Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e...

14
Uma Arquitetura para Fus˜ ao de Dados e Detecc ¸˜ ao de Outliers em Sensores de Baixo Custo de Redes de Sensores sem Fio Rafael Callegaro 1 , Carlos Montez 1 , Alex R. Pinto 3 , Ricardo Moraes 12 1 os-Graduac ¸˜ ao em Eng. de Automac ¸˜ ao e Sistemas – PGEAS 2 Laborat´ orio de Seguranc ¸a em Computac ¸˜ ao - LabSEC 3 Campus Blumenau UFSC – Universidade Federal de Santa Catarina {rafael.callegaro, carlos.montez, arpinto, ricardo.moraes}@ufsc.br Resumo. As aplicac ¸˜ oes nas ´ areas de Agricultura de Precis˜ ao, Engenharia Am- biental, frequentemente, utilizam sensores para o monitoramento de ambien- tes, como por exemplo, no controle de pragas, no processo de irrigac ¸˜ ao, na determinac ¸˜ ao de mapas de solo e produtividade, no acompanhamento de ´ areas florestais e de rios urbanos, etc. As Redes de Sensores sem Fio (RSSF) vˆ em sendo propostas como infraestruturas para essas aplicac ¸˜ oes. Essas redes pro- duzem um grande volume de dados e utilizam sensores de baixo custo e com baixa confiabilidade, gerando dados anˆ omalos (outliers) e afetando a qualidade final do monitoramento. Essas condic ¸˜ oes implicam na necessidade de utilizac ¸˜ ao de m´ etodos de fus˜ ao de informac ¸˜ oes que viabilizem o funcionamento da rede e aumente a confianc ¸a nos dados monitorados. Este artigo prop˜ oe uma arquite- tura para a fus ˜ ao de informac ¸˜ ao voltada para sensores de baixa confiabilidade. A arquitetura foi avaliada atrav´ es de um estudo de caso envolvendo sensores de press˜ ao atmosf´ erica de baixo custo, compat´ ıveis com a plataforma Arduino, cu- jos dados monitorados foram tratados por t´ ecnicas de fus ˜ ao de informac ¸˜ ao. Os resultados obtidos mostram que alguns dos m´ etodos de fus˜ ao de baixo n´ ıvel e ecnicas para detecc ¸˜ ao de outliers, quando combinados e organizados segundo a arquitetura proposta, conseguem substituir um ´ unico sensor centralizado e de alto custo, mantendo a confiabilidade obtida nos dados monitorados. 1. Introduc ¸˜ ao Uma Rede de Sensores Sem Fio (RSSF) consiste em uma rede composta por nodos de baixo custo, com pequenas dimens˜ oes e com alguma capacidade de processamento e transmiss˜ ao. Desta forma os nodos tˆ em capacidades que v˜ ao al´ em da simples coleta de informac ¸˜ ao, eles tˆ em funcionalidades que permitem analisar e fundir seus pr´ oprios dados ou dados de outros n´ os sensores, sendo ainda equipados com algum tipo de sen- sor com capacidade de monitoramento de grandezas f´ ısicas. Al´ em disso, normalmente os nodos n˜ ao se comunicam somente entre si, mas tamb´ em com uma estac ¸˜ ao base, a fim de que os dados possam ser divulgados, processados, analisados ou armazenados [Dargie and Poellabauer 2010]. As aplicac ¸˜ oes variam desde os ambientes industriais, hos- pitalares, dom´ otica, monitoramento urbano e de ´ areas rurais at´ e os ambientes militares [Akyildiz et al. 2002]. Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014 3

Transcript of Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e...

Page 1: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Uma Arquitetura para Fusao de Dados e Deteccao de Outliersem Sensores de Baixo Custo de Redes de Sensores sem Fio

Rafael Callegaro1, Carlos Montez1, Alex R. Pinto3, Ricardo Moraes12

1Pos-Graduacao em Eng. de Automacao e Sistemas – PGEAS

2Laboratorio de Seguranca em Computacao - LabSEC

3Campus Blumenau

UFSC – Universidade Federal de Santa Catarina

{rafael.callegaro, carlos.montez, arpinto, ricardo.moraes}@ufsc.br

Resumo. As aplicacoes nas areas de Agricultura de Precisao, Engenharia Am-biental, frequentemente, utilizam sensores para o monitoramento de ambien-tes, como por exemplo, no controle de pragas, no processo de irrigacao, nadeterminacao de mapas de solo e produtividade, no acompanhamento de areasflorestais e de rios urbanos, etc. As Redes de Sensores sem Fio (RSSF) vemsendo propostas como infraestruturas para essas aplicacoes. Essas redes pro-duzem um grande volume de dados e utilizam sensores de baixo custo e combaixa confiabilidade, gerando dados anomalos (outliers) e afetando a qualidadefinal do monitoramento. Essas condicoes implicam na necessidade de utilizacaode metodos de fusao de informacoes que viabilizem o funcionamento da rede eaumente a confianca nos dados monitorados. Este artigo propoe uma arquite-tura para a fusao de informacao voltada para sensores de baixa confiabilidade.A arquitetura foi avaliada atraves de um estudo de caso envolvendo sensores depressao atmosferica de baixo custo, compatıveis com a plataforma Arduino, cu-jos dados monitorados foram tratados por tecnicas de fusao de informacao. Osresultados obtidos mostram que alguns dos metodos de fusao de baixo nıvel etecnicas para deteccao de outliers, quando combinados e organizados segundoa arquitetura proposta, conseguem substituir um unico sensor centralizado e dealto custo, mantendo a confiabilidade obtida nos dados monitorados.

1. IntroducaoUma Rede de Sensores Sem Fio (RSSF) consiste em uma rede composta por nodos debaixo custo, com pequenas dimensoes e com alguma capacidade de processamento etransmissao. Desta forma os nodos tem capacidades que vao alem da simples coletade informacao, eles tem funcionalidades que permitem analisar e fundir seus propriosdados ou dados de outros nos sensores, sendo ainda equipados com algum tipo de sen-sor com capacidade de monitoramento de grandezas fısicas. Alem disso, normalmenteos nodos nao se comunicam somente entre si, mas tambem com uma estacao base, afim de que os dados possam ser divulgados, processados, analisados ou armazenados[Dargie and Poellabauer 2010]. As aplicacoes variam desde os ambientes industriais, hos-pitalares, domotica, monitoramento urbano e de areas rurais ate os ambientes militares[Akyildiz et al. 2002].

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

3

Page 2: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

As RSSF comecam a ser amplamente utilizadas nos processos de automatizacaode monitoramento de diversas grandezas fısicas. Estas redes substituem as tradicionaisaplicacoes de monitoramento que assumem a abordagem centralizada, onde ha um sensorunico monitorando cada grandeza observada. Este sensor, por ser unico, necessita ser dealta confiabilidade, robusto e, consequentemente, de alto custo. As obras de instalacaopara garantir a confiabilidade das medicoes tambem costumam ter um alto custo asso-ciado. Essa abordagem centralizada tambem implica em manutencao dispendiosa, pois,via de regra, o armazenamento dos dados e feito em dataloggers, que sao dispositivosdedicados para armazenar localmente dados coletados pelos sensores. O alto custo demanutencao tambem e um problema, pois, muitas vezes ha o requisito que estes sensoressejam implantados em locais inospitos e de difıcil acesso, inviabilizando a substituicaoconstante de suas baterias e dificultando o acesso aos dataloggers.

Consequentemente, diversas aplicacoes que empregam uma infraestrutura deRSSF, como por exemplo as de monitoramento ambiental, vem deixando de ocupar, ex-clusivamente, a atencao da academia e gradualmente esta sendo adotada por empresas,substituindo as solucoes tradicionais [Elmenreich 2007]. Essa ampliacao de uso da-sepelas vantagens que as RSSF trazem, no que diz respeito a flexibilidade na implantacaoda rede, maior cobertura espacial, custo dos sensores etc. No entanto, essa adocao so naoe maior porque ainda existem diversos desafios que precisam ser superados, a destacar:(i) ha uma geracao de grande quantidade de dados, (ii) o consumo energetico dos nodosprecisa ser reduzido e (iii) ha dificuldades na deteccao de dados anomalos (outliers) etolerancia a falhas. Este trabalho foca nos problemas (i) e (iii), tratando-os sob o viesdos metodos da fusao da informacao, ou seja, tecnicas que lidam com grande quantidadede dados, que podem reduzir o consumo energetico, alem de serem capazes de aumentara confiabilidade nos dados monitorados pela rede, a partir de manipulacao matematicano conjunto de dados monitorados. Mais especificamente, este trabalho propoe que es-ses problemas sejam tratados de forma sistematica, atraves de uma arquitetura de fusaode informacoes, que organiza o fluxo de dados e as diversas atividades necessarias paraintegracao dos diferentes tipos de fusao.

A principal questao que motiva este trabalho reside em saber se um conjunto desensores de baixo custo consegue substituir os tradicionais sensores centralizados e de altocusto, mantendo, ou mesmo superando, a confiabilidade obtida nos dados monitorados.

No desenvolvimento deste trabalho foi realizada uma pesquisa bibliografica como objetivo de encontrar e avaliar uma arquitetura de comunicacao adequada para esteprocesso. Os aspectos relevantes sobre fusao da informacao, no contexto deste trabalho,sao apresentados na secao 2. Porem, como nao foi encontrada uma arquitetura a seraplicada diretamente no processo de monitoramento ambiental, propoe-se uma arquiteturapara a fusao de dados de sensores de baixo custo em RSSF (secao 3). Posteriormente, nasecao 4, descreve-se um estudo de caso, que utiliza sensores barometricos de baixo custoe compatıveis com a plataforma Arduino, que avalia a arquitetura. Por fim, algumasconsideracoes finais e trabalhos futuros sao apresentados.

2. Fusao da Informacao - Aspectos relevantes

O termo fusao da informacao e amplamente utilizado na literatura. Para[Elmenreich 2007] a fusao da informacao e um termo abrangente que cobre todos os as-

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

4

Page 3: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

pectos do campo de fusao (exceto fusao nuclear ou fusao no mundo da musica). E definidapor (Henrik Bostrom 2013) como o estudo de metodos eficientes para automaticamente ousemi-automaticamente transformar informacoes de diferentes fontes e diferentes pontosno tempo em uma representacao que fornece apoio efetivo para tomada de decisao hu-mana ou automatizada. A fusao de dados comumente faz referencia a metodos de fusaode dados brutos ou de sinal muito utilizado na fusao de sensores. Ja o termo agregacaode dados, comum em RSSF, consiste em um subconjunto da fusao da informacao e tratabasicamente de tecnicas de transferencia de dados [Kulik et al. 2002].

As vantagens de se realizar o sensoriamento utilizando varios sensores ao inves deum unico sensor esta no aumento da disponibilidade, cobertura espacial, cobertura tem-poral e exatidao, podendo ainda diminuir a ambiguidade das observacoes e possibilitarauto-ajustes. No entanto, caso as entradas de informacoes sejam de ma qualidade ou exis-tirem muitas falhas de forma que a quantidade de dados incorretos superem os corretos, odesempenho global do sistema podera ser afetado [Nakamura et al. 2007].

Quando se utiliza uma RSSF, como insfraestrutura no processo de monitoramentode grandezas fısicas, e comum o uso de uma grande quantidade de nodos com sensoresde baixo custo. Basicamente os metodos de fusao podem utilizar a capacidade de pro-cessamento dos nodos para explorar a correlacao espaco temporal das informacoes obser-vadas diretamente pelos sensores para reduzir a quantidade de dados trafegados. Alemdisso, podem ser utilizados para e detectar/corrigir dados discordantes (outliers) e falhas[Zhou et al. 2011].

As falhas e erros sao fontes de outliers ou dados discordantes, ou seja, os ou-tliers sao dados atıpicos em uma aplicacao de monitoramento, e podem ter origensde ataques maliciosos, eventos, falhas e erros. Os ataques maliciosos acontecem porexemplo quando o atacante consegue obter vantagens ao manipular os dados dos senso-res, como nas aplicacoes militares e sao tratados com tecnicas de tolerancia a intrusao[Fawzy et al. 2013].

2.1. Classificacao da Fusao de Informacoes

[Dasarathy 1997] dividiu a fusao de informacoes segundo o nıvel de abstracao dos dados.Na fusao de baixo nıvel os dados brutos sao fornecidos como entradas, combinadas dire-tamente em novos dados que sao melhores que as entradas individuais e que podem serutilizados com os demais nıveis de fusao. A nıvel medio ou de caracterısticas, acontece aabstracao dos dados de forma que seja possıvel representar um objeto de forma precisa econcisa. Na fusao de alto nıvel ou de decisao, acontece a tomada de decisao baseada nasinformacoes provenientes das camadas de nıveis baixo e medio, onde podem ser incorpo-rados conhecimentos a priori e informacoes especıficas sobre a tomada de decisao.

[Durrant-Whyte 1988] distingue a fusao baseada na configuracao dos sensores.Na configuracao complementar, os sensores nao dependem diretamente um do outro, masse complementam para obter uma imagem mais completa do fenomeno observado. Naconfiguracao redundante, sao fornecidas medicoes independentes da mesma propriedadeem instantes diferentes ou por duas ou mais origens no mesmo instante a fim de pro-porcionar melhor precisao e/ou exatidao das observacoes. Na configuracao cooperativa,as informacoes sao fornecidas por mais de um sensor para derivar informacoes que naoestariam disponıveis se fosse utilizado apenas um. Normalmente, neste tipo de fusao ha

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

5

Page 4: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

perda de precisao e confiabilidade.

2.2. Modelos

Os modelos de fusao de informacoes na maioria das vezes descrevem um conjunto deprocessos e como estes se relacionam, abstraindo-se de implementacoes ou instanciasespecıficas. Muitos modelos foram propostos para auxiliar no projeto de sistemas defusao de informacoes. Os mais comuns sao: JDL Process Model [Steinberg 1999], DFDModel [Dasarathy 1997] e Waterfall Model [Harris et al. 1998].

Estes modelos fornecem um esquema teorico e podem ser usados para facilitara compreensao dos requisitos e limitacoes introduzidas por metodos de fusao, mostramcomo os dados se relacionam e especificam tarefas. Na maioria dos casos, a classificacaoda fusao e baseada em nıveis e os modelos sao genericos, com excecao ao JDL que eaplicavel diretamente na area militar. Embora tais modelos nao considerem os aspectosde rede (natureza distribuıda) das RSSF, eles funcionam como um guia para especificarquais metodos podem ser usados e como eles podem ser integrados em uma arquitetura.

3. Arquitetura para Fusao de Dados de Sensores de Baixo CustoNeste artigo propoe-se uma arquitetura para aplicacoes de monitoramento com RSSF edivide as atividades executadas em tres camadas: Camada de Fusao Local, Camada deFusao de Baixo Nıvel e Camada de Gerenciamento e Interface com Usuario (Fig. 1).

Figura 1. Arquitetura proposta para fusao de dados de sensores em RSSF.

A principal contribuicao deste artigo esta na definicao e avaliacao da Camada deFusao de Baixo nıvel, que e responsavel pelo recebimento dos dados provenientes daRSSF, processamento e encaminhamento a Camada de Gerenciamento e Interface comusuario, a qual e responsavel por executar tarefas correspondentes a fusao de medio e dealto nıveis (conforme classificacao apresentada em [Dasarathy 1997]). Essas tarefas - quecostumam envolver interacoes com usuarios e acessos a bases de dados - sao usualmenteempregadas nas tomadas de decisao e sao dependentes de cada aplicacao e, portanto, estao

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

6

Page 5: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

fora do escopo deste artigo. Apresenta-se tambem neste artigo as tecnicas comumenteempregadas na Camada de Fusao Local.

3.1. Camada de Fusao Local

O objetivo deste nıvel de processamento e configurar os sensores para coletar dados sobreo ambiente onde o mesmo esta inserido, realizar algum tipo de fusao local e encaminhar osdados para transmissao. Um dos primeiros passos e verificar junto ao fabricante do sensorquais sao as taxas de amostragens recomendadas. Tambem e necessario conferir se existealgum tipo de ajuste a ser realizado no sensor, como por exemplo, a microcalibracao. De-pendendo da taxa de amostragem adotada, pode-se aplicar localmente aos dados algumtipo de fusao, como por exemplo, a media aritmetica. Alguns metodos de fusao das ca-madas superiores da arquitetura podem utilizar outras informacoes no seu processamento,tais como a variancia ou desvio padrao, gerados pela fusao local. Para o calculo dessesvalores, uma boa opcao e realizar a fusao no intervalo entre beacons1, como exemplifi-cado na Figura 2, onde os nodos sensores realizam os calculos de media aritmetica e/ouvariancia a cada 30 ou 60 segundos (intervalo entre os seus respectivos beacons).

Figura 2. Fusao local dos dados.

3.2. A Camada de Fusao de Baixo Nıvel

A Camada de Fusao de Baixo Nıvel foi subdividida em: calibracao; timestamping;deteccao de erros grosseiros e sistematicos; metodos de fusao e realimentacao (Fig. 1).

3.2.1. Calibracao

A calibracao de sensores e um problema fundamental em RSSF [Tan et al. 2013]. Elaconsiste no conjunto de operacoes que estabelece e corrige a diferenca existente entreum valor medido e o verdadeiro valor. Em alguns casos, pode consistir de uma correcaoaditiva ou multiplicativa da indicacao com uma incerteza de medicao associada. Comoignora-se o verdadeiro valor, a calibracao tende a minimizar a diferenca entre o valor lidoe o verdadeiro valor da grandeza.

1Os beacons sao sinalizadores, que tambem podem ser definidos como pacotes de controle, geradosperiodicamente pelo coordenador para sincronizar a rede alem de delimitar e descrever a estrutura do su-perframe das redes IEEE 802.15.4.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

7

Page 6: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

A calibracao de cada dispositivo, individualmente e manualmente, conhecidacomo micro-calibracao pode ser intratavel quando a rede possuir um grande numero desensores [Tan et al. 2013]. Logo, a autocalibracao ou calibracao autodidata podem serempregadas neste processo. Um metodo convencional de auto calibracao e a correcaode leituras de cada sensor para um referencial comum baseado em um sensor de re-ferencia que se tenha confianca, ou baseado na referencia de um grupo de sensores[Bychkovskiy et al. 2003].

3.2.2. Timestamping

Na arquitetura proposta, a fusao de baixo nıvel pode ocorrer de forma on-line ou off-line.No caso da fusao off-line, os coordenadores PAN nao cumprem o papel de Centros deFusao, apenas encaminham os dados recebidos na direcao do coordenador PAN Principal,onde a fusao sera executada. A fusao off-line pode ser utilizada para um estudo posterioraprofundado do ambiente observado. Neste caso, e necessario associar marcacoes detempo referentes ao momento da observacao em cada dado armazenado.

Os Centros de Fusao desempenham importante papel na Camada de Fusao deBaixo Nıvel quando ocorre a fusao on-line, sendo primordial em redes de sensores quetambem possuam atuadores, para que seus resultados sejam utilizados imediatamente.

3.2.3. Deteccao de erros grosseiros e sistematicos

A deteccao e eliminacao de erros grosseiros e uma tarefa simples, porem, necessariano processo de monitoraramento com RSSF, principalmente quando se admite o uso desensores de baixo custo. A deteccao pode ser baseada, por exemplo, na simples inspecaoda faixa de operacao dos sensores, ou seja, os dados obtidos e que se encontram forada faixa operacional de um sensor devem ser descartados. Erros sistematicos sao maisdifıceis de serem detectados. Correcoes basicas podem ser efetuadas ja na implantacao(deployment) do sensor, quando estas influenciam no valor final. As demais correcoespodem ser feitas baseando-se, por exemplo, em um sensor de referencia, no qual ja setenha confianca; ou baseando-se em um grupo de sensores, nos quais, coletivamente,acredita-se que seus valores medios sejam confiaveis.

3.2.4. Metodos de Fusao

Neste nıvel os dados dos sensores sao comparados, a fim de detectar possıveis sensoresdiscordantes. Diversos algoritmos podem ser utilizados. Nesta arquitetura, considera-seum algoritmo apropriado aquele com a capacidade de comparar os dados obtidos pelossensores envolvidos na fusao e seguindo um criterio realizar ou nao a supressao dos seusdados. A eliminacao das observacoes de sensores, mesmo quando estes realizam leiturascorretas tende a descartar observacoes desnecessariamente, o que nao e desejavel. Ainda,e conveniente que quando uma observacao for descartada, de alguma forma o algoritmotenha capacidade de marcar ou mostrar de forma clara qual sensor e qual o motivo quelevou o dado a ser rejeitado. Igualmente, devido a duvida sobre a qualidade dos sensores

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

8

Page 7: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

de baixo custo, e desejavel que o algoritmo tenha mecanismos capazes de computar aqualidade do sensor durante o processo de fusao.

Um metodo muito utilizado para a fusao de dados e a media aritmetica, que nao eadequada para a grande maioria das aplicacoes. Nas subsecoes abaixo descrevem-se asprincipais caracterısticas dos metodos avaliados neste artigo. E importante destacar queha diversas outras tecnicas que poderiam ser avaliadas, como por exemplo as tecnicasbaseadas em Filtro de Kalman [Nakamura et al. 2007]. No entanto, essas abordagenssao statefull, pois necessitam do historico das mensagens anteriores de cada sensor e osmetodos estudados neste trabalho sao stateless.

A. Media Tolerante a FalhasUm dos metodos de fusao de sensores com simples aplicacao, e bons resultados e amedia tolerante a falhas (MTF) proposto por [Marzullo 1990]. Basicamente o metododivide um conjunto ordenado de dados em tres partes, eliminando as extremidades.O primeiro passo desta tecnica e ordenar o conjunto de dados enviados pelos nodossensores. Tomando t=N/3, onde N e o tamanho do conjunto, descartam-se os extremos daamostra ordenada, ou seja as t maiores e as t menores medidas. O valor final e o calculoda media e desvio padrao dos valores restantes.

B. Confidence-weighted Averaging - CWA[Elmenreich 2007] propos um metodo de fusao relacionando a confianca nos sensorespelo inverso da respectiva variancia. A variancia e uma medida util em muitos casosporque sao aditivas, podendo-se comparar diferentes grupos de dados. O desvio-padrao,por sua vez, tem a vantagem de ser expresso na mesma unidade que a variavel medida,tornando mais facil de comparar resultados. Para [Elmenreich 2007], no melhor caso avariancia e proxima de zero, tendo assim a maxima confianca e no pior caso o sensorgera valores aleatorios dentro da sua faixa de operacao. A variancia de pior caso podeser calculada como a variacao de uma funcao aleatoria uniformemente distribuıda entreos limites a e b, onde a e b sao os valores mınimos e maximos de uma funcao aleatoria,uniformemente distribuıda.

C. CWA + MTFO CWA pode ser utilizado juntamente com outros metodos, como por exemplo a MTFproposta por [Marzullo 1990], o que foi proposto por Elmenreich [Elmenreich 2007].Assim o metodo se torna tolerante a falhas e considera a qualidade do sensor na fusao. Ometodo consiste em calcular a media ponderada incluindo todos os sensores atraves dometodo CWA e, posteriormente, elimina-se 2/3 dos sensores conforme especificado noMTF e calcula-se novamente a media ponderada.

D. CWA com alteracoesO metodo proposto em [Elmenreich 2007] para fundir informacoes de sensores diferen-tes, prioriza os sensores com menor variancia. Uma excecao apontada pelo proprio autordo algoritmo e que, caso a variancia seja zero, passa a ser necessario algum tratamentoespecial para evitar a divisao por zero. Contudo, em experimentos preliminares efetuadosneste trabalho observou-se um outro problema, pois, como a arquitetura proposta evoltada para RSSFs que utilizam sensores de baixo custo. Foi observado em alguns

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

9

Page 8: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

cenarios de execucao, que leituras de dados coletados por um unico sensor podiamapresentar valores iguais por um longo perıodo de tempo, caracterizando um sensordefeituoso e “travado”. Esse travamento do sensor poderia ser definitivo ou temporario,por um curto ou longo tempo. Esse sensor “travado”, pela sua baixa variancia, faziacom que seus dados incorretos contribuıssem com um maior peso no calculo da mediaponderada do que os sensores corretos. Assim foi necessaria uma alteracao simplesdo algoritmo original na implementacao realizada. Basicamente, quando um sensorapresentar variacoes entre leituras abaixo de um valor estipulado (e dependente do tipoe da especificacao do sensor), sua variancia calculada sera artificialmente aumentadapara o maximo valor possıvel, contribuindo assim minimamente para o calculo da mediaponderada.

E. Criterio de ChauvenetO criterio de Chauvenet e um metodo estatıstico que foi desenvolvido para a deteccaode outliers, podendo ser utilizado para deteccao de falhas bizantinas. Ele baseia-se nahipotese de que uma medicao arbitraria pode ser rejeitada se a probabilidade de obtero desvio da media para este valor e menor do que o inverso do dobro do numero demedicoes [Taylor 2012].

O tamanho da amostra e muito importante na utilizacao do metodo, pois comuma amostra grande, ha poucas chances de que um dos valores afetem a media de formasignificativa. Um valor divergente em uma amostra grande deve estar muito longe damedia para “mover” a distribuicao. Isso faz com que a utilizacao de poucos dados tenhaexigencias mais rıgidas.

F. Metodo de PeirceO metodo de Pierce e uma tecnica estatıstica para deteccao de outliers, em uma amostracom comportamento normal. O artigo original data de 1852, contudo e amplamenteutilizado nos dias atuais. [Ross 2003] descreve o metodo de deteccao de dados suspeitosproposto por Peirce como segue: “as observacoes devem ser rejeitadas quando os desviosreais da media obtidos por mante-los, e menor do que os desvios obtidos por sua rejeicao,multiplicada pela probabilidade de fazer tantos e nao mais, observacoes anormais”.

Explicando de outra forma, o objetivo de sua tecnica era gerar probabilidadesde erro que ocorrem no sistema onde todas as n observacoes sao mantidas versus as kamostras rejeitadas. Ele entao rejeita k observacoes e verifica se a amostra e mais proximada normal que a anterior. O Criterio de Peirce, preve a deteccao de mais de um dadodiscordante na amostra. O metodo de calculo utilizado por Peirce e matematicamentecomplexo de usar. Desta forma Gould levou o metodo a ser apresentado em um formatomais facilmente empregavel com tabelas derivadas do trabalho de Peirce [Gould 1855].

3.2.5. Realimentacao

As realimentacoes sao informacoes obtidas de banco de dados, do usuario e outras fon-tes, incluindo os metodos de fusao de dados brutos. Por exemplo, informacoes sobre odescarte dos dados de um sensor em especıfico podem ser utilizadas para a calibracao dorespectivo sensor.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

10

Page 9: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

4. Avaliacao

Nesta secao avalia-se a arquitetura proposta atraves de um estudo de caso. Uma aplicacaode monitoramento ambiental, que usa a pressao atmosferica (PA) como grandeza princi-pal, e utilizada para ilustrar o uso da arquitetura. A PA e uma grandeza relevante paradiversas areas de aplicacao, como a meteorologia, altimetria, engenharia sanitaria e ambi-ental. Comumente para o sensoriamento da PA no monitoramento ambiental, emprega-seum unico sensor barometrico de alta qualidade, confiavel, com especificacoes rıgidas noque tange a instalacao e operacao e, consequentemente, de alto custo.

O local escolhido para a realizacao das medicoes foi nas proximidades do Ae-roporto Hercılio Luz na cidade de Florianopolis, Santa Catarina. Na Figura 3 pode-seobservar que foi utilizado um sensor de referencia externo para questoes comparativas(identificado neste trabalho como Vaisala), este sensor externo e operado pela aeronauticae esta localizado nas proximidades da cabeceira da Pista 14, a 5 metros de altitude comreferencia ao nıvel do mar. A distancia entre o sensor do aeroporto e o local dos expe-rimentos e de 1300 metros. Ainda com a finalidade de comparar os dados obtidos comos sensores de baixo custo, utilizou-se um segundo sensor de referencia preciso e de altocusto (identificado neste trabalho como sensor de referencia interno Young).

Figura 3. Local do experimento.

A comunicacao entre os sensores do experimento foi realizada atraves de umaRSSF IEEE 802.15.4 com topologia em estrela. Quatro sensores de baixo custo foramusados nos experimentos, o que satisfaz o criterio mınimo de sensores exigido pelastecnicas de fusao apresentadas anteriormente.

O quinto nodo foi configurado para atuar como nodo coordenador PAN/Centrode Fusao, sendo o computador responsavel por armazenar os dados gerados. A rede foiconfigurada para ser utilizada em modo com beacon ativado, e este nodo, cumprindoseu papel de Coordenador PAN, e responsavel por sincronizar a rede atraves do enviode beacons. Para configurar a periodicidade da aplicacao foi utilizado o valor do BeaconOrder (BO) = 11, o que define um Beacon Interval (BI) de aproximadamente 30 segundos.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

11

Page 10: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Os demais nodos foram equipados com sensores de baixo custo Bosch. O soft-ware de rede utilizado nos nodos foi implementado sobre a camada MAC. Assim naoforam utilizados sistemas operacionais especıficos para RSSF, tais como o TinyOS ouFreeRTOS.

A alimentacao dos nodos de 1 a 4 equipados com sensores Bosch foi realizada por2 baterias do tipo AA, sendo que os nodos tambem alimentavam os sensores Bosch. Onodo 5, equipado com o sensor Young, utilizou fonte de alimentacao AC/DC. O nodo 5 foiinterligado ao microcomputador utilizando comunicacao serial com cabo USB e os dadoscoletados pelos nodos foram armazenados em arquivo texto, acrecidos dos timestamps noseguinte formato: < timestamp, nodo[1− 10], variancia [1− 10] >.

O microcomputador do experimento teve seu horario sincronizado atraves do pro-tocolo NTP, assim como ocorre com o microcomputador do aeroporto. Optou-se porrealizar a fusao a posteriori, pela existencia de limitacoes de permanencia no local doexperimento e na obtencao dos dados on-line do sensor de referencia externo.

4.1. Resultados Experimentais

A primeira analise de dados realizada foi sobre os dados obtidos pelos sensores de re-ferencia interno (Young) e externo (Vaisala). O objetivo foi verificar se as leituras feitaspelo sensor de referencia interno sao coerentes com as do sensor de referencia externo.

Foram selecionados dados referentes a 24h de leituras e realizada uma mediahoraria da pressao atmosferica (Figura 4). Para realizar o comparativo foi necessariocorrigir os efeitos causados pela diferenca de altitude de instalacao dos dois sensores(cerca de 1,5 metros), que equivale a 0.18 hPa, subtraıdos dos valores obtidos pelo sensorde referencia externo. Alem da altitude foi necessario se levar em consideracao a exa-tidao dos sensores. Segundo os fabricantes, as leituras podem variar ± 0.3 hPa e, dessaforma, a discrepancia entre os dois sensores nao deve ultrapassar ± 0.6 hPa. Observou-seque a diferenca maxima ficou em torno de ± 0.25 hPa. Logo, pode-se considerar que osensor de referencia interno Young esta validado com relacao ao sensor de referencia ex-terno Vaisala, o qual e periodicamente calibrado, pois seus valores sao utilizados para asoperacoes de decolagem e aterrizagem no aeroporto. Por conveniencia, na continuidadedeste trabalho, os dados referentes aos sensores de baixo custo (Bosch) e os resultadosobtidos pela fusao de seus valores serao comparados somente com o sensor de referenciainterno (Young), doravante chamado apenas de sensor de referencia.

Diversas analises foram realizadas para avaliar as tecnicas de fusao. Neste artigoapresenta-se a analise de uma amostra de dados que contem um sensor discordante (Figura5). Observa-se que este sensor sempre envia a mesma leitura de pressao atmosferica,o que pode ser entendido como um sensor com alta precisao (variancia zero). Porem,esta diferenca em relacao aos outros sensores aconteceu provavelmente pelo baixo nıvelde bateria no nodo em que o sensor estava acoplado. Na Figura 5 observa-se que osvalores do sensor Bosch4 permanecem distante dos demais, chegando a diferir 1.31 hPada referencia, enquanto os demais sensores diferem apenas 0.07 hPa.

A Figura 6 apresenta os resultados dos metodos de fusao aplicados a estes dados.O metodo da aplicacao da media aritmetica obteve os piores resultados pois este incluitodos os dados no calculo da fusao. Como nesta amostra ha um sensor com leituras

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

12

Page 11: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Figura 4. Comparacao entre sensores de referencia.

discordantes, a media e deslocada e esta tecnica nao permite dizer qual sensor apresentavalores discordantes.

Ao aplicar o metodo de Chauvenet, verifica-se que o mesmo nao detecta o sensor4 como discordante, obtendo os mesmos valores que a media aritmetica. Interessantenotar que se o sensor de referencia fizesse parte do conjunto de sensores usados para ocalculo da fusao, o metodo de Chauvenet conseguiria um melhor desempenho, eliminandoo sensor discordante e a realizando a media aritmetica com os sensores restantes.

O metodo de Peirce conseguiu detectar corretamente o sensor 4 como discordante.O maximo desvio entre o sensor de referencia e o valor obtido na fusao foi de 0.03 hPa.Diferente dos metodos de Chauvenet e Peirce, a Media Tolerante a Falhas (MTF) sempredescarta os valores de dois tercos dos sensores, mesmo estes tendo valores semelhantes.

O metodo proposto por Elmenreich (CWA) e o mais completo, no sentido em queleva em consideracao a qualidade do sensor. No entanto os dados de variancia devem es-tar disponıveis. Ha tres formas de executar o metodo: na primeira considera-se apenas avariancia informada pelos sensores (CWA); na segunda sao incluıdas as modificacoes pro-postas neste artigo (CWA com alteracoes) e, por fim, utilizando o algoritmo modificadoem conjunto com a media tolerante a falhas (CWA + MTF).

Pode-se observar nos resultados apresentados na Tabela 1 que o metodo proposto

Figura 5. Amostra de dados com sensor discordante.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

13

Page 12: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Figura 6. Aplicacao dos metodos de Fusao de dados.

Tabela 1. Metodo de Elmenreich.Rounds Referencia CWA CWA+MTF CWA com alt.

1 1012,29 1013,37 1012,31 1012,302 1012,27 1013,38 1012,28 1012,263 1012,24 1013,35 1012,25 1012,234 1012,23 1013,36 1012,20 1012,235 1012,22 1013,36 1012,18 1012,206 1012,19 1013,38 1012,17 1012,187 1012,18 1013,39 1012,19 1012,178 1012,16 1013,36 1012,18 1012,189 1012,17 1013,37 1012,15 1012,16

10 1012,15 1013,35 1012,12 1012,15

por Elmenreich (CWA sem alteracoes) tem um desempenho ruim, obtendo a diferencamaxima em torno de 1,2 hPa do sensor de referencia. Este resultado evidencia que, casoum sensor tenha leituras sequenciais iguais, a variancia obtida e zero e o sistema tera suamaior confianca no sensor discordante.

Utilizando o metodo de CWA com alteracoes, assume-se que um sensor comvariancia constante, durante um determinado perıodo, proxima de zero e defeituoso, fa-zendo com que sua variancia seja elevada artificialmente a um valor maximo. Assim,apesar do sensor defeituoso participar da media ponderada, obtem-se um resultado maisaproximado do sensor de referencia. A terceira forma aplicada e do metodo de CWA +MTF, o que tambem faz com que os dados se aproximem da referencia.

Na Tabela 2 pode-se observar o resultado da aplicacao das tecnicas MTF e oCWA+MTF na amostra de dados. Pode-se verificar que o sensor 2 participou de todasas medias, enquanto o sensor 4 foi corretamente desconsiderado em todas. Ja o sensor1, apesar de ter leituras proximas das corretas foi desconsiderado em 80% dos casos,presentes nesta amostra. Comparando os resultados obtidos pela MTF com o sensor dereferencia, encontra-se o valor maximo de 0.02 hPa.

5. Conclusoes

As RSSF utilizando sensores de baixo custo para o monitoramento de grandezas fısicas,vem substituindo a tradicional abordagem centralizada que utilizam um unico sensorconfiavel de alto custo. Parte desta mudanca esta relacionada com as vantagens que a

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

14

Page 13: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Tabela 2. MTF e CWA+MTF aplicados na amostra com sensor 4 discordante.Sensor Sensor

#1 #2 #3 #4 #1 #2 #3 #41o round ◦ • • ◦ 1o round ◦ • • ◦2o round ◦ • • ◦ 2o round ◦ • • ◦3o round ◦ • • ◦ 3o round ◦ • • ◦4o round ◦ • • ◦ 4o round • ◦ • ◦5o round ◦ • • ◦ 5o round • ◦ • ◦6o round • • ◦ ◦ 6o round • ◦ • ◦7o round ◦ • • ◦ 7o round ◦ • • ◦8o round ◦ • • ◦ 8o round ◦ • • ◦9o round ◦ • • ◦ 9o round • ◦ • ◦10oround • • ◦ ◦ 10oround • ◦ • ◦

(a) MTF (b) CWA com MTFLegenda: • Participa da fusao ◦ Nao participa da fusao

RSSF proporciona, como flexibilidade na implantacao da rede, melhor cobertura espa-cial, custo dos sensores etc. No entanto surgem novos desafios na medida que tais redescomecam a ser utilizadas na pratica. Por exemplo, elas geram uma grande quantidade dedados, precisam ter funcionamento adequado a quantidade de energia fornecida, alem defalhas e erros ocasionados por nodos de RSSF equipados com sensores de baixo custo.Assim a utilizacao de dados brutos, gerados pelos nodos sensores nao tem sido adequadapara as aplicacoes.

Desta forma, este trabalho foca nesses problemas, tratando-os sob o vies dosmetodos de fusao da informacao, ou seja, tecnicas que diminuem a quantidade de dadose aumentam sua confiabilidade. A arquitetura proposta foi aplicada no monitoramentode ambientes. Os sensores de baixo custo foram calibrados baseados em um sensor dereferencia, sem esta operacao, os metodos de fusao nao atingiriam o desempenho espe-rado devido ao desvio constante dos valores observados pelos sensores de baixo custo.Os timestamps foram adicionados, proporcionando que a fusao fosse realizada off-line.Os erros sistematicos e grosseiros, como valores “zero” por exemplo, foram correta-mente descartados antes de chegarem aos metodos de fusao. Dentre os metodos testa-dos, Peirce e CWA + MTF se mostraram mais adequados para a fusao dos sensores. Ja amedia aritmetica, Chauvenet e CWA sem modificacoes, nao tiveram bom desempenho napresenca de nodos falhos.

De forma geral a configuracao da RSSF utilizada, juntamente com sensores debaixo custo e a arquitetura proposta, teve desempenho superior do que quando utilizadoum sensor unico de alto custo. Acredita-se que futuros sistemas de monitoramento deambientes utilizando RSSF e sensores de baixo custo, possam dispor deste trabalho comoferramenta, tanto no que se refere ao levantamento bibliografico, no desempenho dosmetodos testados, bem como utilizar ou basear sua aplicacao na arquitetura proposta.

ReferenciasAkyildiz, I. F., Su, W., Sankarasubramaniam, Y., and Cayirci, E. (2002). Wireless sensor

networks: A survey. Comput. Netw., 38(4):393–422.

Bychkovskiy, V., Megerian, S., Estrin, D., and Potkonjak, M. (2003). A collaborativeapproach to in-place sensor calibration. pages 301–316.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

15

Page 14: Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de ... · Uma Arquitetura para Fusao de Dados e Detecc¸˜ ao de Outliers˜ em Sensores de Baixo Custo de Redes de Sensores sem

Dargie, W. and Poellabauer, C. (2010). Fundamentals of wireless sensor networks: theoryand practice. John Wiley & Sons Ltda.

Dasarathy, B. (1997). Sensor fusion potential exploitation-innovative architectures andillustrative applications. Proceedings of the IEEE, 85(1):24–38.

Durrant-Whyte, H. F. (1988). Sensor models and multisensor integration. Int. J. Rob.Res., 7(6):97–113.

Elmenreich, W. (2007). Fusion of continuous-valued sensor measurements usingconfidence-weighted averaging. Journal of Vibration and Control (incorporating Mo-dal Analysis), 13(9-10):1303–1312.

Fawzy, A., Mokhtar, H. M., and Hegazy, O. (2013). Outliers detection and classificationin wireless sensor networks. Egyptian Informatics Journal, 14(2):157 – 164.

Gould, B. A. (1855). On peirce’s criterion for the rejection of doubtful observations, withtables for facilitating its application. Astronomical Journal, 4:81–87.

Harris, C., Bailey, A., and Dodd, T. (1998). Multi-sensor data fusion in defence andaerospace. The Aeronautical Journal, 102(1015):229–244.

Kulik, J., Heinzelman, W., and Balakrishnan, H. (2002). Negotiation-based protocols fordisseminating information in wireless sensor networks. Wirel. Netw., 8(2/3):169–185.

Marzullo, K. (1990). Tolerating failures of continuous-valued sensors. ACM Trans. Com-put. Syst., 8(4):284–304.

Nakamura, E. F., Loureiro, A. A. F., and Frery, A. C. (2007). Information fusion forwireless sensor networks: Methods, models, and classifications. ACM Comput. Surv.,39(3).

Ross, S. (2003). Peirce’s criterion for the elimination of suspect experimental data. Jour-nal of Engineering Technology, 20(2).

Steinberg, Alan N Bowman, C. L. W. F. E. (1999). Revisions to the jdl data fusion model.International Society for Optics and Photonics, pages 430–441.

Tan, R., Xing, G., Yuan, Z., Liu, X., and Yao, J. (2013). System-level calibration for datafusion in wireless sensor networks. ACM Trans. Sen. Netw., 9(3):28:1–28:27.

Taylor, J. R. (2012). Introducao a Analise de Erros - o Estudo de Incertezas. BOOKMAN,2a ed. edition.

Zhou, C.-H., Chen, B., Gao, Y., Zhang, C., and Guo, Z.-J. (2011). A technique of filteringdirty data based on temporal- spatial correlation in wireless sensor network. ProcediaEnvironmental Sciences, 10, Part A:511 – 516.

Anais do II Workshop de Comunicação em Sistemas Embarcados Críticos - WoCCES 2014

16