Aplicação de Mapa de Kohonen para classificação de...
Transcript of Aplicação de Mapa de Kohonen para classificação de...
-
INPE-15239-TDI/1326
APLICACAO DE MAPA DE KOHONEN PARA
CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM
AMBIENTE PARALELO
Thalita Biazzuz Veronese
Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,
orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro
de 2007.
O original deste documento esta disponvel em:
INPE
Sao Jose dos Campos
2008
http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07
-
PUBLICADO POR:
Instituto Nacional de Pesquisas Espaciais - INPE
Gabinete do Diretor (GB)
Servico de Informacao e Documentacao (SID)
Caixa Postal 515 - CEP 12.245-970
Sao Jose dos Campos - SP - Brasil
Tel.:(012) 3945-6911/6923
Fax: (012) 3945-6919
E-mail: [email protected]
CONSELHO DE EDITORACAO:
Presidente:
Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra (OBT)
Membros:
Dra Maria do Carmo de Andrade Nono - Conselho de Pos-Graduacao
Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE)
Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e Atmosfericas (CEA)
Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)
Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos Climaticos (CPT)
Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia Espacial (ETE)
BIBLIOTECA DIGITAL:
Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da Terra (OBT)
Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)
Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao (SID)
Simone A. Del-Ducca Barbedo - Servico de Informacao e Documentacao (SID)
REVISAO E NORMALIZACAO DOCUMENTARIA:
Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)
Marilucia Santos Melo Cid - Servico de Informacao e Documentacao (SID)
Yolanda Ribeiro da Silva e Souza - Servico de Informacao e Documentacao (SID)
EDITORACAO ELETRONICA:
Viveca SantAna Lemos - Servico de Informacao e Documentacao (SID)
-
INPE-15239-TDI/1326
APLICACAO DE MAPA DE KOHONEN PARA
CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM
AMBIENTE PARALELO
Thalita Biazzuz Veronese
Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,
orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro
de 2007.
O original deste documento esta disponvel em:
INPE
Sao Jose dos Campos
2008
http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07
-
Dados Internacionais de Catalogacao na Publicacao (CIP)
V599a Veronese, Thalita Biazzuz.Aplicacao de Mapa de Kohonen para classificacao de
texturas em imagens SAR em ambiente paralelo/ ThalitaBiazzuz Veronese. Sao Jose dos Campos: INPE, 2008.
110p. ; (INPE-15239-TDI/1326)
1. Imagens SAR. 2. Atributos de textura. 3. Filtros Ga-bor. 4. Classificacao de imagens. 5. Processamento paralelo.I. Ttulo.
CDU 621.376.5
Copyright c 2008 do MCT/INPE. Nenhuma parte desta publicacao pode ser reprodu-zida, armazenada em um sistema de recuperacao, ou transmitida sob qualquer forma ou
por qualquer meio, eletronico, mecanico, fotografico, microflmico, reprografico ou outros,
sem a permissao escrita da Editora, com excecao de qualquer material fornecido especifi-
camente no proposito de ser entrado e executado num sistema computacional, para o uso
exclusivo do leitor da obra.
Copyright c 2008 by MCT/INPE. No part of this publication may be reproduced, storedin a retrieval system, or transmitted in any form or by any means, eletronic, mechanical,
photocopying, microfilming, recording or otherwise, without written permission from the
Publisher, with the exception of any material supplied specifically for the purpose of being
entered and executed on a computer system, for exclusive use of the reader of the work.
-
Voce deve ser a propria mudanca que deseja ver no mundo.
Mohandas Karamchand Gandhi
-
querida Leninha, dedico.
-
AGRADECIMENTOS
Agradeco ao meu orientador Lamartine Nogueira Frutuoso Guimaraes, pela oportu-
nidade de desenvolver este trabalho, e pela orientacao e suporte em todas as fases
desta pesquisa de mestrado.
Ao Maj. Maurcio Pozzobon Martins, do Instituto de Estudos Avancados, agradeco
pelo apoio irrestrito, empenhando-se incansavelmente em possibilitar que este tra-
balho alcancasse os objetivos concretos a que se propunha, e pela amizade e profis-
sionalismo exemplares dedicados desde o incio desta pesquisa.
Ao Instituto Nacional de Pesquisas Espaciais, aos profissionais do LAC, CAP e SPG,
pelo ingresso e manutencao neste programa de Mestrado. Agradeco, em especial, aos
professores Demsio, Fernando e Stephan, pela participacao e sugestoes na Defesa
de Proposta de Mestrado.
Ao Instituto de Estudos Avancados, em especial a Divisao de Geointeligencia e a
Divisao de Energia Nuclear, por me receber e permitir usufruir de seus recursos
computacionais e instalacoes, e aos administradores do cluster BELIEVe Onofre
Felix de Lima Neto e Roberto Yuji Tanaka, pelo suporte prestado. Aos funcionarios
que me receberam tao bem nesta insitituicao, expresso minha profunda gratidao.
A Embrapa Monitoramento por Satelite, em especial aos pesquisadores Gustavo
Souza Valladares e Evaristo Eduardo de Miranda, agradeco pela confianca de-
positada neste trabalho, fornecendo os dados indispensaveis para esta pesquisa de
mestrado, e pela hospitalidade ao me receber em sua sede em Campinas.
A CAPES e ao CNPq, pelo suporte financeiro.
A meus pais Carlos Eduardo e Irene, as melhores pessoas que ja conheci, que com seu
amor incondicional proporcionam estrutura, incentivo e apoio em todos os momentos
da minha vida.
Ao meu marido Reinaldo, companheiro de todos os momentos, agradeco simples-
mente por tudo. Por ser essa pessoa tao especial, pelo imensuravel apoio, pelo pre-
sente que e te-lo ao meu lado.
A toda minha famlia, pela confianca, carinho e compreensao, mesmo nos momentos
mais difceis.
-
A todos os meus amigos, que formam minha segunda famlia, agradeco por me
permitirem participar de suas vidas.
A todos os professores que contriburam para a minha formacao, que muitas vezes
foram mais do que simples profissionais e dedicaram tambem sua valiosa amizade.
Por fim, a todos aqueles que colaboraram de alguma forma para que eu chegasse ate
aqui, agradeco e espero algum dia poder retribuir a altura.
-
RESUMO
Ao longo das ultimas decadas, diversas tecnicas tem sido desenvolvidas para clas-sificacao de imagens de sensoriamento remoto. No caso de imagens geradas porsensores que atuam na faixa de microondas (radar), novas pesquisas sao necessarias,ja que muitas vezes tecnicas consagradas para a classificacao de imagens opticas naoproduzem resultados satisfatorios quando aplicadas a imagens radar. Isso acontecedevido as caractersticas peculiares deste tipo de imagem - presenca de forte rudo,por exemplo. Na regiao amazonica, as condicoes climaticas frequentemente favore-cem a cobertura de nuvens, o que se apresenta como fator restritivo a utilizacao desensores opticos, incapazes de transpor este obstaculo naturalmente. Entretanto, ossensores SAR praticamente nao sao afetados pela cobertura de nuvens, e portantotem se tornado os principais responsaveis pela obtencao de dados, contribuindo parasuprir a falta de informacao disponvel sobre esta regiao. Neste trabalho, avalia-se aeficiencia de um classificador neural baseado no mapa auto-organizavel de Kohonenpara classificacao de imagens SAR do SIVAM (Sistema de Vigilancia da Amazonia),utilizando medidas de textura obtidas por filtros Gabor. Na fase de extracao deatributos, um processo de elevado custo computacional, foram implementadas tec-nicas de processamento paralelo em rede de computadores de baixo custo, a fim deavaliar o real ganho em desempenho. As imagens utilizadas foram obtidas pelo sen-sor SAR-SIVAM sobre Machadinho dOeste - RO, adquiridas em 13 de Setembro de2004 pelo sensor SAR da aeronave de sensoriamento remoto do SIVAM, gentilmentecedidas pela Divisao de Sensoriamento Remoto do Instituto de Estudos Avancados(IEAv/CTA). Como referencia para a identificacao visual de classes de texturas,serao utilizadas imagens opticas SPOT e dados de campo cedidos pela EMBRAPA.
-
A KOHONENS MAP FOR SAR IMAGES TEXTURECLASSIFICATION IN PARALLEL ENVIRONMENT
ABSTRACT
In the last decades, several techniques have been developed for classification of re-mote sensing images. In the case of images obtained from sensors that act in themicrowave regions (radar), new researches are necessary, since often successfull tech-niques for optical images classification do not produce satisfactory results when ap-plied to radar images. This happens due to the peculiar characteristics of this typeof image - e.g., the presence of strong noise. In the Amazon region, the climaticconditions frequently benefit clouds covering, what presents itself as a restrictivefactor to the use of optical sensors, unable to naturally cross this obstacles. How-ever, SAR sensors are pratically not affected by the clouds covering, and thus havebecome the main responsible for collection of data, contributing to supply the lackof information about this region. In this work, we evaluate the efficiency of a neuralclassifier based on the Kohonens Self-Organizing Map for classifying SAR-SIVAMimages obtained from Machadinho dOeste - RO, using Gabor texture features. Inthe feature extraction phase, a high computational cost proccess, techniques of par-allel processing were implemented in low cost computer network, in order to analyzethe real performance improvement. The images for testing were obtained in 2004September 13, by the SAR sensor of SIVAMs remote sensing aircraft, kindly givenby Remote Sensing Division of Advanced Studies Institute (IEAv/CTA). As refer-ence for the visual identification of texture classes, SPOT optical images and fieldinformation, given by EMBRAPA, are used.
-
SUMARIO
Pag.
LISTA DE FIGURAS
LISTA DE TABELAS
LISTA DE SIGLAS E ABREVIATURAS
CAPITULO 1 - INTRODUCAO 25
CAPITULO 2 - FUNDAMENTOS TEORICOS 29
2.1 - Imagens Obtidas por Radar de Abertura Sintetica (SAR) . . . . . . . . . 29
2.1.1 - Geometria de Aquisicao de Imagens SAR . . . . . . . . . . . . . . . . 31
2.1.2 - Equacao do Radar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.3 - Polarizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.1.4 - Reducao de Speckle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 - Atributos de Textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.1 - Metodos para Extracao de Atributos de Textura . . . . . . . . . . . . . 42
2.2.2 - A Transformada Discreta de Fourier . . . . . . . . . . . . . . . . . . . 44
2.2.3 - Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.2.4 - Filtros Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.2.5 - Representacao da Textura por Vetores de Atributos . . . . . . . . . . . 50
2.3 - Classificadores Baseados em Redes Neurais Artificiais . . . . . . . . . . . 51
2.3.1 - Fundamentos de Redes Neurais Artificiais . . . . . . . . . . . . . . . . 53
2.3.2 - Mapa Auto-Organizavel de Kohonen (SOM) . . . . . . . . . . . . . . . 58
2.3.3 - Aprendizagem por Quantizacao Vetorial (LVQ) . . . . . . . . . . . . . 60
2.4 - Processamento Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.4.1 - A Arquitetura Beowulf . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.2 - Conceitos Basicos de Paralelismo . . . . . . . . . . . . . . . . . . . . . 67
2.4.3 - Analise de Eficiencia e Speedup . . . . . . . . . . . . . . . . . . . . . . 69
CAPITULO 3 - MATERIAIS E METODOS 71
3.1 - Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2 - O Sensor SAR/R-99B . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
-
3.3 - O Projeto Believe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4 - Matriz de Confusao e Indice Kappa . . . . . . . . . . . . . . . . . . . . . 75
3.5 - Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.5.1 - Definicao da Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . 78
3.5.2 - Definicao das Classes de Estudo . . . . . . . . . . . . . . . . . . . . . . 78
3.5.3 - Extracao das Amostras de Treinamento e Teste . . . . . . . . . . . . . 79
3.5.4 - Extracao de Atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.5.5 - Distribuicao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.5.6 - Treinamento da Rede SOM+LVQ . . . . . . . . . . . . . . . . . . . . . 82
3.5.7 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 83
CAPITULO 4 - ANALISE DE RESULTADOS 87
4.1 - Treinamento da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.1 - Combinacao de Bandas . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.2 - Tamanho dos Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1.3 - Configuracao da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.2 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.3 - Analise de desempenho e eficiencia . . . . . . . . . . . . . . . . . . . . . 94
CAPITULO 5 - CONCLUSOES 99
REFERENCIAS BIBLIOGRAFICAS 101
APENDICE A - DISTRIBUICAO DO PROCESSAMENTO 107
-
LISTA DE FIGURAS
Pag.
2.1 Espectro de frequencias, destacando a faixa de microondas e as bandas
de radar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2 Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos de-
pendem de uma fonte de energia geralmente o sol que ilumine o alvo
para captar a energia refletida. . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 A ambiguidade no imageamento por radar com visada vertical. . . . . . . 32
2.4 Alguns parametros basicos de um sistema SLAR. . . . . . . . . . . . . . 33
2.5 A relacao entre o angulo de depressao e o efeito sombreamento sobre a
imagem SAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6 Os efeitos de inversao e encurtamento sobre a imagem SAR. . . . . . . . 37
2.7 Microondas polarizadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.8 Imagem SAR distorcida por rudo speckle. . . . . . . . . . . . . . . . . . 39
2.9 Processamento multilook. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.10 Exemplos de textura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.11 Exemplo de imagens de diferentes frequencias. . . . . . . . . . . . . . . . 45
2.12 Diagrama em blocos do processo de filtragem no domnio da frequencia. . 45
2.13 Exemplo de transformacao FT e STFT. . . . . . . . . . . . . . . . . . . 46
2.14 Sinal decomposto em wavelets de diferentes escalas e posicoes. . . . . . . 47
2.15 Efeito da alteracao de escala em uma wavelet. . . . . . . . . . . . . . . . 48
2.16 Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de re-
dundancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
-
2.17 O conceito do classificador como uma conexao entre uma imagem (a
esquerda) e um conjunto de rotulos de classe (a direita). . . . . . . . . . 52
2.18 O neuronio e seus principais componentes . . . . . . . . . . . . . . . . . 54
2.19 A sinapse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.20 O neuronio artificial de McCulloch e Pitts. . . . . . . . . . . . . . . . . . 55
2.21 Exemplos de arquiteturas (ou topologias) de redes neurais artificiais. . . 56
2.22 Funcoes de ativacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.23 Funcao de vizinhanca gaussiana. . . . . . . . . . . . . . . . . . . . . . . . 59
2.24 Diagrama em blocos da classificacao SOM+LVQ. . . . . . . . . . . . . . 60
2.25 Diagrama de Voronoi envolvendo quatro celulas. . . . . . . . . . . . . . . 61
2.26 Visao logica de um cluster da classe Beowulf. . . . . . . . . . . . . . . . 65
2.27 Cluster do projeto BELIEVe (IEAv/CTA). . . . . . . . . . . . . . . . . . 66
2.28 Modelos computacionais SISD, SIMD e MISD. UC=Unidade de Con-
trole; UP=Unidade de Processamento; M=Memoria; FI=Fluxo de In-
strucoes; FD=Fluxo de Dados. . . . . . . . . . . . . . . . . . . . . . . . 68
2.29 Modelos computacionais MIMD de memoria compartilhada (a) e dis-
tribuda (b). UC=Unidade de Controle; UP=Unidade de Processa-
mento; M=Memoria; FI=Fluxo de Instrucoes; FD=Fluxo de Dados. . . 69
3.1 Localizacao do municpio de Machadinho dOeste. . . . . . . . . . . . . . 71
3.2 Aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3 Metodologia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4 Imagem SAR (banda L VH polarizada) obtida sobre a area de estudo,
destacando os recortes selecionados para analise. . . . . . . . . . . . . . . 78
3.5 Interface do modulo de geracao de Filtros Gabor. . . . . . . . . . . . . . 80
-
3.6 Interface de selecao de amostras e extracao de atributos. . . . . . . . . . 81
3.7 Interface do modulo de treinamento da rede. . . . . . . . . . . . . . . . . 83
3.8 Interface do modulo de classificacao das imagens. . . . . . . . . . . . . . 84
4.1 Valores de Kappa obtidos para diferentes tamanhos de filtros. . . . . . . 90
4.2 Graficos com ndices Kappa observados para diferentes configuracoes da
rede SOM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.3 Evolucao do treinamento em termos dos valores de Kappa. . . . . . . . . 92
4.4 Recorte selecionado para analise e imagem resultante da classificacao. . . 94
4.5 Medidas de speedup observadas. . . . . . . . . . . . . . . . . . . . . . . . 96
4.6 Medidas de eficiencia observadas. . . . . . . . . . . . . . . . . . . . . . . 97
-
LISTA DE TABELAS
Pag.
3.1 Caractersticas da aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . 73
3.2 Exemplo de matriz de confusao. . . . . . . . . . . . . . . . . . . . . . . . 76
3.3 Numero de pixels de treinamento e teste para cada classe. . . . . . . . . 79
3.4 Numero de pixels de treinamento para cada classe. . . . . . . . . . . . . 84
4.1 Valores de kappa para cada banda. . . . . . . . . . . . . . . . . . . . . . 87
4.2 Valores de Kappa para combinacoes entre bandas. . . . . . . . . . . . . . 88
4.3 Valores de Kappa para X(HH) + L(VH) filtradas. . . . . . . . . . . . . . 89
4.4 Matriz de confusao resultante da classificacao. . . . . . . . . . . . . . . . 93
4.5 Medidas de speedup e eficiencia obtidas para o conjunto de 17.500 pixels. 94
4.6 Medidas de speedup e eficiencia obtidas para o conjunto de 52.500 pixels. 95
4.7 Medidas de speedup e eficiencia obtidas para o conjunto de 87.500 pixels. 95
-
LISTA DE SIGLAS E ABREVIATURAS
SAR Synthetic Aperture RadarSR Sensoriamento RemotoINSAR Interferometria SARSIVAM Sistema de Vigilancia da AmazoniaSLAR Side Looking Airbone RadarDFT Discrete Fourier TransformFFT Fast Fourier TransformSTFT Short-Time Fourier TransformCWT Continuous Wavelet TransformSOM Self-Organizing MapLVQ Learning Vector QuantizationPVM Parallel Virtual MachineMPI Message-Passing InterfaceSISD Single-Instruction Single-DataMISD Multiple-Instruction Single-DataSIMD Single-Instruction Multiple-DataMIMD Multiple-Instruction Multiple-Data
-
CAPITULO 1
INTRODUCAO
A classificacao de imagens de sensoriamento remoto consiste em associar um rotulo
de classe a cada pixel, com base em medidas extradas da imagem - geralmente do
proprio pixel ou de seus vizinhos. Uma imagem de sensoriamento remoto totalmente
classificada e chamada de mapa tematico, pois possibilita a identificacao geografica
das classes sobre a superfcie imageada (CROSTA, 1992). Ha diversas aplicacoes para
a classificacao de imagens de sensoriamento remoto, como, por exemplo, analise de
culturas agrcolas, monitoramento e controle ambiental, planejamento urbano, etc.
Para classificacao de imagens geradas a partir de sensores opticos, diversas tecnicas
tem sido desenvolvidas, aperfeicoadas e utilizadas ao longo das ultimas decadas.
Entretanto, no caso das imagens obtidas a partir de sensores que atuam na faixa de
microondas (radar), novas pesquisas sao necessarias, ja que muitas vezes tecnicas de
classificacao consagradas para dados opticos nao produzem resultados satisfatorios
quando aplicadas a imagens radar, devido as caractersticas peculiares desse tipo de
imagem presenca de forte rudo, por exemplo.
Presente em todo tipo de imagem (HARALICK, 1979), a textura e um atributo es-
pacial que reflete a impressao de aspereza ou suavidade criada pela variacao de
tonalidade ou repeticao de padroes atraves de uma superfcie (TSO; MATHER, 2001).
No contexto do sensoriamento remoto, atributos de textura mostram-se eficazes ao
atuar como informacoes auxiliares na caracterizacao de classes, melhorando muitas
vezes o resultado da classificacao. Em imagens de radar, a incorporacao da textura ao
processo de classificacao e utilizada principalmente quando aplicada a discrimacao
de diferentes tipos de florestas e variedades de culturas agrcolas que nao se dis-
tinguem por apresentarem a mesma tonalidade (ou nvel de cinza medio), mas que
podem ser discriminadas pela diferenca de textura (SILVA JUNIOR, 2001). Pesquisas
em psicologia mostram que o cerebro humano realiza uma analise em frequencia das
imagens, e celulas simples no cortex visual podem ser modeladas mediante as funcoes
Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta propriedade, associada
ao fato de as wavelets Gabor serem melhor localizadas no tempo e na frequencia e
apresentarem maior numero de parametros, torna as funcoes Gabor especialmente
apropriadas para a representacao de caractersticas locais das imagens (CASTANON,
2003).
25
-
Em Manjunath e Ma (1996), e proposta uma metodologia na qual os padroes de
textura sao caracterizados utilizando a transformada wavelet de Gabor e medidas
estatsticas. Esta metodologia foi utilizada por Martins (2003) para a implemen-
tacao de um classificador neural de atributos de textura, baseado em dois tipos
de redes neurais artificiais integradas: mapa auto-organizavel de Kohonen (SOM) e
aprendizagem por quantizacao vetorial (LVQ). A capacidade de reconhecer padroes,
mesmo ao lidar com informacoes ruidosas ou incompletas (HAYKIN, 2001), contribui
para que as redes neurais artificiais atuem como ferramentas nos mais diversos tipos
de problemas (FAUSETT, 1994). As redes neurais artificiais tem sido cada vez mais
usadas no contexto de sensoriamento remoto nos ultimos 10 anos, principalmente
para classificacao de imagens (TSO; MATHER, 2001).
Inaugurado em 25 de julho de 2002, o SIVAM (Sistema de Vigilancia da Amazo-
nia) (http://www.sivam.gov.br) tem o proposito de zelar pela Amazonia Legal
Brasileira. Esta area, considerada a maior reserva natural do planeta, esta sujeita a
acoes predatorias realizadas por madeireiras e garimpeiros ilegais, narcotraficantes e
diversos tipos de ilcito. Na regiao amazonica, as condicoes climaticas frequentemente
sao caracterizadas por coberturas de nuvens, o que se apresenta como fator restritivo
a utilizacao de sensores opticos. Assim, os sensores SAR (Synthetic Aperture Radar)
tem se tornado os principais responsaveis pela obtencao de dados, contribuindo para
suprir a falta de informacao disponvel sobre esta regiao. O SIVAM dispoe de tres
aeronaves R-99B equipadas com sensores SAR para gerar imagens radar da regiao.
Infelizmente, a facilidade em se produzir um grande volume de dados nao e acompan-
hada pela velocidade de analise dos mesmos e a consequente geracao de resultados
aplicaveis ao proposito do SIVAM. Portanto, metodologias em Processamento de
Alto Desempenho devem ser consideradas a fim de otimizar a manipulacao dessa
grande quantidade de dados.
Localizado a aproximadamente 400 km de Porto Velho, dentro da Amazonia Legal
Brasileira1, o municpio de Machadinho dOeste - RO foi escolhido por pesquisadores
da Embrapa e da organizacao nao-governamental ECOFORCA como objeto de um
estudo de longo prazo, com o objetivo de obter informacoes que proporcionem su-
porte aos projetos de sustentabilidade agrcola na Amazonia. Como resultado de uma
cooperacao tecnica entre a Embrapa Monitoramento por Satelite e o Instituto de
Estudos Avancados (IEAv) do Centro Tecnico Aeroespacial (CTA), foram adquiri-
1A Amazonia Legal Brasileira compreende a regiao Norte do Brasil, o estado do Mato Grossoe parte do estado do Maranhao.
26
http://www.sivam.gov.br
-
das imagens do municpio pelo sensor SAR da aeronave de sensoriamento remoto
R99-B do SIVAM, para contribuir na caracterizacao e monitoramento do uso do solo
e cobertura de terra da regiao.
Este trabalho tem como objetivo principal avaliar a eficiencia do classificador de-
senvolvido por Martins (2003) na classificacao da cobertura de terra e uso do solo
da regiao de Machadinho dOeste - RO, atraves de imagens obtidas por radar de
abertura sintetica. Dados de uso do solo e cobertura de terra verificados em campo
foram utilizados como amostras de treinamento para o classificador neural. Devido
ao alto tempo de execucao gasto para realizar a extracao de atributos de textura das
imagens, e necessario integrar tecnicas de processamento de alto desempenho a esta
etapa. Assim, atraves do paralelismo de dados, as amostras e imagens a serem anal-
isadas sao divididas entre varios processadores, que calculam os vetores de atributos
independentemente. Este trabalho esta sendo desenvolvido em um cluster baseado
no conceito de maquinas Beowulf. O ambiente utilizado faz parte do projeto BE-
LIEVe, desenvolvido no Laboratorio de Engenharia Virtual do Instituto de Estudos
Avancados (IEAv).
Este trabalho esta organizado da seguinte maneira. No Captulo 2 sao apresentadas
as fundamentacoes teoricas que servem como base para o desenvolvimento deste
trabalho. Sao descritos inicialmente os principais conceitos relacionados as imagens
obtidas por Radar de Abertura Sintetica; a seguir, discutem-se os temas basicos rel-
ativos a representacao de texturas, introduzindo a metodologia de extracao de atrib-
utos de textura por wavelets de Gabor (MANJUNATH; MA, 1996). Para uma melhor
compreensao desta metodologia, e apresentado um breve resumo sobre a transfor-
mada de Fourier e a teoria de wavelets. E apresentada tambem, resumidamente, a
teoria de redes neurais artificiais e sua aplicacao no contexto do reconhecimento de
padroes em sensoriamento remoto, abordando aspectos especficos relativos as re-
des utilizadas para implementacao do classificador analisado neste trabalho, SOM e
LVQ. Finalmente, sao discutidos os conceitos de processamento paralelo, para uma
melhor compreensao das ferramentas de computacao de alto desempenho utilizadas
no desenvolvimento desta pesquisa de mestrado.
O Captulo 3 descreve a area de estudo, os materiais utilizados e a metodologia
empregada.
No Captulo 4 sao apresentados e discutidos os resultados obtidos na classificacao
27
-
das imagens utilizando atributos de textura. Tambem sao apresentados os resultados
obtidos com a analise de desempenho da implementacao distribuda da extracao de
atributos de textura.
No Captulo 5 sao apresentadas as conclusoes e sugestoes de pesquisas futuras.
28
-
CAPITULO 2
FUNDAMENTOS TEORICOS
2.1 Imagens Obtidas por Radar de Abertura Sintetica (SAR)
A palavra radar, derivada da expressao RAdio Detection And Ranging, e usada para
denominar sensores que atuam na faixa de microondas do espectro eletromagnetico.
A faixa de microondas compreende as bandas cuja frequencia varia de 0.3 a 300
GHz, definindo assim comprimentos de onda entre 1 mm e 1 m (ULABY et al., 1982),
como mostra a Figura 2.1.
(a) Espectro de frequencias.
(b) Faixa de microondas e bandas de radar.
FIGURA 2.1 - Espectro de frequencias, destacando a faixa de microondas e as bandas de radar.
Os radares sao instrumentos que transmitem pulsos de microondas a um determinado
objeto (alvo) e recebem dele um sinal refletido (eco). Com base no tempo decorrido
entre a transmissao do sinal e seu retorno a antena, alem de outras propriedades do
eco, e possvel inferir uma serie de informacoes acerca do alvo, como por exemplo
sua distancia em relacao ao sensor. Os radares se distinguem dos sensores opticos
por diversas razoes, dentre as quais destacam-se:
29
-
a) O sinal refletido permite obter informacoes adicionais aquelas obtidas por
sistemas opticos e termicos, como aspereza e condutividade eletrica do alvo.
b) As microondas possuem alto poder de penetracao em nuvens e chuvas,
o que torna os radares ferramentes importantes para o imageamento de
regioes onde as condicoes meteorologicas se apresentam como fator restri-
tivo a utilizacao de sensores opticos.
c) Os radares imageadores sao sitemas ativos1, isto e, independentes da ilumi-
nacao solar, podendo ser empregados no perodo diurno ou noturno, sem
perda de desempenho (ULABY et al., 1982). A Figura 2.2 mostra a diferenca
entre sensores ativos e passivos.
(a) Radares (sensoresativos).
(b) Radiometros (sensorespassivos).
FIGURA 2.2 - Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos dependem de umafonte de energia geralmente o sol que ilumine o alvo para captar a energia refletida.FONTE: Sensing (2002).
Por essas razoes, e crescente o numero de sistemas SAR (Synthetic Aperture Radar)
em orbita atualmente, e e provavel que o imageamento por radar exerca um papel
cada vez mais importante no conhecimento e monitoramento do meio ambiente (TSO;
MATHER, 2001).
Entretanto, uma vez que a informacao gerada pelo radar e diferente daquela obtida
por sensores opticos, e necessario tambem utilizar tecnicas adequadas para tratar este
tipo de dado. Assim, a pesquisa e o desenvolvimento de novos metodos e ferramen-
tas especficas tem se tornado essenciais para possibilitar a analise dessa informacao.
1Sensores de microondas passivos (radiometros) detectam a radiacao de microondas gerada peloalvo.
30
-
Diversos trabalhos tem sido realizados nesta direcao, especialmente voltados para
tratar imagens SAR de regioes tropicais, como a Amazonia. Oliver (2000) propoe a
aplicacao de metodos de segmentacao a atributos de textura para classificar areas
da Amazonia entre as categorias floresta e nao-floresta, utilizando imagens do Par-
que Nacional de Tapajos. Komarov et al. (1999) associa tecnicas de redes neurais
artificiais a atributos de textura estatsticos para classificar regioes de floresta us-
ando imagens SAR. Em Dutra et al. (2003), investiga-se a utilizacao da metodologia
InSAR (Interferometria SAR) associada ao uso de conjuntos de imagens SAR obtidas
de uma mesma regiao, num pequeno intervalo de tempo, como auxlio a obtencao de
modelos de elevacao dos terrenos imageados. A eficacia de metodos supervisionados
multidimensionais na classificacao de imagens SAR do SIVAM pre-processadas por
filtros para reducao de speckle2 e avaliada por Maximo e Fernandes (2005).
2.1.1 Geometria de Aquisicao de Imagens SAR
O radar de abertura sintetica foi projetado por Carl Wiley em 1952 com a finalidade
de melhorar a resolucao de radares aerotransportados (ULABY et al., 1982). Para isso,
o tamanho da antena e sinteticamente aumentado, isto e, atraves de uma complexa
tecnologia, modifica-se o processamento do sinal de forma a simular uma antena
fisicamente longa. Assim, alem da reducao do tamanho real da antena, obtem-se
como resultado uma melhor resolucao da imagem, independente da distancia entre
o radar e o alvo, tornando viavel seu uso tanto em aeronaves quanto em espaconaves.
O processo de aquisicao das imagens baseia-se na geometria de visada lateral, carac-
terstica dos sensores SLAR (Side Looking Airbone Radar). Esta tecnica foi desen-
volvida para solucionar o problema da ambiguidade presente nos radares de visada
vertical. Este problema ocorre quando ecos provenientes de diferentes alvos tem suas
posicoes confundidas em funcao da recepcao simultanea dos mesmos pelo sistema
sensor, como mostra a Figura 2.3.
O sistema SLAR transmite e recebe energia na forma de microondas usando uma
antena fixada na lateral da aeronave. A area imageada e, entao, uma faixa do solo
paralela a trajetoria do voo (denominada direcao azimutal). A resolucao das imagens,
que corresponde a area iluminada pelo pulso do radar num dado instante de tempo,
depende principalmente da duracao do pulso e do raio da antena. A duracao do
pulso afeta a resolucao transversal, enquanto a largura do raio da antena controla a
2Speckle e um tipo de rudo caracterstico de imagens SAR, que sera descrito na Subsecao 2.1.4.
31
-
FIGURA 2.3 - A ambiguidade no imageamento por radar com visada vertical.FONTE: Adaptado de Ulaby et al. (1982)
resolucao azimutal, como pode ser observado nas Equacoes 2.1 e 2.2 (TSO; MATHER,
2001).
t =c
2sin ; (2.1)
a = R . (2.2)
Onde t e a indicam, respectivamente, as resolucoes transversal3 e azimutal; c cor-
responde a velocidade da luz; e a duracao do pulso; indica a largura horizontal
do feixe; e R corresponde a distancia do sensor a linha de visada. O angulo de in-
cidencia ou angulo de visada e definido como o angulo entre a direcao da energia
emitida e uma linha perpendicular a superfcie imageada (Figura 2.4).
O angulo de depressao () e complementar ao angulo de incidencia (), se assumir-
mos que a superfcie imageada seja plana. A largura horizontal do feixe () esta
relacionada ao tamanho da antena (l) e ao comprimento de onda (), como pode-
mos ver na Equacao 2.3.
=
l. (2.3)
3A resolucao transversal nada mais e do que a projecao da resolucao na linha de visada no solorLV = c2 (ULABY et al., 1982).
32
-
FIGURA 2.4 - Alguns parametros basicos de um sistema SLAR.FONTE: Adaptado de Ulaby et al. (1982)
Pode-se inferir da Equacao 2.1 que quanto mais curta for a duracao do pulso, mel-
hor sera a resolucao transversal. Essa dependencia, porem, carrega uma limitacao:
quanto mais curto o pulso, maior a potencia de pico exigida pelo sistema para que
se mantenha a mesma potencia media.
A distancia da linha de visada (R) e dada por:
R =h
cos , (2.4)
onde h e a altura de voo. Substituindo R na Equacao 2.2, tem-se:
a =h
cos . (2.5)
Assim, gracas aos parametros sin e cos , as resolucoes em azimute e transversal sao
funcao do angulo de incidencia () e, consequentemente, da linha de visada. Logo,
t e degradada nas distancias menores, enquanto a e degradada nas distancias
33
-
maiores. Isso faz com que a forma do pixel seja alongada na direcao transversal
para pequenas distancias e na direcao longitudinal para longas distancias (DAMIAO;
MAXIMO, 1998).
Para os sistemas SAR, as resolucoes transversal e em azimute sao calculadas de forma
distinta da apresentada anteriormente. Os sistemas de abertura sintetica utilizam,
em geral, pulsos de frequencia modulada (chirpped pulses), a fim de obter uma
melhor resolucao transversal sem, entretanto, ter que recorrer a pulsos muito curtos.
Assim, para imagens SAR, a resolucao transversal e calculada de acordo com a
Equacao 2.6:
t =c
2Bsin , (2.6)
onde B e a largura de banda do pulso modulado linearmente em frequencia e que
pode ser tao larga quanto necessaria, sem que para isso seja requerida uma grande
potencia de pico. A resolucao em azimute, por sua vez, independe teoricamente da
distancia entre a antena e o alvo, devido a construcao da antena sintetica. A melhor
resolucao em azimute sintetica potencial (ap) e apresentada na Equacao 2.7.
ap =L
2. (2.7)
As deducoes matematicas para a equacao acima podem ser encontradas em Ulaby
et al. (1982). Elas nao serao apresentadas aqui, pois seu nvel de complexidade foge
ao escopo deste trabalho.
2.1.2 Equacao do Radar
Equacao do radar e o nome dado a relacao entre as caractersticas do radar, do alvo
e do sinal recebido pelo sensor (ULABY et al., 1982). Ha diversas formas de apresentar
esta equacao, em funcao do tipo de radar utilizado ou do parametro tomado como
referencia. Se assumirmos que a antena de transmissao e a mesma de recepcao, o
radar e dito monostatico e a equacao do radar pode ser escrita nas seguintes formas:
Pr =PtA
2e
42R4, (2.8)
34
-
definindo Pr em termos de area da antena, ou:
Pr =PtG
22
(4)3R4, (2.9)
definindo Pr em termos de ganho da antena. Onde:
Pr e a potencia irradiada na direcao do radar;
Pt a potencia transmitida pelo radar;
Ae e a area efetiva da antena;
e a secao transversal radar do alvo;
e o comprimento de onda do sinal;
R e a distancia entre o alvo e o radar;
G e o ganho da antena.
O ganho da antena corresponde a medida da potencia que e aumentada na direcao
do alvo se comparada com a potencia que seria irradiada por uma antena isotropica
(omnidirecional). Radares geralmente usam antenas anisotropicas (diretivas), para
canalizar o maximo da potencia transmitida Pt em alguma direcao particular. Dentre
os parametros apresentados acima, apenas esta relacionado as propriedades da
superfcie imageada, determinando portanto o comportamento deste alvo frente a
um sistema de radar. Quando um alvo e iluminado pelo radar, parte da potencia
incidente tende a se espalhar em todas as direcoes, enquanto outra parte retorna
na direcao do radar. Tal fenomeno e definido como retroespalhamento e e uma
funcao complexa de parametros fsicos do alvo. A forma, o tamanho e o material do
alvo sao fatores determinantes para o retroespalhamento da onda eletromagnetica.
Para simplificar o equacionamento, todos esses fatores sao aglutinados em um unico
parametro , definido como a secao transversal do alvo. A descricao detalhada deste
parametro e dos fatores que o influenciam pode ser encontrada em Ulaby et al.
(1982).
2.1.2.1 Efeitos Geometricos sobre a Imagem SAR
Alguns fatores inerentes a geometria de aquisicao descrita acima podem afetar as
propriedades das imagens de modo a interferir na sua interpretacao. As distorcoes
35
-
geometricas mais comuns presentes nas imagens radar serao brevemente descritas
nesta secao.
Sombreamento (Shadowing)
Uma imagem radar e efetivamente uma representacao dos nveis de energia refletidos
por um alvo relacionados ao tempo decorrido entre a emissao da energia pela antena
e seu retorno a mesma. O efeito sombreamento corresponde a ausencia de informacao
sobre uma determinada area da imagem que fica oculta pela encosta de um objeto,
e e determinado pela altura do objeto e pelo angulo de depressao (TSO; MATHER,
2001). A Figura 2.5 mostra como estes parametros podem distorcer o imageamento.
No objeto A, o angulo b e menor do que o angulo de depressao correspondente 1.
Consequentemente, a encosta do objeto A e iluminada pela energia de microondas.
Entretanto, uma vez que o angulo b do objeto B e maior do que o angulo de
depressao correspondente 2, a antena do radar nao recebera nenhum sinal da regiao
localizada atras do alvo, gerando uma area de refletividade zero ate que o ponto a
seja atingido.
FIGURA 2.5 - A relacao entre o angulo de depressao e o efeito sombreamento sobre a imagem SAR.FONTE: Adaptado de Tso e Mather (2001)
E possvel solucionar este problema atraves do princpio da visada dupla, que consiste
na aquisicao de imagens a partir de duas direcoes diferentes de visada. A obtencao
de imagens sob perspectivas distintas gera um maior volume de dados disponveis,
revelando informacoes (especialmente feicoes lineares) que nao sao aparentes numa
36
-
imagem de visada simples (DAMIAO; MAXIMO, 1998).
Encurtamento (Foreshortening)
A natureza do terreno causa ainda outros efeitos sobre a interpretacao da imagem
relacionados a variacao da altura do terreno. Numa superfcie perfeitamente plana,
os elementos mais proximos do ponto sub-nadir seriam iluminados pelo feixe radar
e refletiriam o sinal antes daqueles elementos mais afastados. Os sinais, portanto,
seriam refletidos progressivamente no tempo da menor para a maior linha de visada.
Um elemento mais elevado do que os vizinhos, no entanto, devera interceptar o
pulso radar mais cedo, logo sera projetado na imagem numa posicao mais proxima
do ponto sub-nadir do que realmente esta. A Figura 2.6 mostra como este efeito
provoca um encurtamento aparente, no plano da imagem radar, das encostas cuja
parte inclinada esta voltada para o radar, ou seja, a encosta CD aparece encurtada
na imagem como C D (DAMIAO; MAXIMO, 1998).
FIGURA 2.6 - Os efeitos de inversao e encurtamento sobre a imagem SAR.FONTE: Adaptado de Damiao e Maximo (1998)
37
-
Inversao (Layover)
O efeito de inversao faz com que o topo de um alvo imageado seja visto pelo radar
como a base, e a base seja registrada como o topo do objeto. Este fenomeno ocorre
em casos extremos de encurtamento, quando o sinal leva menos tempo para ir da
antena ao topo do alvo do que a sua base. Como mostra a Figura 2.6, a inversao so
ocorre quando o angulo formado entre o caminho da energia e a encosta frontal do
objeto e maior do que 90 (TSO; MATHER, 2001).
2.1.3 Polarizacao
O retroespalhamento do sinal pode ainda ser influenciado pela polarizacao da onda
incidente, relacionada as propriedades eletromagneticas e geometricas do alvo. A
polarizacao descreve a orientacao do campo eletrico de uma onda eletromagnetica,
que pode ser do tipo linear, circular ou elptica. A maioria dos sistemas de radar
polarizam a energia lineamente, restringindo o campo eletrico a um plano fixo per-
pendicular a direcao de propagacao da onda Figura 2.7. A onda polarizada e entao
transmitida e recebida no plano horizontal (H) ou no plano vertical (V), possibil-
itando quatro combinacoes de transmissao e recepcao: HH, VV, HV e VH, onde
a primeira e a segunda letra indicam, respectivamente, a polarizacao da radiacao
transmitida e a polarizacao da radiacao recebida pela antena. Polarizacoes cruzadas
(HV e VH) geralmente produzem ecos mais fracos do que aqueles gerados por config-
uracoes paralelas (HH e VV). Em sensoriamento remoto, e comum o uso de radares
multipolarimetricos, capazes de coletar dados em qualquer uma das quatro combi-
nacoes possveis.
FIGURA 2.7 - Microondas polarizadas.
38
-
2.1.4 Reducao de Speckle
Devido ao mecanismo de imageamento inerente, as imagens SAR sao comumente
corrompidas por um rudo conhecido como speckle, provocando uma distorcao ra-
diometrica cujo efeito visual e a aparencia granulosa caracterstica deste tipo de
imagem, como pode ser observado na Figura 2.8. O speckle e causado pela inter-
ferencia entre ondas refletidas de microscopicos difusores dentro de cada celula de
resolucao, e e geralmente modelado como um rudo multiplicativo, ou seja, propor-
cional a intensidade do sinal recebido.
FIGURA 2.8 - Imagem SAR distorcida por rudo speckle.
O efeito do speckle pode ser diminudo aplicando-se alguma forma de pre-
processamento sobre a imagem, melhorando, assim, os resultados de uma classi-
ficacao posterior. Duas abordagens podem ser adotadas com esta finalidade: pro-
cessamento de multiplas visadas ou processamento multilook, e filtragem espacial.
A primeira tecnica e incorporada ao processo de geracao da imagem, enquanto a
39
-
segunda consiste na aplicacao de filtros sobre a imagem ja formada.
2.1.4.1 Processamento Multilook
O processamento multilook consiste em dividir a abertura da antena em varias sub-
aberturas, cada qual proporcionando uma visada (look) independente sobre a su-
perfcie iluminada Figura 2.9. A imagem final e obtida calculando-se a media entre
as imagens geradas por cada visada (SENSING, 2002).
FIGURA 2.9 - Processamento multilook.FONTE: Sensing (2002).
Embora o processamento multilook seja capaz de reduzir o efeito do rudo, ele tam-
bem provoca a degradacao da resolucao espacial da imagem, proporcionalmente ao
numero de visadas escolhido.
2.1.4.2 Filtragem Espacial
Os filtros para reducao de speckle podem ser de dois tipos: adaptativos ou nao-
adaptativos. As tecnicas nao-adaptativas nao levam em consideracao propriedades
locais do terreno imageado, bem como caractersticas relacionadas a natureza do
sensor. Por essa razao, nao sao recomendadas quando se deseja preservar o maximo
de informacao sobre a imagem de entrada. Sao exemplos conhecidos de filtros nao-
adaptativos o filtro da Media e o da Mediana.
Nos filtros adaptativos, o grau de suavizacao se adapta a medidas estatsticas locais
sobre o restroespalhamento do terreno, preservando melhor detalhes como bordas e
40
-
areas de textura elevada (SENSING, 2002). Diversos metodos de filtragem tem sido
propostos na tentativa de proporcionar maior reducao de speckle associada a perda
mnima de informacao, como os filtros de Lee, Frost e RGMAP.
Filtro de Lee. Transforma o modelo multiplicativo em aditivo atraves de uma lin-
earizacao por expansao em serie de Taylor, aplicada sobre a multiplicacao
do sinal e do rudo em torno da media, eliminando, assim, a dependencia
entre o rudo e o valor do pixel (SANTANNA et al., 2001). O sinal sem rudo
e dado pela soma ponderada do valor do pixel observado (central) e do valor
da media. O coeficiente de ponderacao e uma funcao da heterogeneidade
local do alvo, medido atraves do coeficiente de variacao (SENSING, 2002).
Utiliza estatsticas locais para minimizar o erro quadratico medio atraves
do filtro de Wiener.
Filtro de Frost. E um filtro convolucional linear, derivado da minimizacao do erro
quadratico medio sobre o modelo multiplicativo do rudo (SANTANNA et al.,
2001). Estima-se o valor do sinal livre de speckle utilizando uma sub-janela
da janela de processamento, cujo tamanho varia em funcao da heterogenei-
dade local do alvo, medida atraves do coeficiente de variacao (SENSING,
2002).
Filtro MAP Gama (Maximum a Posteriori Gama). Baseia-se na premissa
de que o sinal livre de rudo da cena subjacente obedece a distribuicao
Gama. Assim, o valor do pixel e obtido maximizando-se a funcao den-
sidade de probabilidade a posteriori (Gama) com relacao ao sinal real.
Dentro de cenas conhecidamente bem modeladas pela distribuicao Gama,
como oceanos, florestas e areas agrcolas, e capaz de minimizar a perda de
informacao textural melhor do que os filtros de Frost e de Lee (SENSING,
2002).
2.2 Atributos de Textura
A interpretacao e analise de imagens e realizada com base em atributos espectrais
e espaciais. Entendem-se por espectrais os atributos que descrevem a tonalidade
(variacao do nvel de cinza) de um dado pixel em uma imagem, enquanto os atributos
espaciais refletem a distribuicao espacial de tonalidades dentro de uma regiao da
imagem. Ha dois tipos de relacao espacial: a textura, focada no objeto de interesse,
41
-
representando sua estrutura; e o contexto, que analisa o objeto em relacao ao restante
da cena.
Em termos visuais, Tso e Mather (2001) descrevem a textura como a impressao de
aspereza ou suavidade criada pela variacao de tonalidade ou repeticao de padroes
atraves de uma superfcie. Segundo Haralick (1979), a textura esta presente em todo
tipo de imagem, desde aquelas obtidas por satelites e aeronaves ate microscopicas
imagens de culturas celulares ou amostras de tecido. No contexto de sensoriamento
remoto, atributos de textura mostram-se eficazes ao atuar como informacoes auxil-
iares na caracterizacao de classes, melhorando muitas vezes o resultado da classifi-
cacao.
(a) Padrao regular. (b) Padrao irregular.
FIGURA 2.10 - Exemplos de textura.FONTE: Wu et al. (2000)
A textura tem sido incorporada a classificadores de imagens SAR na expectativa de
melhorar seu desempenho, especialmente para distinguir objetos de mesma tonali-
dade ou cor. A crescente importancia e utilidade da textura em metodos de classi-
ficacao de imagens SAR pode ser observada pelo grande numero de trabalhos de-
senvolvidos nesta area nos ultimos anos (DOBSON et al., 1997; KOMAROV et al., 1999;
DEKKER, 2001; GARCIA; PUIG, 2002; FLETCHER; EVANS, 2002; ACQUA; GAMBA,
2003; KUPLICH et al., 2005; KANDASWAMY et al., 2005).
2.2.1 Metodos para Extracao de Atributos de Textura
As medidas de media e variancia sao definidas como os atributos mais simples que
podem ser usados para caracterizar texturas de uma dada regiao (TSO; MATHER,
42
-
2001). E possvel, no entanto, encontrar diferentes padroes de textura que apresen-
tem a mesma media e variancia, mostrando que estes descritores nao sao suficientes
para analise textural, e formalismos mais abrangentes sao necessarios. Neste con-
texto, diversos metodos tem sido propostos na literatura, e embora nao haja uma
definicao operacional ou formulacao matematica precisa para quantificar as medidas
de textura de uma imagem, as principais abordagens dividem-se em quatro catego-
rias: dimensoes fractais e multifractais; matriz de co-ocorrencia; campo randomico
auto-regressivo multiplicativo; e filtragem no domnio da frequencia (TSO; MATHER,
2001). A primeira utiliza o conceito de dimensao fractal como medida para a quan-
tificacao da textura; superfcies complexas (alta dimensao multifractal) representam
texturas grosseiras, enquanto superfcies simples (suaves) possuem textura mais fina.
O modelo baseado em matriz de co-ocorrencia define a informacao textural atraves
da dependencia espacial entre os nveis de cinza de uma imagem. Em texturas gros-
seiras, observa-se uma ligeira mudanca na distribuicao dos valores espectrais numa
determinada distancia, enquanto em texturas finas a distribuicao muda rapidamente.
Nas tecnicas baseadas em campo randomico auto-regressivo multiplicativo (MAR
Multiplicative Autoregressive Random Fields), a textura e caracterizada pela uti-
lizacao de estimativas lineares do nvel de cinza de um pixel relacionado aos nveis
de cinza de sua vizinhanca. Os coeficientes possuem grande variacao em regioes de
texturas finas, enquanto texturas grosseiras apresentam coeficientes similares.
Os metodos que aplicam a filtragem no domnio da frequencia tem apresentado bons
resultados na tentativa de extrair informacoes de textura (TSO; MATHER, 2001).
Em geral, texturas finas estao associadas a altas frequencias espaciais, enquanto
em texturas grosseiras as frequencias baixas sao dominantes. Ha muitos algoritmos
disponveis com o objetivo de transformar dados de imagem do domnio espacial para
o domnio da frequencia, sendo o mais conhecido deles a transformada de Fourier,
que decompoe um sinal em um conjunto de funcoes senos e cossenos com diferentes
frequencias (MYLER; WEEKS, 1993). A metodologia adotada neste trabalho para
extracao de atributos de textura nas imagens baseia-se na teoria de filtros Gabor.
Para uma melhor compreensao desta teoria, uma breve descricao da transformada
de Fourier e da transformada wavelet e apresentada a seguir.
43
-
2.2.2 A Transformada Discreta de Fourier
As transformacoes matematicas sao aplicadas a sinais para extrair informacoes que
nao sao perceptveis de forma direta (MARTINS, 2003). Uma melhor visualizacao
dos dados a fim de realcar determinadas caractersticas de interesse requer, muitas
vezes, a mudanca do domnio temporal ou espacial para o domnio da frequencia.
Em 1822, com o objetivo inicial de descrever a conducao de calor e determinar
a distribuicao de temperatura ao longo de uma lamina, o matematico frances Jean
Baptiste Joseph Fourier criou o conceito de series de Fourier, mostrando que qualquer
funcao periodica pode ser representada como uma soma de funcoes trigonometricas.
Desde entao, a analise de Fourier tem revolucionado os mais diversos campos da
ciencia e engenharia, da radioastronomia a medicina (PRESS et al., 1992).
Uma extensao a serie de Fourier, a transformada de Fourier permite representar
funcoes nao-periodicas, ampliando assim a quantidade de aplicacoes possveis. De
maior relevancia no contexto de processamento digital de imagens, a versao discreta
da transformada de Fourier (DFT - Discrete Fourier Transform) e definida sobre
uma grade discreta de pixels de uma imagem I = I(m,n) (SEUL et al., 2000), de
acordo com a Equacao 2.10.
F (u, v) =1
MN
M1m=0
N1n=0
I(m,n) exp[i2
(umM
+vn
N
)], (2.10)
onde F (u, v) corresponde a representacao no domnio da frequencia de I(m,n); i =1; u e v sao as amostras correspondentes em frequencia as amostras espaciais
m e n. A faixa nos dois domnios e a mesma: 0 m M 1, 0 n N 1 e0 u M 1, 0 v N 1. A DFT inversa e dada por:
I(m,n) =1
MN
M1u=0
N1v=0
F (u, v) exp[i2(umM
+vn
N
)]. (2.11)
O conceito de frequencia em uma imagem pode ser facilmente interpretado pela
observacao dos detalhes espaciais ali contidos. A Figura 2.11 ilustra o conceito
de frequencia espacial atraves de duas figuras, com conjuntos periodicos de ondas
quadradas em duas frequencias espaciais distintas. A razao periodica das listras da
Figura 2.11(a) e de 2 ciclos/cm, contra 1 ciclo/cm na Figura 2.11(a).
44
-
(a) (b)
FIGURA 2.11 - Exemplo de imagens de diferentes frequencias.FONTE: Adaptado de Myler e Weeks (1993).
A Transformada Rapida de Fourier (FFT Fast Fourier Transform) consiste
numa implementacao eficiente da DFT, que pelo uso da estrategia dividir-para-
conquistar4, e capaz de reduzir a complexidade computacional da DFT da ordem
de N2 para apenas N log2N operacoes (GERSHENFELD, 1999). Em uma imagem de
1024 x 1024 pixels, isso equivale a um ganho de 10:1 (SEUL et al., 2000). A trans-
formada de Fourier e normalmente usada para filtragem no domnio da frequencia
atraves da aplicacao sucessiva da FFT direta e inversa. Na primeira etapa, a imagem
e transformada para o domnio da frequencia usando a FFT. O sinal em frequencia
e entao filtrado, e em seguida submetido a FFT inversa para voltar ao domnio es-
pacial, obtendo assim a imagem modificada. O diagrama em blocos deste processo
e apresentado na Figura 2.12.
FIGURA 2.12 - Diagrama em blocos do processo de filtragem no domnio da frequencia.
Em muitas aplicacoes, porem, nao basta conhecer as componentes em frequencia
contidas no sinal, mas tambem a localizacao no domnio espacial (ou temporal) em
que ocorre cada uma delas. Isso torna a transformada de Fourier inadequada para
4No contexto de projeto de algoritmos, a abordagem dividir-para-conquistar consiste em di-vidir um problema de difcil solucao sucessivamente em subproblemas menores, resolve-los recursi-vamente, e entao combinar estas solucoes para encontrar a resposta para o problema original (AHOet al., 1974).
45
-
tratar sinais do tipo nao-estacionario, ou seja, cujo conteudo em frequencia varia com
o tempo. Com o intuito de superar esta limitacao, Dennis Gabor, em 1946, adaptou
a transformada de Fourier para analisar somente uma pequena porcao de um sinal
de cada vez, criando uma tecnica chamada janelamento (windowing) do sinal, como
mostra a Figura 2.13. A adaptacao de Gabor, chamada de Transformada de Fourier
por Janelamento (Short-Time Fourier Transform STFT), mapeia o sinal em uma
funcao bidimensional de tempo e frequencia (STARCK et al., 1998).
(a)
(b)
FIGURA 2.13 - Exemplo de transformacao FT e STFT.FONTE: Adaptado de Misiti et al. (2006).
Embora esta relacao entre a informacao do tempo e a frequencia obtida pela STFT
seja bastante util, sua precisao e limitada pelo tamanho da janela, fixo para todo o
conteudo em frequencias. Muitos sinais requerem uma avaliacao mais flexvel, com
a possibilidade de variar o tamanho da janela para determinar a relacao entre o
intervalo de tempo e a frequencia com melhor precisao (MISITI et al., 2006). Nesta
situacao, a transformada wavelet pode ser mais apropriada.
46
-
2.2.3 Wavelets
Atraves da aplicacao de janelas de tempo com tamanhos variaveis na decomposicao
de um sinal, a analise por wavelets permite o uso de longos intervalos de tempo para
verificar com mais precisao informacoes de baixa frequencia, ou de intervalos de
tempo menores quando se deseja maior precisao em informacoes de alta frequencia
(GERSHENFELD, 1999).
O termo wavelet refere-se a um conjunto de funcoes em forma de pequenas ondas
geradas por dilatacoes e translacoes de uma funcao simples (t) denominada wavelet-
mae. A definicao da transformada wavelet contnua (CWT Continuous Wavelet
Transform) e dada por:
W (a, b) =1a
inf inf
f(t) (t ba
)dx , (2.12)
onde os parametros a(> 0) e b correspondem as informacoes de escala e posicao,
respectivamente. A Figura 2.14 representa graficamente a decomposicao de um sinal
por wavelets de escalas e posicoes diferentes.
FIGURA 2.14 - Sinal decomposto em wavelets de diferentes escalas e posicoes.FONTE: Misiti et al. (2006)
O fator escala esta relacionado com a frequencia do sinal e consequentemente com
a capacidade da funcao wavelet em identificar detalhes finos ou grosseiros de um
sinal (MISITI et al., 2006). Pequenas escalas correspondem a wavelets comprimidas,
capazes de detectar melhor pequenos detalhes e variacoes rapidas, enquanto escalas
maiores esticam as wavelets, proporcionando melhor representacao para feicoes
grosseiras e variacoes lentas, como mostra a Figura 2.15.
Depois de consolidada a teoria da transformada wavelet, muitos pesquisadores
47
-
FIGURA 2.15 - Efeito da alteracao de escala em uma wavelet.FONTE: Adaptado de Misiti et al. (2006)
comecaram a estudar a aplicacao de wavelets a representacao de texturas (MAR-
TINS, 2003). Ao avaliar o desempenho de atributos de textura extrados por difer-
entes transformadas wavelet, incluindo ortogonais e nao-ortogonais, tipo arvore es-
truturada e transformada de Gabor, Manjunath e Ma (1995) observaram melhor
representacao para os padroes de teste quando aplicada a transformada wavelet de
Gabor. A utilizacao de bancos de filtros Gabor para extracao de atributos de textura
e descrita a seguir.
2.2.4 Filtros Gabor
Pesquisas em psicologia mostram que o cerebro humano realiza uma analise em
frequencia das imagens, e celulas simples no cortex visual podem ser modeladas
mediante as funcoes Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta
propriedade, associada ao fato de as wavelets Gabor serem melhor localizadas no
tempo e na frequencia e apresentarem maior numero de parametros, torna as funcoes
Gabor especialmente apropriadas para a representacao de caractersticas locais das
imagens (CASTANON, 2003).
Em duas dimensoes, a funcao Gabor g(x, y) e sua transformada de Fourier G(u, v)
podem ser escritas como:
g(x, y) =
(1
2xy
)exp
[1
2
(x2
2x+y2
2y
)+ i2Wx
], (2.13)
48
-
G(u, v) = exp
{1
2
[(uW )2
2u+v2
2v
]}, (2.14)
onde u = 1/2x e v = 1/2y. As funcoes Gabor formam um conjunto base
completo (nao-ortogonal), que e usado para expandir o sinal, obtendo assim sua
descricao em frequencia local. Um banco (ou dicionario) de filtros Gabor pode ser
construdo atraves de dilatacoes e rotacoes apropriadas da wavelet mae g(x, y), a
partir da funcao geradora:
gmn(x, y) = amG(x, y), a > 1, m, n = integer , (2.15)
onde:
x = am(x cos + y sin ) , (2.16)
y = am(x sin + y cos ) , (2.17)
onde = n/K e K e o numero total de orientacoes e am e o fator escala. A
nao-ortogonalidade das wavelets Gabor implica que ha informacao reduntante nas
imagens filtradas. Para reduzir esta redundancia, Manjunath e Ma (1996) definem
uma estrategia de geracao de bancos de filtros Gabor, assegurando que os suportes
de magnitude de pico medio (half-peak) das respostas do banco de filtros no espectro
de frequencia tangenciem uns aos outros, como mostra a Figura 2.16.
O processo de eliminacao de redundancia e produto da utilizacao das seguintes
formulas no calculo dos parametros u e v (e, por consequencia, x e y):
a = (Uh/Ul)1/(S1) , (2.18)
u =(a 1)Uh
(a 1)
2 ln 2, (2.19)
49
-
FIGURA 2.16 - Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de redundancia.FONTE: Adaptado de Manjunath e Ma (1996)
v = tan(
2k
)[Uh 2 ln 2
(2uUh
)][2 ln 2 (2 ln 2)
22uU2h
]1/2, (2.20)
onde Ul e Uh correspondem aos centros inferior e superior de frequencias de interesse,
S corresponde ao numero de escalas na decomposicao em multirresolucao, e m =
0, 1, 2, . . . , S 1.
Para construir um banco ou dicionario de filtros, inicialmente e escolhido um inter-
valo de frequencias de interesse atraves da determinacao de dois valores de referencia:
frequencia superior e inferior. O segundo passo e determinar o numero de orientacoes
desejadas e em quantas escalas diferentes o intervalo de frequencia sera decomposto.
No dicionario de filtros representado pela Figura 2.16, os parametros usados sao: fre-
quencia superior Uh = 0.4; frequencia inferior Ul = 0.05; 6 orientacoes; e 4 escalas.
2.2.5 Representacao da Textura por Vetores de Atributos
Dada uma imagem I, e o banco de filtros Gabor gmn, a transformada Gabor em
(x, y) e definida por:
50
-
Wmn(x, y) =
I(x, y)gmn (x x1, y y1)dx1dy1 , (2.21)
onde indica o complexo conjugado. Com a aplicacao de filtros Gabor sobre ospadroes de textura, a geracao dos vetores de atributos e realizada atraves do calculo
de medidas estatsticas da imagem filtrada. As medidas estatsticas utilizadas sao a
media (mn) e o desvio padrao (mn) da magnitude dos coeficientes da transformada,
definidas por:
mn =
|Wmn(xy)|dxdy , (2.22)
mn =
(|Wmn(xy)| mn)2 dxdy , (2.23)
Para cada filtro aplicado, os dados estatsticos de media e desvio padrao sao calcu-
lados e concatenados para a formacao do vetor de atributos daquela textura. Neste
trabalho, foi utilizado um banco de filtros Gabor de quatro escalas e seis orientacoes.
Desta forma, os vetores de atributos resultantes tem a seguinte forma:
f = [11111212 . . . 4646] , (2.24)
onde op e op denotam, respectivamente, os valores da media e do desvio padrao no
estagio o e orientacao p. Um banco de filtros Gabor de quatro escalas e seis orien-
tacoes possui vinte e quatro filtros para cada medida. Como a informacao textural
e representada por duas medidas, entao o vetor de atributos possui quarenta e oito
elementos: dois parametros para cada filtro (MARTINS, 2003).
2.3 Classificadores Baseados em Redes Neurais Artificiais
A classificacao no contexto de sensoriamento remoto consiste em associar cada objeto
ou pixel de uma area em estudo a um ou mais elementos de um conjunto de rotulos
definido pelo usuario, convertendo a informacao numerica contida na imagem a uma
informacao tematica, como um determinado tipo de vegetacao (TSO; MATHER, 2001).
Este processo pode ser visto como uma funcao de mapeamento, que constroi uma
51
-
associacao entre os dados brutos e o conjunto de rotulos definido pelo usuario, como
mostra a Figura 2.17. Uma imagem de sensoriamento remoto totalmente classificada
e chamada de mapa tematico, pois possibilita a identificacao geografica das classes
sobre a superfcie imageada. (CROSTA, 1992).
FIGURA 2.17 - O conceito do classificador como uma conexao entre uma imagem (a esquerda) e umconjunto de rotulos de classe (a direita).FONTE: Adaptado de Tso e Mather (2001)
Por mais de uma decada, o reconhecimento de padroes em imagens de sensoriamento
remoto tem se baseado principalmente em tecnicas estatsticas convencionais, como
os procedimentos de maxima probabilidade e distancia mnima. Embora as abor-
dagens tradicionais possam apresentar bom desempenho, sua habilidade geral para
resolver confusoes inter-classes e limitada. Nos ultimos anos, estrategias alternativas
tem sido propostas, como o uso de redes neurais artificiais, arvores de decisao e meto-
dos derivados da teoria dos conjuntos nebulosos (Fuzzy Set Theory) (TSO; MATHER,
2001). A capacidade de reconhecer padroes, mesmo ao lidar com informacoes rui-
dosas ou incompletas (HAYKIN, 2001), contribui para que as redes neurais artificiais
possam atuar como ferramentas nos mais diversos tipos de problemas (FAUSETT,
1994). No contexto de sensoriamento remoto, seu uso vem crescendo nos ultimos
52
-
dez anos, principalmente para classificacao de imagens (TSO; MATHER, 2001).
2.3.1 Fundamentos de Redes Neurais Artificiais
O desenvolvimento da teoria de Redes Neurais Artificiais comecou ha aproximada-
mente 50 anos, motivado pelo desejo de tentar entender e ao mesmo tempo imitar
o cerebro e algumas de suas habilidades (FAUSETT, 1994). Desde entao, cientistas
tem se empenhado em criar novas tecnicas, alem de aperfeicoar aquelas ja existentes,
com o objetivo de expandir as areas de aplicabilidade da Neurocomputacao. Embora
a plausibilidade biologica dos modelos computacionais seja considerada por alguns
pesquisadores menos importante do que sua capacidade de desempenhar as tarefas
desejadas, uma breve introducao sobre as caractersticas basicas dos sistemas neu-
rais biologicos pode ajudar no entendimento dos principais fundamentos envolvidos
no projeto de uma rede neural artificial.
Em termos moleculares, o neuronio e a unidade fundamental do sistema nervoso
central, por ser o componente responsavel por produzir e conduzir as informacoes que
nele circulam. Os neuronios (ou celulas nervosas) possuem configuracoes variadas de
acordo com sua funcao e regiao a que pertencem, porem obedecem a uma estrutura
geral, que consiste de tres componentes basicos, como mostra a Figura 2.18. O corpo
celular ou soma constitui o nucleo da celula e suas organelas. Os dendritos consistem
em um grande numero de pequenos prolongamentos do corpo celular, atraves dos
quais o neuronio recebe estmulos (informacoes) de outros neuronios a ele associados.
O axonio corresponde ao prolongamento longo e fino que se ramifica em sua porcao
terminal, atraves da qual o neuronio estabelece conexoes com outros neuronios. O
axonio pode se originar do corpo celular ou de um dendrito principal e e onde se
concentra a sada de informacao da celula.
53
-
FIGURA 2.18 - O neuronio e seus principais componentes
O corpo celular (soma) e responsavel por somar os sinais de entrada. Quando a
entrada recebida e considerada suficiente, o neuronio dispara, ou seja, transmite
um sinal atraves de seu axonio a outros neuronios. O contato entre o axonio de um
neuronio e o dendrito de outro, ou seja, uma conexao entre dois neuronios, denomina-
se sinapse (Figura 2.19). A capacidade de estabelecer tais contatos e a principal
propriedade dos neuronios, pois e atraves das sinapses que os neuronios trocam
informacoes, formando a base para a realizacao das funcoes do sistema nervoso.
FIGURA 2.19 - A sinapse.
O neuronio consiste em um sistema eletroqumico muito pequeno, porem extrema-
mente complexo, sendo capaz de prover os principais mecanismos para processa-
mento de informacoes dentro do cerebro humano. Redes neurais artificiais podem ser
54
-
descritas como sistemas computacionais para processamento de informacao baseados
em um modelo simplificado do cerebro. Como uma analogia a constituicao biolog-
ica do cerebro, a unidade fundamental das redes neurais artificiais consiste em uma
estrutura denominada neuronio artificial ou unidade neuronal. O neuronio artificial
tem, para fins computacionais, sua geometria reduzida a um ponto, porem conserva
as caractersticas funcionais basicas do neuronio biologico. O primeiro modelo de
neuronio artificial conhecido foi desenvolvido em 1943, no trabalho pioneiro de Mc-
Culloch e Pitts (HAYKIN, 2001). Ele possui, como representado na Figura 2.20, tres
elementos basicos: um conjunto de sinais de entrada, cada qual associado a um peso;
um somador (
) para somar os sinais de entrada ponderados pelos pesos de suas
respectivas sinapses; e uma funcao de ativacao, responsavel pela ativacao ou nao
da sada do neuronio. Uma rede neural artificial e composta por um conjunto de
unidades neuronais conectadas entre si, e os pesos associados as conexoes represen-
tam a informacao usada pela rede para resolver o problema (FAUSETT, 1994).
FIGURA 2.20 - O neuronio artificial de McCulloch e Pitts.
No cerebro, cada neuronio esta conectado a milhares de outros, recebendo e proces-
sando, portanto, milhares de entradas diferentes. De acordo com a maneira como
cada neuronio esta conectado com os outros dentro da rede, ele se dedica a detec-
tar um conjunto especfico de coisas. Toda essa complexidade nao e possvel de ser
reproduzida em um modelo de simulacao devido as limitacoes impostas pela tecnolo-
gia atual, porem a tentativa de atingir plausibilidade biologica, mesmo atraves de
simplificacoes, pode levar a melhores atributos computacionais. Em uma rede neural
artificial, as unidades se distribuem na forma de camadas. O arranjo das camadas e
os padroes de conexoes entre elas determinam a arquitetura da rede, a qual, como
55
-
no caso dos sistemas biologicos, interfere diretamente no tipo de tarefa que a rede e
capaz de desempenhar. A Figura 2.21 ilustra os tres tipos de arquitetura possveis:
camada unica, composta por apenas uma camada de neuronios aritificiais conectada
a camada que contem os sinais de entrada (Fig. 2.21(a)); multiplas camadas, que
possui entre a entrada e a sada uma ou mais camadas ocultas (Fig. 2.21(b)); e ca-
mada competitiva, na qual a unidade a ser ativada para um dado padrao de entrada
e determinada atraves de um processo de competicao (Fig. 2.21(c)).
(a) Camada unica. (b) Multiplas camadas.
(c) Camada competitiva.
FIGURA 2.21 - Exemplos de arquiteturas (ou topologias) de redes neurais artificiais.
O processo de treinamento ao qual as unidades sao submetidas tambem varia entre
os diferentes modelos de redes. O treinamento ou aprendizagem consiste no metodo
usado para ajustar os pesos das conexoes ao longo da apresentacao dos sinais de
entrada (dados de treinamento), de forma que a rede aprenda a resolver o problema
em questao. Na aprendizagem supervisionada, o tipo mais comum, o treinamento
e realizado apresentando-se a rede uma sequencia de vetores de treinamento ou
padroes, cada qual associado a um vetor de sada desejado, conhecido como vetor-
alvo. O vetor-alvo representa um professor ou supervisor, que indica a rede se ela
esta ou nao produzindo a sada correta, determinando o ajuste dos pesos atraves de
um determinado algoritmo de aprendizagem.
56
-
As redes neurais auto-organizaveis constituem modelos governados por uma forma
nao-supervivisonada de treinamento, na qual uma sequencia de vetores de entrada e
fornecida, mas nao ha um supervisor, ou seja, nao sao especificados vetores-alvo. A
rede modifica os pesos de forma que vetores de entrada similares sejam associados
a mesma unidade de sada, produzindo um vetor representativo para cada grupo
formado (FAUSETT, 1994). Alem da arquitetura e do tipo e aprendizagem, uma
terceira caracterstica que distingue os modelos de redes neurais artificiais e sua
funcao de ativacao, aplicada sobre a soma dos sinais de entrada ponderados para
produzir a sada do neuronio. As funcoes de ativacao mais usadas, identidade, degrau
e sigmoide, estao representadas na Figura 2.22.
(a) Funcao identidade. (b) Funcao degrau.
(c) Funcao sigmoide.
FIGURA 2.22 - Funcoes de ativacao.FONTE: Adaptado de Misiti et al. (2006).
Nas proximas secoes, sao descritas as propriedades das redes utilizadas neste tra-
balho.
57
-
2.3.2 Mapa Auto-Organizavel de Kohonen (SOM)
Proposto por Kohonen (1988), o Mapa Auto-Organizavel de Kohonen e um modelo
de rede neural artificial baseado em competicao, isto e, no qual a rede deve escolher
uma unica unidade para responder a um dado padrao de entrada. A Figura 2.21(c)
mostra a topologia da rede SOM, representada em uma grade bidimensional de
unidades. A camada de entrada e conhecida como cortex sensorial, por analogia com
a funcao desta area no sistema neural biologico (TSO; MATHER, 2001). A camada de
sada e chamada entao de cortex de mapeamento.
Cada uma das ligacoes entre as camadas de entrada e sada possui um valor de
peso sinaptico wji onde i e j identificam o neuronio de entrada e sada, respecti-
vamente. O passo inicial para a criacao de uma rede SOM requer a definicao dos
parametros topologicos, ou seja, a escolha da quantidade de unidades nas camadas
de entrada e sada. O numero de unidades de entrada deve ser igual ao tamanho
do vetor de entrada. Nao ha uma especificacao formal para a dimensao da grade
bidimesional nm (n,m > 1), embora algumas recomendacoes possam ser encon-tradas na literatura (HAYKIN, 2001). O processo de treinamento da rede comeca com
a inicializacao dos pesos sinapticos wji, atribuindo-lhes valores aleatorios pequenos.
O proximo passo e retirar do espaco de entrada uma amostra x = {x1, x2, ..., xk},onde k e a dimensao dos dados de entrada. A distancia euclidiana entre o vetor de
entrada e cada unidade de sada e calculada de acordo com a Equacao 2.25:
d2j =ki
(xni wnji)2 , (2.25)
onde xni e a entrada submetida ao neuronio i na iteracao n. A unidade vencedora e
aquela que apresenta o melhor casamento com a entrada x, ou seja, arg min{d2j}.Os pesos sao entao ajustados usando a formula de atualizacao:
wn+1ji = wnji +
nj (xni wnji) , (2.26)
onde n corresponde a taxa de aprendizagem da rede, uma funcao que decresce grad-
ualmente com o tempo (numero de iteracoes). j e a funcao de vizinhanca centrada
em torno da unidade vencedora j, uma funcao unimodal da distancia lateral entre
58
-
a unidade vencedora (j) e sua vizinhanca (j), que deve satisfazer duas exigencias:
j e simetrica em relacao ao ponto maximo definido por d2j = 0; em outraspalavras, ela alcanca seu valor maximo na unidade vencedora (j), para a
qual a distancia d2j e nula;
a amplitude de j decresce monotonicamente com o aumento da distancialateral d2j , decaindo a zero para d
2j; esta e uma condicao necessaria
para a convergencia.
Uma escolha tpica para j e a funcao gaussiana:
j = exp
(d2j
22
), (2.27)
onde o parametro equivale a largura efetiva da vizinhanca topologica, como
mostra a Figura 2.23; ele mede o grau em que neuronios excitados na vizinhanca do
vencedor participam do processo de aprendizagem.
FIGURA 2.23 - Funcao de vizinhanca gaussiana.FONTE: Adaptado de Haykin (2001)
59
-
O processo a partir da etapa de amostragem e repetido ate que nao sejam observadas
mudancas significativas no mapa de caractersticas, ou ate que se atinja um numero
maximo predeterminado de iteracoes (HAYKIN, 2001).
2.3.3 Aprendizagem por Quantizacao Vetorial (LVQ)
A Aprendizagem por Quantizacao Vetorial (LVQ - Learning Vector Quantization)
e um metodo de classificacao de padroes cujo objetivo e refinar a definicao das
superfcies de decisao entre as classes, explorando informacoes conhecidas sobre os
padroes de treinamento. Desta maneira, e possvel aplicar o mapa auto-organizavel
de Kohonen para fazer um arranjo inicial dos pesos e, em uma etapa posterior,
utilizar a LVQ para fazer um ajuste fino sobre o mapa de caractersticas e melhorar
a capacidade de classificacao da rede, como mostra o diagrama da Figura 2.24.
FIGURA 2.24 - Diagrama em blocos da classificacao SOM+LVQ.FONTE: Adaptado de Haykin (2001)
A rede LVQ consiste em um modelo competitivo supervisionado, que requer uma
colecao de exemplos de treinamento associados a classes ou categorias conhecidas. O
conjunto de vetores de pesos relacionado as unidades de sada e geralmente denom-
inado livro-codigo, e cada membro e chamado palavra-codigo ou vetor de referencia
da classe representada pela unidade5. Cada padrao de entrada e associado a classe
dada pela unidade cujo vetor de referencia e o mais proximo (em medida de distan-
cia euclidiana) do vetor de entrada. O efeito desta associacao equivale a dividir o
espaco de entrada atraves de um diagrama de Voronoi6, como mostra a Figura 2.25.
5Os valores iniciais dos pesos correspondem aos valores finais obtidos pelo algoritmo SOM.Quando a rede LVQ e usada de forma independente, ou seja, sem um ajuste inicial dos pesos atravesdo algoritmo SOM, o conjunto inicial de pesos e composto de valores escolhidos aleatoriamente.
6Dados m pontos em um espaco n-dimensional, o diagrama de Voronoi e a particao do espacon-dimensional em m regioes poliedricas, uma regiao para cada ponto pm. Tal regiao e chamadacelula de Voronoi, e contem todos os pontos que sao mais proximos de p do que de qualquer outroponto no conjunto (HAYKIN, 2001).
60
-
FIGURA 2.25 - Diagrama de Voronoi envolvendo quatro celulas.FONTE: Adaptado de Haykin (2001)
A tecnica usada pelo algoritmo LVQ usa a informacao conhecida sobre as classes
para mover ligeiramente os vetores de Voronoi, a fim de melhorar a qualidade das
regioes de decisao do classificador (HAYKIN, 2001). Dado um vetor de entrada x e sua
sada-alvo (classe), o vetor de Voronoi (vetor de referencia) e movido em direcao a
x se ambos os vetores pertencerem a mesma classe, ou afastado de x caso contrario.
Isso implica numa pequena mudanca no algoritmo de treinamento em relacao a
Equacao 2.26 da rede SOM. Supondo que o vetor de Voronoi wc seja o mais proximo
do vetor de entrada xi, Cwc represente a classe associada ao vetor de Voronoi wc,
e Cxi represente o rotulo de classe do vetor de entrada xi, a atualizacao dos pesos
(vetores de Voronoi) ocorre como segue:
SeCwc =Cxi , entao
wn+1c = wnc +
n(xni wnc ) , (2.28)
onde 0 < n < 1.
SeCwc 6=Cxi , entao
wn+1c = wnc n(xni wnc ) . (2.29)
Os outros vetores de Voronoi nao sao modificados. E desejavel que a constante de
aprendizagem n decresca monotonicamente com o numero de iteracoes. Apos varios
61
-
passos atraves dos dados de entrada, os vetores de Voronoi tipicamente convergem
e o treinamento esta completo (HAYKIN, 2001). Uma modificacao deste algoritmo,
conhecida como LVQ2 (Aprendizagem por Quantizacao Vetorial Tipo 2), estipula
que as correcoes sobre os pesos somente devem ser efetuadas se o vetor de entrada
x estiver dentro de uma janela definida ao redor do plano medio entre dois vetores
de Voronoi vizinhos wp e wq pertencentes a classes diferentes. A largura otima desta
janela deve ser determinada experimentalmente, e depende do numero de amostras
de treinamento disponveis, embora algumas sugestoes praticas sejam discutidas em
Kohonen (1990) e Demuth et al. (2006). Neste caso, as seguintes atualizacoes sao
calculadas:
wn+1p = wnp +
n(xni wnp ) , (2.30)
wn+1q = wnq n(xni wnq ) , (2.31)
caso wp e xi pertencam a mesma classe (Cwp =Cxi), e wq e x, mesmo apresentando
menor distancia euclidiana, pertencam a classes distintas (Cwq =Cxi). Analisando
deficiencias contidas no algoritmo LVQ2, Kohonen (1990) desenvolveu uma terceira
versao para a Aprendizagem por Quantizacao Vetorial (LVQ3), que introduz uma
regra de atualizacao de pesos extra, aplicada nos casos em que x, wp e wq pertencam
a mesma classe, ou seja,Cwp =Cxi =Cwq . Esta nova regra e descrita na equacao
abaixo:
wn+1k = wnk + n(xni wnk ) , (2.32)
onde k{p, q}. O valor da constante e diretamente proporcional ao tamanho dajanela. Estudos apontam o LVQ3 como o algoritmo que produz os melhores re-
sultados (KOHONEN, 1990). O sucesso deste modelo em testes aplicados por Ma e
Manjunath (1996) ao reconhecimento de padroes de texturas determinou a escolha
do LVQ3 para o presente trabalho.
62
-
2.4 Processamento Paralelo
Desde o surgimento do primeiro computador digital eletronico7, a computacao pas-
sou por um processo evolutivo intenso, a fim de proporcionar maior desempenho
e ampliar o leque de aplicacoes que podem ser computacionalmente resolvidas de
maneira eficiente. A partir da decada de 70, em busca de maior eficiencia e facil-
idade no processo computacional, novas tecnologias passaram a ser desenvolvidas,
como a computacao paralela e as redes de computadores (SANTANA et al., 1997).
Pacheco (1997) define o computador paralelo como simplesmente um computador
(ou colecao de computadores) com multiplos processadores que podem trabalhar
juntos na resolucao de um problema unico. Sistemas paralelos e distribudos tem
se tornado essenciais no contexto do processamento digital de imagens, em especial
quando os dados sao obtidos por sensoriamento remoto. Esta necessidade e reforcada
pelo crescente uso de sistemas SAR, cujos sensores apresentam caractersticas com-
plexas, como polarizacao multipla e capacidades interferometricas, alem de gerar
grandes quantidades de dados (TAYLOR et al., 1999). Converter estes dados cada vez
mais amplamente disponveis em informacao efetiva para as instituicoes responsaveis
por tomadas de decisao tem sido uma grande dificuldade na area de processamento
de imagens, justificando a necessidade de serem desenvolvidos sistemas especficos
para a aplicacao que apresentem eficiencia computacional.
Com o aumento da velocidade e confiabilidade das redes de computadores observado
na ultima decada, torna-se cada vez mais comum a interligacao de computadores pes-
soais e workstations de maneira eficiente para composicao de sistemas distribudos.
Clusters denominam maquinas paralelas com arquitetura de memoria distribuda
representados na forma de um conjunto de computadores interconectados trabal-
hando juntos, dando ao usuario a impressao de um sistema unico, apesar da dis-
tribuicao de seus componentes de dados e hardware (BUYYA, 1999). Estes sistemas
tem sido utilizados para a execucao de programas paralelos, em substituicao as ar-
quiteturas paralelas, em virtude de seu menor custo e maior flexibilidade (SANTANA
et al., 1997).
As primeiras ideias relacionadas ao uso de clusters foram desenvolvidas pela IBM na
decada de 60, conectando grandes mainframes com o objetivo de proporcionar uma
forma de paralelismo comercial de baixo custo (BUYYA, 1999). O modelo de clusters
7O primeiro computador eletronico foi projetado em meados de 1940, e recebeu o nome deENIAC (Electronic Numerical Integrator and Computer).
63
-
denominado Beowulf, desenvolvido pela NASA em 1994, tornou-se um projeto bem
sucedido e bastante usado atualmente. Esta arquitetura, adotada para a extracao
de atributos de textura das imagens no presente trabalho, sera descrita a seguir.
2.4.1 A Arquitetura Beowulf
O projeto Beowulf 8 surgiu em 1994, desenvolvido por Sterling et al. (1995) com o ob-
jetivo de proporcionar a NASA um sistema que apresentasse desempenho comparavel
ao das maquinas paralelas, porem a um custo cerca de dez vezes menor. O primeiro
sistema Beowulf continha 16 processadores Intel 66 MHz 486 executando o sistema
operacional Linux, conectados via rede Ethernet. A necessidade de um software para
estabelecer a rede de interconexao entre os processadores levou ao desenvolvimento
de muitos dos drivers Ethernet para Linux ate hoje usados por milhares de computa-
dores ao redor do mundo para conectarem-se a Internet (BUYYA, 1999). O projeto
obteve aprovacao imediata ao apresentar uma escolha alternativa para proporcionar
computacao de alto desempenho (HPC - High Performance Computing).
Com o sucesso do Beowulf original, muitos outros sistemas foram construdos pelo
CEDIS/NASA (Center of Excellence in Space Data and Information Sciences), uti-
lizando varias geracoes e famlias de processadores e conexoes de rede (HSIEH, 2000).
Uma importante caracterstica que distingue os sistemas Beowulf de outros clusters
e o fato de nao ser imposto ao usuario um modelo de arquitetura fixo. Uma vez
que os parametros relacionados a custo e desempenho de equipamentos de hardware
mudam constantemente, as geracoes de sistemas Beowulf evoluem continuamente
desde sua composicao original, criada em 1994. Embora, em um nvel mais geral, a
arquitetura tenha permanecido a mesma,