Aplicação de Mapa de Kohonen para classificação de...

INPE-15239-TDI/1326

APLICACAO DE MAPA DE KOHONEN PARA

CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM

AMBIENTE PARALELO

Thalita Biazzuz Veronese

Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro

de 2007.

O original deste documento esta disponvel em:

INPE

Sao Jose dos Campos

2008

http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07

PUBLICADO POR:

Instituto Nacional de Pesquisas Espaciais - INPE

Gabinete do Diretor (GB)

Servico de Informacao e Documentacao (SID)

Caixa Postal 515 - CEP 12.245-970

Sao Jose dos Campos - SP - Brasil

Tel.:(012) 3945-6911/6923

Fax: (012) 3945-6919

E-mail: [email protected]

CONSELHO DE EDITORACAO:

Presidente:

Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra (OBT)

Membros:

Dra Maria do Carmo de Andrade Nono - Conselho de Pos-Graduacao

Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE)

Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e Atmosfericas (CEA)

Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos Climaticos (CPT)

Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia Espacial (ETE)

BIBLIOTECA DIGITAL:

Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da Terra (OBT)


Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao (SID)

Simone A. Del-Ducca Barbedo - Servico de Informacao e Documentacao (SID)

REVISAO E NORMALIZACAO DOCUMENTARIA:


Marilucia Santos Melo Cid - Servico de Informacao e Documentacao (SID)

Yolanda Ribeiro da Silva e Souza - Servico de Informacao e Documentacao (SID)

EDITORACAO ELETRONICA:

Viveca SantAna Lemos - Servico de Informacao e Documentacao (SID)

[email protected]

INPE-15239-TDI/1326

APLICACAO DE MAPA DE KOHONEN PARA

CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM

AMBIENTE PARALELO

Thalita Biazzuz Veronese

Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro

de 2007.

O original deste documento esta disponvel em:

INPE

Sao Jose dos Campos

2008

http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07

Dados Internacionais de Catalogacao na Publicacao (CIP)

V599a Veronese, Thalita Biazzuz.Aplicacao de Mapa de Kohonen para classificacao de

texturas em imagens SAR em ambiente paralelo/ ThalitaBiazzuz Veronese. Sao Jose dos Campos: INPE, 2008.

110p. ; (INPE-15239-TDI/1326)

1. Imagens SAR. 2. Atributos de textura. 3. Filtros Ga-bor. 4. Classificacao de imagens. 5. Processamento paralelo.I. Ttulo.

CDU 621.376.5

Copyright c 2008 do MCT/INPE. Nenhuma parte desta publicacao pode ser reprodu-zida, armazenada em um sistema de recuperacao, ou transmitida sob qualquer forma ou

por qualquer meio, eletronico, mecanico, fotografico, microflmico, reprografico ou outros,

sem a permissao escrita da Editora, com excecao de qualquer material fornecido especifi-

camente no proposito de ser entrado e executado num sistema computacional, para o uso

exclusivo do leitor da obra.

Copyright c 2008 by MCT/INPE. No part of this publication may be reproduced, storedin a retrieval system, or transmitted in any form or by any means, eletronic, mechanical,

photocopying, microfilming, recording or otherwise, without written permission from the

Publisher, with the exception of any material supplied specifically for the purpose of being

entered and executed on a computer system, for exclusive use of the reader of the work.

Voce deve ser a propria mudanca que deseja ver no mundo.

Mohandas Karamchand Gandhi

querida Leninha, dedico.

AGRADECIMENTOS

Agradeco ao meu orientador Lamartine Nogueira Frutuoso Guimaraes, pela oportu-

nidade de desenvolver este trabalho, e pela orientacao e suporte em todas as fases

desta pesquisa de mestrado.

Ao Maj. Maurcio Pozzobon Martins, do Instituto de Estudos Avancados, agradeco

pelo apoio irrestrito, empenhando-se incansavelmente em possibilitar que este tra-

balho alcancasse os objetivos concretos a que se propunha, e pela amizade e profis-

sionalismo exemplares dedicados desde o incio desta pesquisa.

Ao Instituto Nacional de Pesquisas Espaciais, aos profissionais do LAC, CAP e SPG,

pelo ingresso e manutencao neste programa de Mestrado. Agradeco, em especial, aos

professores Demsio, Fernando e Stephan, pela participacao e sugestoes na Defesa

de Proposta de Mestrado.

Ao Instituto de Estudos Avancados, em especial a Divisao de Geointeligencia e a

Divisao de Energia Nuclear, por me receber e permitir usufruir de seus recursos

computacionais e instalacoes, e aos administradores do cluster BELIEVe Onofre

Felix de Lima Neto e Roberto Yuji Tanaka, pelo suporte prestado. Aos funcionarios

que me receberam tao bem nesta insitituicao, expresso minha profunda gratidao.

A Embrapa Monitoramento por Satelite, em especial aos pesquisadores Gustavo

Souza Valladares e Evaristo Eduardo de Miranda, agradeco pela confianca de-

positada neste trabalho, fornecendo os dados indispensaveis para esta pesquisa de

mestrado, e pela hospitalidade ao me receber em sua sede em Campinas.

A CAPES e ao CNPq, pelo suporte financeiro.

A meus pais Carlos Eduardo e Irene, as melhores pessoas que ja conheci, que com seu

amor incondicional proporcionam estrutura, incentivo e apoio em todos os momentos

da minha vida.

Ao meu marido Reinaldo, companheiro de todos os momentos, agradeco simples-

mente por tudo. Por ser essa pessoa tao especial, pelo imensuravel apoio, pelo pre-

sente que e te-lo ao meu lado.

A toda minha famlia, pela confianca, carinho e compreensao, mesmo nos momentos

mais difceis.

A todos os meus amigos, que formam minha segunda famlia, agradeco por me

permitirem participar de suas vidas.

A todos os professores que contriburam para a minha formacao, que muitas vezes

foram mais do que simples profissionais e dedicaram tambem sua valiosa amizade.

Por fim, a todos aqueles que colaboraram de alguma forma para que eu chegasse ate

aqui, agradeco e espero algum dia poder retribuir a altura.

RESUMO

Ao longo das ultimas decadas, diversas tecnicas tem sido desenvolvidas para clas-sificacao de imagens de sensoriamento remoto. No caso de imagens geradas porsensores que atuam na faixa de microondas (radar), novas pesquisas sao necessarias,ja que muitas vezes tecnicas consagradas para a classificacao de imagens opticas naoproduzem resultados satisfatorios quando aplicadas a imagens radar. Isso acontecedevido as caractersticas peculiares deste tipo de imagem - presenca de forte rudo,por exemplo. Na regiao amazonica, as condicoes climaticas frequentemente favore-cem a cobertura de nuvens, o que se apresenta como fator restritivo a utilizacao desensores opticos, incapazes de transpor este obstaculo naturalmente. Entretanto, ossensores SAR praticamente nao sao afetados pela cobertura de nuvens, e portantotem se tornado os principais responsaveis pela obtencao de dados, contribuindo parasuprir a falta de informacao disponvel sobre esta regiao. Neste trabalho, avalia-se aeficiencia de um classificador neural baseado no mapa auto-organizavel de Kohonenpara classificacao de imagens SAR do SIVAM (Sistema de Vigilancia da Amazonia),utilizando medidas de textura obtidas por filtros Gabor. Na fase de extracao deatributos, um processo de elevado custo computacional, foram implementadas tec-nicas de processamento paralelo em rede de computadores de baixo custo, a fim deavaliar o real ganho em desempenho. As imagens utilizadas foram obtidas pelo sen-sor SAR-SIVAM sobre Machadinho dOeste - RO, adquiridas em 13 de Setembro de2004 pelo sensor SAR da aeronave de sensoriamento remoto do SIVAM, gentilmentecedidas pela Divisao de Sensoriamento Remoto do Instituto de Estudos Avancados(IEAv/CTA). Como referencia para a identificacao visual de classes de texturas,serao utilizadas imagens opticas SPOT e dados de campo cedidos pela EMBRAPA.

A KOHONENS MAP FOR SAR IMAGES TEXTURECLASSIFICATION IN PARALLEL ENVIRONMENT

ABSTRACT

In the last decades, several techniques have been developed for classification of re-mote sensing images. In the case of images obtained from sensors that act in themicrowave regions (radar), new researches are necessary, since often successfull tech-niques for optical images classification do not produce satisfactory results when ap-plied to radar images. This happens due to the peculiar characteristics of this typeof image - e.g., the presence of strong noise. In the Amazon region, the climaticconditions frequently benefit clouds covering, what presents itself as a restrictivefactor to the use of optical sensors, unable to naturally cross this obstacles. How-ever, SAR sensors are pratically not affected by the clouds covering, and thus havebecome the main responsible for collection of data, contributing to supply the lackof information about this region. In this work, we evaluate the efficiency of a neuralclassifier based on the Kohonens Self-Organizing Map for classifying SAR-SIVAMimages obtained from Machadinho dOeste - RO, using Gabor texture features. Inthe feature extraction phase, a high computational cost proccess, techniques of par-allel processing were implemented in low cost computer network, in order to analyzethe real performance improvement. The images for testing were obtained in 2004September 13, by the SAR sensor of SIVAMs remote sensing aircraft, kindly givenby Remote Sensing Division of Advanced Studies Institute (IEAv/CTA). As refer-ence for the visual identification of texture classes, SPOT optical images and fieldinformation, given by EMBRAPA, are used.

SUMARIO

Pag.

LISTA DE FIGURAS

LISTA DE TABELAS

LISTA DE SIGLAS E ABREVIATURAS

CAPITULO 1 - INTRODUCAO 25

CAPITULO 2 - FUNDAMENTOS TEORICOS 29

2.1 - Imagens Obtidas por Radar de Abertura Sintetica (SAR) . . . . . . . . . 29

2.1.1 - Geometria de Aquisicao de Imagens SAR . . . . . . . . . . . . . . . . 31

2.1.2 - Equacao do Radar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.1.3 - Polarizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

2.1.4 - Reducao de Speckle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.2 - Atributos de Textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.2.1 - Metodos para Extracao de Atributos de Textura . . . . . . . . . . . . . 42

2.2.2 - A Transformada Discreta de Fourier . . . . . . . . . . . . . . . . . . . 44

2.2.3 - Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.2.4 - Filtros Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2.2.5 - Representacao da Textura por Vetores de Atributos . . . . . . . . . . . 50

2.3 - Classificadores Baseados em Redes Neurais Artificiais . . . . . . . . . . . 51

2.3.1 - Fundamentos de Redes Neurais Artificiais . . . . . . . . . . . . . . . . 53

2.3.2 - Mapa Auto-Organizavel de Kohonen (SOM) . . . . . . . . . . . . . . . 58

2.3.3 - Aprendizagem por Quantizacao Vetorial (LVQ) . . . . . . . . . . . . . 60

2.4 - Processamento Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.4.1 - A Arquitetura Beowulf . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.4.2 - Conceitos Basicos de Paralelismo . . . . . . . . . . . . . . . . . . . . . 67

2.4.3 - Analise de Eficiencia e Speedup . . . . . . . . . . . . . . . . . . . . . . 69

CAPITULO 3 - MATERIAIS E METODOS 71

3.1 - Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.2 - O Sensor SAR/R-99B . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3.3 - O Projeto Believe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.4 - Matriz de Confusao e Indice Kappa . . . . . . . . . . . . . . . . . . . . . 75

3.5 - Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.5.1 - Definicao da Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . 78

3.5.2 - Definicao das Classes de Estudo . . . . . . . . . . . . . . . . . . . . . . 78

3.5.3 - Extracao das Amostras de Treinamento e Teste . . . . . . . . . . . . . 79

3.5.4 - Extracao de Atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

3.5.5 - Distribuicao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

3.5.6 - Treinamento da Rede SOM+LVQ . . . . . . . . . . . . . . . . . . . . . 82

3.5.7 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 83

CAPITULO 4 - ANALISE DE RESULTADOS 87

4.1 - Treinamento da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

4.1.1 - Combinacao de Bandas . . . . . . . . . . . . . . . . . . . . . . . . . . 87

4.1.2 - Tamanho dos Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4.1.3 - Configuracao da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

4.2 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . 92

4.3 - Analise de desempenho e eficiencia . . . . . . . . . . . . . . . . . . . . . 94

CAPITULO 5 - CONCLUSOES 99

REFERENCIAS BIBLIOGRAFICAS 101

APENDICE A - DISTRIBUICAO DO PROCESSAMENTO 107

LISTA DE FIGURAS

Pag.

2.1 Espectro de frequencias, destacando a faixa de microondas e as bandas

de radar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.2 Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos de-

pendem de uma fonte de energia geralmente o sol que ilumine o alvo

para captar a energia refletida. . . . . . . . . . . . . . . . . . . . . . . . 30

2.3 A ambiguidade no imageamento por radar com visada vertical. . . . . . . 32

2.4 Alguns parametros basicos de um sistema SLAR. . . . . . . . . . . . . . 33

2.5 A relacao entre o angulo de depressao e o efeito sombreamento sobre a

imagem SAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.6 Os efeitos de inversao e encurtamento sobre a imagem SAR. . . . . . . . 37

2.7 Microondas polarizadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

2.8 Imagem SAR distorcida por rudo speckle. . . . . . . . . . . . . . . . . . 39

2.9 Processamento multilook. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.10 Exemplos de textura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.11 Exemplo de imagens de diferentes frequencias. . . . . . . . . . . . . . . . 45

2.12 Diagrama em blocos do processo de filtragem no domnio da frequencia. . 45

2.13 Exemplo de transformacao FT e STFT. . . . . . . . . . . . . . . . . . . 46

2.14 Sinal decomposto em wavelets de diferentes escalas e posicoes. . . . . . . 47

2.15 Efeito da alteracao de escala em uma wavelet. . . . . . . . . . . . . . . . 48

2.16 Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de re-

dundancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.17 O conceito do classificador como uma conexao entre uma imagem (a

esquerda) e um conjunto de rotulos de classe (a direita). . . . . . . . . . 52

2.18 O neuronio e seus principais componentes . . . . . . . . . . . . . . . . . 54

2.19 A sinapse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

2.20 O neuronio artificial de McCulloch e Pitts. . . . . . . . . . . . . . . . . . 55

2.21 Exemplos de arquiteturas (ou topologias) de redes neurais artificiais. . . 56

2.22 Funcoes de ativacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.23 Funcao de vizinhanca gaussiana. . . . . . . . . . . . . . . . . . . . . . . . 59

2.24 Diagrama em blocos da classificacao SOM+LVQ. . . . . . . . . . . . . . 60

2.25 Diagrama de Voronoi envolvendo quatro celulas. . . . . . . . . . . . . . . 61

2.26 Visao logica de um cluster da classe Beowulf. . . . . . . . . . . . . . . . 65

2.27 Cluster do projeto BELIEVe (IEAv/CTA). . . . . . . . . . . . . . . . . . 66

2.28 Modelos computacionais SISD, SIMD e MISD. UC=Unidade de Con-

trole; UP=Unidade de Processamento; M=Memoria; FI=Fluxo de In-

strucoes; FD=Fluxo de Dados. . . . . . . . . . . . . . . . . . . . . . . . 68

2.29 Modelos computacionais MIMD de memoria compartilhada (a) e dis-

tribuda (b). UC=Unidade de Controle; UP=Unidade de Processa-

mento; M=Memoria; FI=Fluxo de Instrucoes; FD=Fluxo de Dados. . . 69

3.1 Localizacao do municpio de Machadinho dOeste. . . . . . . . . . . . . . 71

3.2 Aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.3 Metodologia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.4 Imagem SAR (banda L VH polarizada) obtida sobre a area de estudo,

destacando os recortes selecionados para analise. . . . . . . . . . . . . . . 78

3.5 Interface do modulo de geracao de Filtros Gabor. . . . . . . . . . . . . . 80

3.6 Interface de selecao de amostras e extracao de atributos. . . . . . . . . . 81

3.7 Interface do modulo de treinamento da rede. . . . . . . . . . . . . . . . . 83

3.8 Interface do modulo de classificacao das imagens. . . . . . . . . . . . . . 84

4.1 Valores de Kappa obtidos para diferentes tamanhos de filtros. . . . . . . 90

4.2 Graficos com ndices Kappa observados para diferentes configuracoes da

rede SOM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.3 Evolucao do treinamento em termos dos valores de Kappa. . . . . . . . . 92

4.4 Recorte selecionado para analise e imagem resultante da classificacao. . . 94

4.5 Medidas de speedup observadas. . . . . . . . . . . . . . . . . . . . . . . . 96

4.6 Medidas de eficiencia observadas. . . . . . . . . . . . . . . . . . . . . . . 97

LISTA DE TABELAS

Pag.

3.1 Caractersticas da aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . 73

3.2 Exemplo de matriz de confusao. . . . . . . . . . . . . . . . . . . . . . . . 76

3.3 Numero de pixels de treinamento e teste para cada classe. . . . . . . . . 79

3.4 Numero de pixels de treinamento para cada classe. . . . . . . . . . . . . 84

4.1 Valores de kappa para cada banda. . . . . . . . . . . . . . . . . . . . . . 87

4.2 Valores de Kappa para combinacoes entre bandas. . . . . . . . . . . . . . 88

4.3 Valores de Kappa para X(HH) + L(VH) filtradas. . . . . . . . . . . . . . 89

4.4 Matriz de confusao resultante da classificacao. . . . . . . . . . . . . . . . 93

4.5 Medidas de speedup e eficiencia obtidas para o conjunto de 17.500 pixels. 94



LISTA DE SIGLAS E ABREVIATURAS

SAR Synthetic Aperture RadarSR Sensoriamento RemotoINSAR Interferometria SARSIVAM Sistema de Vigilancia da AmazoniaSLAR Side Looking Airbone RadarDFT Discrete Fourier TransformFFT Fast Fourier TransformSTFT Short-Time Fourier TransformCWT Continuous Wavelet TransformSOM Self-Organizing MapLVQ Learning Vector QuantizationPVM Parallel Virtual MachineMPI Message-Passing InterfaceSISD Single-Instruction Single-DataMISD Multiple-Instruction Single-DataSIMD Single-Instruction Multiple-DataMIMD Multiple-Instruction Multiple-Data

CAPITULO 1

INTRODUCAO

A classificacao de imagens de sensoriamento remoto consiste em associar um rotulo

de classe a cada pixel, com base em medidas extradas da imagem - geralmente do

proprio pixel ou de seus vizinhos. Uma imagem de sensoriamento remoto totalmente

classificada e chamada de mapa tematico, pois possibilita a identificacao geografica

das classes sobre a superfcie imageada (CROSTA, 1992). Ha diversas aplicacoes para

a classificacao de imagens de sensoriamento remoto, como, por exemplo, analise de

culturas agrcolas, monitoramento e controle ambiental, planejamento urbano, etc.

Para classificacao de imagens geradas a partir de sensores opticos, diversas tecnicas

tem sido desenvolvidas, aperfeicoadas e utilizadas ao longo das ultimas decadas.

Entretanto, no caso das imagens obtidas a partir de sensores que atuam na faixa de

microondas (radar), novas pesquisas sao necessarias, ja que muitas vezes tecnicas de

classificacao consagradas para dados opticos nao produzem resultados satisfatorios

quando aplicadas a imagens radar, devido as caractersticas peculiares desse tipo de

imagem presenca de forte rudo, por exemplo.

Presente em todo tipo de imagem (HARALICK, 1979), a textura e um atributo es-

pacial que reflete a impressao de aspereza ou suavidade criada pela variacao de

tonalidade ou repeticao de padroes atraves de uma superfcie (TSO; MATHER, 2001).

No contexto do sensoriamento remoto, atributos de textura mostram-se eficazes ao

atuar como informacoes auxiliares na caracterizacao de classes, melhorando muitas

vezes o resultado da classificacao. Em imagens de radar, a incorporacao da textura ao

processo de classificacao e utilizada principalmente quando aplicada a discrimacao

de diferentes tipos de florestas e variedades de culturas agrcolas que nao se dis-

tinguem por apresentarem a mesma tonalidade (ou nvel de cinza medio), mas que

podem ser discriminadas pela diferenca de textura (SILVA JUNIOR, 2001). Pesquisas

em psicologia mostram que o cerebro humano realiza uma analise em frequencia das

imagens, e celulas simples no cortex visual podem ser modeladas mediante as funcoes

Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta propriedade, associada

ao fato de as wavelets Gabor serem melhor localizadas no tempo e na frequencia e

apresentarem maior numero de parametros, torna as funcoes Gabor especialmente

apropriadas para a representacao de caractersticas locais das imagens (CASTANON,

2003).

25

Em Manjunath e Ma (1996), e proposta uma metodologia na qual os padroes de

textura sao caracterizados utilizando a transformada wavelet de Gabor e medidas

estatsticas. Esta metodologia foi utilizada por Martins (2003) para a implemen-

tacao de um classificador neural de atributos de textura, baseado em dois tipos

de redes neurais artificiais integradas: mapa auto-organizavel de Kohonen (SOM) e

aprendizagem por quantizacao vetorial (LVQ). A capacidade de reconhecer padroes,

mesmo ao lidar com informacoes ruidosas ou incompletas (HAYKIN, 2001), contribui

para que as redes neurais artificiais atuem como ferramentas nos mais diversos tipos

de problemas (FAUSETT, 1994). As redes neurais artificiais tem sido cada vez mais

usadas no contexto de sensoriamento remoto nos ultimos 10 anos, principalmente

para classificacao de imagens (TSO; MATHER, 2001).

Inaugurado em 25 de julho de 2002, o SIVAM (Sistema de Vigilancia da Amazo-

nia) (http://www.sivam.gov.br) tem o proposito de zelar pela Amazonia Legal

Brasileira. Esta area, considerada a maior reserva natural do planeta, esta sujeita a

acoes predatorias realizadas por madeireiras e garimpeiros ilegais, narcotraficantes e

diversos tipos de ilcito. Na regiao amazonica, as condicoes climaticas frequentemente

sao caracterizadas por coberturas de nuvens, o que se apresenta como fator restritivo

a utilizacao de sensores opticos. Assim, os sensores SAR (Synthetic Aperture Radar)

tem se tornado os principais responsaveis pela obtencao de dados, contribuindo para

suprir a falta de informacao disponvel sobre esta regiao. O SIVAM dispoe de tres

aeronaves R-99B equipadas com sensores SAR para gerar imagens radar da regiao.

Infelizmente, a facilidade em se produzir um grande volume de dados nao e acompan-

hada pela velocidade de analise dos mesmos e a consequente geracao de resultados

aplicaveis ao proposito do SIVAM. Portanto, metodologias em Processamento de

Alto Desempenho devem ser consideradas a fim de otimizar a manipulacao dessa

grande quantidade de dados.

Localizado a aproximadamente 400 km de Porto Velho, dentro da Amazonia Legal

Brasileira1, o municpio de Machadinho dOeste - RO foi escolhido por pesquisadores

da Embrapa e da organizacao nao-governamental ECOFORCA como objeto de um

estudo de longo prazo, com o objetivo de obter informacoes que proporcionem su-

porte aos projetos de sustentabilidade agrcola na Amazonia. Como resultado de uma

cooperacao tecnica entre a Embrapa Monitoramento por Satelite e o Instituto de

Estudos Avancados (IEAv) do Centro Tecnico Aeroespacial (CTA), foram adquiri-

1A Amazonia Legal Brasileira compreende a regiao Norte do Brasil, o estado do Mato Grossoe parte do estado do Maranhao.

26

http://www.sivam.gov.br

das imagens do municpio pelo sensor SAR da aeronave de sensoriamento remoto

R99-B do SIVAM, para contribuir na caracterizacao e monitoramento do uso do solo

e cobertura de terra da regiao.

Este trabalho tem como objetivo principal avaliar a eficiencia do classificador de-

senvolvido por Martins (2003) na classificacao da cobertura de terra e uso do solo

da regiao de Machadinho dOeste - RO, atraves de imagens obtidas por radar de

abertura sintetica. Dados de uso do solo e cobertura de terra verificados em campo

foram utilizados como amostras de treinamento para o classificador neural. Devido

ao alto tempo de execucao gasto para realizar a extracao de atributos de textura das

imagens, e necessario integrar tecnicas de processamento de alto desempenho a esta

etapa. Assim, atraves do paralelismo de dados, as amostras e imagens a serem anal-

isadas sao divididas entre varios processadores, que calculam os vetores de atributos

independentemente. Este trabalho esta sendo desenvolvido em um cluster baseado

no conceito de maquinas Beowulf. O ambiente utilizado faz parte do projeto BE-

LIEVe, desenvolvido no Laboratorio de Engenharia Virtual do Instituto de Estudos

Avancados (IEAv).

Este trabalho esta organizado da seguinte maneira. No Captulo 2 sao apresentadas

as fundamentacoes teoricas que servem como base para o desenvolvimento deste

trabalho. Sao descritos inicialmente os principais conceitos relacionados as imagens

obtidas por Radar de Abertura Sintetica; a seguir, discutem-se os temas basicos rel-

ativos a representacao de texturas, introduzindo a metodologia de extracao de atrib-

utos de textura por wavelets de Gabor (MANJUNATH; MA, 1996). Para uma melhor

compreensao desta metodologia, e apresentado um breve resumo sobre a transfor-

mada de Fourier e a teoria de wavelets. E apresentada tambem, resumidamente, a

teoria de redes neurais artificiais e sua aplicacao no contexto do reconhecimento de

padroes em sensoriamento remoto, abordando aspectos especficos relativos as re-

des utilizadas para implementacao do classificador analisado neste trabalho, SOM e

LVQ. Finalmente, sao discutidos os conceitos de processamento paralelo, para uma

melhor compreensao das ferramentas de computacao de alto desempenho utilizadas

no desenvolvimento desta pesquisa de mestrado.

O Captulo 3 descreve a area de estudo, os materiais utilizados e a metodologia

empregada.

No Captulo 4 sao apresentados e discutidos os resultados obtidos na classificacao

27

das imagens utilizando atributos de textura. Tambem sao apresentados os resultados

obtidos com a analise de desempenho da implementacao distribuda da extracao de

atributos de textura.

No Captulo 5 sao apresentadas as conclusoes e sugestoes de pesquisas futuras.

28

CAPITULO 2

FUNDAMENTOS TEORICOS

2.1 Imagens Obtidas por Radar de Abertura Sintetica (SAR)

A palavra radar, derivada da expressao RAdio Detection And Ranging, e usada para

denominar sensores que atuam na faixa de microondas do espectro eletromagnetico.

A faixa de microondas compreende as bandas cuja frequencia varia de 0.3 a 300

GHz, definindo assim comprimentos de onda entre 1 mm e 1 m (ULABY et al., 1982),

como mostra a Figura 2.1.

(a) Espectro de frequencias.

(b) Faixa de microondas e bandas de radar.

FIGURA 2.1 - Espectro de frequencias, destacando a faixa de microondas e as bandas de radar.

Os radares sao instrumentos que transmitem pulsos de microondas a um determinado

objeto (alvo) e recebem dele um sinal refletido (eco). Com base no tempo decorrido

entre a transmissao do sinal e seu retorno a antena, alem de outras propriedades do

eco, e possvel inferir uma serie de informacoes acerca do alvo, como por exemplo

sua distancia em relacao ao sensor. Os radares se distinguem dos sensores opticos

por diversas razoes, dentre as quais destacam-se:

29

a) O sinal refletido permite obter informacoes adicionais aquelas obtidas por

sistemas opticos e termicos, como aspereza e condutividade eletrica do alvo.

b) As microondas possuem alto poder de penetracao em nuvens e chuvas,

o que torna os radares ferramentes importantes para o imageamento de

regioes onde as condicoes meteorologicas se apresentam como fator restri-

tivo a utilizacao de sensores opticos.

c) Os radares imageadores sao sitemas ativos1, isto e, independentes da ilumi-

nacao solar, podendo ser empregados no perodo diurno ou noturno, sem

perda de desempenho (ULABY et al., 1982). A Figura 2.2 mostra a diferenca

entre sensores ativos e passivos.

(a) Radares (sensoresativos).

(b) Radiometros (sensorespassivos).

FIGURA 2.2 - Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos dependem de umafonte de energia geralmente o sol que ilumine o alvo para captar a energia refletida.FONTE: Sensing (2002).

Por essas razoes, e crescente o numero de sistemas SAR (Synthetic Aperture Radar)

em orbita atualmente, e e provavel que o imageamento por radar exerca um papel

cada vez mais importante no conhecimento e monitoramento do meio ambiente (TSO;

MATHER, 2001).

Entretanto, uma vez que a informacao gerada pelo radar e diferente daquela obtida

por sensores opticos, e necessario tambem utilizar tecnicas adequadas para tratar este

tipo de dado. Assim, a pesquisa e o desenvolvimento de novos metodos e ferramen-

tas especficas tem se tornado essenciais para possibilitar a analise dessa informacao.

1Sensores de microondas passivos (radiometros) detectam a radiacao de microondas gerada peloalvo.

30

Diversos trabalhos tem sido realizados nesta direcao, especialmente voltados para

tratar imagens SAR de regioes tropicais, como a Amazonia. Oliver (2000) propoe a

aplicacao de metodos de segmentacao a atributos de textura para classificar areas

da Amazonia entre as categorias floresta e nao-floresta, utilizando imagens do Par-

que Nacional de Tapajos. Komarov et al. (1999) associa tecnicas de redes neurais

artificiais a atributos de textura estatsticos para classificar regioes de floresta us-

ando imagens SAR. Em Dutra et al. (2003), investiga-se a utilizacao da metodologia

InSAR (Interferometria SAR) associada ao uso de conjuntos de imagens SAR obtidas

de uma mesma regiao, num pequeno intervalo de tempo, como auxlio a obtencao de

modelos de elevacao dos terrenos imageados. A eficacia de metodos supervisionados

multidimensionais na classificacao de imagens SAR do SIVAM pre-processadas por

filtros para reducao de speckle2 e avaliada por Maximo e Fernandes (2005).

2.1.1 Geometria de Aquisicao de Imagens SAR

O radar de abertura sintetica foi projetado por Carl Wiley em 1952 com a finalidade

de melhorar a resolucao de radares aerotransportados (ULABY et al., 1982). Para isso,

o tamanho da antena e sinteticamente aumentado, isto e, atraves de uma complexa

tecnologia, modifica-se o processamento do sinal de forma a simular uma antena

fisicamente longa. Assim, alem da reducao do tamanho real da antena, obtem-se

como resultado uma melhor resolucao da imagem, independente da distancia entre

o radar e o alvo, tornando viavel seu uso tanto em aeronaves quanto em espaconaves.

O processo de aquisicao das imagens baseia-se na geometria de visada lateral, carac-

terstica dos sensores SLAR (Side Looking Airbone Radar). Esta tecnica foi desen-

volvida para solucionar o problema da ambiguidade presente nos radares de visada

vertical. Este problema ocorre quando ecos provenientes de diferentes alvos tem suas

posicoes confundidas em funcao da recepcao simultanea dos mesmos pelo sistema

sensor, como mostra a Figura 2.3.

O sistema SLAR transmite e recebe energia na forma de microondas usando uma

antena fixada na lateral da aeronave. A area imageada e, entao, uma faixa do solo

paralela a trajetoria do voo (denominada direcao azimutal). A resolucao das imagens,

que corresponde a area iluminada pelo pulso do radar num dado instante de tempo,

depende principalmente da duracao do pulso e do raio da antena. A duracao do

pulso afeta a resolucao transversal, enquanto a largura do raio da antena controla a

2Speckle e um tipo de rudo caracterstico de imagens SAR, que sera descrito na Subsecao 2.1.4.

31

FIGURA 2.3 - A ambiguidade no imageamento por radar com visada vertical.FONTE: Adaptado de Ulaby et al. (1982)

resolucao azimutal, como pode ser observado nas Equacoes 2.1 e 2.2 (TSO; MATHER,

2001).

t =c

2sin ; (2.1)

a = R . (2.2)

Onde t e a indicam, respectivamente, as resolucoes transversal3 e azimutal; c cor-

responde a velocidade da luz; e a duracao do pulso; indica a largura horizontal

do feixe; e R corresponde a distancia do sensor a linha de visada. O angulo de in-

cidencia ou angulo de visada e definido como o angulo entre a direcao da energia

emitida e uma linha perpendicular a superfcie imageada (Figura 2.4).

O angulo de depressao () e complementar ao angulo de incidencia (), se assumir-

mos que a superfcie imageada seja plana. A largura horizontal do feixe () esta

relacionada ao tamanho da antena (l) e ao comprimento de onda (), como pode-

mos ver na Equacao 2.3.

=

l. (2.3)

3A resolucao transversal nada mais e do que a projecao da resolucao na linha de visada no solorLV = c2 (ULABY et al., 1982).

32

FIGURA 2.4 - Alguns parametros basicos de um sistema SLAR.FONTE: Adaptado de Ulaby et al. (1982)

Pode-se inferir da Equacao 2.1 que quanto mais curta for a duracao do pulso, mel-

hor sera a resolucao transversal. Essa dependencia, porem, carrega uma limitacao:

quanto mais curto o pulso, maior a potencia de pico exigida pelo sistema para que

se mantenha a mesma potencia media.

A distancia da linha de visada (R) e dada por:

R =h

cos , (2.4)

onde h e a altura de voo. Substituindo R na Equacao 2.2, tem-se:

a =h

cos . (2.5)

Assim, gracas aos parametros sin e cos , as resolucoes em azimute e transversal sao

funcao do angulo de incidencia () e, consequentemente, da linha de visada. Logo,

t e degradada nas distancias menores, enquanto a e degradada nas distancias

33

maiores. Isso faz com que a forma do pixel seja alongada na direcao transversal

para pequenas distancias e na direcao longitudinal para longas distancias (DAMIAO;

MAXIMO, 1998).

Para os sistemas SAR, as resolucoes transversal e em azimute sao calculadas de forma

distinta da apresentada anteriormente. Os sistemas de abertura sintetica utilizam,

em geral, pulsos de frequencia modulada (chirpped pulses), a fim de obter uma

melhor resolucao transversal sem, entretanto, ter que recorrer a pulsos muito curtos.

Assim, para imagens SAR, a resolucao transversal e calculada de acordo com a

Equacao 2.6:

t =c

2Bsin , (2.6)

onde B e a largura de banda do pulso modulado linearmente em frequencia e que

pode ser tao larga quanto necessaria, sem que para isso seja requerida uma grande

potencia de pico. A resolucao em azimute, por sua vez, independe teoricamente da

distancia entre a antena e o alvo, devido a construcao da antena sintetica. A melhor

resolucao em azimute sintetica potencial (ap) e apresentada na Equacao 2.7.

ap =L

2. (2.7)

As deducoes matematicas para a equacao acima podem ser encontradas em Ulaby

et al. (1982). Elas nao serao apresentadas aqui, pois seu nvel de complexidade foge

ao escopo deste trabalho.

2.1.2 Equacao do Radar

Equacao do radar e o nome dado a relacao entre as caractersticas do radar, do alvo

e do sinal recebido pelo sensor (ULABY et al., 1982). Ha diversas formas de apresentar

esta equacao, em funcao do tipo de radar utilizado ou do parametro tomado como

referencia. Se assumirmos que a antena de transmissao e a mesma de recepcao, o

radar e dito monostatico e a equacao do radar pode ser escrita nas seguintes formas:

Pr =PtA

2e

42R4, (2.8)

34

definindo Pr em termos de area da antena, ou:

Pr =PtG

22

(4)3R4, (2.9)

definindo Pr em termos de ganho da antena. Onde:

Pr e a potencia irradiada na direcao do radar;

Pt a potencia transmitida pelo radar;

Ae e a area efetiva da antena;

e a secao transversal radar do alvo;

e o comprimento de onda do sinal;

R e a distancia entre o alvo e o radar;

G e o ganho da antena.

O ganho da antena corresponde a medida da potencia que e aumentada na direcao

do alvo se comparada com a potencia que seria irradiada por uma antena isotropica

(omnidirecional). Radares geralmente usam antenas anisotropicas (diretivas), para

canalizar o maximo da potencia transmitida Pt em alguma direcao particular. Dentre

os parametros apresentados acima, apenas esta relacionado as propriedades da

superfcie imageada, determinando portanto o comportamento deste alvo frente a

um sistema de radar. Quando um alvo e iluminado pelo radar, parte da potencia

incidente tende a se espalhar em todas as direcoes, enquanto outra parte retorna

na direcao do radar. Tal fenomeno e definido como retroespalhamento e e uma

funcao complexa de parametros fsicos do alvo. A forma, o tamanho e o material do

alvo sao fatores determinantes para o retroespalhamento da onda eletromagnetica.

Para simplificar o equacionamento, todos esses fatores sao aglutinados em um unico

parametro , definido como a secao transversal do alvo. A descricao detalhada deste

parametro e dos fatores que o influenciam pode ser encontrada em Ulaby et al.

(1982).

2.1.2.1 Efeitos Geometricos sobre a Imagem SAR

Alguns fatores inerentes a geometria de aquisicao descrita acima podem afetar as

propriedades das imagens de modo a interferir na sua interpretacao. As distorcoes

35

geometricas mais comuns presentes nas imagens radar serao brevemente descritas

nesta secao.

Sombreamento (Shadowing)

Uma imagem radar e efetivamente uma representacao dos nveis de energia refletidos

por um alvo relacionados ao tempo decorrido entre a emissao da energia pela antena

e seu retorno a mesma. O efeito sombreamento corresponde a ausencia de informacao

sobre uma determinada area da imagem que fica oculta pela encosta de um objeto,

e e determinado pela altura do objeto e pelo angulo de depressao (TSO; MATHER,

2001). A Figura 2.5 mostra como estes parametros podem distorcer o imageamento.

No objeto A, o angulo b e menor do que o angulo de depressao correspondente 1.

Consequentemente, a encosta do objeto A e iluminada pela energia de microondas.

Entretanto, uma vez que o angulo b do objeto B e maior do que o angulo de

depressao correspondente 2, a antena do radar nao recebera nenhum sinal da regiao

localizada atras do alvo, gerando uma area de refletividade zero ate que o ponto a

seja atingido.

FIGURA 2.5 - A relacao entre o angulo de depressao e o efeito sombreamento sobre a imagem SAR.FONTE: Adaptado de Tso e Mather (2001)

E possvel solucionar este problema atraves do princpio da visada dupla, que consiste

na aquisicao de imagens a partir de duas direcoes diferentes de visada. A obtencao

de imagens sob perspectivas distintas gera um maior volume de dados disponveis,

revelando informacoes (especialmente feicoes lineares) que nao sao aparentes numa

36

imagem de visada simples (DAMIAO; MAXIMO, 1998).

Encurtamento (Foreshortening)

A natureza do terreno causa ainda outros efeitos sobre a interpretacao da imagem

relacionados a variacao da altura do terreno. Numa superfcie perfeitamente plana,

os elementos mais proximos do ponto sub-nadir seriam iluminados pelo feixe radar

e refletiriam o sinal antes daqueles elementos mais afastados. Os sinais, portanto,

seriam refletidos progressivamente no tempo da menor para a maior linha de visada.

Um elemento mais elevado do que os vizinhos, no entanto, devera interceptar o

pulso radar mais cedo, logo sera projetado na imagem numa posicao mais proxima

do ponto sub-nadir do que realmente esta. A Figura 2.6 mostra como este efeito

provoca um encurtamento aparente, no plano da imagem radar, das encostas cuja

parte inclinada esta voltada para o radar, ou seja, a encosta CD aparece encurtada

na imagem como C D (DAMIAO; MAXIMO, 1998).

FIGURA 2.6 - Os efeitos de inversao e encurtamento sobre a imagem SAR.FONTE: Adaptado de Damiao e Maximo (1998)

37

Inversao (Layover)

O efeito de inversao faz com que o topo de um alvo imageado seja visto pelo radar

como a base, e a base seja registrada como o topo do objeto. Este fenomeno ocorre

em casos extremos de encurtamento, quando o sinal leva menos tempo para ir da

antena ao topo do alvo do que a sua base. Como mostra a Figura 2.6, a inversao so

ocorre quando o angulo formado entre o caminho da energia e a encosta frontal do

objeto e maior do que 90 (TSO; MATHER, 2001).

2.1.3 Polarizacao

O retroespalhamento do sinal pode ainda ser influenciado pela polarizacao da onda

incidente, relacionada as propriedades eletromagneticas e geometricas do alvo. A

polarizacao descreve a orientacao do campo eletrico de uma onda eletromagnetica,

que pode ser do tipo linear, circular ou elptica. A maioria dos sistemas de radar

polarizam a energia lineamente, restringindo o campo eletrico a um plano fixo per-

pendicular a direcao de propagacao da onda Figura 2.7. A onda polarizada e entao

transmitida e recebida no plano horizontal (H) ou no plano vertical (V), possibil-

itando quatro combinacoes de transmissao e recepcao: HH, VV, HV e VH, onde

a primeira e a segunda letra indicam, respectivamente, a polarizacao da radiacao

transmitida e a polarizacao da radiacao recebida pela antena. Polarizacoes cruzadas

(HV e VH) geralmente produzem ecos mais fracos do que aqueles gerados por config-

uracoes paralelas (HH e VV). Em sensoriamento remoto, e comum o uso de radares

multipolarimetricos, capazes de coletar dados em qualquer uma das quatro combi-

nacoes possveis.

FIGURA 2.7 - Microondas polarizadas.

38

2.1.4 Reducao de Speckle

Devido ao mecanismo de imageamento inerente, as imagens SAR sao comumente

corrompidas por um rudo conhecido como speckle, provocando uma distorcao ra-

diometrica cujo efeito visual e a aparencia granulosa caracterstica deste tipo de

imagem, como pode ser observado na Figura 2.8. O speckle e causado pela inter-

ferencia entre ondas refletidas de microscopicos difusores dentro de cada celula de

resolucao, e e geralmente modelado como um rudo multiplicativo, ou seja, propor-

cional a intensidade do sinal recebido.

FIGURA 2.8 - Imagem SAR distorcida por rudo speckle.

O efeito do speckle pode ser diminudo aplicando-se alguma forma de pre-

processamento sobre a imagem, melhorando, assim, os resultados de uma classi-

ficacao posterior. Duas abordagens podem ser adotadas com esta finalidade: pro-

cessamento de multiplas visadas ou processamento multilook, e filtragem espacial.

A primeira tecnica e incorporada ao processo de geracao da imagem, enquanto a

39

segunda consiste na aplicacao de filtros sobre a imagem ja formada.

2.1.4.1 Processamento Multilook

O processamento multilook consiste em dividir a abertura da antena em varias sub-

aberturas, cada qual proporcionando uma visada (look) independente sobre a su-

perfcie iluminada Figura 2.9. A imagem final e obtida calculando-se a media entre

as imagens geradas por cada visada (SENSING, 2002).

FIGURA 2.9 - Processamento multilook.FONTE: Sensing (2002).

Embora o processamento multilook seja capaz de reduzir o efeito do rudo, ele tam-

bem provoca a degradacao da resolucao espacial da imagem, proporcionalmente ao

numero de visadas escolhido.

2.1.4.2 Filtragem Espacial

Os filtros para reducao de speckle podem ser de dois tipos: adaptativos ou nao-

adaptativos. As tecnicas nao-adaptativas nao levam em consideracao propriedades

locais do terreno imageado, bem como caractersticas relacionadas a natureza do

sensor. Por essa razao, nao sao recomendadas quando se deseja preservar o maximo

de informacao sobre a imagem de entrada. Sao exemplos conhecidos de filtros nao-

adaptativos o filtro da Media e o da Mediana.

Nos filtros adaptativos, o grau de suavizacao se adapta a medidas estatsticas locais

sobre o restroespalhamento do terreno, preservando melhor detalhes como bordas e

40

areas de textura elevada (SENSING, 2002). Diversos metodos de filtragem tem sido

propostos na tentativa de proporcionar maior reducao de speckle associada a perda

mnima de informacao, como os filtros de Lee, Frost e RGMAP.

Filtro de Lee. Transforma o modelo multiplicativo em aditivo atraves de uma lin-

earizacao por expansao em serie de Taylor, aplicada sobre a multiplicacao

do sinal e do rudo em torno da media, eliminando, assim, a dependencia

entre o rudo e o valor do pixel (SANTANNA et al., 2001). O sinal sem rudo

e dado pela soma ponderada do valor do pixel observado (central) e do valor

da media. O coeficiente de ponderacao e uma funcao da heterogeneidade

local do alvo, medido atraves do coeficiente de variacao (SENSING, 2002).

Utiliza estatsticas locais para minimizar o erro quadratico medio atraves

do filtro de Wiener.

Filtro de Frost. E um filtro convolucional linear, derivado da minimizacao do erro

quadratico medio sobre o modelo multiplicativo do rudo (SANTANNA et al.,

2001). Estima-se o valor do sinal livre de speckle utilizando uma sub-janela

da janela de processamento, cujo tamanho varia em funcao da heterogenei-

dade local do alvo, medida atraves do coeficiente de variacao (SENSING,

2002).

Filtro MAP Gama (Maximum a Posteriori Gama). Baseia-se na premissa

de que o sinal livre de rudo da cena subjacente obedece a distribuicao

Gama. Assim, o valor do pixel e obtido maximizando-se a funcao den-

sidade de probabilidade a posteriori (Gama) com relacao ao sinal real.

Dentro de cenas conhecidamente bem modeladas pela distribuicao Gama,

como oceanos, florestas e areas agrcolas, e capaz de minimizar a perda de

informacao textural melhor do que os filtros de Frost e de Lee (SENSING,

2002).

2.2 Atributos de Textura

A interpretacao e analise de imagens e realizada com base em atributos espectrais

e espaciais. Entendem-se por espectrais os atributos que descrevem a tonalidade

(variacao do nvel de cinza) de um dado pixel em uma imagem, enquanto os atributos

espaciais refletem a distribuicao espacial de tonalidades dentro de uma regiao da

imagem. Ha dois tipos de relacao espacial: a textura, focada no objeto de interesse,

41

representando sua estrutura; e o contexto, que analisa o objeto em relacao ao restante

da cena.

Em termos visuais, Tso e Mather (2001) descrevem a textura como a impressao de

aspereza ou suavidade criada pela variacao de tonalidade ou repeticao de padroes

atraves de uma superfcie. Segundo Haralick (1979), a textura esta presente em todo

tipo de imagem, desde aquelas obtidas por satelites e aeronaves ate microscopicas

imagens de culturas celulares ou amostras de tecido. No contexto de sensoriamento

remoto, atributos de textura mostram-se eficazes ao atuar como informacoes auxil-

iares na caracterizacao de classes, melhorando muitas vezes o resultado da classifi-

cacao.

(a) Padrao regular. (b) Padrao irregular.

FIGURA 2.10 - Exemplos de textura.FONTE: Wu et al. (2000)

A textura tem sido incorporada a classificadores de imagens SAR na expectativa de

melhorar seu desempenho, especialmente para distinguir objetos de mesma tonali-

dade ou cor. A crescente importancia e utilidade da textura em metodos de classi-

ficacao de imagens SAR pode ser observada pelo grande numero de trabalhos de-

senvolvidos nesta area nos ultimos anos (DOBSON et al., 1997; KOMAROV et al., 1999;

DEKKER, 2001; GARCIA; PUIG, 2002; FLETCHER; EVANS, 2002; ACQUA; GAMBA,

2003; KUPLICH et al., 2005; KANDASWAMY et al., 2005).

2.2.1 Metodos para Extracao de Atributos de Textura

As medidas de media e variancia sao definidas como os atributos mais simples que

podem ser usados para caracterizar texturas de uma dada regiao (TSO; MATHER,

42

2001). E possvel, no entanto, encontrar diferentes padroes de textura que apresen-

tem a mesma media e variancia, mostrando que estes descritores nao sao suficientes

para analise textural, e formalismos mais abrangentes sao necessarios. Neste con-

texto, diversos metodos tem sido propostos na literatura, e embora nao haja uma

definicao operacional ou formulacao matematica precisa para quantificar as medidas

de textura de uma imagem, as principais abordagens dividem-se em quatro catego-

rias: dimensoes fractais e multifractais; matriz de co-ocorrencia; campo randomico

auto-regressivo multiplicativo; e filtragem no domnio da frequencia (TSO; MATHER,

2001). A primeira utiliza o conceito de dimensao fractal como medida para a quan-

tificacao da textura; superfcies complexas (alta dimensao multifractal) representam

texturas grosseiras, enquanto superfcies simples (suaves) possuem textura mais fina.

O modelo baseado em matriz de co-ocorrencia define a informacao textural atraves

da dependencia espacial entre os nveis de cinza de uma imagem. Em texturas gros-

seiras, observa-se uma ligeira mudanca na distribuicao dos valores espectrais numa

determinada distancia, enquanto em texturas finas a distribuicao muda rapidamente.

Nas tecnicas baseadas em campo randomico auto-regressivo multiplicativo (MAR

Multiplicative Autoregressive Random Fields), a textura e caracterizada pela uti-

lizacao de estimativas lineares do nvel de cinza de um pixel relacionado aos nveis

de cinza de sua vizinhanca. Os coeficientes possuem grande variacao em regioes de

texturas finas, enquanto texturas grosseiras apresentam coeficientes similares.

Os metodos que aplicam a filtragem no domnio da frequencia tem apresentado bons

resultados na tentativa de extrair informacoes de textura (TSO; MATHER, 2001).

Em geral, texturas finas estao associadas a altas frequencias espaciais, enquanto

em texturas grosseiras as frequencias baixas sao dominantes. Ha muitos algoritmos

disponveis com o objetivo de transformar dados de imagem do domnio espacial para

o domnio da frequencia, sendo o mais conhecido deles a transformada de Fourier,

que decompoe um sinal em um conjunto de funcoes senos e cossenos com diferentes

frequencias (MYLER; WEEKS, 1993). A metodologia adotada neste trabalho para

extracao de atributos de textura nas imagens baseia-se na teoria de filtros Gabor.

Para uma melhor compreensao desta teoria, uma breve descricao da transformada

de Fourier e da transformada wavelet e apresentada a seguir.

43

2.2.2 A Transformada Discreta de Fourier

As transformacoes matematicas sao aplicadas a sinais para extrair informacoes que

nao sao perceptveis de forma direta (MARTINS, 2003). Uma melhor visualizacao

dos dados a fim de realcar determinadas caractersticas de interesse requer, muitas

vezes, a mudanca do domnio temporal ou espacial para o domnio da frequencia.

Em 1822, com o objetivo inicial de descrever a conducao de calor e determinar

a distribuicao de temperatura ao longo de uma lamina, o matematico frances Jean

Baptiste Joseph Fourier criou o conceito de series de Fourier, mostrando que qualquer

funcao periodica pode ser representada como uma soma de funcoes trigonometricas.

Desde entao, a analise de Fourier tem revolucionado os mais diversos campos da

ciencia e engenharia, da radioastronomia a medicina (PRESS et al., 1992).

Uma extensao a serie de Fourier, a transformada de Fourier permite representar

funcoes nao-periodicas, ampliando assim a quantidade de aplicacoes possveis. De

maior relevancia no contexto de processamento digital de imagens, a versao discreta

da transformada de Fourier (DFT - Discrete Fourier Transform) e definida sobre

uma grade discreta de pixels de uma imagem I = I(m,n) (SEUL et al., 2000), de

acordo com a Equacao 2.10.

F (u, v) =1

MN

M1m=0

N1n=0

I(m,n) exp[i2

(umM

+vn

N

)], (2.10)

onde F (u, v) corresponde a representacao no domnio da frequencia de I(m,n); i =1; u e v sao as amostras correspondentes em frequencia as amostras espaciais

m e n. A faixa nos dois domnios e a mesma: 0 m M 1, 0 n N 1 e0 u M 1, 0 v N 1. A DFT inversa e dada por:

I(m,n) =1

MN

M1u=0

N1v=0

F (u, v) exp[i2(umM

+vn

N

)]. (2.11)

O conceito de frequencia em uma imagem pode ser facilmente interpretado pela

observacao dos detalhes espaciais ali contidos. A Figura 2.11 ilustra o conceito

de frequencia espacial atraves de duas figuras, com conjuntos periodicos de ondas

quadradas em duas frequencias espaciais distintas. A razao periodica das listras da

Figura 2.11(a) e de 2 ciclos/cm, contra 1 ciclo/cm na Figura 2.11(a).

44

(a) (b)

FIGURA 2.11 - Exemplo de imagens de diferentes frequencias.FONTE: Adaptado de Myler e Weeks (1993).

A Transformada Rapida de Fourier (FFT Fast Fourier Transform) consiste

numa implementacao eficiente da DFT, que pelo uso da estrategia dividir-para-

conquistar4, e capaz de reduzir a complexidade computacional da DFT da ordem

de N2 para apenas N log2N operacoes (GERSHENFELD, 1999). Em uma imagem de

1024 x 1024 pixels, isso equivale a um ganho de 10:1 (SEUL et al., 2000). A trans-

formada de Fourier e normalmente usada para filtragem no domnio da frequencia

atraves da aplicacao sucessiva da FFT direta e inversa. Na primeira etapa, a imagem

e transformada para o domnio da frequencia usando a FFT. O sinal em frequencia

e entao filtrado, e em seguida submetido a FFT inversa para voltar ao domnio es-

pacial, obtendo assim a imagem modificada. O diagrama em blocos deste processo

e apresentado na Figura 2.12.

FIGURA 2.12 - Diagrama em blocos do processo de filtragem no domnio da frequencia.

Em muitas aplicacoes, porem, nao basta conhecer as componentes em frequencia

contidas no sinal, mas tambem a localizacao no domnio espacial (ou temporal) em

que ocorre cada uma delas. Isso torna a transformada de Fourier inadequada para

4No contexto de projeto de algoritmos, a abordagem dividir-para-conquistar consiste em di-vidir um problema de difcil solucao sucessivamente em subproblemas menores, resolve-los recursi-vamente, e entao combinar estas solucoes para encontrar a resposta para o problema original (AHOet al., 1974).

45

tratar sinais do tipo nao-estacionario, ou seja, cujo conteudo em frequencia varia com

o tempo. Com o intuito de superar esta limitacao, Dennis Gabor, em 1946, adaptou

a transformada de Fourier para analisar somente uma pequena porcao de um sinal

de cada vez, criando uma tecnica chamada janelamento (windowing) do sinal, como

mostra a Figura 2.13. A adaptacao de Gabor, chamada de Transformada de Fourier

por Janelamento (Short-Time Fourier Transform STFT), mapeia o sinal em uma

funcao bidimensional de tempo e frequencia (STARCK et al., 1998).

(a)

(b)

FIGURA 2.13 - Exemplo de transformacao FT e STFT.FONTE: Adaptado de Misiti et al. (2006).

Embora esta relacao entre a informacao do tempo e a frequencia obtida pela STFT

seja bastante util, sua precisao e limitada pelo tamanho da janela, fixo para todo o

conteudo em frequencias. Muitos sinais requerem uma avaliacao mais flexvel, com

a possibilidade de variar o tamanho da janela para determinar a relacao entre o

intervalo de tempo e a frequencia com melhor precisao (MISITI et al., 2006). Nesta

situacao, a transformada wavelet pode ser mais apropriada.

46

2.2.3 Wavelets

Atraves da aplicacao de janelas de tempo com tamanhos variaveis na decomposicao

de um sinal, a analise por wavelets permite o uso de longos intervalos de tempo para

verificar com mais precisao informacoes de baixa frequencia, ou de intervalos de

tempo menores quando se deseja maior precisao em informacoes de alta frequencia

(GERSHENFELD, 1999).

O termo wavelet refere-se a um conjunto de funcoes em forma de pequenas ondas

geradas por dilatacoes e translacoes de uma funcao simples (t) denominada wavelet-

mae. A definicao da transformada wavelet contnua (CWT Continuous Wavelet

Transform) e dada por:

W (a, b) =1a

inf inf

f(t) (t ba

)dx , (2.12)

onde os parametros a(> 0) e b correspondem as informacoes de escala e posicao,

respectivamente. A Figura 2.14 representa graficamente a decomposicao de um sinal

por wavelets de escalas e posicoes diferentes.

FIGURA 2.14 - Sinal decomposto em wavelets de diferentes escalas e posicoes.FONTE: Misiti et al. (2006)

O fator escala esta relacionado com a frequencia do sinal e consequentemente com

a capacidade da funcao wavelet em identificar detalhes finos ou grosseiros de um

sinal (MISITI et al., 2006). Pequenas escalas correspondem a wavelets comprimidas,

capazes de detectar melhor pequenos detalhes e variacoes rapidas, enquanto escalas

maiores esticam as wavelets, proporcionando melhor representacao para feicoes

grosseiras e variacoes lentas, como mostra a Figura 2.15.

Depois de consolidada a teoria da transformada wavelet, muitos pesquisadores

47

FIGURA 2.15 - Efeito da alteracao de escala em uma wavelet.FONTE: Adaptado de Misiti et al. (2006)

comecaram a estudar a aplicacao de wavelets a representacao de texturas (MAR-

TINS, 2003). Ao avaliar o desempenho de atributos de textura extrados por difer-

entes transformadas wavelet, incluindo ortogonais e nao-ortogonais, tipo arvore es-

truturada e transformada de Gabor, Manjunath e Ma (1995) observaram melhor

representacao para os padroes de teste quando aplicada a transformada wavelet de

Gabor. A utilizacao de bancos de filtros Gabor para extracao de atributos de textura

e descrita a seguir.

2.2.4 Filtros Gabor

Pesquisas em psicologia mostram que o cerebro humano realiza uma analise em

frequencia das imagens, e celulas simples no cortex visual podem ser modeladas

mediante as funcoes Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta

propriedade, associada ao fato de as wavelets Gabor serem melhor localizadas no

tempo e na frequencia e apresentarem maior numero de parametros, torna as funcoes

Gabor especialmente apropriadas para a representacao de caractersticas locais das

imagens (CASTANON, 2003).

Em duas dimensoes, a funcao Gabor g(x, y) e sua transformada de Fourier G(u, v)

podem ser escritas como:

g(x, y) =

(1

2xy

)exp

[1

2

(x2

2x+y2

2y

)+ i2Wx

], (2.13)

48

G(u, v) = exp

{1

2

[(uW )2

2u+v2

2v

]}, (2.14)

onde u = 1/2x e v = 1/2y. As funcoes Gabor formam um conjunto base

completo (nao-ortogonal), que e usado para expandir o sinal, obtendo assim sua

descricao em frequencia local. Um banco (ou dicionario) de filtros Gabor pode ser

construdo atraves de dilatacoes e rotacoes apropriadas da wavelet mae g(x, y), a

partir da funcao geradora:

gmn(x, y) = amG(x, y), a > 1, m, n = integer , (2.15)

onde:

x = am(x cos + y sin ) , (2.16)

y = am(x sin + y cos ) , (2.17)

onde = n/K e K e o numero total de orientacoes e am e o fator escala. A

nao-ortogonalidade das wavelets Gabor implica que ha informacao reduntante nas

imagens filtradas. Para reduzir esta redundancia, Manjunath e Ma (1996) definem

uma estrategia de geracao de bancos de filtros Gabor, assegurando que os suportes

de magnitude de pico medio (half-peak) das respostas do banco de filtros no espectro

de frequencia tangenciem uns aos outros, como mostra a Figura 2.16.

O processo de eliminacao de redundancia e produto da utilizacao das seguintes

formulas no calculo dos parametros u e v (e, por consequencia, x e y):

a = (Uh/Ul)1/(S1) , (2.18)

u =(a 1)Uh

(a 1)

2 ln 2, (2.19)

49

FIGURA 2.16 - Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de redundancia.FONTE: Adaptado de Manjunath e Ma (1996)

v = tan(

2k

)[Uh 2 ln 2

(2uUh

)][2 ln 2 (2 ln 2)

22uU2h

]1/2, (2.20)

onde Ul e Uh correspondem aos centros inferior e superior de frequencias de interesse,

S corresponde ao numero de escalas na decomposicao em multirresolucao, e m =

0, 1, 2, . . . , S 1.

Para construir um banco ou dicionario de filtros, inicialmente e escolhido um inter-

valo de frequencias de interesse atraves da determinacao de dois valores de referencia:

frequencia superior e inferior. O segundo passo e determinar o numero de orientacoes

desejadas e em quantas escalas diferentes o intervalo de frequencia sera decomposto.

No dicionario de filtros representado pela Figura 2.16, os parametros usados sao: fre-

quencia superior Uh = 0.4; frequencia inferior Ul = 0.05; 6 orientacoes; e 4 escalas.

2.2.5 Representacao da Textura por Vetores de Atributos

Dada uma imagem I, e o banco de filtros Gabor gmn, a transformada Gabor em

(x, y) e definida por:

50

Wmn(x, y) =

I(x, y)gmn (x x1, y y1)dx1dy1 , (2.21)

onde indica o complexo conjugado. Com a aplicacao de filtros Gabor sobre ospadroes de textura, a geracao dos vetores de atributos e realizada atraves do calculo

de medidas estatsticas da imagem filtrada. As medidas estatsticas utilizadas sao a

media (mn) e o desvio padrao (mn) da magnitude dos coeficientes da transformada,

definidas por:

mn =

|Wmn(xy)|dxdy , (2.22)

mn =

(|Wmn(xy)| mn)2 dxdy , (2.23)

Para cada filtro aplicado, os dados estatsticos de media e desvio padrao sao calcu-

lados e concatenados para a formacao do vetor de atributos daquela textura. Neste

trabalho, foi utilizado um banco de filtros Gabor de quatro escalas e seis orientacoes.

Desta forma, os vetores de atributos resultantes tem a seguinte forma:

f = [11111212 . . . 4646] , (2.24)

onde op e op denotam, respectivamente, os valores da media e do desvio padrao no

estagio o e orientacao p. Um banco de filtros Gabor de quatro escalas e seis orien-

tacoes possui vinte e quatro filtros para cada medida. Como a informacao textural

e representada por duas medidas, entao o vetor de atributos possui quarenta e oito

elementos: dois parametros para cada filtro (MARTINS, 2003).

2.3 Classificadores Baseados em Redes Neurais Artificiais

A classificacao no contexto de sensoriamento remoto consiste em associar cada objeto

ou pixel de uma area em estudo a um ou mais elementos de um conjunto de rotulos

definido pelo usuario, convertendo a informacao numerica contida na imagem a uma

informacao tematica, como um determinado tipo de vegetacao (TSO; MATHER, 2001).

Este processo pode ser visto como uma funcao de mapeamento, que constroi uma

51

associacao entre os dados brutos e o conjunto de rotulos definido pelo usuario, como

mostra a Figura 2.17. Uma imagem de sensoriamento remoto totalmente classificada

e chamada de mapa tematico, pois possibilita a identificacao geografica das classes

sobre a superfcie imageada. (CROSTA, 1992).

FIGURA 2.17 - O conceito do classificador como uma conexao entre uma imagem (a esquerda) e umconjunto de rotulos de classe (a direita).FONTE: Adaptado de Tso e Mather (2001)

Por mais de uma decada, o reconhecimento de padroes em imagens de sensoriamento

remoto tem se baseado principalmente em tecnicas estatsticas convencionais, como

os procedimentos de maxima probabilidade e distancia mnima. Embora as abor-

dagens tradicionais possam apresentar bom desempenho, sua habilidade geral para

resolver confusoes inter-classes e limitada. Nos ultimos anos, estrategias alternativas

tem sido propostas, como o uso de redes neurais artificiais, arvores de decisao e meto-

dos derivados da teoria dos conjuntos nebulosos (Fuzzy Set Theory) (TSO; MATHER,

2001). A capacidade de reconhecer padroes, mesmo ao lidar com informacoes rui-

dosas ou incompletas (HAYKIN, 2001), contribui para que as redes neurais artificiais

possam atuar como ferramentas nos mais diversos tipos de problemas (FAUSETT,

1994). No contexto de sensoriamento remoto, seu uso vem crescendo nos ultimos

52

dez anos, principalmente para classificacao de imagens (TSO; MATHER, 2001).

2.3.1 Fundamentos de Redes Neurais Artificiais

O desenvolvimento da teoria de Redes Neurais Artificiais comecou ha aproximada-

mente 50 anos, motivado pelo desejo de tentar entender e ao mesmo tempo imitar

o cerebro e algumas de suas habilidades (FAUSETT, 1994). Desde entao, cientistas

tem se empenhado em criar novas tecnicas, alem de aperfeicoar aquelas ja existentes,

com o objetivo de expandir as areas de aplicabilidade da Neurocomputacao. Embora

a plausibilidade biologica dos modelos computacionais seja considerada por alguns

pesquisadores menos importante do que sua capacidade de desempenhar as tarefas

desejadas, uma breve introducao sobre as caractersticas basicas dos sistemas neu-

rais biologicos pode ajudar no entendimento dos principais fundamentos envolvidos

no projeto de uma rede neural artificial.

Em termos moleculares, o neuronio e a unidade fundamental do sistema nervoso

central, por ser o componente responsavel por produzir e conduzir as informacoes que

nele circulam. Os neuronios (ou celulas nervosas) possuem configuracoes variadas de

acordo com sua funcao e regiao a que pertencem, porem obedecem a uma estrutura

geral, que consiste de tres componentes basicos, como mostra a Figura 2.18. O corpo

celular ou soma constitui o nucleo da celula e suas organelas. Os dendritos consistem

em um grande numero de pequenos prolongamentos do corpo celular, atraves dos

quais o neuronio recebe estmulos (informacoes) de outros neuronios a ele associados.

O axonio corresponde ao prolongamento longo e fino que se ramifica em sua porcao

terminal, atraves da qual o neuronio estabelece conexoes com outros neuronios. O

axonio pode se originar do corpo celular ou de um dendrito principal e e onde se

concentra a sada de informacao da celula.

53

FIGURA 2.18 - O neuronio e seus principais componentes

O corpo celular (soma) e responsavel por somar os sinais de entrada. Quando a

entrada recebida e considerada suficiente, o neuronio dispara, ou seja, transmite

um sinal atraves de seu axonio a outros neuronios. O contato entre o axonio de um

neuronio e o dendrito de outro, ou seja, uma conexao entre dois neuronios, denomina-

se sinapse (Figura 2.19). A capacidade de estabelecer tais contatos e a principal

propriedade dos neuronios, pois e atraves das sinapses que os neuronios trocam

informacoes, formando a base para a realizacao das funcoes do sistema nervoso.

FIGURA 2.19 - A sinapse.

O neuronio consiste em um sistema eletroqumico muito pequeno, porem extrema-

mente complexo, sendo capaz de prover os principais mecanismos para processa-

mento de informacoes dentro do cerebro humano. Redes neurais artificiais podem ser

54

descritas como sistemas computacionais para processamento de informacao baseados

em um modelo simplificado do cerebro. Como uma analogia a constituicao biolog-

ica do cerebro, a unidade fundamental das redes neurais artificiais consiste em uma

estrutura denominada neuronio artificial ou unidade neuronal. O neuronio artificial

tem, para fins computacionais, sua geometria reduzida a um ponto, porem conserva

as caractersticas funcionais basicas do neuronio biologico. O primeiro modelo de

neuronio artificial conhecido foi desenvolvido em 1943, no trabalho pioneiro de Mc-

Culloch e Pitts (HAYKIN, 2001). Ele possui, como representado na Figura 2.20, tres

elementos basicos: um conjunto de sinais de entrada, cada qual associado a um peso;

um somador (

) para somar os sinais de entrada ponderados pelos pesos de suas

respectivas sinapses; e uma funcao de ativacao, responsavel pela ativacao ou nao

da sada do neuronio. Uma rede neural artificial e composta por um conjunto de

unidades neuronais conectadas entre si, e os pesos associados as conexoes represen-

tam a informacao usada pela rede para resolver o problema (FAUSETT, 1994).

FIGURA 2.20 - O neuronio artificial de McCulloch e Pitts.

No cerebro, cada neuronio esta conectado a milhares de outros, recebendo e proces-

sando, portanto, milhares de entradas diferentes. De acordo com a maneira como

cada neuronio esta conectado com os outros dentro da rede, ele se dedica a detec-

tar um conjunto especfico de coisas. Toda essa complexidade nao e possvel de ser

reproduzida em um modelo de simulacao devido as limitacoes impostas pela tecnolo-

gia atual, porem a tentativa de atingir plausibilidade biologica, mesmo atraves de

simplificacoes, pode levar a melhores atributos computacionais. Em uma rede neural

artificial, as unidades se distribuem na forma de camadas. O arranjo das camadas e

os padroes de conexoes entre elas determinam a arquitetura da rede, a qual, como

55

no caso dos sistemas biologicos, interfere diretamente no tipo de tarefa que a rede e

capaz de desempenhar. A Figura 2.21 ilustra os tres tipos de arquitetura possveis:

camada unica, composta por apenas uma camada de neuronios aritificiais conectada

a camada que contem os sinais de entrada (Fig. 2.21(a)); multiplas camadas, que

possui entre a entrada e a sada uma ou mais camadas ocultas (Fig. 2.21(b)); e ca-

mada competitiva, na qual a unidade a ser ativada para um dado padrao de entrada

e determinada atraves de um processo de competicao (Fig. 2.21(c)).

(a) Camada unica. (b) Multiplas camadas.

(c) Camada competitiva.

FIGURA 2.21 - Exemplos de arquiteturas (ou topologias) de redes neurais artificiais.

O processo de treinamento ao qual as unidades sao submetidas tambem varia entre

os diferentes modelos de redes. O treinamento ou aprendizagem consiste no metodo

usado para ajustar os pesos das conexoes ao longo da apresentacao dos sinais de

entrada (dados de treinamento), de forma que a rede aprenda a resolver o problema

em questao. Na aprendizagem supervisionada, o tipo mais comum, o treinamento

e realizado apresentando-se a rede uma sequencia de vetores de treinamento ou

padroes, cada qual associado a um vetor de sada desejado, conhecido como vetor-

alvo. O vetor-alvo representa um professor ou supervisor, que indica a rede se ela

esta ou nao produzindo a sada correta, determinando o ajuste dos pesos atraves de

um determinado algoritmo de aprendizagem.

56

As redes neurais auto-organizaveis constituem modelos governados por uma forma

nao-supervivisonada de treinamento, na qual uma sequencia de vetores de entrada e

fornecida, mas nao ha um supervisor, ou seja, nao sao especificados vetores-alvo. A

rede modifica os pesos de forma que vetores de entrada similares sejam associados

a mesma unidade de sada, produzindo um vetor representativo para cada grupo

formado (FAUSETT, 1994). Alem da arquitetura e do tipo e aprendizagem, uma

terceira caracterstica que distingue os modelos de redes neurais artificiais e sua

funcao de ativacao, aplicada sobre a soma dos sinais de entrada ponderados para

produzir a sada do neuronio. As funcoes de ativacao mais usadas, identidade, degrau

e sigmoide, estao representadas na Figura 2.22.

(a) Funcao identidade. (b) Funcao degrau.

(c) Funcao sigmoide.

FIGURA 2.22 - Funcoes de ativacao.FONTE: Adaptado de Misiti et al. (2006).

Nas proximas secoes, sao descritas as propriedades das redes utilizadas neste tra-

balho.

57

2.3.2 Mapa Auto-Organizavel de Kohonen (SOM)

Proposto por Kohonen (1988), o Mapa Auto-Organizavel de Kohonen e um modelo

de rede neural artificial baseado em competicao, isto e, no qual a rede deve escolher

uma unica unidade para responder a um dado padrao de entrada. A Figura 2.21(c)

mostra a topologia da rede SOM, representada em uma grade bidimensional de

unidades. A camada de entrada e conhecida como cortex sensorial, por analogia com

a funcao desta area no sistema neural biologico (TSO; MATHER, 2001). A camada de

sada e chamada entao de cortex de mapeamento.

Cada uma das ligacoes entre as camadas de entrada e sada possui um valor de

peso sinaptico wji onde i e j identificam o neuronio de entrada e sada, respecti-

vamente. O passo inicial para a criacao de uma rede SOM requer a definicao dos

parametros topologicos, ou seja, a escolha da quantidade de unidades nas camadas

de entrada e sada. O numero de unidades de entrada deve ser igual ao tamanho

do vetor de entrada. Nao ha uma especificacao formal para a dimensao da grade

bidimesional nm (n,m > 1), embora algumas recomendacoes possam ser encon-tradas na literatura (HAYKIN, 2001). O processo de treinamento da rede comeca com

a inicializacao dos pesos sinapticos wji, atribuindo-lhes valores aleatorios pequenos.

O proximo passo e retirar do espaco de entrada uma amostra x = {x1, x2, ..., xk},onde k e a dimensao dos dados de entrada. A distancia euclidiana entre o vetor de

entrada e cada unidade de sada e calculada de acordo com a Equacao 2.25:

d2j =ki

(xni wnji)2 , (2.25)

onde xni e a entrada submetida ao neuronio i na iteracao n. A unidade vencedora e

aquela que apresenta o melhor casamento com a entrada x, ou seja, arg min{d2j}.Os pesos sao entao ajustados usando a formula de atualizacao:

wn+1ji = wnji +

nj (xni wnji) , (2.26)

onde n corresponde a taxa de aprendizagem da rede, uma funcao que decresce grad-

ualmente com o tempo (numero de iteracoes). j e a funcao de vizinhanca centrada

em torno da unidade vencedora j, uma funcao unimodal da distancia lateral entre

58

a unidade vencedora (j) e sua vizinhanca (j), que deve satisfazer duas exigencias:

j e simetrica em relacao ao ponto maximo definido por d2j = 0; em outraspalavras, ela alcanca seu valor maximo na unidade vencedora (j), para a

qual a distancia d2j e nula;

a amplitude de j decresce monotonicamente com o aumento da distancialateral d2j , decaindo a zero para d

2j; esta e uma condicao necessaria

para a convergencia.

Uma escolha tpica para j e a funcao gaussiana:

j = exp

(d2j

22

), (2.27)

onde o parametro equivale a largura efetiva da vizinhanca topologica, como

mostra a Figura 2.23; ele mede o grau em que neuronios excitados na vizinhanca do

vencedor participam do processo de aprendizagem.

FIGURA 2.23 - Funcao de vizinhanca gaussiana.FONTE: Adaptado de Haykin (2001)

59

O processo a partir da etapa de amostragem e repetido ate que nao sejam observadas

mudancas significativas no mapa de caractersticas, ou ate que se atinja um numero

maximo predeterminado de iteracoes (HAYKIN, 2001).

2.3.3 Aprendizagem por Quantizacao Vetorial (LVQ)

A Aprendizagem por Quantizacao Vetorial (LVQ - Learning Vector Quantization)

e um metodo de classificacao de padroes cujo objetivo e refinar a definicao das

superfcies de decisao entre as classes, explorando informacoes conhecidas sobre os

padroes de treinamento. Desta maneira, e possvel aplicar o mapa auto-organizavel

de Kohonen para fazer um arranjo inicial dos pesos e, em uma etapa posterior,

utilizar a LVQ para fazer um ajuste fino sobre o mapa de caractersticas e melhorar

a capacidade de classificacao da rede, como mostra o diagrama da Figura 2.24.

FIGURA 2.24 - Diagrama em blocos da classificacao SOM+LVQ.FONTE: Adaptado de Haykin (2001)

A rede LVQ consiste em um modelo competitivo supervisionado, que requer uma

colecao de exemplos de treinamento associados a classes ou categorias conhecidas. O

conjunto de vetores de pesos relacionado as unidades de sada e geralmente denom-

inado livro-codigo, e cada membro e chamado palavra-codigo ou vetor de referencia

da classe representada pela unidade5. Cada padrao de entrada e associado a classe

dada pela unidade cujo vetor de referencia e o mais proximo (em medida de distan-

cia euclidiana) do vetor de entrada. O efeito desta associacao equivale a dividir o

espaco de entrada atraves de um diagrama de Voronoi6, como mostra a Figura 2.25.

5Os valores iniciais dos pesos correspondem aos valores finais obtidos pelo algoritmo SOM.Quando a rede LVQ e usada de forma independente, ou seja, sem um ajuste inicial dos pesos atravesdo algoritmo SOM, o conjunto inicial de pesos e composto de valores escolhidos aleatoriamente.

6Dados m pontos em um espaco n-dimensional, o diagrama de Voronoi e a particao do espacon-dimensional em m regioes poliedricas, uma regiao para cada ponto pm. Tal regiao e chamadacelula de Voronoi, e contem todos os pontos que sao mais proximos de p do que de qualquer outroponto no conjunto (HAYKIN, 2001).

60

FIGURA 2.25 - Diagrama de Voronoi envolvendo quatro celulas.FONTE: Adaptado de Haykin (2001)

A tecnica usada pelo algoritmo LVQ usa a informacao conhecida sobre as classes

para mover ligeiramente os vetores de Voronoi, a fim de melhorar a qualidade das

regioes de decisao do classificador (HAYKIN, 2001). Dado um vetor de entrada x e sua

sada-alvo (classe), o vetor de Voronoi (vetor de referencia) e movido em direcao a

x se ambos os vetores pertencerem a mesma classe, ou afastado de x caso contrario.

Isso implica numa pequena mudanca no algoritmo de treinamento em relacao a

Equacao 2.26 da rede SOM. Supondo que o vetor de Voronoi wc seja o mais proximo

do vetor de entrada xi, Cwc represente a classe associada ao vetor de Voronoi wc,

e Cxi represente o rotulo de classe do vetor de entrada xi, a atualizacao dos pesos

(vetores de Voronoi) ocorre como segue:

SeCwc =Cxi , entao

wn+1c = wnc +

n(xni wnc ) , (2.28)

onde 0 < n < 1.

SeCwc 6=Cxi , entao

wn+1c = wnc n(xni wnc ) . (2.29)

Os outros vetores de Voronoi nao sao modificados. E desejavel que a constante de

aprendizagem n decresca monotonicamente com o numero de iteracoes. Apos varios

61

passos atraves dos dados de entrada, os vetores de Voronoi tipicamente convergem

e o treinamento esta completo (HAYKIN, 2001). Uma modificacao deste algoritmo,

conhecida como LVQ2 (Aprendizagem por Quantizacao Vetorial Tipo 2), estipula

que as correcoes sobre os pesos somente devem ser efetuadas se o vetor de entrada

x estiver dentro de uma janela definida ao redor do plano medio entre dois vetores

de Voronoi vizinhos wp e wq pertencentes a classes diferentes. A largura otima desta

janela deve ser determinada experimentalmente, e depende do numero de amostras

de treinamento disponveis, embora algumas sugestoes praticas sejam discutidas em

Kohonen (1990) e Demuth et al. (2006). Neste caso, as seguintes atualizacoes sao

calculadas:

wn+1p = wnp +

n(xni wnp ) , (2.30)

wn+1q = wnq n(xni wnq ) , (2.31)

caso wp e xi pertencam a mesma classe (Cwp =Cxi), e wq e x, mesmo apresentando

menor distancia euclidiana, pertencam a classes distintas (Cwq =Cxi). Analisando

deficiencias contidas no algoritmo LVQ2, Kohonen (1990) desenvolveu uma terceira

versao para a Aprendizagem por Quantizacao Vetorial (LVQ3), que introduz uma

regra de atualizacao de pesos extra, aplicada nos casos em que x, wp e wq pertencam

a mesma classe, ou seja,Cwp =Cxi =Cwq . Esta nova regra e descrita na equacao

abaixo:

wn+1k = wnk + n(xni wnk ) , (2.32)

onde k{p, q}. O valor da constante e diretamente proporcional ao tamanho dajanela. Estudos apontam o LVQ3 como o algoritmo que produz os melhores re-

sultados (KOHONEN, 1990). O sucesso deste modelo em testes aplicados por Ma e

Manjunath (1996) ao reconhecimento de padroes de texturas determinou a escolha

do LVQ3 para o presente trabalho.

62

2.4 Processamento Paralelo

Desde o surgimento do primeiro computador digital eletronico7, a computacao pas-

sou por um processo evolutivo intenso, a fim de proporcionar maior desempenho

e ampliar o leque de aplicacoes que podem ser computacionalmente resolvidas de

maneira eficiente. A partir da decada de 70, em busca de maior eficiencia e facil-

idade no processo computacional, novas tecnologias passaram a ser desenvolvidas,

como a computacao paralela e as redes de computadores (SANTANA et al., 1997).

Pacheco (1997) define o computador paralelo como simplesmente um computador

(ou colecao de computadores) com multiplos processadores que podem trabalhar

juntos na resolucao de um problema unico. Sistemas paralelos e distribudos tem

se tornado essenciais no contexto do processamento digital de imagens, em especial

quando os dados sao obtidos por sensoriamento remoto. Esta necessidade e reforcada

pelo crescente uso de sistemas SAR, cujos sensores apresentam caractersticas com-

plexas, como polarizacao multipla e capacidades interferometricas, alem de gerar

grandes quantidades de dados (TAYLOR et al., 1999). Converter estes dados cada vez

mais amplamente disponveis em informacao efetiva para as instituicoes responsaveis

por tomadas de decisao tem sido uma grande dificuldade na area de processamento

de imagens, justificando a necessidade de serem desenvolvidos sistemas especficos

para a aplicacao que apresentem eficiencia computacional.

Com o aumento da velocidade e confiabilidade das redes de computadores observado

na ultima decada, torna-se cada vez mais comum a interligacao de computadores pes-

soais e workstations de maneira eficiente para composicao de sistemas distribudos.

Clusters denominam maquinas paralelas com arquitetura de memoria distribuda

representados na forma de um conjunto de computadores interconectados trabal-

hando juntos, dando ao usuario a impressao de um sistema unico, apesar da dis-

tribuicao de seus componentes de dados e hardware (BUYYA, 1999). Estes sistemas

tem sido utilizados para a execucao de programas paralelos, em substituicao as ar-

quiteturas paralelas, em virtude de seu menor custo e maior flexibilidade (SANTANA

et al., 1997).

As primeiras ideias relacionadas ao uso de clusters foram desenvolvidas pela IBM na

decada de 60, conectando grandes mainframes com o objetivo de proporcionar uma

forma de paralelismo comercial de baixo custo (BUYYA, 1999). O modelo de clusters

7O primeiro computador eletronico foi projetado em meados de 1940, e recebeu o nome deENIAC (Electronic Numerical Integrator and Computer).

63

denominado Beowulf, desenvolvido pela NASA em 1994, tornou-se um projeto bem

sucedido e bastante usado atualmente. Esta arquitetura, adotada para a extracao

de atributos de textura das imagens no presente trabalho, sera descrita a seguir.

2.4.1 A Arquitetura Beowulf

O projeto Beowulf 8 surgiu em 1994, desenvolvido por Sterling et al. (1995) com o ob-

jetivo de proporcionar a NASA um sistema que apresentasse desempenho comparavel

ao das maquinas paralelas, porem a um custo cerca de dez vezes menor. O primeiro

sistema Beowulf continha 16 processadores Intel 66 MHz 486 executando o sistema

operacional Linux, conectados via rede Ethernet. A necessidade de um software para

estabelecer a rede de interconexao entre os processadores levou ao desenvolvimento

de muitos dos drivers Ethernet para Linux ate hoje usados por milhares de computa-

dores ao redor do mundo para conectarem-se a Internet (BUYYA, 1999). O projeto

obteve aprovacao imediata ao apresentar uma escolha alternativa para proporcionar

computacao de alto desempenho (HPC - High Performance Computing).

Com o sucesso do Beowulf original, muitos outros sistemas foram construdos pelo

CEDIS/NASA (Center of Excellence in Space Data and Information Sciences), uti-

lizando varias geracoes e famlias de processadores e conexoes de rede (HSIEH, 2000).

Uma importante caracterstica que distingue os sistemas Beowulf de outros clusters

e o fato de nao ser imposto ao usuario um modelo de arquitetura fixo. Uma vez

que os parametros relacionados a custo e desempenho de equipamentos de hardware

mudam constantemente, as geracoes de sistemas Beowulf evoluem continuamente

desde sua composicao original, criada em 1994. Embora, em um nvel mais geral, a

arquitetura tenha permanecido a mesma,

Aplicação de Mapa de Kohonen para classificação de...

Documents

Transcript of Aplicação de Mapa de Kohonen para classificação de...