Aplicação de Mapa de Kohonen para classificação de...

113
INPE-15239-TDI/1326 APLICA ¸ C ˜ AO DE MAPA DE KOHONEN PARA CLASSIFICA ¸ C ˜ AO DE TEXTURAS EM IMAGENS SAR EM AMBIENTE PARALELO Thalita Biazzuz Veronese Disserta¸c˜ ao de Mestrado do Curso de P´ os-Gradua¸ aoemComputa¸c˜aoAplicada, orientada pelo Dr. Lamartine Nogueira Frutuoso Guimar˜aes, aprovada em 5 de fevereiro de 2007. O original deste documento est´ a dispon´ ıvel em: <http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07> INPE ao Jos´ e dos Campos 2008

Transcript of Aplicação de Mapa de Kohonen para classificação de...

  • INPE-15239-TDI/1326

    APLICACAO DE MAPA DE KOHONEN PARA

    CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM

    AMBIENTE PARALELO

    Thalita Biazzuz Veronese

    Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

    orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro

    de 2007.

    O original deste documento esta disponvel em:

    INPE

    Sao Jose dos Campos

    2008

    http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07

  • PUBLICADO POR:

    Instituto Nacional de Pesquisas Espaciais - INPE

    Gabinete do Diretor (GB)

    Servico de Informacao e Documentacao (SID)

    Caixa Postal 515 - CEP 12.245-970

    Sao Jose dos Campos - SP - Brasil

    Tel.:(012) 3945-6911/6923

    Fax: (012) 3945-6919

    E-mail: [email protected]

    CONSELHO DE EDITORACAO:

    Presidente:

    Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra (OBT)

    Membros:

    Dra Maria do Carmo de Andrade Nono - Conselho de Pos-Graduacao

    Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE)

    Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e Atmosfericas (CEA)

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos Climaticos (CPT)

    Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia Espacial (ETE)

    BIBLIOTECA DIGITAL:

    Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da Terra (OBT)

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao (SID)

    Simone A. Del-Ducca Barbedo - Servico de Informacao e Documentacao (SID)

    REVISAO E NORMALIZACAO DOCUMENTARIA:

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Marilucia Santos Melo Cid - Servico de Informacao e Documentacao (SID)

    Yolanda Ribeiro da Silva e Souza - Servico de Informacao e Documentacao (SID)

    EDITORACAO ELETRONICA:

    Viveca SantAna Lemos - Servico de Informacao e Documentacao (SID)

    [email protected]

  • INPE-15239-TDI/1326

    APLICACAO DE MAPA DE KOHONEN PARA

    CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM

    AMBIENTE PARALELO

    Thalita Biazzuz Veronese

    Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

    orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes, aprovada em 5 de fevereiro

    de 2007.

    O original deste documento esta disponvel em:

    INPE

    Sao Jose dos Campos

    2008

    http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07

  • Dados Internacionais de Catalogacao na Publicacao (CIP)

    V599a Veronese, Thalita Biazzuz.Aplicacao de Mapa de Kohonen para classificacao de

    texturas em imagens SAR em ambiente paralelo/ ThalitaBiazzuz Veronese. Sao Jose dos Campos: INPE, 2008.

    110p. ; (INPE-15239-TDI/1326)

    1. Imagens SAR. 2. Atributos de textura. 3. Filtros Ga-bor. 4. Classificacao de imagens. 5. Processamento paralelo.I. Ttulo.

    CDU 621.376.5

    Copyright c 2008 do MCT/INPE. Nenhuma parte desta publicacao pode ser reprodu-zida, armazenada em um sistema de recuperacao, ou transmitida sob qualquer forma ou

    por qualquer meio, eletronico, mecanico, fotografico, microflmico, reprografico ou outros,

    sem a permissao escrita da Editora, com excecao de qualquer material fornecido especifi-

    camente no proposito de ser entrado e executado num sistema computacional, para o uso

    exclusivo do leitor da obra.

    Copyright c 2008 by MCT/INPE. No part of this publication may be reproduced, storedin a retrieval system, or transmitted in any form or by any means, eletronic, mechanical,

    photocopying, microfilming, recording or otherwise, without written permission from the

    Publisher, with the exception of any material supplied specifically for the purpose of being

    entered and executed on a computer system, for exclusive use of the reader of the work.

  • Voce deve ser a propria mudanca que deseja ver no mundo.

    Mohandas Karamchand Gandhi

  • querida Leninha, dedico.

  • AGRADECIMENTOS

    Agradeco ao meu orientador Lamartine Nogueira Frutuoso Guimaraes, pela oportu-

    nidade de desenvolver este trabalho, e pela orientacao e suporte em todas as fases

    desta pesquisa de mestrado.

    Ao Maj. Maurcio Pozzobon Martins, do Instituto de Estudos Avancados, agradeco

    pelo apoio irrestrito, empenhando-se incansavelmente em possibilitar que este tra-

    balho alcancasse os objetivos concretos a que se propunha, e pela amizade e profis-

    sionalismo exemplares dedicados desde o incio desta pesquisa.

    Ao Instituto Nacional de Pesquisas Espaciais, aos profissionais do LAC, CAP e SPG,

    pelo ingresso e manutencao neste programa de Mestrado. Agradeco, em especial, aos

    professores Demsio, Fernando e Stephan, pela participacao e sugestoes na Defesa

    de Proposta de Mestrado.

    Ao Instituto de Estudos Avancados, em especial a Divisao de Geointeligencia e a

    Divisao de Energia Nuclear, por me receber e permitir usufruir de seus recursos

    computacionais e instalacoes, e aos administradores do cluster BELIEVe Onofre

    Felix de Lima Neto e Roberto Yuji Tanaka, pelo suporte prestado. Aos funcionarios

    que me receberam tao bem nesta insitituicao, expresso minha profunda gratidao.

    A Embrapa Monitoramento por Satelite, em especial aos pesquisadores Gustavo

    Souza Valladares e Evaristo Eduardo de Miranda, agradeco pela confianca de-

    positada neste trabalho, fornecendo os dados indispensaveis para esta pesquisa de

    mestrado, e pela hospitalidade ao me receber em sua sede em Campinas.

    A CAPES e ao CNPq, pelo suporte financeiro.

    A meus pais Carlos Eduardo e Irene, as melhores pessoas que ja conheci, que com seu

    amor incondicional proporcionam estrutura, incentivo e apoio em todos os momentos

    da minha vida.

    Ao meu marido Reinaldo, companheiro de todos os momentos, agradeco simples-

    mente por tudo. Por ser essa pessoa tao especial, pelo imensuravel apoio, pelo pre-

    sente que e te-lo ao meu lado.

    A toda minha famlia, pela confianca, carinho e compreensao, mesmo nos momentos

    mais difceis.

  • A todos os meus amigos, que formam minha segunda famlia, agradeco por me

    permitirem participar de suas vidas.

    A todos os professores que contriburam para a minha formacao, que muitas vezes

    foram mais do que simples profissionais e dedicaram tambem sua valiosa amizade.

    Por fim, a todos aqueles que colaboraram de alguma forma para que eu chegasse ate

    aqui, agradeco e espero algum dia poder retribuir a altura.

  • RESUMO

    Ao longo das ultimas decadas, diversas tecnicas tem sido desenvolvidas para clas-sificacao de imagens de sensoriamento remoto. No caso de imagens geradas porsensores que atuam na faixa de microondas (radar), novas pesquisas sao necessarias,ja que muitas vezes tecnicas consagradas para a classificacao de imagens opticas naoproduzem resultados satisfatorios quando aplicadas a imagens radar. Isso acontecedevido as caractersticas peculiares deste tipo de imagem - presenca de forte rudo,por exemplo. Na regiao amazonica, as condicoes climaticas frequentemente favore-cem a cobertura de nuvens, o que se apresenta como fator restritivo a utilizacao desensores opticos, incapazes de transpor este obstaculo naturalmente. Entretanto, ossensores SAR praticamente nao sao afetados pela cobertura de nuvens, e portantotem se tornado os principais responsaveis pela obtencao de dados, contribuindo parasuprir a falta de informacao disponvel sobre esta regiao. Neste trabalho, avalia-se aeficiencia de um classificador neural baseado no mapa auto-organizavel de Kohonenpara classificacao de imagens SAR do SIVAM (Sistema de Vigilancia da Amazonia),utilizando medidas de textura obtidas por filtros Gabor. Na fase de extracao deatributos, um processo de elevado custo computacional, foram implementadas tec-nicas de processamento paralelo em rede de computadores de baixo custo, a fim deavaliar o real ganho em desempenho. As imagens utilizadas foram obtidas pelo sen-sor SAR-SIVAM sobre Machadinho dOeste - RO, adquiridas em 13 de Setembro de2004 pelo sensor SAR da aeronave de sensoriamento remoto do SIVAM, gentilmentecedidas pela Divisao de Sensoriamento Remoto do Instituto de Estudos Avancados(IEAv/CTA). Como referencia para a identificacao visual de classes de texturas,serao utilizadas imagens opticas SPOT e dados de campo cedidos pela EMBRAPA.

  • A KOHONENS MAP FOR SAR IMAGES TEXTURECLASSIFICATION IN PARALLEL ENVIRONMENT

    ABSTRACT

    In the last decades, several techniques have been developed for classification of re-mote sensing images. In the case of images obtained from sensors that act in themicrowave regions (radar), new researches are necessary, since often successfull tech-niques for optical images classification do not produce satisfactory results when ap-plied to radar images. This happens due to the peculiar characteristics of this typeof image - e.g., the presence of strong noise. In the Amazon region, the climaticconditions frequently benefit clouds covering, what presents itself as a restrictivefactor to the use of optical sensors, unable to naturally cross this obstacles. How-ever, SAR sensors are pratically not affected by the clouds covering, and thus havebecome the main responsible for collection of data, contributing to supply the lackof information about this region. In this work, we evaluate the efficiency of a neuralclassifier based on the Kohonens Self-Organizing Map for classifying SAR-SIVAMimages obtained from Machadinho dOeste - RO, using Gabor texture features. Inthe feature extraction phase, a high computational cost proccess, techniques of par-allel processing were implemented in low cost computer network, in order to analyzethe real performance improvement. The images for testing were obtained in 2004September 13, by the SAR sensor of SIVAMs remote sensing aircraft, kindly givenby Remote Sensing Division of Advanced Studies Institute (IEAv/CTA). As refer-ence for the visual identification of texture classes, SPOT optical images and fieldinformation, given by EMBRAPA, are used.

  • SUMARIO

    Pag.

    LISTA DE FIGURAS

    LISTA DE TABELAS

    LISTA DE SIGLAS E ABREVIATURAS

    CAPITULO 1 - INTRODUCAO 25

    CAPITULO 2 - FUNDAMENTOS TEORICOS 29

    2.1 - Imagens Obtidas por Radar de Abertura Sintetica (SAR) . . . . . . . . . 29

    2.1.1 - Geometria de Aquisicao de Imagens SAR . . . . . . . . . . . . . . . . 31

    2.1.2 - Equacao do Radar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    2.1.3 - Polarizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    2.1.4 - Reducao de Speckle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    2.2 - Atributos de Textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    2.2.1 - Metodos para Extracao de Atributos de Textura . . . . . . . . . . . . . 42

    2.2.2 - A Transformada Discreta de Fourier . . . . . . . . . . . . . . . . . . . 44

    2.2.3 - Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    2.2.4 - Filtros Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    2.2.5 - Representacao da Textura por Vetores de Atributos . . . . . . . . . . . 50

    2.3 - Classificadores Baseados em Redes Neurais Artificiais . . . . . . . . . . . 51

    2.3.1 - Fundamentos de Redes Neurais Artificiais . . . . . . . . . . . . . . . . 53

    2.3.2 - Mapa Auto-Organizavel de Kohonen (SOM) . . . . . . . . . . . . . . . 58

    2.3.3 - Aprendizagem por Quantizacao Vetorial (LVQ) . . . . . . . . . . . . . 60

    2.4 - Processamento Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    2.4.1 - A Arquitetura Beowulf . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    2.4.2 - Conceitos Basicos de Paralelismo . . . . . . . . . . . . . . . . . . . . . 67

    2.4.3 - Analise de Eficiencia e Speedup . . . . . . . . . . . . . . . . . . . . . . 69

    CAPITULO 3 - MATERIAIS E METODOS 71

    3.1 - Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    3.2 - O Sensor SAR/R-99B . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

  • 3.3 - O Projeto Believe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    3.4 - Matriz de Confusao e Indice Kappa . . . . . . . . . . . . . . . . . . . . . 75

    3.5 - Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    3.5.1 - Definicao da Area de Estudo . . . . . . . . . . . . . . . . . . . . . . . 78

    3.5.2 - Definicao das Classes de Estudo . . . . . . . . . . . . . . . . . . . . . . 78

    3.5.3 - Extracao das Amostras de Treinamento e Teste . . . . . . . . . . . . . 79

    3.5.4 - Extracao de Atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

    3.5.5 - Distribuicao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

    3.5.6 - Treinamento da Rede SOM+LVQ . . . . . . . . . . . . . . . . . . . . . 82

    3.5.7 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 83

    CAPITULO 4 - ANALISE DE RESULTADOS 87

    4.1 - Treinamento da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    4.1.1 - Combinacao de Bandas . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    4.1.2 - Tamanho dos Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

    4.1.3 - Configuracao da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

    4.2 - Classificacao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . 92

    4.3 - Analise de desempenho e eficiencia . . . . . . . . . . . . . . . . . . . . . 94

    CAPITULO 5 - CONCLUSOES 99

    REFERENCIAS BIBLIOGRAFICAS 101

    APENDICE A - DISTRIBUICAO DO PROCESSAMENTO 107

  • LISTA DE FIGURAS

    Pag.

    2.1 Espectro de frequencias, destacando a faixa de microondas e as bandas

    de radar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    2.2 Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos de-

    pendem de uma fonte de energia geralmente o sol que ilumine o alvo

    para captar a energia refletida. . . . . . . . . . . . . . . . . . . . . . . . 30

    2.3 A ambiguidade no imageamento por radar com visada vertical. . . . . . . 32

    2.4 Alguns parametros basicos de um sistema SLAR. . . . . . . . . . . . . . 33

    2.5 A relacao entre o angulo de depressao e o efeito sombreamento sobre a

    imagem SAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    2.6 Os efeitos de inversao e encurtamento sobre a imagem SAR. . . . . . . . 37

    2.7 Microondas polarizadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    2.8 Imagem SAR distorcida por rudo speckle. . . . . . . . . . . . . . . . . . 39

    2.9 Processamento multilook. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.10 Exemplos de textura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    2.11 Exemplo de imagens de diferentes frequencias. . . . . . . . . . . . . . . . 45

    2.12 Diagrama em blocos do processo de filtragem no domnio da frequencia. . 45

    2.13 Exemplo de transformacao FT e STFT. . . . . . . . . . . . . . . . . . . 46

    2.14 Sinal decomposto em wavelets de diferentes escalas e posicoes. . . . . . . 47

    2.15 Efeito da alteracao de escala em uma wavelet. . . . . . . . . . . . . . . . 48

    2.16 Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de re-

    dundancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

  • 2.17 O conceito do classificador como uma conexao entre uma imagem (a

    esquerda) e um conjunto de rotulos de classe (a direita). . . . . . . . . . 52

    2.18 O neuronio e seus principais componentes . . . . . . . . . . . . . . . . . 54

    2.19 A sinapse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    2.20 O neuronio artificial de McCulloch e Pitts. . . . . . . . . . . . . . . . . . 55

    2.21 Exemplos de arquiteturas (ou topologias) de redes neurais artificiais. . . 56

    2.22 Funcoes de ativacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    2.23 Funcao de vizinhanca gaussiana. . . . . . . . . . . . . . . . . . . . . . . . 59

    2.24 Diagrama em blocos da classificacao SOM+LVQ. . . . . . . . . . . . . . 60

    2.25 Diagrama de Voronoi envolvendo quatro celulas. . . . . . . . . . . . . . . 61

    2.26 Visao logica de um cluster da classe Beowulf. . . . . . . . . . . . . . . . 65

    2.27 Cluster do projeto BELIEVe (IEAv/CTA). . . . . . . . . . . . . . . . . . 66

    2.28 Modelos computacionais SISD, SIMD e MISD. UC=Unidade de Con-

    trole; UP=Unidade de Processamento; M=Memoria; FI=Fluxo de In-

    strucoes; FD=Fluxo de Dados. . . . . . . . . . . . . . . . . . . . . . . . 68

    2.29 Modelos computacionais MIMD de memoria compartilhada (a) e dis-

    tribuda (b). UC=Unidade de Controle; UP=Unidade de Processa-

    mento; M=Memoria; FI=Fluxo de Instrucoes; FD=Fluxo de Dados. . . 69

    3.1 Localizacao do municpio de Machadinho dOeste. . . . . . . . . . . . . . 71

    3.2 Aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . . . . . . . . . . . 74

    3.3 Metodologia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    3.4 Imagem SAR (banda L VH polarizada) obtida sobre a area de estudo,

    destacando os recortes selecionados para analise. . . . . . . . . . . . . . . 78

    3.5 Interface do modulo de geracao de Filtros Gabor. . . . . . . . . . . . . . 80

  • 3.6 Interface de selecao de amostras e extracao de atributos. . . . . . . . . . 81

    3.7 Interface do modulo de treinamento da rede. . . . . . . . . . . . . . . . . 83

    3.8 Interface do modulo de classificacao das imagens. . . . . . . . . . . . . . 84

    4.1 Valores de Kappa obtidos para diferentes tamanhos de filtros. . . . . . . 90

    4.2 Graficos com ndices Kappa observados para diferentes configuracoes da

    rede SOM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

    4.3 Evolucao do treinamento em termos dos valores de Kappa. . . . . . . . . 92

    4.4 Recorte selecionado para analise e imagem resultante da classificacao. . . 94

    4.5 Medidas de speedup observadas. . . . . . . . . . . . . . . . . . . . . . . . 96

    4.6 Medidas de eficiencia observadas. . . . . . . . . . . . . . . . . . . . . . . 97

  • LISTA DE TABELAS

    Pag.

    3.1 Caractersticas da aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . 73

    3.2 Exemplo de matriz de confusao. . . . . . . . . . . . . . . . . . . . . . . . 76

    3.3 Numero de pixels de treinamento e teste para cada classe. . . . . . . . . 79

    3.4 Numero de pixels de treinamento para cada classe. . . . . . . . . . . . . 84

    4.1 Valores de kappa para cada banda. . . . . . . . . . . . . . . . . . . . . . 87

    4.2 Valores de Kappa para combinacoes entre bandas. . . . . . . . . . . . . . 88

    4.3 Valores de Kappa para X(HH) + L(VH) filtradas. . . . . . . . . . . . . . 89

    4.4 Matriz de confusao resultante da classificacao. . . . . . . . . . . . . . . . 93

    4.5 Medidas de speedup e eficiencia obtidas para o conjunto de 17.500 pixels. 94

    4.6 Medidas de speedup e eficiencia obtidas para o conjunto de 52.500 pixels. 95

    4.7 Medidas de speedup e eficiencia obtidas para o conjunto de 87.500 pixels. 95

  • LISTA DE SIGLAS E ABREVIATURAS

    SAR Synthetic Aperture RadarSR Sensoriamento RemotoINSAR Interferometria SARSIVAM Sistema de Vigilancia da AmazoniaSLAR Side Looking Airbone RadarDFT Discrete Fourier TransformFFT Fast Fourier TransformSTFT Short-Time Fourier TransformCWT Continuous Wavelet TransformSOM Self-Organizing MapLVQ Learning Vector QuantizationPVM Parallel Virtual MachineMPI Message-Passing InterfaceSISD Single-Instruction Single-DataMISD Multiple-Instruction Single-DataSIMD Single-Instruction Multiple-DataMIMD Multiple-Instruction Multiple-Data

  • CAPITULO 1

    INTRODUCAO

    A classificacao de imagens de sensoriamento remoto consiste em associar um rotulo

    de classe a cada pixel, com base em medidas extradas da imagem - geralmente do

    proprio pixel ou de seus vizinhos. Uma imagem de sensoriamento remoto totalmente

    classificada e chamada de mapa tematico, pois possibilita a identificacao geografica

    das classes sobre a superfcie imageada (CROSTA, 1992). Ha diversas aplicacoes para

    a classificacao de imagens de sensoriamento remoto, como, por exemplo, analise de

    culturas agrcolas, monitoramento e controle ambiental, planejamento urbano, etc.

    Para classificacao de imagens geradas a partir de sensores opticos, diversas tecnicas

    tem sido desenvolvidas, aperfeicoadas e utilizadas ao longo das ultimas decadas.

    Entretanto, no caso das imagens obtidas a partir de sensores que atuam na faixa de

    microondas (radar), novas pesquisas sao necessarias, ja que muitas vezes tecnicas de

    classificacao consagradas para dados opticos nao produzem resultados satisfatorios

    quando aplicadas a imagens radar, devido as caractersticas peculiares desse tipo de

    imagem presenca de forte rudo, por exemplo.

    Presente em todo tipo de imagem (HARALICK, 1979), a textura e um atributo es-

    pacial que reflete a impressao de aspereza ou suavidade criada pela variacao de

    tonalidade ou repeticao de padroes atraves de uma superfcie (TSO; MATHER, 2001).

    No contexto do sensoriamento remoto, atributos de textura mostram-se eficazes ao

    atuar como informacoes auxiliares na caracterizacao de classes, melhorando muitas

    vezes o resultado da classificacao. Em imagens de radar, a incorporacao da textura ao

    processo de classificacao e utilizada principalmente quando aplicada a discrimacao

    de diferentes tipos de florestas e variedades de culturas agrcolas que nao se dis-

    tinguem por apresentarem a mesma tonalidade (ou nvel de cinza medio), mas que

    podem ser discriminadas pela diferenca de textura (SILVA JUNIOR, 2001). Pesquisas

    em psicologia mostram que o cerebro humano realiza uma analise em frequencia das

    imagens, e celulas simples no cortex visual podem ser modeladas mediante as funcoes

    Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta propriedade, associada

    ao fato de as wavelets Gabor serem melhor localizadas no tempo e na frequencia e

    apresentarem maior numero de parametros, torna as funcoes Gabor especialmente

    apropriadas para a representacao de caractersticas locais das imagens (CASTANON,

    2003).

    25

  • Em Manjunath e Ma (1996), e proposta uma metodologia na qual os padroes de

    textura sao caracterizados utilizando a transformada wavelet de Gabor e medidas

    estatsticas. Esta metodologia foi utilizada por Martins (2003) para a implemen-

    tacao de um classificador neural de atributos de textura, baseado em dois tipos

    de redes neurais artificiais integradas: mapa auto-organizavel de Kohonen (SOM) e

    aprendizagem por quantizacao vetorial (LVQ). A capacidade de reconhecer padroes,

    mesmo ao lidar com informacoes ruidosas ou incompletas (HAYKIN, 2001), contribui

    para que as redes neurais artificiais atuem como ferramentas nos mais diversos tipos

    de problemas (FAUSETT, 1994). As redes neurais artificiais tem sido cada vez mais

    usadas no contexto de sensoriamento remoto nos ultimos 10 anos, principalmente

    para classificacao de imagens (TSO; MATHER, 2001).

    Inaugurado em 25 de julho de 2002, o SIVAM (Sistema de Vigilancia da Amazo-

    nia) (http://www.sivam.gov.br) tem o proposito de zelar pela Amazonia Legal

    Brasileira. Esta area, considerada a maior reserva natural do planeta, esta sujeita a

    acoes predatorias realizadas por madeireiras e garimpeiros ilegais, narcotraficantes e

    diversos tipos de ilcito. Na regiao amazonica, as condicoes climaticas frequentemente

    sao caracterizadas por coberturas de nuvens, o que se apresenta como fator restritivo

    a utilizacao de sensores opticos. Assim, os sensores SAR (Synthetic Aperture Radar)

    tem se tornado os principais responsaveis pela obtencao de dados, contribuindo para

    suprir a falta de informacao disponvel sobre esta regiao. O SIVAM dispoe de tres

    aeronaves R-99B equipadas com sensores SAR para gerar imagens radar da regiao.

    Infelizmente, a facilidade em se produzir um grande volume de dados nao e acompan-

    hada pela velocidade de analise dos mesmos e a consequente geracao de resultados

    aplicaveis ao proposito do SIVAM. Portanto, metodologias em Processamento de

    Alto Desempenho devem ser consideradas a fim de otimizar a manipulacao dessa

    grande quantidade de dados.

    Localizado a aproximadamente 400 km de Porto Velho, dentro da Amazonia Legal

    Brasileira1, o municpio de Machadinho dOeste - RO foi escolhido por pesquisadores

    da Embrapa e da organizacao nao-governamental ECOFORCA como objeto de um

    estudo de longo prazo, com o objetivo de obter informacoes que proporcionem su-

    porte aos projetos de sustentabilidade agrcola na Amazonia. Como resultado de uma

    cooperacao tecnica entre a Embrapa Monitoramento por Satelite e o Instituto de

    Estudos Avancados (IEAv) do Centro Tecnico Aeroespacial (CTA), foram adquiri-

    1A Amazonia Legal Brasileira compreende a regiao Norte do Brasil, o estado do Mato Grossoe parte do estado do Maranhao.

    26

    http://www.sivam.gov.br

  • das imagens do municpio pelo sensor SAR da aeronave de sensoriamento remoto

    R99-B do SIVAM, para contribuir na caracterizacao e monitoramento do uso do solo

    e cobertura de terra da regiao.

    Este trabalho tem como objetivo principal avaliar a eficiencia do classificador de-

    senvolvido por Martins (2003) na classificacao da cobertura de terra e uso do solo

    da regiao de Machadinho dOeste - RO, atraves de imagens obtidas por radar de

    abertura sintetica. Dados de uso do solo e cobertura de terra verificados em campo

    foram utilizados como amostras de treinamento para o classificador neural. Devido

    ao alto tempo de execucao gasto para realizar a extracao de atributos de textura das

    imagens, e necessario integrar tecnicas de processamento de alto desempenho a esta

    etapa. Assim, atraves do paralelismo de dados, as amostras e imagens a serem anal-

    isadas sao divididas entre varios processadores, que calculam os vetores de atributos

    independentemente. Este trabalho esta sendo desenvolvido em um cluster baseado

    no conceito de maquinas Beowulf. O ambiente utilizado faz parte do projeto BE-

    LIEVe, desenvolvido no Laboratorio de Engenharia Virtual do Instituto de Estudos

    Avancados (IEAv).

    Este trabalho esta organizado da seguinte maneira. No Captulo 2 sao apresentadas

    as fundamentacoes teoricas que servem como base para o desenvolvimento deste

    trabalho. Sao descritos inicialmente os principais conceitos relacionados as imagens

    obtidas por Radar de Abertura Sintetica; a seguir, discutem-se os temas basicos rel-

    ativos a representacao de texturas, introduzindo a metodologia de extracao de atrib-

    utos de textura por wavelets de Gabor (MANJUNATH; MA, 1996). Para uma melhor

    compreensao desta metodologia, e apresentado um breve resumo sobre a transfor-

    mada de Fourier e a teoria de wavelets. E apresentada tambem, resumidamente, a

    teoria de redes neurais artificiais e sua aplicacao no contexto do reconhecimento de

    padroes em sensoriamento remoto, abordando aspectos especficos relativos as re-

    des utilizadas para implementacao do classificador analisado neste trabalho, SOM e

    LVQ. Finalmente, sao discutidos os conceitos de processamento paralelo, para uma

    melhor compreensao das ferramentas de computacao de alto desempenho utilizadas

    no desenvolvimento desta pesquisa de mestrado.

    O Captulo 3 descreve a area de estudo, os materiais utilizados e a metodologia

    empregada.

    No Captulo 4 sao apresentados e discutidos os resultados obtidos na classificacao

    27

  • das imagens utilizando atributos de textura. Tambem sao apresentados os resultados

    obtidos com a analise de desempenho da implementacao distribuda da extracao de

    atributos de textura.

    No Captulo 5 sao apresentadas as conclusoes e sugestoes de pesquisas futuras.

    28

  • CAPITULO 2

    FUNDAMENTOS TEORICOS

    2.1 Imagens Obtidas por Radar de Abertura Sintetica (SAR)

    A palavra radar, derivada da expressao RAdio Detection And Ranging, e usada para

    denominar sensores que atuam na faixa de microondas do espectro eletromagnetico.

    A faixa de microondas compreende as bandas cuja frequencia varia de 0.3 a 300

    GHz, definindo assim comprimentos de onda entre 1 mm e 1 m (ULABY et al., 1982),

    como mostra a Figura 2.1.

    (a) Espectro de frequencias.

    (b) Faixa de microondas e bandas de radar.

    FIGURA 2.1 - Espectro de frequencias, destacando a faixa de microondas e as bandas de radar.

    Os radares sao instrumentos que transmitem pulsos de microondas a um determinado

    objeto (alvo) e recebem dele um sinal refletido (eco). Com base no tempo decorrido

    entre a transmissao do sinal e seu retorno a antena, alem de outras propriedades do

    eco, e possvel inferir uma serie de informacoes acerca do alvo, como por exemplo

    sua distancia em relacao ao sensor. Os radares se distinguem dos sensores opticos

    por diversas razoes, dentre as quais destacam-se:

    29

  • a) O sinal refletido permite obter informacoes adicionais aquelas obtidas por

    sistemas opticos e termicos, como aspereza e condutividade eletrica do alvo.

    b) As microondas possuem alto poder de penetracao em nuvens e chuvas,

    o que torna os radares ferramentes importantes para o imageamento de

    regioes onde as condicoes meteorologicas se apresentam como fator restri-

    tivo a utilizacao de sensores opticos.

    c) Os radares imageadores sao sitemas ativos1, isto e, independentes da ilumi-

    nacao solar, podendo ser empregados no perodo diurno ou noturno, sem

    perda de desempenho (ULABY et al., 1982). A Figura 2.2 mostra a diferenca

    entre sensores ativos e passivos.

    (a) Radares (sensoresativos).

    (b) Radiometros (sensorespassivos).

    FIGURA 2.2 - Diferenca entre sensores ativos (a) e passivos (b). Sensores passivos dependem de umafonte de energia geralmente o sol que ilumine o alvo para captar a energia refletida.FONTE: Sensing (2002).

    Por essas razoes, e crescente o numero de sistemas SAR (Synthetic Aperture Radar)

    em orbita atualmente, e e provavel que o imageamento por radar exerca um papel

    cada vez mais importante no conhecimento e monitoramento do meio ambiente (TSO;

    MATHER, 2001).

    Entretanto, uma vez que a informacao gerada pelo radar e diferente daquela obtida

    por sensores opticos, e necessario tambem utilizar tecnicas adequadas para tratar este

    tipo de dado. Assim, a pesquisa e o desenvolvimento de novos metodos e ferramen-

    tas especficas tem se tornado essenciais para possibilitar a analise dessa informacao.

    1Sensores de microondas passivos (radiometros) detectam a radiacao de microondas gerada peloalvo.

    30

  • Diversos trabalhos tem sido realizados nesta direcao, especialmente voltados para

    tratar imagens SAR de regioes tropicais, como a Amazonia. Oliver (2000) propoe a

    aplicacao de metodos de segmentacao a atributos de textura para classificar areas

    da Amazonia entre as categorias floresta e nao-floresta, utilizando imagens do Par-

    que Nacional de Tapajos. Komarov et al. (1999) associa tecnicas de redes neurais

    artificiais a atributos de textura estatsticos para classificar regioes de floresta us-

    ando imagens SAR. Em Dutra et al. (2003), investiga-se a utilizacao da metodologia

    InSAR (Interferometria SAR) associada ao uso de conjuntos de imagens SAR obtidas

    de uma mesma regiao, num pequeno intervalo de tempo, como auxlio a obtencao de

    modelos de elevacao dos terrenos imageados. A eficacia de metodos supervisionados

    multidimensionais na classificacao de imagens SAR do SIVAM pre-processadas por

    filtros para reducao de speckle2 e avaliada por Maximo e Fernandes (2005).

    2.1.1 Geometria de Aquisicao de Imagens SAR

    O radar de abertura sintetica foi projetado por Carl Wiley em 1952 com a finalidade

    de melhorar a resolucao de radares aerotransportados (ULABY et al., 1982). Para isso,

    o tamanho da antena e sinteticamente aumentado, isto e, atraves de uma complexa

    tecnologia, modifica-se o processamento do sinal de forma a simular uma antena

    fisicamente longa. Assim, alem da reducao do tamanho real da antena, obtem-se

    como resultado uma melhor resolucao da imagem, independente da distancia entre

    o radar e o alvo, tornando viavel seu uso tanto em aeronaves quanto em espaconaves.

    O processo de aquisicao das imagens baseia-se na geometria de visada lateral, carac-

    terstica dos sensores SLAR (Side Looking Airbone Radar). Esta tecnica foi desen-

    volvida para solucionar o problema da ambiguidade presente nos radares de visada

    vertical. Este problema ocorre quando ecos provenientes de diferentes alvos tem suas

    posicoes confundidas em funcao da recepcao simultanea dos mesmos pelo sistema

    sensor, como mostra a Figura 2.3.

    O sistema SLAR transmite e recebe energia na forma de microondas usando uma

    antena fixada na lateral da aeronave. A area imageada e, entao, uma faixa do solo

    paralela a trajetoria do voo (denominada direcao azimutal). A resolucao das imagens,

    que corresponde a area iluminada pelo pulso do radar num dado instante de tempo,

    depende principalmente da duracao do pulso e do raio da antena. A duracao do

    pulso afeta a resolucao transversal, enquanto a largura do raio da antena controla a

    2Speckle e um tipo de rudo caracterstico de imagens SAR, que sera descrito na Subsecao 2.1.4.

    31

  • FIGURA 2.3 - A ambiguidade no imageamento por radar com visada vertical.FONTE: Adaptado de Ulaby et al. (1982)

    resolucao azimutal, como pode ser observado nas Equacoes 2.1 e 2.2 (TSO; MATHER,

    2001).

    t =c

    2sin ; (2.1)

    a = R . (2.2)

    Onde t e a indicam, respectivamente, as resolucoes transversal3 e azimutal; c cor-

    responde a velocidade da luz; e a duracao do pulso; indica a largura horizontal

    do feixe; e R corresponde a distancia do sensor a linha de visada. O angulo de in-

    cidencia ou angulo de visada e definido como o angulo entre a direcao da energia

    emitida e uma linha perpendicular a superfcie imageada (Figura 2.4).

    O angulo de depressao () e complementar ao angulo de incidencia (), se assumir-

    mos que a superfcie imageada seja plana. A largura horizontal do feixe () esta

    relacionada ao tamanho da antena (l) e ao comprimento de onda (), como pode-

    mos ver na Equacao 2.3.

    =

    l. (2.3)

    3A resolucao transversal nada mais e do que a projecao da resolucao na linha de visada no solorLV = c2 (ULABY et al., 1982).

    32

  • FIGURA 2.4 - Alguns parametros basicos de um sistema SLAR.FONTE: Adaptado de Ulaby et al. (1982)

    Pode-se inferir da Equacao 2.1 que quanto mais curta for a duracao do pulso, mel-

    hor sera a resolucao transversal. Essa dependencia, porem, carrega uma limitacao:

    quanto mais curto o pulso, maior a potencia de pico exigida pelo sistema para que

    se mantenha a mesma potencia media.

    A distancia da linha de visada (R) e dada por:

    R =h

    cos , (2.4)

    onde h e a altura de voo. Substituindo R na Equacao 2.2, tem-se:

    a =h

    cos . (2.5)

    Assim, gracas aos parametros sin e cos , as resolucoes em azimute e transversal sao

    funcao do angulo de incidencia () e, consequentemente, da linha de visada. Logo,

    t e degradada nas distancias menores, enquanto a e degradada nas distancias

    33

  • maiores. Isso faz com que a forma do pixel seja alongada na direcao transversal

    para pequenas distancias e na direcao longitudinal para longas distancias (DAMIAO;

    MAXIMO, 1998).

    Para os sistemas SAR, as resolucoes transversal e em azimute sao calculadas de forma

    distinta da apresentada anteriormente. Os sistemas de abertura sintetica utilizam,

    em geral, pulsos de frequencia modulada (chirpped pulses), a fim de obter uma

    melhor resolucao transversal sem, entretanto, ter que recorrer a pulsos muito curtos.

    Assim, para imagens SAR, a resolucao transversal e calculada de acordo com a

    Equacao 2.6:

    t =c

    2Bsin , (2.6)

    onde B e a largura de banda do pulso modulado linearmente em frequencia e que

    pode ser tao larga quanto necessaria, sem que para isso seja requerida uma grande

    potencia de pico. A resolucao em azimute, por sua vez, independe teoricamente da

    distancia entre a antena e o alvo, devido a construcao da antena sintetica. A melhor

    resolucao em azimute sintetica potencial (ap) e apresentada na Equacao 2.7.

    ap =L

    2. (2.7)

    As deducoes matematicas para a equacao acima podem ser encontradas em Ulaby

    et al. (1982). Elas nao serao apresentadas aqui, pois seu nvel de complexidade foge

    ao escopo deste trabalho.

    2.1.2 Equacao do Radar

    Equacao do radar e o nome dado a relacao entre as caractersticas do radar, do alvo

    e do sinal recebido pelo sensor (ULABY et al., 1982). Ha diversas formas de apresentar

    esta equacao, em funcao do tipo de radar utilizado ou do parametro tomado como

    referencia. Se assumirmos que a antena de transmissao e a mesma de recepcao, o

    radar e dito monostatico e a equacao do radar pode ser escrita nas seguintes formas:

    Pr =PtA

    2e

    42R4, (2.8)

    34

  • definindo Pr em termos de area da antena, ou:

    Pr =PtG

    22

    (4)3R4, (2.9)

    definindo Pr em termos de ganho da antena. Onde:

    Pr e a potencia irradiada na direcao do radar;

    Pt a potencia transmitida pelo radar;

    Ae e a area efetiva da antena;

    e a secao transversal radar do alvo;

    e o comprimento de onda do sinal;

    R e a distancia entre o alvo e o radar;

    G e o ganho da antena.

    O ganho da antena corresponde a medida da potencia que e aumentada na direcao

    do alvo se comparada com a potencia que seria irradiada por uma antena isotropica

    (omnidirecional). Radares geralmente usam antenas anisotropicas (diretivas), para

    canalizar o maximo da potencia transmitida Pt em alguma direcao particular. Dentre

    os parametros apresentados acima, apenas esta relacionado as propriedades da

    superfcie imageada, determinando portanto o comportamento deste alvo frente a

    um sistema de radar. Quando um alvo e iluminado pelo radar, parte da potencia

    incidente tende a se espalhar em todas as direcoes, enquanto outra parte retorna

    na direcao do radar. Tal fenomeno e definido como retroespalhamento e e uma

    funcao complexa de parametros fsicos do alvo. A forma, o tamanho e o material do

    alvo sao fatores determinantes para o retroespalhamento da onda eletromagnetica.

    Para simplificar o equacionamento, todos esses fatores sao aglutinados em um unico

    parametro , definido como a secao transversal do alvo. A descricao detalhada deste

    parametro e dos fatores que o influenciam pode ser encontrada em Ulaby et al.

    (1982).

    2.1.2.1 Efeitos Geometricos sobre a Imagem SAR

    Alguns fatores inerentes a geometria de aquisicao descrita acima podem afetar as

    propriedades das imagens de modo a interferir na sua interpretacao. As distorcoes

    35

  • geometricas mais comuns presentes nas imagens radar serao brevemente descritas

    nesta secao.

    Sombreamento (Shadowing)

    Uma imagem radar e efetivamente uma representacao dos nveis de energia refletidos

    por um alvo relacionados ao tempo decorrido entre a emissao da energia pela antena

    e seu retorno a mesma. O efeito sombreamento corresponde a ausencia de informacao

    sobre uma determinada area da imagem que fica oculta pela encosta de um objeto,

    e e determinado pela altura do objeto e pelo angulo de depressao (TSO; MATHER,

    2001). A Figura 2.5 mostra como estes parametros podem distorcer o imageamento.

    No objeto A, o angulo b e menor do que o angulo de depressao correspondente 1.

    Consequentemente, a encosta do objeto A e iluminada pela energia de microondas.

    Entretanto, uma vez que o angulo b do objeto B e maior do que o angulo de

    depressao correspondente 2, a antena do radar nao recebera nenhum sinal da regiao

    localizada atras do alvo, gerando uma area de refletividade zero ate que o ponto a

    seja atingido.

    FIGURA 2.5 - A relacao entre o angulo de depressao e o efeito sombreamento sobre a imagem SAR.FONTE: Adaptado de Tso e Mather (2001)

    E possvel solucionar este problema atraves do princpio da visada dupla, que consiste

    na aquisicao de imagens a partir de duas direcoes diferentes de visada. A obtencao

    de imagens sob perspectivas distintas gera um maior volume de dados disponveis,

    revelando informacoes (especialmente feicoes lineares) que nao sao aparentes numa

    36

  • imagem de visada simples (DAMIAO; MAXIMO, 1998).

    Encurtamento (Foreshortening)

    A natureza do terreno causa ainda outros efeitos sobre a interpretacao da imagem

    relacionados a variacao da altura do terreno. Numa superfcie perfeitamente plana,

    os elementos mais proximos do ponto sub-nadir seriam iluminados pelo feixe radar

    e refletiriam o sinal antes daqueles elementos mais afastados. Os sinais, portanto,

    seriam refletidos progressivamente no tempo da menor para a maior linha de visada.

    Um elemento mais elevado do que os vizinhos, no entanto, devera interceptar o

    pulso radar mais cedo, logo sera projetado na imagem numa posicao mais proxima

    do ponto sub-nadir do que realmente esta. A Figura 2.6 mostra como este efeito

    provoca um encurtamento aparente, no plano da imagem radar, das encostas cuja

    parte inclinada esta voltada para o radar, ou seja, a encosta CD aparece encurtada

    na imagem como C D (DAMIAO; MAXIMO, 1998).

    FIGURA 2.6 - Os efeitos de inversao e encurtamento sobre a imagem SAR.FONTE: Adaptado de Damiao e Maximo (1998)

    37

  • Inversao (Layover)

    O efeito de inversao faz com que o topo de um alvo imageado seja visto pelo radar

    como a base, e a base seja registrada como o topo do objeto. Este fenomeno ocorre

    em casos extremos de encurtamento, quando o sinal leva menos tempo para ir da

    antena ao topo do alvo do que a sua base. Como mostra a Figura 2.6, a inversao so

    ocorre quando o angulo formado entre o caminho da energia e a encosta frontal do

    objeto e maior do que 90 (TSO; MATHER, 2001).

    2.1.3 Polarizacao

    O retroespalhamento do sinal pode ainda ser influenciado pela polarizacao da onda

    incidente, relacionada as propriedades eletromagneticas e geometricas do alvo. A

    polarizacao descreve a orientacao do campo eletrico de uma onda eletromagnetica,

    que pode ser do tipo linear, circular ou elptica. A maioria dos sistemas de radar

    polarizam a energia lineamente, restringindo o campo eletrico a um plano fixo per-

    pendicular a direcao de propagacao da onda Figura 2.7. A onda polarizada e entao

    transmitida e recebida no plano horizontal (H) ou no plano vertical (V), possibil-

    itando quatro combinacoes de transmissao e recepcao: HH, VV, HV e VH, onde

    a primeira e a segunda letra indicam, respectivamente, a polarizacao da radiacao

    transmitida e a polarizacao da radiacao recebida pela antena. Polarizacoes cruzadas

    (HV e VH) geralmente produzem ecos mais fracos do que aqueles gerados por config-

    uracoes paralelas (HH e VV). Em sensoriamento remoto, e comum o uso de radares

    multipolarimetricos, capazes de coletar dados em qualquer uma das quatro combi-

    nacoes possveis.

    FIGURA 2.7 - Microondas polarizadas.

    38

  • 2.1.4 Reducao de Speckle

    Devido ao mecanismo de imageamento inerente, as imagens SAR sao comumente

    corrompidas por um rudo conhecido como speckle, provocando uma distorcao ra-

    diometrica cujo efeito visual e a aparencia granulosa caracterstica deste tipo de

    imagem, como pode ser observado na Figura 2.8. O speckle e causado pela inter-

    ferencia entre ondas refletidas de microscopicos difusores dentro de cada celula de

    resolucao, e e geralmente modelado como um rudo multiplicativo, ou seja, propor-

    cional a intensidade do sinal recebido.

    FIGURA 2.8 - Imagem SAR distorcida por rudo speckle.

    O efeito do speckle pode ser diminudo aplicando-se alguma forma de pre-

    processamento sobre a imagem, melhorando, assim, os resultados de uma classi-

    ficacao posterior. Duas abordagens podem ser adotadas com esta finalidade: pro-

    cessamento de multiplas visadas ou processamento multilook, e filtragem espacial.

    A primeira tecnica e incorporada ao processo de geracao da imagem, enquanto a

    39

  • segunda consiste na aplicacao de filtros sobre a imagem ja formada.

    2.1.4.1 Processamento Multilook

    O processamento multilook consiste em dividir a abertura da antena em varias sub-

    aberturas, cada qual proporcionando uma visada (look) independente sobre a su-

    perfcie iluminada Figura 2.9. A imagem final e obtida calculando-se a media entre

    as imagens geradas por cada visada (SENSING, 2002).

    FIGURA 2.9 - Processamento multilook.FONTE: Sensing (2002).

    Embora o processamento multilook seja capaz de reduzir o efeito do rudo, ele tam-

    bem provoca a degradacao da resolucao espacial da imagem, proporcionalmente ao

    numero de visadas escolhido.

    2.1.4.2 Filtragem Espacial

    Os filtros para reducao de speckle podem ser de dois tipos: adaptativos ou nao-

    adaptativos. As tecnicas nao-adaptativas nao levam em consideracao propriedades

    locais do terreno imageado, bem como caractersticas relacionadas a natureza do

    sensor. Por essa razao, nao sao recomendadas quando se deseja preservar o maximo

    de informacao sobre a imagem de entrada. Sao exemplos conhecidos de filtros nao-

    adaptativos o filtro da Media e o da Mediana.

    Nos filtros adaptativos, o grau de suavizacao se adapta a medidas estatsticas locais

    sobre o restroespalhamento do terreno, preservando melhor detalhes como bordas e

    40

  • areas de textura elevada (SENSING, 2002). Diversos metodos de filtragem tem sido

    propostos na tentativa de proporcionar maior reducao de speckle associada a perda

    mnima de informacao, como os filtros de Lee, Frost e RGMAP.

    Filtro de Lee. Transforma o modelo multiplicativo em aditivo atraves de uma lin-

    earizacao por expansao em serie de Taylor, aplicada sobre a multiplicacao

    do sinal e do rudo em torno da media, eliminando, assim, a dependencia

    entre o rudo e o valor do pixel (SANTANNA et al., 2001). O sinal sem rudo

    e dado pela soma ponderada do valor do pixel observado (central) e do valor

    da media. O coeficiente de ponderacao e uma funcao da heterogeneidade

    local do alvo, medido atraves do coeficiente de variacao (SENSING, 2002).

    Utiliza estatsticas locais para minimizar o erro quadratico medio atraves

    do filtro de Wiener.

    Filtro de Frost. E um filtro convolucional linear, derivado da minimizacao do erro

    quadratico medio sobre o modelo multiplicativo do rudo (SANTANNA et al.,

    2001). Estima-se o valor do sinal livre de speckle utilizando uma sub-janela

    da janela de processamento, cujo tamanho varia em funcao da heterogenei-

    dade local do alvo, medida atraves do coeficiente de variacao (SENSING,

    2002).

    Filtro MAP Gama (Maximum a Posteriori Gama). Baseia-se na premissa

    de que o sinal livre de rudo da cena subjacente obedece a distribuicao

    Gama. Assim, o valor do pixel e obtido maximizando-se a funcao den-

    sidade de probabilidade a posteriori (Gama) com relacao ao sinal real.

    Dentro de cenas conhecidamente bem modeladas pela distribuicao Gama,

    como oceanos, florestas e areas agrcolas, e capaz de minimizar a perda de

    informacao textural melhor do que os filtros de Frost e de Lee (SENSING,

    2002).

    2.2 Atributos de Textura

    A interpretacao e analise de imagens e realizada com base em atributos espectrais

    e espaciais. Entendem-se por espectrais os atributos que descrevem a tonalidade

    (variacao do nvel de cinza) de um dado pixel em uma imagem, enquanto os atributos

    espaciais refletem a distribuicao espacial de tonalidades dentro de uma regiao da

    imagem. Ha dois tipos de relacao espacial: a textura, focada no objeto de interesse,

    41

  • representando sua estrutura; e o contexto, que analisa o objeto em relacao ao restante

    da cena.

    Em termos visuais, Tso e Mather (2001) descrevem a textura como a impressao de

    aspereza ou suavidade criada pela variacao de tonalidade ou repeticao de padroes

    atraves de uma superfcie. Segundo Haralick (1979), a textura esta presente em todo

    tipo de imagem, desde aquelas obtidas por satelites e aeronaves ate microscopicas

    imagens de culturas celulares ou amostras de tecido. No contexto de sensoriamento

    remoto, atributos de textura mostram-se eficazes ao atuar como informacoes auxil-

    iares na caracterizacao de classes, melhorando muitas vezes o resultado da classifi-

    cacao.

    (a) Padrao regular. (b) Padrao irregular.

    FIGURA 2.10 - Exemplos de textura.FONTE: Wu et al. (2000)

    A textura tem sido incorporada a classificadores de imagens SAR na expectativa de

    melhorar seu desempenho, especialmente para distinguir objetos de mesma tonali-

    dade ou cor. A crescente importancia e utilidade da textura em metodos de classi-

    ficacao de imagens SAR pode ser observada pelo grande numero de trabalhos de-

    senvolvidos nesta area nos ultimos anos (DOBSON et al., 1997; KOMAROV et al., 1999;

    DEKKER, 2001; GARCIA; PUIG, 2002; FLETCHER; EVANS, 2002; ACQUA; GAMBA,

    2003; KUPLICH et al., 2005; KANDASWAMY et al., 2005).

    2.2.1 Metodos para Extracao de Atributos de Textura

    As medidas de media e variancia sao definidas como os atributos mais simples que

    podem ser usados para caracterizar texturas de uma dada regiao (TSO; MATHER,

    42

  • 2001). E possvel, no entanto, encontrar diferentes padroes de textura que apresen-

    tem a mesma media e variancia, mostrando que estes descritores nao sao suficientes

    para analise textural, e formalismos mais abrangentes sao necessarios. Neste con-

    texto, diversos metodos tem sido propostos na literatura, e embora nao haja uma

    definicao operacional ou formulacao matematica precisa para quantificar as medidas

    de textura de uma imagem, as principais abordagens dividem-se em quatro catego-

    rias: dimensoes fractais e multifractais; matriz de co-ocorrencia; campo randomico

    auto-regressivo multiplicativo; e filtragem no domnio da frequencia (TSO; MATHER,

    2001). A primeira utiliza o conceito de dimensao fractal como medida para a quan-

    tificacao da textura; superfcies complexas (alta dimensao multifractal) representam

    texturas grosseiras, enquanto superfcies simples (suaves) possuem textura mais fina.

    O modelo baseado em matriz de co-ocorrencia define a informacao textural atraves

    da dependencia espacial entre os nveis de cinza de uma imagem. Em texturas gros-

    seiras, observa-se uma ligeira mudanca na distribuicao dos valores espectrais numa

    determinada distancia, enquanto em texturas finas a distribuicao muda rapidamente.

    Nas tecnicas baseadas em campo randomico auto-regressivo multiplicativo (MAR

    Multiplicative Autoregressive Random Fields), a textura e caracterizada pela uti-

    lizacao de estimativas lineares do nvel de cinza de um pixel relacionado aos nveis

    de cinza de sua vizinhanca. Os coeficientes possuem grande variacao em regioes de

    texturas finas, enquanto texturas grosseiras apresentam coeficientes similares.

    Os metodos que aplicam a filtragem no domnio da frequencia tem apresentado bons

    resultados na tentativa de extrair informacoes de textura (TSO; MATHER, 2001).

    Em geral, texturas finas estao associadas a altas frequencias espaciais, enquanto

    em texturas grosseiras as frequencias baixas sao dominantes. Ha muitos algoritmos

    disponveis com o objetivo de transformar dados de imagem do domnio espacial para

    o domnio da frequencia, sendo o mais conhecido deles a transformada de Fourier,

    que decompoe um sinal em um conjunto de funcoes senos e cossenos com diferentes

    frequencias (MYLER; WEEKS, 1993). A metodologia adotada neste trabalho para

    extracao de atributos de textura nas imagens baseia-se na teoria de filtros Gabor.

    Para uma melhor compreensao desta teoria, uma breve descricao da transformada

    de Fourier e da transformada wavelet e apresentada a seguir.

    43

  • 2.2.2 A Transformada Discreta de Fourier

    As transformacoes matematicas sao aplicadas a sinais para extrair informacoes que

    nao sao perceptveis de forma direta (MARTINS, 2003). Uma melhor visualizacao

    dos dados a fim de realcar determinadas caractersticas de interesse requer, muitas

    vezes, a mudanca do domnio temporal ou espacial para o domnio da frequencia.

    Em 1822, com o objetivo inicial de descrever a conducao de calor e determinar

    a distribuicao de temperatura ao longo de uma lamina, o matematico frances Jean

    Baptiste Joseph Fourier criou o conceito de series de Fourier, mostrando que qualquer

    funcao periodica pode ser representada como uma soma de funcoes trigonometricas.

    Desde entao, a analise de Fourier tem revolucionado os mais diversos campos da

    ciencia e engenharia, da radioastronomia a medicina (PRESS et al., 1992).

    Uma extensao a serie de Fourier, a transformada de Fourier permite representar

    funcoes nao-periodicas, ampliando assim a quantidade de aplicacoes possveis. De

    maior relevancia no contexto de processamento digital de imagens, a versao discreta

    da transformada de Fourier (DFT - Discrete Fourier Transform) e definida sobre

    uma grade discreta de pixels de uma imagem I = I(m,n) (SEUL et al., 2000), de

    acordo com a Equacao 2.10.

    F (u, v) =1

    MN

    M1m=0

    N1n=0

    I(m,n) exp[i2

    (umM

    +vn

    N

    )], (2.10)

    onde F (u, v) corresponde a representacao no domnio da frequencia de I(m,n); i =1; u e v sao as amostras correspondentes em frequencia as amostras espaciais

    m e n. A faixa nos dois domnios e a mesma: 0 m M 1, 0 n N 1 e0 u M 1, 0 v N 1. A DFT inversa e dada por:

    I(m,n) =1

    MN

    M1u=0

    N1v=0

    F (u, v) exp[i2(umM

    +vn

    N

    )]. (2.11)

    O conceito de frequencia em uma imagem pode ser facilmente interpretado pela

    observacao dos detalhes espaciais ali contidos. A Figura 2.11 ilustra o conceito

    de frequencia espacial atraves de duas figuras, com conjuntos periodicos de ondas

    quadradas em duas frequencias espaciais distintas. A razao periodica das listras da

    Figura 2.11(a) e de 2 ciclos/cm, contra 1 ciclo/cm na Figura 2.11(a).

    44

  • (a) (b)

    FIGURA 2.11 - Exemplo de imagens de diferentes frequencias.FONTE: Adaptado de Myler e Weeks (1993).

    A Transformada Rapida de Fourier (FFT Fast Fourier Transform) consiste

    numa implementacao eficiente da DFT, que pelo uso da estrategia dividir-para-

    conquistar4, e capaz de reduzir a complexidade computacional da DFT da ordem

    de N2 para apenas N log2N operacoes (GERSHENFELD, 1999). Em uma imagem de

    1024 x 1024 pixels, isso equivale a um ganho de 10:1 (SEUL et al., 2000). A trans-

    formada de Fourier e normalmente usada para filtragem no domnio da frequencia

    atraves da aplicacao sucessiva da FFT direta e inversa. Na primeira etapa, a imagem

    e transformada para o domnio da frequencia usando a FFT. O sinal em frequencia

    e entao filtrado, e em seguida submetido a FFT inversa para voltar ao domnio es-

    pacial, obtendo assim a imagem modificada. O diagrama em blocos deste processo

    e apresentado na Figura 2.12.

    FIGURA 2.12 - Diagrama em blocos do processo de filtragem no domnio da frequencia.

    Em muitas aplicacoes, porem, nao basta conhecer as componentes em frequencia

    contidas no sinal, mas tambem a localizacao no domnio espacial (ou temporal) em

    que ocorre cada uma delas. Isso torna a transformada de Fourier inadequada para

    4No contexto de projeto de algoritmos, a abordagem dividir-para-conquistar consiste em di-vidir um problema de difcil solucao sucessivamente em subproblemas menores, resolve-los recursi-vamente, e entao combinar estas solucoes para encontrar a resposta para o problema original (AHOet al., 1974).

    45

  • tratar sinais do tipo nao-estacionario, ou seja, cujo conteudo em frequencia varia com

    o tempo. Com o intuito de superar esta limitacao, Dennis Gabor, em 1946, adaptou

    a transformada de Fourier para analisar somente uma pequena porcao de um sinal

    de cada vez, criando uma tecnica chamada janelamento (windowing) do sinal, como

    mostra a Figura 2.13. A adaptacao de Gabor, chamada de Transformada de Fourier

    por Janelamento (Short-Time Fourier Transform STFT), mapeia o sinal em uma

    funcao bidimensional de tempo e frequencia (STARCK et al., 1998).

    (a)

    (b)

    FIGURA 2.13 - Exemplo de transformacao FT e STFT.FONTE: Adaptado de Misiti et al. (2006).

    Embora esta relacao entre a informacao do tempo e a frequencia obtida pela STFT

    seja bastante util, sua precisao e limitada pelo tamanho da janela, fixo para todo o

    conteudo em frequencias. Muitos sinais requerem uma avaliacao mais flexvel, com

    a possibilidade de variar o tamanho da janela para determinar a relacao entre o

    intervalo de tempo e a frequencia com melhor precisao (MISITI et al., 2006). Nesta

    situacao, a transformada wavelet pode ser mais apropriada.

    46

  • 2.2.3 Wavelets

    Atraves da aplicacao de janelas de tempo com tamanhos variaveis na decomposicao

    de um sinal, a analise por wavelets permite o uso de longos intervalos de tempo para

    verificar com mais precisao informacoes de baixa frequencia, ou de intervalos de

    tempo menores quando se deseja maior precisao em informacoes de alta frequencia

    (GERSHENFELD, 1999).

    O termo wavelet refere-se a um conjunto de funcoes em forma de pequenas ondas

    geradas por dilatacoes e translacoes de uma funcao simples (t) denominada wavelet-

    mae. A definicao da transformada wavelet contnua (CWT Continuous Wavelet

    Transform) e dada por:

    W (a, b) =1a

    inf inf

    f(t) (t ba

    )dx , (2.12)

    onde os parametros a(> 0) e b correspondem as informacoes de escala e posicao,

    respectivamente. A Figura 2.14 representa graficamente a decomposicao de um sinal

    por wavelets de escalas e posicoes diferentes.

    FIGURA 2.14 - Sinal decomposto em wavelets de diferentes escalas e posicoes.FONTE: Misiti et al. (2006)

    O fator escala esta relacionado com a frequencia do sinal e consequentemente com

    a capacidade da funcao wavelet em identificar detalhes finos ou grosseiros de um

    sinal (MISITI et al., 2006). Pequenas escalas correspondem a wavelets comprimidas,

    capazes de detectar melhor pequenos detalhes e variacoes rapidas, enquanto escalas

    maiores esticam as wavelets, proporcionando melhor representacao para feicoes

    grosseiras e variacoes lentas, como mostra a Figura 2.15.

    Depois de consolidada a teoria da transformada wavelet, muitos pesquisadores

    47

  • FIGURA 2.15 - Efeito da alteracao de escala em uma wavelet.FONTE: Adaptado de Misiti et al. (2006)

    comecaram a estudar a aplicacao de wavelets a representacao de texturas (MAR-

    TINS, 2003). Ao avaliar o desempenho de atributos de textura extrados por difer-

    entes transformadas wavelet, incluindo ortogonais e nao-ortogonais, tipo arvore es-

    truturada e transformada de Gabor, Manjunath e Ma (1995) observaram melhor

    representacao para os padroes de teste quando aplicada a transformada wavelet de

    Gabor. A utilizacao de bancos de filtros Gabor para extracao de atributos de textura

    e descrita a seguir.

    2.2.4 Filtros Gabor

    Pesquisas em psicologia mostram que o cerebro humano realiza uma analise em

    frequencia das imagens, e celulas simples no cortex visual podem ser modeladas

    mediante as funcoes Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta

    propriedade, associada ao fato de as wavelets Gabor serem melhor localizadas no

    tempo e na frequencia e apresentarem maior numero de parametros, torna as funcoes

    Gabor especialmente apropriadas para a representacao de caractersticas locais das

    imagens (CASTANON, 2003).

    Em duas dimensoes, a funcao Gabor g(x, y) e sua transformada de Fourier G(u, v)

    podem ser escritas como:

    g(x, y) =

    (1

    2xy

    )exp

    [1

    2

    (x2

    2x+y2

    2y

    )+ i2Wx

    ], (2.13)

    48

  • G(u, v) = exp

    {1

    2

    [(uW )2

    2u+v2

    2v

    ]}, (2.14)

    onde u = 1/2x e v = 1/2y. As funcoes Gabor formam um conjunto base

    completo (nao-ortogonal), que e usado para expandir o sinal, obtendo assim sua

    descricao em frequencia local. Um banco (ou dicionario) de filtros Gabor pode ser

    construdo atraves de dilatacoes e rotacoes apropriadas da wavelet mae g(x, y), a

    partir da funcao geradora:

    gmn(x, y) = amG(x, y), a > 1, m, n = integer , (2.15)

    onde:

    x = am(x cos + y sin ) , (2.16)

    y = am(x sin + y cos ) , (2.17)

    onde = n/K e K e o numero total de orientacoes e am e o fator escala. A

    nao-ortogonalidade das wavelets Gabor implica que ha informacao reduntante nas

    imagens filtradas. Para reduzir esta redundancia, Manjunath e Ma (1996) definem

    uma estrategia de geracao de bancos de filtros Gabor, assegurando que os suportes

    de magnitude de pico medio (half-peak) das respostas do banco de filtros no espectro

    de frequencia tangenciem uns aos outros, como mostra a Figura 2.16.

    O processo de eliminacao de redundancia e produto da utilizacao das seguintes

    formulas no calculo dos parametros u e v (e, por consequencia, x e y):

    a = (Uh/Ul)1/(S1) , (2.18)

    u =(a 1)Uh

    (a 1)

    2 ln 2, (2.19)

    49

  • FIGURA 2.16 - Banco de filtros ortogonais, apos aplicar a tecnica de eliminacao de redundancia.FONTE: Adaptado de Manjunath e Ma (1996)

    v = tan(

    2k

    )[Uh 2 ln 2

    (2uUh

    )][2 ln 2 (2 ln 2)

    22uU2h

    ]1/2, (2.20)

    onde Ul e Uh correspondem aos centros inferior e superior de frequencias de interesse,

    S corresponde ao numero de escalas na decomposicao em multirresolucao, e m =

    0, 1, 2, . . . , S 1.

    Para construir um banco ou dicionario de filtros, inicialmente e escolhido um inter-

    valo de frequencias de interesse atraves da determinacao de dois valores de referencia:

    frequencia superior e inferior. O segundo passo e determinar o numero de orientacoes

    desejadas e em quantas escalas diferentes o intervalo de frequencia sera decomposto.

    No dicionario de filtros representado pela Figura 2.16, os parametros usados sao: fre-

    quencia superior Uh = 0.4; frequencia inferior Ul = 0.05; 6 orientacoes; e 4 escalas.

    2.2.5 Representacao da Textura por Vetores de Atributos

    Dada uma imagem I, e o banco de filtros Gabor gmn, a transformada Gabor em

    (x, y) e definida por:

    50

  • Wmn(x, y) =

    I(x, y)gmn (x x1, y y1)dx1dy1 , (2.21)

    onde indica o complexo conjugado. Com a aplicacao de filtros Gabor sobre ospadroes de textura, a geracao dos vetores de atributos e realizada atraves do calculo

    de medidas estatsticas da imagem filtrada. As medidas estatsticas utilizadas sao a

    media (mn) e o desvio padrao (mn) da magnitude dos coeficientes da transformada,

    definidas por:

    mn =

    |Wmn(xy)|dxdy , (2.22)

    mn =

    (|Wmn(xy)| mn)2 dxdy , (2.23)

    Para cada filtro aplicado, os dados estatsticos de media e desvio padrao sao calcu-

    lados e concatenados para a formacao do vetor de atributos daquela textura. Neste

    trabalho, foi utilizado um banco de filtros Gabor de quatro escalas e seis orientacoes.

    Desta forma, os vetores de atributos resultantes tem a seguinte forma:

    f = [11111212 . . . 4646] , (2.24)

    onde op e op denotam, respectivamente, os valores da media e do desvio padrao no

    estagio o e orientacao p. Um banco de filtros Gabor de quatro escalas e seis orien-

    tacoes possui vinte e quatro filtros para cada medida. Como a informacao textural

    e representada por duas medidas, entao o vetor de atributos possui quarenta e oito

    elementos: dois parametros para cada filtro (MARTINS, 2003).

    2.3 Classificadores Baseados em Redes Neurais Artificiais

    A classificacao no contexto de sensoriamento remoto consiste em associar cada objeto

    ou pixel de uma area em estudo a um ou mais elementos de um conjunto de rotulos

    definido pelo usuario, convertendo a informacao numerica contida na imagem a uma

    informacao tematica, como um determinado tipo de vegetacao (TSO; MATHER, 2001).

    Este processo pode ser visto como uma funcao de mapeamento, que constroi uma

    51

  • associacao entre os dados brutos e o conjunto de rotulos definido pelo usuario, como

    mostra a Figura 2.17. Uma imagem de sensoriamento remoto totalmente classificada

    e chamada de mapa tematico, pois possibilita a identificacao geografica das classes

    sobre a superfcie imageada. (CROSTA, 1992).

    FIGURA 2.17 - O conceito do classificador como uma conexao entre uma imagem (a esquerda) e umconjunto de rotulos de classe (a direita).FONTE: Adaptado de Tso e Mather (2001)

    Por mais de uma decada, o reconhecimento de padroes em imagens de sensoriamento

    remoto tem se baseado principalmente em tecnicas estatsticas convencionais, como

    os procedimentos de maxima probabilidade e distancia mnima. Embora as abor-

    dagens tradicionais possam apresentar bom desempenho, sua habilidade geral para

    resolver confusoes inter-classes e limitada. Nos ultimos anos, estrategias alternativas

    tem sido propostas, como o uso de redes neurais artificiais, arvores de decisao e meto-

    dos derivados da teoria dos conjuntos nebulosos (Fuzzy Set Theory) (TSO; MATHER,

    2001). A capacidade de reconhecer padroes, mesmo ao lidar com informacoes rui-

    dosas ou incompletas (HAYKIN, 2001), contribui para que as redes neurais artificiais

    possam atuar como ferramentas nos mais diversos tipos de problemas (FAUSETT,

    1994). No contexto de sensoriamento remoto, seu uso vem crescendo nos ultimos

    52

  • dez anos, principalmente para classificacao de imagens (TSO; MATHER, 2001).

    2.3.1 Fundamentos de Redes Neurais Artificiais

    O desenvolvimento da teoria de Redes Neurais Artificiais comecou ha aproximada-

    mente 50 anos, motivado pelo desejo de tentar entender e ao mesmo tempo imitar

    o cerebro e algumas de suas habilidades (FAUSETT, 1994). Desde entao, cientistas

    tem se empenhado em criar novas tecnicas, alem de aperfeicoar aquelas ja existentes,

    com o objetivo de expandir as areas de aplicabilidade da Neurocomputacao. Embora

    a plausibilidade biologica dos modelos computacionais seja considerada por alguns

    pesquisadores menos importante do que sua capacidade de desempenhar as tarefas

    desejadas, uma breve introducao sobre as caractersticas basicas dos sistemas neu-

    rais biologicos pode ajudar no entendimento dos principais fundamentos envolvidos

    no projeto de uma rede neural artificial.

    Em termos moleculares, o neuronio e a unidade fundamental do sistema nervoso

    central, por ser o componente responsavel por produzir e conduzir as informacoes que

    nele circulam. Os neuronios (ou celulas nervosas) possuem configuracoes variadas de

    acordo com sua funcao e regiao a que pertencem, porem obedecem a uma estrutura

    geral, que consiste de tres componentes basicos, como mostra a Figura 2.18. O corpo

    celular ou soma constitui o nucleo da celula e suas organelas. Os dendritos consistem

    em um grande numero de pequenos prolongamentos do corpo celular, atraves dos

    quais o neuronio recebe estmulos (informacoes) de outros neuronios a ele associados.

    O axonio corresponde ao prolongamento longo e fino que se ramifica em sua porcao

    terminal, atraves da qual o neuronio estabelece conexoes com outros neuronios. O

    axonio pode se originar do corpo celular ou de um dendrito principal e e onde se

    concentra a sada de informacao da celula.

    53

  • FIGURA 2.18 - O neuronio e seus principais componentes

    O corpo celular (soma) e responsavel por somar os sinais de entrada. Quando a

    entrada recebida e considerada suficiente, o neuronio dispara, ou seja, transmite

    um sinal atraves de seu axonio a outros neuronios. O contato entre o axonio de um

    neuronio e o dendrito de outro, ou seja, uma conexao entre dois neuronios, denomina-

    se sinapse (Figura 2.19). A capacidade de estabelecer tais contatos e a principal

    propriedade dos neuronios, pois e atraves das sinapses que os neuronios trocam

    informacoes, formando a base para a realizacao das funcoes do sistema nervoso.

    FIGURA 2.19 - A sinapse.

    O neuronio consiste em um sistema eletroqumico muito pequeno, porem extrema-

    mente complexo, sendo capaz de prover os principais mecanismos para processa-

    mento de informacoes dentro do cerebro humano. Redes neurais artificiais podem ser

    54

  • descritas como sistemas computacionais para processamento de informacao baseados

    em um modelo simplificado do cerebro. Como uma analogia a constituicao biolog-

    ica do cerebro, a unidade fundamental das redes neurais artificiais consiste em uma

    estrutura denominada neuronio artificial ou unidade neuronal. O neuronio artificial

    tem, para fins computacionais, sua geometria reduzida a um ponto, porem conserva

    as caractersticas funcionais basicas do neuronio biologico. O primeiro modelo de

    neuronio artificial conhecido foi desenvolvido em 1943, no trabalho pioneiro de Mc-

    Culloch e Pitts (HAYKIN, 2001). Ele possui, como representado na Figura 2.20, tres

    elementos basicos: um conjunto de sinais de entrada, cada qual associado a um peso;

    um somador (

    ) para somar os sinais de entrada ponderados pelos pesos de suas

    respectivas sinapses; e uma funcao de ativacao, responsavel pela ativacao ou nao

    da sada do neuronio. Uma rede neural artificial e composta por um conjunto de

    unidades neuronais conectadas entre si, e os pesos associados as conexoes represen-

    tam a informacao usada pela rede para resolver o problema (FAUSETT, 1994).

    FIGURA 2.20 - O neuronio artificial de McCulloch e Pitts.

    No cerebro, cada neuronio esta conectado a milhares de outros, recebendo e proces-

    sando, portanto, milhares de entradas diferentes. De acordo com a maneira como

    cada neuronio esta conectado com os outros dentro da rede, ele se dedica a detec-

    tar um conjunto especfico de coisas. Toda essa complexidade nao e possvel de ser

    reproduzida em um modelo de simulacao devido as limitacoes impostas pela tecnolo-

    gia atual, porem a tentativa de atingir plausibilidade biologica, mesmo atraves de

    simplificacoes, pode levar a melhores atributos computacionais. Em uma rede neural

    artificial, as unidades se distribuem na forma de camadas. O arranjo das camadas e

    os padroes de conexoes entre elas determinam a arquitetura da rede, a qual, como

    55

  • no caso dos sistemas biologicos, interfere diretamente no tipo de tarefa que a rede e

    capaz de desempenhar. A Figura 2.21 ilustra os tres tipos de arquitetura possveis:

    camada unica, composta por apenas uma camada de neuronios aritificiais conectada

    a camada que contem os sinais de entrada (Fig. 2.21(a)); multiplas camadas, que

    possui entre a entrada e a sada uma ou mais camadas ocultas (Fig. 2.21(b)); e ca-

    mada competitiva, na qual a unidade a ser ativada para um dado padrao de entrada

    e determinada atraves de um processo de competicao (Fig. 2.21(c)).

    (a) Camada unica. (b) Multiplas camadas.

    (c) Camada competitiva.

    FIGURA 2.21 - Exemplos de arquiteturas (ou topologias) de redes neurais artificiais.

    O processo de treinamento ao qual as unidades sao submetidas tambem varia entre

    os diferentes modelos de redes. O treinamento ou aprendizagem consiste no metodo

    usado para ajustar os pesos das conexoes ao longo da apresentacao dos sinais de

    entrada (dados de treinamento), de forma que a rede aprenda a resolver o problema

    em questao. Na aprendizagem supervisionada, o tipo mais comum, o treinamento

    e realizado apresentando-se a rede uma sequencia de vetores de treinamento ou

    padroes, cada qual associado a um vetor de sada desejado, conhecido como vetor-

    alvo. O vetor-alvo representa um professor ou supervisor, que indica a rede se ela

    esta ou nao produzindo a sada correta, determinando o ajuste dos pesos atraves de

    um determinado algoritmo de aprendizagem.

    56

  • As redes neurais auto-organizaveis constituem modelos governados por uma forma

    nao-supervivisonada de treinamento, na qual uma sequencia de vetores de entrada e

    fornecida, mas nao ha um supervisor, ou seja, nao sao especificados vetores-alvo. A

    rede modifica os pesos de forma que vetores de entrada similares sejam associados

    a mesma unidade de sada, produzindo um vetor representativo para cada grupo

    formado (FAUSETT, 1994). Alem da arquitetura e do tipo e aprendizagem, uma

    terceira caracterstica que distingue os modelos de redes neurais artificiais e sua

    funcao de ativacao, aplicada sobre a soma dos sinais de entrada ponderados para

    produzir a sada do neuronio. As funcoes de ativacao mais usadas, identidade, degrau

    e sigmoide, estao representadas na Figura 2.22.

    (a) Funcao identidade. (b) Funcao degrau.

    (c) Funcao sigmoide.

    FIGURA 2.22 - Funcoes de ativacao.FONTE: Adaptado de Misiti et al. (2006).

    Nas proximas secoes, sao descritas as propriedades das redes utilizadas neste tra-

    balho.

    57

  • 2.3.2 Mapa Auto-Organizavel de Kohonen (SOM)

    Proposto por Kohonen (1988), o Mapa Auto-Organizavel de Kohonen e um modelo

    de rede neural artificial baseado em competicao, isto e, no qual a rede deve escolher

    uma unica unidade para responder a um dado padrao de entrada. A Figura 2.21(c)

    mostra a topologia da rede SOM, representada em uma grade bidimensional de

    unidades. A camada de entrada e conhecida como cortex sensorial, por analogia com

    a funcao desta area no sistema neural biologico (TSO; MATHER, 2001). A camada de

    sada e chamada entao de cortex de mapeamento.

    Cada uma das ligacoes entre as camadas de entrada e sada possui um valor de

    peso sinaptico wji onde i e j identificam o neuronio de entrada e sada, respecti-

    vamente. O passo inicial para a criacao de uma rede SOM requer a definicao dos

    parametros topologicos, ou seja, a escolha da quantidade de unidades nas camadas

    de entrada e sada. O numero de unidades de entrada deve ser igual ao tamanho

    do vetor de entrada. Nao ha uma especificacao formal para a dimensao da grade

    bidimesional nm (n,m > 1), embora algumas recomendacoes possam ser encon-tradas na literatura (HAYKIN, 2001). O processo de treinamento da rede comeca com

    a inicializacao dos pesos sinapticos wji, atribuindo-lhes valores aleatorios pequenos.

    O proximo passo e retirar do espaco de entrada uma amostra x = {x1, x2, ..., xk},onde k e a dimensao dos dados de entrada. A distancia euclidiana entre o vetor de

    entrada e cada unidade de sada e calculada de acordo com a Equacao 2.25:

    d2j =ki

    (xni wnji)2 , (2.25)

    onde xni e a entrada submetida ao neuronio i na iteracao n. A unidade vencedora e

    aquela que apresenta o melhor casamento com a entrada x, ou seja, arg min{d2j}.Os pesos sao entao ajustados usando a formula de atualizacao:

    wn+1ji = wnji +

    nj (xni wnji) , (2.26)

    onde n corresponde a taxa de aprendizagem da rede, uma funcao que decresce grad-

    ualmente com o tempo (numero de iteracoes). j e a funcao de vizinhanca centrada

    em torno da unidade vencedora j, uma funcao unimodal da distancia lateral entre

    58

  • a unidade vencedora (j) e sua vizinhanca (j), que deve satisfazer duas exigencias:

    j e simetrica em relacao ao ponto maximo definido por d2j = 0; em outraspalavras, ela alcanca seu valor maximo na unidade vencedora (j), para a

    qual a distancia d2j e nula;

    a amplitude de j decresce monotonicamente com o aumento da distancialateral d2j , decaindo a zero para d

    2j; esta e uma condicao necessaria

    para a convergencia.

    Uma escolha tpica para j e a funcao gaussiana:

    j = exp

    (d2j

    22

    ), (2.27)

    onde o parametro equivale a largura efetiva da vizinhanca topologica, como

    mostra a Figura 2.23; ele mede o grau em que neuronios excitados na vizinhanca do

    vencedor participam do processo de aprendizagem.

    FIGURA 2.23 - Funcao de vizinhanca gaussiana.FONTE: Adaptado de Haykin (2001)

    59

  • O processo a partir da etapa de amostragem e repetido ate que nao sejam observadas

    mudancas significativas no mapa de caractersticas, ou ate que se atinja um numero

    maximo predeterminado de iteracoes (HAYKIN, 2001).

    2.3.3 Aprendizagem por Quantizacao Vetorial (LVQ)

    A Aprendizagem por Quantizacao Vetorial (LVQ - Learning Vector Quantization)

    e um metodo de classificacao de padroes cujo objetivo e refinar a definicao das

    superfcies de decisao entre as classes, explorando informacoes conhecidas sobre os

    padroes de treinamento. Desta maneira, e possvel aplicar o mapa auto-organizavel

    de Kohonen para fazer um arranjo inicial dos pesos e, em uma etapa posterior,

    utilizar a LVQ para fazer um ajuste fino sobre o mapa de caractersticas e melhorar

    a capacidade de classificacao da rede, como mostra o diagrama da Figura 2.24.

    FIGURA 2.24 - Diagrama em blocos da classificacao SOM+LVQ.FONTE: Adaptado de Haykin (2001)

    A rede LVQ consiste em um modelo competitivo supervisionado, que requer uma

    colecao de exemplos de treinamento associados a classes ou categorias conhecidas. O

    conjunto de vetores de pesos relacionado as unidades de sada e geralmente denom-

    inado livro-codigo, e cada membro e chamado palavra-codigo ou vetor de referencia

    da classe representada pela unidade5. Cada padrao de entrada e associado a classe

    dada pela unidade cujo vetor de referencia e o mais proximo (em medida de distan-

    cia euclidiana) do vetor de entrada. O efeito desta associacao equivale a dividir o

    espaco de entrada atraves de um diagrama de Voronoi6, como mostra a Figura 2.25.

    5Os valores iniciais dos pesos correspondem aos valores finais obtidos pelo algoritmo SOM.Quando a rede LVQ e usada de forma independente, ou seja, sem um ajuste inicial dos pesos atravesdo algoritmo SOM, o conjunto inicial de pesos e composto de valores escolhidos aleatoriamente.

    6Dados m pontos em um espaco n-dimensional, o diagrama de Voronoi e a particao do espacon-dimensional em m regioes poliedricas, uma regiao para cada ponto pm. Tal regiao e chamadacelula de Voronoi, e contem todos os pontos que sao mais proximos de p do que de qualquer outroponto no conjunto (HAYKIN, 2001).

    60

  • FIGURA 2.25 - Diagrama de Voronoi envolvendo quatro celulas.FONTE: Adaptado de Haykin (2001)

    A tecnica usada pelo algoritmo LVQ usa a informacao conhecida sobre as classes

    para mover ligeiramente os vetores de Voronoi, a fim de melhorar a qualidade das

    regioes de decisao do classificador (HAYKIN, 2001). Dado um vetor de entrada x e sua

    sada-alvo (classe), o vetor de Voronoi (vetor de referencia) e movido em direcao a

    x se ambos os vetores pertencerem a mesma classe, ou afastado de x caso contrario.

    Isso implica numa pequena mudanca no algoritmo de treinamento em relacao a

    Equacao 2.26 da rede SOM. Supondo que o vetor de Voronoi wc seja o mais proximo

    do vetor de entrada xi, Cwc represente a classe associada ao vetor de Voronoi wc,

    e Cxi represente o rotulo de classe do vetor de entrada xi, a atualizacao dos pesos

    (vetores de Voronoi) ocorre como segue:

    SeCwc =Cxi , entao

    wn+1c = wnc +

    n(xni wnc ) , (2.28)

    onde 0 < n < 1.

    SeCwc 6=Cxi , entao

    wn+1c = wnc n(xni wnc ) . (2.29)

    Os outros vetores de Voronoi nao sao modificados. E desejavel que a constante de

    aprendizagem n decresca monotonicamente com o numero de iteracoes. Apos varios

    61

  • passos atraves dos dados de entrada, os vetores de Voronoi tipicamente convergem

    e o treinamento esta completo (HAYKIN, 2001). Uma modificacao deste algoritmo,

    conhecida como LVQ2 (Aprendizagem por Quantizacao Vetorial Tipo 2), estipula

    que as correcoes sobre os pesos somente devem ser efetuadas se o vetor de entrada

    x estiver dentro de uma janela definida ao redor do plano medio entre dois vetores

    de Voronoi vizinhos wp e wq pertencentes a classes diferentes. A largura otima desta

    janela deve ser determinada experimentalmente, e depende do numero de amostras

    de treinamento disponveis, embora algumas sugestoes praticas sejam discutidas em

    Kohonen (1990) e Demuth et al. (2006). Neste caso, as seguintes atualizacoes sao

    calculadas:

    wn+1p = wnp +

    n(xni wnp ) , (2.30)

    wn+1q = wnq n(xni wnq ) , (2.31)

    caso wp e xi pertencam a mesma classe (Cwp =Cxi), e wq e x, mesmo apresentando

    menor distancia euclidiana, pertencam a classes distintas (Cwq =Cxi). Analisando

    deficiencias contidas no algoritmo LVQ2, Kohonen (1990) desenvolveu uma terceira

    versao para a Aprendizagem por Quantizacao Vetorial (LVQ3), que introduz uma

    regra de atualizacao de pesos extra, aplicada nos casos em que x, wp e wq pertencam

    a mesma classe, ou seja,Cwp =Cxi =Cwq . Esta nova regra e descrita na equacao

    abaixo:

    wn+1k = wnk + n(xni wnk ) , (2.32)

    onde k{p, q}. O valor da constante e diretamente proporcional ao tamanho dajanela. Estudos apontam o LVQ3 como o algoritmo que produz os melhores re-

    sultados (KOHONEN, 1990). O sucesso deste modelo em testes aplicados por Ma e

    Manjunath (1996) ao reconhecimento de padroes de texturas determinou a escolha

    do LVQ3 para o presente trabalho.

    62

  • 2.4 Processamento Paralelo

    Desde o surgimento do primeiro computador digital eletronico7, a computacao pas-

    sou por um processo evolutivo intenso, a fim de proporcionar maior desempenho

    e ampliar o leque de aplicacoes que podem ser computacionalmente resolvidas de

    maneira eficiente. A partir da decada de 70, em busca de maior eficiencia e facil-

    idade no processo computacional, novas tecnologias passaram a ser desenvolvidas,

    como a computacao paralela e as redes de computadores (SANTANA et al., 1997).

    Pacheco (1997) define o computador paralelo como simplesmente um computador

    (ou colecao de computadores) com multiplos processadores que podem trabalhar

    juntos na resolucao de um problema unico. Sistemas paralelos e distribudos tem

    se tornado essenciais no contexto do processamento digital de imagens, em especial

    quando os dados sao obtidos por sensoriamento remoto. Esta necessidade e reforcada

    pelo crescente uso de sistemas SAR, cujos sensores apresentam caractersticas com-

    plexas, como polarizacao multipla e capacidades interferometricas, alem de gerar

    grandes quantidades de dados (TAYLOR et al., 1999). Converter estes dados cada vez

    mais amplamente disponveis em informacao efetiva para as instituicoes responsaveis

    por tomadas de decisao tem sido uma grande dificuldade na area de processamento

    de imagens, justificando a necessidade de serem desenvolvidos sistemas especficos

    para a aplicacao que apresentem eficiencia computacional.

    Com o aumento da velocidade e confiabilidade das redes de computadores observado

    na ultima decada, torna-se cada vez mais comum a interligacao de computadores pes-

    soais e workstations de maneira eficiente para composicao de sistemas distribudos.

    Clusters denominam maquinas paralelas com arquitetura de memoria distribuda

    representados na forma de um conjunto de computadores interconectados trabal-

    hando juntos, dando ao usuario a impressao de um sistema unico, apesar da dis-

    tribuicao de seus componentes de dados e hardware (BUYYA, 1999). Estes sistemas

    tem sido utilizados para a execucao de programas paralelos, em substituicao as ar-

    quiteturas paralelas, em virtude de seu menor custo e maior flexibilidade (SANTANA

    et al., 1997).

    As primeiras ideias relacionadas ao uso de clusters foram desenvolvidas pela IBM na

    decada de 60, conectando grandes mainframes com o objetivo de proporcionar uma

    forma de paralelismo comercial de baixo custo (BUYYA, 1999). O modelo de clusters

    7O primeiro computador eletronico foi projetado em meados de 1940, e recebeu o nome deENIAC (Electronic Numerical Integrator and Computer).

    63

  • denominado Beowulf, desenvolvido pela NASA em 1994, tornou-se um projeto bem

    sucedido e bastante usado atualmente. Esta arquitetura, adotada para a extracao

    de atributos de textura das imagens no presente trabalho, sera descrita a seguir.

    2.4.1 A Arquitetura Beowulf

    O projeto Beowulf 8 surgiu em 1994, desenvolvido por Sterling et al. (1995) com o ob-

    jetivo de proporcionar a NASA um sistema que apresentasse desempenho comparavel

    ao das maquinas paralelas, porem a um custo cerca de dez vezes menor. O primeiro

    sistema Beowulf continha 16 processadores Intel 66 MHz 486 executando o sistema

    operacional Linux, conectados via rede Ethernet. A necessidade de um software para

    estabelecer a rede de interconexao entre os processadores levou ao desenvolvimento

    de muitos dos drivers Ethernet para Linux ate hoje usados por milhares de computa-

    dores ao redor do mundo para conectarem-se a Internet (BUYYA, 1999). O projeto

    obteve aprovacao imediata ao apresentar uma escolha alternativa para proporcionar

    computacao de alto desempenho (HPC - High Performance Computing).

    Com o sucesso do Beowulf original, muitos outros sistemas foram construdos pelo

    CEDIS/NASA (Center of Excellence in Space Data and Information Sciences), uti-

    lizando varias geracoes e famlias de processadores e conexoes de rede (HSIEH, 2000).

    Uma importante caracterstica que distingue os sistemas Beowulf de outros clusters

    e o fato de nao ser imposto ao usuario um modelo de arquitetura fixo. Uma vez

    que os parametros relacionados a custo e desempenho de equipamentos de hardware

    mudam constantemente, as geracoes de sistemas Beowulf evoluem continuamente

    desde sua composicao original, criada em 1994. Embora, em um nvel mais geral, a

    arquitetura tenha permanecido a mesma,