Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de...

82
Outubro de 2007 Reconhecimento automático de crateras na superfície de Marte baseado em técnicas de boosting RICARDO FERNANDO LOPES FONTES MARTINS Dissertação para obtenção do Grau de Mestre em ENGENHARIA ELECTROTÉCNICA E DE COMPUTADORES Júri Presidente: Prof. Francisco Miguel Prazeres Silva Garcia Orientadores: Prof. Jorge dos Santos Salvador Marques Prof. Pedro Miguel Berardo Duarte Pina Vogais: Profª. Maria Margarida Campos da Silveira Profª. Ana Luísa Nobre Fred

Transcript of Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de...

Page 1: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Outubro de 2007

Reconhecimento automático de crateras na superfície de Marte baseado em técnicas de boosting

RICARDO FERNANDO LOPES FONTES MARTINS

Dissertação para obtenção do Grau de Mestre em

ENGENHARIA ELECTROTÉCNICA E DE COMPUTADORES

Júri Presidente: Prof. Francisco Miguel Prazeres Silva Garcia

Orientadores: Prof. Jorge dos Santos Salvador Marques

Prof. Pedro Miguel Berardo Duarte Pina

Vogais: Profª. Maria Margarida Campos da Silveira

Profª. Ana Luísa Nobre Fred

Page 2: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Agradecimentos

Quero em primeiro lugar dedicar esta dissertacao de mestrado a minha famılia, em especial aminha mae que sempre acreditou em mim e nas minhas capacidades. Apoiou e apostou, desdesempre, na minha educacao e formacao a todos os nıveis. Ao meu irmao por todos os conselhos eaos meus avos que garantiram os meus estudos ao longo de todos estes anos. Sem voces nao estariaonde estou hoje, a todos o meu eterno e profundo agradecimento.

Agradeco tambem aos meus orientadores. Ao Prof. Jorge Salvador Marques, ao Prof. Pedro Pinae a Profª. Margarida Silveira, obrigado pela vossa paciencia e pelas vossas sugestoes, comentariose crıticas. Especial agradecimento ao Prof. Pedro Pina pela disponibilizacao do conjunto de imagensutilizadas nesta dissertacao, anteriormente utilizadas sob o projecto PDCTE/CTA/49724/03 suportadopela FCT (Fundacao para a Ciencia e Tecnologia).

Por fim quero agradecer a todos os meus amigos de dentro e fora do Instituto Superior Tecnico queme apoiaram neste percurso. Em especial a Dora Gaspar pelos incentivos, compreensao e paciencia,e por se ter voluntariado para ler esta dissertacao.

1

Page 3: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Resumo

A identificacao de crateras de impacto numa superfıcie planetaria assume uma importancia crucialno estudo dos planetas, pois permite a estimacao da idade de zonas da superfıcie atraves de medicoesde tamanho e frequencia de impactos. Diversos metodos para identificacao automatica de craterastem sido desenvolvidos, no entanto nenhum e suficientemente robusto de forma a poder ser aplicadoem todas as superfıcies planetarias.

Esta dissertacao propoe uma nova abordagem para deteccao automatica de crateras na superfıciede Marte utilizando algoritmos de aprendizagem baseados em boosting e caracterısticas de Haar. Osmetodos desenvolvidos sao inspirados no trabalho de P. Viola e M. Jones [22] em 2001 no contextode deteccao de faces. A nova abordagem e por si so um contributo para a area em questao. Outroscontributos sao: a proposta de um mecanismo de treino de classificadores com exemplos de craterasem escalas diferentes, metodos de geracao de falsos exemplos para o conjunto de treino e avaliacaoautomatica de desempenho dos classificadores. Sao utilizadas 101 imagens da superfıcie de Martepara treino e teste. Os metodos propostos sao avaliados por validacao cruzada de quatro ensaios. Osmelhores resultados para crateras de diametro igual ou superior a 7 pixels variam entre 79% a 88% detaxa de deteccoes correctas e entre 5% a 23% de taxa de falsas deteccoes dependendo do threshold.Os desempenhos estao proximos dos melhores publicados ate hoje e podem ser melhorados.

2

Page 4: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Abstract

The identification of impact craters on a planetary surface has crucial importance for planetarystudies because it allows the estimation of the surface age through measures of size and frequencyof impacts. Several methods for automatic crater identification have been developed, however none issufficiently robust to be applied on all planetary surfaces.

This dissertation proposes a new approach to automatic crater detection on the surface of Marsusing learning algorithms based on boosting and Haar-like features. The method developed is inspiredon the work of P. Viola and M. Jones [22] in 2001 for face detection. This new approach is by itselfa contribution to this area. Other contributes are: the proposal of a classifier training mechanismwith craters of different scales, methods to produce false examples for the training set and automaticevaluation of the performance of each classifier. For training and testing, 101 images of Mars are used.The proposed method is evaluated through a four fold cross validation. The best global results forcraters equal or above 7 pixels of diameter vary between 79% to 88% of true detection rate and 5%to 23% of false detection rate depending on the chosen threshold. The performances are close to thebest ever published so far and can be improved.

3

Page 5: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Conteudo

Agradecimentos 1

Resumo 2

Abstract 3

Lista de Tabelas 6

Lista de Figuras 7

Lista de Acronimos 10

1 Introducao 111.1 Estado da Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.2 Objectivos e Contribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.3 Estrutura da Dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Reconhecimento Automatico de Crateras 162.1 Formulacao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.3 Pre-Processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.4 Caracterısticas da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.4.1 Mascaras Rectangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.4.2 Extraccao de caracterısticas atraves da imagem integral . . . . . . . . . . . . . . 20

2.5 Classificador boosting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.5.1 Aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.6 Classificador boosting em cascata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.7 Classificacao Multi-Escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.8 Pos-Processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Base de Dados e Conjuntos de Treino e Teste 303.1 Imagens e Condicoes de Aquisicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.2 Identificacao Manual de Crateras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.3 Validacao Cruzada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.4 Definicao de Conjunto de Treino e de Escalas . . . . . . . . . . . . . . . . . . . . . . . . 333.5 Conjunto de Treino Automatico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.6 Conjunto de Treino Iterativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4

Page 6: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

4 Resultados Experimentais 374.1 Taxa de Deteccao e Taxa de Falsas Deteccoes . . . . . . . . . . . . . . . . . . . . . . . 374.2 Avaliacao Automatica das Deteccoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.3 Resultados com classificador boosting . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.4 Resultados com classificador boosting em cascata . . . . . . . . . . . . . . . . . . . . . 424.5 Influencia do numero de iteracoes e do deslocamento de bloco . . . . . . . . . . . . . . 434.6 Teste simples em imagens de sondas diferentes . . . . . . . . . . . . . . . . . . . . . . 454.7 Discussao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5 Conclusoes e Trabalho Futuro 49

Bibliografia 51

Anexos 53Anexo I - Listagem das Imagens MOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Anexo II - Representacao do Ground Truth nas Imagens . . . . . . . . . . . . . . . . . . . . . 58Anexo III - Resultados parciais para boosting simples . . . . . . . . . . . . . . . . . . . . . . 68Anexo IV - Resultados parciais para boosting em cascata . . . . . . . . . . . . . . . . . . . . 71Anexo V - Ilustracao de um resultado parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5

Page 7: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Lista de Tabelas

2.1 Algoritmo para treino boosting, adaptado de Viola e Jones [22] . . . . . . . . . . . . . . 222.2 Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22] . . . . . 252.3 Procedimento para o agrupamento de deteccoes apos classificacao de uma imagem

com o classificador final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1 Tabela com a divisao do numero de imagens utilizadas em cada ensaio por zona. . . . 33

4.1 Algoritmo desenvolvido para a avaliacao automatica dos resultados. . . . . . . . . . . . 384.2 Tabela com as taxas de deteccao (TDR) e falsas deteccao (FDR) globais para os clas-

sificadores de boosting obtidos com os varios conjuntos de treino e em funcao de µ. . . 414.3 Tabela com as taxas de deteccao (TDR) e falsas deteccao (FDR) globais para os clas-

sificadores de boosting em cascata obtidos com os varios conjuntos de treino e emfuncao de µ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

5.1 Tabela de informacao sobre as imagens referentes a Zona A. . . . . . . . . . . . . . . . 545.2 Tabela de informacao sobre as imagens referentes a Zona B. . . . . . . . . . . . . . . . 545.3 Tabela de informacao sobre as imagens referentes a Zona C. . . . . . . . . . . . . . . . 555.4 Tabela de informacao sobre as imagens referentes a Zona D. . . . . . . . . . . . . . . . 55

6

Page 8: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Lista de Figuras

1.1 Modelo cronologico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se a frequencia de impactos por km2 e o eixo dasabcissas a correspondente idade em mil milhoes de anos. . . . . . . . . . . . . . . . . . 12

2.1 Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zonaB mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C evisıvel um enorme vale e algumas montanhas. No exemplo em (c): imagem R1301124da zona D, apresentam-se crateras com aspecto visual muito diferente das duas ima-gens anteriores devido provavelmente a erosao eolica na zona. . . . . . . . . . . . . . . 17

2.2 Esquematico proposto para a deteccao de cratera num bloco da imagem. . . . . . . . . 182.3 Deteccao de crateras em imagens de Marte. . . . . . . . . . . . . . . . . . . . . . . . . 182.4 Exemplo de rotacao de duas imagens segundo o azimute do Sol. (a) e (c) Imagens origi-

nais E0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288rodadas segundo o azimute do Sol respectivamente. . . . . . . . . . . . . . . . . . . . . 19

2.5 Em cima, de (a) a (e), os varios tipos de mascaras. Em baixo (f): um exemplo de umamascara do Tipo 1 e a representacao dos respectivos pontos de referencia necessariosa definicao dos rectangulos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.6 Resultado da classificacao da imagem MOC-R1004288 (Zona B) com um classificadorboosting sem analise multi-escala, bloco de dimensao 20× 20. . . . . . . . . . . . . . . 23

2.7 Representacao de um classificador em cascata com 3 camadas . . . . . . . . . . . . . 242.8 Resultado da classificacao de imagem MOC-R1004288 (Zona B) como um classificador

boosting em cascata sem analise multi-escala. . . . . . . . . . . . . . . . . . . . . . . . 252.9 Representacao do calculo e normalizacao de caracterısticas. . . . . . . . . . . . . . . . 262.10 Resultado da classificacao de imagem MOC-R1004288 (Zona B) com um classificador

boosting com analise multi-escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.11 Supressao de nao maximos. Em (a) e (b) as deteccoes estao representadas em (x, y) e

escala (S). Em (a) as deteccoes apos a classificacao de uma imagem. Em (b) o resul-tado apos a supressao de nao maximos. Nos graficos (c) e (d) as deteccoes estao repre-sentadas em localizacao x/y, escala S e funcao discriminante H. Em (c) as deteccoesapos a classificacao de uma imagem. Em (b) o resultado apos a supressao de naomaximos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.12 Resultado da classificacao da imagem MOC-R1004288 (Zona B) com um classificadorboosting a varias escalas com pos-processamento. . . . . . . . . . . . . . . . . . . . . 28

3.1 Superfıcie de Marte e as quatro zonas utilizadas (A,B,C e D). . . . . . . . . . . . . . . . 313.2 Informacao disponıvel para a imagem M2100403. No rectangulo azul esta o valor do

azimute solar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

7

Page 9: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

3.3 Diagrama dos ensaios para validacao cruzada dos resultados. . . . . . . . . . . . . . . 323.4 Definicao da escala adequada a um exemplo de cratera de impacto . . . . . . . . . . . 333.5 Os primeiros 100 exemplos de crateras presentes no conjunto de treino CTA referente

ao 1º Ensaio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.6 Exemplos falsos sobre os aneis de uma cratera. A verde o exemplo positivo de uma

cratera. A vermelho os exemplos falsos enviados para o conjunto de treino . . . . . . . 353.7 Esquematico do metodo utilizado para geracao de conjuntos de treino iterativos . . . . 36

4.1 Legendagem para a avaliacao dos resultados obtidos numa imagem. . . . . . . . . . . 394.2 Classificacao de duas imagens: R1004288 da zona B e R1002799 da zona D, com o

classificador boosting obtido no 1º Ensaio com CTA (esquerda) e avaliacao automaticados resultados (direita). Em (a) e (c) o resultado apos a classificacao e (c) e (d) aavaliacao automatica dos resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.3 As 10 primeiras caracterısticas escolhidas com o classificador boosting treinado comCTA (4º Ensaio). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.4 As 10 primeiras caracterısticas escolhidas com o classificador boosting treinado comCTI3 (4º Ensaio). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.5 Curva de ROC para os classificadores de boosting com 50 iteracoes. . . . . . . . . . . 414.6 As dez primeiras caracterısticas escolhidas na segunda camada do classificador em

cascata para o conjunto CTI3 do quarto ensaio. . . . . . . . . . . . . . . . . . . . . . . 424.7 Curva de ROC para os classificadores de boosting em cascata. . . . . . . . . . . . . . 434.8 Comparacao de desempenhos do mesmo classificador (obtido do treino boosting sim-

ples com CTI3 - 4º Ensaio, µ = 0.6) utilizando diferente numero de iteracoes T . Resul-tados obtidos na imagem R0904061 da Zona A. . . . . . . . . . . . . . . . . . . . . . . 44

4.9 Comparacao entre o numero de iteracoes utilizado e o tempo de classificacao. Resulta-dos resultantes da aplicacao a todo o conjunto de teste. . . . . . . . . . . . . . . . . . . 44

4.10 Comparacao de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio) utilizando passos de deslocamento de bloco δ diferentes.Resultados resultantes da aplicacao a todo o conjunto de teste. . . . . . . . . . . . . . 45

4.11 Comparacao entre o tamanho do deslocamento do passo δ e o tempo de classificacao.Resultados obtidos na imagem R0904061 da Zona A. . . . . . . . . . . . . . . . . . . . 46

4.12 Deteccao de crateras numa imagem proveniente da sonda HRSC com o classificadorboosting simples obtido do treino com CTI3, com µ = 0.6. . . . . . . . . . . . . . . . . . 46

4.13 Deteccao de crateras numa imagem proveniente da sonda Viking 2 com o classificadorboosting simples obtido do treino com CTI3. . . . . . . . . . . . . . . . . . . . . . . . . 47

5.1 GT para as imagens da Zona A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.2 GT para as imagens da Zona B, parte 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.3 GT para as imagens da Zona B, parte 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.4 GT para as imagens da Zona C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615.5 GT para as imagens da Zona D, parte 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.6 GT para as imagens da Zona D, parte 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 635.7 GT para as imagens da Zona D, parte 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 645.8 GT para as imagens da Zona D, parte 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . 655.9 GT para as imagens da Zona D, parte 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.10 GT para as imagens da Zona D, parte 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

8

Page 10: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

5.11 Curvas de ROC para o 1º ensaio, classificadores de boosting com 50 iteracoes. . . . . 685.12 Curvas de ROC para o 2º ensaio, classificadores de boosting com 50 iteracoes. . . . . 695.13 Curvas de ROC para o 3º ensaio, classificadores de boosting com 50 iteracoes. . . . . 695.14 Curvas de ROC para o 4º ensaio, classificadores de boosting com 50 iteracoes. . . . . 705.15 Curvas de ROC para o 1º ensaio, classificadores de boosting em cascata. . . . . . . . 715.16 Curvas de ROC para o 2º ensaio, classificadores de boosting em cascata. . . . . . . . 725.17 Curvas de ROC para o 3º ensaio, classificadores de boosting em cascata. . . . . . . . 725.18 Curvas de ROC para o 4º ensaio, classificadores de boosting em cascata. . . . . . . . 735.19 Resultado parcial para a Zona A, figuras por ordem: E0500815 e E1600100. . . . . . . 745.20 Resultado parcial para a Zona B 1ª parte, figuras por ordem: E1102299, E1201076 e

E1201895. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 755.21 Resultado parcial para a Zona B 2ª parte, figuras por ordem: M0201122. . . . . . . . . 765.22 Resultado parcial para a Zona C, figuras por ordem: E0100976. . . . . . . . . . . . . . 765.23 Resultado parcial para a Zona D, 1ª parte, figuras por ordem: E0101393, E0101876 e

E0400996. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 775.24 Resultado parcial para a Zona D, 2ª parte, figuras por ordem: E0402024, E1900648 e

E1900650. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 785.25 Resultado parcial para a Zona D, 3ª parte, figuras por ordem: E2100529, FHA00514 e

M0001055. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 795.26 Resultado parcial para a Zona D, 4ª parte, figuras por ordem: M0001986, M0003044 e

M0003160. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 805.27 Resultado parcial para a Zona D, 5ª parte, figuras por ordem: M0200385, M0201769 e

M0203009. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

9

Page 11: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Lista de Acronimos

MGS - Mars Global Surveyor.MOC - Mars Orbital Camera.HRSC - High Resolution Stereo Camera.GENIE - GENetic Imagery Exploitation.CSTM - Continuously Scalable Template Models.FFT - Fast Fourier Transform.MIMS - Mars Image Mining System.CERENA - Centro de Recursos Naturais e Ambiente.CTA - Conjunto de Treino Automatico.CTI - Conjunto de Treino Iterativo.TD - True Detection.FD - False Detection.TDR - True Detection Rate.FDR - False Detection Rate.GT - Ground Truth.ROC - Receiver Operating Characteristic.

10

Page 12: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Capıtulo 1

Introducao

As crateras de impacto sao estruturas geologicas formadas pelo impacto de meteoritos sobrea superfıcie de um planeta e constituem o motivo de varios estudos efectuados pela comunidadecientıfica. Sao uma das caracterısticas que mais sobressaem visualmente numa superfıcie planetaria,sendo a sua formacao um processo geologico que ocorre em todo o sistema solar e constitui o principalescultor das superfıcies planetarias.

A identificacao de crateras de impacto numa superfıcie planetaria e de importancia fundamental,pois a contagem do numero destas estruturas permite estimar a idade dos terrenos onde se inserem.A compreensao da evolucao geologica de planetas baseia-se em medidas de distribuicao de tamanhoe frequencia de impactos, calculadas atraves das imagens recolhidas pelas sondas em orbita doscorpos planetarios [1]. Sabendo a taxa de producao de crateras e assumindo a distribuicao espacialde crateras de impacto como um processo aleatorio, o conhecimento do numero de crateras de umadeterminada area permite estimar a idade da superfıcie em milhares de anos. Terrenos mais antigosapresentam em geral um maior numero de impactos relativamente a terrenos mais recentes.

O desenvolvimento de tecnicas para determinacao das idades das superfıcies teve inıcio na decadade 50. A recolha de rochas provenientes da Lua permitiu saber a idade absoluta das rochas e desen-volver um modelo de estimacao de idades, baseado no tamanho e frequencia de impactos observadosnuma determinada area. Assim, a Lua e uma base de calibracao de modelos para determinacao daidade de outros planetas. Nos ultimos anos tem aparecido diferentes modelos aplicados ao planetaMarte usados para estimar a idade da superfıcie de diversas zonas desse planeta. O modelo cro-nologico construıdo para a Lua foi adaptado para Marte por Hartmann e Neukum em 2001 [2] e eapresentado na Figura 1.1.

As crateras de impacto na superfıcie de Marte apresentam estados de conservacao variados (cra-teras mais recentes tem contornos mais bem definidos, crateras menos recentes podem apresentarcontornos mais difusos). As imagens de maior resolucao espacial obtidas pela Mars Orbital Camera(MOC) a bordo da sonda Mars Global Surveyor (MGS) que orbita Marte desde 1997, revelam acti-vidade vulcanica, lıquida e eolica apos a formacao das crateras. Estes processos naturais alterama estrutura geologica das crateras ao longo do tempo, criando uma grande variedade de formatosde crateras em toda a superfıcie. Por outro lado, as dimensoes das crateras variam desde a ordemdo metro ate aos milhares de quilometros e os terrenos onde ocorrem tem origem e aspectos muitodiversos.

O reconhecimento e catalogacao das crateras de impacto e tambem essencial para a cronoes-tratigrafia (o estudo da idade das rochas e todo o seu processo de formacao) de uma determinada

11

Page 13: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 1.1: Modelo cronologico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se a frequencia de impactos por km2 e o eixo das abcissas acorrespondente idade em mil milhoes de anos.

regiao, que permite melhorar a interpretacao geologica historica de um determinado local ou zona dasuperfıcie. Assim, o estudo das crateras de um planeta serve varios fins, como o da compreensaodo proprio processo de craterismo, o do conhecimento da natureza dos terrenos que foram alvo dosimpactos, e sobretudo o da analise e compreensao dos processos que estao na origem da sua porvezes acentuada degradacao (preenchimento parcial ou total das depressoes internas e a erosao dosbordos elevados) e que contribuıram para a definicao do aspecto actual da superfıcie do planeta. Iden-tificar impactos de crateras podera tambem ser importante para a elaboracao de uma ferramenta denavegacao espacial, a ser utilizada para definir um local seguro de aterragem em missoes espaciaisfuturas.

O processo de identificacao de crateras tem sido executado por operadores humanos, mas estaoperacao e extremamente exigente em termos de tempo (seriam necessarios varios anos para cons-truir uma base de dados com toda a informacao de impactos de crateras em Marte atraves desteprocesso). Esta situacao e exacerbada pelo aumento da resolucao espacial dos instrumentos a bordodas sondas recentes, que permitem a deteccao de crateras com varias dimensoes.

Por estas razoes e cada vez mais importante providenciar a comunidade cientıfica ferramentasautomaticas de deteccao de crateras. A automacao total do processo de deteccao de crateras serauma contribuicao importante para o estudo do sistema solar, assim como sera uma preciosa ferra-menta para os operadores humanos que possuem um largo volume de imagens para analisar e po-dendo focar a sua concentracao na aplicacao dos modelos geologicos aos dados. Diversas linhas deinvestigacao tem sido seguidas nas ultimas decadas para se conseguir um processo automatico quepermita a identificacao e contagem de crateras de impacto (algumas serao abordadas na seccao 1.1).Contudo, a identificacao automatica de crateras atraves de metodos de processamento de imagemprovou ser um problema difıcil pois ate hoje nenhum dos metodos obteve resultados suficientementesatisfatorios para serem aplicados a toda a superfıcie de Marte.

12

Page 14: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

1.1 Estado da Arte

Diversos trabalhos sobre deteccao automatica de crateras em imagens de superfıcies planetarias,nomeadamente da Lua e de Marte, tem sido efectuados nos ultimos anos. As abordagens paradeteccao de crateras podem ser divididas em duas classes: supervisionadas e nao-supervisionadas.Ambas as abordagens utilizam conjuntos de treino e teste. Nos metodos nao-supervisionados os da-dos nao estao classificados ao contrario dos metodos supervisionados que necessitam de classificacaodos dados por parte do utilizador.

Os metodos supervisionados [3], [4], [5] e [6] utilizam conceitos de aprendizagem de forma a cons-truir um classificador para a deteccao de crateras. Em [3] e testado um software de aprendizagemautomatica chamado GENIE (GENetic Imagery Exploitation). O software avalia o desempenho devarios algoritmos e combina os melhores de forma a classificar correctamente todo o conjunto detreino. E utilizada apenas uma imagem de Marte para treino e o resultado apresentado refere-sea classificacao dessa mesma imagem com o classificador final (98% de deteccao e 10% de falsasdeteccoes) nao sendo contabilizadas as crateras de pequenas dimensoes neste resultado. O factode se usar a mesma imagem para treino e teste conduz a estimativas demasiado optimistas do de-sempenho desta abordagem. Nos trabalhos [4] e [6] utiliza-se a tecnica de modelos de templatecontinuamente escalaveis (CSTM-Continuously Scalable Template Models), baseia-se um exemploreal de uma cratera amostrado a varias frequencias com o objectivo de criar uma famılia de filtros aser utilizada para classificacao. No desempenho ambas as abordagens sao avaliadas num conjuntode teste inferior a cinco imagens, [4] e testado numa imagem da superfıcie Lunar e obteve 80% dedeteccoes correctas e 12% de falsas, [6] e testado em tres exemplos sinteticos e uma imagem MOCobtendo um elevado numero de falsas deteccoes. Em [5] varios algoritmos sao testados e compa-rados (entre os quais redes neuronais, modelos de templates continuamente escalaveis e maquinasde vectores de suporte). As maquinas de vectores de suporte mapeiam os vectores de treino numespaco dimensional elevado procurando construir um hiperplano que separe as classes. O melhordesempenho foi obtido com maquinas de vectores de suporte com apenas 60% de deteccoes correc-tas num numero nao especificado de imagens da sonda Viking Orbiter. Em [7] e apresentada umaabordagem de redes neuronais para identificacao de crateras mas apenas testada em tres blocos deimagem contendo exemplos de crateras e dois exemplos sinteticos. Todas as abordagens supervisio-nadas referidas apresentam resultados promissores mas os classificadores resultantes do treino saoaplicados a um conjunto de teste limitado e alguns apresentam apenas bons resultados em craterasde grandes dimensoes.

A maioria das abordagens baseia-se em metodos nao-supervisionados e utilizam tecnicas paraidentificar os aneis das crateras numa imagem atraves da extraccao de caracterısticas circulares ouelıpticas. As abordagens propostas em [8], [9] e [10] baseiam-se na transformada de Hough paradeteccao de formas circulares. Metodos para deteccao automatica de crateras atraves de dados detopografia digital, [11] e [12], procuram por zonas concavas e utilizam tambem a transformada deHough. Em [13] a deteccao de crateras e feita atraves de analise de textura e em [14] atraves dacorrelacao com uma template apos a deteccao de contornos. Outras abordagens, [15], [16], [17], [18],[19] e [20], optam por combinar diversos dos metodos mencionados (transformada de Hough, analisede textura e correlacao com template) e outras tecnicas de processamento para detectar crateras. Noartigo [20] o metodo combina deteccao de contornos, medidas de textura e analise de direccao degradientes e e testado em imagens provenientes de diferentes sondas.

Dos varios estudos efectuados nenhum obteve taxas de deteccao acima de 90% e de falsasdeteccoes abaixo de 10% sobre um conjunto de imagens de teste de dimensao consideravel (pelo

13

Page 15: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

menos 10 imagens). No entanto, entre os melhores resultados destaca-se o obtido por L. Bandeira etal.[18]. Neste trabalho o reconhecimento de crateras e composto por tres fases: seleccao de candi-datos (atraves de deteccao de contornos), criacao de um volume de probabilidade criado atraves dacorrelacao com templates a varias escalas utilizando uma FFT (Fast Fourier Transform) e deteccaode crateras atraves da analise de maximos locais. Este metodo nao supervisionado atinge um resul-tado global de 86% de deteccoes correctas e 12% de falsas deteccoes. O trabalho desenvolvido comdados de topografia digital [11] obteve um bom desempenho (taxa de deteccao de 88% em imagensprovenientes da MOC), mas as imagens de teste foram escolhidas de forma a nao incluırem crate-ras muito degradadas e localizadas sobre os aneis de outras crateras pois o metodo possui um fracodesempenho nestas situacoes.

1.2 Objectivos e Contribuicoes

Esta dissertacao tem como objectivo principal desenvolver um metodo para a deteccao automaticade crateras, nao so em imagens da superfıcie de Marte como de qualquer outra superfıcie planetaria,em diferentes escalas, utilizando uma abordagem diferente de todas as outras mencionadas anteri-ormente. Para que este trabalho tenha um bom impacto na comunidade cientıfica, deseja-se nestafase demonstrar que e um metodo valido para deteccao de crateras e por isso devera obter taxas dedesempenho proximas das melhores apresentadas na literatura ate hoje.

Para se poder lidar com as fontes de variacao apresentadas na introducao, pretende-se nestadissertacao utilizar metodos de aprendizagem automatica capazes de aprender as caracterısticas oufeatures da imagem de fundo e das crateras. Pretende-se ainda usar uma representacao multi-escaladas imagens para tornar o algoritmo independente da escala. As abordagens dos trabalhos apre-sentados na seccao anterior possuem uma quantidade fixa de caracterısticas a serem utilizadas nadeteccao de crateras. Nesta dissertacao o processo de aprendizagem selecciona as melhores carac-terısticas de entre milhares de caracterısticas escolhidas pelo utilizador para construir um classificadorfinal. Propoe-se que esta seleccao seja feita usando tecnicas de boosting semelhantes as propostaspor P. Viola e M. Jones [22] no contexto da deteccao de faces em imagens e que demonstraram umdesempenho e rapidez notaveis mesmo quando ha variacoes de escala. Este metodo foi inicialmenteaplicado para reconhecimento de caras, sendo hoje considerado um standard em problemas de reco-nhecimento de padroes.

Em contraste com os trabalhos de aprendizagem apresentados, sera utilizado um conjunto vastode imagens de diversas regioes e com crateras de aspecto e dimensao variados. As imagens utili-zadas neste trabalho sao as do trabalho desenvolvido por L. Bandeira et al.[18], o que permite umacomparacao de resultados apesar de existirem algumas diferencas no processo de avaliacao. Nestadissertacao, as imagens serao separadas em conjuntos de treino e teste enquanto que em [18] naoexiste um conjunto de treino tendo sido testado em todo o conjunto de imagens. Para demonstrara validade dos resultados com esta abordagem, e feita uma validacao cruzada realizando varios en-saios para que todas as imagens sejam utilizadas na fase de teste. O codigo foi desenvolvido emMATLABTM e executado num laptop convencional. Este trabalho propoe uma nova abordagem nocontexto de automacao de deteccao de crateras, que se pretende competitiva em relacao aos metodosate hoje propostos pela comunidade cientıfica.

14

Page 16: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

1.3 Estrutura da Dissertacao

O trabalho encontra-se dividido em mais quatro capıtulos para alem do capıtulo de introducao. Noproximo capıtulo e feita a formulacao do problema e sao descritos os algoritmos utilizados para treinoe deteccao de crateras em diversas escalas. No capıtulo 3 explica-se a origem e caracterizacao dasimagens utilizadas. E descrito o processo de recolha de informacao, identificacao manual de craterase calculo do seu diametro para a criacao da base de dados para cada imagem (ground truth). A formacomo e gerado o conjunto de treino influencia directamente os resultados obtidos pelo classificadorfinal resultante do treino, os tipos de conjuntos de treino construıdos sao tambem descritos nestecapıtulo. No capıtulo 4 apresentam-se os resultados globais apos a validacao cruzada, alguns testesefectuados e uma crıtica aos resultados obtidos. Finalmente, no capıtulo 6 sao apresentadas asconclusoes do trabalho, sugestoes para possıveis melhoramentos e trabalho futuro.

15

Page 17: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Capıtulo 2

Reconhecimento Automatico de

Crateras

Este capıtulo comeca por formular o problema, descrevendo em pormenor as principais dificulda-des. Seguidamente apresenta-se a proposta de resolucao do problema, a sua origem, motivacao ejustificacao. Nas seccoes seguintes explicam-se em detalhe os algoritmos desenvolvidos e o proces-samento envolvido.

2.1 Formulacao do Problema

Dado um conjunto de imagens de diversas zonas da superfıcie de Marte, pretende-se detectar eregistar a localizacao das crateras de impacto atraves de um metodo automatico. Apesar de algunsresultados animadores nos ultimos anos, o problema de deteccao automatica de crateras continua aser um problema difıcil, nao existindo ainda uma solucao suficientemente satisfatoria.

Uma das dificuldades associadas a este problema e a diversidade do aspecto visual das craterasde impacto que depende do tipo de terreno em que ocorrem, direccao de iluminacao e do estadoatmosferico no instante de aquisicao. Algumas zonas em estruturas geologicas tais como vales, mon-tanhas e vulcoes possuem caracterısticas morfologicas semelhantes as das crateras que podem serconfundidas com crateras. No entanto, a maior dificuldade deve-se aos diferentes tipos de erosao aque as crateras foram expostas ao longo dos anos (tempestades de poeira, erupcoes de lava e acti-vidade lıquida). Por estas razoes, as crateras possuem uma grande variedade de aspectos. Craterasem diferentes zonas da superfıcie foram expostas a diferentes tipos de erosao, alterando de formadiferente em cada zona, as suas estruturas geologicas e, consequentemente, as suas caracterısticasvisuais. E tambem frequente a sobreposicao de crateras, por exemplo, crateras de impacto de menordimensao situadas dentro ou sobre o anel de uma cratera de dimensao maior. Por ultimo, o tama-nho das crateras de impacto na superfıcie de Marte pode variar entre alguns metros e milhares dequilometros. A Figura 2.1 mostra algumas das dificuldades mencionadas.

Estas dificuldades sao responsaveis pela nao existencia ate hoje de uma solucao final satisfatoriapara o problema. Para atingir uma solucao final satisfatoria, o metodo proposto devera ser robusto asdificuldades anteriores para que possa ser aplicado em toda a superfıcie de Marte e tambem a outrassuperfıcies planetarias.

16

Page 18: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

(a) (b) (c)

Figura 2.1: Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zonaB mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C e visıvel umenorme vale e algumas montanhas. No exemplo em (c): imagem R1301124 da zona D, apresentam-se crateras com aspecto visual muito diferente das duas imagens anteriores devido provavelmente aerosao eolica na zona.

2.2 Metodologia

O reconhecimento automatico de crateras enquadra-se nas areas de reconhecimento de padroese processamento de imagem. Para se poder lidar com as fontes de variacao apresentadas na seccaoanterior pretende-se aplicar neste trabalho metodos de aprendizagem automatica capazes de apren-der as caracterısticas da imagem de fundo e das crateras, a partir de exemplos. Modelos de reco-nhecimento de padroes podem ser baseados em templates ou caracterısticas (features). A estrategiaseguida neste trabalho consiste em extrair de imagens, blocos de dimensoes predefinidas e classifica-los numa de duas classes: com ou sem cratera no seu interior. A decisao e baseada num conjuntode caracterısticas visuais que descrevem o conteudo do bloco. O classificador e treinado a partir deexemplos fornecidos pelo utilizador correspondendo a blocos com e sem crateras (exemplos positi-vos e negativos, respectivamente) para que o classificador aprenda as propriedades estatısticas dascaracterısticas seleccionadas em ambas as classes.

Para o reconhecimento de padroes numa imagem, a operacao de extraccao de caracterısticasconsiste em extrair valores de determinados atributos de uma imagem que permitam diferenciar osobjectos e gerar uma decisao em funcao dos valores extraıdos. Ao contrario de outras abordagensem que as caracterısticas sao definidas pelo utilizador (por exemplo: intensidade media, variancia,percentagem de pontos de contorno, formas circulares), neste trabalho parte-se de um numero muitoelevado (milhares) de caracterısticas e usa-se um metodo de seleccao automatica que selecciona umpequeno numero (dezenas) de caracterısticas a serem utilizadas para o reconhecimento de crateras.

Este trabalho inspira-se no metodo proposto por P. Viola e M. Jones [22] no contexto de deteccaode faces em imagens, que demonstrou um desempenho notavel mesmo na presenca de variacoes deescala. Propoe-se a utilizacao de tecnicas de boosting para a seleccao de caracterısticas semelhan-tes. O boosting e um conceito utilizado para aprendizagem automatica supervisionada e consiste emcombinar classificadores ”fracos” (com um fraco desempenho) treinados com um algoritmo de apren-dizagem simples de forma a obter um classificador ”forte” que apresente um melhor desempenho doque qualquer um dos classificadores ”fracos”. O boosting e os metodos de aprendizagem serao ex-plicados em detalhe na seccao 2.5. O metodo apresentado e aplicavel a todo o tipo de objectos eutiliza uma tecnica rapida de extraccao de caracterısticas da imagem atraves da filtragem linear commascaras rectangulares utilizando uma imagem integral. Para diminuir o tempo de classificacao total

17

Page 19: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

e construıdo um classificador em cascata constituıdo por varios classificadores boosting em camadassubsequentes, seccao 2.6. A Figura 2.2 mostra o diagrama da abordagem para a deteccao de crate-ras num bloco de imagem. Dado um bloco da imagem Bn×n, extrai-se um vector de caracterısticas, f ,

Figura 2.2: Esquematico proposto para a deteccao de cratera num bloco da imagem.

usadas na classificacao. O classificador utilizara essas caracterısticas para calcular a decisao final. Oclassificador atribui uma etiqueta 1 se existir uma cratera e uma etiqueta 0 caso contrario. A deteccaode crateras nas imagens da superfıcie de Marte e realizada aplicando este metodo de classificacao acada bloco de dimensao n× n, ver Figura 2.3. Para diminuir o efeito da direccao de iluminacao numa

Figura 2.3: Deteccao de crateras em imagens de Marte.

imagem rodam-se previamente as imagens de forma a alinhar a direccao de iluminacao (seccao 2.3) eapos a classificacao da imagem na sua totalidade sera necessario realizar um processo de supressaode nao maximos (seccao 2.8).

2.3 Pre-Processamento

A direccao da luz incidente na superfıcie de Marte varia ao longo do tempo, em funcao da posicaorelativa do Sol no instante de aquisicao, alterando o aspecto visual das crateras. A colocacao deexemplos no conjunto de treino com diferentes direccoes de luz incidente torna o classificador menosselectivo, por esta razao pretende-se alinhar todas as imagens segundo a posicao relativa do Sol.Este procedimento e realizado facilmente conhecendo o azimute solar que e fornecido juntamentecom as imagens utilizadas nesta dissertacao (ver capıtulo 3). O azimute do Sol e o angulo, em graus(no sentido dos ponteiros do relogio), entre uma linha desenhada do centro para a direita da imageme outra do centro em direccao a localizacao do sol, no instante de aquisicao. Esta informacao permitesaber a direccao e sentido da luz do sol numa imagem. Pretende-se que a direccao da luz solarseja igual em todas as imagens. Para esse efeito, as imagens sao rodadas no valor desse azimutemas segundo o sentido contrario ao dos ponteiros de relogio. Para evitar um fundo a preto apos arotacao, a imagem original e inicialmente expandida com o valor dos seus pixels na fronteira para que

18

Page 20: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

(a) (b)

(c) (d)

Figura 2.4: Exemplo de rotacao de duas imagens segundo o azimute do Sol. (a) e (c) Imagens originaisE0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288 rodadas segundoo azimute do Sol respectivamente.

futuramente nao aparecam falsas deteccoes devido a transicoes bruscas de iluminacao. Aplicandoeste procedimento, todas as imagens ficarao alinhadas com a mesma direccao (horizontal) e sentido(da esquerda para a direita) da fonte de luz, ver dois exemplos na Figura 2.4. Devido a rotacao,a dimensao das imagens aumenta e, consequentemente, aumenta o tempo de computacao para adeteccao de crateras pois existe um maior numero de blocos na imagem a classificar.

2.4 Caracterısticas da Imagem

2.4.1 Mascaras Rectangulares

A extraccao de caracterısticas da imagem e feita atraves de mascaras semelhantes as propostaspor P.Viola e M.Jones [22]. Estas caracterısticas foram inicialmente propostas por Papageorgiou et al.[21] e sao tambem denominadas por caracterısticas de Haar (Haar-like features), pois o seu valor ecalculado de forma semelhante aos coeficientes de uma Transformada de Haar. Nesta dissertacaosao utilizados cinco tipos de mascaras diferentes, ver Figura 2.5, sendo possıvel variar a posicao edimensao de cada mascara no interior da imagem.

Estas mascaras sao caracterizadas pelos seus coeficientes, o coeficiente na zona branca e 1, nazona a preto e -1 e nas restantes zonas e zero. As mascaras podem alterar a sua forma em altura,

19

Page 21: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

(a) Tipo 1 (b) Tipo 2 (c) Tipo 3 (d) Tipo 4 (e) Tipo 5

(f) Referencias

Figura 2.5: Em cima, de (a) a (e), os varios tipos de mascaras. Em baixo (f): um exemplo de umamascara do Tipo 1 e a representacao dos respectivos pontos de referencia necessarios a definicaodos rectangulos.

comprimento, e localizacao dentro da janela. Nesta dissertacao e criado um conjunto de mascaras dedimensao N: m = {m1, · · · ,mj , · · · ,mN}. Cada uma dessas mascaras e definida pelos seus pontosde referencia (vertices dos rectangulos) e o seu tipo. A forma como sao geradas as varias mascarasrectangulares (m) sera explicada na seccao 2.7. A localizacao e tamanho de cada mascara estaodefinidos pelos seus pontos de referencia. O valor da caracterıstica fj localizada num ponto (x, y)da imagem e o resultado da filtragem linear da imagem I com a mascara mj nessa localizacao. Afiltragem linear de uma imagem I com uma mascara M , de tamanho a × b, na localizacao (x, y) edada por:

f(x, y) =a∑u=1

b∑v=1

M(u, v)I(x+ u− 1, y + v − 1) (2.1)

A resposta da filtragem linear num ponto e calculada pela soma do produto dos coeficientes damascara com os correspondentes pixels da imagem coberta pela mascara. No caso destas mascaras,o resultado da filtragem linear e simplesmente o somatorio do valor de todos os pixels dentro da zonabranca subtraıdo pelo somatorio do valor de todos os pixels dentro da zona preta. Aplicando a teoriaao exemplo da Figura 2.5(f), o calculo da respectiva caracterıstica e dado por:

fj(I) =∑

rectI(CDEF )−∑

rectI(ABCD) (2.2)

Sendo que∑rectI(ABCD) e

∑rectI(CDEF ) representam o somatorio de todos os pixels da

imagem I dentro do rectangulo definido por ABCD e CDEF , respectivamente. Executar o somatoriode todos os pixels dentro de um rectangulo requer um tempo de computacao proporcional ao tamanhodos rectangulos. O resultado da filtragem linear com este tipo de mascaras pode ser executado deforma eficiente utilizando o conceito de imagem integral introduzido em [22].

2.4.2 Extraccao de caracterısticas atraves da imagem integral

A imagem integral e uma imagem auxiliar construıda a partir da imagem original. O valor daimagem integral J no ponto (x, y) e a soma das intensidades de todos os pixels da imagem I acima ea esquerda de (x, y). Assim:

J(x, y) =∑

x′≤x,y′≤y

I(x′, y′) (2.3)

20

Page 22: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

A imagem integral permite calcular o somatorio de todos os pixels dentro de um rectangulo uti-lizando apenas 3 operacoes1 com quatro pontos de referencia. Aplicando a definicao de imagemintegral (2.3) a equacao (2.2), o calculo do valor das caracterısticas passa a ser executado com umtempo de computacao constante e com um numero fixo de operacoes independentemente do tamanhoda imagem ou dos rectangulos, ver equacao (2.4). As caracterısticas de tipo 1 e 2 (dois rectangulos)necessitam de seis pontos de referencia e sete operacoes. As de tipo 3 e 4 (tres rectangulos) neces-sitam de oito pontos de referencia e nove operacoes e as caracterısticas de tipo 5 (oito rectangulos)necessitam de nove pontos de referencia e dez operacoes.

fj(I) = [J(F )− J(D)− J(E) + J(C)]− [J(D)− J(B)− J(C) + J(A)] (2.4)

2.5 Classificador boosting

Neste trabalho utiliza-se um algoritmo de classificacao baseado em boosting. O algoritmo imple-mentado e semelhante ao apresentado por P. Viola e M. Jones [22] sendo uma variante do Ada-Boost. O algoritmo AdaBoost foi publicado por Freund e Schapire em 1995 [25] e o seu nomeprovem do termo boosting adaptativo (Adaptive Boosting). O algoritmo procura adaptar uma funcaode classificacao a um conjunto de treino composto por elementos pesados. Funcionando de formaiterativa, o algoritmo escolhe em cada iteracao uma funcao de classificacao ”fraca” (weak classifica-tion function) com o menor erro de classificacao. O termo ”adaptativo” surge da actualizacao dospesos de forma a aumentar o peso dos elementos mal classificados para a iteracao seguinte, destaforma os classificadores seguintes irao focar-se nos elementos de treino mal classificados pelos clas-sificadores escolhidos nas rondas anteriores. P. Viola e M. Jones utilizam o AdaBoost para seleccaode caracterısticas ao restringirem as funcoes de classificacao ao uso de uma unica caracterısticadenominando-as por classificadores fracos. Assim, os classificadores de boosting tomam a decisaocom base num comite de classificadores simples designados por classificadores fracos. Denominam-se fracos pois o seu desempenho e pobre, sendo pouco provavel que apenas um consiga classifi-car correctamente todo o conjunto de treino. O classificador fraco hj e definido por uma paridadep ∈ {−1, 1}, uma caracterıstica fj e um threshold θj , sendo I a imagem, ou o bloco de imagem, a serclassificado:

hj(I) =

{1 se p · fj(I) ≥ p · θj0 caso contrario

(2.5)

Recapitulando, inicialmente sao atribuıdos pesos para cada elemento de treino. O algoritmo de bo-osting constroi o classificador final de forma iterativa, seleccionando em cada iteracao o classificadorfraco com menor erro de classificacao. Em cada iteracao cada classificador fraco escolhe o melhorthreshold de forma a obter o menor erro possıvel, este processo e descrito na seccao seguinte. Nofim de cada iteracao atribui-se um peso a cada padrao de treino. Os padroes mal classificados veemo seu peso aumentado e os padroes bem classificados veem o seu peso reduzido. Na iteracao se-guinte e escolhido um classificador fraco que se concentre na classificacao correcta dos elementoscom maior peso (mal classificados pelo classificador nas iteracoes anteriores). A cada classificadorfraco seleccionado j e atribuıdo um determinado peso αj (ver descricao do algoritmo na tabela 2.1).Assim, no final de T iteracoes obtem-se um classificador com um maximo de T classificadores fracos2

1Neste contexto o termo operacoes refere-se a adicoes e subtraccoes.2O mesmo classificador fraco podera ser seleccionado mais do que uma vez pelo algoritmo e com diferentes thresholds

associados, o que faz com que, apos T iteracoes possam ter sido escolhidos menos de T classificadores.

21

Page 23: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

cada um associado a uma unica caracterıstica. As caracterısticas seleccionadas sao as que melhorseparam as duas classes do conjunto de treino (crateras e terreno de fundo).

Tabela 2.1: Algoritmo para treino boosting, adaptado de Viola e Jones [22]Consideremos um conjunto de treino constituıdo por M imagens de treino e respectivaclasse binaria {(I1, y1), ..., (IM , yM )} em que yi = 0 se Ii nao contiver uma cratera e yi = 1caso contrario.

• Procede-se a extraccao de todas as caracterısticas em todos os elementos de treino.

• Seja p o numero de elementos de treino positivos e n o numero de elementos detreino negativos. Inicia-se os pesos w de todos os elementos do conjunto da seguinteforma:

w1,i ={ 1

2·p se elemento i for positivo1

2·n se elemento i for negativo(2.6)

• Para t = 1, · · · , T :

– Normaliza-se os pesos atribuıdos aos exemplos de treino wt:

wt,i =wt,i∑Mj=1 wt,j

(2.7)

– Para cada caracterıstica j treina-se o classificador hj correspondente e escolhe-se o classificador ht com menor erro εt, ver seccao seguinte. O erro declassificacao e dado por:

εj =M∑i

wt,i · |hj(Ii)− yi| (2.8)

– Actualiza-se os pesos dos exemplos para a iteracao seguinte wt+1, sendo ei = 0se o exemplo Ii for classificado correctamente por ht, ei = 1 caso contrario, eβt = εt

1−εt:

wt+1,i = wt,i · β1−eit (2.9)

– Atribui-se um peso αt = log( 1βt

) ao classificador ht.

A funcao discriminante final H(I) (2.10), e obtida atraves da combinacao linear das classificacoesgeradas pelos classificadores fracos escolhidos a cada iteracao, ponderada com os pesos α. O clas-sificador final C(I) utiliza o resultado da funcao discriminante H, seguido de um threshold definido poruma percentagem µ do somatorio dos pesos α, para gerar a decisao final (2.11).

H(I) =T∑t=1

αt · ht(I) (2.10)

C(I) =

{1 se H(I) ≥ µ ·

∑Tt=1 αt (0 ≤ µ ≤ 1)

0 caso contrario(2.11)

Normalmente o valor escolhido para µ e 0.5. Diminuindo µ, reduzem-se os erros de falhas dedeteccao mas aumenta-se o numero de deteccoes falsas. Quando se aumenta µ, diminui-se o numerode falsas deteccoes mas aumenta-se o numero de falhas de deteccao. No final e necessario executaruma analise aos varios resultados em funcao de µ de forma a decidir sobre o compromisso entre taxade deteccoes correctas e taxa de falsas deteccoes. A Figura 2.6, mostra o resultado de classificacao

22

Page 24: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

de uma imagem com um classificador de boosting sem analise multi-escala. Neste exemplo verifica-se

Figura 2.6: Resultado da classificacao da imagem MOC-R1004288 (Zona B) com um classificadorboosting sem analise multi-escala, bloco de dimensao 20× 20.

a deteccao de todas as crateras com escala semelhante entre si. No entanto varias deteccoes ocorremem torno de uma cratera. Esta dificuldade e corrigida com um pos-processamento dos resultados(seccao 2.8).

2.5.1 Aprendizagem

Como foi referido anteriormente, a aprendizagem e feita atraves dos classificadores fracos queestao associados as diferentes caracterısticas. Em cada iteracao, os pesos dos elementos de treinomudam e por isso e necessario calcular, em todas as iteracoes, o threshold optimo para cada clas-sificador fraco. Para cada classificador fraco calcula-se o valor da caracterıstica correspondente emtodos os M exemplos do conjunto de treino. Os elementos sao entao ordenados por ordem crescentedo valor da caracterıstica. Para cada elemento ordenado e calculado o erro de classificacao utilizandocomo limiar o valor da caracterıstica nesse exemplo. O erro e ponderado segundo os pesos actuaisdos exemplos de treino e e avaliado segundo as duas paridades possıveis. Relembrando (2.5), comparidade p = 1 o classificador fraco retorna 1 (cratera) quando o valor da caracterıstica e superior aothreshold, portanto sao erros todos os valores abaixo desse threshold correspondentes a exemplosde crateras e tambem todos os exemplos acima desse threshold correspondentes a exemplos falsos.Concluindo, para p = 1 erro de classificacao com threshold igual ao valor da caracterıstica no exemplok vem concretizado na equacao (2.12). Para a paridade p = −1 e precisamente o inverso, equacao(2.13).

Ep=1(k) =k∑i=1

wiyi +n∑

i=k+1

wi(1− yi) (2.12)

Ep=−1(k) =k∑i=1

wi(1− yi) +n∑

i=k+1

wiyi (2.13)

Sendo que wi representa o peso de elemento i. O erro e calculado para todos os valores da ca-racterıstica nos exemplos do treino, sendo que o threshold e a paridade optima para o classificador

23

Page 25: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

associado a essa caracterıstica sao os que minimizam o erro de classificacao (2.14). Este procedi-mento e executado para todos os classificadores fracos e, a cada iteracao, e escolhido o que menorerro apresenta com o threshold e paridade optimos.

mink ∈ {1, ..., n}p ∈ {−1, 1}

Ep(k) (2.14)

2.6 Classificador boosting em cascata

Com o classificador em cascata, pretende-se diminuir o tempo de processamento necessariopara classificar uma imagem e avaliar as diferencas de desempenho em relacao ao classificador deboosting simples, comparando os resultados de deteccoes correctas e falsos alarmes.

O classificador em cascata e constituıdo por uma sequencia de camadas (layers), sendo que cadacamada contem um classificador de boosting diferente. Um bloco da imagem sera classificado comocratera se for avaliado correctamente em todas as camadas do classificador. Se em qualquer camadao bloco for classificado como nao cratera e de imediato excluıdo, nao sendo avaliado nas camadasseguintes. A maioria dos blocos de imagem que nao contem crateras sao rejeitados nas primeiras ca-madas, avaliando um pequeno numero de caracterısticas, nao perdendo tempo nos blocos ”faceis”declassificar. As ultimas camadas estao treinadas para diferenciar os exemplos falsos mais ”difıceis”, dascrateras. Um diagrama representativo de um classificador em cascata com 3 camadas e apresentadona Figura 2.7.

Figura 2.7: Representacao de um classificador em cascata com 3 camadas

Na Tabela 2.2 e descrito o algoritmo de treino para aprendizagem com um classificador em cascata.Este algoritmo permite ao utilizador definir uma taxa mınima de deteccao e uma taxa maxima defalsas deteccoes toleradas em cada camada, e tambem a taxa final de falsas deteccoes. Permitetambem especificar o numero mınimo de caracterısticas a utilizar no classificador de boosting em cadacamada. Ao contrario do algoritmo de boosting, cuja condicao de paragem e o numero de iteracoesespecificado, o criterio de paragem no treino de um classificador de boosting em cascata e satisfazera taxa final de falsas deteccoes especificada pelo utilizador ou o numero de camadas indicado.

A Figura 2.8 mostra o resultado da classificacao de uma imagem (sem multi-escala) de um classi-ficador boosting em cascata. Tambem neste exemplo sao visıveis as multiplas deteccoes em torno deuma cratera.

24

Page 26: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Tabela 2.2: Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22]Divide-se o conjunto de treino em conjunto de treino positivo P e conjunto de treino nega-tivo N .

• Escolhe-se um valor para Fmax(taxa maxima aceitavel de falsos positivos) e paraDmin(taxa mınima aceitavel de deteccao) em cada camada. Escolheu-se Fmax = 0.3e Dmin = 0.99.

• Escolhe-se a taxa final de falsas deteccoes Ffinal desejada. Escolheu-se Ffinal =0.0001.

• Iniciam-se as variaveis F (0) = 1.0, D(0) = 1.0 e i = 0.

• Define-se o numero mınimo de caracterısticas a avaliar em cada camada:

Lmin(1) = 15, Lmin(2) = 20, Lmin(3) = 25, · · · → Lmin = [15, 20, 25, ...] (2.15)

• Enquanto F (i) ≥ Ffinal:

– i = i+ 1;

– n(i) = Lmin(i);F (i) = F (i− 1);

– Enquanto F (i) ≥ Fmax · F (i− 1) :

* Utiliza-se os conjuntos P e N para treinar um classificador com n(i) carac-terısticas utilizando o algoritmo de boosting.

* Avalia-se o actual classificador em cascata para determinar D(i) e F (i).

* Desce-se o threshold da camada i ate o classificador em cascata actual teruma taxa de deteccao de pelo menos Dmin ×D(i− 1).

* n(i) = n(i) + 1

– Vaza-se o conjunto N .

– Se F (i) ≥ Ffinal: avalia-se o actual classificador em cascata no conjunto denegativos e colocar em N os mal classificados.

Figura 2.8: Resultado da classificacao de imagem MOC-R1004288 (Zona B) como um classificadorboosting em cascata sem analise multi-escala.

25

Page 27: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

2.7 Classificacao Multi-Escala

Os classificadores anteriores sao adequados para detectar crateras com dimensoes identicas.Para lidar com grandes variacoes de escala usa-se um classificador independente de escala. O re-conhecimento de padroes em varias escalas pode ser obtido atraves de diversos classificadores (umpara cada escala) ou utilizando uma piramide de escalas a serem classificadas pelo mesmo clas-sificador. Nesta dissertacao um unico classificador e obtido, treinado com padroes multi-escala. Oclassificador obtido e utilizado para classificacao de todos os blocos de imagem em diversas esca-las3. Em todos os blocos de imagem sao extraıdas as mesmas caracterısticas sem ser necessariore-amostrar todas as imagens para a mesma resolucao, desta forma nao se perde informacao sobre aimagem original. A extraccao do valor de todas as caracterısticas num bloco de imagem e efectuadaatraves do escalamento das mascaras para a escala S do elemento de treino, seguindo-se o calculodo seu valor e normalizacao atraves da divisao por S2.

O conjunto de mascaras m e gerado num bloco quadrado de 1× 1 (escala S = 1pixel2) variando aaltura, largura, e coordenadas de posicao de 0.1 em 0.1, construindo todas as combinacoes possıveis,sao geradas 3216 mascaras rectangulares4 , ou seja, m = {m1, · · · ,m3216}.

Desta forma o conjunto de treino e constituıdo por imagens de crateras e de exemplos falsos aescalas diferentes. Para cada elemento de treino, cada mascara e escalada5 para a escala corres-pondente do elemento, seguindo-se o calculo da caracterıstica f nessa escala divido por S2 para queo valor fique normalizado, caracterıstica normalizada f0. O classificador e portanto treinado com osvalores das caracterısticas normalizados em funcao da escala. O classificador final obtido do treinopode ser utilizado para detectar crateras a diferentes escalas numa imagem desde que a classificacaoseja feita sobre o valor das caracterısticas normalizado. A Figura 2.9 ilustra um esquematico para ocalculo e normalizacao do valor das caracterısticas.

Figura 2.9: Representacao do calculo e normalizacao de caracterısticas.

Para executar o varrimento de uma imagem da superfıcie de Marte comeca-se por deslocar umbloco quadrado de escala S = 10 (10 × 10 pixel) ao longo de toda a imagem com um desloca-mento δ = 1 pixel. Apos classificar todos os blocos a escala S da imagem executa-se de novo omesmo procedimento com diferentes escalas relacionadas por um factor multiplicativo de 1.25 entresi (S′ = 1.25 · S) ate atingir a escala S = 400. A dimensao dos blocos de varias escalas e semprearredondada a dezena para evitar problemas de arredondamento no escalamento das mascaras. Oresultado final da classificacao de uma imagem inteira e um conjunto de deteccoes d. Uma deteccao

3A escala S e a dimensao do bloco quadrado.4O total de mascaras e obtido a partir de todas as combinacoes possıveis de altura, largura e coordenadas de posicao.

Numero de mascaras para cada tipo de mascara: Tipo 1-880, Tipo 2-880, Tipo 3-528, Tipo 4-528 e Tipo 5-400. Totalizando3216 mascaras.

5Para escalar a mascara para um elemento de escala S=K basta multiplicar as coordenadas dos pontos de referencia por K.

26

Page 28: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

e definida pelas coordenadas de localizacao (x, y), pela escala S e pelo valor obtido na funcao dis-criminante H do classificador, ou seja, um conjunto de N deteccoes pode ser representado pord = {(x1, y1, S1, H1), ..., (xN , yN , SN , HN )}. A Figura 2.10 mostra o resultado da classificacao deuma imagem com um classificador boosting usando multi-escala. De novo sao visıveis as multiplasdeteccoes em torno de uma cratera.

Figura 2.10: Resultado da classificacao de imagem MOC-R1004288 (Zona B) com um classificadorboosting com analise multi-escala.

2.8 Pos-Processamento

Devido a pouca sensibilidade do classificador final face a pequenas variacoes de escala e posicao,multiplas deteccoes ocorrem em torno de uma cratera e a diferentes escalas. As multiplas deteccoesem torno de uma cratera devem ser agrupadas numa so. O agrupamento e feito atraves do valorda funcao discriminante obtida de cada deteccao, pois deseja-se manter apenas a deteccao commaior valor na funcao discriminante nesse local, ou seja, realizar uma supressao de nao maximoslocais. Os graficos da Figura 2.11 representam sob a forma de graficos tridimensionais um exemploda supressao de nao maximos aplicada as deteccoes obtidas apos classificacao de uma imagem. Adescricao generica do algoritmo para supressao de nao maximos desenvolvido encontra-se na tabela2.3. O algoritmo e um processo exaustivo de procura por maximos locais, para isso procura numavizinhanca, em localizacao (x, y) e tambem em escala (S), por deteccoes com maior valor na funcaodiscriminante H. Os valores utilizados para os intervalos de escala e localizacao foram obtidos portentativa-erro.

Apos o agrupamento de pontos e tambem necessario rodar as deteccoes e a imagem para asua orientacao inicial, por isso a imagem e as coordenadas das deteccoes sao rodadas do azimutecorrespondente a imagem. A Figura 2.12 mostra o resultado do pos-processamento (supressao denao maximos e rotacao da imagem para a sua orientacao inicial) aplicado ao resultado apresentadona Figura 2.10.

27

Page 29: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

(a) (b)

(c) (d)

Figura 2.11: Supressao de nao maximos. Em (a) e (b) as deteccoes estao representadas em (x, y)e escala (S). Em (a) as deteccoes apos a classificacao de uma imagem. Em (b) o resultado apos asupressao de nao maximos. Nos graficos (c) e (d) as deteccoes estao representadas em localizacaox/y, escala S e funcao discriminante H. Em (c) as deteccoes apos a classificacao de uma imagem.Em (b) o resultado apos a supressao de nao maximos.

Figura 2.12: Resultado da classificacao da imagem MOC-R1004288 (Zona B) com um classificadorboosting a varias escalas com pos-processamento.

28

Page 30: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Tabela 2.3: Procedimento para o agrupamento de deteccoes apos classificacao de uma imagem como classificador final.

Dadas as deteccoes apos o varrimento a uma imagem, relembrando a seccao 2.7. Denote-se d o conjunto das deteccoes encontradas numa imagem I, sendo dj = (xj , yj , Sj , Hj):

• Inicia-se j = 1 e i = 1. Avaliar a distancia ρ de dj a deteccao seguinte dj+i calculandoa distancia euclidiana:

ρ =√

(xj − xj+i)2 + (yj − yj+i)2 (2.16)

– Se as duas seguintes condicoes:ρ ≤ Sj

2

0.7× Sj ≤ Sj+i ≤ 2.5× Sjforem verificadas, considera-se uma deteccao vizinha. Neste caso escolhe-sea deteccao com maior resultado na funcao discriminante H, ou seja:

* Se Hj < Hj+i elimina-se a deteccao j do conjunto das deteccoes.

* Caso contrario elimina-se a deteccao dj+i do conjunto.

• Incrementa-se i (i = i+ 1).

• Repete-se este procedimento para as deteccoes restantes (j = j + 1 e reinicializari = 1), ate nao existirem mais deteccoes para agrupar.

29

Page 31: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Capıtulo 3

Base de Dados e Conjuntos de Treino

e Teste

Existem actualmente milhares de imagens da superfıcie de Marte capturadas pelas sondas queorbitam o planeta, nomeadamente a Mariner 9, Viking 1 e Viking 2, Mars Global Surveyor, MarsOdissey, Mars Express e a Mars Reconnaissance Orbiter. A 15 de Dezembro de 2005 existia umtotal de 329240 imagens, a Mars Global Surveyor que iniciou a sua orbita em torno de Marte a 12 deSetembro de 1997 capturou a imagem 100000 em 20 Novembro de 2001. As imagens utilizadas paraeste estudo (101 no total) sao uma pequena amostra da superfıcie deste planeta.

A definicao dos conjuntos de treino e um passo fundamental no desenho do classificador. A formacomo sao gerados necessita de ser bem definida e explicada. O maior problema da geracao de con-juntos de treino nao reside nos exemplos de crateras (exemplos verdadeiros) mas sim nos exemplosfalsos (nao crateras). Os exemplos positivos sao facilmente criados a partir da informacao disponıveldo Ground Truth. Definir quais os exemplos falsos que devem ser incluıdos no conjunto de treino ede que forma sao criados, e um aspecto fundamental. Nas seguintes seccoes sao introduzidos edefinidos dois tipos de conjuntos de treino: o conjunto de treino automatico e iterativo.

3.1 Imagens e Condicoes de Aquisicao

O metodo e testado apenas sobre as imagens obtidas pela MOC, no futuro pretende-se aplicaro metodo em imagens de diferentes sondas como em [20]. As imagens provem de quatro zonasdiferentes da superfıcie de Marte intituladas: Zona A, Zona B, Zona C e Zona D (visualizar Figura 3.1).Os conjuntos de imagens utilizadas sao os mesmos de L. Bandeira et al. [18] e foram escolhidas com aajuda do MIMS (Mars Image Mining System) [23], uma base de dados relacional de enderecos internetpara a maioria das imagens obtidas das diversas missoes efectuadas que permitiu obter facilmentetodas as imagens MOC disponıveis para as quatro regioes indicadas. Nesse trabalho [18] algumasimagens ruidosas foram excluıdas do conjunto. O numero de imagens em cada zona e diferente (11,18, 9 e 63 para as zonas A, B, C e D, respectivamente) totalizando 101 imagens.

As imagens sao apresentadas numa escala de cinzento com 256 nıveis e a resolucao espacialde cada uma varia entre os 200 e 300 m/pixel. O tamanho de todas as imagens (excepto duas) e de480×480 pixels e cobrem uma area total de cerca de 1500000 km2. Os cientistas dividem a historia de

30

Page 32: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 3.1: Superfıcie de Marte e as quatro zonas utilizadas (A,B,C e D).

Marte em tres perıodos geologicos: Noachian(a mais de 3.5 mil milhoes de anos), Hesperian(entre 3.5e 1.8 milhoes de anos) e Amazonian(desde a 1.8 mil milhoes de anos ate hoje). As zonas escolhidasA, B, C e D, correspondem a superfıcies do mesmo perıodo geologico (Hesperian), no entanto mesmodentro da mesma zona, as superfıcies revelam uma grande diversidade de estruturas geologicas.

Todas as imagens MOC disponıveis na internet estao acompanhadas de informacoes sobre ascondicoes de aquisicao tais como longitude, latitude, escala, azimute do Sol, resolucao e outros as-pectos, ver Figura 3.2. Foi criado um ficheiro de informacao com o nome as imagens utilizadas e orespectivo azimute solar, factor essencial para o pre-processamento aplicado as imagens para quetodas fiquem alinhadas com a mesma direccao da fonte de luz. Informacao detalhada sobre todas asimagens utilizadas pode ser consultada no Anexo I desta dissertacao.

Figura 3.2: Informacao disponıvel para a imagem M2100403. No rectangulo azul esta o valor doazimute solar.

3.2 Identificacao Manual de Crateras

Para poder gerar o conjunto de treino e necessario criar exemplos de crateras, ou seja, blocosde imagens contendo crateras, esses exemplos sao provenientes das imagens definidas para treino.

31

Page 33: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Para cada uma das 101 imagens foi criada e guardada informacao que nesta dissertacao se designapor Ground Truth (GT). A informacao de GT inclui a localizacao (coordenadas x e y) e diametro d (empixels) de todas as crateras identificaveis visualmente em cada uma das imagens. Esta informacao foiproduzida de forma manual, no contexto desta dissertacao, atraves de um script desenvolvido ondee pedido ao utilizador que efectue a marcacao do centro das crateras e de dois pontos sobre o anelda cratera em margens opostas, de forma a calcular o seu diametro pela distancia entre esses doispontos. O GT e importante para o treino do classificador e para a sua avaliacao no conjunto de teste.O procedimento para a avaliacao automatica do desempenho do classificador no conjunto de testee explicado em detalhe no capıtulo 4. No GT construıdo para cada imagem estao marcadas todasas crateras visıveis, mesmo crateras que saem do domınio da imagem e crateras muito pequenas (2pixels de diametro). As crateras muito pequenas foram marcadas numa segunda fase, com um scriptsemelhante ao da primeira fase de recolha de informacao utilizando um zoom sobre as zonas onde seencontram as crateras pequenas. No Anexo II desta dissertacao e apresentado o GT sobreposto nascorrespondentes imagens utilizadas.

3.3 Validacao Cruzada

Uma vez que o metodo proposto se baseia em aprendizagem e necessario definir as imagens aserem utilizadas para o conjunto de treino, que sera utilizado pelo algoritmo de aprendizagem e asimagens de um conjunto de teste onde sera avaliado o desempenho dos classificadores finais. Dadoque o conjunto de imagens e pequeno, decidiu-se que 75% das imagens serao utilizadas para treino eos restantes 25% para teste. Para que seja possıvel utilizar todas as imagens como teste pretende-se

Figura 3.3: Diagrama dos ensaios para validacao cruzada dos resultados.

realizar uma validacao cruzada de resultados realizando quatro ensaios. Como existem quatro zonasdistintas, cada uma sera dividida em 75% para treino e 25% para teste em cada, pelo que no totalaproximadamente 75 imagens serao utilizadas no treino e 25 para teste em cada ensaio. O conjuntode imagens e dividido em quatro subconjuntos, cada um com 25% (um quarto) das imagens de cadazona. Em cada ensaio, um dos quatro subconjuntos e utilizado como conjunto de teste e os restantessubconjuntos formam o conjunto de treino. Desta forma cada imagem e utilizada no teste uma vez etres vezes no treino, ver ilustracao na Figura 3.3. A divisao 75% para treino e 25% para teste nao eexacta em cada uma das zonas sendo a diferenca compensada no ultimo ensaio, Tabela 3.1.

32

Page 34: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Tabela 3.1: Tabela com a divisao do numero de imagens utilizadas em cada ensaio por zona.

Zona Nº Total de Imagens Ensaio 1 Ensaio 2 Ensaio 3 Ensaio 4

Treino Teste Treino Teste Treino Teste Treino Teste

A 11 8 3 8 3 8 3 9 2

B 18 13 5 13 5 13 5 14 4

C 9 7 2 7 2 7 2 8 1

D 63 47 16 47 16 47 16 48 15

3.4 Definicao de Conjunto de Treino e de Escalas

Um conjunto de treino e definido por pares de exemplos I (blocos de imagens) e respectiva etiquetadesejada y. As imagens dadas como exemplos sao blocos de uma imagem original centradas nocentro da cratera e com uma determinada escala. Define-se y = 1 quando o bloco contem umacratera centrada no seu centro (elemento positivo) e y = 0 para exemplos de nao-crateras (elementonegativo). O conjunto de treino φ com m elementos pode ser representado da seguinte forma:

φ = {(I1, y1), ..., (Im, ym)} (3.1)

O bloco Ii tem dimensoes Si × Si em que Si e designada por escala do bloco i. Surge portantoa necessidade de definir uma relacao entre o diametro dos exemplos de crateras e a dimensao S

correspondente ao bloco que as contem. A dimensao dos blocos e calculada com base em doiscriterios: em primeiro lugar, a dimensao dos blocos contendo uma cratera deve ter pelo menos 30%de margem para alem do diametro da cratera em todos os sentidos ( ver ilustracao na Figura 3.4) , ou

Figura 3.4: Definicao da escala adequada a um exemplo de cratera de impacto

seja, a dimensao do bloco deve possuir pelo menos o diametro da cratera mais duas vezes 30% doseu diametro d, ver (3.2). Em segundo lugar, a dimensao do bloco e sempre arredondada a dezenasuperior. A necessidade do arredondamento a dezena surge para evitar arredondamentos ”forcados”no escalamento de mascaras binarias que podem deformar a sua definicao normalizada.

S ≥ d+ 0.3d+ 0.3d⇔ S ≥ 1.6d. (3.2)

33

Page 35: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

3.5 Conjunto de Treino Automatico

Dada uma imagem com n crateras, sao elaborados facilmente n blocos com crateras escolhendoas dimensoes dos blocos de acordo com as regras anteriores; a Figura 3.5 mostra as primeiras 100crateras do conjunto de treino. A questao mais difıcil coloca-se na geracao de exemplos falsos.

Figura 3.5: Os primeiros 100 exemplos de crateras presentes no conjunto de treino CTA referente ao1º Ensaio.

Numa imagem quadrada de 480 pixels e possıvel gerar aproximadamente 480 × 480 = 230400 blo-cos de dimensao S a serem utilizados como elementos falsos para o conjunto de treino. Aplicando omesmo raciocınio a, por exemplo, oito escalas diferentes e a todas as 75 imagens terıamos um totalde 480×480×8×75 = 138240000 blocos de imagem. Por outras palavras, e obvio que uma imagem dasuperfıcie de Marte permite a definicao de um conjunto vasto de exemplos negativos. Colocar todosos exemplos possıveis a diversas escalas num conjunto de treino necessitaria de uma grande dispo-nibilidade de memoria e demoraria um longo tempo para treinar o classificador final. Por esta razaomuitas areas das imagens de treino nao serao usadas. Por outro lado, a maioria desses exemplos cor-responderiam a zonas homogeneas da superfıcie, mas deseja-se que o conjunto de treino contenhatambem exemplos difıceis de classificar tais como montanhas, vales ou irregularidades de terreno.

Numa fase inicial, opta-se por se definir manualmente os exemplos negativos. No entanto, aposalguns treinos efectuados com este procedimento, verifica-se que os exemplos falsos introduzidos noconjunto de treino desta forma nao sao suficientes para alcancar resultados satisfatorios no classifi-cador final. Verifica-se tambem que muitas das falsas deteccoes ocorridas na classificacao de umaimagem acontecem nas bordas nas crateras de grandes dimensoes. Por este motivo decide-se ela-borar um Conjunto de Treino Automatico (CTA) que gera exemplos falsos em torno dos exemplos decrateras enviadas para o conjunto de treino positivo. Mais concretamente, sao gerados 8 exemplos

34

Page 36: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 3.6: Exemplos falsos sobre os aneis de uma cratera. A verde o exemplo positivo de umacratera. A vermelho os exemplos falsos enviados para o conjunto de treino

falsos em torno de cada cratera sobre o seu anel, como se mostra na Figura 3.6. A existencia deum maior numero de exemplos negativos face aos positivos num conjunto de treino e compensada naexecucao do treino de boosting onde os pesos de cada elemento sao inicializados com um valor in-versamente proporcional ao numero total de exemplos do mesmo tipo. Isto quer dizer que, neste casoconcreto, o peso inicial dos elementos positivos e maior do que o dos elementos negativos, compen-sando a distribuicao do numero de elementos de cada classe. Por razoes de resolucao das crateras,nao sao introduzidas no conjunto de treino crateras de diametro inferior a 10 pixels nem crateras quenao estejam completamente incluıdas na imagem (crateras cortadas pelas bordas da imagem). Existetambem o cuidado de verificar que nao existe nenhuma cratera mais pequena perto dos aneis de umacratera, pois no caso de existir nao sao gerados os exemplos falsos sobre os seus aneis.

3.6 Conjunto de Treino Iterativo

Numa tentativa de melhorar o desempenho dos classificadores com a introducao de mais exem-plos no conjunto de treino, e definido um Conjunto de Treino Iterativo (CTI). E desejavel saber quaisos blocos nas imagens em que o classificador possui maior dificuldade em classificar correctamente.A partir da informacao do GT de cada imagem e possıvel avaliar automaticamente as deteccoes eadicionar falsas deteccoes ao conjunto de treino ja existente. O processo de avaliacao automaticodos resultados e explicado em detalhe na seccao 4.2. O metodo para geracao do CTI encontra-seesquematizado na Figura 3.7. Na primeira iteracao e executado um treino com o conjunto CTA. Ometodo utiliza as primeiras 10 caracterısticas do classificador obtido para classificar as imagens eidentificar automaticamente as deteccoes falsas ocorridas. Para cada imagem classificada, as cincodeteccoes falsas com maior valor na funcao discriminante sao adicionadas ao conjunto de treino jaexistente (neste caso o CTA). Apos executar este procedimento em todas as imagens do conjunto detreino obtem-se um novo conjunto de treino, o CTI1, constituıdo pelos exemplos do CTA mais uma ex-tensao de exemplos difıceis de classificar. Na iteracao seguinte e executado um treino com o conjuntoanterior CTI1 e repetido o procedimento, gerando um novo conjunto CTI2 e assim sucessivamente.

35

Page 37: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 3.7: Esquematico do metodo utilizado para geracao de conjuntos de treino iterativos

36

Page 38: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Capıtulo 4

Resultados Experimentais

Neste capıtulo sao definidas as medidas de avaliacao de resultados, bem como a forma como eavaliada uma deteccao (correcta ou incorrecta) pelo avaliador automatico desenvolvido, que e tambemessencial para a construcao dos conjuntos de treino CTI. Apresentam-se os resultados globais obti-dos com classificadores boosting e boosting em cascata treinados com os varios conjuntos de treinogerados. Variaveis como o numero de iteracoes no classificador de boosting e o passo de desloca-mento do bloco na deteccao de crateras em imagens sao testadas com diferentes valores para um dosclassificadores obtidos. Por fim apresenta-se um pequeno teste com imagens provenientes de outrassondas e uma crıtica aos resultados.

4.1 Taxa de Deteccao e Taxa de Falsas Deteccoes

Para a avaliacao do desempenho de cada classificador atraves das suas deteccoes, nao sao con-sideradas as crateras que saem dos limites da imagem nem crateras com diametro inferior a 7 pixels.Sao utilizados dois tipos de conceitos em medidas de desempenho para avaliacao dos resultados,precisao (4.1) e sensibilidade (4.2).

precisao=#{Deteccoes Relevantes} ∩ {Deteccoes}

#{Deteccoes}(4.1)

sensibilidade=#{Deteccoes Relevantes} ∩ {Deteccoes}

#{Deteccoes Relevantes}(4.2)

A medida de precisao e uma avaliacao de deteccoes correctas ou incorrectas face ao numero dedeteccoes obtidas, enquanto que a medida de sensibilidade pondera o numero de deteccoes correctasou incorrectas face ao numero de deteccoes relevantes. Sao calculados dois indicadores, TDR (TrueDetection Rate) taxa de deteccoes correctas (4.3) e o FDR (False Detection Rate) taxa de falsasdeteccoes (4.4). A TDR e uma medida de sensibilidade e a FDR uma medida de precisao.

TDR =TDGT⇔ TDR(%) =

TDGT× 100 (4.3)

FDR =FD

TD + FD⇔ FDR(%) =

FDTD + FD

× 100 (4.4)

Sendo GT neste contexto o numero total de crateras existentes, TD (True Detection) o numero dedeteccoes correctas e FD (False Detection) o numero de falsas deteccoes. As formulas para TDR

37

Page 39: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

e FDR sao as mesmas que foram utilizadas em [18] de forma a permitir posteriores comparacoes.Para avaliar mais facilmente o desempenho e tambem calculado um factor indicativo da qualidadedo classificador (Q). Deseja-se que um classificador possua uma taxa de deteccao alta e uma taxade falsos negativos baixa, portanto a diferenca entre estas duas medidas deve ser o mais elevadopossıvel:

Q = TDR− FDR, Q ∈ [−1, 1] (4.5)

4.2 Avaliacao Automatica das Deteccoes

Embora o conjunto de imagens seja pequeno relativamente ao numero total de imagens existentesda superfıcie de Marte, avaliar manualmente os resultados para varios classificadores nas 101 ima-gens seria um trabalho exaustivo em termos de tempo e sujeito a erros humanos. Por este motivo, epara ser possıvel construir o conjunto de treino CTI, e desenvolvido um algoritmo simples de avaliacaoautomatica das deteccoes. A descricao simplificada deste algoritmo encontra-se na Tabela 4.1. Oobjectivo deste algoritmo e decidir com base no GT se uma deteccao e correcta ou se e uma falsadeteccao, comparando a distancia das deteccoes e a escala da deteccao relativamente ao diametrodas crateras existentes na imagem. O algoritmo procura deteccoes na vizinhanca de cada cratera noGT e verifica se a escala da deteccao e adequada ao seu diametro1, ver na seccao 3.4 a equacao(3.2), se nao verificar estas duas condicoes e considerada deteccao falsa.

Tabela 4.1: Algoritmo desenvolvido para a avaliacao automatica dos resultados.Sendo d = {(x1, y1, S1, H1), ..., (xn, yn, Sn, Hm)} o conjunto de m deteccoes resultante daclassificacao uma imagem I com um classificador e gt = {(x1, y1, D1), ..., (xn, yn, Dn)} oGround Truth da imagem I contendo n crateras localizadas nas coordenadas (x, y) comdiametro D. Iniciar j = 1 e k = 0.

• Enquanto j ≤ n:

1. Averiguar a escala adequada S ao elemento gtj atraves da equacao (3.2) defi-nida anteriormente na seccao 3.4, equacao (3.2).

2. Procurar por deteccoes numa vizinhanca de S2 atraves da distancia euclideana,

ver equacao (2.16) na seccao 2.8. Se nao houver vizinhos, j = j + 1 regressara 1.

3. Averiguar se a escala das deteccoes vizinhas e adequada a escala do elementogtj . Caso nenhuma seja encontrada: j = j + 1⇒ voltar a 1.

- Se a escala das deteccoes vizinhas e adequada a escala do elemento gtjconsidera-se correcta a deteccao mais proxima, guardar a deteccao num vectorde deteccoes correctas e incrementar k.

- Caso nenhuma seja encontrada: j = j + 1⇒ voltar a 1.

• Apos percorrer todos os elementos do gt, o numero de deteccoes correctas e TD = ke o numero de falsas deteccoes e FD = m− k.

Este algoritmo pode ser aplicado apenas a crateras de dimensao igual ou superior a um deter-minado diametro d, neste trabalho 7 pixels, sendo que crateras detectadas abaixo desse limiar naocontam como deteccoes falsas nem correctas. Para ilustrar melhor a avaliacao dos resultados porparte do avaliador automatico criou-se o codigo de cores apresentado na Figura 4.1.

1A escala da deteccao e considerada valida se estiver dentro de um intervalo desde 0.7 ate 2.5 do diametro da cratera emquestao (valores obtidos por tentativa-erro).

38

Page 40: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 4.1: Legendagem para a avaliacao dos resultados obtidos numa imagem.

(a) (b)

(c) (d)

Figura 4.2: Classificacao de duas imagens: R1004288 da zona B e R1002799 da zona D, com oclassificador boosting obtido no 1º Ensaio com CTA (esquerda) e avaliacao automatica dos resultados(direita). Em (a) e (c) o resultado apos a classificacao e (c) e (d) a avaliacao automatica dos resultados.

Na Figura 4.2 e apresentado um exemplo de avaliacao automatica do resultado da classificacao deduas imagens com um classificador de boosting. No primeiro exemplo nao houve deteccoes falsas,mas no segundo, com o mesmo classificador, sete deteccoes foram avaliadas como sendo falsas enao foram detectadas quatro crateras de diametro igual ou superior a 7 pixels. Em ambos os casosforam detectadas algumas crateras de diametro inferior a 7 pixels. Com este procedimento e possıvelobter taxas de deteccao e de falsas deteccoes de forma automatica.

39

Page 41: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

4.3 Resultados com classificador boosting

Sao efectuados treinos para classificadores boosting com 50 iteracoes para cada um dos quatrosconjuntos de treino gerados: CTA, CTI1, CTI2 e CTI3, para os quatro ensaios obtendo 16 classifica-dores boosting no total. O tempo necessario para efectuar os treinos aumenta com o aumento donumero de exemplos no conjunto de treino mas demora em media aproximadamente tres horas a con-cluir. Nas Figuras 4.3 e 4.4 estao representadas as 10 primeiras caracterısticas que o classificadoresfinais obtidos com os conjuntos CTA e CTI3, respectivamente, escolheram no quarto ensaio realizado.

Figura 4.3: As 10 primeiras caracterısticas escolhidas com o classificador boosting treinado com CTA(4º Ensaio).

Figura 4.4: As 10 primeiras caracterısticas escolhidas com o classificador boosting treinado com CTI3(4º Ensaio).

Verifica-se em geral que as caracterısticas escolhidas possuem um significado logico. Todas ascaracterısticas concentram-se em transicoes de iluminacao provocadas por sombras dos aneis dascrateras. Como as imagens sao alinhadas segundo o azimute do sol, as transicoes de intensidadesde luz sao maioritariamente na horizontal e por isso se verifica que a maioria das caracterısticas es-colhidas sao baseadas em transicoes horizontais (caracterısticas de tipo 2 e 4). No entanto tambemforam seleccionadas caracterısticas baseadas em transicoes diagonais (caracterısticas de tipo 5). Ne-nhuma caracterıstica do tipo 3 (duas transicoes verticais) foi seleccionada nas figuras apresentadas.

Aplicando os varios classificadores finais obtidos as 25 imagens de teste nos quatro ensaios, fa-zendo variar o threshold dos classificadores finais atraves de µ, calcula-se a media sobre os quatroensaios para cada valor de µ obtendo as respectivas curvas de ROC (Receiver Operating Charac-

40

Page 42: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

teristic) globais para cada um dos conjuntos de treino (Figura 4.5). As curvas de ROC parciais, ou

Figura 4.5: Curva de ROC para os classificadores de boosting com 50 iteracoes.

seja, para cada um dos ensaios estao disponıveis no Anexo III desta dissertacao. Observando osresultados globais verifica-se uma ligeira diferenca de desempenho entre os classificadores obtidosde diferentes conjuntos de treino. Nos resultados parciais os conjuntos de treino CTI apresentam umamelhoria de desempenho no 3º e 4º ensaio, mas o contrario se passou no 1º e 2º ensaio. O tempo declassificacao para os classificadores com 50 iteracoes e de aproximadamente 200s.

A Tabela 4.2 apresenta os resultados globais em todos os conjuntos de treino para 3 valores deµ. Nesta tabela, e perceptıvel que para qualquer conjunto de treino apresentado e possıvel obter

Tabela 4.2: Tabela com as taxas de deteccao (TDR) e falsas deteccao (FDR) globais para os classifi-cadores de boosting obtidos com os varios conjuntos de treino e em funcao de µ.

CTA CTI1 CTI2 CTI3

µ TDR (%) FDR (%) Q TDR (%) FDR (%) Q TDR (%) FDR (%) Q TDR (%) FDR (%) Q

0.55 94.48 60.47 0.3401 91.09 33.71 0.5738 88.82 24.83 0.6400 88.55 23.20 0.6535

0.60 90.79 24.29 0.6650 82.82 8.88 0.7393 80.70 7.01 0.7369 79.24 5.53 0.7371

0.65 81.07 8.93 0.7214 71.25 2.51 0.6874 67.24 1.98 0.6526 67.03 1.91 0.6432

um classificador com um desempenho razoavel. Com µ = 0.6 o desempenho para CTI1,CTI2 eCTI3 e praticamente identico (analisando Q). Embora o melhor resultado seja o obtido com CTI1(TDR = 82.82% e TDR = 8.88%), os resultados obtidos com CTI2 (TDR = 80.70% e TDR = 7.01%)e CTI3 (TDR = 79.24% e TDR = 5.53%) estao muito proximos quanto ao desempenho, pois apesar

41

Page 43: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

de terem uma taxa de deteccao inferior tambem diminuem a taxa de falsas deteccoes. Com o conjuntode treino CTA tambem obtem um bom resultado mas com um threshold mais elevado (µ = 0.65). Osresultados globais sao os que caracterizam melhor o desempenho dos classificadores obtidos, noentanto nos resultados parciais o classificador obtido com CTI3 no quarto ensaio obteve com µ = 0.6uma taxa de deteccao TD ≈ 85.5% e uma taxa de falsas deteccoes FD ≈ 5.5%.

4.4 Resultados com classificador boosting em cascata

Sao efectuados treinos com classificadores em cascata com os conjuntos de treino da seccaoanterior: CTA, CTI1, CTI2 e CTI3, para os quatro ensaios obtendo 16 classificadores em cascatano total. As quinze primeiras caracterısticas escolhidas por este classificador na primeira camadasao iguais as quinze primeiras caracterısticas escolhidas pelo classificador de boosting obtido para omesmo conjunto de treino CTI3 em cada ensaio. As primeiras dez caracterısticas da segunda camadado classificador obtido com CTI3 no quarto ensaio sao ilustradas na Figura 4.6.

Figura 4.6: As dez primeiras caracterısticas escolhidas na segunda camada do classificador em cas-cata para o conjunto CTI3 do quarto ensaio.

Aplicando os varios classificadores finais obtidos as imagens de teste e fazendo variar o thresholddo classificador boosting na sua ultima camada, obtiveram-se as respectivas curvas de ROC (Figura4.7). Neste caso, a melhoria de desempenho com o aumento do numero de exemplos falsos e evi-dente, sendo os classificadores obtidos a partir de CTI3, os que apresentam melhor desempenho.O tempo de classificacao para um classificador com 15 caracterısticas na primeira camada, 20 nasegunda e 25 na terceira e de 56 segundos para classificar toda a imagem, o que representa umavelocidade de classificacao cerca de quatro vezes inferior relativamente a um classificador simplescom 50 caracterısticas. No entanto, as curvas de ROC mostram um desempenho pior por parte doclassificador em cascata em relacao ao boosting simples.

Analisando a Tabela 4.3, os seus melhores resultados globais sao obtidos com CTI3: para µ = 0.6obtem-se TDR=74.14% e FDR=14.76% e com µ = 0.65 obtem-se TDR=64.65% e FDR=5.03%. Odesempenho deste tipo de classificadores e significativamente pior em relacao aos classificadoressimples de 50 iteracoes no entanto e notorio o melhoramento global dos resultados com a introducaode mais exemplos falsos no treino. As curvas ROC dos parciais para todos os tipos de conjunto comclassificadores boosting em cascata estao disponıveis no Anexo IV desta dissertacao. O melhor clas-sificador parcial encontrado obtem-se do treino com CTI no 4º Ensaio e apresenta com µ = 0.6 umataxa de deteccao TDR=80.91% e taxa de falsas deteccoes FDR=10.10%. Apesar deste bom resultado,os restantes ensaios apresentam resultados piores sendo o 1º Ensaio o que tem pior resultado, com

42

Page 44: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 4.7: Curva de ROC para os classificadores de boosting em cascata.

Tabela 4.3: Tabela com as taxas de deteccao (TDR) e falsas deteccao (FDR) globais para os classifi-cadores de boosting em cascata obtidos com os varios conjuntos de treino e em funcao de µ.

CTA CTI1 CTI2 CTI3

µ TDR (%) FDR (%) Q TDR (%) FDR (%) Q TDR (%) FDR (%) Q TDR (%) FDR (%) Q

0.55 93.14 86.12 0.0701 87.35 48.78 0.3856 84.91 37.61 0.4730 82.44 34.54 0.4790

0.60 90.47 74.29 0.1618 79.93 26.09 0.5384 76.03 20.62 0.5541 74.14 14.76 0.5938

0.65 85.48 53.53 0.3195 69.49 11.29 0.5819 66.92 10.39 0.5653 64.65 5.03 0.5962

TDR=59.42% e FDR=7.46%.

4.5 Influencia do numero de iteracoes e do deslocamento de bloco

Os classificadores boosting podem ser treinados com o numero de iteracoes que o utilizadorpretender. Porem, maior numero de iteracoes implica um maior tempo treino e maior tempo declassificacao de imagens. Executam-se varias experiencias sobre o mesmo conjunto de teste variandoo numero de iteracoes T para o classificador obtido do treino de boosting simples com CTI3 no 4º En-saio, ver Figura 4.8. Na legenda da figura, T = n iteracoes refere-se ao resultado de classificacao so-bre o conjunto de teste obtido com as primeiras n iteracoes do classificador boosting simples (treinadocom 50 iteracoes). Os resultados comprovam que o aumento de iteracoes produz um ligeiro aumento

43

Page 45: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 4.8: Comparacao de desempenhos do mesmo classificador (obtido do treino boosting simplescom CTI3 - 4º Ensaio, µ = 0.6) utilizando diferente numero de iteracoes T . Resultados obtidos naimagem R0904061 da Zona A.

no desempenho do classificador quanto a taxa de deteccoes correctas vs taxa de falsas deteccoes.Contudo, o numero de iteracoes utilizadas e directamente proporcional ao tempo de classificacao, ver

Figura 4.9: Comparacao entre o numero de iteracoes utilizado e o tempo de classificacao. Resultadosresultantes da aplicacao a todo o conjunto de teste.

Figura 4.9. Quanto maior o numero de iteracoes, maior o numero de caracterısticas a serem avaliadasem cada bloco da imagem, aumentando o tempo de classificacao. O tempo reduz para metade aoreduzir de 50 para 30 iteracoes.

44

Page 46: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

E tambem testado de forma semelhante, com o mesmo classificador, a influencia do passo dedeslocamento δ entre blocos de uma imagem, ou seja, a diferenca entre se deslocar o bloco de 1 em1 pixel (δ = 1.00) ou de 2 em 2 pixels (δ = 2.00), por exemplo. Todos os resultados anteriormente

Figura 4.10: Comparacao de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio) utilizando passos de deslocamento de bloco δ diferentes. Resultadosresultantes da aplicacao a todo o conjunto de teste.

apresentados foram obtidos com δ = 1.00. Um aumento de δ reduz a taxa de deteccao e a de falsasdeteccoes. A Figura 4.10 demonstra que o aumento do passo piora ligeiramente o desempenho doclassificador no que diz respeito as taxas de deteccao e de falsas deteccoes. O passo de desloca-mento e inversamente proporcional ao tempo de classificacao, Figura 4.11. Um maior valor para opasso δ diminui o tempo de classificacao de uma imagem. Para a imagem onde foi realizado esteteste, o desempenho com δ = 1.25 e praticamente igual ao desempenho obtido com δ = 1.00 coma vantagem de reduzir o tempo de classificacao de 200s para 139s, mais rapido apenas com uma li-geira quebra de desempenho. Com δ = 2.00 a quebra de desempenho e maior, ainda assim razoavel,reduzindo o tempo de processamento para 59s (quatro vezes mais rapido).

4.6 Teste simples em imagens de sondas diferentes

Dado que existe um volume grande de imagens da superfıcie de Marte por classificar nao so prove-nientes da MOC, e necessario que o metodo proposto seja aplicavel a imagens capturadas por outrassondas. Num teste simples, aplica-se o classificador boosting obtido de CTI3 no quarto ensaio a duas

45

Page 47: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 4.11: Comparacao entre o tamanho do deslocamento do passo δ e o tempo de classificacao.Resultados obtidos na imagem R0904061 da Zona A.

imagens: uma imagem da HRSC (High Resolution Stereo Camera), a bordo da Mars Express e outrada Viking 2. Na Figura 4.12 apresenta-se o resultado da classificacao aplicado a imagem da HRSC,

Figura 4.12: Deteccao de crateras numa imagem proveniente da sonda HRSC com o classificadorboosting simples obtido do treino com CTI3, com µ = 0.6.

apesar de nao ter detectado duas crateras visivelmente superiores a 6 pixels de diametro (talvez porestarem um pouco mais degradadas) detectou todas as restantes e nao apresentou falsas deteccoes.Na Figura 4.13, referente a imagem da Viking 2, e visıvel que todas as crateras de dimensao superiora 6 pixels foram detectadas e algumas tambem inferiores a esse limite, mas aparecem algumas falsasdeteccoes.

Estes resultados demonstram a capacidade do classificador identificar crateras em imagens cap-turadas por outras sondas com caracterısticas diferentes da MOC. Tendo em conta que o classificadore treinado apenas com exemplos de imagens da MOC, acredita-se que melhores resultados poderaoser obtidos executando um treino com exemplos de imagens de varias sondas.

46

Page 48: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 4.13: Deteccao de crateras numa imagem proveniente da sonda Viking 2 com o classificadorboosting simples obtido do treino com CTI3.

4.7 Discussao dos Resultados

Os resultados obtidos mostram que os melhores desempenhos sao obtidos com os classificadoresboosting simples no que diz respeito taxas de deteccao (TDR) e de falsos alarmes (FDR). O classifi-cador de boosting em cascata e cerca de quatro vezes mais rapido na classificacao de imagens masobteve um desempenho de TDR e FDR mais fraco. Os classificadores em cascata melhoraram signifi-cativamente e de uma forma progressiva desde CTA a CTI3 levando a querer que melhores resultadosserao conseguidos acrescentando mais exemplos aos conjuntos de treino.

O facto dos melhores resultados em ambos os tipos de classificadores serem obtidos no 4º ensaionao e uma coincidencia. O quarto ensaio possui um maior numero de imagens de treino uma vez quea divisao 25% para treino e 75% nao e exacta nas zonas A, B, C e D, sendo compensada a diferencaneste ultimo. Daqui se pode tambem concluir que apesar de 75% das 101 imagens serem utiliza-das para treino, nao chegam para obter uma quantidade suficiente de exemplos de crateras, seriamnecessarias mais imagens no total. O quarto ensaio e o ensaio que maior numero de exemplos de cra-teras possui no conjunto de treino contabilizando 523 crateras ao todo, numero baixo em comparacaocom os treinos apresentados por P. Viola e M. Jones [22] em que sao utilizados 5000 exemplos decaras. Outro factor que podera ter influencia no desempenho e a presenca de crateras muito degrada-das nos conjuntos de treino que podera perturbar o treino do classificador. Na construcao do GT, ascrateras poderiam ser marcadas no caso de estarem muito degradadas para nao permitir que facamparte do conjunto de treino.

Verifica-se ainda que e possıvel aumentar ligeiramente o passo de deslocamento dos blocos sobrea imagem a classificar sem degradar consideravelmente o desempenho e reduzindo drasticamenteo tempo de classificacao. O mesmo pode ser feito reduzindo o numero de caracterısticas a seremavaliadas pelo classificador (iteracoes) mas com uma maior reducao no desempenho. Os resultadosobtidos nos testes a imagens provenientes da Viking 2 e HRSC provam a versatilidade do metodoem relacao a imagens de outras sondas mesmo sem estar presente nenhum exemplo com este tipode imagens no conjunto de treino. Estes factos levam a acreditar que esta metodologia funcione comdesempenhos semelhantes em imagens de outras superfıcies planetarias (e.g. Lua e Mercurio).

Os resultados obtidos nao podem ser comparados directamente com os resultados obtidos por L.Bandeira et al. [18] porque nesse trabalho nao existe um conjunto de treino definido (o algoritmo e

47

Page 49: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

testado na totalidade das 101 imagens num so ensaio). Contudo, e realizada a validacao cruzada,todas as imagens estao presentes no conjunto de teste num dos quatro ensaios e por isso e legıtimocomparar os resultados globais. Em [18] sao apresentados dois desempenhos mediante um nıvelde probabilidade p. Para p = 40% o TDR e de 83.33% e o FDR de 5.36% e para p = 50% o TDRe de 86.57% e o FDR de 15.95%. Nos resultados globais apresentados nesta dissertacao para oclassificador boosting CTI3 com µ = 0.60 obtem-se um TDR de 79.24% e um FDR de 5.53% e para µ =0.55 obtem-se um TDR de 88.55% e um FDR de 23.20%. Os resultados apresentados nesta dissertacaoencontram-se muito proximos dos resultados apresentados em [18], embora com um desempenhoinferior. No entanto, nas taxas de deteccao sao contabilizadas todas as crateras de diametro igual ousuperior a 7 pixels, uma melhoria face a [18] que contempla crateras acima de 10 pixels de diametro.Tendo em conta que [18] e o resultado de um trabalho contınuo de varios anos e que apresentaum dos melhores resultados ate hoje, os resultados desta abordagem completamente diferente saopromissores pois encontra-se numa fase inicial e podera ser melhorado de varias formas (ver capıtuloseguinte).

48

Page 50: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Capıtulo 5

Conclusoes e Trabalho Futuro

Nesta dissertacao desenvolveu-se um metodo, inspirado nos metodos de boosting de P. Viola e M.Jones [22], para a deteccao automatica de crateras com diversos tamanhos, com diferentes estruturasgeologicas e em zonas com morfologia diferente (embora pertencentes ao mesmo perıodo geologico).Dois tipos de treinos sao implementados para obtencao de classificadores, o treino para classificadorboosting e o treino para classificador boosting em cascata. Propuseram-se e testaram-se varios tiposde conjuntos de treino, o conjunto de treino automatico (CTA) e o conjunto de treino iterativo (CTI)para acrescentar exemplos no conjunto de treino de forma iterativa. Os melhores resultados foramobtidos com os classificadores de boosting. Obtiveram-se taxas de deteccao globais que variam entreos 79% a 88% e taxas de falsas deteccoes que variam de 5% a 23%, mediante o threshold final dosclassificadores de boosting. Estes resultados situam-se perto dos melhores resultados conseguidosate hoje e o metodo possui margem para progressao no desempenho. E tambem importante referirque as taxas de deteccao apresentadas se referem a todas as crateras de diametro igual ou superiora 7 pixels, um aspecto favoravel pois considera crateras de menor dimensao em relativamente a [18].Os resultados apresentados confirmam que os objectivos inicialmente propostos foram atingidos.

Para demonstrar a fiabilidade deste metodo a comunidade cientıfica e necessario testar esta meto-dologia com um conjunto maior de imagens, pertencentes a zonas de diferentes perıodos geologicos,com resolucoes diferentes e provenientes de outros tipos de sondas. Os resultados de experienciassimples indicam que e possıvel criar um classificador para deteccao de crateras em todo o tipo de son-das. O conjunto de 101 imagens e um conjunto consideravel de imagens mas representam apenasuma fraccao da superfıcie de Marte. Aumentar o tamanho do conjunto de imagens produzira melhordesempenho nos classificadores de imagens para alem de reforcar o valor dos resultados obtidos. Noentanto e sempre necessaria a construcao de um Ground Truth para as imagens a serem utilizadasnos conjuntos de treino e avaliacao do conjunto de teste. Outro aspecto importante e o facto de estametodologia ser aplicavel a imagens de qualquer outra superfıcie planetaria exactamente da mesmaforma.

Varias tentativas para melhorar os resultados poderao ser testadas, nomeadamente no pre- pro-cessamento das imagens. Normalizacao de variancia, aumento de contraste e diversos tipos de fil-tragem, poderao melhorar significativamente o desempenho do classificador final. Tambem podemser adicionados novos tipos de mascaras rectangulares para a extraccao de caracterısticas, como porexemplo as mascaras diagonais apresentadas por Barczak [26]. Em [24] e feita uma comparacaoentre tres tipos de algoritmos boosting: o AdaBoost (utilizado nesta dissertacao), o LogitBoost e oBrownboost. Os resultados demonstraram melhor generalizacao com o LogitBoost, portanto outrostipos de algoritmos de boosting podem melhorar o desempenho dos classificadores.

49

Page 51: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Esta metodologia pode tambem ser utilizada em combinacao com outros metodos ja existentes quedemonstram bons resultados, nomeadamente o trabalho de L. Bandeira et al. [18]. Ambos os algorit-mos podem ser ajustados, de forma a obter uma taxa de deteccao elevada (aumentando tambem ataxa de falsos positivos), seleccionando areas de interesse para pos- processamento com um segundometodo, um pouco a semelhanca de um classificador em cascata com dois tipos totalmente diferen-tes de classificadores. E possıvel que uma abordagem deste tipo alcance boas taxas de deteccoescorrectas reduzindo simultaneamente a taxa de falsas deteccoes.

50

Page 52: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Bibliografia

[1] S. C. Werner, ”Major Aspects of the Chronostratigraphy and Geologic Evolutionary History of Mars”, PhD thesis, FreeUniversity Berlin, p. 252 , 2006 (http://www.diss.fu-berlin.de/2006/33/ indexe.html).

[2] W.K. Hartmann and G. Neukum, ”Cratering Chronology and the Evolution of Mars”. Space Science Reviews, vol. 96, pp.165-194, 2001.

[3] C. Plesko, S. Brumby, E. Asphaug, D. Chamberlain, and T. Engel, ”Automatic crater counts on Mars”, presented at theLunar and Planetary Science XXXV, Lunar Planetary Inst., Houston, TX, #1935, 2004.

[4] M. C. Burl, T. Stough, W. Colwell, E. B. Bierhaus, W. J. Merline, and C. Chapman, ”Automated detection of craters andother geological features”in Proc. Int. Symp. Artif. Intell., Robot. and Autom. Space, Montreal, QC, Canada, 2001.

[5] T. Vinogradova, M. Burl, E. Mjolness, ”Training of a Crater Detection Algorithm for Mars Crater Imagery”. In Proceedingsof IEEE Aerospace Conference, 2002, Vol. 7, pp. 3201-3211.

[6] P. G. Wetzler, B. Enke, W. J. Merline, C. R. Chapman, and M. C. Burl, ”Learning to detect small impact craters”in Proc. 7thIEEE WACV/MOTION, 2005, vol. 1, pp. 178-184.

[7] A. A. Smirnov, ”Exploratory study of automated crater detection algorithm”. Technical Report, Boulder, Colorado, USA,2002.

[8] G. Michael, ”Coordinate Registration by Automated Crater Recognition”, Planetary and Space Science, vol. 51, pp. 563-568, 2003.

[9] R. Honda and R. Azuma, ”Crater extraction and classification system for lunar images”. Mem. Fac. Sci. Kochi Univ. (Inform.Sci.), vol. 21, pp.13-22, 2000.

[10] H. Jahn, ”Crater detection by linear filters representing the Hough Transform”, in Proc. ISPRS Commission III Symposium:Spatial Information from Digital Photogrammetry and Computer Vision, SPIE, Munich, Germany, 1994, vol. 2357, pp.427-431.

[11] B.D. Bue and T.F. Stepinski, ”Machine Detection of Martian Impact Craters From Digital Topography Data”, IEEE Transac-tions on Geoscience and Remote Sensing, vol. 45, no.1, pp. 265-274, 2007.

[12] N. Matsumoto, N. Asada and H. Demura, ”Automatic Crater Recognition on Digital Terrain Model”, In Proceedings of Lunarand Planetary Science XXXVI, Houston, Texas, 2005, Abs. #1995.

[13] T. Barata, E.I. Alves, J. Saraiva and P. Pina, ”Automatic Recognition of Impact Craters on the Surface of Mars”, in LectureNotes in Computer Science, A. Campilho and M. Kamel, Eds. Berlin: Springer, 2004, vol.3212, pp. 489-496.

[14] J. Saraiva, L.P.C. Bandeira and P. Pina, ”A Structured Approach to Automated Crater Detection”, In Proceedings of Lunarand Planetary Science XXXVII, League City, Texas, 2006, Abs. #1142.

[15] J.R. Kim, J.-P. Muller and J.G. Morley, ”Quantitative Assessment of Automated Crater Detection on Mars”. In Proceedingsof XXth ISPRS Congress, Istanbul, Turkey, pp. 816-821, 2004.

[16] Y. Sawabe, T. Matsunaga and S. Rokugawa, ”Automated detection and classification of lunar craters using multiple appro-aches”. Advances in Space Research, Vol. 37 No. 1, pp. 21-27, 2006.

[17] M. Magee, C.R. Chapman, S.W. Dellenback, B. Enke, W.J. Merline, M.P. Rigney, ”Automated Identification of Martian Cra-ters Using Image Processing”. In Proceedings of Lunar and Planetary Science XXXIV, Houston, Texas, 2003, Abs.#1756.

51

Page 53: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

[18] L. Bandeira, J. Saraiva and P. Pina , ”Impact crater recognition on Mars based on a probability volume created by templatematching”, IEEE Transactions on Geoscience and Remote Sensing, 2007 (em publicacao).

[19] J. Earl, A.F. Chicarro, C. Koeberl, P.G. Marchetti and M. Milnes, ”Automatic Recognition of Crater-like Structures in Terres-trial and Planetary Images”. In Proceedings of Lunar and Planetary Science XXXVI, Houston, Texas, 2005, Abs. #1319.

[20] J.R. Kim, J.-P. Muller, S. van Gasselt, J.G. Morley and G. Neukum, ”Automated Crater Detection, A New Tool for MarsCartography and Chronology”, Photogrammetric Engineering and Remote Sensing, vol. 71, pp. 1205-1217, 2005.

[21] C. Papageorgiou, M. Oren, and T. Poggio, ”A general framework for object detection.”In International Conference onComputer Vision, 1998.

[22] P. Viola and M. Jones, ”Robust real-time object detection”, In International Conf. Computer Vision, vol.2, p.747, Vancouver,2001.

[23] E.I. Alves, and D. Vaz, ”MIMS - A relational database of imagery on Mars”, Computers & Geosciences, vol. 33, no. 3, pp.318-324, 2007.

[24] R. A. McDonald, D. J. Hand and I. A. Eckley, ”An empirical comparison of three boosting algorithms on real data sets withartificial class noise”, In Fourth International Workshop on Multiple Classifier Systems, pp 35-44, Springer, 2003.

[25] Y. Freund and R. E. Schapire,”A decision-theoretic generalization of on-line learning and an application to boosting”, InEuropean Conference on Computational Learning Theory, pp. 23-37, 1995.

[26] Barczak, A.L.C., ”Toward an Efficient Implementation of a Rotation Invariant Detector using Haar-Like Features”, in proc.of the IVCNZ05, pp. 31-36, Dunedin, NZ, 2005.

52

Page 54: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexos

53

Page 55: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexo I - Listagem das Imagens MOC

Neste anexo estao disponıveis as tabelas de base de dados para cada zona utilizada. Para cadazona sao indicados o nome original das imagens, a resolucao com que foi obtida, a area coberta dasuperfıcie de Marte, o azimute do Sol no instante da aquisicao e a aprovacao/rejeicao decidida peloCentro de Recursos Naturais e Ambiente (CERENA) sobre as imagens (algumas muito ruidosas foramexcluıdas do conjunto de imagens inicial).

Tabela 5.1: Tabela de informacao sobre as imagens referentes a

Zona A.

Zona

A

Nome Resolucao (m2/pixel) Area (km2) Azimute do Sol (◦) Aprovacao

E0500815 260.29 15610 325.73 Aceite

E1600100 272.90 17159 304.69 Aceite

M0701504 258.63 15411 317.95 Aceite

M0905430 258.42 15386 303.60 Aceite

M1001396 257.74 15305 300.26 Aceite

R0701511 269.99 16795 315.75 Aceite

R0902856 271.07 16930 302.39 Aceite

R0904061 270.14 16814 301.73 Aceite

R1400990 272.74 17139 302.67 Excluıda

R1501040 271.78 17018 307.82 Aceite

R1501578 270.26 16829 312.09 Aceite

R1502333 271.27 16955 314.19 Aceite

Tabela 5.2: Tabela de informacao sobre as imagens referentes a

Zona B.

Zona

B

Nome Resolucao (m2/pixel) Area (km2) Azimute do Sol (◦) Aprovacao

E1102299 260.28 15609 304.09 Aceite

E1201076 260.85 15677 302.57 Aceite

E1201895 260.05 15581 303.41 Aceite

M0201122 247.62 14127 10.30 Aceite

M0301712 248.55 14233 350.64 Aceite

M0305907 247.89 14158 344.11 Aceite

M0400654 249.71 14367 347.62 Aceite

M0401539 248.41 14217 348.87 Aceite54

Page 56: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

M0701530 247.07 14064 345.37 Aceite

M0705420 245.70 13909 341.74 Aceite

M1002113 247.04 14061 308.44 Aceite

M1202727 246.18 13963 303.78 Aceite

R0301379 259.64 15532 0.62 Aceite

R0502399 262.01 15817 336.51 Aceite

R0800127 259.45 15509 322.34 Aceite

R0901855 259.62 15530 313.17 Aceite

R1004288 261.52 15758 304.91 Aceite

R1004772 258.25 15366 309.10 Aceite

Tabela 5.3: Tabela de informacao sobre as imagens referentes a

Zona C.

Zona

C

Nome Resolucao (m2/pixel) Area (km2) Azimute do Sol (◦) Aprovacao

E0100976 236.95 12936 50.34 Aceite

M0100313 236.44 12880 45.22 Aceite

M1801434 235.22 12748 -55.78 Excluıda

M1900133 235.73 12803 55.18 Aceite

M2100403 236.24 12858 55.75 Aceite

M2201984 237.51 12997 52.97 Excluıda

R0500971 249.18 14306 17.64 Aceite

R0601245 247.67 14133 5.28 Aceite

R0900034 253.27 14779 344.72 Aceite

R1002734 248.48 14225 342.88 Aceite

R1004058 247.93 14163 330.36 Aceite

Tabela 5.4: Tabela de informacao sobre as imagens referentes a

Zona D.

Zona

D

Nome Resolucao (m2/pixel) Area (km2) Azimute do Sol (◦) Aprovacao

E0101393 236.41 12877 52.66 Aceite

E0101395 237.35 12980 50.89 Excluıda

E0101876 237.31 12975 50.69 Aceite

55

Page 57: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

E0400996 236.46 12882 38.04 Aceite

E0402024 237.73 13021 34.30 Aceite

E1103443 247.97 14167 7.00 Excluıda

E1900648 246.21 13967 57.03 Aceite

E1900650 248.16 14189 53.55 Aceite

E2100529 248.90 14274 53.64 Aceite

FHA00514 238.11 13934 53.55 Aceite

M0001055 234.79 13124 51.15 Aceite

M0001986 233.84 12599 50.98 Aceite

M0003044 235.98 12830 46.15 Aceite

M0003160 235.50 12778 47.71 Aceite

M0200385 236.26 12861 40.37 Aceite

M0201769 235.50 12778 40.08 Aceite

M0203009 235.51 12779 38.92 Aceite

M0301908 235.68 12798 34.07 Aceite

M0303429 236.27 12862 29.28 Aceite

M0304077 234.65 12686 34.26 Aceite

M0304483 235.89 12820 28.44 Aceite

M0304932 235.50 12778 29.63 Aceite

M0307247 235.43 12770 24.99 Aceite

M0700466 236.56 12893 14.47 Aceite

M0701760 235.40 12767 18.87 Aceite

M0702734 236.54 12891 10.50 Aceite

M0703132 235.32 12759 17.22 Aceite

M0801056 235.72 12802 25.11 Aceite

M0802948 235.64 12793 7.13 Aceite

M0805148 235.74 12804 19.79 Aceite

M0901725 236.60 12898 14.16 Aceite

M0902260 235.93 12825 365.28 Excluıda

M0904295 235.92 12824 372.72 Aceite

M1003227 235.35 12762 28.00 Aceite

M1103735 235.17 12742 45.20 Aceite

M1200503 236.01 12833 40.32 Excluıda

M1501916 235.41 12768 -40.00 Aceite

56

Page 58: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

M1600790 236.13 12846 -42.00 Excluıda

M1800125 234.92 12715 -33 Aceite

M1801019 236.01 12833 -35 Aceite

M1801151 235.72 12802 -35 Aceite

M1801914 236.32 12867 -35 Aceite

M1901401 236.77 12916 54.24 Aceite

M1902008 235.80 12811 56.77 Aceite

M2000089 236.00 12832 56.12 Aceite

M2001533 235.54 12782 58.02 Aceite

M2101352 237.05 12947 55.18 Aceite

M2200004 236.17 12851 56.52 Aceite

M2200482 235.39 12766 57.76 Aceite

M2202191 236.42 12878 55.65 Aceite

M2300337 237.32 12976 54.15 Aceite

M2301336 237.07 12949 53.67 Aceite

R0100603 246.55 14005 50.71 Aceite

R0401494 248.12 14184 27.68 Aceite

R0500367 247.24 14084 28.62 Aceite

R0501393 247.70 14136 23.27 Aceite

R0800087 246.98 14054 2.38 Aceite

R0900230 252.43 14681 355.83 Aceite

R0900555 248.05 14176 349.07 Aceite

R1000317 247.90 14159 354.21 Aceite

R1001027 248.15 14188 2.94 Aceite

R1002799 248.29 14204 0.67 Aceite

R1004125 246.95 14051 359.27 Aceite

R1102844 249.06 14292 357.27 Aceite

R1200769 248.18 14191 23.65 Aceite

R1301124 246.63 14014 3.70 Aceite

R1402393 248.70 14251 14.41 Aceite

R1500997 247.58 14123 29.71 Aceite

57

Page 59: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexo II - Representacao do Ground Truth nas Imagens

Neste anexo e apresentado o Ground Truth gerado no contexto desta dissertacao para cada umadas imagens. A informacao relativa as crateras identificadas manualmente e representada atraves deum quadrado sobreposto na imagem centrado no centro das crateras.

Zona AE0500815 E1600100 M0701534

M0905430 M1001396 R0701511

R0902856 R0904061 R1501040

R1501578 R1502333

Figura 5.1: GT para as imagens da Zona A.

58

Page 60: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Zona BE1102299 E1201076 E1201895

M0201122 M0301712 M0305907

M0400654 M0401539 M0701530

M0705420 M1002113 M1202727

Figura 5.2: GT para as imagens da Zona B, parte 1.

59

Page 61: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

R0301379 R0502399 R0800127

R0901855 R1004288 R1004772

Figura 5.3: GT para as imagens da Zona B, parte 2.

60

Page 62: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Zona CE0100976 M0100313 M1900133

M2100403 R0500971 R0601245

R0900034 R1002734 R1004058

Figura 5.4: GT para as imagens da Zona C.

61

Page 63: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Zona DE0101393 E0101876 E0400996

E0402024 E1900648 E1900650

E2100529 FHA00514 M0001055

M0001986 M0003044 M0003160

Figura 5.5: GT para as imagens da Zona D, parte 1.

62

Page 64: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

M0200385 M0201769 M0203009

M0301908 M0303429 M0304077

M0304483 M0304932 M0307247

M0700466 M0701760 M0702734

Figura 5.6: GT para as imagens da Zona D, parte 2.

63

Page 65: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

M0703132 M0801056 M0802948

M0805148 M0901725 M0904295

M1003227 M1103735 M1501916

M1800125 M1801019 M1801151

Figura 5.7: GT para as imagens da Zona D, parte 3.

64

Page 66: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

M1801914 M1901401 M1902008

M2000089 M2001533 M2101352

M2200004 M2200482 M2202191

M2300337 M2301336 R0100603

Figura 5.8: GT para as imagens da Zona D, parte 4.

65

Page 67: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

R0401494 R0500367 R0501393

R0800087 R0900230 R0900555

R1000317 R1001027 R1002799

R1004125 R1102844 R1200769

Figura 5.9: GT para as imagens da Zona D, parte 5.

66

Page 68: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

R1301124 R1402393 R1500997

Figura 5.10: GT para as imagens da Zona D, parte 6.

67

Page 69: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexo III - Resultados parciais para boosting simples

Neste anexo apresentam-se os resultados obtidos para os classificadores boosting simples paracada um dos quatro ensaios contendo as curvas de ROC para todos os conjuntos de treino em cadaensaio. As Figuras 5.11, 5.12, 5.13 e 5.14 correspondem ao 1º, 2º, 3º e 4º ensaio respectivamente.

Figura 5.11: Curvas de ROC para o 1º ensaio, classificadores de boosting com 50 iteracoes.

68

Page 70: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.12: Curvas de ROC para o 2º ensaio, classificadores de boosting com 50 iteracoes.

Figura 5.13: Curvas de ROC para o 3º ensaio, classificadores de boosting com 50 iteracoes.

69

Page 71: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.14: Curvas de ROC para o 4º ensaio, classificadores de boosting com 50 iteracoes.

70

Page 72: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexo IV - Resultados parciais para boosting em cascata

Neste anexo apresentam-se os resultados obtidos para os classificadores boosting em cascatapara cada um dos quatro ensaios contendo as curvas de ROC para todos os conjuntos de treino emcada ensaio. As Figuras 5.15, 5.16, 5.17 e 5.18 correspondem ao 1º, 2º, 3º e 4º ensaio respectiva-mente.

Figura 5.15: Curvas de ROC para o 1º ensaio, classificadores de boosting em cascata.

71

Page 73: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.16: Curvas de ROC para o 2º ensaio, classificadores de boosting em cascata.

Figura 5.17: Curvas de ROC para o 3º ensaio, classificadores de boosting em cascata.

72

Page 74: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.18: Curvas de ROC para o 4º ensaio, classificadores de boosting em cascata.

73

Page 75: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Anexo V - Ilustracao de um resultado parcial

Neste anexo e apresentado o resultado do classificador parcial obtido com o conjunto de treinoCTI3 no quarto ensaio com µ = 0.6. Em cada figura apresenta-se o resultado da classificacao nasimagens (a esquerda) e correspondente avaliacao automatica (a direita). Os resultados com as ima-gens de teste para este ensaio na zona A encontram-se na Figura 5.19, zona B nas Figuras 5.20 e5.21, zona C na Figura 5.22 e zona D nas Figuras 5.23, 5.24, 5.25, 5.26 e 5.27. Para interpretacao daavaliacao automatica recomenda-se a consulta da Figura 4.1.

Zona A:

Figura 5.19: Resultado parcial para a Zona A, figuras por ordem: E0500815 e E1600100.

74

Page 76: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Zona B:

Figura 5.20: Resultado parcial para a Zona B 1ª parte, figuras por ordem: E1102299, E1201076 eE1201895.

75

Page 77: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.21: Resultado parcial para a Zona B 2ª parte, figuras por ordem: M0201122.

Zona C:

Figura 5.22: Resultado parcial para a Zona C, figuras por ordem: E0100976.

76

Page 78: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Zona D:

Figura 5.23: Resultado parcial para a Zona D, 1ª parte, figuras por ordem: E0101393, E0101876 eE0400996.

77

Page 79: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.24: Resultado parcial para a Zona D, 2ª parte, figuras por ordem: E0402024, E1900648 eE1900650.

78

Page 80: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.25: Resultado parcial para a Zona D, 3ª parte, figuras por ordem: E2100529, FHA00514 eM0001055.

79

Page 81: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.26: Resultado parcial para a Zona D, 4ª parte, figuras por ordem: M0001986, M0003044 eM0003160.

80

Page 82: Reconhecimento Automatico da Superficie de Marte …2007-10... · em escalas diferentes, metodos de gerac¸´ ao de falsos exemplos para o conjunto de treino e ... 2.1 Algoritmo para

Figura 5.27: Resultado parcial para a Zona D, 5ª parte, figuras por ordem: M0200385, M0201769 eM0203009.

81