Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos...

Post on 21-Apr-2015

106 views 1 download

Transcript of Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos...

Classificação de imagens de fotografias Classificação de imagens de fotografias históricas usando detecção de linhas ehistóricas usando detecção de linhas e

paralelogramos pela presença de edifíciosparalelogramos pela presença de edifícios

Natália Cosse Batista

Grupo 8natalia@dcc.ufmg.br

Sumário

1. Introdução2. Trabalhos relacionados3. Definição do problema4. Metodologia5. Testes preliminares6. Classificação simples por limiar7. Classificação com SVM8. Conclusões9. Trabalhos futurosReferências principais

1. Introdução (1/2)

• Base de imagens do APM: 6.000 imagens digitais.

1. Introdução (2/2)

• Objetivo: classificar as imagens com base na presença de edifícios.

• Edifícios: são objetos feitos pelo homem com bordas bem definidas e contornos retilíneos. Contém características regulares causadas principalmente pela presença de janelas e portas, que são evidência de estrutura na imagem.

• Classes:– Edifícios– Intermediárias– Não-edifícios

2. Trabalhos relacionados (1/3)

• Iqbal e Aggarwal: recuperação por classificação de imagens contendo grandes objetos feitos pelo homem usando agrupamento perceptivo.

• Características: número de linhas longas, junções em L, junções em U, grupos paralelos e polígonos.

2. Trabalhos relacionados (2/3)

• Transformada de Hough:

– linhas são representadas por pontos no espaço de parâmetros.

– Tamanho dos picos estão relacionados ao número de pixels que compõe a linha.

2. Trabalhos relacionados (3/3)

• Jung e Schramm: detecção de paralelogramos utilizando Transformada de Hough particionada.

• Picos aparecem aos pares: simetria em relação ao eixo θ.

• Distâncias horizontais: ângulo entre pares.• Distâncias verticais (eixo ρ)

entre os pares de picos são os

lados do paralelogramo.

3. Definição do problema

• Classificar as imagens em edifícios, intermediárias e não-edifícios com base nas características: número de linhas e número de paralelogramos.

4. Metodologia (1/2)

• Separar um conjunto de 90 imagens nas três classes.

• Filtros para melhorar qualidade da imagem (Gaussiano e melhora do contraste).

• Detectar bordas (Canny).

• Detectar linhas.

• Detectar paralelogramos.

4. Metodologia (2/2)

5. Testes preliminares

• Imagens sintéticas: para análise dos parâmetros do detector de linhas e paralelogramos.

• Redução da resolução, retirada da moldura, filtro gaussiano, filtro para melhora do contraste.

6. Classificação simples por limiar (1/2)

• Tiles 20x20 e lado mínimo = 10. • Nos experimentos com 25 imagens, 5 de cada

configuração, foram selecionados limiares para o # linhas e # paralelogramos.

• Resultados

para 90 imagens:

maior parte foi

classificada como

intermediária.

6. Classificação simples por limiar (2/2)

7. Classificação com SVM (1/3)

• Support Vector Machine (SVM): encontra um hiperplano que separa os vetores de treino mapeados em um espaço de dimensão mais alta.

• 45 imagens de treino, 15 de cada classe.• 45 imagens de teste, 15 de cada classe.• Kernel RBF (radial basis function): relação não-linear.• 9 características:

– # paralelogramos– # linhas– # paralelogramos / # linhas– # linhas ≥ 40 / # linhas– # linhas ≥ 50 / # linhas– # linhas ≥ 60 / # linhas– # linhas ≥ 70 / # linhas– # linhas ≥ 80 / # linhas– # linhas ≥ 100 / # linhas

7. Classificação com SVM (2/3)

• Resultado: 62% (28/45)

7. Classificação com SVM (3/3)

8. Conclusões

• Resultados precisam ser melhorados, características escolhidas só possibilitam 62% de acerto na classificação.

• Deve-se incluir mais características no modelo, principalmente levando-se em conta o posicionamento dos paralelogramos.

9. Trabalhos futuros

• Selecionar novas características, por exemplo um histograma de orientações dos paralelogramos.

• Utilizar um conjunto maior de imagens para treinamento e testes.

• Testar outros filtros para melhorar qualidade das imagens.

Referências principais

• Q. Iqbal and J. Aggarwal. Retrieval by classification of images containing large manmade objects using perceptual grouping. Pattern Recognition, 35(7):1463–1479, July 2002.

• C. Jung and S. Rosito. Parallelogram detection using the tiled hough transform. In Proceedings of 13th International Conference on Systems, Signals and Image Processing, volume I, pages 177–180, 2006.

• C. Chang and C. Lin. LIBSVM : a library for support vector machines, 2001. Software available athttp://www.csie.ntu.edu.tw/~cjlin/libsvm .