recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras...

6
Radiol Bras 2002;35(2):93–98 93 Artigo Original Artigo Original Artigo Original Artigo Original Artigo Original RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO: RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO: RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO: RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO: RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO: USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃO USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃO USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃO USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃO USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃO DE MICROCALCIFICAÇÕES MAMOGRÁFICAS* DE MICROCALCIFICAÇÕES MAMOGRÁFICAS* DE MICROCALCIFICAÇÕES MAMOGRÁFICAS* DE MICROCALCIFICAÇÕES MAMOGRÁFICAS* DE MICROCALCIFICAÇÕES MAMOGRÁFICAS* Paulo Mazzoncini de Azevedo-Marques 1 , Marcelo Hossamu Honda 2 , José Antônio H. Rodrigues 3 , Rildo Ribeiro dos Santos 4 , Agma Juci Machado Traina 5 , Caetano Traina Júnior 6 , Josiane Maria Bueno 7 Este trabalho descreve um sistema de recuperação de imagens baseada em conteúdo (“content-based im- age retrieval”), desenvolvido para auxiliar o diagnóstico de lesões de mama por inspeção visual, mediante comparação de imagens. Quando uma imagem desconhecida é apresentada, o sistema extrai um vetor de atributos de textura e busca, em um banco de dados, imagens com características semelhantes dentro de uma aproximação previamente estabelecida. As imagens recuperadas são apresentadas ao usuário, que pode, então, verificar os diagnósticos associados. Unitermos: Recuperação de imagem baseada em conteúdo. Reconhecimento de padrões. Atributos de textura. Content-based image retrieval: textural features applied to characterization of mammographic calcifica- tions. This work describes a content-based image retrieval system developed to aid in the diagnosis of breast lesions by visual inspection through comparison of images. When an unknown image is presented the sys- tem extracts a vector of texture features and searches a database for images with similar characteristics, within a previously established approximation. The retrieved images are presented to the user for evaluation of the associated diagnoses. Key words: Content-based image retrieval. Pattern recognition. Texture features. Resumo Abstract * Trabalho realizado junto ao Serviço de Radiodiagnóstico do Hospital das Clínicas da Faculdade de Medicina de Ribei- rão Preto da Universidade de São Paulo (HCFMRP-USP), Ri- beirão Preto, SP. Apoio financeiro da Fapesp e da Pró-Rei- toria de Pesquisa da USP (Projeto Ciupe). 1. Engenheiro Eletrônico, Doutor em Física Aplicada, Do- cente do Centro de Ciências das Imagens e Física Médica do Departamento de Clínica Médica da FMRP-USP. 2. Bacharel em Ciências da Computação, Aluno de Mes- trado do Departamento de Engenharia Elétrica da Escola de Engenharia da USP, São Carlos, SP. 3. Médico Radiologista, Mestre em Clínica Médica, Médico Assistente no Serviço de Radiodiagnóstico do HCFMRP-USP. 4. Bacharel em Ciências da Computação, Doutor em Física Computacional, Docente do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista (Unesp), São José do Rio Preto, SP. 5. Bacharel em Ciências da Computação, Doutora em Fí- sica Computacional, Docente do Instituto de Ciências Ma- temáticas e de Computação da USP, São Carlos, SP. 6. Engenheiro Elétrico, Doutor em Física Computacional, Docente do Instituto de Ciências Matemáticas e de Compu- tação da USP, São Carlos, SP. 7. Bacharel em Ciências da Computação, Mestre em Ciên- cias da Computação e Matemática Computacional, Aluna de Doutorado do Instituto de Ciências Matemáticas e de Com- putação da USP, São Carlos, SP. Endereço para correspondência: Dr. Paulo M. de Azevedo Marques. Rua Ceará, 3005, apto. 22, Jardim Paulistano. Ri- beirão Preto, SP, 14090-300. E-mail: [email protected] Recebido para publicação em 28/2/2001. Aceito, após re- visão, em 17/10/2001. INTRODUÇÃO O câncer de mama é uma das doenças que lideram o número de mortes entre mulheres em grande parte do mundo, apre- sentando a maior taxa de mortalidade en- tre todos os tipos de câncer na Europa Oci- dental e na América do Norte (1) . No Cana- dá e nos Estados Unidos as estatísticas in- dicam que uma entre dez mulheres desen- volverá câncer de mama durante o seu pe- ríodo de vida (2) . De acordo com dados do Instituto Nacional do Câncer (INCA), o número estimado de novos casos de cân- cer de mama no Brasil, em 2001, é de 31.590, existindo uma indicação estatísti- ca de aumento de sua freqüência, tanto nos países desenvolvidos quanto nos países em desenvolvimento (3) . Dos métodos de diagnóstico atualmen- te disponíveis, a mamografia é ainda o mais eficaz para a detecção do câncer, sendo a detecção precoce e a remoção do tumor na fase inicial a estratégia mais eficiente na re- dução da taxa de mortalidade das pacien- tes (4) . No entanto, a detecção precoce rea- lizada por especialista, através da análise visual, é muito difícil, sendo que de 10% a 30% dos cânceres de mama, incluindo os tumores palpáveis, não são detectados com a rotina mamográfica (5) . Muitos dos casos iniciais de câncer de mama são descobertos pela detecção de mi- crocalcificações, sendo que cerca de 30% a 50% dos carcinomas possuem microcal- cificações associadas visíveis no mamogra- ma (6,7) , e 50% a 80% dos carcinomas de mama revelam microcalcificações sob exa- me histológico (8,9) . Entretanto, a dificulda- de na visualização das microcalcificações causa um aumento significativo no núme- ro de biópsias realizadas, chegando a taxas de falso-positivos de 88% (número de fal- so-positivos dividido pela soma do núme- ro de falso-positivos e falso-negativos) (2) . Por isso, muitos grupos de pesquisa têm desenvolvido sistemas de diagnóstico au- xiliado por computador (“computer-aided diagnosis” – CAD) voltados para a detec- ção e classificação automatizada de lesões de mama, visando à diminuição das taxas de falso-positivos e falso-negativos (1,2) . Nós também temos trabalhado no de- senvolvimento de sistemas de diagnóstico auxiliado por computador (10–13) , sendo o propósito deste estudo a implementação de um sistema de recuperação de imagens baseada em conteúdo (14) (“content-based

Transcript of recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras...

Page 1: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Radiol Bras 2002;35(2):93–98 93

Artigo OriginalArtigo OriginalArtigo OriginalArtigo OriginalArtigo Original

RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO:RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO:RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO:RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO:RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO:USO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃOUSO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃOUSO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃOUSO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃOUSO DE ATRIBUTOS DE TEXTURA PARA CARACTERIZAÇÃODE MICROCALCIFICAÇÕES MAMOGRÁFICAS*DE MICROCALCIFICAÇÕES MAMOGRÁFICAS*DE MICROCALCIFICAÇÕES MAMOGRÁFICAS*DE MICROCALCIFICAÇÕES MAMOGRÁFICAS*DE MICROCALCIFICAÇÕES MAMOGRÁFICAS*Paulo Mazzoncini de Azevedo-Marques1, Marcelo Hossamu Honda2, José Antônio H.Rodrigues3, Rildo Ribeiro dos Santos4, Agma Juci Machado Traina5, Caetano Traina Júnior6,Josiane Maria Bueno7

Este trabalho descreve um sistema de recuperação de imagens baseada em conteúdo (“content-based im-

age retrieval”), desenvolvido para auxiliar o diagnóstico de lesões de mama por inspeção visual, mediante

comparação de imagens. Quando uma imagem desconhecida é apresentada, o sistema extrai um vetor de

atributos de textura e busca, em um banco de dados, imagens com características semelhantes dentro de

uma aproximação previamente estabelecida. As imagens recuperadas são apresentadas ao usuário, que

pode, então, verificar os diagnósticos associados.

Unitermos: Recuperação de imagem baseada em conteúdo. Reconhecimento de padrões. Atributos detextura.

Content-based image retrieval: textural features applied to characterization of mammographic calcifica-tions.This work describes a content-based image retrieval system developed to aid in the diagnosis of breast

lesions by visual inspection through comparison of images. When an unknown image is presented the sys-

tem extracts a vector of texture features and searches a database for images with similar characteristics,

within a previously established approximation. The retrieved images are presented to the user for evaluation

of the associated diagnoses.

Key words: Content-based image retrieval. Pattern recognition. Texture features.

Resumo

Abstract

* Trabalho realizado junto ao Serviço de Radiodiagnósticodo Hospital das Clínicas da Faculdade de Medicina de Ribei-rão Preto da Universidade de São Paulo (HCFMRP-USP), Ri-beirão Preto, SP. Apoio financeiro da Fapesp e da Pró-Rei-toria de Pesquisa da USP (Projeto Ciupe).

1. Engenheiro Eletrônico, Doutor em Física Aplicada, Do-cente do Centro de Ciências das Imagens e Física Médicado Departamento de Clínica Médica da FMRP-USP.

2. Bacharel em Ciências da Computação, Aluno de Mes-trado do Departamento de Engenharia Elétrica da Escola deEngenharia da USP, São Carlos, SP.

3. Médico Radiologista, Mestre em Clínica Médica, MédicoAssistente no Serviço de Radiodiagnóstico do HCFMRP-USP.

4. Bacharel em Ciências da Computação, Doutor em FísicaComputacional, Docente do Instituto de Biociências, Letrase Ciências Exatas da Universidade Estadual Paulista (Unesp),São José do Rio Preto, SP.

5. Bacharel em Ciências da Computação, Doutora em Fí-sica Computacional, Docente do Instituto de Ciências Ma-temáticas e de Computação da USP, São Carlos, SP.

6. Engenheiro Elétrico, Doutor em Física Computacional,Docente do Instituto de Ciências Matemáticas e de Compu-tação da USP, São Carlos, SP.

7. Bacharel em Ciências da Computação, Mestre em Ciên-cias da Computação e Matemática Computacional, Aluna deDoutorado do Instituto de Ciências Matemáticas e de Com-putação da USP, São Carlos, SP.

Endereço para correspondência: Dr. Paulo M. de AzevedoMarques. Rua Ceará, 3005, apto. 22, Jardim Paulistano. Ri-beirão Preto, SP, 14090-300. E-mail: [email protected]

Recebido para publicação em 28/2/2001. Aceito, após re-visão, em 17/10/2001.

INTRODUÇÃO

O câncer de mama é uma das doençasque lideram o número de mortes entre

mulheres em grande parte do mundo, apre-sentando a maior taxa de mortalidade en-tre todos os tipos de câncer na Europa Oci-dental e na América do Norte(1). No Cana-dá e nos Estados Unidos as estatísticas in-dicam que uma entre dez mulheres desen-volverá câncer de mama durante o seu pe-ríodo de vida(2). De acordo com dados doInstituto Nacional do Câncer (INCA), onúmero estimado de novos casos de cân-cer de mama no Brasil, em 2001, é de31.590, existindo uma indicação estatísti-ca de aumento de sua freqüência, tanto nospaíses desenvolvidos quanto nos países emdesenvolvimento(3).

Dos métodos de diagnóstico atualmen-te disponíveis, a mamografia é ainda o maiseficaz para a detecção do câncer, sendo adetecção precoce e a remoção do tumor nafase inicial a estratégia mais eficiente na re-dução da taxa de mortalidade das pacien-tes(4). No entanto, a detecção precoce rea-lizada por especialista, através da análisevisual, é muito difícil, sendo que de 10% a30% dos cânceres de mama, incluindo ostumores palpáveis, não são detectados coma rotina mamográfica(5).

Muitos dos casos iniciais de câncer demama são descobertos pela detecção de mi-crocalcificações, sendo que cerca de 30%a 50% dos carcinomas possuem microcal-cificações associadas visíveis no mamogra-ma(6,7), e 50% a 80% dos carcinomas demama revelam microcalcificações sob exa-me histológico(8,9). Entretanto, a dificulda-de na visualização das microcalcificaçõescausa um aumento significativo no núme-ro de biópsias realizadas, chegando a taxasde falso-positivos de 88% (número de fal-so-positivos dividido pela soma do núme-ro de falso-positivos e falso-negativos)(2).Por isso, muitos grupos de pesquisa têmdesenvolvido sistemas de diagnóstico au-xiliado por computador (“computer-aideddiagnosis” – CAD) voltados para a detec-ção e classificação automatizada de lesõesde mama, visando à diminuição das taxasde falso-positivos e falso-negativos(1,2).

Nós também temos trabalhado no de-senvolvimento de sistemas de diagnósticoauxiliado por computador(10–13), sendo opropósito deste estudo a implementação deum sistema de recuperação de imagensbaseada em conteúdo(14) (“content-based

Page 2: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Recuperação de imagem baseada em conteúdo

94 Radiol Bras 2002;35(2):93–98

image retrieval” – CBIR), voltado para oauxílio ao diagnóstico de lesões de mamapor comparação visual.

Sistema de recuperação de imagensbaseada em conteúdo

Um ambiente médico se caracteriza peladiversidade e quantidade de informaçõesque são produzidas ao longo do tratamen-to e acompanhamento de um paciente. Di-versos tipos de sistemas de gerenciamentode informação podem ser encontrados den-tro desse ambiente, para controle dos da-dos administrativos e clínicos. Estes dadospodem estar na forma de atributos textuais,representando informações gerais sobre opaciente e dados do prontuário, bem comona forma de imagens, resultantes da reali-zação de exames. Nesse contexto, a buscapor informações pode ser feita medianteconsultas por elementos textuais ou porimagens. Um sistema que possibilite a bus-ca de exames a partir de informações so-bre o seu conteúdo pictórico é denomina-do de sistema de consulta de imagem ba-seada em conteúdo.

Pode-se definir tipos diferentes de con-sultas, de acordo com o tipo de informaçãoa ser utilizada na caracterização do conteú-do da imagem. Os métodos mais comunsde formulação de consulta são(15):

a) Baseadas em atributos textuais: con-sistem na utilização de atributos textuaisque descrevem o que se encontra no exa-me. Estas informações normalmente sãoobtidas a partir da análise de um especia-lista no domínio de conhecimento em queesteja inserido o exame. No entanto, o textopode apresentar um alto índice de ambigüi-dade, além de ser dependente do conheci-mento do especialista.

b) Baseadas em características pictóri-cas: consistem na extração de uma série deelementos gráficos que possam caracteri-zar o conteúdo da imagem, como, porexemplo, o histograma de cores, textura,descritores da forma, e outros. Neste caso,o aspecto importante consiste na definiçãode uma semântica apropriada ao conjuntode informações obtidas, para que estaspossam ser significativas para o domínio daaplicação(16).

c) Baseadas em imagem-exemplo: con-sistem em fornecer uma imagem a ser uti-lizada como um exemplo das demais a se-

rem recuperadas a partir do banco de da-dos. A imagem-exemplo pode apresentar amesma resolução das que deverão ser re-cuperadas, uma resolução menor, ou sermontada ou desenhada pelo usuário. Nes-te último caso, pode-se utilizar de íconesque representem elementos presentes nasimagens e, assim, o problema pode consis-tir em definir ícones apropriados aos váriosdomínios de aplicações.

Uso de textura para caracterizaçãode imagens radiológicas

Uma definição genérica de textura po-deria ser “a disposição ou característica doselementos constituintes de alguma coisa,especialmente no que se refere à aparênciasuperficial ou à qualidade táctil”(17). Porém,no caso de imagens, uma definição maisadequada poderia ser “uma característicarepresentativa da distribuição espacial dosníveis de cinza dos elementos de imagem(“pixels”) de uma região”(18). Ou seja, umatributo de textura é um valor, calculado apartir da imagem de um objeto, que quan-tifica algumas características da variaçãodos níveis de cinza desse objeto. Normal-mente, um atributo de textura é indepen-dente da posição, orientação, tamanho,forma e brilho do objeto(19).

Uma das abordagens mais simples paraa descrição de textura é por intermédio dosmomentos do histograma de primeira or-dem dos níveis de cinza de uma imagem oude uma região. Porém, medidas de texturacalculadas apenas a partir do histograma deprimeira ordem sofrem a limitação de nãocarregarem informações sobre a distribui-ção espacial dos “pixels” da imagem. Umamaneira de trazer essa informação ao pro-cesso de análise de textura é considerar nãoapenas a distribuição de intensidade, mastambém as posições espaciais relativas dos“pixels” com valores de intensidade iguaisou similares. O histograma de segunda or-dem, p(i,j), também chamado de matriz dedependência espacial de nível de cinza oumatriz de co-ocorrência, é uma represen-tação da distribuição de probabilidade deocorrência de um par de valores semelhan-tes de nível de cinza, separados por umadistância “d”, na orientação “θ”. Em outraspalavras, p(i,j) indica a freqüência de ocor-rência de um particular par de nível de cin-za i e j, medido a partir de uma distância

“d” e de um ângulo “θ”. As estatísticas dohistograma de segunda ordem, como, porexemplo, entropia, inércia e energia, cor-relacionam-se muito bem com as estrutu-ras da imagem e têm sido largamente utili-zadas na literatura para a análise de carac-terística, tais como homogeneidade, con-traste, presença de estruturas organizadas,transição de nível de cinza e complexida-de da imagem(20–23). A Figura 1 apresentaum exemplo do cálculo da matriz de co-ocorrência para uma imagem com três ní-veis de cinza, considerando-se uma distân-cia igual a 1 e um ângulo igual a 135°.

(a)

(b)

Figura 1. Exemplo de cálculo de matriz de co-ocor-rência de nível de cinza: (a) exemplo de imagemcom três níveis de cinza; (b) cálculo de número depares de “pixels” iguais à direita e abaixo; (c) matrizde co-ocorrência obtida após a normalização damatriz A.

(c)

0 0 0 1 2

1 1 0 1 1

2 2 1 0 0

1 1 0 2 0

0 0 1 0 1

135°

4 2 1

2 3 2

0 2 0

A =

a13

a31

a11

0,2500 0,1250 0,0625

0,1250 0,1875 0,1250

0,0000 0,1250 0,0000

A =

Page 3: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Azevedo-Marques PM et al.

Radiol Bras 2002;35(2):93–98 95

MATERIAL E MÉTODOS

Este trabalho utiliza-se de uma aborda-gem mista, com extração de característicasdas imagens para a definição de seu con-teúdo e o uso de uma imagem-exemplocomo forma de reforçar o significado da in-formação a ser procurada no banco. Nessaabordagem(24–27), o conceito que possibilitaa definição de operadores envolvendo ima-gens na base de dados é a constante ima-gem. A constante imagem é uma imagemqualquer, indicada como padrão para asoperações a serem formuladas sobre outrasimagens do banco. Por exemplo, o médicopode utilizar uma mamografia que conte-nha um agrupamento de microcalcifica-ções, associado a um tumor benigno oumaligno, como parâmetro para futuras bus-cas por exames que possuam uma afecçãocom características visuais semelhantes.Ou seja, esta imagem pode ser indicada aosistema como um padrão de comparaçãocom outras, obtidas a partir do mesmo tipode exame. Para que isso seja possível, oselementos gráficos extraídos das imagenssão tratados pelos sumarizadores. Os su-marizadores representam o conjunto deoperações válidas para o grupo de imagens,cujo resultado é utilizado como elementopara realizar comparações entre estas. Cadaoperação representada pelo sumarizadorpode retornar diversos valores. Os parâ-metros ou variáveis representam este con-junto de valores. Estes elementos descre-vem o sumarizador em seu aspecto estru-tural, através do conjunto de informaçõesque este extrai das imagens. Pode-se entãodefinir um intervalo de valores indicadocomo significativo para a caracterização daimagem, o qual é denominado de limite deaceitação. Ou seja, o grau de similaridadeentre os parâmetros obtidos para as ima-gens envolvidas na operação de busca.

O sistema desenvolvido trabalha emplataforma Windows (Microsoft) e utilizao programa Delphi (Borland) para a cons-trução da interface com o usuário. As ima-gens, juntamente com as demais informa-ções não textuais, foram armazenadas nobanco de dados relacional Oracle 8i (Ora-cle Corp.). O banco de imagens utilizadopara os testes foi composto por 100 casosde lesões de mama contendo agrupamen-tos de microcalcificações associados (50

lesões benignas e 50 malignas), todas con-firmadas por biópsia. As mamografias(uma por caso) foram digitalizadas em umdigitalizador Umax-MirageII (UmaxTechnologies Inc.), com resolução espacialde 600 pontos por polegada (tamanho de“pixel” igual a 0,042 mm) e 256 níveis decinza (8 “bits”). As regiões de interesse(“regions of interest” – ROI) (uma por ma-mografia) contendo os agrupamentos fo-ram identificadas por médicos especialis-tas do Hospital das Clínicas da Faculdadede Medicina de Ribeirão (HCFMRP) e seg-mentadas. As imagens contendo as ROI fo-ram utilizadas para a caracterização dasmamografias. As imagens foram agrupadassegundo valores de atributos de textura su-geridos por Haralick et al.(20) e Haralick(21),obtidos das matrizes de co-ocorrência deníveis de cinza em orientações iguais a 0°,45°, 90° e 135° e distância entre a vizinhan-ça igual a 1 “pixel”, calculadas para cadauma das ROI(10,13). A extração de atributosde textura das ROI consiste, então, no tipode sumarizador definido para essa aplica-ção e os valores resultantes de sua aplica-ção sobre as imagens são definidos comovariáveis descritoras. Assim, quando da in-serção de um novo exame no banco de da-dos, as características que descrevem oconteúdo da imagem são obtidas a partir daaplicação do sumarizador de textura sobrea ROI e armazenadas juntamente com aimagem. Essas informações são a chave deacesso às imagens, sendo utilizadas na for-mulação de consultas baseadas na descri-ção do conteúdo.

Para a avaliação da acurácia do sistemaimplementado foi utilizado o método deavaliação conhecido como “leave-one-out”(ou método “round-robin”), no qual umaamostra por vez é retirada do banco e uti-lizada como referência para a consulta,sendo este processo repetido até que todasas amostras tenham sido utilizadas comoreferência. Para cada consulta realizada, asimilaridade entre a imagem de referênciae as imagens recuperadas foi avaliada atra-vés de inspeção visual por um radiologistaexperiente do Serviço de Radiodiagnósticodo HCFMRP, o qual atribuiu uma notaentre 1 (completamente diferente), 2 (par-cialmente diferente), 3 (semelhante), 4(parcialmente idêntico) e 5 (completamenteidêntico) para cada par de imagens avalia-do. A precisão(28) do sistema foi calculadacomo sendo a fração de imagens recupe-radas consideradas relevantes para a con-sulta, isto é, o número de imagens recupe-radas consideradas relevantes dividido pelonúmero total de imagens recuperadas porconsulta. Foram consideradas relevantes asimagens que tiveram nota de similaridadeigual ou maior do que 3, em relação à ima-gem de referência.

RESULTADOS

Com o esquema da aplicação construí-do e o banco de imagens montado, pode-se fazer consultas para recuperar informa-ções a partir da indicação de seu conteúdo.A consulta é definida indicando-se basica-mente as seguintes informações (Figura 2):

Figura 2. Exemplo de tela de entrada para busca de imagem por conteúdo.

Page 4: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Recuperação de imagem baseada em conteúdo

96 Radiol Bras 2002;35(2):93–98

• O tipo de exame a ser recuperado (exa-me de mamografia), representado interna-mente pelos seus atributos e associado aopaciente;

• a imagem-exemplo (constante ima-gem), com a representação visual do tipode padrão que se espera localizar (tipo deagrupamento);

• o tipo de operação para a caracteriza-ção deste padrão (sumarizador);

• as características mais adequadas paradescrever o padrão (variável descritora);

• o limite de aceitação para a formaçãodo conjunto resposta.

Deve-se notar que na definição da con-sulta não é obrigatória a indicação de to-das as informações, sendo que a omissãode alguma(s) implica a realização de umaconsulta mais genérica. Considerando-se aindicação de todas estas informações, ousuário estará delimitando uma região no

espaço de busca, onde se encontram asimagens que irão formar o conjunto respos-ta. Uma vez que a operação de extração decaracterísticas resulta em uma série de in-formações sobre o conteúdo da imagem,pode-se considerar que estes elementosconstituem as coordenadas de um ponto emum espaço multidimensional. Ao selecio-nar a variável descritora e o seu limite deaceitação, o usuário estará indicando a di-mensão do espaço a ser considerada nabusca e a região que deverá conter os pon-tos com as imagens resultantes. Todas asimagens indexadas por estes pontos for-mam a resposta para a consulta formulada.

Particularmente, neste trabalho, foi uti-lizada uma combinação de atributos de tex-tura (medida de correlação, momento da di-ferença inversa, entropia, entropia da dife-rença e entropia da soma), considerada amais precisa em estudo realizado por Fer-

rari et al.(10,12), com o mesmo banco de ima-gens aqui empregado e um limite de acei-tação igual a 15% de variação nos valoresdos atributos (obtido de forma empírica).A precisão medida para as consultas apre-sentou valor médio igual a 0,64 e desviopadrão de 0,15. O desvio padrão elevadorepresenta a grande variação encontrada namedida da precisão, abrangendo desde va-lores muito baixos, da ordem de 0,22, atévalores altos, da ordem de 0,86, e inclusi-ve consultas com valores de precisão iguaisa 1,00 (ou seja, casos em que todas as ima-gens recuperadas foram consideradas rele-vantes pelo médico radiologista que fez aavaliação de similaridade). As Figuras 3 e4 mostram resultados de consultas ao ban-co de imagens considerando-se o parâme-tro entropia para a caracterização da textu-ra de agrupamentos associados a lesõesmaligna e benigna, respectivamente.

Figura 3. Exemplo de busca de imagem por conteúdo. A: Imagem de referência – caso maligno. B,C,D: Imagens recuperadas do banco.

C D

A B

Page 5: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Azevedo-Marques PM et al.

Radiol Bras 2002;35(2):93–98 97

DISCUSSÃO

A recuperação de imagens baseada emconteúdo tem ganhado espaço como umaimportante área de pesquisa em visão com-putacional e sistemas multimídia. A buscapor informação em formato digital, espe-cialmente por imagens, tem-se tornado deextrema importância para a radiologia.Muitos hospitais e centros de saúde pos-suem grandes coleções de imagens em for-mato digital, e a organização e indexaçãodesse material é fundamental para propiciara busca e recuperação de informação emtempo real e de forma significativa. Nessecontexto, sistemas de recuperação de ima-gens baseada em conteúdo são uma alter-nativa e um complemento importante paraos sistemas convencionais de busca ba-seada em palavras-chave. Porém, uma ta-refa bastante difícil no projeto de sistemas

de recuperação de imagens baseada emconteúdo é a escolha de uma representaçãoadequada para as imagens, especialmentena área da radiologia, em que estes siste-mas devem estar voltados para a interpre-tação visual e o auxílio ao diagnóstico.Atributos de textura têm sido consideradosuma boa aproximação para a percepçãovisual humana e utilizados em muitos sis-temas de auxílio ao diagnóstico(1,2). Ape-sar do valor médio encontrado para a pre-cisão ter sido relativamente baixo (0,64),a existência de consultas com um grandenúmero de imagens recuperadas conside-radas relevantes parece indicar a possibili-dade do uso de atributos de textura comoum índice para a recuperação de imagensmamográficas a partir de conteúdo. É im-portante salientar que todas as consultas re-tornaram pelo menos uma imagem consi-derada relevante, o que reforça a hipótese

de utilização do sistema no auxílio ao diag-nóstico. Deve-se ressaltar, também, que adecisão de utilizar ou não o diagnóstico as-sociado a uma imagem recuperada comofonte de informação para o auxílio ao diag-nóstico dependerá da avaliação de simila-ridade feita pelo radiologista no momentoda consulta, o qual poderá ou não solicitara visualização do laudo associado.

Provavelmente, a grande variação dosvalores de precisão e o resultado de baixarelevância de algumas consultas estejamassociados com o número limitado deamostras utilizado neste estudo. Certamen-te, alguns tipos de lesões não foram bemrepresentados em nossa base de dados e umestudo com número maior de imagens sefaz necessário. Além disso, como o valorda precisão está diretamente relacionadocom a inspeção visual por parte do radio-logista, uma avaliação das consultas por

A B

DC

Figura 4. Exemplo de busca de imagem por conteúdo. A: Imagem de referência – caso benigno. B,C,D: Imagens recuperadas do banco.

23 24

Page 6: recuperacao de imagem - SciELORecuperação de imagem baseada em conteúdo 94 Radiol Bras 2002;35(2):93–98 image retrieval” – CBIR), voltado para o auxílio ao diagnóstico de

Recuperação de imagem baseada em conteúdo

98 Radiol Bras 2002;35(2):93–98

parte de um número maior de especialistasé fundamental para o estabelecimento devalores de variação intra e interpessoal.

Outros aspectos importantes que deve-rão ser abordados em trabalhos futuros sãoa investigação da possibilidade do uso deatributos de textura (entre outros) para aseparação de imagens mamográficas se-gundo as categorias do BI-RADSTM(29) e aassociação do sistema de recuperação deimagens baseada em conteúdo com o sis-tema de informação em radiologia do hos-pital(30). Estudos voltados para esses obje-tivos já foram iniciados pelo nosso grupo.

CONCLUSÕES

Este trabalho apresenta a implementa-ção inicial de um sistema de recuperaçãode imagens baseada em conteúdo voltadopara o auxílio ao diagnóstico de lesões demama. Para as informações utilizadas nacaracterização da textura das imagens, osistema apresentou-se satisfatoriamentepreciso, com base na comparação visualentre as imagens de referência e as imagensrecuperadas. A partir dos resultados ini-ciais, pode-se considerar que o sistema pos-sui potencial como ferramenta de auxílioao trabalho do radiologista, especialmentepor permitir a formulação de consultasbaseadas na descrição do conteúdo gráfi-co da imagem. Além disso, a estrutura im-plementada é flexível à incorporação edefinição de novas técnicas para a descri-ção das imagens, permitindo a inclusão denovos sumarizadores, o que pode otimizaro processo de consulta ao banco.

REFERÊNCIAS1. Giger ML, Huo Z, Kupinski MA, Vyborny CJ.

Computer-aided diagnosis in mammography. In:Sonka M, Fitzpatrick JM, eds. Handbook of medi-cal imaging. Vol. II. Bellingham, Wash.: The In-ternational Society for Optical Engineering (SPIE),2000:915–1004.

2. Giger ML. Computer-aided diagnosis. In: RSNACategorical Course in Breast Imaging 1999:249–72.

3. Instituto Nacional do Câncer, Ministério da Saúde,Coordenação de Programas de Câncer. Estimativada incidência e mortalidade por câncer no Brasil.Rio de Janeiro, 2000 (http://www.inca.org.br/2000).

4. Swanson GM. Breast cancer in the 1990’s. J AmMed Women Assoc 1992;47:140–8.

5. Pollei SR, Mettler FA Jr, Bartow SA, MoradianG, Moskowitz M. Occult breast cancer: preva-lence and radiographic detectability. Radiology1987;163:459–62.

6. Sickles EA. Mammographic detectability of breastmicrocalcifications. AJR 1982;139:913–8.

7. Wolfe JN. Analysis of 462 breast carcinomas. AmJ Roentgenol Radium Ther Nucl Med 1974;121:846–53.

8. Murphy WA, DeSchryver-Kecskemeti K. Isolatedclustered microcalcifications in the breast: radio-logic-pathologic correlation. Radiology 1978;127:335–41.

9. Millis RR, Davis R, Stacey AJ. The detection andsignificance of calcifications in the breast: a ra-diological and pathological study. Br J Radiol1976;49:12–26.

10. Ferrari RJ, Frère AF, Marques PMA, KinoshitaSK, Spina LAR. Comparative evaluation of sta-tistical pattern recognition techniques for the clas-sification of breast lesions. In: Karssemeijer N,Thijssen M, Hendriks J, van Erning L, eds. Digi-tal mammography. Dordrecht: Kluwer AcademicPublishers, 1998:249–52.

11. Kinoshita SK, Marques PMA, Slaets AFF, MaranaHRC, Ferrari RJ, Villela RL. Detection and char-acterization of mammographic masses by artifi-cial neural network. In: Karssemeijer N, ThijssenM, Hendriks J, van Erning L, eds. Digital mam-mography. Dordrecht: Kluwer Academic Publish-ers, 1998:489–90.

12. Ferrari RJ, Azevedo-Marques PM, Frère AF,Kinoshita SK, Spina LAR. Characterization ofbreast cancer using statistical approaches. In: DoiK, MacMahon H, Giger ML, Hoffmann KR, eds.Computer-aided diagnosis in medical imaging.Amsterdam: Elsevier Science B.V., 1999:281–6.

13. Kinoshita SK, Azevedo-Marques PM, Slaets AFF,Marana HRC, Ferrari RJ, Villela RL. Character-ization of breast masses using texture and shapefeatures. In: Doi K, MacMahon H, Giger ML,Hoffmann KR, eds. Computer-aided diagnosis inmedical imaging. Amsterdam: Elsevier ScienceB.V., 1999:265–70.

14. Qi H, Snyder WE. Content-based image retrievalin picture archiving and communications sys-tems. J Digit Imaging 1999;12(2 Suppl 1):81–3.

15. Zachary JM, Iyengar SS. Content-based image

retrieval systems. Proceedings of the IEEE Sym-posium on Application-Specific Systems andSoftware Engineering & Technology 1999:136–43.

16. Colombo C, Del Bimbo A, Pala P. Semantics invisual information retrieval. IEEE Multimedia1999;6:38–53.

17. Landau SI, editor-in-chief. Webster Illustratedcontemporary dictionary. Garden City, NY:Doubleday, 1986.

18. IEEE Standard 610.4-1990. IEEE standard glos-sary of image processing and pattern recognitionterminology. New York: IEEE Press, 1990.

19. Castleman KN. Digital image processing. NewJersey: Prentice Hall, 1996.

20. Haralick RM, Shanmugan K, Dinstein I. Texturalfeatures of images classification. IEEE TransSystems Man Cybernetics 1973;SMC-3:610–21.

21. Haralick RM. Statistical and structural ap-proaches to texture. Proc IEEE 1979;67:786–804.

22. Reed TR, Du Buf MH. A review of recent tex-ture segmentation and feature extraction tech-niques. CVGIP: Image Understanding 1993;57:359–72.

23. Gonzalez RC, Woods RE. Digital image process-ing. New York: Addison-Wesley, 1993.

24. Traina Jr C, Traina AJM, Santos RR, SenzakoEY. A support system for content-based medicalimage retrieval in object oriented databases. JMed Syst 1997;21:339–52.

25. Traina Jr C, Traina AJM, Santos RR, SenzakoEY. Content-based medical image retrieval inobject oriented databases. Proceedings of the 10thIEEE Symposium on Computer Based MedicalSystems. Maribor, Eslovênia, June 1997:67–72.

26. Traina Jr C, Traina AJM, Santos RR, SenzakoEY. Support to content-based image query inobject-oriented databases. Proceedings of theACM Symposium on Applied Computing –SAC’98. Atlanta, USA, Feb/Mar 1998:241–7.

27. Traina Jr C, Traina AJM, Santos RR, SenzakoEY. A tool for content-based image retrieval inobject-oriented databases. Proceedings of theInternational Workshop on Issues and Applica-tions of Database Technology – IADT’98. Ber-lin, Germany, July 1998:344–51.

28. Smeulders AWM, Worring M, Santini S, GuptaA, Jain R. Content-based image retrieval at theend of the early years. IEEE Transactions on Pat-tern Analysis and Machine Intelligence 2000;22:1349–80.

29. The American College of Radiology (ACR).Breast imaging reporting and data system (BI-RADSTM). 3rd ed. Reston, VA: ACR, 1998.

30. Azevedo-Marques PM, Santos A, Elias Jr J, GoesW, Castro C, Trad CS. Implementação de umsistema de informação em radiologia em hospi-tal universitário. Radiol Bras 2000;33:155–60.