Lofoscopia

83
UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO – BACHARELADO PROTÓTIPO DE UM SISTEMA DE IDENTIFICAÇÃO DO(S) DELTA(S) E NÚCLEO EM IMPRESSÕES DIGITAIS UTILIZANDO REDES NEURAIS ARTIFICIAIS. CAIO RAFAEL SILVA MATIAS BLUMENAU 2004 2004/2-09

description

Biometria, lofoscopia...

Transcript of Lofoscopia

  • UNIVERSIDADE REGIONAL DE BLUMENAU

    CENTRO DE CINCIAS EXATAS E NATURAIS

    CURSO DE CINCIAS DA COMPUTAO BACHARELADO

    PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)

    DELTA(S) E NCLEO EM IMPRESSES DIGITAIS

    UTILIZANDO REDES NEURAIS ARTIFICIAIS.

    CAIO RAFAEL SILVA MATIAS

    BLUMENAU 2004

    2004/2-09

  • CAIO RAFAEL SILVA MATIAS

    PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)

    DELTA(S) E NCLEO EM IMPRESSES DIGITAIS

    UTILIZANDO REDES NEURAIS ARTIFICIAIS.

    Trabalho de Concluso de Curso submetido Universidade Regional de Blumenau para a obteno dos crditos na disciplina. Trabalho de Concluso de Curso II do curso de Cincias da Computao Bacharelado.

    Prof. Jomi Fred Hbner - Orientador

    BLUMENAU 2004

    2004/2-09

  • PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)

    DELTA(S) E NCLEO EM IMPRESSES DIGITAIS

    UTILIZANDO REDES NEURAIS ARTIFICIAIS.

    Por

    CAIO RAFAEL SILVA MATIAS

    Trabalho aprovado para obteno dos crditos na disciplina de Trabalho de Concluso de Curso II, pela banca examinadora formada por:

    ______________________________________________________ Presidente: Prof., Jomi Fred Hbner Orientador, FURB

    ______________________________________________________ Membro: Prof. Mauro Marcelo Mattos, FURB

    ______________________________________________________ Membro: Prof. Paulo Csar Rodacki Gomes, FURB

    Blumenau, 09 de Fevereiro de 2005.

  • Dedico este trabalho a toda a minha famlia em especial minha noiva, pessoas estas que me apoiaram durante toda a minha vida.

  • A mente que se abre a uma nova idia jamais volta ao seu tamanho original.

    Albert Einstein

  • AGRADECIMENTOS

    A Deus, pela oportunidade da existncia.

    A meus pais, Jair Matias e Roseli Silva Matias, por toda a educao recebida ao longo

    destes meus 22 anos, educao esta que foi fundamental para a formao de meu carter.

    minha noiva Gabriela Porto pela sua maturidade e companheirismo mostrados nos

    momentos de minha ausncia em que me dediquei a este trabalho.

    Ao meu orientador, Jomi Fred Hbner pelo seu bom humor, e conhecimentos tcnicos,

    bem como pelo seu apoio e incentivo prestados a mim durante todo o perodo de

    desenvolvimento.

    Aos meus companheiros Alex Sandro Silva e Maurcio Edgar Stivanello, com os quais

    troquei muitas idias durante todo o perodo de desenvolvimento deste trabalho.

    E por fim a todos aqueles amigos e companheiros, que j passaram ou esto presentes

    em minha vida, e que j torceram ou torcem pelo meu sucesso enquanto ser humano.

  • RESUMO

    Este trabalho apresenta o desenvolvimento de um prottipo para reconhecimento de delta(s) e ncleo em impresses digitais. Para este reconhecimento utilizou-se uma Rede Neural Artificial feedforward multicamada com treinamento backpropagation. Como entradas para esta rede so apresentados fragmentos de imagens, e como resposta espera-se que a rede classifique esta entrada em trs padres, os quais indicaro a qual regio este fragmento de imagem pertence. Ainda so mostrados neste trabalho a construo de um sistema de identificao das impresses digitais atravs da comparao de uma impresso digital com outras de usurios previamente cadastrados, bem como as tcnicas, dificuldades e resultados referentes as etapas de estudo e desenvolvimento.

    Palavras chaves: Inteligncia Artificial; Redes Neurais Artificiais; Impresses Digitais;

  • ABSTRACT

    This work describes the development of prototype to recognize delta(s) and kernel in fingerprints. It was applied a feedforward multi-layer artificial neural network with backpropagation algorithm to classify the fingerprints. Some regions of the fingerprints image are used as training samples for this network and it answer by classify theses inputs as the either delta or kernel. This work shows the implementation of a fingerprints recognizing system by comparing fingerprints with another one previously provided. Some techniques, difficulties and results identified while this working was being done are show. Palavras chaves: Artificial Inteligence; Artificial Neural Network; Fingerprints;

  • LISTA DE ILUSTRAES

    Figura 1 Regies dos sistemas de linhas. ..............................................................................21 Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich. ......................................23 Figura 3 Em destaque ncleo e deltas de uma ID..................................................................24 Figura 4 Representao macro de um sistema de identificao biomtrica. .........................26 Figura 5 Representao de um neurnio biolgico. ..............................................................32 Figura 6 Representao do funcionamento de um neurnio artificial...................................35 Figura 7 Representao dos Fluxos das RNA .......................................................................36 Figura 8 Funo logstica de ativao sigmide binria. ......................................................38 Figura 9 Exemplo de regies da IID passadas como entrada para a RNA............................44 Figura 10 Definio da diviso de quadrantes numa IID ......................................................44 Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID. ...............45 Figura 12 Diagrama de caso de uso primrio do ator Especialista ....................................46 Figura 13 Diagrama de caso de uso primrio do ator Usurio...........................................46 Figura 14 Diagrama de caso de uso secundrio do ator Usurio .......................................47 Figura 15 Diagrama de Classes do prottipo ........................................................................47 Quadro 1 Rotina principal de treinamento da classe RedeNeural .........................................53 Quadro 2 Rotina de ativao dos neurnios das camadas ocultas e de sada........................54 Quadro 3 Rotina de clculo do delta dos neurnios da camada de sada da RNA................54 Quadro 4 Rotina de clculo do delta dos nernios da camada oculta RNA..........................55 Quadro 5 Rotina de ajuste dos pesos de todas as camada da RNA. ......................................55 Quadro 6 Rotina de clculo do Erro Quadrado Mdio EQM................................................56 Quadro 7 Rotinas da Funo Sigmide Binria e sua derivada. ...........................................56 Quadro 8 Rotina de converso de imagens 20x20 para os valores de entrada da RNA........56 Quadro 9 Rotina da heurstica do clculo da distncia..........................................................57 Figura 16 Exemplo de IIDs capturadas com tinta comum e tinta tipogrfica .......................59 Figura 17 IID capturada atravs de um leitor biomtrico......................................................59 Figura 18 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 19 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 20 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 21 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 22 Exemplo de IIDs geradas pelo aplicativo Sfinge ..................................................62 Figura 23 Amostras de treinamento de regies dos deltas ampliadas em 5 vezes. ...............65 Figura 24 Amostras de treinamento de regies dos ncleos ampliadas em 5 vezes. ............65 Figura 25 Amostras de treinamento de regies quaisquer ampliadas em 5 vezes.................65 Figura 26 Tela principal do prottipo....................................................................................66 Figura 27 Pasta Treinamento Automtico da tela de Treinamento da RNA. ........................67 Figura 28 Pasta Treinamento Manual da tela de Treinamento da RNA................................68 Figura 29 Pasta de Pesos da tela de Treinamento da RNA. ..................................................69 Figura 30 Pasta de Validao Automtica da tela de Validao da RNA.............................70 Figura 31 Pasta de Validao Manual da tela de Validao da RNA. ..................................70 Figura 32 Tela de cadastramento de usurios.........................................................................71 Figura 33 Tela de identificao das IIDs atravs da comparao das distncias. ..................72 Figura 34 Grfico de testes com diferentes valores em parmetros da RNA........................73

  • LISTA DE TABELAS

    Tabela 1 Quantidade de amostras por Grupo para cada tipo de regio .................................64 Tabela 2 Resultado da taxa de acerto da RNA com vrios NO na camada Oculta ...............73 Tabela 3 Resultados por grupos de Amostras .......................................................................74

  • LISTA DE SIGLAS

    AFIS Automatic Fingerprint Identification System

    BD Banco de Dados

    BMP BitMaP ou mapa de bits

    DPI Dots Per Inch ou pontos por polegada

    EQM Erro Quadrado Mdio

    ID Impresso Digital

    IID Imagem de Impresso Digital

    NO Neurnio Oculto

    Pixel Picture Element ou elemento da imagem

    RGB Red+Green+Blue ou Vermelho+Verde+Azul

    RNA Rede Neural Artificial

    RNA-FM Rede Neural Artificial Feedforward Multicamada

    SGBD Sistema Gerenciador de Banco de Dados

    UML Unified Modeling Language ou Linguagem de Modelagem Unificada

    XOR eXclusive OR conhecido como OU exclusivo

  • SUMRIO

    1 INTRODUO..................................................................................................................13

    1.1 ORIGEM DO TRABALHO..............................................................................................13

    1.2 REAS..............................................................................................................................14

    1.3 PROBLEMA .....................................................................................................................15

    1.4 JUSTIFICATIVAS............................................................................................................15

    1.5 OBJETIVOS......................................................................................................................16

    1.6 ESTRUTURA DO TRABALHO......................................................................................16

    2 FUNDAMENTAO TERICA....................................................................................18

    2.1 IMPRESSES DIGITAIS.................................................................................................18

    2.1.1 Datiloscopia.....................................................................................................................18

    2.1.2 Estudo da Pele.................................................................................................................19

    2.1.3 Sistema Datiloscpico de Juan Vucetich ........................................................................21

    2.1.3.1 Mincias .......................................................................................................................23

    2.1.3.2 Ncleo e Deltas.............................................................................................................24

    2.2 BIOMETRIA.....................................................................................................................25

    2.2.1 Sistemas de Identificao Biomtrica .............................................................................25

    2.2.2 Sistemas de Identificao Biomtrica atravs das Impresses Digitais..........................26

    2.3 PROCESSAMENTO DE IMAGENS ...............................................................................28

    2.3.1 Imagem Digital................................................................................................................28

    2.3.1.1 Definio de Cores .......................................................................................................29

    2.3.1.2 Formato de Imagens .....................................................................................................30

    2.3.2 Tcnicas de Processamento de Imagens .........................................................................30

    2.4 REDES NEURAIS ............................................................................................................31

    2.4.1 Sistema Nervoso e Neurnio Biolgico..........................................................................31

    2.4.2 Redes Neurais Artificiais ................................................................................................33

    2.4.2.1 Neurnio Artificial........................................................................................................34

    2.4.2.2 Rede Neural Artificial Feedforward Multicamada.......................................................36

    2.4.2.3 Funes de Ativao.....................................................................................................37

    2.4.2.4 Treinamento e Aprendizado .........................................................................................38

    2.4.2.4.1 Aprendizado por Retropropagao (backpropagation) ...........................................39

    2.4.2.5 Escolha da Estrutura das Redes ....................................................................................41

    2.5 CONTEXTO ATUAL DO TRABALHO .........................................................................41

  • 2.5.1 Trabalhos Correlatos .......................................................................................................41

    3 DESENVOLVIMENTO DO PROTTIPO....................................................................43

    3.1 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO.......................43

    3.2 VISO GERAL.................................................................................................................43

    3.3 ESPECIFICAO ............................................................................................................45

    3.3.1 Casos de Uso...................................................................................................................46

    3.3.2 Diagramas de Classes......................................................................................................47

    3.3.3 Integrao........................................................................................................................48

    3.3.4 Classe da Rede Neural ....................................................................................................48

    3.3.5 Estrutura da Rede ............................................................................................................50

    3.3.6 Parmetros de Treino ......................................................................................................51

    3.4 IMPLEMENTAO ........................................................................................................52

    3.4.1 Tcnicas e Ferramentas Utilizadas..................................................................................52

    3.4.2 Imagens de Impresses Digitais......................................................................................58

    3.4.3 Pr-Processamento em Imagens de Impresses Digitais ................................................62

    3.4.4 Treinamento da Rede Neural Artificial...........................................................................63

    3.4.5 Operacionalidade da Implementao ..............................................................................66

    3.5 RESULTADOS E DISCUSSO ......................................................................................72

    4 CONCLUSES..................................................................................................................76

    4.1 OBJETIVOS DO TRABALHO ........................................................................................76

    4.2 FERRAMENTAS..............................................................................................................76

    4.3 PROTTIPO .....................................................................................................................76

    4.4 REDE NEURAL ARTIFICIAL FEEDFORWARD MULTICAMADA...........................77

    4.5 CONCLUSES FINAIS...................................................................................................78

    4.6 EXTENSES ....................................................................................................................78

    REFERNCIAS BIBLIOGRFICAS .................................................................................80

  • 13

    0 INTRODUO

    Neste captulo so levantados alguns aspectos relativos ao tema, bem como a origem

    deste trabalho e as justificativas para o desenvolvimento do mesmo.

    0.0 ORIGEM DO TRABALHO

    A histria da Identificao Humana contada por historiadores, arquelogos e

    exploradores que estudaram o Homem e a vida animal na crosta terrestre. Desde a mais

    remota Antigidade, o Homem teve sua ateno voltada para a identificao. Os trogloditas

    usavam como meios de identificao, sinais diversos que serviam para marcar suas moradias.

    Aplicavam os desenhos palmares por meio de decalque sobre a argila, colorindo-o, e em

    seguida completavam o enfeite com cabeas dessecadas de animais ou at mesmo de inimigos

    abatidos em combates. Integrantes de tribos traziam desenhos coloridos pelo corpo, dentes de

    animais preso s orelhas, lbios e nariz. Tudo isto para que pudessem ser identificados uns

    pelos outros (APPOL, 2004).

    Ao longo do tempo estes mtodos de identificao evoluram, principalmente pela

    necessidade crescente de se confirmar a identidade de um indivduo, ou seja, de se ter certeza

    de que uma pessoa quem realmente diz ser. Durante os ltimos anos, as pessoas tm usado

    chaves, cartes, assinaturas e senhas para validar sua identidade. O grande problema destes

    artefatos que podem ser esquecidos, roubados, perdidos, copiados, armazenados de maneira

    insegura e at utilizados por pessoas que no tenham autorizao. Desta forma, no

    surpreendente que um novo campo de atraes nas pesquisas recentes seja a biometria. Dentre

    as definies citadas no dicionrio, biometria o ramo da cincia que estuda a mensurao

    dos seres vivos (PROGLOBO, 1996).

    Com base nos estudos da biometria e com a larga utilizao de computadores,

    puderam-se criar sistemas computacionais confiveis de identificao de indivduos. Para

    tanto estes sistemas utilizam caractersticas biomtricas que estudos cientficos j

    comprovaram como sendo nicas. Entre estas caractersticas destaca-se, o reconhecimento

    atravs da face, da geometria das mos, da assinatura, da voz, da ris, da retina e das

    impresses digitais associada ao acrnimo ID (AGUIAR, 2004).

  • 14

    Entre as caractersticas biomtricas citadas acima, a mais utilizada a identificao

    atravs das IDs, por ser mais barata e muito confivel. As IDs so reprodues fiis dos

    desenhos digitais em alguma superfcie plana. Desenhos digitais por sua vez, so as diversas

    linhas e entrelinhas formadas na pele dos dedos dos ps e das mos dos seres humanos e de

    alguns outros animais dotados de mos, tais como macacos, gambs, cotias, etc. No estudo

    das IDs destacam-se como sendo caractersticas importantes o(s) delta(s) e ncleo das

    mesmas. Pode-se definir o ncleo como sendo o centro de encontro das IDs, e o(s) delta(s)

    como sendo o(s) ngulo(s) ou tringulo(s) formados pelas linhas, localizados a direita e/ou

    esquerda da ID (KEHDY, 1968, p. 33).

    Para extrair as caractersticas biomtricas necessrio hardware especializado. No

    caso do desenho digital se faz necessrio um sensor ou scanner biomtrico. Os sistemas

    biomtricos baseados em IDs utilizam como base a Datiloscopia agregada a tcnicas e

    heursticas prprias de computao para gerar um sistema que permita a autenticao da

    identidade de um indivduo. O hardware normalmente apresenta para estes sistemas de

    identificao uma imagem digital, que por sua vez precisa ser tratada na maioria das vezes

    atravs de tcnicas de pr-processamento de imagem, para que estes sistemas se tornem o

    mais confiveis possvel.

    Para o desenvolvimento deste trabalho sero utilizadas tcnicas de Redes Neurais

    Artificiais (RNA) para o reconhecimento das IDs e a comparao com outras IDs previamente

    armazenadas. Segundo Loesch (1996, p. 5), as RNA so uma tentativa de se copiar as redes

    neurais dos seres humanos. Nelas encontram-se tambm neurnios, mas artificiais, que

    interconectados, podem produzir resultados expressivos no reconhecimento de padres. No

    caso deste trabalho, os padres a serem identificados e comparados sero as IDs.

    1.2 REAS

    As reas relacionadas ao trabalho proposto so:

    a) Datiloscopia: o contedo desta rea se faz necessrio para definio das

    caractersticas das IDs, que sero amplamente utilizadas para o desenvolvimento do

    prottipo;

    b) Identificao Biomtrica: seus conceitos vo ao encontro do prottipo, que um

    sistema de identificao biomtrica;

  • 15

    b) Computao Grfica: no que diz respeito captura das imagens das IDs, e todo o

    pr-processamento destas imagem que serviro de entrada para a RNA;

    b) Inteligncia Artificial (Redes Neurais Artificiais): a RNA implementada que ser a

    principal tecnologia empregada no prottipo.

    0.0 PROBLEMA

    Atualmente, e cada vez mais, necessita-se ter o acesso restrito e controlado de pessoas

    a certos locais, que vo desde bancos, empresas internacionais, locais de jogos etc. Os

    sistemas de identificao tradicionais levantam enormes e conhecidos problemas na gesto de

    assiduidade e acesso. So comuns, por exemplo, os erros nos cdigos a digitar e o

    esquecimento dos cartes. Alm disso, so sistemas com uma elevada taxa de incerteza, j

    que os cdigos podem ser divulgados a terceiros e os cartes podem ser emprestados ou at

    roubados (PROGLOBO, 1996).

    Em razo desta dificuldade, criou-se os sistemas de identificao biomtrica. Estes

    sistemas visam minimizar significativamente os problemas de controle de assiduidade e

    acesso, uma vez que utilizam as caractersticas fsicas do indivduo para identificao, e

    somente ser possvel a comprovao de sua identidade na presena fsica do mesmo.

    0.0 JUSTIFICATIVAS

    Inicialmente a identificao atravs das IDs eram feitas por indivduos treinados, ou

    seja, uma ou mais pessoas tinham arquivos de IDs impressas em papel e, quando conhecido o

    nome do indivduo, pegava-se sua ficha e comparavam-se as mincias e outras caractersticas

    da ID j destacadas nesta ficha com a ID fornecida, utilizando para isto lupa e materiais como

    rgua e lpis. Quando no se tinha o nome do indivduo a ser identificado com sua ficha

    correspondente, como por exemplo, um crime sem testemunha, este trabalho se tornava

    demorado e de pacincia, onde muitas vezes o indivduo no podia ser identificado entre

    tantas fichas (GUMZ, 2002, p. 4).

    Este processo de identificao tornou-se cada vez mais precrio com o passar do

    tempo, e desde ento os sistemas biomtricos de identificao de indivduos atravs das IDs

    vm ganhando espao no mercado de acesso continuamente. Entre os motivos geradores deste

    crescimento pode-se destacar que as IDs no so perdidas como cartes, nem divulgadas a

  • 16

    terceiros como senhas, e que os aparelhos de leitura de impresses digitais oferecem muito

    mais segurana que estes mtodos, uma vez que praticamente impossvel falsificar uma ID

    humana (APPOL, 2004).

    Neste trabalho pretende-se apresentar uma pesquisa referente s dificuldades que

    envolvem a criao de um sistema de identificao biomtrica, propondo uma soluo de

    identificao de indivduos atravs do(s) delta(s) e ncleo das IDs. Atravs da utilizao dos

    conceitos da Datiloscopia, dos conhecimentos dos sistemas biomtricos, das tcnicas de

    processamento de imagens digitais e das RNAs pretende-se criar um prottipo de

    identificao de indivduos.

    2.3 OBJETIVOS

    O objetivo deste trabalho desenvolver um sistema para identificao do(s) delta(s) e

    ncleo em IDs utilizando tcnicas de RNAs.

    Os objetivos especficos do trabalho so:

    a) realizar a identificao do(s) delta(s) e ncleo de IDs armazenadas em imagens

    Bitmaps;

    b) realizar a identificao do(s) delta(s) e ncleo de IDs de qualquer dedo das mos.

    c) realizar a comparao destas IDs identificadas com outras previamente

    armazenadas.

    2.4 ESTRUTURA DO TRABALHO

    Este trabalho est organizado como descrito a seguir:

    a) no capitulo 1, apresentada brevemente uma introduo ao assunto, bem como

    uma idia a que este trabalho se prope;

    b) no captulo 2 sero apresentadas todas as reas referentes a fundamentao terica

    deste trabalho, sendo elas: Datiloscopia, Identificao Biomtrica, Processamento

    de Imagens e Redes Neurais Artificiais. Neste captulo so apresentados conceitos,

    caractersticas, tcnicas, ferramentas e outros aspectos relevantes vinculados ao

    tema;

  • 17

    c) no captulo 3 ser apresentado todo o processo de desenvolvimento do prottipo

    bem como as estruturas, algoritmos, tcnicas, diagramas, fragmentos de cdigos,

    etc, utilizados durante esta etapa;

    b) e, por ltimo, no captulo 4, sero apresentadas concluses, anlise de resultados,

    bem como sugestes para trabalhos futuros.

  • 18

    0 FUNDAMENTAO TERICA

    Nas prximas sees sero apresentados conceitos, tcnicas e ferramentas mais

    relevantes ao desenvolvimento do trabalho, bem como o estado da arte sobre o tema e

    tambm trabalhos correlatos encontrados.

    0.0 IMPRESSES DIGITAIS

    Segundo APPES (2004) a Papiloscopia o mais seguro mtodo de identificao

    humana. A Papiloscopia divide-se em Datiloscopia, Quiroscopia e Poroscopia. A Datiloscopia

    a cincia que estuda os desenhos papilares formados na polpa digital (ponta dos dedos). A

    Quiroscopia cincia que estuda os desenhos formados pela palma das mos. E a Poroscopia

    a cincia que estuda os desenhos formados pela planta dos ps. Para o desenvolvimento

    deste trabalho ser considerado apenas o estudo da Datiloscopia.

    0.0.0 Datiloscopia

    Segundo Tavares Jnior (1991, p. 19-20) alguns autores consideram o incio do estudo

    da Datiloscopia no perodo pr-histrico, onde o Homem primitivo tinha o costume de marcar

    sua caverna com o desenho de suas mos sobre a argila, passando aps para pases do Oriente,

    onde os homens eram obrigados a opor os dedos polegares impregnados de tintas em papis

    para a emisso de documentos de divrcio. Mas foi entre os anos de 1664 e 1891 que a

    Datiloscopia teve seu estudo comprovado como cincia.

    Em 1664 o anatomista italiano J. Marcello Malpighi fez estudos sobre as papilas da

    pele encontradas na palma das mos e nas extremidades digitais. Seus estudos foram

    estendidos por vrios pesquisadores, onde os que mais se destacaram por seu trabalho foram

    William Hershel que em 1.858 provou o postulado da imutabilidade; Arthur Kollmam que em

    1.883 provou a formao dos desenhos digitais no sexto ms de vida fetal; Francis Galton que

    em 1.888 criou um sistema com trinta e oito tipos de IDs classificados em trs grupos: arcos,

    presilhas e verticilos; Henry de Varigny que em 1.891 publicou um artigo sobre o sistema de

    Galton que foi traduzido para vrias lnguas; e Juan Vucetich, argentino que leu este artigo, e

    que criou uma extenso do sistema de Galton e implantou pela primeira vez a identificao de

    suspeitos de crime pela ID por volta de 1.891 com o nome de Icnofalangometria (TAVARES

  • 19

    JNIOR, 1991, p. 20-22). O termo Icnofalangometria foi modificado para Datiloscopia em

    1894, por sugesto do Dr. Francisco Latzina (KEHDY, 1968, p. 37).

    A Datiloscopia a cincia que trata a identificao de pessoas atravs da comparao

    de suas IDs. O termo Datiloscopia deriva de dois elementos gregos daktylos = dedos e

    skopin = examinar. A Datiloscopia divide-se em civil, criminal e clnica. A Datiloscopia

    civil trata da identificao das pessoas para expedio de documentos de identidade, tais

    como cdula de identidade, passaporte, etc. A Datiloscopia criminal reveste-se de trs

    aspectos, a saber: indiciado em inqurito policial, expedio de documentos de idoneidade e

    aproveitamento das impresses papilares encontradas nos locais de crimes. J a Datiloscopia

    clnica estuda as perturbaes que se verificam nos desenhos digitais. Perturbaes estas

    resultantes de algumas doenas, ou exerccio de certas profisses (KEHDY, 1968, p. 25-27).

    Segundo Kehdy (1968, p. 27) e APPES (2004), so os seguintes os postulados1 da

    Datiloscopia:

    c) perenidade: a propriedade que tem o desenho digital de existir desde o sexto ms

    de vida fetal at a putrefao cadavrica, quando se d o descolamento da derme;

    c) imutabilidade: a propriedade que tem o desenho digital de no mudar, desde o

    sexto ms de vida fetal at a putrefao cadavrica;

    a) variabilidade: a propriedade que tem o desenho digital de variar de dedo para

    dedo e de pessoa para pessoa. Os gmeos, quando do mesmo ovo, apresentam

    desenhos papilares semelhantes, mas nunca absolutamente iguais. A variedade to

    grande que em milhes e milhes de IDs j estudadas e fichadas em todo o mundo

    jamais se encontrou duas iguais;

    b) classificabilidade: a propriedade que tem o desenho digital de poder ser

    classificado. Este por sua vez classificado em tipo e subtipo.

    0.0.0 Estudo da Pele

    Pele uma vasta membrana que recobre todo o corpo humano. Tavares Jnior (1991,

    p. 27) detalha que a pele constituda por duas camadas: a derme e a epiderme. A derme a

    parte principal e mais profunda da pele, e est localizada sob a epiderme. Na superfcie da

    1 Postulado uma proposio que aceita sem demonstrao.

  • 20

    pele ficam localizados pequenos relevos: as papilas. Estas existem nas superfcies palmares e

    plantares. J a epiderme uma fina membrana, transparente, que recobre a derme.

    Segundo Kehdy (1968, p. 31) existem duas espcies de glndulas de secreo

    presentes na pele e que interessam no estudo da Datiloscopia. So as glndulas sudorparas e

    sebceas. As glndulas sudorparas existem em maior quantidade e esto presentes nas palmas

    das mos, nas extremidades digitais e nas plantas dos ps. J as glndulas sebceas existem

    em maior quantidade na testa, no couro cabeludo, no nariz e nas orelhas, e produzem

    substncias gordurosas. Estas glndulas e a secreo das mesmas que permitem que sejam

    deixadas ID em locais de crimes, por exemplo.

    Tavares Jnior (1991, p. 30) afirma que as papilas so situadas na derme e se espalham

    por todo o corpo, por este motivo que pequenos cortes ou queimaduras leves no afetam os

    desenhos digitais. Define-se como desenho digital a combinao de cristas e sulcos papilares

    localizados na derme e espalhados pela epiderme, formando configuraes diversas em IDs. E

    IDs por sua vez so a reprodues do desenho digital em um suporte liso e limpo.

    APPOL (2004) afirma que, o datilograma produzido pelo entintamento da polpa

    digital ou por manchas de suor e gorduras sobre um suporte liso e polido, podendo ser

    tambm produzido por decalque em suporte mole que venha a endurecer. Em um datilograma,

    as linhas impressas representam cristas papilares (linhas pretas ou cinza escuro) e os espaos

    intercalados so os sulcos interpapilares (linhas brancas ou cinza claro).

    Tavares Jnior (1991, p. 30) cita que as IDs compem-se de: linhas pretas, linhas

    brancas, delta, ponto caractersticos, poros, linhas brancas albodactiloscpicas.

    b) linhas pretas: correspondem s cristas papilares;

    b) linhas brancas: correspondem aos sulcos interpapilares;

    b) delta: o ngulo ou tringulo formado pelas cristas papilares;

    b) pontos caractersticos: so os acidentes que se encontram nas cristas papilares.

    Servem para identificar as impresses por serem permanentes;

    b) poros: so aberturas dos canais que expelem os produtos das glndulas sudorparas

    e sebceas;

    b) linhas brancas albodactiloscpicas: so formadas pela interrupo de duas ou mais

    cristas papilares, so formadas pelo enrugamento da pele.

  • 21

    Segundo Kehdy (1968, p. 34) as IDs com ausncia de deltas, no possuem sistemas de

    linhas, as demais possuem trs sistemas de linhas, conforme mostrados na Figura 1, sendo

    definidos como:

    b) regio basilar: formada pelo conjunto de linhas existentes entre a prega

    interfalangeana e a terceira linha abaixo do ramo descendente e ascendente do

    delta.

    b) regio nuclear: formada pelo conjunto de linhas que circunscrevem o centro do

    datilograma, ou seguindo a diretriz superior at o ramo ascendente do delta.

    b) regio margial: formada pelo conjunto de linhas do pice e das laterais do

    datilograma at a linha imediata que acompanha a diretriz superior do delta.

    Figura 1 Regies dos sistemas de linhas.

    As IDs so normalmente extradas com papel, rolo e tinta, onde a superfcie do dedo

    molhada com o rolo entintado e imediatamente posta contra o papel. Assim so separados os

    indivduos em fichas que podem ser decadatilares ou monodatilares (dez ou uma ID por

    ficha). Estas fichas so ordenadas por tipo de ID, quantidade e tipo de mincias (KEHDY,

    1968, p. 14).

    0.0.0 Sistema Datiloscpico de Juan Vucetich

    Foi por iniciativa de Flix Pacheco, que o Presidente da Repblica Dr. Rodrigues

    Alves, em 05 de fevereiro de 1903, atravs do Decreto 4.764, introduziu a Datiloscopia como

    mtodo mais simples e mais perfeito para identificao de indivduos. Todo o processo de

    identificao seria subordinado classificao dactiloscpica, de acordo com o Sistema

  • 22

    Vucetich, considerando-se, para todos os efeitos, a ID como prova mais concludente e

    positiva da identidade do indivduo (APPES, 2004).

    Segundo Tavares Jnior (1991, p. 37-38) e Kehdy (1968, p. 37), no sistema

    datiloscpico de Vucetich as IDs so classificadas nos tipos: arco, presilha interna, presilha

    externa e verticilo. O arco apresenta como caractersticas a ausncia de delta, onde as linhas

    atravessam o campo da ID de um lado ao outro. A presilha interna tem um delta direita do

    observador e as linhas nucleares correm para a esquerda do observador. J a presilha externa

    tem um delta esquerda do observador e as linhas nucleares correm para a direita do

    observador. E o verticilo tem dois deltas, sendo um direita e outro esquerda do observador,

    onde as linhas nucleares ficam encerradas entre os dois deltas, assumindo configuraes

    variadas.

    Os tipos fundamentais de Vucetich so representados abreviadamente por nmeros e

    letras, a saber: Arco=A=1, presilha Interna=I=2, presilha Externa=E=3 e Verticilo=V=4. As

    letras so empregadas para os dedos polegares e os nmeros para os demais dedos. Alm dos

    smbolos acima, ainda so utilizados X quando h cicatriz e O para amputao, estes ltimos

    dois smbolos so empregados para qualquer um dos dedos (KEHDY, 1968, p. 38).

    Tavares Jnior (1991, p. 45) exibe a frmula datiloscpica como uma frao ordinria

    para se efetuar a classificao decadatilar, onde o numerador indica impresses da mo direita

    e o denominador da mo esquerda. Os smbolos da frmula so dispostos na ordem natural

    dos dedos: polegar, indicador, mdio, anelar e mnimo. Segundo Kehdy (1968, p. 40) existem

    410 combinaes, o que resulta em 1.048.576 diferentes frmulas datiloscpicas, que o

    resultado dos 4 tipos fundamentais elevados aos dez dedos. Na frmula 2-1 tem-se um

    exemplo de frmula datiloscpica, mo direita: arco, verticilo, presilha externa, presilha

    interna e arco; e na mo esquerda: verticilo, arco, arco, presilha interna, arco.

    1121

    4321

    V

    A (2-1)

    Kehdy (1968, p. 40) afirma que os quatro tipos fundamentais de Vucetich no

    aparecem com a mesma freqncia nos datilogramas. Atravs de estudos estabeleceu-se que

    5% das IDs encontradas so do tipo arco, 60% do tipo presilhas e 35% do tipo verticilos. Na

    Figura 2 so apresentados os quatro tipos fundamentais das IDs no sistema Vucetich.

  • 23

    Fonte: Adaptado de Gumz (2002, p. 12). Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich.

    Em (KEHDY, 1968, p. 44) ainda so detalhados os subtipos das IDs, estes por sua vez

    so agregados aos tipos principais, a saber:

    b) arco: plano, angular, bifurcado direita e bifurcado esquerda;

    b) presilha interna: normal, invadida, dupla e ganchosa;

    b) presilha externa: normal, invadida, dupla e ganchosa; e

    b) verticilo: espiral, ovoidal, sinuoso e ganchoso.

    Defrontam-se alguns casos onde o sistema de Vucetich apresenta tipos limites, quando

    uma impresso tem seu desenho encaixando-se em mais de um tipo. Os tipos limites so: arco

    e presilha interna, arco e presilha externa, arco e verticilo, presilha interna e verticilo e,

    presilha externa e verticilo (KEHDY, 1968, p. 36).

    0.0.0.0 Mincias

    Segundo Costa (2000, p. 15), as mincias so acidentes que se encontram nas cristas

    papilares e tm a finalidade de estabelecer a unicidade das IDs. Pode-se dizer que mincias

    so terminaes e bifurcaes dos sulcos papilares.

    Kehdy (1968, p. 61) e Tavares Jnior (1991, p. 32) afirmam que para se confirmar a

    identidade de uma ID, devero ser coincididos no mnimo doze mincias, as quais devem ser

    encontradas da mesma forma, localizao e mesma quantidade nas duas impresses em

  • 24

    comparao. Tambm no pode haver mincias que se encontram na impresso testemunha2 e

    no esto presentes na impresso suspeita3.

    0.0.0.0 Ncleo e Deltas

    O ncleo de uma ID representa o centro de gravidade da impresso. Em IDs do

    grupo verticilo, o ncleo est localizado na parte superior da volta mais interna da linha

    datilar. J em IDs dos grupos presilhas, o ncleo localiza-se no ombro da laada mais interna

    da impresso (ANTHEUS, 2002).

    O delta o ngulo ou tringulo formado pelas cristas papilares, pela brusca

    divergncia das linhas paralelas ou pela bifurcao de uma linha simples. Sua principal

    funo determinar o tipo da ID. Os deltas representam o ponto de divergncia das linhas

    datilares mais internas que envolvem ou tendem a envolver a regio nuclear de uma ID.

    Verticilos apresentam dois deltas, Presilhas Externas apresentam um delta esquerda do

    observador e as Presilhas Internas um delta direita do observador. O Arco normalmente no

    possui delta (APPOL, 2004). Na Figura 3, so mostrados ncleo e deltas.

    Figura 3 Em destaque ncleo e deltas de uma ID.

    2 Impresso testemunha a encontrada em local de crime. 3 Impresso suspeita a tomada dos dedos do suspeito ou encontrada no arquivo datiloscpico.

  • 25

    0.0 BIOMETRIA

    Segundo Bressan (2002, p. 3), todos os mtodos de identificao de indivduos so

    baseados em trs conceitos fundamentais: segurana baseada em algo que o indivduo possui,

    como uma chave de um cofre, segurana baseada em algo que o indivduo sabe, como uma

    senha, e segurana baseada em quem o individuo , como sua ID. A identificao atravs

    deste ltimo conceito chamada de identificao biomtrica, pois usa caractersticas

    estudadas pela biometria.

    Como j citado anteriormente, segundo o dicionrio, biometria o ramo da cincia

    que estuda a mensurao dos seres vivos, mas no mundo da segurana, biometria se refere

    aos mtodos automatizados para identificao de pessoas com base em suas caractersticas

    fsicas, fisiolgicas ou em seus aspectos comportamentais (AGUIAR, 2004).

    0.0.0 Sistemas de Identificao Biomtrica

    Segundo Pankanti (2000, p. 2), um sistema biomtrico um sistema de

    reconhecimento de padres capaz de estabelecer a identidade de um indivduo atravs de

    caractersticas fsicas ou comportamentais. Para que estas caractersticas possam ser utilizadas

    em um processo de identificao de usurio necessria a utilizao de tecnologias bastante

    avanadas. Bressan (2002, p. 3), enfatiza que qualquer caracterstica humana, seja ela fsica,

    fisiolgica ou comportamental, pode ser usada para identificao biomtrica, desde que

    satisfaam aos seguintes requisitos:

    b) universalidade: todas as pessoas devem possuir a caracterstica a ser medida;

    b) singularidade: indica que esta caracterstica no pode ser igual em pessoas

    diferentes;

    b) permanncia: significa que a caracterstica no deve variar com o tempo;

    b) desempenho: preciso da identificao, os recursos requeridos para conseguir uma

    preciso de identificao aceitvel e ao trabalho ou fatores ambientais que afetam a

    preciso de identificao;

    b) aceitabilidade: indica o quanto as pessoas esto dispostas a aceitar os sistemas

    biomtricos;

    b) proteo: facilidade ou dificuldade de enganar o sistema com tcnicas fraudulentas.

  • 26

    Segundo Hong (1998, p. 3), os sistemas biomtricos so divididos em duas partes: o

    mdulo de registro e o mdulo de identificao. No mdulo de registro as caractersticas so

    obtidas por um leitor biomtrico e processadas atravs de um mdulo extrator de

    caractersticas gerando um template que ser armazenado. J o mdulo de identificao deve

    fazer a captura das caractersticas biomtricas no momento do acesso, gerando tambm uma

    representao atravs do mdulo extrator, equivalente as armazenadas atravs dos templates.

    E finalmente, o resultado do mdulo de identificao alimentado ao mdulo comparador de

    caractersticas que o confronta contra os templates armazenados para estabelecer a identidade.

    A traduo de template modelo ou gabarito, mas como as palavras modelo e gabarito tm

    muitos significados em nosso idioma, a partir deste ponto ser utilizado o termo template para

    indicar as caractersticas biomtricas armazenadas pelo mdulo de registro. Na Figura 4,

    apresenta-se uma representao macro de um sistema de identificao biomtrica.

    Fonte: Adaptado de Gumz (2002, p. 15). Figura 4 Representao macro de um sistema de identificao biomtrica.

    Como exemplos de aplicaes biomtricas tm-se as forenses que incluem

    identificao criminal, segurana de prises e identificao de cadveres; as civis que

    agregam identificao nacional, carteira de motorista, sade, travessia de fronteiras; e as

    comerciais em que se destacam comrcio eletrnico e servios bancrios como caixa

    automtico, carto de crdito e controles de acesso (GUMZ, 2002, p. 16).

    0.0.0 Sistemas de Identificao Biomtrica atravs das Impresses Digitais

    Os sistemas de identificao biomtrica por IDs so associados a sigla AFIS, do ingls

    Automatic Fingerprint Identification System ou sistema de identificao automtica de IDs.

  • 27

    Segundo Bressan (2002, p. 8), os sistemas de identificao atravs de IDs, analisam

    basicamente a posio das mincias, mas os sistemas mais modernos, alm disto, esto

    verificando tambm outras caractersticas, tais como arcos, voltas, posio do(s) delta(s),

    ncleo, etc. Tudo isto para que estes sistemas tenham seus percentuais de acerto cada vez

    mais prximos de 100%.

    Os templates citados anteriormente no necessariamente gravam a imagem da ID

    coletada pelo leitor biomtrico, na maioria das vezes usam-se caractersticas especficas dos

    desenhos das impresses, como o nmero de linhas, redemoinhos, etc., de modo que o

    processo de comparao seja feito de uma forma mais rpida e precisa (BRESSAN, 2002, p.

    3).

    Segundo Bressan (2002, p. 8), existem vrios tipos de sensores para identificao de

    ID. Alguns trabalham com calor, outros com presso, etc., mas os mais comuns usam um

    pequeno CCD (que o componente bsico de um scanner) para obter imagens digitais da

    impresso. Estes tipos de sensores tambm so mais confiveis que os de temperatura e

    presso, pois no dependem das condies ambientais durante a utilizao do sensor.

    Mais detalhadamente podem-se citar os trs tipos de leitores de IDs:

    b) pticos: o dedo colocado sobre uma plataforma de vidro e uma imagem do dedo

    capturada. Estes dispositivos tornaram-se pequenos e baratos;

    b) ultra-som: o dedo colocado sobre uma plataforma de vidro e uma varredura de

    ultra-som efetuada;

    b) baseados em chip: o usurio coloca seu dedo direto em um chip de silcio.

    Hong (1998, p. 15) e Bressan (2002, p. 9) destacam que um problema ligado ao AFIS

    encontra-se na sua aceitabilidade pelo usurio civil, porque IDs tm sido associadas a

    investigaes criminais e trabalho policial, fazendo com que estes usurios se sintam

    desconfortveis, e tambm que a tecnologia requer uma grande quantidade de recursos

    computacionais alm de que uma pequena parte da populao no possibilite a identificao

    pelas IDs devido a razes genticas, de idade, de ambiente ou ocupacionais como as

    estudadas pela datiloscopia clnica.

  • 28

    0.0 PROCESSAMENTO DE IMAGENS

    O sentido da viso pode ser considerado o meio mais eficiente que os seres humanos

    dispem para captar informaes do ambiente que os cerca. Prova disso a necessidade

    crescente de automatizar algumas atividades de nosso cotidiano e que pode ser considerada

    umas das responsveis pelo grande crescimento das ferramentas de processamento de

    imagens. Estas ferramentas podem realizar tarefas que variam desde um simples

    aprimoramento de uma imagem at a compreenso de mecanismos complexos (FACON,

    1993, p. 6).

    A rea de Processamento Digital de Imagens teve incio em meados da dcada de 60,

    com a motivao criada pelos programas espaciais da NASA nos EUA. O aumento da

    capacidade de memria e velocidade dos computadores contribuiu para dar impulso nova

    tecnologia, que passou a ser aplicada em outras reas como: medicina, microscopia, tica

    eletrnica, transmisso digital de sinais de TV ou fac-smile e em sensores visuais de robs.

    Em 1975, a inveno do tomgrafo computadorizado por G. N. Hounsfield, abriu amplas

    perspectivas de utilizao das tcnicas digitais de imagens radiogrficas (OSRIO, 1991, p.

    24).

    0.0.0 Imagem Digital

    Imagens digitais podem ser definidas como sendo representaes digitais de imagens

    capturadas do mundo real, atravs de sensores. Segundo Gonzalez e Woods (1992, p. 7), para

    esta captura, so necessrios dois elementos. O primeiro um dispositivo fsico que seja

    sensvel a uma banda de espectro de energia eletromagntica, tais como raios-X, ultravioleta,

    banda visvel ou banda infravermelha, e que produza um sinal eltrico de sada proporcional a

    um nvel de energia percebida. O segundo chamado de digitalizador, que um dispositivo

    que converta a sada eltrica para forma digital.

    Segundo Gonzalez e Woods (1992, p. 5), uma imagem digital pode ser considerada

    como sendo uma matriz cujos ndices de linhas e colunas identificam um ponto da imagem, e

    o correspondente valor do elemento da matriz identifica o nvel de cor naquele ponto. Cada

    elemento dessa matriz chamado de elemento da imagem ou elemento da figura, originrios

    do ingls pixel ou pels que so abreviaes de picture elements.

  • 29

    A qualidade das imagens capturadas e exibidas definida pelo dpi, do ingls dots per

    inch ou pontos por polegada. O dpi trata da medio da quantidade de pontos em uma imagem

    digital por polegada, ou seja, quanto mais pixels a imagem apresentar por polegada, melhor

    ser sua qualidade e definio (GUMZ, 2002, p. 20).

    A dimenso de uma imagem digital, poder ser unidimensional (1D = varivel),

    bidimensional (2D = ponto), tridimensional (3D = ponto no espao), quadrimensional

    (4D=ponto no espao tempo) ou at N-dimensional. As dimenses superiores a 2D so mais

    utilizadas para visualizao cientfica (GUMZ, 2002, p. 21).

    0.0.0.0 Definio de Cores

    Quanto a colorao, as imagens podem ser classificadas em dois grupos:

    monocromticas e coloridas. As monocromticas so imagens binrias, e apresentam somente

    duas cores, preto ou branco. As imagens coloridas podem ser representadas atravs de vrios

    modelos, a saber: RGB (Red Green Blue), CMY (Cyan Magenta Yellow), HSI, RYB, YIQ,

    etc (BROWN; SHEPHERD, 1995, p. 106).

    O sistema mais usado em monitores de vdeo coloridos o RGB. No modelo RGB

    cada cor aparece nos seus componentes espectrais primrios de vermelho verde e azul.

    Imagens no modelo RGB consistem em trs planos de imagens independentes, um para cada

    cor primria (GONZALEZ; WOODS, 1992, p. 160).

    O ser humano possui em seu sistema visual trs tipos de sensores capazes de

    identificar trs faixas diferentes de espectros de energia. Estas faixas correspondem as

    tonalidades de Vermelho (Red), Verde (Green) e Azul (Blue). Logo o ser humano v na

    realidade a combinao resultante da mistura destas trs cores bsicas. Atravs de testes

    realizados com o ser humano chegou-se a concluso que a utilizao de 256 variaes

    diferentes de intensidade em cada uma das cores bsicas capaz de gerar um nmero de cores

    superior a capacidade visual do ser humano, ou seja, fica praticamente impossvel distinguir

    entre duas cores vizinhas (CASACURTA et al, 1998, p. 9-10).

    Segundo Casacurta et. al. (1998, p. 10), no sistema RGB, o valor (0, 0, 0) equivale a

    cor preta com intensidade zero nas trs componentes. O valor (255, 255, 255) equivale a cor

    branca onde as trs componentes esto presentes com a sua intensidade mxima. As diferentes

  • 30

    combinaes entre RGB sero capazes de gerar qualquer tipo de cor, sendo que se as trs

    componentes tiverem sempre valores iguais ser definida uma escala de tons de cinza do preto

    ao branco, a chamada gray scale.

    0.0.0.0 Formato de Imagens

    Existem diferentes formatos de arquivos para o armazenamento de imagens, uma vez

    que se tm vrias classes diferentes de representaes de imagens. O armazenamento da

    imagem envolve basicamente trs elementos principais: a forma como a imagem est

    representada, o tipo de compactao empregado e o cabealho contendo as informaes a

    cerca desta imagem (resoluo, nmero de cores, classe da imagem, palette, compactao,

    etc). Um mesmo tipo de arquivo pode inclusive permitir o armazenamento de diferentes

    classes de imagens e tambm permitir a utilizao de vrios mtodos de compactao

    (CASACURTA et al, 1998, p. 14).

    Segundo Facon (1993, p. 28), quanto maior o nmero de aplicaes em que uma

    imagem digital pode ser tratada, diz-se que maior a sua padronizao. Normalmente

    programas grficos podem ser classificados pela forma com a qual armazenam e apresentam

    as imagens. Para esta abordagem h duas categorias: formato de varredura e formato vetorial.

    Entre os formatos de imagens digitais mais utilizados esto: BMP, JPG, GIF, TIFF, PCX,

    CGM, ICO, RLE, TARGA, PostScript, entre outros (BROWN; SHEPHERD, 1998, p. 73).

    0.0.0 Tcnicas de Processamento de Imagens

    Segundo Gonzalez e Woods (1992, p. 11), o processamento de imagens digitais

    geralmente expresso de forma algortmica e implementado em software, que uma vez

    aplicados a uma imagem geram um aprimoramento ou correo da mesma, no que diz

    respeito a eliminao de rudos, realce de imagem, restaurao de regies da imagem, etc.

    Este processo normalmente direcionado para uma soluo, deste modo tcnicas que

    funcionam em um problema, podem se mostrar totalmente inadequadas para outro problema.

    Entre tcnicas de processamento de imagens podem ser citadas algumas tcnicas como

    a de restaurao que busca compensar distores especficas, normalmente geradas no

    momento de aquisio. Quando se pode identificar experimentalmente a funo que

    representa a deformao ou construir um modelo matemtico adequado, possvel buscar a

  • 31

    funo inversa e aplic-la sobre a imagem deformada. Em aplicaes como: correo de foco,

    Imagens borradas por movimento. J a Segmentao procura isolar regies de pixels, e aplicar

    operaes para extrao de atributos. A operao de segmentao mais comum a

    limiarizao por um tom de corte. Tudo que est acima deste tom vira branco, tudo que est

    abaixo vira preto, obtendo-se uma imagem binria (SCURI, 1999, p. 55).

    Gumz (2002, p. 22), detalha alguns filtros conhecidos, sendo eles, filtro de mdia

    (mean filter), filtro da mediana (median filter), filtro mnimo-mximo, suavizao controlada

    por gradiente, suavizao gaussiana (gaussian smoothing), suavizao conservativa

    (conservative smoothing), remoo de manchas Crimmins (Crimmins speckle removal), filtros

    de freqncia passa-baixa (low-pass) e passa-alta (high-pass), laplacian of gaussian filter e

    unsharp filter.

    0.0 REDES NEURAIS

    Silva (1999, p. 16) comenta que o crebro humano o dispositivo mais complexo

    conhecido pelo Homem, e que a capacidade de pensar, memorizar e resolver problemas tem

    conduzido muitos cientistas a tentar modelar sua operao. Diversos pesquisadores tm

    buscado criar modelos computacionais que representam a funcionalidade do crebro. Um

    destes modelos resultou na criao das Redes Neurais Artificiais (RNA).

    0.0.0 Sistema Nervoso e Neurnio Biolgico

    O crebro uma das partes do sistema nervoso que prov uma grande quantidade de

    controle sobre as funes do corpo. Nele existem dois tipos de clulas: as glias, responsveis

    pelo suporte e nutrio e os neurnios que so as clulas especializadas na atividade nervosa

    (LOESCH, 1996, p. 8). Tafner, Xerez e Rodrigues Filho (1996, p. 32) afirmam que o crebro

    possui cerca de 10 bilhes de neurnios, e que cada neurnio capaz de ter at 10.000

    conexes com outros neurnios ou at mesmo com partes do prprio neurnio.

  • 32

    O neurnio biolgico possui um corpo e diversas ramificaes, que so chamadas de

    dendritos, que por sua vez conduzem sinais de entrada do neurnio para o corpo da clula. A

    partir do corpo da clula surge um filamento comprido denominado axnio, na extremidade

    deste filamento existem micro-ramificaes, denominados terminais dos neurnios, que tm

    por objetivo transmitir um sinal do corpo para outra extremidade do neurnio. Os terminais

    dos neurnios so conectados aos dendrites de outros neurnios, cuja conexo d-se o nome

    de sinapse (LOESCH, 1996, p. 8). Na Figura 5, feita uma representao de um neurnio

    biolgico.

    Fonte: Osrio e Bittencourt (2000, p. 8). Figura 5 Representao de um neurnio biolgico.

    Segundo Loesch (1996, p. 9) e Silva (1999, p. 17), os estmulos entram nos neurnios

    atravs das sinapses de outros neurnios, conectadas aos dendrites deste primeiro, e quando

    chegam ao corpo da clula, ocorre um processo de integrao (soma), deste estmulos. Ao

    resultado desta soma pode ser gerado um impulso eltrico que comea no axnio e se propaga

    para todas as sinapses. O processo de controle da produo destes impulsos eltricos se d

    normalmente atravs de uma funo de limiar que produz uma sada, caso esta soma supere

    este limiar.

  • 33

    0.0.0 Redes Neurais Artificiais

    Segundo Loesch (1996, p. 15), a histria das redes neurais artificiais recente, com

    pouco mais de meio sculo de estudos. Estes iniciaram por volta de 1940, quando as primeiras

    simulaes foram feitas com papel e lpis por Donald Hebb e Karl Laschey. Seguidos por

    McCulloch e Pitts que propuseram uma modelagem matemtica para os neurnios biolgicos

    atravs dos fatos que: neurnios comportam-se como somadores algbricos; adicionam

    entradas excitatrias ou subtraem entradas inibitrias; neurnios possuem uma propriedade de

    limiar, entre outras.

    Loesch (1996, p. 5) define as RNAs como sendo sistemas computacionais de

    implementao em software ou hardware, que imitam as habilidades dos neurnios

    biolgicos, usando para isto um grande nmero de neurnios artificiais interconectados. Os

    benefcios obtidos pela utilizao de uma RNA se do graas a sua massiva estrutura

    distribuda e paralela, e sua habilidade de aprender e generalizar sadas de entradas que no

    estavam amostradas durante o seu treinamento. Estes benefcios permitem que ela resolva

    problemas complexos (HAYKIN, 2001, p. 4).

    Existem vrios tipos de RNA, onde os mais conhecidos so ADALINE/MADALINE,

    Backpropagation Perceptron (ou feedforward), Time-Delay, Recurrent, BAM (Memria

    Associativa Bidirecional), Hofield e Kohonen (LOESCH, 1996, p. 46). As RNA podem ser

    algumas vezes superiores a outros mtodos porque os dados sobre os quais se efetuam

    concluses so confusos, caticos e inconsistentes (MASTERS, 1993, p. 6-7).

    Uma RNA pode ser auto-associativa ou hetero-associativa. O mapeamento de entrada,

    ou auto-associao, permite a uma RNA ser treinada para correlacionar um padro com ele

    mesmo. E o mapeamento de sada, ou hetero-associao, associa um padro treinado com

    outro. Elas podem tambm aproximar funes j que a partir de uma entrada produzem uma

    sada o que os qualifica como uma funo (MASTERS, 1993, p. 24, 68).

    Gumz (2002, p. 24) comenta que, para que as RNAs possam resolver os problemas

    para o qual foram projetadas, as mesmas devem ser treinadas. Toda o desempenho da RNA

    est ligado ao processo de treino que deve adaptar seus pesos e sinais de sada de acordo com

    os objetivos finais. O processo de treino envolve ajustar os pesos das conexes entre os

  • 34

    neurnios (ajuste sinptico) e configurar os valores de sada para cada caso verificando a

    quantidade de erro apontado por um clculo sobre o valor de sada do neurnio.

    0.0.0.0 Neurnio Artificial

    Em Tafner, Xerez e Rodrigues Filho (1996, p. 56), encontram-se outros nomes para os

    neurnios artificiais, como Elemento de Processamento ou Nodo. Segundo o autor todo

    neurnio artificial tem um funcionamento muito parecido com o neurnio biolgico, uma vez

    que todo neurnio artificial possui um ou mais sinais de entrada, e apenas um sinal de sada.

    Estas entradas dos neurnios artificiais podem ser comparadas aos estmulos recebidos pelo

    neurnio biolgico.

    Um importante atributo dos neurnios artificiais so os pesos associados ao mesmo. Os

    pesos (weight) so valores que representam o grau de importncia que uma determinada

    entrada possui em relao ao neurnio. Sempre que as entradas so apresentadas ao neurnio,

    elas so multiplicadas pelos valores dos pesos, os resultados destas multiplicaes so

    somados e apresentados a uma funo de ativao (TAFNER; XEREZ; RODRIGUES

    FILHO, 1996, p. 56-58). O neurnio ativado se, e somente se, o resultado da funo de

    ativao alcanar um valor estipulado, chamado de limiar. Pode existir tambm um valor de

    entrada adicional, o vis ou bias, que determinado no treinamento, com o objetivo principal

    de modificar o valor de limiar da funo de ativao (LOESCH, 1996, p. 20).

    Resumindo, um neurnio formado por um conjunto de sinapses que contm os pesos,

    um somador para calcular os sinais de entrada multiplicados aos pesos (soma ponderada), e

    uma funo de ativao para limitar a amplitude do sinal de sada para um valor numrico

    finito (HAYKIN, 2001, p. 36). A Figura 6 ilustra um neurnio artificial, onde os sinais de

    entrada x1..xj podem ser sadas de outros neurnios; as variveis wj1..wjp armazenam os valores

    dos pesos sinpticos diretamente responsveis pela sada esperada do neurnio aps somatrio

    ponderado; o valor wj0 o vis que ser somado a redej; redej o resultado da soma

    ponderada da entrada; a funo de ativao f(redej) a responsvel pela ativao com a

    resposta da RNA sobre dada entrada se alcanado o valor de limiar l j o qual impe os valores

    limites mximos e mnimos que resultar numa sada yj.

  • 35

    Fonte: Adaptado de Haykin (2001, p. 36). Figura 6 Representao do funcionamento de um neurnio artificial.

    Segundo Masters (1993, p. 79-82), a sada do neurnio calculada como:

    redej= (wj0 +=

    n

    i 1

    xi*w ji) (2-2)

    aplicada em

    sada=f(redej) (2-3)

    Onde os pesos wji so primariamente responsveis pelas caractersticas operacionais da

    rede, pela j conhecida soma ponderada com as entradas xi. A funo de ativao f(redej)

    calcula o valor da sada do somatrio ponderado de entradas da redej e, wj0 o valor do vis.

    Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 63), os neurnios artificiais sempre

    so dispostos em camadas, toda rede neural apresenta uma camada de entrada e uma camada

    de sada. Algumas RNA podem apresentar camadas intermedirias ou ocultas como so

    chamadas, estas sempre se situam entre a camada de entrada e a camada de sada e no tm

    contato com o mundo externo. As camadas de entradas apenas recebem os valores de entradas

    e repassam para as camadas seguintes, as camadas seguintes sendo ocultas ou de sada que

    realizam o processamento da rede.

    As ligaes entre os neurnios das RNA podem ter diferentes fluxos, sendo feedback

    (realimentao), quando o sinal de sada de um neurnio servir de entrada para um outro, ou

  • 36

    para o mesmo neurnio, ou feedforward quando o fluxo seguir apenas em uma direo. Na

    Figura 7, apresenta-se os dois tipos de fluxo.

    Fonte: Gumz (2002, p. 27). Figura 7 Representao dos Fluxos das RNA.

    0.0.0.0 Rede Neural Artificial Feedforward Multicamada

    Loesch (1996, p. 67) afirma que as RNA feedforward multicamadas (RNA-FM), ou

    MLP (Multi Layer Perceptron - Perceptrons de mltiplas camadas) como tambm so

    chamadas, so as mais utilizadas e difundidas dentre as RNAs. As MLP so uma extenso dos

    primeiros Perceptrons, tambm so hetero-associativas e podem possuir uma ou mais

    camadas ocultas, porm possuem capacidades muito mais potentes e genricas que seu

    primeiro modelo. Segundo Welstead (1994, p. 59) estas so as RNAs mais utilizadas, onde

    estimativas apontam para 90% de todas as aplicaes de RNA implementadas.

    Numa RNA feedforward todos os neurnios de uma determinada camada so

    plenamente conectados aos neurnios da camada seguinte. Na Figura 7, no lado esquerdo

    tem-se uma RNA-FM, com uma camada de entrada, uma camada oculta e uma camada de

    sada. As RNA-FM podem apresentar mais de uma camada oculta, mas conhecido que uma

    camada suficiente para resolver problemas determinsticos (MASTERS, 1993, p. 79). A

    camada oculta alm de no ter contato com o mundo externo tem a funo de mediar a

    entrada externa e a sada da rede (HAYKIN, 2001, p. 19).

    Haykin (2001, p. 183) enfatiza que este modelo de RNA tm sido aplicado com

    sucesso para resolver problemas difceis atravs do seu treinamento supervisionado com um

  • 37

    algoritmo muito conhecido como algoritmo de retropropagao de erro (backpropagation).

    Normalmente uma RNA-FM consegue aprender uma funo ensinada. Se esta apresentar

    problemas, no devido ao modelo em si, mas por um treinamento insuficiente, nmero

    pequeno de neurnios na camada oculta ou tentativa de aprender uma funo que no

    determinstica (MASTERS, 1993, p. 87).

    Segundo Loesch (1996, p. 77), apesar de muitas aplicaes bem sucedidas,

    inconvenientes podem ocorrer durante o processo de treinamento, onde problemas complexos

    podem requerer dias e at semanas para que a RNA aprenda. Mesmo com todo este tempo de

    treinamento um RNA pode no aprender todos os pares de treinamento que lhes foram

    apresentados.

    0.0.0.0 Funes de Ativao

    A funo de ativao de um neurnio uma funo no-linear que quando aplicada as

    entradas de um neurnio determina a sada do mesmo. As faixas de valores de algumas

    funes so limitadas de 0 a 1 enquanto outras de 1 a +1. As funes de ativao mais

    usadas so a funo sigmide binria, a funo sigmide bipolar, a funo tangente

    hiperblica e a funo arco-tangente escalar (GUMZ, 2002, p. 39).

    A maioria dos modelos de RNA-FM usam a funo de ativao logstica sigmide

    binria (formato de S), que representada na Figura 8. Ela pode ser definida como uma

    funo real cujo domnio so os nmeros reais, a derivada sempre positiva e a faixa de

    valores limitada (MASTERS, 1993, p. 81). A funo de ativao logstica sigmide d-se

    por:

    f(x)=1/(1 + e-x) (2-4)

    cuja derivada

    f(x) = f(x)*(1- f(x)) (2-5)

  • 38

    onde o valor mximo usado + 1,0 e o valor mnimo 0,0. Lembrando sempre que as

    funes sigmides nunca alcanam seus tericos mnimo e mximo, geralmente os neurnios

    so considerados totalmente ativados por volta de 0,9 e desativados por volta de 0,1. Onde se

    pode dar como entrada numa rede os valores extremos de 1,0 e 0,0; mas nunca tentar treinar a

    rede para alcan-los. Em muitos casos tm-se verificado que a forma exata da funo tem

    pouco efeito no poder final da rede, embora possa ter impacto significante na velocidade de

    treino (MASTERS, 1993, p. 81).

    Fonte: Masters (1993, p. 81).

    Figura 8 Funo logstica de ativao sigmide binria.

    0.0.0.0 Treinamento e Aprendizado

    Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 65), o treinamento das RNAs

    acontece basicamente de duas formas, sendo por aprendizado supervisionado e aprendizado

    no-supervisionado. No aprendizado supervisionado so apresentados a RNA pares de entrada

    e sada, ou seja, um conjunto de entradas e um conjunto de sadas desejadas para cada entrada.

    J no aprendizado no-supervisionado no existem sadas desejadas, para o treinamento da

    rede so usados apenas os valores de entradas, e atravs destes valores que a rede se

    organiza de modo a classificar as entradas.

    A maioria das aplicaes das RNAs so treinadas atravs do aprendizado

    supervisionado, onde o objetivo principal de treinar uma rede ajustar seus pesos de tal forma

    que para um vetor de entrada produza-se um vetor desejado de sada, onde para cada entrada

    amostrada, emparelha-se uma sada (LOESCH, 1996, p. 71).

  • 39

    0.0.0.0.0 Aprendizado por Retropropagao (backpropagation)

    O mtodo de treino por retropropagao, ou backpropagation, foi o primeiro mtodo

    de treino para a RNA-FM. Este mtodo consiste basicamente de duas etapas executadas

    atravs das camadas da rede: um passo para frente a propagao e um passo para trs, a

    retropropagao. Na sua forma bsica, a retropropagao chamada por analistas numricos

    de algoritmo de inclinao de gradiente, que determina a direo de um passo de clculo.

    Na propagao um vetor de entrada aplicado aos pesos da rede e seu efeito

    propagado para frente camada por camada at a camada de sada, produzindo um conjunto de

    valores de sadas como resposta da rede. Aps verificado se a resposta desejada da rede era

    igual a esperada de acordo com o vetor de sada, caso no seja calculado um erro e este

    retropropagado para correo de todos os pesos da rede (HAYKIN, 2001, p. 184). Este ajuste

    dos pesos executado de acordo com uma taxa de aprendizado, em que se for muito pequena

    ir convergir muito devagar e se for muito grande, ir saltar e nunca ir convergir

    (MASTERS, 1993, p. 100).

    Primeiramente o treino comea com todos os pesos da RNA iniciados com pequenos

    valores no-zero, freqentemente gerados randomicamente ou por algoritmos especficos

    como o fortalecimento simulado (simulated annealing). Ento pares de treinamento da

    coleo de amostras so apresentados a rede, um de cada vez (MASTERS, 1993, p.111). Uma

    medida do erro feita pela rede, atravs da comparao de seus valores de sadas, aps

    calculado um valor que ir auxiliar na correo dos pesos da rede, designado como delta4, e

    por ltimo os pesos da rede so atualizados de um modo a reduzir o erro. Todo este processo

    de apresentar as entradas RNA, calcular as ativaes das camadas, calcular os valores dos

    deltas e o erro, chamado de epoch. As medidas de erro mais conhecidas so: erro quadrado

    mdio (mean square error), erro absoluto mdio (mean absolut error), erro de Kalman-

    Kwasny, entropia cruzada (cross entropy), erro mximo quadrado (maximum squared error),

    mean log error, alm de outros (MASTERS, 1993, p. 40-49).

    A medida mais comum do erro dada pelo erro quadrado mdio ou EQM, nas

    ativaes de sada. A correta ativao alvo do neurnio de sada j designada como dj, e a

    4 importate salientar que quando houver referncia ao termo delta, o mesmo pode significar um ponto caractersitico da ID, ou o valor utilizado no algoritmo de aprendizado da rede. Para tanto deve-se analisar o contexto em que o termo encontra-se.

  • 40

    ativao observada yj. Se existirem n neurnios de sada, o erro para a simples apresentao

    = =

    n

    j 1

    (dj - yj)2 (2-6)

    A frmula para calcular o delta dos neurnios difere entre a camada de sada e as

    camadas ocultas. Para simplificar o clculo pode-se dividir as frmulas sendo o clculo do

    erro da frmula 2-7 para a camada de sada e 2-8 para as camadas ocultas.

    j(k) = dj - yj (2-7)

    j(k) =+

    =

    1

    1

    Nk

    i

    (i(k+1)* wij (k+1)) (2-8)

    Aplicando as frmulas 2-7 e 2-8 na frmula 2-9 tem-se o clculo do valor do delta na

    camada k.

    j(k) = j(k) * f(redej) (2-9)

    Onde k o nmero da camada atual; j(k) o valor do delta calculado na camada k; wij

    o peso que conecta o neurnio j desta camada oculta com o neurnio i da camada anterior.

    importante lembrar que na frmula 2-8 o i(k+1) refere-se ao valor do delta calculado na

    camada seguinte e que utilizado para o clculo do delta da camada atual.

    Aps realizar todo este clculo realizado o ajuste de todos os pesos da RNA,

    conforme a frmula 4-5.

    wj(k) = wj

    (k) + 2j(k)*xj(k) (2-10)

    Onde wj(k) o peso a ser ajustado do neurnio j na camada k; o valor da taxa de

    aprendizado; j(k) o valor do delta calculado na camada k; e o xj(k) o valor de entrada do

    neurnio j na camada k (LOESCH, 1996, p. XX).

  • 41

    2.4.2.5 Escolha da Estrutura das Redes

    Normalmente a quantidade de neurnios existentes tanto na camada de entrada como

    na camada de sada determinado pelo tipo de problema a ser resolvido, j a quantidade de

    neurnios na camada oculta podem variar consideravelmente. O neurnio na camada oculta

    ser associado ao acrnimo NO de agora em diante.

    Uma soluo inicial para a quantidade de NOs de uma RNA dada na frmula (2-11).

    O = nm* (2-11)

    Onde m a quantidade de neurnios de sada e n a de entrada e O a quantidade de

    NOs.

    Aps ser treinada e testada, a RNA pode no apresentar resultados satisfatrios, isto

    pode ocorrer devido a existncia de muitos NOs ocasionando o superajustamento.

    Recomenda-se iniciar o treino com poucos neurnios artificiais nesta camada (GUMZ, 2002,

    p. 44).

    2.5 CONTEXTO ATUAL DO TRABALHO

    Analisando-se os trabalhos de Costa (2000), Hong (1998), Gumz (2002) entre outros

    verificou-se que, muitos sistemas biomtricos que utilizam o reconhecimento atravs das IDs

    usam como base um fator importantssimo que so as comparaes das mincias. Mas poucos

    trabalhos, pelo que se tem conhecimento, utilizam outras tcnicas, como por exemplo a

    comparao entre as distncia do(s) delta(s) e do ncleo.

    2.5.1 Trabalhos Correlatos

    Os trabalhos correlatos encontrados foram os trabalhos de:

    a) Hong (1998). Este o trabalho mais completo, onde apresentou-se um estudo

    detalhado sobre os passos da construo de um AFIS: aquisio de ID, pr-

    processamento, mapa de direes, classificao e extrao de mincias.

    b) Silva (1999). Foi desenvolvido um prottipo para classificao de ID nos tipos

    fundamentais: arco, presilha interna, presilha externa e verticilo. Para tanto o autor

  • 42

    tambm utilizou a construo de mapa de direes. No prottipo foi utilizada uma

    RNA perceptron feedforward treinada por retropropagao.

    b) Costa (2000). Foram apresentadas frmulas para pr-processamento de IIDs,

    conceitos e algumas tcnicas para classificao e extrao de mincias. Efetuou-se

    apenas concluses sobre o mapa de direes das cristas papilares.

    b) Pankanti (2000). Comentou vrios mtodos de identificao biomtrica existentes,

    dando destaque especial ao AFIS, realizando a comparao entre os mesmos.

    b) Gumz (2002). Foi desenvolvido um prottipo para identificao e classificao das

    mincias de uma ID. O trabalho bem detalhado e mostra passo a passo o estudo

    realizado.

    b) Reis (2003). Neste trabalho apresentada uma soluo para deteco das mincias

    e um clculo para o encontro do ncleo de uma ID.

    Todos os trabalhos relatam com bastante coerncia o estudo/desenvolvimento de seus

    trabalhos. Em especial nos trabalho de concluso de curso de Alex Sandro da Silva e Rafael

    Arajo Gumz foram sugeridos como extenso a identificao automtica do(s) delta(s) e

    ncleo das ID.

  • 43

    0 DESENVOLVIMENTO DO PROTTIPO

    Nas prximas sees sero apresentados os requisitos do prottipo, uma viso geral da

    soluo proposta bem como o desenvolvimento do prottipo.

    0.0 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO

    O prottipo do sistema deve atender aos seguintes requisitos:

    c) criar, treinar,validar e executar a RNA5;

    c) possibilitar o treinamento manual ou automtico da RNA atravs de fragmentos de

    imagens;

    c) possibilitar salvar os pesos da RNA aps o seu treinamento;

    c) possibilitar carregar os pesos da RNA para a continuao de um treinamento;

    c) possibilitar a validao manual ou automtica da RNA atravs de fragmentos de

    imagens;

    c) possibilitar o cadastramento de usurios juntamente com sua IID;

    c) possibilitar carregar uma IID para comparao com as demais IIDs j cadastradas;

    0.0 VISO GERAL

    Antes da seo de especificao, se faz necessria uma abordagem prvia de como ser

    o funcionamento geral do prottipo para que o leitor possa conhecer alguns conceitos

    necessrios para as prximas sees.

    Inicialmente o prottipo deve permitir que o especialista treine a RNA passando como

    entrada para a rede um vetor que ser gerado com base nos fragmentos de imagens de

    tamanho 20x20 pixels. Estas imagens sero de regies dos deltas, regies do ncleo e

    regies quaisquer, conforme apresentado na Figura 9. Este treinamento como j citado na

    seo 3.1, poder ocorrer de forma automtica ou manual. Uma vez que a RNA esteja

    treinada sero gravados os pesos da mesma e a partir de ento o usurio do prottipo poder

    iniciar o cadastramento de usurios bem como executar a opo comparao das IDs.

    5 O termo RNA ser utilizado a partir de agora para representar a RNA-FM, pois esta ser a nica rede implementada no prottipo.

  • 44

    Figura 9 Exemplo de regies da IID passadas como entrada para a RNA.

    Ao realizar o cadastramento de um novo usurio com sua respectiva IID, o sistema ir

    armazenar algumas informaes importantes derivadas da IID, para a extrao destas

    caractersticas foi utilizada uma heurstica que de agora em diante iremos chamar de

    heurstica do clculo da distncia. Atravs desta heurstica que o prottipo ir identificar

    se uma IID igual a outra ou no. Para que se possa explicar o funcionamento desta heurstica

    fazem-se necessrias algumas definies. Uma definio inicial apresentada na Figura 10,

    onde dividiu-se uma IID em 5 regies, chamados de agora em diante de quadrantes.

    Figura 10 Definio da diviso de quadrantes numa IID.

    A idia inicial da heurstica do clculo da distncia de varrer os quadrantes 3, 4

    para obter as posies dos deltas bem como o quadrante 5 para obter a posio do ncleo.

    Esta varredura consistir em passar fragmentos de imagens 20x20 para validao da RNA de

    todo o espao dos quadrantes incrementando-se as linhas e colunas dos mesmos. Quando for

    encontrado o delta no quadrante 3 e 4, ou um ncleo no quadrante 5 deve-se guardar a posio

  • 45

    e interromper a varredura no quadrante atual. importante lembrar que uma vez que a RNA

    esteja bem treinada a mesma ir encontrar obrigatoriamente um ou nenhum delta nos

    quadrantes 3 e 4, e um ncleo no quadrante 5. Caso isto no ocorra pode-se constatar que a

    IID est com pouca nitidez, ou que a RNA ainda se encontra com um desempenho

    insatisfatrio.

    Uma vez com as posies encontradas do(s) delta(s) e ncleo atravs das coordenadas

    iniciais do fragmento 20x20, ir se utilizar das coordenadas (x,y) das regies para se calcular

    a distncia entre delta(s) e ncleo, ou at entre os prprios deltas. No caso da ID ser uma

    presilha externa ou presilha interna apenas ser traada uma distncia como pode ser

    visualizado na Figura 11 pelo valor A, em contrapartida quando a ID for um verticilo poder

    se ter uma maior exatido, pois podero ser calculadas 3 distncias para a comparao, entre

    cada um dos dois deltas e o ncleo e entre os prprios deltas, conforme a Figura 11, para os

    valores A, B e C. Quando a ID for um arco, no poder se calcular nenhuma distncia, ou

    seja, esta heurstica apenas funcionar para 3 dos 4 tipos fundamentais.

    Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID.

    0.0 ESPECIFICAO

    A especificao do prottipo ser apresentada atravs dos diagramas de casos de uso

    primrio e secundrio, e do diagrama de classe. Os diagramas apresentados seguiro a notao

    da UML. Assim como as classes implementadas no prottipo seguiro os conceitos de

  • 46

    orientao a objetos. Todos os desenhos dos diagramas foram realizamos na ferramenta

    Rational Rose 2002 verso demo da Rational Rose Corporation. Maiores informaes sobre a

    ferramenta pode ser obtidas no site Rational (2002).

    0.0.0 Casos de Uso

    Os casos de uso primrios e secundrio, mostrados do uma idia dos processos

    envolvidos no prottipo, conforme mostrados nas Figuras 12, 13 e 14.

    Figura 12 Diagrama de caso de uso primrio do ator Especialista.

    Figura 13 Diagrama de caso de uso primrio do ator Usurio.

  • 47

    Figura 14 Diagrama de caso de uso secundrio do ator Usurio.

    0.0.0 Diagramas de Classes

    Na Figura 15 apresentado o diagrama de classes do prottipo, onde podem ser

    visualizadas as 3 classes existentes no mesmo, sendo elas: Integrao, RedeNeural e Usurio.

    A classe Integrao a classe que contempla todos os mtodos que iro comunicar-se com as

    outras duas classes. Um exemplo destes mtodos pode ser o mtodo de converso de um

    fragmento de imagem 20x20 pixels para os dados de entrada da Rede Neural. A classe

    Usurio comunica-se com a classe Integrao pois junto com o cadastramento do usurio e

    sua digital, j so gravados os valores das distncias calculados atravs do mtodo da

    heurstica do clculo da distncia. E por fim a classe RedeNeural contempla todos os

    mtodos referentes ao treinamento e validao da rede. Como j citado qualquer mtodo que

    deva auxiliar a rede, mas no faz parte do seu treinamento e validao foi encapsulado na

    classe Integrao.

    Figura 15 Diagrama de Classes do prottipo.

  • 48

    Por no ser o foco principal do prottipo o cadastramento do usurio, apenas ser

    detalhada a seguir a classe da Integrao e RedeNeural.

    0.0.0 Integrao

    A classe Integrao uma classe mediadora entre as classes Usurio e RedeNeural,

    nesta classe esto presentes todos os mtodos necessrios para o funcionamento do prottipo,

    mas que no poderiam fazer parte de nenhuma das outras duas classes. Como o prprio nome

    j diz, uma classe que integra as demais classes servindo de ponte para a troca de

    mensagem entre elas.

    Segue uma explicao dos principais atributos desta classe:

    c) wAltFragImg: Altura do fragmento das imagens a serem convertidos nos dados de

    entrada da RNA, utilizado 20 pixels.

    c) wLarFragImg: Largura do fragmento das imagens a serem convertidos nos dados

    de entrada da RNA, utilizado 20 pixels.

    Seguem os principais mtodos desta classe:

    c) pConverteBitMapParaVetorEntrada: este o mtodo que converte um fragmento

    de imagem 20x20 pixels para os dados que serviro de entrada para a RNA;

    c) pCarregaMatrizPesos: mtodo que carrega a matriz de pesos do arquivo para a

    memria;

    c) pRetornaDistanciasDigital: mtodo que calcula as distncias entre os pontos

    caractersticos das IIDs.

    0.0.0 Classe da Rede Neural

    Na classe RedeNeural a maioria dos atributos so privados, com exceo dos vetores

    de pesos da RNA que so acessados por vrios pontos do sistema. Na classe tambm

    encontram-se alguns mtodos privados que so os de manipulao interna da classe e outros

    pblicos que so chamados de alguns pontos fora da classe.

    Importante destacar dois tipos de dados muito importantes para a classe da Rede

    Neural, so eles os tipo: TArray1D e TArray2D. Estes tipos de dados como mostrados a

  • 49

    seguir, so tipos de arrays (vetores) dinmicos, que podem ter seu tamanho alterado em

    tempo de execuo, so eles:

    a) TArray1D = Array of Double: tipo usado para definir arrays dinmicos de uma

    dimenso (1D) do tipo Double. O Double representa nmeros reais com ponto

    flutuante ocupa 8 bits de espao em memria

    b) TArray2D = Array of Array of Double: tipo usado para definir arrays dinmicos

    de duas dimenses (2D) do tipo Double.

    Segue uma explicao dos principais atributos da classe RedeNeural:

    a) wNeuroniosEntrada: quantidade de neurnios da camada de entrada;

    b) wNeuroniosOculta: quantidade de neurnios da camada oculta;

    c) wNeuroniosSaida: quantidade de neurnios da camada de sada;

    d) wTaxaAprendizado: valor da taxa de aprendizado utilizada durante a correo dos

    pesos da RNA;

    e) wToleranciaErro: valor da tolerncia de erro a qual ir indicar se a RNA aprendeu

    ou no;

    f) wMaxIteracoes: valor mximo de iteraes a qual a RNA ser submetida. Espera-

    se que a rede sempre convirja antes deste valor;

    g) wVetPesosOculta: vetor que ir guardar os valores dos pesos entre os neurnios da

    camada de entrada e camada oculta;

    h) wVetPesosSaida: vetor que ir guardar os valores dos pesos entre os neurnios da

    camada oculta e camada de sada;

    i) wVetAtivacoesOculta: vetor que guarda os valores de ativaes de todos os

    neurnios da camada oculta, ativados durante o processo de propagao;

    j) wVetAtivacoesSaida: vetor que guarda os valores de ativaes de todos os

    neurnios da camada de sada, ativados durante o processo de propagao;

    k) wVetDeltaSaida: vetor que guarda os valores dos deltas de cada neurnio,

    calculados na camada de sada;

    l) wVetDeltaOculta: vetor que guarda os valores dos deltas de cada neurnio,

    calculados na camada oculta;

    Segue uma explicao dos principais mtodos da classe RedeNeural:

    a) pRandomizaPesos: mtodo que randomiza os pesos da RNA com valores prximos

    a zero para a inicializao do treinamento;

  • 50

    b) pTreinaRNABackPropagation: mtodo principal de treinamento que chama os

    demais mtodos para que a RNA seja treinada;

    c) pAtivaNeuronios: mtodo que ativa os neurnios da camada oculta e camada de

    sada. Para tanto so utilizados os valores de entrada e os valores dos vetores de

    pesos;

    c) pCalculaDeltaSaida: mtodo que calcula os valores dos deltas de todos os

    neurnios da camada de sada;

    c) pCalculaDeltaOculta: mtodo que calcula os valores dos delta de todos os

    neurnios da camada oculta;

    c) pAjustaPesos: mtodo que realiza o ajuste dos pesos nos vetores quando uma

    determinada amostra gerou um erro acima da tolerncia de erro;

    c) fFuncaoAtivacao: mtodo da funo sigmide binria, utilizada na ativao dos

    neurnios;

    c) fDerivadaFuncaoAtivacao: mtodo da derivada da funo sigmide binria,

    utilizada para o clculo do delta dos neurnios da camada de sada e oculta;

    c) fCalculaEQM: mtodo que calcula o erro quadrado mdio (EQM) de uma amostra

    de treinamento;

    c) fTestaRNA: mtodo que testa a RNA aps efetuado seu treinamento;

    0.0.0 Estrutura da Rede

    Inicialmente uma das preocupaes numa aplicao utilizando RNA deve ser com

    relao a quantidade de camadas ocultas da rede e a quantidade de neurnios presentes tanto

    na camada de entrada, quanto na(s) camada(s) oculta(s) e camada de sada. Sabe-se que se um

    mesmo problema for dado a vrios projetistas de RNAs todos podem apresentar solues com

    RNAs estruturadas de maneira completamente diferentes. Para a implementao do prottipo

    definiu-se o uso de apenas uma camada oculta.

    O nmero de neurnios utilizados na camada de entrada foi de 400, este valor a

    representao de cada pixel dos fragmentos das IIDs de tamanho de 20x20 pixels. A

    quantidade de neurnios na camada de sada ser igual a 1, que indicar atravs de faixas de

    valores a regio dada na entrada da rede. E por ltimo, definiu-se a quantidade de neurnios

    na camada seguindo a frmula (2-11) descrita a seo 2.4, onde O = 1*400 , totalizando 20

    neurnios nesta camada.

  • 51

    Inicialmente se treinar a rede com 20 neurnios na camada oculta, caso esta rede

    mostre pouco poder de generalizao, ir se seguir indicaes de alguns autores, onde dever

    se aumentar ou diminuir esta quantidade de neurnios um a um at que se encontre um

    melhor desempenho.

    0.0.0 Parmetros de Treino

    Os parmetros de treino so to importantes quanto a definio da quantidade de

    neurnios presentes em cada camada. O algoritmo backpropagation implementado conta com

    3 parmetros extremamente importantes sendo eles: quantidade mxima de iteraes, taxa de

    aprendizagem e valor da tolerncia ao erro.

    A quantidade mxima de iteraes o mais simples, ele um critrio de parada, onde

    se o erro desejado no for alcanado usado para interromper o