Lofoscopia

UNIVERSIDADE REGIONAL DE BLUMENAU

CENTRO DE CINCIAS EXATAS E NATURAIS

CURSO DE CINCIAS DA COMPUTAO BACHARELADO

PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)

DELTA(S) E NCLEO EM IMPRESSES DIGITAIS

UTILIZANDO REDES NEURAIS ARTIFICIAIS.

CAIO RAFAEL SILVA MATIAS

BLUMENAU 2004

2004/2-09





Trabalho de Concluso de Curso submetido Universidade Regional de Blumenau para a obteno dos crditos na disciplina. Trabalho de Concluso de Curso II do curso de Cincias da Computao Bacharelado.

Prof. Jomi Fred Hbner - Orientador

BLUMENAU 2004

2004/2-09




Por


Trabalho aprovado para obteno dos crditos na disciplina de Trabalho de Concluso de Curso II, pela banca examinadora formada por:

______________________________________________________ Presidente: Prof., Jomi Fred Hbner Orientador, FURB

______________________________________________________ Membro: Prof. Mauro Marcelo Mattos, FURB

______________________________________________________ Membro: Prof. Paulo Csar Rodacki Gomes, FURB

Blumenau, 09 de Fevereiro de 2005.

Dedico este trabalho a toda a minha famlia em especial minha noiva, pessoas estas que me apoiaram durante toda a minha vida.

A mente que se abre a uma nova idia jamais volta ao seu tamanho original.

Albert Einstein

AGRADECIMENTOS

A Deus, pela oportunidade da existncia.

A meus pais, Jair Matias e Roseli Silva Matias, por toda a educao recebida ao longo

destes meus 22 anos, educao esta que foi fundamental para a formao de meu carter.

minha noiva Gabriela Porto pela sua maturidade e companheirismo mostrados nos

momentos de minha ausncia em que me dediquei a este trabalho.

Ao meu orientador, Jomi Fred Hbner pelo seu bom humor, e conhecimentos tcnicos,

bem como pelo seu apoio e incentivo prestados a mim durante todo o perodo de

desenvolvimento.

Aos meus companheiros Alex Sandro Silva e Maurcio Edgar Stivanello, com os quais

troquei muitas idias durante todo o perodo de desenvolvimento deste trabalho.

E por fim a todos aqueles amigos e companheiros, que j passaram ou esto presentes

em minha vida, e que j torceram ou torcem pelo meu sucesso enquanto ser humano.

RESUMO

Este trabalho apresenta o desenvolvimento de um prottipo para reconhecimento de delta(s) e ncleo em impresses digitais. Para este reconhecimento utilizou-se uma Rede Neural Artificial feedforward multicamada com treinamento backpropagation. Como entradas para esta rede so apresentados fragmentos de imagens, e como resposta espera-se que a rede classifique esta entrada em trs padres, os quais indicaro a qual regio este fragmento de imagem pertence. Ainda so mostrados neste trabalho a construo de um sistema de identificao das impresses digitais atravs da comparao de uma impresso digital com outras de usurios previamente cadastrados, bem como as tcnicas, dificuldades e resultados referentes as etapas de estudo e desenvolvimento.

Palavras chaves: Inteligncia Artificial; Redes Neurais Artificiais; Impresses Digitais;

ABSTRACT

This work describes the development of prototype to recognize delta(s) and kernel in fingerprints. It was applied a feedforward multi-layer artificial neural network with backpropagation algorithm to classify the fingerprints. Some regions of the fingerprints image are used as training samples for this network and it answer by classify theses inputs as the either delta or kernel. This work shows the implementation of a fingerprints recognizing system by comparing fingerprints with another one previously provided. Some techniques, difficulties and results identified while this working was being done are show. Palavras chaves: Artificial Inteligence; Artificial Neural Network; Fingerprints;

LISTA DE ILUSTRAES

Figura 1 Regies dos sistemas de linhas. ..............................................................................21 Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich. ......................................23 Figura 3 Em destaque ncleo e deltas de uma ID..................................................................24 Figura 4 Representao macro de um sistema de identificao biomtrica. .........................26 Figura 5 Representao de um neurnio biolgico. ..............................................................32 Figura 6 Representao do funcionamento de um neurnio artificial...................................35 Figura 7 Representao dos Fluxos das RNA .......................................................................36 Figura 8 Funo logstica de ativao sigmide binria. ......................................................38 Figura 9 Exemplo de regies da IID passadas como entrada para a RNA............................44 Figura 10 Definio da diviso de quadrantes numa IID ......................................................44 Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID. ...............45 Figura 12 Diagrama de caso de uso primrio do ator Especialista ....................................46 Figura 13 Diagrama de caso de uso primrio do ator Usurio...........................................46 Figura 14 Diagrama de caso de uso secundrio do ator Usurio .......................................47 Figura 15 Diagrama de Classes do prottipo ........................................................................47 Quadro 1 Rotina principal de treinamento da classe RedeNeural .........................................53 Quadro 2 Rotina de ativao dos neurnios das camadas ocultas e de sada........................54 Quadro 3 Rotina de clculo do delta dos neurnios da camada de sada da RNA................54 Quadro 4 Rotina de clculo do delta dos nernios da camada oculta RNA..........................55 Quadro 5 Rotina de ajuste dos pesos de todas as camada da RNA. ......................................55 Quadro 6 Rotina de clculo do Erro Quadrado Mdio EQM................................................56 Quadro 7 Rotinas da Funo Sigmide Binria e sua derivada. ...........................................56 Quadro 8 Rotina de converso de imagens 20x20 para os valores de entrada da RNA........56 Quadro 9 Rotina da heurstica do clculo da distncia..........................................................57 Figura 16 Exemplo de IIDs capturadas com tinta comum e tinta tipogrfica .......................59 Figura 17 IID capturada atravs de um leitor biomtrico......................................................59 Figura 18 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 19 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 20 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 21 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 22 Exemplo de IIDs geradas pelo aplicativo Sfinge ..................................................62 Figura 23 Amostras de treinamento de regies dos deltas ampliadas em 5 vezes. ...............65 Figura 24 Amostras de treinamento de regies dos ncleos ampliadas em 5 vezes. ............65 Figura 25 Amostras de treinamento de regies quaisquer ampliadas em 5 vezes.................65 Figura 26 Tela principal do prottipo....................................................................................66 Figura 27 Pasta Treinamento Automtico da tela de Treinamento da RNA. ........................67 Figura 28 Pasta Treinamento Manual da tela de Treinamento da RNA................................68 Figura 29 Pasta de Pesos da tela de Treinamento da RNA. ..................................................69 Figura 30 Pasta de Validao Automtica da tela de Validao da RNA.............................70 Figura 31 Pasta de Validao Manual da tela de Validao da RNA. ..................................70 Figura 32 Tela de cadastramento de usurios.........................................................................71 Figura 33 Tela de identificao das IIDs atravs da comparao das distncias. ..................72 Figura 34 Grfico de testes com diferentes valores em parmetros da RNA........................73

LISTA DE TABELAS

Tabela 1 Quantidade de amostras por Grupo para cada tipo de regio .................................64 Tabela 2 Resultado da taxa de acerto da RNA com vrios NO na camada Oculta ...............73 Tabela 3 Resultados por grupos de Amostras .......................................................................74

LISTA DE SIGLAS

AFIS Automatic Fingerprint Identification System

BD Banco de Dados

BMP BitMaP ou mapa de bits

DPI Dots Per Inch ou pontos por polegada

EQM Erro Quadrado Mdio

ID Impresso Digital

IID Imagem de Impresso Digital

NO Neurnio Oculto

Pixel Picture Element ou elemento da imagem

RGB Red+Green+Blue ou Vermelho+Verde+Azul

RNA Rede Neural Artificial

RNA-FM Rede Neural Artificial Feedforward Multicamada

SGBD Sistema Gerenciador de Banco de Dados

UML Unified Modeling Language ou Linguagem de Modelagem Unificada

XOR eXclusive OR conhecido como OU exclusivo

SUMRIO

1 INTRODUO..................................................................................................................13

1.1 ORIGEM DO TRABALHO..............................................................................................13

1.2 REAS..............................................................................................................................14

1.3 PROBLEMA .....................................................................................................................15

1.4 JUSTIFICATIVAS............................................................................................................15

1.5 OBJETIVOS......................................................................................................................16

1.6 ESTRUTURA DO TRABALHO......................................................................................16

2 FUNDAMENTAO TERICA....................................................................................18

2.1 IMPRESSES DIGITAIS.................................................................................................18

2.1.1 Datiloscopia.....................................................................................................................18

2.1.2 Estudo da Pele.................................................................................................................19

2.1.3 Sistema Datiloscpico de Juan Vucetich ........................................................................21

2.1.3.1 Mincias .......................................................................................................................23

2.1.3.2 Ncleo e Deltas.............................................................................................................24

2.2 BIOMETRIA.....................................................................................................................25

2.2.1 Sistemas de Identificao Biomtrica .............................................................................25

2.2.2 Sistemas de Identificao Biomtrica atravs das Impresses Digitais..........................26

2.3 PROCESSAMENTO DE IMAGENS ...............................................................................28

2.3.1 Imagem Digital................................................................................................................28

2.3.1.1 Definio de Cores .......................................................................................................29

2.3.1.2 Formato de Imagens .....................................................................................................30

2.3.2 Tcnicas de Processamento de Imagens .........................................................................30

2.4 REDES NEURAIS ............................................................................................................31

2.4.1 Sistema Nervoso e Neurnio Biolgico..........................................................................31

2.4.2 Redes Neurais Artificiais ................................................................................................33

2.4.2.1 Neurnio Artificial........................................................................................................34

2.4.2.2 Rede Neural Artificial Feedforward Multicamada.......................................................36

2.4.2.3 Funes de Ativao.....................................................................................................37

2.4.2.4 Treinamento e Aprendizado .........................................................................................38

2.4.2.4.1 Aprendizado por Retropropagao (backpropagation) ...........................................39

2.4.2.5 Escolha da Estrutura das Redes ....................................................................................41

2.5 CONTEXTO ATUAL DO TRABALHO .........................................................................41

2.5.1 Trabalhos Correlatos .......................................................................................................41

3 DESENVOLVIMENTO DO PROTTIPO....................................................................43

3.1 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO.......................43

3.2 VISO GERAL.................................................................................................................43

3.3 ESPECIFICAO ............................................................................................................45

3.3.1 Casos de Uso...................................................................................................................46

3.3.2 Diagramas de Classes......................................................................................................47

3.3.3 Integrao........................................................................................................................48

3.3.4 Classe da Rede Neural ....................................................................................................48

3.3.5 Estrutura da Rede ............................................................................................................50

3.3.6 Parmetros de Treino ......................................................................................................51

3.4 IMPLEMENTAO ........................................................................................................52

3.4.1 Tcnicas e Ferramentas Utilizadas..................................................................................52

3.4.2 Imagens de Impresses Digitais......................................................................................58

3.4.3 Pr-Processamento em Imagens de Impresses Digitais ................................................62

3.4.4 Treinamento da Rede Neural Artificial...........................................................................63

3.4.5 Operacionalidade da Implementao ..............................................................................66

3.5 RESULTADOS E DISCUSSO ......................................................................................72

4 CONCLUSES..................................................................................................................76

4.1 OBJETIVOS DO TRABALHO ........................................................................................76

4.2 FERRAMENTAS..............................................................................................................76

4.3 PROTTIPO .....................................................................................................................76

4.4 REDE NEURAL ARTIFICIAL FEEDFORWARD MULTICAMADA...........................77

4.5 CONCLUSES FINAIS...................................................................................................78

4.6 EXTENSES ....................................................................................................................78

REFERNCIAS BIBLIOGRFICAS .................................................................................80

13

0 INTRODUO

Neste captulo so levantados alguns aspectos relativos ao tema, bem como a origem

deste trabalho e as justificativas para o desenvolvimento do mesmo.

0.0 ORIGEM DO TRABALHO

A histria da Identificao Humana contada por historiadores, arquelogos e

exploradores que estudaram o Homem e a vida animal na crosta terrestre. Desde a mais

remota Antigidade, o Homem teve sua ateno voltada para a identificao. Os trogloditas

usavam como meios de identificao, sinais diversos que serviam para marcar suas moradias.

Aplicavam os desenhos palmares por meio de decalque sobre a argila, colorindo-o, e em

seguida completavam o enfeite com cabeas dessecadas de animais ou at mesmo de inimigos

abatidos em combates. Integrantes de tribos traziam desenhos coloridos pelo corpo, dentes de

animais preso s orelhas, lbios e nariz. Tudo isto para que pudessem ser identificados uns

pelos outros (APPOL, 2004).

Ao longo do tempo estes mtodos de identificao evoluram, principalmente pela

necessidade crescente de se confirmar a identidade de um indivduo, ou seja, de se ter certeza

de que uma pessoa quem realmente diz ser. Durante os ltimos anos, as pessoas tm usado

chaves, cartes, assinaturas e senhas para validar sua identidade. O grande problema destes

artefatos que podem ser esquecidos, roubados, perdidos, copiados, armazenados de maneira

insegura e at utilizados por pessoas que no tenham autorizao. Desta forma, no

surpreendente que um novo campo de atraes nas pesquisas recentes seja a biometria. Dentre

as definies citadas no dicionrio, biometria o ramo da cincia que estuda a mensurao

dos seres vivos (PROGLOBO, 1996).

Com base nos estudos da biometria e com a larga utilizao de computadores,

puderam-se criar sistemas computacionais confiveis de identificao de indivduos. Para

tanto estes sistemas utilizam caractersticas biomtricas que estudos cientficos j

comprovaram como sendo nicas. Entre estas caractersticas destaca-se, o reconhecimento

atravs da face, da geometria das mos, da assinatura, da voz, da ris, da retina e das

impresses digitais associada ao acrnimo ID (AGUIAR, 2004).

14

Entre as caractersticas biomtricas citadas acima, a mais utilizada a identificao

atravs das IDs, por ser mais barata e muito confivel. As IDs so reprodues fiis dos

desenhos digitais em alguma superfcie plana. Desenhos digitais por sua vez, so as diversas

linhas e entrelinhas formadas na pele dos dedos dos ps e das mos dos seres humanos e de

alguns outros animais dotados de mos, tais como macacos, gambs, cotias, etc. No estudo

das IDs destacam-se como sendo caractersticas importantes o(s) delta(s) e ncleo das

mesmas. Pode-se definir o ncleo como sendo o centro de encontro das IDs, e o(s) delta(s)

como sendo o(s) ngulo(s) ou tringulo(s) formados pelas linhas, localizados a direita e/ou

esquerda da ID (KEHDY, 1968, p. 33).

Para extrair as caractersticas biomtricas necessrio hardware especializado. No

caso do desenho digital se faz necessrio um sensor ou scanner biomtrico. Os sistemas

biomtricos baseados em IDs utilizam como base a Datiloscopia agregada a tcnicas e

heursticas prprias de computao para gerar um sistema que permita a autenticao da

identidade de um indivduo. O hardware normalmente apresenta para estes sistemas de

identificao uma imagem digital, que por sua vez precisa ser tratada na maioria das vezes

atravs de tcnicas de pr-processamento de imagem, para que estes sistemas se tornem o

mais confiveis possvel.

Para o desenvolvimento deste trabalho sero utilizadas tcnicas de Redes Neurais

Artificiais (RNA) para o reconhecimento das IDs e a comparao com outras IDs previamente

armazenadas. Segundo Loesch (1996, p. 5), as RNA so uma tentativa de se copiar as redes

neurais dos seres humanos. Nelas encontram-se tambm neurnios, mas artificiais, que

interconectados, podem produzir resultados expressivos no reconhecimento de padres. No

caso deste trabalho, os padres a serem identificados e comparados sero as IDs.

1.2 REAS

As reas relacionadas ao trabalho proposto so:

a) Datiloscopia: o contedo desta rea se faz necessrio para definio das

caractersticas das IDs, que sero amplamente utilizadas para o desenvolvimento do

prottipo;

b) Identificao Biomtrica: seus conceitos vo ao encontro do prottipo, que um

sistema de identificao biomtrica;

15

b) Computao Grfica: no que diz respeito captura das imagens das IDs, e todo o

pr-processamento destas imagem que serviro de entrada para a RNA;

b) Inteligncia Artificial (Redes Neurais Artificiais): a RNA implementada que ser a

principal tecnologia empregada no prottipo.

0.0 PROBLEMA

Atualmente, e cada vez mais, necessita-se ter o acesso restrito e controlado de pessoas

a certos locais, que vo desde bancos, empresas internacionais, locais de jogos etc. Os

sistemas de identificao tradicionais levantam enormes e conhecidos problemas na gesto de

assiduidade e acesso. So comuns, por exemplo, os erros nos cdigos a digitar e o

esquecimento dos cartes. Alm disso, so sistemas com uma elevada taxa de incerteza, j

que os cdigos podem ser divulgados a terceiros e os cartes podem ser emprestados ou at

roubados (PROGLOBO, 1996).

Em razo desta dificuldade, criou-se os sistemas de identificao biomtrica. Estes

sistemas visam minimizar significativamente os problemas de controle de assiduidade e

acesso, uma vez que utilizam as caractersticas fsicas do indivduo para identificao, e

somente ser possvel a comprovao de sua identidade na presena fsica do mesmo.

0.0 JUSTIFICATIVAS

Inicialmente a identificao atravs das IDs eram feitas por indivduos treinados, ou

seja, uma ou mais pessoas tinham arquivos de IDs impressas em papel e, quando conhecido o

nome do indivduo, pegava-se sua ficha e comparavam-se as mincias e outras caractersticas

da ID j destacadas nesta ficha com a ID fornecida, utilizando para isto lupa e materiais como

rgua e lpis. Quando no se tinha o nome do indivduo a ser identificado com sua ficha

correspondente, como por exemplo, um crime sem testemunha, este trabalho se tornava

demorado e de pacincia, onde muitas vezes o indivduo no podia ser identificado entre

tantas fichas (GUMZ, 2002, p. 4).

Este processo de identificao tornou-se cada vez mais precrio com o passar do

tempo, e desde ento os sistemas biomtricos de identificao de indivduos atravs das IDs

vm ganhando espao no mercado de acesso continuamente. Entre os motivos geradores deste

crescimento pode-se destacar que as IDs no so perdidas como cartes, nem divulgadas a

16

terceiros como senhas, e que os aparelhos de leitura de impresses digitais oferecem muito

mais segurana que estes mtodos, uma vez que praticamente impossvel falsificar uma ID

humana (APPOL, 2004).

Neste trabalho pretende-se apresentar uma pesquisa referente s dificuldades que

envolvem a criao de um sistema de identificao biomtrica, propondo uma soluo de

identificao de indivduos atravs do(s) delta(s) e ncleo das IDs. Atravs da utilizao dos

conceitos da Datiloscopia, dos conhecimentos dos sistemas biomtricos, das tcnicas de

processamento de imagens digitais e das RNAs pretende-se criar um prottipo de

identificao de indivduos.

2.3 OBJETIVOS

O objetivo deste trabalho desenvolver um sistema para identificao do(s) delta(s) e

ncleo em IDs utilizando tcnicas de RNAs.

Os objetivos especficos do trabalho so:

a) realizar a identificao do(s) delta(s) e ncleo de IDs armazenadas em imagens

Bitmaps;

b) realizar a identificao do(s) delta(s) e ncleo de IDs de qualquer dedo das mos.

c) realizar a comparao destas IDs identificadas com outras previamente

armazenadas.

2.4 ESTRUTURA DO TRABALHO

Este trabalho est organizado como descrito a seguir:

a) no capitulo 1, apresentada brevemente uma introduo ao assunto, bem como

uma idia a que este trabalho se prope;

b) no captulo 2 sero apresentadas todas as reas referentes a fundamentao terica

deste trabalho, sendo elas: Datiloscopia, Identificao Biomtrica, Processamento

de Imagens e Redes Neurais Artificiais. Neste captulo so apresentados conceitos,

caractersticas, tcnicas, ferramentas e outros aspectos relevantes vinculados ao

tema;

17

c) no captulo 3 ser apresentado todo o processo de desenvolvimento do prottipo

bem como as estruturas, algoritmos, tcnicas, diagramas, fragmentos de cdigos,

etc, utilizados durante esta etapa;

b) e, por ltimo, no captulo 4, sero apresentadas concluses, anlise de resultados,

bem como sugestes para trabalhos futuros.

18

0 FUNDAMENTAO TERICA

Nas prximas sees sero apresentados conceitos, tcnicas e ferramentas mais

relevantes ao desenvolvimento do trabalho, bem como o estado da arte sobre o tema e

tambm trabalhos correlatos encontrados.

0.0 IMPRESSES DIGITAIS

Segundo APPES (2004) a Papiloscopia o mais seguro mtodo de identificao

humana. A Papiloscopia divide-se em Datiloscopia, Quiroscopia e Poroscopia. A Datiloscopia

a cincia que estuda os desenhos papilares formados na polpa digital (ponta dos dedos). A

Quiroscopia cincia que estuda os desenhos formados pela palma das mos. E a Poroscopia

a cincia que estuda os desenhos formados pela planta dos ps. Para o desenvolvimento

deste trabalho ser considerado apenas o estudo da Datiloscopia.

0.0.0 Datiloscopia

Segundo Tavares Jnior (1991, p. 19-20) alguns autores consideram o incio do estudo

da Datiloscopia no perodo pr-histrico, onde o Homem primitivo tinha o costume de marcar

sua caverna com o desenho de suas mos sobre a argila, passando aps para pases do Oriente,

onde os homens eram obrigados a opor os dedos polegares impregnados de tintas em papis

para a emisso de documentos de divrcio. Mas foi entre os anos de 1664 e 1891 que a

Datiloscopia teve seu estudo comprovado como cincia.

Em 1664 o anatomista italiano J. Marcello Malpighi fez estudos sobre as papilas da

pele encontradas na palma das mos e nas extremidades digitais. Seus estudos foram

estendidos por vrios pesquisadores, onde os que mais se destacaram por seu trabalho foram

William Hershel que em 1.858 provou o postulado da imutabilidade; Arthur Kollmam que em

1.883 provou a formao dos desenhos digitais no sexto ms de vida fetal; Francis Galton que

em 1.888 criou um sistema com trinta e oito tipos de IDs classificados em trs grupos: arcos,

presilhas e verticilos; Henry de Varigny que em 1.891 publicou um artigo sobre o sistema de

Galton que foi traduzido para vrias lnguas; e Juan Vucetich, argentino que leu este artigo, e

que criou uma extenso do sistema de Galton e implantou pela primeira vez a identificao de

suspeitos de crime pela ID por volta de 1.891 com o nome de Icnofalangometria (TAVARES

19

JNIOR, 1991, p. 20-22). O termo Icnofalangometria foi modificado para Datiloscopia em

1894, por sugesto do Dr. Francisco Latzina (KEHDY, 1968, p. 37).

A Datiloscopia a cincia que trata a identificao de pessoas atravs da comparao

de suas IDs. O termo Datiloscopia deriva de dois elementos gregos daktylos = dedos e

skopin = examinar. A Datiloscopia divide-se em civil, criminal e clnica. A Datiloscopia

civil trata da identificao das pessoas para expedio de documentos de identidade, tais

como cdula de identidade, passaporte, etc. A Datiloscopia criminal reveste-se de trs

aspectos, a saber: indiciado em inqurito policial, expedio de documentos de idoneidade e

aproveitamento das impresses papilares encontradas nos locais de crimes. J a Datiloscopia

clnica estuda as perturbaes que se verificam nos desenhos digitais. Perturbaes estas

resultantes de algumas doenas, ou exerccio de certas profisses (KEHDY, 1968, p. 25-27).

Segundo Kehdy (1968, p. 27) e APPES (2004), so os seguintes os postulados1 da

Datiloscopia:

c) perenidade: a propriedade que tem o desenho digital de existir desde o sexto ms

de vida fetal at a putrefao cadavrica, quando se d o descolamento da derme;

c) imutabilidade: a propriedade que tem o desenho digital de no mudar, desde o

sexto ms de vida fetal at a putrefao cadavrica;

a) variabilidade: a propriedade que tem o desenho digital de variar de dedo para

dedo e de pessoa para pessoa. Os gmeos, quando do mesmo ovo, apresentam

desenhos papilares semelhantes, mas nunca absolutamente iguais. A variedade to

grande que em milhes e milhes de IDs j estudadas e fichadas em todo o mundo

jamais se encontrou duas iguais;

b) classificabilidade: a propriedade que tem o desenho digital de poder ser

classificado. Este por sua vez classificado em tipo e subtipo.

0.0.0 Estudo da Pele

Pele uma vasta membrana que recobre todo o corpo humano. Tavares Jnior (1991,

p. 27) detalha que a pele constituda por duas camadas: a derme e a epiderme. A derme a

parte principal e mais profunda da pele, e est localizada sob a epiderme. Na superfcie da

1 Postulado uma proposio que aceita sem demonstrao.

20

pele ficam localizados pequenos relevos: as papilas. Estas existem nas superfcies palmares e

plantares. J a epiderme uma fina membrana, transparente, que recobre a derme.

Segundo Kehdy (1968, p. 31) existem duas espcies de glndulas de secreo

presentes na pele e que interessam no estudo da Datiloscopia. So as glndulas sudorparas e

sebceas. As glndulas sudorparas existem em maior quantidade e esto presentes nas palmas

das mos, nas extremidades digitais e nas plantas dos ps. J as glndulas sebceas existem

em maior quantidade na testa, no couro cabeludo, no nariz e nas orelhas, e produzem

substncias gordurosas. Estas glndulas e a secreo das mesmas que permitem que sejam

deixadas ID em locais de crimes, por exemplo.

Tavares Jnior (1991, p. 30) afirma que as papilas so situadas na derme e se espalham

por todo o corpo, por este motivo que pequenos cortes ou queimaduras leves no afetam os

desenhos digitais. Define-se como desenho digital a combinao de cristas e sulcos papilares

localizados na derme e espalhados pela epiderme, formando configuraes diversas em IDs. E

IDs por sua vez so a reprodues do desenho digital em um suporte liso e limpo.

APPOL (2004) afirma que, o datilograma produzido pelo entintamento da polpa

digital ou por manchas de suor e gorduras sobre um suporte liso e polido, podendo ser

tambm produzido por decalque em suporte mole que venha a endurecer. Em um datilograma,

as linhas impressas representam cristas papilares (linhas pretas ou cinza escuro) e os espaos

intercalados so os sulcos interpapilares (linhas brancas ou cinza claro).

Tavares Jnior (1991, p. 30) cita que as IDs compem-se de: linhas pretas, linhas

brancas, delta, ponto caractersticos, poros, linhas brancas albodactiloscpicas.

b) linhas pretas: correspondem s cristas papilares;

b) linhas brancas: correspondem aos sulcos interpapilares;

b) delta: o ngulo ou tringulo formado pelas cristas papilares;

b) pontos caractersticos: so os acidentes que se encontram nas cristas papilares.

Servem para identificar as impresses por serem permanentes;

b) poros: so aberturas dos canais que expelem os produtos das glndulas sudorparas

e sebceas;

b) linhas brancas albodactiloscpicas: so formadas pela interrupo de duas ou mais

cristas papilares, so formadas pelo enrugamento da pele.

21

Segundo Kehdy (1968, p. 34) as IDs com ausncia de deltas, no possuem sistemas de

linhas, as demais possuem trs sistemas de linhas, conforme mostrados na Figura 1, sendo

definidos como:

b) regio basilar: formada pelo conjunto de linhas existentes entre a prega

interfalangeana e a terceira linha abaixo do ramo descendente e ascendente do

delta.

b) regio nuclear: formada pelo conjunto de linhas que circunscrevem o centro do

datilograma, ou seguindo a diretriz superior at o ramo ascendente do delta.

b) regio margial: formada pelo conjunto de linhas do pice e das laterais do

datilograma at a linha imediata que acompanha a diretriz superior do delta.

Figura 1 Regies dos sistemas de linhas.

As IDs so normalmente extradas com papel, rolo e tinta, onde a superfcie do dedo

molhada com o rolo entintado e imediatamente posta contra o papel. Assim so separados os

indivduos em fichas que podem ser decadatilares ou monodatilares (dez ou uma ID por

ficha). Estas fichas so ordenadas por tipo de ID, quantidade e tipo de mincias (KEHDY,

1968, p. 14).

0.0.0 Sistema Datiloscpico de Juan Vucetich

Foi por iniciativa de Flix Pacheco, que o Presidente da Repblica Dr. Rodrigues

Alves, em 05 de fevereiro de 1903, atravs do Decreto 4.764, introduziu a Datiloscopia como

mtodo mais simples e mais perfeito para identificao de indivduos. Todo o processo de

identificao seria subordinado classificao dactiloscpica, de acordo com o Sistema

22

Vucetich, considerando-se, para todos os efeitos, a ID como prova mais concludente e

positiva da identidade do indivduo (APPES, 2004).

Segundo Tavares Jnior (1991, p. 37-38) e Kehdy (1968, p. 37), no sistema

datiloscpico de Vucetich as IDs so classificadas nos tipos: arco, presilha interna, presilha

externa e verticilo. O arco apresenta como caractersticas a ausncia de delta, onde as linhas

atravessam o campo da ID de um lado ao outro. A presilha interna tem um delta direita do

observador e as linhas nucleares correm para a esquerda do observador. J a presilha externa

tem um delta esquerda do observador e as linhas nucleares correm para a direita do

observador. E o verticilo tem dois deltas, sendo um direita e outro esquerda do observador,

onde as linhas nucleares ficam encerradas entre os dois deltas, assumindo configuraes

variadas.

Os tipos fundamentais de Vucetich so representados abreviadamente por nmeros e

letras, a saber: Arco=A=1, presilha Interna=I=2, presilha Externa=E=3 e Verticilo=V=4. As

letras so empregadas para os dedos polegares e os nmeros para os demais dedos. Alm dos

smbolos acima, ainda so utilizados X quando h cicatriz e O para amputao, estes ltimos

dois smbolos so empregados para qualquer um dos dedos (KEHDY, 1968, p. 38).

Tavares Jnior (1991, p. 45) exibe a frmula datiloscpica como uma frao ordinria

para se efetuar a classificao decadatilar, onde o numerador indica impresses da mo direita

e o denominador da mo esquerda. Os smbolos da frmula so dispostos na ordem natural

dos dedos: polegar, indicador, mdio, anelar e mnimo. Segundo Kehdy (1968, p. 40) existem

410 combinaes, o que resulta em 1.048.576 diferentes frmulas datiloscpicas, que o

resultado dos 4 tipos fundamentais elevados aos dez dedos. Na frmula 2-1 tem-se um

exemplo de frmula datiloscpica, mo direita: arco, verticilo, presilha externa, presilha

interna e arco; e na mo esquerda: verticilo, arco, arco, presilha interna, arco.

1121

4321

V

A (2-1)

Kehdy (1968, p. 40) afirma que os quatro tipos fundamentais de Vucetich no

aparecem com a mesma freqncia nos datilogramas. Atravs de estudos estabeleceu-se que

5% das IDs encontradas so do tipo arco, 60% do tipo presilhas e 35% do tipo verticilos. Na

Figura 2 so apresentados os quatro tipos fundamentais das IDs no sistema Vucetich.

23

Fonte: Adaptado de Gumz (2002, p. 12). Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich.

Em (KEHDY, 1968, p. 44) ainda so detalhados os subtipos das IDs, estes por sua vez

so agregados aos tipos principais, a saber:

b) arco: plano, angular, bifurcado direita e bifurcado esquerda;

b) presilha interna: normal, invadida, dupla e ganchosa;

b) presilha externa: normal, invadida, dupla e ganchosa; e

b) verticilo: espiral, ovoidal, sinuoso e ganchoso.

Defrontam-se alguns casos onde o sistema de Vucetich apresenta tipos limites, quando

uma impresso tem seu desenho encaixando-se em mais de um tipo. Os tipos limites so: arco

e presilha interna, arco e presilha externa, arco e verticilo, presilha interna e verticilo e,

presilha externa e verticilo (KEHDY, 1968, p. 36).

0.0.0.0 Mincias

Segundo Costa (2000, p. 15), as mincias so acidentes que se encontram nas cristas

papilares e tm a finalidade de estabelecer a unicidade das IDs. Pode-se dizer que mincias

so terminaes e bifurcaes dos sulcos papilares.

Kehdy (1968, p. 61) e Tavares Jnior (1991, p. 32) afirmam que para se confirmar a

identidade de uma ID, devero ser coincididos no mnimo doze mincias, as quais devem ser

encontradas da mesma forma, localizao e mesma quantidade nas duas impresses em

24

comparao. Tambm no pode haver mincias que se encontram na impresso testemunha2 e

no esto presentes na impresso suspeita3.

0.0.0.0 Ncleo e Deltas

O ncleo de uma ID representa o centro de gravidade da impresso. Em IDs do

grupo verticilo, o ncleo est localizado na parte superior da volta mais interna da linha

datilar. J em IDs dos grupos presilhas, o ncleo localiza-se no ombro da laada mais interna

da impresso (ANTHEUS, 2002).

O delta o ngulo ou tringulo formado pelas cristas papilares, pela brusca

divergncia das linhas paralelas ou pela bifurcao de uma linha simples. Sua principal

funo determinar o tipo da ID. Os deltas representam o ponto de divergncia das linhas

datilares mais internas que envolvem ou tendem a envolver a regio nuclear de uma ID.

Verticilos apresentam dois deltas, Presilhas Externas apresentam um delta esquerda do

observador e as Presilhas Internas um delta direita do observador. O Arco normalmente no

possui delta (APPOL, 2004). Na Figura 3, so mostrados ncleo e deltas.

Figura 3 Em destaque ncleo e deltas de uma ID.

2 Impresso testemunha a encontrada em local de crime. 3 Impresso suspeita a tomada dos dedos do suspeito ou encontrada no arquivo datiloscpico.

25

0.0 BIOMETRIA

Segundo Bressan (2002, p. 3), todos os mtodos de identificao de indivduos so

baseados em trs conceitos fundamentais: segurana baseada em algo que o indivduo possui,

como uma chave de um cofre, segurana baseada em algo que o indivduo sabe, como uma

senha, e segurana baseada em quem o individuo , como sua ID. A identificao atravs

deste ltimo conceito chamada de identificao biomtrica, pois usa caractersticas

estudadas pela biometria.

Como j citado anteriormente, segundo o dicionrio, biometria o ramo da cincia

que estuda a mensurao dos seres vivos, mas no mundo da segurana, biometria se refere

aos mtodos automatizados para identificao de pessoas com base em suas caractersticas

fsicas, fisiolgicas ou em seus aspectos comportamentais (AGUIAR, 2004).

0.0.0 Sistemas de Identificao Biomtrica

Segundo Pankanti (2000, p. 2), um sistema biomtrico um sistema de

reconhecimento de padres capaz de estabelecer a identidade de um indivduo atravs de

caractersticas fsicas ou comportamentais. Para que estas caractersticas possam ser utilizadas

em um processo de identificao de usurio necessria a utilizao de tecnologias bastante

avanadas. Bressan (2002, p. 3), enfatiza que qualquer caracterstica humana, seja ela fsica,

fisiolgica ou comportamental, pode ser usada para identificao biomtrica, desde que

satisfaam aos seguintes requisitos:

b) universalidade: todas as pessoas devem possuir a caracterstica a ser medida;

b) singularidade: indica que esta caracterstica no pode ser igual em pessoas

diferentes;

b) permanncia: significa que a caracterstica no deve variar com o tempo;

b) desempenho: preciso da identificao, os recursos requeridos para conseguir uma

preciso de identificao aceitvel e ao trabalho ou fatores ambientais que afetam a

preciso de identificao;

b) aceitabilidade: indica o quanto as pessoas esto dispostas a aceitar os sistemas

biomtricos;

b) proteo: facilidade ou dificuldade de enganar o sistema com tcnicas fraudulentas.

26

Segundo Hong (1998, p. 3), os sistemas biomtricos so divididos em duas partes: o

mdulo de registro e o mdulo de identificao. No mdulo de registro as caractersticas so

obtidas por um leitor biomtrico e processadas atravs de um mdulo extrator de

caractersticas gerando um template que ser armazenado. J o mdulo de identificao deve

fazer a captura das caractersticas biomtricas no momento do acesso, gerando tambm uma

representao atravs do mdulo extrator, equivalente as armazenadas atravs dos templates.

E finalmente, o resultado do mdulo de identificao alimentado ao mdulo comparador de

caractersticas que o confronta contra os templates armazenados para estabelecer a identidade.

A traduo de template modelo ou gabarito, mas como as palavras modelo e gabarito tm

muitos significados em nosso idioma, a partir deste ponto ser utilizado o termo template para

indicar as caractersticas biomtricas armazenadas pelo mdulo de registro. Na Figura 4,

apresenta-se uma representao macro de um sistema de identificao biomtrica.

Fonte: Adaptado de Gumz (2002, p. 15). Figura 4 Representao macro de um sistema de identificao biomtrica.

Como exemplos de aplicaes biomtricas tm-se as forenses que incluem

identificao criminal, segurana de prises e identificao de cadveres; as civis que

agregam identificao nacional, carteira de motorista, sade, travessia de fronteiras; e as

comerciais em que se destacam comrcio eletrnico e servios bancrios como caixa

automtico, carto de crdito e controles de acesso (GUMZ, 2002, p. 16).

0.0.0 Sistemas de Identificao Biomtrica atravs das Impresses Digitais

Os sistemas de identificao biomtrica por IDs so associados a sigla AFIS, do ingls

Automatic Fingerprint Identification System ou sistema de identificao automtica de IDs.

27

Segundo Bressan (2002, p. 8), os sistemas de identificao atravs de IDs, analisam

basicamente a posio das mincias, mas os sistemas mais modernos, alm disto, esto

verificando tambm outras caractersticas, tais como arcos, voltas, posio do(s) delta(s),

ncleo, etc. Tudo isto para que estes sistemas tenham seus percentuais de acerto cada vez

mais prximos de 100%.

Os templates citados anteriormente no necessariamente gravam a imagem da ID

coletada pelo leitor biomtrico, na maioria das vezes usam-se caractersticas especficas dos

desenhos das impresses, como o nmero de linhas, redemoinhos, etc., de modo que o

processo de comparao seja feito de uma forma mais rpida e precisa (BRESSAN, 2002, p.

3).

Segundo Bressan (2002, p. 8), existem vrios tipos de sensores para identificao de

ID. Alguns trabalham com calor, outros com presso, etc., mas os mais comuns usam um

pequeno CCD (que o componente bsico de um scanner) para obter imagens digitais da

impresso. Estes tipos de sensores tambm so mais confiveis que os de temperatura e

presso, pois no dependem das condies ambientais durante a utilizao do sensor.

Mais detalhadamente podem-se citar os trs tipos de leitores de IDs:

b) pticos: o dedo colocado sobre uma plataforma de vidro e uma imagem do dedo

capturada. Estes dispositivos tornaram-se pequenos e baratos;

b) ultra-som: o dedo colocado sobre uma plataforma de vidro e uma varredura de

ultra-som efetuada;

b) baseados em chip: o usurio coloca seu dedo direto em um chip de silcio.

Hong (1998, p. 15) e Bressan (2002, p. 9) destacam que um problema ligado ao AFIS

encontra-se na sua aceitabilidade pelo usurio civil, porque IDs tm sido associadas a

investigaes criminais e trabalho policial, fazendo com que estes usurios se sintam

desconfortveis, e tambm que a tecnologia requer uma grande quantidade de recursos

computacionais alm de que uma pequena parte da populao no possibilite a identificao

pelas IDs devido a razes genticas, de idade, de ambiente ou ocupacionais como as

estudadas pela datiloscopia clnica.

28

0.0 PROCESSAMENTO DE IMAGENS

O sentido da viso pode ser considerado o meio mais eficiente que os seres humanos

dispem para captar informaes do ambiente que os cerca. Prova disso a necessidade

crescente de automatizar algumas atividades de nosso cotidiano e que pode ser considerada

umas das responsveis pelo grande crescimento das ferramentas de processamento de

imagens. Estas ferramentas podem realizar tarefas que variam desde um simples

aprimoramento de uma imagem at a compreenso de mecanismos complexos (FACON,

1993, p. 6).

A rea de Processamento Digital de Imagens teve incio em meados da dcada de 60,

com a motivao criada pelos programas espaciais da NASA nos EUA. O aumento da

capacidade de memria e velocidade dos computadores contribuiu para dar impulso nova

tecnologia, que passou a ser aplicada em outras reas como: medicina, microscopia, tica

eletrnica, transmisso digital de sinais de TV ou fac-smile e em sensores visuais de robs.

Em 1975, a inveno do tomgrafo computadorizado por G. N. Hounsfield, abriu amplas

perspectivas de utilizao das tcnicas digitais de imagens radiogrficas (OSRIO, 1991, p.

24).

0.0.0 Imagem Digital

Imagens digitais podem ser definidas como sendo representaes digitais de imagens

capturadas do mundo real, atravs de sensores. Segundo Gonzalez e Woods (1992, p. 7), para

esta captura, so necessrios dois elementos. O primeiro um dispositivo fsico que seja

sensvel a uma banda de espectro de energia eletromagntica, tais como raios-X, ultravioleta,

banda visvel ou banda infravermelha, e que produza um sinal eltrico de sada proporcional a

um nvel de energia percebida. O segundo chamado de digitalizador, que um dispositivo

que converta a sada eltrica para forma digital.

Segundo Gonzalez e Woods (1992, p. 5), uma imagem digital pode ser considerada

como sendo uma matriz cujos ndices de linhas e colunas identificam um ponto da imagem, e

o correspondente valor do elemento da matriz identifica o nvel de cor naquele ponto. Cada

elemento dessa matriz chamado de elemento da imagem ou elemento da figura, originrios

do ingls pixel ou pels que so abreviaes de picture elements.

29

A qualidade das imagens capturadas e exibidas definida pelo dpi, do ingls dots per

inch ou pontos por polegada. O dpi trata da medio da quantidade de pontos em uma imagem

digital por polegada, ou seja, quanto mais pixels a imagem apresentar por polegada, melhor

ser sua qualidade e definio (GUMZ, 2002, p. 20).

A dimenso de uma imagem digital, poder ser unidimensional (1D = varivel),

bidimensional (2D = ponto), tridimensional (3D = ponto no espao), quadrimensional

(4D=ponto no espao tempo) ou at N-dimensional. As dimenses superiores a 2D so mais

utilizadas para visualizao cientfica (GUMZ, 2002, p. 21).

0.0.0.0 Definio de Cores

Quanto a colorao, as imagens podem ser classificadas em dois grupos:

monocromticas e coloridas. As monocromticas so imagens binrias, e apresentam somente

duas cores, preto ou branco. As imagens coloridas podem ser representadas atravs de vrios

modelos, a saber: RGB (Red Green Blue), CMY (Cyan Magenta Yellow), HSI, RYB, YIQ,

etc (BROWN; SHEPHERD, 1995, p. 106).

O sistema mais usado em monitores de vdeo coloridos o RGB. No modelo RGB

cada cor aparece nos seus componentes espectrais primrios de vermelho verde e azul.

Imagens no modelo RGB consistem em trs planos de imagens independentes, um para cada

cor primria (GONZALEZ; WOODS, 1992, p. 160).

O ser humano possui em seu sistema visual trs tipos de sensores capazes de

identificar trs faixas diferentes de espectros de energia. Estas faixas correspondem as

tonalidades de Vermelho (Red), Verde (Green) e Azul (Blue). Logo o ser humano v na

realidade a combinao resultante da mistura destas trs cores bsicas. Atravs de testes

realizados com o ser humano chegou-se a concluso que a utilizao de 256 variaes

diferentes de intensidade em cada uma das cores bsicas capaz de gerar um nmero de cores

superior a capacidade visual do ser humano, ou seja, fica praticamente impossvel distinguir

entre duas cores vizinhas (CASACURTA et al, 1998, p. 9-10).

Segundo Casacurta et. al. (1998, p. 10), no sistema RGB, o valor (0, 0, 0) equivale a

cor preta com intensidade zero nas trs componentes. O valor (255, 255, 255) equivale a cor

branca onde as trs componentes esto presentes com a sua intensidade mxima. As diferentes

30

combinaes entre RGB sero capazes de gerar qualquer tipo de cor, sendo que se as trs

componentes tiverem sempre valores iguais ser definida uma escala de tons de cinza do preto

ao branco, a chamada gray scale.

0.0.0.0 Formato de Imagens

Existem diferentes formatos de arquivos para o armazenamento de imagens, uma vez

que se tm vrias classes diferentes de representaes de imagens. O armazenamento da

imagem envolve basicamente trs elementos principais: a forma como a imagem est

representada, o tipo de compactao empregado e o cabealho contendo as informaes a

cerca desta imagem (resoluo, nmero de cores, classe da imagem, palette, compactao,

etc). Um mesmo tipo de arquivo pode inclusive permitir o armazenamento de diferentes

classes de imagens e tambm permitir a utilizao de vrios mtodos de compactao

(CASACURTA et al, 1998, p. 14).

Segundo Facon (1993, p. 28), quanto maior o nmero de aplicaes em que uma

imagem digital pode ser tratada, diz-se que maior a sua padronizao. Normalmente

programas grficos podem ser classificados pela forma com a qual armazenam e apresentam

as imagens. Para esta abordagem h duas categorias: formato de varredura e formato vetorial.

Entre os formatos de imagens digitais mais utilizados esto: BMP, JPG, GIF, TIFF, PCX,

CGM, ICO, RLE, TARGA, PostScript, entre outros (BROWN; SHEPHERD, 1998, p. 73).

0.0.0 Tcnicas de Processamento de Imagens

Segundo Gonzalez e Woods (1992, p. 11), o processamento de imagens digitais

geralmente expresso de forma algortmica e implementado em software, que uma vez

aplicados a uma imagem geram um aprimoramento ou correo da mesma, no que diz

respeito a eliminao de rudos, realce de imagem, restaurao de regies da imagem, etc.

Este processo normalmente direcionado para uma soluo, deste modo tcnicas que

funcionam em um problema, podem se mostrar totalmente inadequadas para outro problema.

Entre tcnicas de processamento de imagens podem ser citadas algumas tcnicas como

a de restaurao que busca compensar distores especficas, normalmente geradas no

momento de aquisio. Quando se pode identificar experimentalmente a funo que

representa a deformao ou construir um modelo matemtico adequado, possvel buscar a

31

funo inversa e aplic-la sobre a imagem deformada. Em aplicaes como: correo de foco,

Imagens borradas por movimento. J a Segmentao procura isolar regies de pixels, e aplicar

operaes para extrao de atributos. A operao de segmentao mais comum a

limiarizao por um tom de corte. Tudo que est acima deste tom vira branco, tudo que est

abaixo vira preto, obtendo-se uma imagem binria (SCURI, 1999, p. 55).

Gumz (2002, p. 22), detalha alguns filtros conhecidos, sendo eles, filtro de mdia

(mean filter), filtro da mediana (median filter), filtro mnimo-mximo, suavizao controlada

por gradiente, suavizao gaussiana (gaussian smoothing), suavizao conservativa

(conservative smoothing), remoo de manchas Crimmins (Crimmins speckle removal), filtros

de freqncia passa-baixa (low-pass) e passa-alta (high-pass), laplacian of gaussian filter e

unsharp filter.

0.0 REDES NEURAIS

Silva (1999, p. 16) comenta que o crebro humano o dispositivo mais complexo

conhecido pelo Homem, e que a capacidade de pensar, memorizar e resolver problemas tem

conduzido muitos cientistas a tentar modelar sua operao. Diversos pesquisadores tm

buscado criar modelos computacionais que representam a funcionalidade do crebro. Um

destes modelos resultou na criao das Redes Neurais Artificiais (RNA).

0.0.0 Sistema Nervoso e Neurnio Biolgico

O crebro uma das partes do sistema nervoso que prov uma grande quantidade de

controle sobre as funes do corpo. Nele existem dois tipos de clulas: as glias, responsveis

pelo suporte e nutrio e os neurnios que so as clulas especializadas na atividade nervosa

(LOESCH, 1996, p. 8). Tafner, Xerez e Rodrigues Filho (1996, p. 32) afirmam que o crebro

possui cerca de 10 bilhes de neurnios, e que cada neurnio capaz de ter at 10.000

conexes com outros neurnios ou at mesmo com partes do prprio neurnio.

32

O neurnio biolgico possui um corpo e diversas ramificaes, que so chamadas de

dendritos, que por sua vez conduzem sinais de entrada do neurnio para o corpo da clula. A

partir do corpo da clula surge um filamento comprido denominado axnio, na extremidade

deste filamento existem micro-ramificaes, denominados terminais dos neurnios, que tm

por objetivo transmitir um sinal do corpo para outra extremidade do neurnio. Os terminais

dos neurnios so conectados aos dendrites de outros neurnios, cuja conexo d-se o nome

de sinapse (LOESCH, 1996, p. 8). Na Figura 5, feita uma representao de um neurnio

biolgico.

Fonte: Osrio e Bittencourt (2000, p. 8). Figura 5 Representao de um neurnio biolgico.

Segundo Loesch (1996, p. 9) e Silva (1999, p. 17), os estmulos entram nos neurnios

atravs das sinapses de outros neurnios, conectadas aos dendrites deste primeiro, e quando

chegam ao corpo da clula, ocorre um processo de integrao (soma), deste estmulos. Ao

resultado desta soma pode ser gerado um impulso eltrico que comea no axnio e se propaga

para todas as sinapses. O processo de controle da produo destes impulsos eltricos se d

normalmente atravs de uma funo de limiar que produz uma sada, caso esta soma supere

este limiar.

33

0.0.0 Redes Neurais Artificiais

Segundo Loesch (1996, p. 15), a histria das redes neurais artificiais recente, com

pouco mais de meio sculo de estudos. Estes iniciaram por volta de 1940, quando as primeiras

simulaes foram feitas com papel e lpis por Donald Hebb e Karl Laschey. Seguidos por

McCulloch e Pitts que propuseram uma modelagem matemtica para os neurnios biolgicos

atravs dos fatos que: neurnios comportam-se como somadores algbricos; adicionam

entradas excitatrias ou subtraem entradas inibitrias; neurnios possuem uma propriedade de

limiar, entre outras.

Loesch (1996, p. 5) define as RNAs como sendo sistemas computacionais de

implementao em software ou hardware, que imitam as habilidades dos neurnios

biolgicos, usando para isto um grande nmero de neurnios artificiais interconectados. Os

benefcios obtidos pela utilizao de uma RNA se do graas a sua massiva estrutura

distribuda e paralela, e sua habilidade de aprender e generalizar sadas de entradas que no

estavam amostradas durante o seu treinamento. Estes benefcios permitem que ela resolva

problemas complexos (HAYKIN, 2001, p. 4).

Existem vrios tipos de RNA, onde os mais conhecidos so ADALINE/MADALINE,

Backpropagation Perceptron (ou feedforward), Time-Delay, Recurrent, BAM (Memria

Associativa Bidirecional), Hofield e Kohonen (LOESCH, 1996, p. 46). As RNA podem ser

algumas vezes superiores a outros mtodos porque os dados sobre os quais se efetuam

concluses so confusos, caticos e inconsistentes (MASTERS, 1993, p. 6-7).

Uma RNA pode ser auto-associativa ou hetero-associativa. O mapeamento de entrada,

ou auto-associao, permite a uma RNA ser treinada para correlacionar um padro com ele

mesmo. E o mapeamento de sada, ou hetero-associao, associa um padro treinado com

outro. Elas podem tambm aproximar funes j que a partir de uma entrada produzem uma

sada o que os qualifica como uma funo (MASTERS, 1993, p. 24, 68).

Gumz (2002, p. 24) comenta que, para que as RNAs possam resolver os problemas

para o qual foram projetadas, as mesmas devem ser treinadas. Toda o desempenho da RNA

est ligado ao processo de treino que deve adaptar seus pesos e sinais de sada de acordo com

os objetivos finais. O processo de treino envolve ajustar os pesos das conexes entre os

34

neurnios (ajuste sinptico) e configurar os valores de sada para cada caso verificando a

quantidade de erro apontado por um clculo sobre o valor de sada do neurnio.

0.0.0.0 Neurnio Artificial

Em Tafner, Xerez e Rodrigues Filho (1996, p. 56), encontram-se outros nomes para os

neurnios artificiais, como Elemento de Processamento ou Nodo. Segundo o autor todo

neurnio artificial tem um funcionamento muito parecido com o neurnio biolgico, uma vez

que todo neurnio artificial possui um ou mais sinais de entrada, e apenas um sinal de sada.

Estas entradas dos neurnios artificiais podem ser comparadas aos estmulos recebidos pelo

neurnio biolgico.

Um importante atributo dos neurnios artificiais so os pesos associados ao mesmo. Os

pesos (weight) so valores que representam o grau de importncia que uma determinada

entrada possui em relao ao neurnio. Sempre que as entradas so apresentadas ao neurnio,

elas so multiplicadas pelos valores dos pesos, os resultados destas multiplicaes so

somados e apresentados a uma funo de ativao (TAFNER; XEREZ; RODRIGUES

FILHO, 1996, p. 56-58). O neurnio ativado se, e somente se, o resultado da funo de

ativao alcanar um valor estipulado, chamado de limiar. Pode existir tambm um valor de

entrada adicional, o vis ou bias, que determinado no treinamento, com o objetivo principal

de modificar o valor de limiar da funo de ativao (LOESCH, 1996, p. 20).

Resumindo, um neurnio formado por um conjunto de sinapses que contm os pesos,

um somador para calcular os sinais de entrada multiplicados aos pesos (soma ponderada), e

uma funo de ativao para limitar a amplitude do sinal de sada para um valor numrico

finito (HAYKIN, 2001, p. 36). A Figura 6 ilustra um neurnio artificial, onde os sinais de

entrada x1..xj podem ser sadas de outros neurnios; as variveis wj1..wjp armazenam os valores

dos pesos sinpticos diretamente responsveis pela sada esperada do neurnio aps somatrio

ponderado; o valor wj0 o vis que ser somado a redej; redej o resultado da soma

ponderada da entrada; a funo de ativao f(redej) a responsvel pela ativao com a

resposta da RNA sobre dada entrada se alcanado o valor de limiar l j o qual impe os valores

limites mximos e mnimos que resultar numa sada yj.

35

Fonte: Adaptado de Haykin (2001, p. 36). Figura 6 Representao do funcionamento de um neurnio artificial.

Segundo Masters (1993, p. 79-82), a sada do neurnio calculada como:

redej= (wj0 +=

n

i 1

xi*w ji) (2-2)

aplicada em

sada=f(redej) (2-3)

Onde os pesos wji so primariamente responsveis pelas caractersticas operacionais da

rede, pela j conhecida soma ponderada com as entradas xi. A funo de ativao f(redej)

calcula o valor da sada do somatrio ponderado de entradas da redej e, wj0 o valor do vis.

Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 63), os neurnios artificiais sempre

so dispostos em camadas, toda rede neural apresenta uma camada de entrada e uma camada

de sada. Algumas RNA podem apresentar camadas intermedirias ou ocultas como so

chamadas, estas sempre se situam entre a camada de entrada e a camada de sada e no tm

contato com o mundo externo. As camadas de entradas apenas recebem os valores de entradas

e repassam para as camadas seguintes, as camadas seguintes sendo ocultas ou de sada que

realizam o processamento da rede.

As ligaes entre os neurnios das RNA podem ter diferentes fluxos, sendo feedback

(realimentao), quando o sinal de sada de um neurnio servir de entrada para um outro, ou

36

para o mesmo neurnio, ou feedforward quando o fluxo seguir apenas em uma direo. Na

Figura 7, apresenta-se os dois tipos de fluxo.

Fonte: Gumz (2002, p. 27). Figura 7 Representao dos Fluxos das RNA.

0.0.0.0 Rede Neural Artificial Feedforward Multicamada

Loesch (1996, p. 67) afirma que as RNA feedforward multicamadas (RNA-FM), ou

MLP (Multi Layer Perceptron - Perceptrons de mltiplas camadas) como tambm so

chamadas, so as mais utilizadas e difundidas dentre as RNAs. As MLP so uma extenso dos

primeiros Perceptrons, tambm so hetero-associativas e podem possuir uma ou mais

camadas ocultas, porm possuem capacidades muito mais potentes e genricas que seu

primeiro modelo. Segundo Welstead (1994, p. 59) estas so as RNAs mais utilizadas, onde

estimativas apontam para 90% de todas as aplicaes de RNA implementadas.

Numa RNA feedforward todos os neurnios de uma determinada camada so

plenamente conectados aos neurnios da camada seguinte. Na Figura 7, no lado esquerdo

tem-se uma RNA-FM, com uma camada de entrada, uma camada oculta e uma camada de

sada. As RNA-FM podem apresentar mais de uma camada oculta, mas conhecido que uma

camada suficiente para resolver problemas determinsticos (MASTERS, 1993, p. 79). A

camada oculta alm de no ter contato com o mundo externo tem a funo de mediar a

entrada externa e a sada da rede (HAYKIN, 2001, p. 19).

Haykin (2001, p. 183) enfatiza que este modelo de RNA tm sido aplicado com

sucesso para resolver problemas difceis atravs do seu treinamento supervisionado com um

37

algoritmo muito conhecido como algoritmo de retropropagao de erro (backpropagation).

Normalmente uma RNA-FM consegue aprender uma funo ensinada. Se esta apresentar

problemas, no devido ao modelo em si, mas por um treinamento insuficiente, nmero

pequeno de neurnios na camada oculta ou tentativa de aprender uma funo que no

determinstica (MASTERS, 1993, p. 87).

Segundo Loesch (1996, p. 77), apesar de muitas aplicaes bem sucedidas,

inconvenientes podem ocorrer durante o processo de treinamento, onde problemas complexos

podem requerer dias e at semanas para que a RNA aprenda. Mesmo com todo este tempo de

treinamento um RNA pode no aprender todos os pares de treinamento que lhes foram

apresentados.

0.0.0.0 Funes de Ativao

A funo de ativao de um neurnio uma funo no-linear que quando aplicada as

entradas de um neurnio determina a sada do mesmo. As faixas de valores de algumas

funes so limitadas de 0 a 1 enquanto outras de 1 a +1. As funes de ativao mais

usadas so a funo sigmide binria, a funo sigmide bipolar, a funo tangente

hiperblica e a funo arco-tangente escalar (GUMZ, 2002, p. 39).

A maioria dos modelos de RNA-FM usam a funo de ativao logstica sigmide

binria (formato de S), que representada na Figura 8. Ela pode ser definida como uma

funo real cujo domnio so os nmeros reais, a derivada sempre positiva e a faixa de

valores limitada (MASTERS, 1993, p. 81). A funo de ativao logstica sigmide d-se

por:

f(x)=1/(1 + e-x) (2-4)

cuja derivada

f(x) = f(x)*(1- f(x)) (2-5)

38

onde o valor mximo usado + 1,0 e o valor mnimo 0,0. Lembrando sempre que as

funes sigmides nunca alcanam seus tericos mnimo e mximo, geralmente os neurnios

so considerados totalmente ativados por volta de 0,9 e desativados por volta de 0,1. Onde se

pode dar como entrada numa rede os valores extremos de 1,0 e 0,0; mas nunca tentar treinar a

rede para alcan-los. Em muitos casos tm-se verificado que a forma exata da funo tem

pouco efeito no poder final da rede, embora possa ter impacto significante na velocidade de

treino (MASTERS, 1993, p. 81).

Fonte: Masters (1993, p. 81).

Figura 8 Funo logstica de ativao sigmide binria.

0.0.0.0 Treinamento e Aprendizado

Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 65), o treinamento das RNAs

acontece basicamente de duas formas, sendo por aprendizado supervisionado e aprendizado

no-supervisionado. No aprendizado supervisionado so apresentados a RNA pares de entrada

e sada, ou seja, um conjunto de entradas e um conjunto de sadas desejadas para cada entrada.

J no aprendizado no-supervisionado no existem sadas desejadas, para o treinamento da

rede so usados apenas os valores de entradas, e atravs destes valores que a rede se

organiza de modo a classificar as entradas.

A maioria das aplicaes das RNAs so treinadas atravs do aprendizado

supervisionado, onde o objetivo principal de treinar uma rede ajustar seus pesos de tal forma

que para um vetor de entrada produza-se um vetor desejado de sada, onde para cada entrada

amostrada, emparelha-se uma sada (LOESCH, 1996, p. 71).

39

0.0.0.0.0 Aprendizado por Retropropagao (backpropagation)

O mtodo de treino por retropropagao, ou backpropagation, foi o primeiro mtodo

de treino para a RNA-FM. Este mtodo consiste basicamente de duas etapas executadas

atravs das camadas da rede: um passo para frente a propagao e um passo para trs, a

retropropagao. Na sua forma bsica, a retropropagao chamada por analistas numricos

de algoritmo de inclinao de gradiente, que determina a direo de um passo de clculo.

Na propagao um vetor de entrada aplicado aos pesos da rede e seu efeito

propagado para frente camada por camada at a camada de sada, produzindo um conjunto de

valores de sadas como resposta da rede. Aps verificado se a resposta desejada da rede era

igual a esperada de acordo com o vetor de sada, caso no seja calculado um erro e este

retropropagado para correo de todos os pesos da rede (HAYKIN, 2001, p. 184). Este ajuste

dos pesos executado de acordo com uma taxa de aprendizado, em que se for muito pequena

ir convergir muito devagar e se for muito grande, ir saltar e nunca ir convergir

(MASTERS, 1993, p. 100).

Primeiramente o treino comea com todos os pesos da RNA iniciados com pequenos

valores no-zero, freqentemente gerados randomicamente ou por algoritmos especficos

como o fortalecimento simulado (simulated annealing). Ento pares de treinamento da

coleo de amostras so apresentados a rede, um de cada vez (MASTERS, 1993, p.111). Uma

medida do erro feita pela rede, atravs da comparao de seus valores de sadas, aps

calculado um valor que ir auxiliar na correo dos pesos da rede, designado como delta4, e

por ltimo os pesos da rede so atualizados de um modo a reduzir o erro. Todo este processo

de apresentar as entradas RNA, calcular as ativaes das camadas, calcular os valores dos

deltas e o erro, chamado de epoch. As medidas de erro mais conhecidas so: erro quadrado

mdio (mean square error), erro absoluto mdio (mean absolut error), erro de Kalman-

Kwasny, entropia cruzada (cross entropy), erro mximo quadrado (maximum squared error),

mean log error, alm de outros (MASTERS, 1993, p. 40-49).

A medida mais comum do erro dada pelo erro quadrado mdio ou EQM, nas

ativaes de sada. A correta ativao alvo do neurnio de sada j designada como dj, e a

4 importate salientar que quando houver referncia ao termo delta, o mesmo pode significar um ponto caractersitico da ID, ou o valor utilizado no algoritmo de aprendizado da rede. Para tanto deve-se analisar o contexto em que o termo encontra-se.

40

ativao observada yj. Se existirem n neurnios de sada, o erro para a simples apresentao

= =

n

j 1

(dj - yj)2 (2-6)

A frmula para calcular o delta dos neurnios difere entre a camada de sada e as

camadas ocultas. Para simplificar o clculo pode-se dividir as frmulas sendo o clculo do

erro da frmula 2-7 para a camada de sada e 2-8 para as camadas ocultas.

j(k) = dj - yj (2-7)

j(k) =+

=

1

1

Nk

i

(i(k+1)* wij (k+1)) (2-8)

Aplicando as frmulas 2-7 e 2-8 na frmula 2-9 tem-se o clculo do valor do delta na

camada k.

j(k) = j(k) * f(redej) (2-9)

Onde k o nmero da camada atual; j(k) o valor do delta calculado na camada k; wij

o peso que conecta o neurnio j desta camada oculta com o neurnio i da camada anterior.

importante lembrar que na frmula 2-8 o i(k+1) refere-se ao valor do delta calculado na

camada seguinte e que utilizado para o clculo do delta da camada atual.

Aps realizar todo este clculo realizado o ajuste de todos os pesos da RNA,

conforme a frmula 4-5.

wj(k) = wj

(k) + 2j(k)*xj(k) (2-10)

Onde wj(k) o peso a ser ajustado do neurnio j na camada k; o valor da taxa de

aprendizado; j(k) o valor do delta calculado na camada k; e o xj(k) o valor de entrada do

neurnio j na camada k (LOESCH, 1996, p. XX).

41

2.4.2.5 Escolha da Estrutura das Redes

Normalmente a quantidade de neurnios existentes tanto na camada de entrada como

na camada de sada determinado pelo tipo de problema a ser resolvido, j a quantidade de

neurnios na camada oculta podem variar consideravelmente. O neurnio na camada oculta

ser associado ao acrnimo NO de agora em diante.

Uma soluo inicial para a quantidade de NOs de uma RNA dada na frmula (2-11).

O = nm* (2-11)

Onde m a quantidade de neurnios de sada e n a de entrada e O a quantidade de

NOs.

Aps ser treinada e testada, a RNA pode no apresentar resultados satisfatrios, isto

pode ocorrer devido a existncia de muitos NOs ocasionando o superajustamento.

Recomenda-se iniciar o treino com poucos neurnios artificiais nesta camada (GUMZ, 2002,

p. 44).

2.5 CONTEXTO ATUAL DO TRABALHO

Analisando-se os trabalhos de Costa (2000), Hong (1998), Gumz (2002) entre outros

verificou-se que, muitos sistemas biomtricos que utilizam o reconhecimento atravs das IDs

usam como base um fator importantssimo que so as comparaes das mincias. Mas poucos

trabalhos, pelo que se tem conhecimento, utilizam outras tcnicas, como por exemplo a

comparao entre as distncia do(s) delta(s) e do ncleo.

2.5.1 Trabalhos Correlatos

Os trabalhos correlatos encontrados foram os trabalhos de:

a) Hong (1998). Este o trabalho mais completo, onde apresentou-se um estudo

detalhado sobre os passos da construo de um AFIS: aquisio de ID, pr-

processamento, mapa de direes, classificao e extrao de mincias.

b) Silva (1999). Foi desenvolvido um prottipo para classificao de ID nos tipos

fundamentais: arco, presilha interna, presilha externa e verticilo. Para tanto o autor

42

tambm utilizou a construo de mapa de direes. No prottipo foi utilizada uma

RNA perceptron feedforward treinada por retropropagao.

b) Costa (2000). Foram apresentadas frmulas para pr-processamento de IIDs,

conceitos e algumas tcnicas para classificao e extrao de mincias. Efetuou-se

apenas concluses sobre o mapa de direes das cristas papilares.

b) Pankanti (2000). Comentou vrios mtodos de identificao biomtrica existentes,

dando destaque especial ao AFIS, realizando a comparao entre os mesmos.

b) Gumz (2002). Foi desenvolvido um prottipo para identificao e classificao das

mincias de uma ID. O trabalho bem detalhado e mostra passo a passo o estudo

realizado.

b) Reis (2003). Neste trabalho apresentada uma soluo para deteco das mincias

e um clculo para o encontro do ncleo de uma ID.

Todos os trabalhos relatam com bastante coerncia o estudo/desenvolvimento de seus

trabalhos. Em especial nos trabalho de concluso de curso de Alex Sandro da Silva e Rafael

Arajo Gumz foram sugeridos como extenso a identificao automtica do(s) delta(s) e

ncleo das ID.

43

0 DESENVOLVIMENTO DO PROTTIPO

Nas prximas sees sero apresentados os requisitos do prottipo, uma viso geral da

soluo proposta bem como o desenvolvimento do prottipo.

0.0 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO

O prottipo do sistema deve atender aos seguintes requisitos:

c) criar, treinar,validar e executar a RNA5;

c) possibilitar o treinamento manual ou automtico da RNA atravs de fragmentos de

imagens;

c) possibilitar salvar os pesos da RNA aps o seu treinamento;

c) possibilitar carregar os pesos da RNA para a continuao de um treinamento;

c) possibilitar a validao manual ou automtica da RNA atravs de fragmentos de

imagens;

c) possibilitar o cadastramento de usurios juntamente com sua IID;

c) possibilitar carregar uma IID para comparao com as demais IIDs j cadastradas;

0.0 VISO GERAL

Antes da seo de especificao, se faz necessria uma abordagem prvia de como ser

o funcionamento geral do prottipo para que o leitor possa conhecer alguns conceitos

necessrios para as prximas sees.

Inicialmente o prottipo deve permitir que o especialista treine a RNA passando como

entrada para a rede um vetor que ser gerado com base nos fragmentos de imagens de

tamanho 20x20 pixels. Estas imagens sero de regies dos deltas, regies do ncleo e

regies quaisquer, conforme apresentado na Figura 9. Este treinamento como j citado na

seo 3.1, poder ocorrer de forma automtica ou manual. Uma vez que a RNA esteja

treinada sero gravados os pesos da mesma e a partir de ento o usurio do prottipo poder

iniciar o cadastramento de usurios bem como executar a opo comparao das IDs.

5 O termo RNA ser utilizado a partir de agora para representar a RNA-FM, pois esta ser a nica rede implementada no prottipo.

44

Figura 9 Exemplo de regies da IID passadas como entrada para a RNA.

Ao realizar o cadastramento de um novo usurio com sua respectiva IID, o sistema ir

armazenar algumas informaes importantes derivadas da IID, para a extrao destas

caractersticas foi utilizada uma heurstica que de agora em diante iremos chamar de

heurstica do clculo da distncia. Atravs desta heurstica que o prottipo ir identificar

se uma IID igual a outra ou no. Para que se possa explicar o funcionamento desta heurstica

fazem-se necessrias algumas definies. Uma definio inicial apresentada na Figura 10,

onde dividiu-se uma IID em 5 regies, chamados de agora em diante de quadrantes.

Figura 10 Definio da diviso de quadrantes numa IID.

A idia inicial da heurstica do clculo da distncia de varrer os quadrantes 3, 4

para obter as posies dos deltas bem como o quadrante 5 para obter a posio do ncleo.

Esta varredura consistir em passar fragmentos de imagens 20x20 para validao da RNA de

todo o espao dos quadrantes incrementando-se as linhas e colunas dos mesmos. Quando for

encontrado o delta no quadrante 3 e 4, ou um ncleo no quadrante 5 deve-se guardar a posio

45

e interromper a varredura no quadrante atual. importante lembrar que uma vez que a RNA

esteja bem treinada a mesma ir encontrar obrigatoriamente um ou nenhum delta nos

quadrantes 3 e 4, e um ncleo no quadrante 5. Caso isto no ocorra pode-se constatar que a

IID est com pouca nitidez, ou que a RNA ainda se encontra com um desempenho

insatisfatrio.

Uma vez com as posies encontradas do(s) delta(s) e ncleo atravs das coordenadas

iniciais do fragmento 20x20, ir se utilizar das coordenadas (x,y) das regies para se calcular

a distncia entre delta(s) e ncleo, ou at entre os prprios deltas. No caso da ID ser uma

presilha externa ou presilha interna apenas ser traada uma distncia como pode ser

visualizado na Figura 11 pelo valor A, em contrapartida quando a ID for um verticilo poder

se ter uma maior exatido, pois podero ser calculadas 3 distncias para a comparao, entre

cada um dos dois deltas e o ncleo e entre os prprios deltas, conforme a Figura 11, para os

valores A, B e C. Quando a ID for um arco, no poder se calcular nenhuma distncia, ou

seja, esta heurstica apenas funcionar para 3 dos 4 tipos fundamentais.

Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID.

0.0 ESPECIFICAO

A especificao do prottipo ser apresentada atravs dos diagramas de casos de uso

primrio e secundrio, e do diagrama de classe. Os diagramas apresentados seguiro a notao

da UML. Assim como as classes implementadas no prottipo seguiro os conceitos de

46

orientao a objetos. Todos os desenhos dos diagramas foram realizamos na ferramenta

Rational Rose 2002 verso demo da Rational Rose Corporation. Maiores informaes sobre a

ferramenta pode ser obtidas no site Rational (2002).

0.0.0 Casos de Uso

Os casos de uso primrios e secundrio, mostrados do uma idia dos processos

envolvidos no prottipo, conforme mostrados nas Figuras 12, 13 e 14.

Figura 12 Diagrama de caso de uso primrio do ator Especialista.

Figura 13 Diagrama de caso de uso primrio do ator Usurio.

47

Figura 14 Diagrama de caso de uso secundrio do ator Usurio.

0.0.0 Diagramas de Classes

Na Figura 15 apresentado o diagrama de classes do prottipo, onde podem ser

visualizadas as 3 classes existentes no mesmo, sendo elas: Integrao, RedeNeural e Usurio.

A classe Integrao a classe que contempla todos os mtodos que iro comunicar-se com as

outras duas classes. Um exemplo destes mtodos pode ser o mtodo de converso de um

fragmento de imagem 20x20 pixels para os dados de entrada da Rede Neural. A classe

Usurio comunica-se com a classe Integrao pois junto com o cadastramento do usurio e

sua digital, j so gravados os valores das distncias calculados atravs do mtodo da

heurstica do clculo da distncia. E por fim a classe RedeNeural contempla todos os

mtodos referentes ao treinamento e validao da rede. Como j citado qualquer mtodo que

deva auxiliar a rede, mas no faz parte do seu treinamento e validao foi encapsulado na

classe Integrao.

Figura 15 Diagrama de Classes do prottipo.

48

Por no ser o foco principal do prottipo o cadastramento do usurio, apenas ser

detalhada a seguir a classe da Integrao e RedeNeural.

0.0.0 Integrao

A classe Integrao uma classe mediadora entre as classes Usurio e RedeNeural,

nesta classe esto presentes todos os mtodos necessrios para o funcionamento do prottipo,

mas que no poderiam fazer parte de nenhuma das outras duas classes. Como o prprio nome

j diz, uma classe que integra as demais classes servindo de ponte para a troca de

mensagem entre elas.

Segue uma explicao dos principais atributos desta classe:

c) wAltFragImg: Altura do fragmento das imagens a serem convertidos nos dados de

entrada da RNA, utilizado 20 pixels.

c) wLarFragImg: Largura do fragmento das imagens a serem convertidos nos dados

de entrada da RNA, utilizado 20 pixels.

Seguem os principais mtodos desta classe:

c) pConverteBitMapParaVetorEntrada: este o mtodo que converte um fragmento

de imagem 20x20 pixels para os dados que serviro de entrada para a RNA;

c) pCarregaMatrizPesos: mtodo que carrega a matriz de pesos do arquivo para a

memria;

c) pRetornaDistanciasDigital: mtodo que calcula as distncias entre os pontos

caractersticos das IIDs.

0.0.0 Classe da Rede Neural

Na classe RedeNeural a maioria dos atributos so privados, com exceo dos vetores

de pesos da RNA que so acessados por vrios pontos do sistema. Na classe tambm

encontram-se alguns mtodos privados que so os de manipulao interna da classe e outros

pblicos que so chamados de alguns pontos fora da classe.

Importante destacar dois tipos de dados muito importantes para a classe da Rede

Neural, so eles os tipo: TArray1D e TArray2D. Estes tipos de dados como mostrados a

49

seguir, so tipos de arrays (vetores) dinmicos, que podem ter seu tamanho alterado em

tempo de execuo, so eles:

a) TArray1D = Array of Double: tipo usado para definir arrays dinmicos de uma

dimenso (1D) do tipo Double. O Double representa nmeros reais com ponto

flutuante ocupa 8 bits de espao em memria

b) TArray2D = Array of Array of Double: tipo usado para definir arrays dinmicos

de duas dimenses (2D) do tipo Double.

Segue uma explicao dos principais atributos da classe RedeNeural:

a) wNeuroniosEntrada: quantidade de neurnios da camada de entrada;

b) wNeuroniosOculta: quantidade de neurnios da camada oculta;

c) wNeuroniosSaida: quantidade de neurnios da camada de sada;

d) wTaxaAprendizado: valor da taxa de aprendizado utilizada durante a correo dos

pesos da RNA;

e) wToleranciaErro: valor da tolerncia de erro a qual ir indicar se a RNA aprendeu

ou no;

f) wMaxIteracoes: valor mximo de iteraes a qual a RNA ser submetida. Espera-

se que a rede sempre convirja antes deste valor;

g) wVetPesosOculta: vetor que ir guardar os valores dos pesos entre os neurnios da

camada de entrada e camada oculta;

h) wVetPesosSaida: vetor que ir guardar os valores dos pesos entre os neurnios da

camada oculta e camada de sada;

i) wVetAtivacoesOculta: vetor que guarda os valores de ativaes de todos os

neurnios da camada oculta, ativados durante o processo de propagao;

j) wVetAtivacoesSaida: vetor que guarda os valores de ativaes de todos os

neurnios da camada de sada, ativados durante o processo de propagao;

k) wVetDeltaSaida: vetor que guarda os valores dos deltas de cada neurnio,

calculados na camada de sada;

l) wVetDeltaOculta: vetor que guarda os valores dos deltas de cada neurnio,

calculados na camada oculta;

Segue uma explicao dos principais mtodos da classe RedeNeural:

a) pRandomizaPesos: mtodo que randomiza os pesos da RNA com valores prximos

a zero para a inicializao do treinamento;

50

b) pTreinaRNABackPropagation: mtodo principal de treinamento que chama os

demais mtodos para que a RNA seja treinada;

c) pAtivaNeuronios: mtodo que ativa os neurnios da camada oculta e camada de

sada. Para tanto so utilizados os valores de entrada e os valores dos vetores de

pesos;

c) pCalculaDeltaSaida: mtodo que calcula os valores dos deltas de todos os

neurnios da camada de sada;

c) pCalculaDeltaOculta: mtodo que calcula os valores dos delta de todos os

neurnios da camada oculta;

c) pAjustaPesos: mtodo que realiza o ajuste dos pesos nos vetores quando uma

determinada amostra gerou um erro acima da tolerncia de erro;

c) fFuncaoAtivacao: mtodo da funo sigmide binria, utilizada na ativao dos

neurnios;

c) fDerivadaFuncaoAtivacao: mtodo da derivada da funo sigmide binria,

utilizada para o clculo do delta dos neurnios da camada de sada e oculta;

c) fCalculaEQM: mtodo que calcula o erro quadrado mdio (EQM) de uma amostra

de treinamento;

c) fTestaRNA: mtodo que testa a RNA aps efetuado seu treinamento;

0.0.0 Estrutura da Rede

Inicialmente uma das preocupaes numa aplicao utilizando RNA deve ser com

relao a quantidade de camadas ocultas da rede e a quantidade de neurnios presentes tanto

na camada de entrada, quanto na(s) camada(s) oculta(s) e camada de sada. Sabe-se que se um

mesmo problema for dado a vrios projetistas de RNAs todos podem apresentar solues com

RNAs estruturadas de maneira completamente diferentes. Para a implementao do prottipo

definiu-se o uso de apenas uma camada oculta.

O nmero de neurnios utilizados na camada de entrada foi de 400, este valor a

representao de cada pixel dos fragmentos das IIDs de tamanho de 20x20 pixels. A

quantidade de neurnios na camada de sada ser igual a 1, que indicar atravs de faixas de

valores a regio dada na entrada da rede. E por ltimo, definiu-se a quantidade de neurnios

na camada seguindo a frmula (2-11) descrita a seo 2.4, onde O = 1*400 , totalizando 20

neurnios nesta camada.

51

Inicialmente se treinar a rede com 20 neurnios na camada oculta, caso esta rede

mostre pouco poder de generalizao, ir se seguir indicaes de alguns autores, onde dever

se aumentar ou diminuir esta quantidade de neurnios um a um at que se encontre um

melhor desempenho.

0.0.0 Parmetros de Treino

Os parmetros de treino so to importantes quanto a definio da quantidade de

neurnios presentes em cada camada. O algoritmo backpropagation implementado conta com

3 parmetros extremamente importantes sendo eles: quantidade mxima de iteraes, taxa de

aprendizagem e valor da tolerncia ao erro.

A quantidade mxima de iteraes o mais simples, ele um critrio de parada, onde

se o erro desejado no for alcanado usado para interromper o

Lofoscopia

Documents

Transcript of Lofoscopia