Lofoscopia
-
Upload
wailton-duarte -
Category
Documents
-
view
13 -
download
3
description
Transcript of Lofoscopia
-
UNIVERSIDADE REGIONAL DE BLUMENAU
CENTRO DE CINCIAS EXATAS E NATURAIS
CURSO DE CINCIAS DA COMPUTAO BACHARELADO
PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)
DELTA(S) E NCLEO EM IMPRESSES DIGITAIS
UTILIZANDO REDES NEURAIS ARTIFICIAIS.
CAIO RAFAEL SILVA MATIAS
BLUMENAU 2004
2004/2-09
-
CAIO RAFAEL SILVA MATIAS
PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)
DELTA(S) E NCLEO EM IMPRESSES DIGITAIS
UTILIZANDO REDES NEURAIS ARTIFICIAIS.
Trabalho de Concluso de Curso submetido Universidade Regional de Blumenau para a obteno dos crditos na disciplina. Trabalho de Concluso de Curso II do curso de Cincias da Computao Bacharelado.
Prof. Jomi Fred Hbner - Orientador
BLUMENAU 2004
2004/2-09
-
PROTTIPO DE UM SISTEMA DE IDENTIFICAO DO(S)
DELTA(S) E NCLEO EM IMPRESSES DIGITAIS
UTILIZANDO REDES NEURAIS ARTIFICIAIS.
Por
CAIO RAFAEL SILVA MATIAS
Trabalho aprovado para obteno dos crditos na disciplina de Trabalho de Concluso de Curso II, pela banca examinadora formada por:
______________________________________________________ Presidente: Prof., Jomi Fred Hbner Orientador, FURB
______________________________________________________ Membro: Prof. Mauro Marcelo Mattos, FURB
______________________________________________________ Membro: Prof. Paulo Csar Rodacki Gomes, FURB
Blumenau, 09 de Fevereiro de 2005.
-
Dedico este trabalho a toda a minha famlia em especial minha noiva, pessoas estas que me apoiaram durante toda a minha vida.
-
A mente que se abre a uma nova idia jamais volta ao seu tamanho original.
Albert Einstein
-
AGRADECIMENTOS
A Deus, pela oportunidade da existncia.
A meus pais, Jair Matias e Roseli Silva Matias, por toda a educao recebida ao longo
destes meus 22 anos, educao esta que foi fundamental para a formao de meu carter.
minha noiva Gabriela Porto pela sua maturidade e companheirismo mostrados nos
momentos de minha ausncia em que me dediquei a este trabalho.
Ao meu orientador, Jomi Fred Hbner pelo seu bom humor, e conhecimentos tcnicos,
bem como pelo seu apoio e incentivo prestados a mim durante todo o perodo de
desenvolvimento.
Aos meus companheiros Alex Sandro Silva e Maurcio Edgar Stivanello, com os quais
troquei muitas idias durante todo o perodo de desenvolvimento deste trabalho.
E por fim a todos aqueles amigos e companheiros, que j passaram ou esto presentes
em minha vida, e que j torceram ou torcem pelo meu sucesso enquanto ser humano.
-
RESUMO
Este trabalho apresenta o desenvolvimento de um prottipo para reconhecimento de delta(s) e ncleo em impresses digitais. Para este reconhecimento utilizou-se uma Rede Neural Artificial feedforward multicamada com treinamento backpropagation. Como entradas para esta rede so apresentados fragmentos de imagens, e como resposta espera-se que a rede classifique esta entrada em trs padres, os quais indicaro a qual regio este fragmento de imagem pertence. Ainda so mostrados neste trabalho a construo de um sistema de identificao das impresses digitais atravs da comparao de uma impresso digital com outras de usurios previamente cadastrados, bem como as tcnicas, dificuldades e resultados referentes as etapas de estudo e desenvolvimento.
Palavras chaves: Inteligncia Artificial; Redes Neurais Artificiais; Impresses Digitais;
-
ABSTRACT
This work describes the development of prototype to recognize delta(s) and kernel in fingerprints. It was applied a feedforward multi-layer artificial neural network with backpropagation algorithm to classify the fingerprints. Some regions of the fingerprints image are used as training samples for this network and it answer by classify theses inputs as the either delta or kernel. This work shows the implementation of a fingerprints recognizing system by comparing fingerprints with another one previously provided. Some techniques, difficulties and results identified while this working was being done are show. Palavras chaves: Artificial Inteligence; Artificial Neural Network; Fingerprints;
-
LISTA DE ILUSTRAES
Figura 1 Regies dos sistemas de linhas. ..............................................................................21 Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich. ......................................23 Figura 3 Em destaque ncleo e deltas de uma ID..................................................................24 Figura 4 Representao macro de um sistema de identificao biomtrica. .........................26 Figura 5 Representao de um neurnio biolgico. ..............................................................32 Figura 6 Representao do funcionamento de um neurnio artificial...................................35 Figura 7 Representao dos Fluxos das RNA .......................................................................36 Figura 8 Funo logstica de ativao sigmide binria. ......................................................38 Figura 9 Exemplo de regies da IID passadas como entrada para a RNA............................44 Figura 10 Definio da diviso de quadrantes numa IID ......................................................44 Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID. ...............45 Figura 12 Diagrama de caso de uso primrio do ator Especialista ....................................46 Figura 13 Diagrama de caso de uso primrio do ator Usurio...........................................46 Figura 14 Diagrama de caso de uso secundrio do ator Usurio .......................................47 Figura 15 Diagrama de Classes do prottipo ........................................................................47 Quadro 1 Rotina principal de treinamento da classe RedeNeural .........................................53 Quadro 2 Rotina de ativao dos neurnios das camadas ocultas e de sada........................54 Quadro 3 Rotina de clculo do delta dos neurnios da camada de sada da RNA................54 Quadro 4 Rotina de clculo do delta dos nernios da camada oculta RNA..........................55 Quadro 5 Rotina de ajuste dos pesos de todas as camada da RNA. ......................................55 Quadro 6 Rotina de clculo do Erro Quadrado Mdio EQM................................................56 Quadro 7 Rotinas da Funo Sigmide Binria e sua derivada. ...........................................56 Quadro 8 Rotina de converso de imagens 20x20 para os valores de entrada da RNA........56 Quadro 9 Rotina da heurstica do clculo da distncia..........................................................57 Figura 16 Exemplo de IIDs capturadas com tinta comum e tinta tipogrfica .......................59 Figura 17 IID capturada atravs de um leitor biomtrico......................................................59 Figura 18 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 19 Exemplos de IIDs capturadas na Internet..............................................................60 Figura 20 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 21 Exemplos de configurao do Aplicativo Sfinge..................................................61 Figura 22 Exemplo de IIDs geradas pelo aplicativo Sfinge ..................................................62 Figura 23 Amostras de treinamento de regies dos deltas ampliadas em 5 vezes. ...............65 Figura 24 Amostras de treinamento de regies dos ncleos ampliadas em 5 vezes. ............65 Figura 25 Amostras de treinamento de regies quaisquer ampliadas em 5 vezes.................65 Figura 26 Tela principal do prottipo....................................................................................66 Figura 27 Pasta Treinamento Automtico da tela de Treinamento da RNA. ........................67 Figura 28 Pasta Treinamento Manual da tela de Treinamento da RNA................................68 Figura 29 Pasta de Pesos da tela de Treinamento da RNA. ..................................................69 Figura 30 Pasta de Validao Automtica da tela de Validao da RNA.............................70 Figura 31 Pasta de Validao Manual da tela de Validao da RNA. ..................................70 Figura 32 Tela de cadastramento de usurios.........................................................................71 Figura 33 Tela de identificao das IIDs atravs da comparao das distncias. ..................72 Figura 34 Grfico de testes com diferentes valores em parmetros da RNA........................73
-
LISTA DE TABELAS
Tabela 1 Quantidade de amostras por Grupo para cada tipo de regio .................................64 Tabela 2 Resultado da taxa de acerto da RNA com vrios NO na camada Oculta ...............73 Tabela 3 Resultados por grupos de Amostras .......................................................................74
-
LISTA DE SIGLAS
AFIS Automatic Fingerprint Identification System
BD Banco de Dados
BMP BitMaP ou mapa de bits
DPI Dots Per Inch ou pontos por polegada
EQM Erro Quadrado Mdio
ID Impresso Digital
IID Imagem de Impresso Digital
NO Neurnio Oculto
Pixel Picture Element ou elemento da imagem
RGB Red+Green+Blue ou Vermelho+Verde+Azul
RNA Rede Neural Artificial
RNA-FM Rede Neural Artificial Feedforward Multicamada
SGBD Sistema Gerenciador de Banco de Dados
UML Unified Modeling Language ou Linguagem de Modelagem Unificada
XOR eXclusive OR conhecido como OU exclusivo
-
SUMRIO
1 INTRODUO..................................................................................................................13
1.1 ORIGEM DO TRABALHO..............................................................................................13
1.2 REAS..............................................................................................................................14
1.3 PROBLEMA .....................................................................................................................15
1.4 JUSTIFICATIVAS............................................................................................................15
1.5 OBJETIVOS......................................................................................................................16
1.6 ESTRUTURA DO TRABALHO......................................................................................16
2 FUNDAMENTAO TERICA....................................................................................18
2.1 IMPRESSES DIGITAIS.................................................................................................18
2.1.1 Datiloscopia.....................................................................................................................18
2.1.2 Estudo da Pele.................................................................................................................19
2.1.3 Sistema Datiloscpico de Juan Vucetich ........................................................................21
2.1.3.1 Mincias .......................................................................................................................23
2.1.3.2 Ncleo e Deltas.............................................................................................................24
2.2 BIOMETRIA.....................................................................................................................25
2.2.1 Sistemas de Identificao Biomtrica .............................................................................25
2.2.2 Sistemas de Identificao Biomtrica atravs das Impresses Digitais..........................26
2.3 PROCESSAMENTO DE IMAGENS ...............................................................................28
2.3.1 Imagem Digital................................................................................................................28
2.3.1.1 Definio de Cores .......................................................................................................29
2.3.1.2 Formato de Imagens .....................................................................................................30
2.3.2 Tcnicas de Processamento de Imagens .........................................................................30
2.4 REDES NEURAIS ............................................................................................................31
2.4.1 Sistema Nervoso e Neurnio Biolgico..........................................................................31
2.4.2 Redes Neurais Artificiais ................................................................................................33
2.4.2.1 Neurnio Artificial........................................................................................................34
2.4.2.2 Rede Neural Artificial Feedforward Multicamada.......................................................36
2.4.2.3 Funes de Ativao.....................................................................................................37
2.4.2.4 Treinamento e Aprendizado .........................................................................................38
2.4.2.4.1 Aprendizado por Retropropagao (backpropagation) ...........................................39
2.4.2.5 Escolha da Estrutura das Redes ....................................................................................41
2.5 CONTEXTO ATUAL DO TRABALHO .........................................................................41
-
2.5.1 Trabalhos Correlatos .......................................................................................................41
3 DESENVOLVIMENTO DO PROTTIPO....................................................................43
3.1 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO.......................43
3.2 VISO GERAL.................................................................................................................43
3.3 ESPECIFICAO ............................................................................................................45
3.3.1 Casos de Uso...................................................................................................................46
3.3.2 Diagramas de Classes......................................................................................................47
3.3.3 Integrao........................................................................................................................48
3.3.4 Classe da Rede Neural ....................................................................................................48
3.3.5 Estrutura da Rede ............................................................................................................50
3.3.6 Parmetros de Treino ......................................................................................................51
3.4 IMPLEMENTAO ........................................................................................................52
3.4.1 Tcnicas e Ferramentas Utilizadas..................................................................................52
3.4.2 Imagens de Impresses Digitais......................................................................................58
3.4.3 Pr-Processamento em Imagens de Impresses Digitais ................................................62
3.4.4 Treinamento da Rede Neural Artificial...........................................................................63
3.4.5 Operacionalidade da Implementao ..............................................................................66
3.5 RESULTADOS E DISCUSSO ......................................................................................72
4 CONCLUSES..................................................................................................................76
4.1 OBJETIVOS DO TRABALHO ........................................................................................76
4.2 FERRAMENTAS..............................................................................................................76
4.3 PROTTIPO .....................................................................................................................76
4.4 REDE NEURAL ARTIFICIAL FEEDFORWARD MULTICAMADA...........................77
4.5 CONCLUSES FINAIS...................................................................................................78
4.6 EXTENSES ....................................................................................................................78
REFERNCIAS BIBLIOGRFICAS .................................................................................80
-
13
0 INTRODUO
Neste captulo so levantados alguns aspectos relativos ao tema, bem como a origem
deste trabalho e as justificativas para o desenvolvimento do mesmo.
0.0 ORIGEM DO TRABALHO
A histria da Identificao Humana contada por historiadores, arquelogos e
exploradores que estudaram o Homem e a vida animal na crosta terrestre. Desde a mais
remota Antigidade, o Homem teve sua ateno voltada para a identificao. Os trogloditas
usavam como meios de identificao, sinais diversos que serviam para marcar suas moradias.
Aplicavam os desenhos palmares por meio de decalque sobre a argila, colorindo-o, e em
seguida completavam o enfeite com cabeas dessecadas de animais ou at mesmo de inimigos
abatidos em combates. Integrantes de tribos traziam desenhos coloridos pelo corpo, dentes de
animais preso s orelhas, lbios e nariz. Tudo isto para que pudessem ser identificados uns
pelos outros (APPOL, 2004).
Ao longo do tempo estes mtodos de identificao evoluram, principalmente pela
necessidade crescente de se confirmar a identidade de um indivduo, ou seja, de se ter certeza
de que uma pessoa quem realmente diz ser. Durante os ltimos anos, as pessoas tm usado
chaves, cartes, assinaturas e senhas para validar sua identidade. O grande problema destes
artefatos que podem ser esquecidos, roubados, perdidos, copiados, armazenados de maneira
insegura e at utilizados por pessoas que no tenham autorizao. Desta forma, no
surpreendente que um novo campo de atraes nas pesquisas recentes seja a biometria. Dentre
as definies citadas no dicionrio, biometria o ramo da cincia que estuda a mensurao
dos seres vivos (PROGLOBO, 1996).
Com base nos estudos da biometria e com a larga utilizao de computadores,
puderam-se criar sistemas computacionais confiveis de identificao de indivduos. Para
tanto estes sistemas utilizam caractersticas biomtricas que estudos cientficos j
comprovaram como sendo nicas. Entre estas caractersticas destaca-se, o reconhecimento
atravs da face, da geometria das mos, da assinatura, da voz, da ris, da retina e das
impresses digitais associada ao acrnimo ID (AGUIAR, 2004).
-
14
Entre as caractersticas biomtricas citadas acima, a mais utilizada a identificao
atravs das IDs, por ser mais barata e muito confivel. As IDs so reprodues fiis dos
desenhos digitais em alguma superfcie plana. Desenhos digitais por sua vez, so as diversas
linhas e entrelinhas formadas na pele dos dedos dos ps e das mos dos seres humanos e de
alguns outros animais dotados de mos, tais como macacos, gambs, cotias, etc. No estudo
das IDs destacam-se como sendo caractersticas importantes o(s) delta(s) e ncleo das
mesmas. Pode-se definir o ncleo como sendo o centro de encontro das IDs, e o(s) delta(s)
como sendo o(s) ngulo(s) ou tringulo(s) formados pelas linhas, localizados a direita e/ou
esquerda da ID (KEHDY, 1968, p. 33).
Para extrair as caractersticas biomtricas necessrio hardware especializado. No
caso do desenho digital se faz necessrio um sensor ou scanner biomtrico. Os sistemas
biomtricos baseados em IDs utilizam como base a Datiloscopia agregada a tcnicas e
heursticas prprias de computao para gerar um sistema que permita a autenticao da
identidade de um indivduo. O hardware normalmente apresenta para estes sistemas de
identificao uma imagem digital, que por sua vez precisa ser tratada na maioria das vezes
atravs de tcnicas de pr-processamento de imagem, para que estes sistemas se tornem o
mais confiveis possvel.
Para o desenvolvimento deste trabalho sero utilizadas tcnicas de Redes Neurais
Artificiais (RNA) para o reconhecimento das IDs e a comparao com outras IDs previamente
armazenadas. Segundo Loesch (1996, p. 5), as RNA so uma tentativa de se copiar as redes
neurais dos seres humanos. Nelas encontram-se tambm neurnios, mas artificiais, que
interconectados, podem produzir resultados expressivos no reconhecimento de padres. No
caso deste trabalho, os padres a serem identificados e comparados sero as IDs.
1.2 REAS
As reas relacionadas ao trabalho proposto so:
a) Datiloscopia: o contedo desta rea se faz necessrio para definio das
caractersticas das IDs, que sero amplamente utilizadas para o desenvolvimento do
prottipo;
b) Identificao Biomtrica: seus conceitos vo ao encontro do prottipo, que um
sistema de identificao biomtrica;
-
15
b) Computao Grfica: no que diz respeito captura das imagens das IDs, e todo o
pr-processamento destas imagem que serviro de entrada para a RNA;
b) Inteligncia Artificial (Redes Neurais Artificiais): a RNA implementada que ser a
principal tecnologia empregada no prottipo.
0.0 PROBLEMA
Atualmente, e cada vez mais, necessita-se ter o acesso restrito e controlado de pessoas
a certos locais, que vo desde bancos, empresas internacionais, locais de jogos etc. Os
sistemas de identificao tradicionais levantam enormes e conhecidos problemas na gesto de
assiduidade e acesso. So comuns, por exemplo, os erros nos cdigos a digitar e o
esquecimento dos cartes. Alm disso, so sistemas com uma elevada taxa de incerteza, j
que os cdigos podem ser divulgados a terceiros e os cartes podem ser emprestados ou at
roubados (PROGLOBO, 1996).
Em razo desta dificuldade, criou-se os sistemas de identificao biomtrica. Estes
sistemas visam minimizar significativamente os problemas de controle de assiduidade e
acesso, uma vez que utilizam as caractersticas fsicas do indivduo para identificao, e
somente ser possvel a comprovao de sua identidade na presena fsica do mesmo.
0.0 JUSTIFICATIVAS
Inicialmente a identificao atravs das IDs eram feitas por indivduos treinados, ou
seja, uma ou mais pessoas tinham arquivos de IDs impressas em papel e, quando conhecido o
nome do indivduo, pegava-se sua ficha e comparavam-se as mincias e outras caractersticas
da ID j destacadas nesta ficha com a ID fornecida, utilizando para isto lupa e materiais como
rgua e lpis. Quando no se tinha o nome do indivduo a ser identificado com sua ficha
correspondente, como por exemplo, um crime sem testemunha, este trabalho se tornava
demorado e de pacincia, onde muitas vezes o indivduo no podia ser identificado entre
tantas fichas (GUMZ, 2002, p. 4).
Este processo de identificao tornou-se cada vez mais precrio com o passar do
tempo, e desde ento os sistemas biomtricos de identificao de indivduos atravs das IDs
vm ganhando espao no mercado de acesso continuamente. Entre os motivos geradores deste
crescimento pode-se destacar que as IDs no so perdidas como cartes, nem divulgadas a
-
16
terceiros como senhas, e que os aparelhos de leitura de impresses digitais oferecem muito
mais segurana que estes mtodos, uma vez que praticamente impossvel falsificar uma ID
humana (APPOL, 2004).
Neste trabalho pretende-se apresentar uma pesquisa referente s dificuldades que
envolvem a criao de um sistema de identificao biomtrica, propondo uma soluo de
identificao de indivduos atravs do(s) delta(s) e ncleo das IDs. Atravs da utilizao dos
conceitos da Datiloscopia, dos conhecimentos dos sistemas biomtricos, das tcnicas de
processamento de imagens digitais e das RNAs pretende-se criar um prottipo de
identificao de indivduos.
2.3 OBJETIVOS
O objetivo deste trabalho desenvolver um sistema para identificao do(s) delta(s) e
ncleo em IDs utilizando tcnicas de RNAs.
Os objetivos especficos do trabalho so:
a) realizar a identificao do(s) delta(s) e ncleo de IDs armazenadas em imagens
Bitmaps;
b) realizar a identificao do(s) delta(s) e ncleo de IDs de qualquer dedo das mos.
c) realizar a comparao destas IDs identificadas com outras previamente
armazenadas.
2.4 ESTRUTURA DO TRABALHO
Este trabalho est organizado como descrito a seguir:
a) no capitulo 1, apresentada brevemente uma introduo ao assunto, bem como
uma idia a que este trabalho se prope;
b) no captulo 2 sero apresentadas todas as reas referentes a fundamentao terica
deste trabalho, sendo elas: Datiloscopia, Identificao Biomtrica, Processamento
de Imagens e Redes Neurais Artificiais. Neste captulo so apresentados conceitos,
caractersticas, tcnicas, ferramentas e outros aspectos relevantes vinculados ao
tema;
-
17
c) no captulo 3 ser apresentado todo o processo de desenvolvimento do prottipo
bem como as estruturas, algoritmos, tcnicas, diagramas, fragmentos de cdigos,
etc, utilizados durante esta etapa;
b) e, por ltimo, no captulo 4, sero apresentadas concluses, anlise de resultados,
bem como sugestes para trabalhos futuros.
-
18
0 FUNDAMENTAO TERICA
Nas prximas sees sero apresentados conceitos, tcnicas e ferramentas mais
relevantes ao desenvolvimento do trabalho, bem como o estado da arte sobre o tema e
tambm trabalhos correlatos encontrados.
0.0 IMPRESSES DIGITAIS
Segundo APPES (2004) a Papiloscopia o mais seguro mtodo de identificao
humana. A Papiloscopia divide-se em Datiloscopia, Quiroscopia e Poroscopia. A Datiloscopia
a cincia que estuda os desenhos papilares formados na polpa digital (ponta dos dedos). A
Quiroscopia cincia que estuda os desenhos formados pela palma das mos. E a Poroscopia
a cincia que estuda os desenhos formados pela planta dos ps. Para o desenvolvimento
deste trabalho ser considerado apenas o estudo da Datiloscopia.
0.0.0 Datiloscopia
Segundo Tavares Jnior (1991, p. 19-20) alguns autores consideram o incio do estudo
da Datiloscopia no perodo pr-histrico, onde o Homem primitivo tinha o costume de marcar
sua caverna com o desenho de suas mos sobre a argila, passando aps para pases do Oriente,
onde os homens eram obrigados a opor os dedos polegares impregnados de tintas em papis
para a emisso de documentos de divrcio. Mas foi entre os anos de 1664 e 1891 que a
Datiloscopia teve seu estudo comprovado como cincia.
Em 1664 o anatomista italiano J. Marcello Malpighi fez estudos sobre as papilas da
pele encontradas na palma das mos e nas extremidades digitais. Seus estudos foram
estendidos por vrios pesquisadores, onde os que mais se destacaram por seu trabalho foram
William Hershel que em 1.858 provou o postulado da imutabilidade; Arthur Kollmam que em
1.883 provou a formao dos desenhos digitais no sexto ms de vida fetal; Francis Galton que
em 1.888 criou um sistema com trinta e oito tipos de IDs classificados em trs grupos: arcos,
presilhas e verticilos; Henry de Varigny que em 1.891 publicou um artigo sobre o sistema de
Galton que foi traduzido para vrias lnguas; e Juan Vucetich, argentino que leu este artigo, e
que criou uma extenso do sistema de Galton e implantou pela primeira vez a identificao de
suspeitos de crime pela ID por volta de 1.891 com o nome de Icnofalangometria (TAVARES
-
19
JNIOR, 1991, p. 20-22). O termo Icnofalangometria foi modificado para Datiloscopia em
1894, por sugesto do Dr. Francisco Latzina (KEHDY, 1968, p. 37).
A Datiloscopia a cincia que trata a identificao de pessoas atravs da comparao
de suas IDs. O termo Datiloscopia deriva de dois elementos gregos daktylos = dedos e
skopin = examinar. A Datiloscopia divide-se em civil, criminal e clnica. A Datiloscopia
civil trata da identificao das pessoas para expedio de documentos de identidade, tais
como cdula de identidade, passaporte, etc. A Datiloscopia criminal reveste-se de trs
aspectos, a saber: indiciado em inqurito policial, expedio de documentos de idoneidade e
aproveitamento das impresses papilares encontradas nos locais de crimes. J a Datiloscopia
clnica estuda as perturbaes que se verificam nos desenhos digitais. Perturbaes estas
resultantes de algumas doenas, ou exerccio de certas profisses (KEHDY, 1968, p. 25-27).
Segundo Kehdy (1968, p. 27) e APPES (2004), so os seguintes os postulados1 da
Datiloscopia:
c) perenidade: a propriedade que tem o desenho digital de existir desde o sexto ms
de vida fetal at a putrefao cadavrica, quando se d o descolamento da derme;
c) imutabilidade: a propriedade que tem o desenho digital de no mudar, desde o
sexto ms de vida fetal at a putrefao cadavrica;
a) variabilidade: a propriedade que tem o desenho digital de variar de dedo para
dedo e de pessoa para pessoa. Os gmeos, quando do mesmo ovo, apresentam
desenhos papilares semelhantes, mas nunca absolutamente iguais. A variedade to
grande que em milhes e milhes de IDs j estudadas e fichadas em todo o mundo
jamais se encontrou duas iguais;
b) classificabilidade: a propriedade que tem o desenho digital de poder ser
classificado. Este por sua vez classificado em tipo e subtipo.
0.0.0 Estudo da Pele
Pele uma vasta membrana que recobre todo o corpo humano. Tavares Jnior (1991,
p. 27) detalha que a pele constituda por duas camadas: a derme e a epiderme. A derme a
parte principal e mais profunda da pele, e est localizada sob a epiderme. Na superfcie da
1 Postulado uma proposio que aceita sem demonstrao.
-
20
pele ficam localizados pequenos relevos: as papilas. Estas existem nas superfcies palmares e
plantares. J a epiderme uma fina membrana, transparente, que recobre a derme.
Segundo Kehdy (1968, p. 31) existem duas espcies de glndulas de secreo
presentes na pele e que interessam no estudo da Datiloscopia. So as glndulas sudorparas e
sebceas. As glndulas sudorparas existem em maior quantidade e esto presentes nas palmas
das mos, nas extremidades digitais e nas plantas dos ps. J as glndulas sebceas existem
em maior quantidade na testa, no couro cabeludo, no nariz e nas orelhas, e produzem
substncias gordurosas. Estas glndulas e a secreo das mesmas que permitem que sejam
deixadas ID em locais de crimes, por exemplo.
Tavares Jnior (1991, p. 30) afirma que as papilas so situadas na derme e se espalham
por todo o corpo, por este motivo que pequenos cortes ou queimaduras leves no afetam os
desenhos digitais. Define-se como desenho digital a combinao de cristas e sulcos papilares
localizados na derme e espalhados pela epiderme, formando configuraes diversas em IDs. E
IDs por sua vez so a reprodues do desenho digital em um suporte liso e limpo.
APPOL (2004) afirma que, o datilograma produzido pelo entintamento da polpa
digital ou por manchas de suor e gorduras sobre um suporte liso e polido, podendo ser
tambm produzido por decalque em suporte mole que venha a endurecer. Em um datilograma,
as linhas impressas representam cristas papilares (linhas pretas ou cinza escuro) e os espaos
intercalados so os sulcos interpapilares (linhas brancas ou cinza claro).
Tavares Jnior (1991, p. 30) cita que as IDs compem-se de: linhas pretas, linhas
brancas, delta, ponto caractersticos, poros, linhas brancas albodactiloscpicas.
b) linhas pretas: correspondem s cristas papilares;
b) linhas brancas: correspondem aos sulcos interpapilares;
b) delta: o ngulo ou tringulo formado pelas cristas papilares;
b) pontos caractersticos: so os acidentes que se encontram nas cristas papilares.
Servem para identificar as impresses por serem permanentes;
b) poros: so aberturas dos canais que expelem os produtos das glndulas sudorparas
e sebceas;
b) linhas brancas albodactiloscpicas: so formadas pela interrupo de duas ou mais
cristas papilares, so formadas pelo enrugamento da pele.
-
21
Segundo Kehdy (1968, p. 34) as IDs com ausncia de deltas, no possuem sistemas de
linhas, as demais possuem trs sistemas de linhas, conforme mostrados na Figura 1, sendo
definidos como:
b) regio basilar: formada pelo conjunto de linhas existentes entre a prega
interfalangeana e a terceira linha abaixo do ramo descendente e ascendente do
delta.
b) regio nuclear: formada pelo conjunto de linhas que circunscrevem o centro do
datilograma, ou seguindo a diretriz superior at o ramo ascendente do delta.
b) regio margial: formada pelo conjunto de linhas do pice e das laterais do
datilograma at a linha imediata que acompanha a diretriz superior do delta.
Figura 1 Regies dos sistemas de linhas.
As IDs so normalmente extradas com papel, rolo e tinta, onde a superfcie do dedo
molhada com o rolo entintado e imediatamente posta contra o papel. Assim so separados os
indivduos em fichas que podem ser decadatilares ou monodatilares (dez ou uma ID por
ficha). Estas fichas so ordenadas por tipo de ID, quantidade e tipo de mincias (KEHDY,
1968, p. 14).
0.0.0 Sistema Datiloscpico de Juan Vucetich
Foi por iniciativa de Flix Pacheco, que o Presidente da Repblica Dr. Rodrigues
Alves, em 05 de fevereiro de 1903, atravs do Decreto 4.764, introduziu a Datiloscopia como
mtodo mais simples e mais perfeito para identificao de indivduos. Todo o processo de
identificao seria subordinado classificao dactiloscpica, de acordo com o Sistema
-
22
Vucetich, considerando-se, para todos os efeitos, a ID como prova mais concludente e
positiva da identidade do indivduo (APPES, 2004).
Segundo Tavares Jnior (1991, p. 37-38) e Kehdy (1968, p. 37), no sistema
datiloscpico de Vucetich as IDs so classificadas nos tipos: arco, presilha interna, presilha
externa e verticilo. O arco apresenta como caractersticas a ausncia de delta, onde as linhas
atravessam o campo da ID de um lado ao outro. A presilha interna tem um delta direita do
observador e as linhas nucleares correm para a esquerda do observador. J a presilha externa
tem um delta esquerda do observador e as linhas nucleares correm para a direita do
observador. E o verticilo tem dois deltas, sendo um direita e outro esquerda do observador,
onde as linhas nucleares ficam encerradas entre os dois deltas, assumindo configuraes
variadas.
Os tipos fundamentais de Vucetich so representados abreviadamente por nmeros e
letras, a saber: Arco=A=1, presilha Interna=I=2, presilha Externa=E=3 e Verticilo=V=4. As
letras so empregadas para os dedos polegares e os nmeros para os demais dedos. Alm dos
smbolos acima, ainda so utilizados X quando h cicatriz e O para amputao, estes ltimos
dois smbolos so empregados para qualquer um dos dedos (KEHDY, 1968, p. 38).
Tavares Jnior (1991, p. 45) exibe a frmula datiloscpica como uma frao ordinria
para se efetuar a classificao decadatilar, onde o numerador indica impresses da mo direita
e o denominador da mo esquerda. Os smbolos da frmula so dispostos na ordem natural
dos dedos: polegar, indicador, mdio, anelar e mnimo. Segundo Kehdy (1968, p. 40) existem
410 combinaes, o que resulta em 1.048.576 diferentes frmulas datiloscpicas, que o
resultado dos 4 tipos fundamentais elevados aos dez dedos. Na frmula 2-1 tem-se um
exemplo de frmula datiloscpica, mo direita: arco, verticilo, presilha externa, presilha
interna e arco; e na mo esquerda: verticilo, arco, arco, presilha interna, arco.
1121
4321
V
A (2-1)
Kehdy (1968, p. 40) afirma que os quatro tipos fundamentais de Vucetich no
aparecem com a mesma freqncia nos datilogramas. Atravs de estudos estabeleceu-se que
5% das IDs encontradas so do tipo arco, 60% do tipo presilhas e 35% do tipo verticilos. Na
Figura 2 so apresentados os quatro tipos fundamentais das IDs no sistema Vucetich.
-
23
Fonte: Adaptado de Gumz (2002, p. 12). Figura 2 Tipos fundamentais de IDs no sistema de Juan Vucetich.
Em (KEHDY, 1968, p. 44) ainda so detalhados os subtipos das IDs, estes por sua vez
so agregados aos tipos principais, a saber:
b) arco: plano, angular, bifurcado direita e bifurcado esquerda;
b) presilha interna: normal, invadida, dupla e ganchosa;
b) presilha externa: normal, invadida, dupla e ganchosa; e
b) verticilo: espiral, ovoidal, sinuoso e ganchoso.
Defrontam-se alguns casos onde o sistema de Vucetich apresenta tipos limites, quando
uma impresso tem seu desenho encaixando-se em mais de um tipo. Os tipos limites so: arco
e presilha interna, arco e presilha externa, arco e verticilo, presilha interna e verticilo e,
presilha externa e verticilo (KEHDY, 1968, p. 36).
0.0.0.0 Mincias
Segundo Costa (2000, p. 15), as mincias so acidentes que se encontram nas cristas
papilares e tm a finalidade de estabelecer a unicidade das IDs. Pode-se dizer que mincias
so terminaes e bifurcaes dos sulcos papilares.
Kehdy (1968, p. 61) e Tavares Jnior (1991, p. 32) afirmam que para se confirmar a
identidade de uma ID, devero ser coincididos no mnimo doze mincias, as quais devem ser
encontradas da mesma forma, localizao e mesma quantidade nas duas impresses em
-
24
comparao. Tambm no pode haver mincias que se encontram na impresso testemunha2 e
no esto presentes na impresso suspeita3.
0.0.0.0 Ncleo e Deltas
O ncleo de uma ID representa o centro de gravidade da impresso. Em IDs do
grupo verticilo, o ncleo est localizado na parte superior da volta mais interna da linha
datilar. J em IDs dos grupos presilhas, o ncleo localiza-se no ombro da laada mais interna
da impresso (ANTHEUS, 2002).
O delta o ngulo ou tringulo formado pelas cristas papilares, pela brusca
divergncia das linhas paralelas ou pela bifurcao de uma linha simples. Sua principal
funo determinar o tipo da ID. Os deltas representam o ponto de divergncia das linhas
datilares mais internas que envolvem ou tendem a envolver a regio nuclear de uma ID.
Verticilos apresentam dois deltas, Presilhas Externas apresentam um delta esquerda do
observador e as Presilhas Internas um delta direita do observador. O Arco normalmente no
possui delta (APPOL, 2004). Na Figura 3, so mostrados ncleo e deltas.
Figura 3 Em destaque ncleo e deltas de uma ID.
2 Impresso testemunha a encontrada em local de crime. 3 Impresso suspeita a tomada dos dedos do suspeito ou encontrada no arquivo datiloscpico.
-
25
0.0 BIOMETRIA
Segundo Bressan (2002, p. 3), todos os mtodos de identificao de indivduos so
baseados em trs conceitos fundamentais: segurana baseada em algo que o indivduo possui,
como uma chave de um cofre, segurana baseada em algo que o indivduo sabe, como uma
senha, e segurana baseada em quem o individuo , como sua ID. A identificao atravs
deste ltimo conceito chamada de identificao biomtrica, pois usa caractersticas
estudadas pela biometria.
Como j citado anteriormente, segundo o dicionrio, biometria o ramo da cincia
que estuda a mensurao dos seres vivos, mas no mundo da segurana, biometria se refere
aos mtodos automatizados para identificao de pessoas com base em suas caractersticas
fsicas, fisiolgicas ou em seus aspectos comportamentais (AGUIAR, 2004).
0.0.0 Sistemas de Identificao Biomtrica
Segundo Pankanti (2000, p. 2), um sistema biomtrico um sistema de
reconhecimento de padres capaz de estabelecer a identidade de um indivduo atravs de
caractersticas fsicas ou comportamentais. Para que estas caractersticas possam ser utilizadas
em um processo de identificao de usurio necessria a utilizao de tecnologias bastante
avanadas. Bressan (2002, p. 3), enfatiza que qualquer caracterstica humana, seja ela fsica,
fisiolgica ou comportamental, pode ser usada para identificao biomtrica, desde que
satisfaam aos seguintes requisitos:
b) universalidade: todas as pessoas devem possuir a caracterstica a ser medida;
b) singularidade: indica que esta caracterstica no pode ser igual em pessoas
diferentes;
b) permanncia: significa que a caracterstica no deve variar com o tempo;
b) desempenho: preciso da identificao, os recursos requeridos para conseguir uma
preciso de identificao aceitvel e ao trabalho ou fatores ambientais que afetam a
preciso de identificao;
b) aceitabilidade: indica o quanto as pessoas esto dispostas a aceitar os sistemas
biomtricos;
b) proteo: facilidade ou dificuldade de enganar o sistema com tcnicas fraudulentas.
-
26
Segundo Hong (1998, p. 3), os sistemas biomtricos so divididos em duas partes: o
mdulo de registro e o mdulo de identificao. No mdulo de registro as caractersticas so
obtidas por um leitor biomtrico e processadas atravs de um mdulo extrator de
caractersticas gerando um template que ser armazenado. J o mdulo de identificao deve
fazer a captura das caractersticas biomtricas no momento do acesso, gerando tambm uma
representao atravs do mdulo extrator, equivalente as armazenadas atravs dos templates.
E finalmente, o resultado do mdulo de identificao alimentado ao mdulo comparador de
caractersticas que o confronta contra os templates armazenados para estabelecer a identidade.
A traduo de template modelo ou gabarito, mas como as palavras modelo e gabarito tm
muitos significados em nosso idioma, a partir deste ponto ser utilizado o termo template para
indicar as caractersticas biomtricas armazenadas pelo mdulo de registro. Na Figura 4,
apresenta-se uma representao macro de um sistema de identificao biomtrica.
Fonte: Adaptado de Gumz (2002, p. 15). Figura 4 Representao macro de um sistema de identificao biomtrica.
Como exemplos de aplicaes biomtricas tm-se as forenses que incluem
identificao criminal, segurana de prises e identificao de cadveres; as civis que
agregam identificao nacional, carteira de motorista, sade, travessia de fronteiras; e as
comerciais em que se destacam comrcio eletrnico e servios bancrios como caixa
automtico, carto de crdito e controles de acesso (GUMZ, 2002, p. 16).
0.0.0 Sistemas de Identificao Biomtrica atravs das Impresses Digitais
Os sistemas de identificao biomtrica por IDs so associados a sigla AFIS, do ingls
Automatic Fingerprint Identification System ou sistema de identificao automtica de IDs.
-
27
Segundo Bressan (2002, p. 8), os sistemas de identificao atravs de IDs, analisam
basicamente a posio das mincias, mas os sistemas mais modernos, alm disto, esto
verificando tambm outras caractersticas, tais como arcos, voltas, posio do(s) delta(s),
ncleo, etc. Tudo isto para que estes sistemas tenham seus percentuais de acerto cada vez
mais prximos de 100%.
Os templates citados anteriormente no necessariamente gravam a imagem da ID
coletada pelo leitor biomtrico, na maioria das vezes usam-se caractersticas especficas dos
desenhos das impresses, como o nmero de linhas, redemoinhos, etc., de modo que o
processo de comparao seja feito de uma forma mais rpida e precisa (BRESSAN, 2002, p.
3).
Segundo Bressan (2002, p. 8), existem vrios tipos de sensores para identificao de
ID. Alguns trabalham com calor, outros com presso, etc., mas os mais comuns usam um
pequeno CCD (que o componente bsico de um scanner) para obter imagens digitais da
impresso. Estes tipos de sensores tambm so mais confiveis que os de temperatura e
presso, pois no dependem das condies ambientais durante a utilizao do sensor.
Mais detalhadamente podem-se citar os trs tipos de leitores de IDs:
b) pticos: o dedo colocado sobre uma plataforma de vidro e uma imagem do dedo
capturada. Estes dispositivos tornaram-se pequenos e baratos;
b) ultra-som: o dedo colocado sobre uma plataforma de vidro e uma varredura de
ultra-som efetuada;
b) baseados em chip: o usurio coloca seu dedo direto em um chip de silcio.
Hong (1998, p. 15) e Bressan (2002, p. 9) destacam que um problema ligado ao AFIS
encontra-se na sua aceitabilidade pelo usurio civil, porque IDs tm sido associadas a
investigaes criminais e trabalho policial, fazendo com que estes usurios se sintam
desconfortveis, e tambm que a tecnologia requer uma grande quantidade de recursos
computacionais alm de que uma pequena parte da populao no possibilite a identificao
pelas IDs devido a razes genticas, de idade, de ambiente ou ocupacionais como as
estudadas pela datiloscopia clnica.
-
28
0.0 PROCESSAMENTO DE IMAGENS
O sentido da viso pode ser considerado o meio mais eficiente que os seres humanos
dispem para captar informaes do ambiente que os cerca. Prova disso a necessidade
crescente de automatizar algumas atividades de nosso cotidiano e que pode ser considerada
umas das responsveis pelo grande crescimento das ferramentas de processamento de
imagens. Estas ferramentas podem realizar tarefas que variam desde um simples
aprimoramento de uma imagem at a compreenso de mecanismos complexos (FACON,
1993, p. 6).
A rea de Processamento Digital de Imagens teve incio em meados da dcada de 60,
com a motivao criada pelos programas espaciais da NASA nos EUA. O aumento da
capacidade de memria e velocidade dos computadores contribuiu para dar impulso nova
tecnologia, que passou a ser aplicada em outras reas como: medicina, microscopia, tica
eletrnica, transmisso digital de sinais de TV ou fac-smile e em sensores visuais de robs.
Em 1975, a inveno do tomgrafo computadorizado por G. N. Hounsfield, abriu amplas
perspectivas de utilizao das tcnicas digitais de imagens radiogrficas (OSRIO, 1991, p.
24).
0.0.0 Imagem Digital
Imagens digitais podem ser definidas como sendo representaes digitais de imagens
capturadas do mundo real, atravs de sensores. Segundo Gonzalez e Woods (1992, p. 7), para
esta captura, so necessrios dois elementos. O primeiro um dispositivo fsico que seja
sensvel a uma banda de espectro de energia eletromagntica, tais como raios-X, ultravioleta,
banda visvel ou banda infravermelha, e que produza um sinal eltrico de sada proporcional a
um nvel de energia percebida. O segundo chamado de digitalizador, que um dispositivo
que converta a sada eltrica para forma digital.
Segundo Gonzalez e Woods (1992, p. 5), uma imagem digital pode ser considerada
como sendo uma matriz cujos ndices de linhas e colunas identificam um ponto da imagem, e
o correspondente valor do elemento da matriz identifica o nvel de cor naquele ponto. Cada
elemento dessa matriz chamado de elemento da imagem ou elemento da figura, originrios
do ingls pixel ou pels que so abreviaes de picture elements.
-
29
A qualidade das imagens capturadas e exibidas definida pelo dpi, do ingls dots per
inch ou pontos por polegada. O dpi trata da medio da quantidade de pontos em uma imagem
digital por polegada, ou seja, quanto mais pixels a imagem apresentar por polegada, melhor
ser sua qualidade e definio (GUMZ, 2002, p. 20).
A dimenso de uma imagem digital, poder ser unidimensional (1D = varivel),
bidimensional (2D = ponto), tridimensional (3D = ponto no espao), quadrimensional
(4D=ponto no espao tempo) ou at N-dimensional. As dimenses superiores a 2D so mais
utilizadas para visualizao cientfica (GUMZ, 2002, p. 21).
0.0.0.0 Definio de Cores
Quanto a colorao, as imagens podem ser classificadas em dois grupos:
monocromticas e coloridas. As monocromticas so imagens binrias, e apresentam somente
duas cores, preto ou branco. As imagens coloridas podem ser representadas atravs de vrios
modelos, a saber: RGB (Red Green Blue), CMY (Cyan Magenta Yellow), HSI, RYB, YIQ,
etc (BROWN; SHEPHERD, 1995, p. 106).
O sistema mais usado em monitores de vdeo coloridos o RGB. No modelo RGB
cada cor aparece nos seus componentes espectrais primrios de vermelho verde e azul.
Imagens no modelo RGB consistem em trs planos de imagens independentes, um para cada
cor primria (GONZALEZ; WOODS, 1992, p. 160).
O ser humano possui em seu sistema visual trs tipos de sensores capazes de
identificar trs faixas diferentes de espectros de energia. Estas faixas correspondem as
tonalidades de Vermelho (Red), Verde (Green) e Azul (Blue). Logo o ser humano v na
realidade a combinao resultante da mistura destas trs cores bsicas. Atravs de testes
realizados com o ser humano chegou-se a concluso que a utilizao de 256 variaes
diferentes de intensidade em cada uma das cores bsicas capaz de gerar um nmero de cores
superior a capacidade visual do ser humano, ou seja, fica praticamente impossvel distinguir
entre duas cores vizinhas (CASACURTA et al, 1998, p. 9-10).
Segundo Casacurta et. al. (1998, p. 10), no sistema RGB, o valor (0, 0, 0) equivale a
cor preta com intensidade zero nas trs componentes. O valor (255, 255, 255) equivale a cor
branca onde as trs componentes esto presentes com a sua intensidade mxima. As diferentes
-
30
combinaes entre RGB sero capazes de gerar qualquer tipo de cor, sendo que se as trs
componentes tiverem sempre valores iguais ser definida uma escala de tons de cinza do preto
ao branco, a chamada gray scale.
0.0.0.0 Formato de Imagens
Existem diferentes formatos de arquivos para o armazenamento de imagens, uma vez
que se tm vrias classes diferentes de representaes de imagens. O armazenamento da
imagem envolve basicamente trs elementos principais: a forma como a imagem est
representada, o tipo de compactao empregado e o cabealho contendo as informaes a
cerca desta imagem (resoluo, nmero de cores, classe da imagem, palette, compactao,
etc). Um mesmo tipo de arquivo pode inclusive permitir o armazenamento de diferentes
classes de imagens e tambm permitir a utilizao de vrios mtodos de compactao
(CASACURTA et al, 1998, p. 14).
Segundo Facon (1993, p. 28), quanto maior o nmero de aplicaes em que uma
imagem digital pode ser tratada, diz-se que maior a sua padronizao. Normalmente
programas grficos podem ser classificados pela forma com a qual armazenam e apresentam
as imagens. Para esta abordagem h duas categorias: formato de varredura e formato vetorial.
Entre os formatos de imagens digitais mais utilizados esto: BMP, JPG, GIF, TIFF, PCX,
CGM, ICO, RLE, TARGA, PostScript, entre outros (BROWN; SHEPHERD, 1998, p. 73).
0.0.0 Tcnicas de Processamento de Imagens
Segundo Gonzalez e Woods (1992, p. 11), o processamento de imagens digitais
geralmente expresso de forma algortmica e implementado em software, que uma vez
aplicados a uma imagem geram um aprimoramento ou correo da mesma, no que diz
respeito a eliminao de rudos, realce de imagem, restaurao de regies da imagem, etc.
Este processo normalmente direcionado para uma soluo, deste modo tcnicas que
funcionam em um problema, podem se mostrar totalmente inadequadas para outro problema.
Entre tcnicas de processamento de imagens podem ser citadas algumas tcnicas como
a de restaurao que busca compensar distores especficas, normalmente geradas no
momento de aquisio. Quando se pode identificar experimentalmente a funo que
representa a deformao ou construir um modelo matemtico adequado, possvel buscar a
-
31
funo inversa e aplic-la sobre a imagem deformada. Em aplicaes como: correo de foco,
Imagens borradas por movimento. J a Segmentao procura isolar regies de pixels, e aplicar
operaes para extrao de atributos. A operao de segmentao mais comum a
limiarizao por um tom de corte. Tudo que est acima deste tom vira branco, tudo que est
abaixo vira preto, obtendo-se uma imagem binria (SCURI, 1999, p. 55).
Gumz (2002, p. 22), detalha alguns filtros conhecidos, sendo eles, filtro de mdia
(mean filter), filtro da mediana (median filter), filtro mnimo-mximo, suavizao controlada
por gradiente, suavizao gaussiana (gaussian smoothing), suavizao conservativa
(conservative smoothing), remoo de manchas Crimmins (Crimmins speckle removal), filtros
de freqncia passa-baixa (low-pass) e passa-alta (high-pass), laplacian of gaussian filter e
unsharp filter.
0.0 REDES NEURAIS
Silva (1999, p. 16) comenta que o crebro humano o dispositivo mais complexo
conhecido pelo Homem, e que a capacidade de pensar, memorizar e resolver problemas tem
conduzido muitos cientistas a tentar modelar sua operao. Diversos pesquisadores tm
buscado criar modelos computacionais que representam a funcionalidade do crebro. Um
destes modelos resultou na criao das Redes Neurais Artificiais (RNA).
0.0.0 Sistema Nervoso e Neurnio Biolgico
O crebro uma das partes do sistema nervoso que prov uma grande quantidade de
controle sobre as funes do corpo. Nele existem dois tipos de clulas: as glias, responsveis
pelo suporte e nutrio e os neurnios que so as clulas especializadas na atividade nervosa
(LOESCH, 1996, p. 8). Tafner, Xerez e Rodrigues Filho (1996, p. 32) afirmam que o crebro
possui cerca de 10 bilhes de neurnios, e que cada neurnio capaz de ter at 10.000
conexes com outros neurnios ou at mesmo com partes do prprio neurnio.
-
32
O neurnio biolgico possui um corpo e diversas ramificaes, que so chamadas de
dendritos, que por sua vez conduzem sinais de entrada do neurnio para o corpo da clula. A
partir do corpo da clula surge um filamento comprido denominado axnio, na extremidade
deste filamento existem micro-ramificaes, denominados terminais dos neurnios, que tm
por objetivo transmitir um sinal do corpo para outra extremidade do neurnio. Os terminais
dos neurnios so conectados aos dendrites de outros neurnios, cuja conexo d-se o nome
de sinapse (LOESCH, 1996, p. 8). Na Figura 5, feita uma representao de um neurnio
biolgico.
Fonte: Osrio e Bittencourt (2000, p. 8). Figura 5 Representao de um neurnio biolgico.
Segundo Loesch (1996, p. 9) e Silva (1999, p. 17), os estmulos entram nos neurnios
atravs das sinapses de outros neurnios, conectadas aos dendrites deste primeiro, e quando
chegam ao corpo da clula, ocorre um processo de integrao (soma), deste estmulos. Ao
resultado desta soma pode ser gerado um impulso eltrico que comea no axnio e se propaga
para todas as sinapses. O processo de controle da produo destes impulsos eltricos se d
normalmente atravs de uma funo de limiar que produz uma sada, caso esta soma supere
este limiar.
-
33
0.0.0 Redes Neurais Artificiais
Segundo Loesch (1996, p. 15), a histria das redes neurais artificiais recente, com
pouco mais de meio sculo de estudos. Estes iniciaram por volta de 1940, quando as primeiras
simulaes foram feitas com papel e lpis por Donald Hebb e Karl Laschey. Seguidos por
McCulloch e Pitts que propuseram uma modelagem matemtica para os neurnios biolgicos
atravs dos fatos que: neurnios comportam-se como somadores algbricos; adicionam
entradas excitatrias ou subtraem entradas inibitrias; neurnios possuem uma propriedade de
limiar, entre outras.
Loesch (1996, p. 5) define as RNAs como sendo sistemas computacionais de
implementao em software ou hardware, que imitam as habilidades dos neurnios
biolgicos, usando para isto um grande nmero de neurnios artificiais interconectados. Os
benefcios obtidos pela utilizao de uma RNA se do graas a sua massiva estrutura
distribuda e paralela, e sua habilidade de aprender e generalizar sadas de entradas que no
estavam amostradas durante o seu treinamento. Estes benefcios permitem que ela resolva
problemas complexos (HAYKIN, 2001, p. 4).
Existem vrios tipos de RNA, onde os mais conhecidos so ADALINE/MADALINE,
Backpropagation Perceptron (ou feedforward), Time-Delay, Recurrent, BAM (Memria
Associativa Bidirecional), Hofield e Kohonen (LOESCH, 1996, p. 46). As RNA podem ser
algumas vezes superiores a outros mtodos porque os dados sobre os quais se efetuam
concluses so confusos, caticos e inconsistentes (MASTERS, 1993, p. 6-7).
Uma RNA pode ser auto-associativa ou hetero-associativa. O mapeamento de entrada,
ou auto-associao, permite a uma RNA ser treinada para correlacionar um padro com ele
mesmo. E o mapeamento de sada, ou hetero-associao, associa um padro treinado com
outro. Elas podem tambm aproximar funes j que a partir de uma entrada produzem uma
sada o que os qualifica como uma funo (MASTERS, 1993, p. 24, 68).
Gumz (2002, p. 24) comenta que, para que as RNAs possam resolver os problemas
para o qual foram projetadas, as mesmas devem ser treinadas. Toda o desempenho da RNA
est ligado ao processo de treino que deve adaptar seus pesos e sinais de sada de acordo com
os objetivos finais. O processo de treino envolve ajustar os pesos das conexes entre os
-
34
neurnios (ajuste sinptico) e configurar os valores de sada para cada caso verificando a
quantidade de erro apontado por um clculo sobre o valor de sada do neurnio.
0.0.0.0 Neurnio Artificial
Em Tafner, Xerez e Rodrigues Filho (1996, p. 56), encontram-se outros nomes para os
neurnios artificiais, como Elemento de Processamento ou Nodo. Segundo o autor todo
neurnio artificial tem um funcionamento muito parecido com o neurnio biolgico, uma vez
que todo neurnio artificial possui um ou mais sinais de entrada, e apenas um sinal de sada.
Estas entradas dos neurnios artificiais podem ser comparadas aos estmulos recebidos pelo
neurnio biolgico.
Um importante atributo dos neurnios artificiais so os pesos associados ao mesmo. Os
pesos (weight) so valores que representam o grau de importncia que uma determinada
entrada possui em relao ao neurnio. Sempre que as entradas so apresentadas ao neurnio,
elas so multiplicadas pelos valores dos pesos, os resultados destas multiplicaes so
somados e apresentados a uma funo de ativao (TAFNER; XEREZ; RODRIGUES
FILHO, 1996, p. 56-58). O neurnio ativado se, e somente se, o resultado da funo de
ativao alcanar um valor estipulado, chamado de limiar. Pode existir tambm um valor de
entrada adicional, o vis ou bias, que determinado no treinamento, com o objetivo principal
de modificar o valor de limiar da funo de ativao (LOESCH, 1996, p. 20).
Resumindo, um neurnio formado por um conjunto de sinapses que contm os pesos,
um somador para calcular os sinais de entrada multiplicados aos pesos (soma ponderada), e
uma funo de ativao para limitar a amplitude do sinal de sada para um valor numrico
finito (HAYKIN, 2001, p. 36). A Figura 6 ilustra um neurnio artificial, onde os sinais de
entrada x1..xj podem ser sadas de outros neurnios; as variveis wj1..wjp armazenam os valores
dos pesos sinpticos diretamente responsveis pela sada esperada do neurnio aps somatrio
ponderado; o valor wj0 o vis que ser somado a redej; redej o resultado da soma
ponderada da entrada; a funo de ativao f(redej) a responsvel pela ativao com a
resposta da RNA sobre dada entrada se alcanado o valor de limiar l j o qual impe os valores
limites mximos e mnimos que resultar numa sada yj.
-
35
Fonte: Adaptado de Haykin (2001, p. 36). Figura 6 Representao do funcionamento de um neurnio artificial.
Segundo Masters (1993, p. 79-82), a sada do neurnio calculada como:
redej= (wj0 +=
n
i 1
xi*w ji) (2-2)
aplicada em
sada=f(redej) (2-3)
Onde os pesos wji so primariamente responsveis pelas caractersticas operacionais da
rede, pela j conhecida soma ponderada com as entradas xi. A funo de ativao f(redej)
calcula o valor da sada do somatrio ponderado de entradas da redej e, wj0 o valor do vis.
Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 63), os neurnios artificiais sempre
so dispostos em camadas, toda rede neural apresenta uma camada de entrada e uma camada
de sada. Algumas RNA podem apresentar camadas intermedirias ou ocultas como so
chamadas, estas sempre se situam entre a camada de entrada e a camada de sada e no tm
contato com o mundo externo. As camadas de entradas apenas recebem os valores de entradas
e repassam para as camadas seguintes, as camadas seguintes sendo ocultas ou de sada que
realizam o processamento da rede.
As ligaes entre os neurnios das RNA podem ter diferentes fluxos, sendo feedback
(realimentao), quando o sinal de sada de um neurnio servir de entrada para um outro, ou
-
36
para o mesmo neurnio, ou feedforward quando o fluxo seguir apenas em uma direo. Na
Figura 7, apresenta-se os dois tipos de fluxo.
Fonte: Gumz (2002, p. 27). Figura 7 Representao dos Fluxos das RNA.
0.0.0.0 Rede Neural Artificial Feedforward Multicamada
Loesch (1996, p. 67) afirma que as RNA feedforward multicamadas (RNA-FM), ou
MLP (Multi Layer Perceptron - Perceptrons de mltiplas camadas) como tambm so
chamadas, so as mais utilizadas e difundidas dentre as RNAs. As MLP so uma extenso dos
primeiros Perceptrons, tambm so hetero-associativas e podem possuir uma ou mais
camadas ocultas, porm possuem capacidades muito mais potentes e genricas que seu
primeiro modelo. Segundo Welstead (1994, p. 59) estas so as RNAs mais utilizadas, onde
estimativas apontam para 90% de todas as aplicaes de RNA implementadas.
Numa RNA feedforward todos os neurnios de uma determinada camada so
plenamente conectados aos neurnios da camada seguinte. Na Figura 7, no lado esquerdo
tem-se uma RNA-FM, com uma camada de entrada, uma camada oculta e uma camada de
sada. As RNA-FM podem apresentar mais de uma camada oculta, mas conhecido que uma
camada suficiente para resolver problemas determinsticos (MASTERS, 1993, p. 79). A
camada oculta alm de no ter contato com o mundo externo tem a funo de mediar a
entrada externa e a sada da rede (HAYKIN, 2001, p. 19).
Haykin (2001, p. 183) enfatiza que este modelo de RNA tm sido aplicado com
sucesso para resolver problemas difceis atravs do seu treinamento supervisionado com um
-
37
algoritmo muito conhecido como algoritmo de retropropagao de erro (backpropagation).
Normalmente uma RNA-FM consegue aprender uma funo ensinada. Se esta apresentar
problemas, no devido ao modelo em si, mas por um treinamento insuficiente, nmero
pequeno de neurnios na camada oculta ou tentativa de aprender uma funo que no
determinstica (MASTERS, 1993, p. 87).
Segundo Loesch (1996, p. 77), apesar de muitas aplicaes bem sucedidas,
inconvenientes podem ocorrer durante o processo de treinamento, onde problemas complexos
podem requerer dias e at semanas para que a RNA aprenda. Mesmo com todo este tempo de
treinamento um RNA pode no aprender todos os pares de treinamento que lhes foram
apresentados.
0.0.0.0 Funes de Ativao
A funo de ativao de um neurnio uma funo no-linear que quando aplicada as
entradas de um neurnio determina a sada do mesmo. As faixas de valores de algumas
funes so limitadas de 0 a 1 enquanto outras de 1 a +1. As funes de ativao mais
usadas so a funo sigmide binria, a funo sigmide bipolar, a funo tangente
hiperblica e a funo arco-tangente escalar (GUMZ, 2002, p. 39).
A maioria dos modelos de RNA-FM usam a funo de ativao logstica sigmide
binria (formato de S), que representada na Figura 8. Ela pode ser definida como uma
funo real cujo domnio so os nmeros reais, a derivada sempre positiva e a faixa de
valores limitada (MASTERS, 1993, p. 81). A funo de ativao logstica sigmide d-se
por:
f(x)=1/(1 + e-x) (2-4)
cuja derivada
f(x) = f(x)*(1- f(x)) (2-5)
-
38
onde o valor mximo usado + 1,0 e o valor mnimo 0,0. Lembrando sempre que as
funes sigmides nunca alcanam seus tericos mnimo e mximo, geralmente os neurnios
so considerados totalmente ativados por volta de 0,9 e desativados por volta de 0,1. Onde se
pode dar como entrada numa rede os valores extremos de 1,0 e 0,0; mas nunca tentar treinar a
rede para alcan-los. Em muitos casos tm-se verificado que a forma exata da funo tem
pouco efeito no poder final da rede, embora possa ter impacto significante na velocidade de
treino (MASTERS, 1993, p. 81).
Fonte: Masters (1993, p. 81).
Figura 8 Funo logstica de ativao sigmide binria.
0.0.0.0 Treinamento e Aprendizado
Segundo Tafner, Xerez e Rodrigues Filho (1996, p. 65), o treinamento das RNAs
acontece basicamente de duas formas, sendo por aprendizado supervisionado e aprendizado
no-supervisionado. No aprendizado supervisionado so apresentados a RNA pares de entrada
e sada, ou seja, um conjunto de entradas e um conjunto de sadas desejadas para cada entrada.
J no aprendizado no-supervisionado no existem sadas desejadas, para o treinamento da
rede so usados apenas os valores de entradas, e atravs destes valores que a rede se
organiza de modo a classificar as entradas.
A maioria das aplicaes das RNAs so treinadas atravs do aprendizado
supervisionado, onde o objetivo principal de treinar uma rede ajustar seus pesos de tal forma
que para um vetor de entrada produza-se um vetor desejado de sada, onde para cada entrada
amostrada, emparelha-se uma sada (LOESCH, 1996, p. 71).
-
39
0.0.0.0.0 Aprendizado por Retropropagao (backpropagation)
O mtodo de treino por retropropagao, ou backpropagation, foi o primeiro mtodo
de treino para a RNA-FM. Este mtodo consiste basicamente de duas etapas executadas
atravs das camadas da rede: um passo para frente a propagao e um passo para trs, a
retropropagao. Na sua forma bsica, a retropropagao chamada por analistas numricos
de algoritmo de inclinao de gradiente, que determina a direo de um passo de clculo.
Na propagao um vetor de entrada aplicado aos pesos da rede e seu efeito
propagado para frente camada por camada at a camada de sada, produzindo um conjunto de
valores de sadas como resposta da rede. Aps verificado se a resposta desejada da rede era
igual a esperada de acordo com o vetor de sada, caso no seja calculado um erro e este
retropropagado para correo de todos os pesos da rede (HAYKIN, 2001, p. 184). Este ajuste
dos pesos executado de acordo com uma taxa de aprendizado, em que se for muito pequena
ir convergir muito devagar e se for muito grande, ir saltar e nunca ir convergir
(MASTERS, 1993, p. 100).
Primeiramente o treino comea com todos os pesos da RNA iniciados com pequenos
valores no-zero, freqentemente gerados randomicamente ou por algoritmos especficos
como o fortalecimento simulado (simulated annealing). Ento pares de treinamento da
coleo de amostras so apresentados a rede, um de cada vez (MASTERS, 1993, p.111). Uma
medida do erro feita pela rede, atravs da comparao de seus valores de sadas, aps
calculado um valor que ir auxiliar na correo dos pesos da rede, designado como delta4, e
por ltimo os pesos da rede so atualizados de um modo a reduzir o erro. Todo este processo
de apresentar as entradas RNA, calcular as ativaes das camadas, calcular os valores dos
deltas e o erro, chamado de epoch. As medidas de erro mais conhecidas so: erro quadrado
mdio (mean square error), erro absoluto mdio (mean absolut error), erro de Kalman-
Kwasny, entropia cruzada (cross entropy), erro mximo quadrado (maximum squared error),
mean log error, alm de outros (MASTERS, 1993, p. 40-49).
A medida mais comum do erro dada pelo erro quadrado mdio ou EQM, nas
ativaes de sada. A correta ativao alvo do neurnio de sada j designada como dj, e a
4 importate salientar que quando houver referncia ao termo delta, o mesmo pode significar um ponto caractersitico da ID, ou o valor utilizado no algoritmo de aprendizado da rede. Para tanto deve-se analisar o contexto em que o termo encontra-se.
-
40
ativao observada yj. Se existirem n neurnios de sada, o erro para a simples apresentao
= =
n
j 1
(dj - yj)2 (2-6)
A frmula para calcular o delta dos neurnios difere entre a camada de sada e as
camadas ocultas. Para simplificar o clculo pode-se dividir as frmulas sendo o clculo do
erro da frmula 2-7 para a camada de sada e 2-8 para as camadas ocultas.
j(k) = dj - yj (2-7)
j(k) =+
=
1
1
Nk
i
(i(k+1)* wij (k+1)) (2-8)
Aplicando as frmulas 2-7 e 2-8 na frmula 2-9 tem-se o clculo do valor do delta na
camada k.
j(k) = j(k) * f(redej) (2-9)
Onde k o nmero da camada atual; j(k) o valor do delta calculado na camada k; wij
o peso que conecta o neurnio j desta camada oculta com o neurnio i da camada anterior.
importante lembrar que na frmula 2-8 o i(k+1) refere-se ao valor do delta calculado na
camada seguinte e que utilizado para o clculo do delta da camada atual.
Aps realizar todo este clculo realizado o ajuste de todos os pesos da RNA,
conforme a frmula 4-5.
wj(k) = wj
(k) + 2j(k)*xj(k) (2-10)
Onde wj(k) o peso a ser ajustado do neurnio j na camada k; o valor da taxa de
aprendizado; j(k) o valor do delta calculado na camada k; e o xj(k) o valor de entrada do
neurnio j na camada k (LOESCH, 1996, p. XX).
-
41
2.4.2.5 Escolha da Estrutura das Redes
Normalmente a quantidade de neurnios existentes tanto na camada de entrada como
na camada de sada determinado pelo tipo de problema a ser resolvido, j a quantidade de
neurnios na camada oculta podem variar consideravelmente. O neurnio na camada oculta
ser associado ao acrnimo NO de agora em diante.
Uma soluo inicial para a quantidade de NOs de uma RNA dada na frmula (2-11).
O = nm* (2-11)
Onde m a quantidade de neurnios de sada e n a de entrada e O a quantidade de
NOs.
Aps ser treinada e testada, a RNA pode no apresentar resultados satisfatrios, isto
pode ocorrer devido a existncia de muitos NOs ocasionando o superajustamento.
Recomenda-se iniciar o treino com poucos neurnios artificiais nesta camada (GUMZ, 2002,
p. 44).
2.5 CONTEXTO ATUAL DO TRABALHO
Analisando-se os trabalhos de Costa (2000), Hong (1998), Gumz (2002) entre outros
verificou-se que, muitos sistemas biomtricos que utilizam o reconhecimento atravs das IDs
usam como base um fator importantssimo que so as comparaes das mincias. Mas poucos
trabalhos, pelo que se tem conhecimento, utilizam outras tcnicas, como por exemplo a
comparao entre as distncia do(s) delta(s) e do ncleo.
2.5.1 Trabalhos Correlatos
Os trabalhos correlatos encontrados foram os trabalhos de:
a) Hong (1998). Este o trabalho mais completo, onde apresentou-se um estudo
detalhado sobre os passos da construo de um AFIS: aquisio de ID, pr-
processamento, mapa de direes, classificao e extrao de mincias.
b) Silva (1999). Foi desenvolvido um prottipo para classificao de ID nos tipos
fundamentais: arco, presilha interna, presilha externa e verticilo. Para tanto o autor
-
42
tambm utilizou a construo de mapa de direes. No prottipo foi utilizada uma
RNA perceptron feedforward treinada por retropropagao.
b) Costa (2000). Foram apresentadas frmulas para pr-processamento de IIDs,
conceitos e algumas tcnicas para classificao e extrao de mincias. Efetuou-se
apenas concluses sobre o mapa de direes das cristas papilares.
b) Pankanti (2000). Comentou vrios mtodos de identificao biomtrica existentes,
dando destaque especial ao AFIS, realizando a comparao entre os mesmos.
b) Gumz (2002). Foi desenvolvido um prottipo para identificao e classificao das
mincias de uma ID. O trabalho bem detalhado e mostra passo a passo o estudo
realizado.
b) Reis (2003). Neste trabalho apresentada uma soluo para deteco das mincias
e um clculo para o encontro do ncleo de uma ID.
Todos os trabalhos relatam com bastante coerncia o estudo/desenvolvimento de seus
trabalhos. Em especial nos trabalho de concluso de curso de Alex Sandro da Silva e Rafael
Arajo Gumz foram sugeridos como extenso a identificao automtica do(s) delta(s) e
ncleo das ID.
-
43
0 DESENVOLVIMENTO DO PROTTIPO
Nas prximas sees sero apresentados os requisitos do prottipo, uma viso geral da
soluo proposta bem como o desenvolvimento do prottipo.
0.0 REQUISITOS PRINCIPAIS DO PROBLEMA A SER TRABALHADO
O prottipo do sistema deve atender aos seguintes requisitos:
c) criar, treinar,validar e executar a RNA5;
c) possibilitar o treinamento manual ou automtico da RNA atravs de fragmentos de
imagens;
c) possibilitar salvar os pesos da RNA aps o seu treinamento;
c) possibilitar carregar os pesos da RNA para a continuao de um treinamento;
c) possibilitar a validao manual ou automtica da RNA atravs de fragmentos de
imagens;
c) possibilitar o cadastramento de usurios juntamente com sua IID;
c) possibilitar carregar uma IID para comparao com as demais IIDs j cadastradas;
0.0 VISO GERAL
Antes da seo de especificao, se faz necessria uma abordagem prvia de como ser
o funcionamento geral do prottipo para que o leitor possa conhecer alguns conceitos
necessrios para as prximas sees.
Inicialmente o prottipo deve permitir que o especialista treine a RNA passando como
entrada para a rede um vetor que ser gerado com base nos fragmentos de imagens de
tamanho 20x20 pixels. Estas imagens sero de regies dos deltas, regies do ncleo e
regies quaisquer, conforme apresentado na Figura 9. Este treinamento como j citado na
seo 3.1, poder ocorrer de forma automtica ou manual. Uma vez que a RNA esteja
treinada sero gravados os pesos da mesma e a partir de ento o usurio do prottipo poder
iniciar o cadastramento de usurios bem como executar a opo comparao das IDs.
5 O termo RNA ser utilizado a partir de agora para representar a RNA-FM, pois esta ser a nica rede implementada no prottipo.
-
44
Figura 9 Exemplo de regies da IID passadas como entrada para a RNA.
Ao realizar o cadastramento de um novo usurio com sua respectiva IID, o sistema ir
armazenar algumas informaes importantes derivadas da IID, para a extrao destas
caractersticas foi utilizada uma heurstica que de agora em diante iremos chamar de
heurstica do clculo da distncia. Atravs desta heurstica que o prottipo ir identificar
se uma IID igual a outra ou no. Para que se possa explicar o funcionamento desta heurstica
fazem-se necessrias algumas definies. Uma definio inicial apresentada na Figura 10,
onde dividiu-se uma IID em 5 regies, chamados de agora em diante de quadrantes.
Figura 10 Definio da diviso de quadrantes numa IID.
A idia inicial da heurstica do clculo da distncia de varrer os quadrantes 3, 4
para obter as posies dos deltas bem como o quadrante 5 para obter a posio do ncleo.
Esta varredura consistir em passar fragmentos de imagens 20x20 para validao da RNA de
todo o espao dos quadrantes incrementando-se as linhas e colunas dos mesmos. Quando for
encontrado o delta no quadrante 3 e 4, ou um ncleo no quadrante 5 deve-se guardar a posio
-
45
e interromper a varredura no quadrante atual. importante lembrar que uma vez que a RNA
esteja bem treinada a mesma ir encontrar obrigatoriamente um ou nenhum delta nos
quadrantes 3 e 4, e um ncleo no quadrante 5. Caso isto no ocorra pode-se constatar que a
IID est com pouca nitidez, ou que a RNA ainda se encontra com um desempenho
insatisfatrio.
Uma vez com as posies encontradas do(s) delta(s) e ncleo atravs das coordenadas
iniciais do fragmento 20x20, ir se utilizar das coordenadas (x,y) das regies para se calcular
a distncia entre delta(s) e ncleo, ou at entre os prprios deltas. No caso da ID ser uma
presilha externa ou presilha interna apenas ser traada uma distncia como pode ser
visualizado na Figura 11 pelo valor A, em contrapartida quando a ID for um verticilo poder
se ter uma maior exatido, pois podero ser calculadas 3 distncias para a comparao, entre
cada um dos dois deltas e o ncleo e entre os prprios deltas, conforme a Figura 11, para os
valores A, B e C. Quando a ID for um arco, no poder se calcular nenhuma distncia, ou
seja, esta heurstica apenas funcionar para 3 dos 4 tipos fundamentais.
Figura 11 Exemplo de distncias calculadas para os 3 tipos fundamentais de ID.
0.0 ESPECIFICAO
A especificao do prottipo ser apresentada atravs dos diagramas de casos de uso
primrio e secundrio, e do diagrama de classe. Os diagramas apresentados seguiro a notao
da UML. Assim como as classes implementadas no prottipo seguiro os conceitos de
-
46
orientao a objetos. Todos os desenhos dos diagramas foram realizamos na ferramenta
Rational Rose 2002 verso demo da Rational Rose Corporation. Maiores informaes sobre a
ferramenta pode ser obtidas no site Rational (2002).
0.0.0 Casos de Uso
Os casos de uso primrios e secundrio, mostrados do uma idia dos processos
envolvidos no prottipo, conforme mostrados nas Figuras 12, 13 e 14.
Figura 12 Diagrama de caso de uso primrio do ator Especialista.
Figura 13 Diagrama de caso de uso primrio do ator Usurio.
-
47
Figura 14 Diagrama de caso de uso secundrio do ator Usurio.
0.0.0 Diagramas de Classes
Na Figura 15 apresentado o diagrama de classes do prottipo, onde podem ser
visualizadas as 3 classes existentes no mesmo, sendo elas: Integrao, RedeNeural e Usurio.
A classe Integrao a classe que contempla todos os mtodos que iro comunicar-se com as
outras duas classes. Um exemplo destes mtodos pode ser o mtodo de converso de um
fragmento de imagem 20x20 pixels para os dados de entrada da Rede Neural. A classe
Usurio comunica-se com a classe Integrao pois junto com o cadastramento do usurio e
sua digital, j so gravados os valores das distncias calculados atravs do mtodo da
heurstica do clculo da distncia. E por fim a classe RedeNeural contempla todos os
mtodos referentes ao treinamento e validao da rede. Como j citado qualquer mtodo que
deva auxiliar a rede, mas no faz parte do seu treinamento e validao foi encapsulado na
classe Integrao.
Figura 15 Diagrama de Classes do prottipo.
-
48
Por no ser o foco principal do prottipo o cadastramento do usurio, apenas ser
detalhada a seguir a classe da Integrao e RedeNeural.
0.0.0 Integrao
A classe Integrao uma classe mediadora entre as classes Usurio e RedeNeural,
nesta classe esto presentes todos os mtodos necessrios para o funcionamento do prottipo,
mas que no poderiam fazer parte de nenhuma das outras duas classes. Como o prprio nome
j diz, uma classe que integra as demais classes servindo de ponte para a troca de
mensagem entre elas.
Segue uma explicao dos principais atributos desta classe:
c) wAltFragImg: Altura do fragmento das imagens a serem convertidos nos dados de
entrada da RNA, utilizado 20 pixels.
c) wLarFragImg: Largura do fragmento das imagens a serem convertidos nos dados
de entrada da RNA, utilizado 20 pixels.
Seguem os principais mtodos desta classe:
c) pConverteBitMapParaVetorEntrada: este o mtodo que converte um fragmento
de imagem 20x20 pixels para os dados que serviro de entrada para a RNA;
c) pCarregaMatrizPesos: mtodo que carrega a matriz de pesos do arquivo para a
memria;
c) pRetornaDistanciasDigital: mtodo que calcula as distncias entre os pontos
caractersticos das IIDs.
0.0.0 Classe da Rede Neural
Na classe RedeNeural a maioria dos atributos so privados, com exceo dos vetores
de pesos da RNA que so acessados por vrios pontos do sistema. Na classe tambm
encontram-se alguns mtodos privados que so os de manipulao interna da classe e outros
pblicos que so chamados de alguns pontos fora da classe.
Importante destacar dois tipos de dados muito importantes para a classe da Rede
Neural, so eles os tipo: TArray1D e TArray2D. Estes tipos de dados como mostrados a
-
49
seguir, so tipos de arrays (vetores) dinmicos, que podem ter seu tamanho alterado em
tempo de execuo, so eles:
a) TArray1D = Array of Double: tipo usado para definir arrays dinmicos de uma
dimenso (1D) do tipo Double. O Double representa nmeros reais com ponto
flutuante ocupa 8 bits de espao em memria
b) TArray2D = Array of Array of Double: tipo usado para definir arrays dinmicos
de duas dimenses (2D) do tipo Double.
Segue uma explicao dos principais atributos da classe RedeNeural:
a) wNeuroniosEntrada: quantidade de neurnios da camada de entrada;
b) wNeuroniosOculta: quantidade de neurnios da camada oculta;
c) wNeuroniosSaida: quantidade de neurnios da camada de sada;
d) wTaxaAprendizado: valor da taxa de aprendizado utilizada durante a correo dos
pesos da RNA;
e) wToleranciaErro: valor da tolerncia de erro a qual ir indicar se a RNA aprendeu
ou no;
f) wMaxIteracoes: valor mximo de iteraes a qual a RNA ser submetida. Espera-
se que a rede sempre convirja antes deste valor;
g) wVetPesosOculta: vetor que ir guardar os valores dos pesos entre os neurnios da
camada de entrada e camada oculta;
h) wVetPesosSaida: vetor que ir guardar os valores dos pesos entre os neurnios da
camada oculta e camada de sada;
i) wVetAtivacoesOculta: vetor que guarda os valores de ativaes de todos os
neurnios da camada oculta, ativados durante o processo de propagao;
j) wVetAtivacoesSaida: vetor que guarda os valores de ativaes de todos os
neurnios da camada de sada, ativados durante o processo de propagao;
k) wVetDeltaSaida: vetor que guarda os valores dos deltas de cada neurnio,
calculados na camada de sada;
l) wVetDeltaOculta: vetor que guarda os valores dos deltas de cada neurnio,
calculados na camada oculta;
Segue uma explicao dos principais mtodos da classe RedeNeural:
a) pRandomizaPesos: mtodo que randomiza os pesos da RNA com valores prximos
a zero para a inicializao do treinamento;
-
50
b) pTreinaRNABackPropagation: mtodo principal de treinamento que chama os
demais mtodos para que a RNA seja treinada;
c) pAtivaNeuronios: mtodo que ativa os neurnios da camada oculta e camada de
sada. Para tanto so utilizados os valores de entrada e os valores dos vetores de
pesos;
c) pCalculaDeltaSaida: mtodo que calcula os valores dos deltas de todos os
neurnios da camada de sada;
c) pCalculaDeltaOculta: mtodo que calcula os valores dos delta de todos os
neurnios da camada oculta;
c) pAjustaPesos: mtodo que realiza o ajuste dos pesos nos vetores quando uma
determinada amostra gerou um erro acima da tolerncia de erro;
c) fFuncaoAtivacao: mtodo da funo sigmide binria, utilizada na ativao dos
neurnios;
c) fDerivadaFuncaoAtivacao: mtodo da derivada da funo sigmide binria,
utilizada para o clculo do delta dos neurnios da camada de sada e oculta;
c) fCalculaEQM: mtodo que calcula o erro quadrado mdio (EQM) de uma amostra
de treinamento;
c) fTestaRNA: mtodo que testa a RNA aps efetuado seu treinamento;
0.0.0 Estrutura da Rede
Inicialmente uma das preocupaes numa aplicao utilizando RNA deve ser com
relao a quantidade de camadas ocultas da rede e a quantidade de neurnios presentes tanto
na camada de entrada, quanto na(s) camada(s) oculta(s) e camada de sada. Sabe-se que se um
mesmo problema for dado a vrios projetistas de RNAs todos podem apresentar solues com
RNAs estruturadas de maneira completamente diferentes. Para a implementao do prottipo
definiu-se o uso de apenas uma camada oculta.
O nmero de neurnios utilizados na camada de entrada foi de 400, este valor a
representao de cada pixel dos fragmentos das IIDs de tamanho de 20x20 pixels. A
quantidade de neurnios na camada de sada ser igual a 1, que indicar atravs de faixas de
valores a regio dada na entrada da rede. E por ltimo, definiu-se a quantidade de neurnios
na camada seguindo a frmula (2-11) descrita a seo 2.4, onde O = 1*400 , totalizando 20
neurnios nesta camada.
-
51
Inicialmente se treinar a rede com 20 neurnios na camada oculta, caso esta rede
mostre pouco poder de generalizao, ir se seguir indicaes de alguns autores, onde dever
se aumentar ou diminuir esta quantidade de neurnios um a um at que se encontre um
melhor desempenho.
0.0.0 Parmetros de Treino
Os parmetros de treino so to importantes quanto a definio da quantidade de
neurnios presentes em cada camada. O algoritmo backpropagation implementado conta com
3 parmetros extremamente importantes sendo eles: quantidade mxima de iteraes, taxa de
aprendizagem e valor da tolerncia ao erro.
A quantidade mxima de iteraes o mais simples, ele um critrio de parada, onde
se o erro desejado no for alcanado usado para interromper o