Sistema ocr

17
MINISTÉRIO DA EDUCAÇÃO SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA TRIÂNGULO MINEIRO – Campus Uberlândia Sistema para Deficientes Visuais e Instrutores com redes neurais e OCR Adilmar Coelho Dantas Suprior em Sistema para Internet

description

Sistema OCR com mapeamento de caracteres (imagem) para deficientes desenvolvido usando rede neural.

Transcript of Sistema ocr

Page 1: Sistema ocr

MINISTÉRIO DA EDUCAÇÃO

SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA

TRIÂNGULO MINEIRO – Campus Uberlândia

Sistema para Deficientes Visuais e Instrutores com redes neurais e OCR

Adilmar Coelho DantasSuprior em Sistema para Internet

Page 2: Sistema ocr

SumárioIntrodução..........................................................................................................................3

História..............................................................................................................................3

Tecnologia Assistiva.........................................................................................................3

Objetivo da tecnologia assistiva........................................................................................4

Categorias da tecnologia assistiva.....................................................................................4

Redes neurais.....................................................................................................................8

O Neurônio Artificial e a Rede Neural..........................................................................9

O Neurônio Artificial....................................................................................................9

A Rede Neural Artificial (Multilayer Perceptron).......................................................10

Funcionamento................................................................................................................12

Objetivo...........................................................................................................................12

Desenvolvimento.............................................................................................................12

Manual.............................................................................................................................12

Anexos.............................................................................................................................13

Page 3: Sistema ocr

Introdução

O sistema consiste em apoiar pessoas com deficiências visuais em seus estudos e para executarem tarefas do seu dia a dia como, por exemplo, ler o que está escrito em algum anúncio. Além disso, ele possui material de apoio para que eles possam através de aulas em voz estudarem para processo seletivos como vestibulares e concursos.

OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escritos à mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador.

História

Em 1950 David Shepard e Louis Tordella começaram a pesquisa do procedimento para automação de dados da então Agência de Segurança das Forças Armadas (AFSA) dos Estados Unidos, que dois anos depois se tornaria a Agência de Segurança Nacional (NSA). Com a ajuda de Harvey Cook eles construíram o "Gismo", o primeiro software de OCR. Shepard então fundou a Intelligent Machines Research Corporation (IMR) que fez os primeiros softwares OCR comerciais.

Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.

Tecnologia Assistiva

Tecnologia Assistiva é um termo ainda novo, utilizado para identificar todo o arsenal de Recursos e Serviços que contribuem para proporcionar ou ampliar habilidades funcionais de pessoas com deficiência e consequentemente promover Vida Independente e Inclusão.

É também definida como "uma ampla gama de equipamentos, serviços, estratégias e práticas concebidas e aplicadas para minimizar os problemas encontrados pelos indivíduos com deficiências" (COOK E HUSSEY • Assistive Technologies: Principles and Practices • Mosby – Year Book, Inc., 1995).

No Brasil, o Comitê de Ajudas Técnicas - CAT, instituído pela PORTARIA N° 142, DE 16 DE NOVEMBRO DE 2006 propõe o seguinte conceito para a tecnologia assistiva: "Tecnologia Assistiva é uma área do conhecimento, de característica interdisciplinar, que engloba produtos, recursos, metodologias, estratégias, práticas e serviços que objetivam promover a funcionalidade, relacionada à atividade e participação de pessoas com deficiência, incapacidades ou mobilidade reduzida, visando sua autonomia, independência, qualidade de vida e inclusão social" (ATA VII - Comitê de Ajudas Técnicas (CAT) - Coordenadoria Nacional para Integração da Pessoa

Page 4: Sistema ocr

Portadora de Deficiência (CORDE) - Secretaria Especial dos Direitos Humanos - Presidência da República).

O termo Assistive Technology, traduzido no Brasil como Tecnologia Assistiva, foi criado em 1988 como importante elemento jurídico dentro da legislação norte-americana conhecida como Public Law 100-407 e foi renovado em 1998 como Assistive Technology Act de 1998 (P.L. 105-394, S.2432). Compõe, com outras leis, o ADA - American with Disabilities Act, que regula os direitos dos cidadãos com deficiência nos EUA, além de prover a base legal dos fundos públicos para compra dos recursos que estes necessitam.

Objetivo da tecnologia assistiva

Proporcionar à pessoa com deficiência maior independência, qualidade de vida e inclusão social, através da ampliação de sua comunicação, mobilidade, controle de seu ambiente, habilidades de seu aprendizado, trabalho e integração com a família, amigos e sociedade.

Categorias da tecnologia assistiva

A classificação abaixo foi construída com base nas diretrizes gerais da ADA, porém não é definitiva e pode variar segundo alguns autores.

A importância das classificações no âmbito da tecnologia assistiva se dá pela promoção da organização desta área de conhecimento e servirá ao estudo, pesquisa, desenvolvimento, promoção de políticas públicas, organização de serviços, catalogação e formação de banco de dados para identificação dos recursos mais apropriados ao atendimento de uma necessidade funcional do usuário final.

1

Auxílios para a vida diária

Materiais e produtos para auxílio em tarefas rotineiras tais como comer, cozinhar, vestir-se, tomar banho e executar necessidades pessoais, manutenção da casa etc.

Page 5: Sistema ocr

2

CAA (CSA)Comunicação aumentativa

(suplementar) e alternativa

Recursos, eletrônicos ou não, que permitem a comunicação expressiva e receptiva das pessoas sem a fala ou com limitações da mesma. São muito utilizadas as pranchas de comunicação com os símbolos PCS ou Bliss além de vocalizadores e softwares dedicados para este fim.

3

Recursos de acessibilidade ao

computador

Equipamentos de entrada e saída (síntese de voz, Braille), auxílios alternativos de acesso (ponteiras de cabeça, de luz), teclados modificados ou alternativos, acionadores, softwares especiais (de reconhecimento de voz, etc.), que permitem as pessoas com deficiência a usarem o computador.

4

Sistemas de controle

de ambienteSistemas eletrônicos que permitem as pessoas com limitações moto-locomotoras, controlar remotamente aparelhos eletroeletrônicos, sistemas de segurança, entre outros, localizados em seu quarto, sala, escritório, casa e arredores.

Page 6: Sistema ocr

5

Projetos arquitetônicos

para acessibilidade

Adaptações estruturais e reformas na casa e/ou ambiente de trabalho, através de rampas, elevadores, adaptações em banheiros entre outras, que retiram ou reduzem as barreiras físicas, facilitando a locomoção da pessoa com deficiência.

6

Órteses e próteses

Troca ou ajuste de partes do corpo, faltantes ou de funcionamento comprometido, por membros artificiais ou outros recurso ortopédicos (talas, apoios etc.). Inclui-se os protéticos para auxiliar nos déficits ou limitações cognitivas, como os gravadores de fita magnética ou digital que funcionam como lembretes instantâneos.

7

Adequação Postural

Adaptações para cadeira de rodas ou outro sistema de sentar visando o conforto e distribuição adequada da pressão na superfície da pele (almofadas especiais, assentos e encostos anatômicos), bem como posicionadores e contentores que propiciam maior estabilidade e postura adequada do corpo através do suporte e posicionamento de tronco/cabeça/membros.

Page 7: Sistema ocr

8

Auxíliosde mobilidade

Cadeiras de rodas manuais e motorizadas, bases móveis, andadores, scooters de 3 rodas e qualquer outro veículo utilizado na melhoria da mobilidade pessoal.

9Auxílios para cegos ou com

visão subnormal Auxílios para grupos específicos que inclui lupas e lentes, Braille para equipamentos com síntese de voz, grandes telas de impressão, sistema de TV com aumento para leitura de documentos, publicações etc.

10

Auxílios para surdos ou com déficit auditivo Auxílios que incluem vários equipamentos

(infravermelho, FM), aparelhos para surdez, telefones com teclado — teletipo (TTY), sistemas com alerta táctil-visual, entre outros.

11

Adaptações em veículos

Acessórios e adaptações que possibilitam a condução do veículo, elevadores para cadeiras de rodas, camionetas modificadas e outros veículos automotores usados no transporte

Page 8: Sistema ocr

pessoal.

Redes neurais

As redes neurais artificiais consistem em um método de solucionar problemas de inteligência artificial, construindo um sistema que tenha circuitos que simulem o cérebro humano, inclusive seu comportamento, ou seja, aprendendo, errando e fazendo descobertas. São mais que isso, são técnicas computacionais que apresentam um modelo inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento através da experiência. Uma grande rede neural artificial pode ter centenas ou milhares de unidades de processamento, enquanto o cérebro de um mamífero pode ter bilhões de neurônios. Apesar da complexidade da redes neurais não permitir uma única definição, as linhas seguintes seguem como uma tentativa das inúmeras definições ou interpretações do que seja realmente uma rede neural.

        Um grafo direcionado é um objeto geométrico que consiste de um conjunto de pontos, chamados nós, ao longo de um conjunto de segmentos de linhas direcionadas entre eles. Uma rede neural é uma estrutura de processamento de informação distribuída paralelamente na forma de um grafo direcionado, com algumas restrições e definições próprias.

        Os nós deste grafo são chamados elementos de processamento. Suas arestas são conexões, que funcionam como caminhos de condução instantânea de sinais em uma única direção, de forma que seus elementos de processamento podem receber qualquer número de conexões de entrada. Estas estruturas podem possuir memória local, e também possuir qualquer número de conexões de saída desde que os sinais nestas conexões sejam os mesmos. Portanto, estes elementos tem na verdade uma única conexão de saída, que pode dividir-se em cópias para formar múltiplas conexões, sendo que todos carregam o mesmo sinal.

        Então, a única entrada permitida para a função de transferência (que cada elemento de processamento possui) são os valores armazenados na memória local do elemento de processamento e os valores atuais dos sinais de entrada nas conexões recebidas pelo elemento de processamento. Os únicos valores de saída permitidos a partir da função de transferência são valores armazenados na memória local do elemento de processamento, e o sinal de saída do mesmo.

        A função de transferência pode operar continuamente ou episodicamente. Sendo que no segundo caso, deve existir uma entrada chamada "activate" que causa o ativamento da função de transferência com o sinal de entrada corrente e com valores da memória local, e produzir um sinal de saída atualizado (ocasionalmente alterando valores da memória). E no primeiro caso, os elementos estão sempre ativados, e a entrada "activate" chega através de uma conexão de um elemento de processamento agendado que também é parte da rede.

Page 9: Sistema ocr

          Sinais de entrada para uma rede neural a partir de fora da rede chegam através de conexões que se originam do mundo externo,  saídas da rede para o mundo externo são conexões que deixam a rede.

        De forma geral, a operação de uma célula da rede se resume em:

Sinais são apresentados à entrada; Cada sinal é multiplicado por um peso que indica sua influência na saída da

unidade; É feita a soma ponderada dos sinais que produz um nível de atividade; Se este nível excede um limite (threshold) a unidade produz uma saída;

O Neurônio Artificial e a Rede Neural

        Assim como o sistema nervoso é composto por bilhões de células nervosas, a rede neural artificial também seria formada por unidades que nada mais são que pequenos módulos que simulam o funcionamento de um neurônio. Estes módulos devem funcionar de acordo com os elementos em que foram inspirados, recebendo e retransmitindo informações.

O Neurônio Artificial

        O fisiologista Warrem MacCulloch interpretou o funcionamento do neurônio biológico como sendo um circuito de entradas binárias combinadas por uma soma ponderada (com pesos) produzindo uma entrada efetiva:

fig06-Modelo de McCulloch e Pitts

        No modelo geral de neurônio (fig06) as entradas WiUi são combinadas usando uma função F, para produzir um estado de ativação do neurônio (correspondente à frequência de descarga do neurônio biológico).As entradas chegam através dos dendritos e tem um peso atribuído pela sinapse.

Page 10: Sistema ocr

fig07-Esquema de um neurônio artificial

        A função básica de um neurônio é somar as entradas e retornar uma saída, caso esse valor seja maior que o valor de soma (threshold).

 

A Rede Neural Artificial (Multilayer Perceptron)

          A rede neural artificial é um sistema de neurônios ligados por conexões sinápticas divididos em neurônios de entrada, que recebem estímulos do meio externo, neurônios internos ou hidden (ocultos) e neurônios de saída, que se comunicam com o exterior. A forma de arranjar perceptrons em camadas é denominado Multilayer Perceptron. O multilayer perceptron foi concebido para resolver problemas mais complexos, os quais não poderiam ser resolvidos pelo modelo de neurônio básico. Um único perceptron ou uma combinação das saídas de alguns perceptrons poderia realizar uma operação XOR, porém, seria incapaz de aprendê-la. Para isto são necessárias mais conexões, as quais só existem em uma rede de perceptrons dispostos em camadas. Os neurônios internos são de suma importância na rede neural pois provou-se que sem estes torna-se impossível a resolução de problemas linearmente não separáveis. Em outras palavras pode-se dizer que uma rede é composta por várias unidades de processamento, cujo funcionamento é bastante simples. Essas unidades, geralmente são conectadas por canais de comunicação que estão associados a determinado peso. As unidades fazem operações apenas sobre seus dados locais, que são entradas recebidas pelas suas conexões. O comportamento inteligente de uma Rede Neural Artificial vem das interações entre as unidades de processamento da rede.

        A maioria dos modelos de redes neurais possui alguma regra de treinamento, onde os pesos de suas conexões são ajustados de acordo com os padrões apresentados. Em outras palavras, elas aprendem através de exemplos. Arquiteturas neurais são tipicamente organizadas em camadas, com unidades que podem estar conectadas às unidades da camada posterior.

        A rede neural passa por um processo de treinamento a partir dos casos reais conhecidos, adquirindo, a partir daí, a sistemática necessária para executar adequadamente o processo desejado dos dados fornecidos. Sendo assim, a rede neural é

Page 11: Sistema ocr

capaz de extrair regras básicas a partir de dados reais, diferindo da computação programada, onde é necessário um conjunto de regras rígidas pré-fixadas e algoritmos.  

fig08-Organização em camadas.

 

        Usualmente as camadas são classificadas em três grupos:

Camada de Entrada: onde os padrões são apresentados à rede; Camadas Intermediárias ou Ocultas: onde é feita a maior parte do

processamento, através das conexões ponderadas; podem ser consideradas como extratoras de características;

 Camada de Saída: onde o resultado final é concluído e apresentado.   Redes  neurais são também classificadas de acordo com a arquitetura em que foram implementadas, topologia, características de seus nós, regras de treinamento, e tipos de modelos.

Page 12: Sistema ocr

Funcionamento

O sistema funciona totalmente operado somente por voz e por comandos do teclado, ou seja, para cada movimento o deficiente ouve e interpreta sua ação executada no sistema, um sistema implantado de biblioteca da MICROSOFT faz a parte de OCR em que através de uma interface o usuário consegue digitalizar documentos ouvi-los ou ate mesmo salva-los em uma biblioteca eliminando assim a necessidade bastante questionada pelos próprios deficientes de que muitas das vezes seus instrutores não tinham tempo de lerem livros dos quais eles sentiam vontade e que ainda não foram lançados embraile.

O Software e composto de módulos divididos por faixa etária se posicionam da seguinte maneira.

Infantil: Histórias e Material educacional

Adulto: Material escolar (Português, matemática, historia, física, etc.).

Instrutor: Sistema OCR, Biblioteca Virtual.

Objetivo

O principal objetivo do Software e proporcionar a inclusão digital dessas pessoas com deficiência permitindo que este material seja compartilhado via web (livros.txt – para serem lidos pelo sistema) através de um site.

Desenvolvimento

Plataforma DELPHI 7 + Plugin MICROSOFT OFFICE OCR + NEURAL DELPHI

A instalação e os requisitos para que o sistema rode com desempenho total são mínimos já que o sistema não exige interfaces sobrecarregadas.

Manual

Desenvolver um manual após o desenvolvimento

Teclas de navegação TAB / ENTERCalibração de Voz do sistema (manual em anexo)

Page 13: Sistema ocr

Anexos