indroduction and vision computer

110
UNIVERSIDADE DE BRASÍLIA FACULDADE DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA MECÂNICA SISTEMA DE VISÃO ROBÓTICA PARA RECONHECIMENTO E LOCALIZAÇÃO DE OBJETOS SOB MANIPULAÇÃO POR ROBÔS INDUSTRIAIS EM CÉLULAS DE MANUFATURA LAERCIO ARRAES JARDIM ORIENTADOR: JOSÉ MAURÍCIO SANTOS TORRES DA MOTTA DISSERTAÇÃO DE MESTRADO EM SISTEMAS MECATRÔNICOS PUBLICAÇÃO: ENM.DM – BRASÍLIA/DF: OUTUBRO – 2006

description

indroduction and vision computer

Transcript of indroduction and vision computer

  • UNIVERSIDADE DE BRASLIA

    FACULDADE DE TECNOLOGIA

    DEPARTAMENTO DE ENGENHARIA MECNICA

    SISTEMA DE VISO ROBTICA PARA

    RECONHECIMENTO E LOCALIZAO DE OBJETOS

    SOB MANIPULAO POR ROBS INDUSTRIAIS EM

    CLULAS DE MANUFATURA

    LAERCIO ARRAES JARDIM

    ORIENTADOR: JOS MAURCIO SANTOS TORRES DA MOTTA

    DISSERTAO DE MESTRADO EM SISTEMAS MECATRNICOS

    PUBLICAO: ENM.DM

    BRASLIA/DF: OUTUBRO 2006

  • ii

    UNIVERSIDADE DE BRASLIA

    FACULDADE DE TECNOLOGIA

    DEPARTAMENTO DE ENGENHARIA MECNICA

    SISTEMA DE VISO ROBTICA PARA IDENTIFICAO

    E LOCALIZAO DE OBJETOS SOB MANIPULAO

    POR ROBS INDUSTRIAIS EM CLULAS DE

    MANUFATURA.

    LAERCIO ARRAES JARDIM

    DISSERTAO SUBMETIDA AO DEPARTAMENTO DE

    ENGENHARIA MECNICA DA FACULDADE DE TECNOLOGIA

    DA UNIVERSIDADE DE BRASLIA COMO PARTE DOS

    REQUISTOS NECESSRIOS PARA A OBTENO DO GRAU

    DE MESTRE EM SISTEMAS MECATRNICOS.

    APROVADA POR:

    _________________________________________________

    Prof. Dr. JOS MAURCIO S. T. DA MOTTA - (ENM-UnB)

    (Orientador)

    _________________________________________________

    Prof. Dra.CARLA MARIA C. C. KOIKE (CIC/UnB)

    (Examinador Externo)

    _________________________________________________

    Prof. Dr. TEODIANO FREIRE BASTOS FILHO - (UFES)

    (Examinador Externo)

    BRASLIA/DF, 19 DE OUTUBRO DE 2006

  • iii

    FICHA CATALOGRFICA

    JARDIM, LAERCIO ARRAES

    Sistema de Viso Robotica para Identificao e Localizao de Objetos sob Manipulao

    por Robs Industriais em Clulas de Manufatura. [Distrito Federal] 2006.

    xvii, 110p., 297 mm (ENM/FT/UnB, Mestre, Sistemas Mecatrnicos, 2006). Dissertao

    de Mestrado Universidade de Braslia. Faculdade de Tecnologia.

    Departamento de Engenharia Mecnica.

    1.Viso computacional 2. Projetivas invariantes

    3. Identificao e localizao de Objetos 4. Vrtices

    I. ENM/FT/UnB II. Ttulo (srie)

    REFERNCIA BIBLIOGRFICA

    JARDIM, L. A. (2006). Sistema de Viso Robtica para Identificao e Localizao de

    Objetos sob Manipulao por Robs Industriais em Clulas de Manufatura. Dissertao de

    Mestrado em Sistemas Mecatrnicos, Publicao ENM.DM-04A/06, Departamento de

    Engenharia Mecnica, Universidade de Braslia, Braslia, DF, 110p.

    CESSO DE DIREITOS

    AUTOR: Laercio Arraes Jardim.

    TTULO: Sistema de Viso Robtica para Identificao e Localizao de Objetos sob

    Manipulao por Robs Industriais em Clulas de Manufatura.

    GRAU: Mestre ANO: 2006

    concedida Universidade de Braslia permisso para reproduzir cpias desta Dissertao

    de Mestrado e para emprestar ou vender tais cpias somente para propsitos acadmicos e

    cientficos. O autor reserva outros direitos de publicao e nenhuma parte dessa dissertao

    de mestrado pode ser reproduzida sem autorizao por escrito do autor.

    ____________________________

    Laercio Arraes Jardim

  • iv

    AGRADECIMENTOS

    Vida,

    Essa ddiva que o Criador nos deu.

    Luz do Sol

    Por brilhar todos os dias de minha vida.

    Aos Mestres

    Por transmitir seus conhecimentos. Em especial, o meu orientador, por seus conhecimentos

    transmitidos com pacincia e dignidade.

    Todas...

    ... as pessoas que me apoiaram.

  • v

    RESUMO SISTEMA DE VISO ROBTICA PARA RECONHECIMENTO E

    LOCALIZAO DE OBJETOS SOB MANIPULAO POR ROBS

    INDUSTRIAIS EM CLULAS DE MANUFATURA

    Autor: Laercio Arraes Jardim

    Orientador: Prof. Dr. Jos Maurcio S. T. da Motta

    Programa de Ps-graduao em Sistemas Mecatrnicos

    Braslia, Outubro de 2006.

    Existem vrias tcnicas de aplicao de viso robtica para o reconhecimento

    (identificao e localizao) de objetos industriais tipicamente encontrados em uma clula

    de manufatura, objetivando a pega e transporte de peas para agrupamento de forma

    inteiramente automtica por manipuladores industriais.

    Viso robtica automtica para objetos industriais complicados uma importante e ainda

    difcil tarefa, especialmente no estgio de extrao de caractersticas desses objetos.

    Prope-se um modelo de reconhecimento de objetos de formatos diversos, utilizando-se de

    extrao de pontos caractersticos (vrtices) para formao de bancos de invariantes, para

    posterior identificao e localizao.

    A fase de identificao dos objetos desenvolvida em dois processamentos, off-line e on-

    line. O processo off-line tem como objetivo gerar um banco de dados, onde seriam

    armazenadas informaes necessrias identificao de objetos. Essas informaes so

    constitudas de vetores de projetivas invariantes. Os vetores de projetivas invariantes so

    gerados atravs de uma lista de vrtices extrados dos objetos chamados modelos. A

    ordenao da lista dos vrtices deve ser de tal maneira que sua seqncia (horria)

    apresente a geometria bsica do modelo. O processo on-line encarrega-se de identificar

    objetos que tenham sido previamente armazenados no banco de dados.

    A fase de localizao foi desenvolvida com o objetivo de determinar posies e

    orientaes de objetos em um sistema de referncia conhecida. possvel relacionar, nesta

  • vi

    fase, os diversos planos que o objeto, devidamente identificado, se encontra, podendo ser o

    plano da imagem, da cmera ou da base do manipulador.

    O reconhecimento de objetos, atravs de sua identificao por projetiva invariante e sua

    localizao em coordenadas da cmera, permitir o posicionamento do manipulador para a

    apreenso com controle de posio e orientao.

  • vii

    ABSTRACT

    There are several techniques for applying robotic vision for identification and localization

    of industrial objects. These objects are typically found in manufacturing cells. The purpose

    is to catch and transport the pieces for automatically grouping.

    Robotic vision for industrial objects is an important and still difficult task, especially

    feature extraction of the object image. For that, this work proposes a model for recognition

    of objects different shapes, most of time symmetric, using the extraction of feature points

    (corners) for creating a database of invariants, for identification and localization.

    The step of object identification is developed in two different processes: on-line and off-

    line. The off-line step has the objective of creating a database, where the information

    needed to identify the objects is recorded by using vectors of invariant projective. These

    vectors are defined from a list of corners extracted from an object image. The order of the

    corners listed is sorted in some way that its sequence shows the basic geometry of the

    model. The on-line process has the objective of identifying the objects previously recorded.

    The localization step was developed to assign positions and orientations of the object in a

    reference coordinate system. At this stage, it is possible to relate all the coordinate frames

    previously assigned to the object, like the image, camera or base manipulator frames

    The recognition of objects, through the identification of invariant projective and its

    localization in camera coordinates, allows the positioning of a manipulator to catch and to

    control it position and orientation.

  • viii

    NDICE

    1. INTRODUO...................................................................................................... 13

    2. NOES DE TICA E PROCESSAMENTO DE IMAGENS........................ 16

    2.1 IMAGENS DIGITAIS NOES DE TICA............................................. 17

    2.1.1 Imagens de Intensidade............................................................................. 17

    2.1.2 tica Bsica................................................................................................ 18

    2.1.3 Radiometria Bsica ................................................................................... 20

    2.1.4 Formao Geomtrica da Imagem........................................................... 21

    2.2 PARMETROS DE CMERAS..................................................................... 23

    2.2.1 Parmetros Extrnsecos ............................................................................ 23

    2.2.2 Parmetros Intrnsecos ............................................................................. 25

    2.3 FILTRAGEM DE RUDOS ............................................................................. 26

    2.3.1 Filtro Linear............................................................................................... 27

    2.4 CARACTERSTICAS DAS IMAGENS ......................................................... 30

    2.4.1 Contorno..................................................................................................... 31

    2.4.2 Vrtices ....................................................................................................... 34

    2.4.3 Centro de Massa ........................................................................................ 36

    2.4.4 Segmentao de Imagem........................................................................... 38

    3. RECONHECIMENTO DE OBJETOS IDENTIFICAO........................... 40

    3.1 Projetiva Invariante para Gerao de Modelos.............................................. 41

    3.2 Configurao Geomtrica do modelo .............................................................. 42

    3.3 Criao do Banco de Invariantes ..................................................................... 44

    3.4 Identificao de Peas por Comparao ......................................................... 45

    3.4.1 Processamento Off-Line............................................................................ 45

    3.4.2 Processamento On-Line ............................................................................ 50

    4. RECONHECIMENTO DE OBJETOS LOCALIZAO ............................. 52

    4.1 Conceitos Bsicos............................................................................................... 52

    4.2 Localizao de Objetos Imagem de Intensidade.......................................... 52

  • ix

    4.2.1 Modelo de Cmera de Perspectiva Completa ......................................... 53

    4.2.2 Modelo de Cmera de Perspectiva Fraca................................................ 55

    4.2.3 Exemplo de Aplicao para Modelo de Cmera de Perspectiva Fraca 56

    5. CONTROLE DO ESPAO OPERACIONAL UTILIZANDO VISO........... 59

    5.1 Aspectos Gerais.................................................................................................. 59

    5.2 Subsistema de Controle do Manipulador........................................................ 59

    5.2.1 Espao Operacional e Espao Junta Cinemtica Direta e Inversa.... 59

    5.2.2 Matriz Jacobiano do Manipulador .......................................................... 61

    5.3 Subsistema de Viso .......................................................................................... 62

    5.3.1 Formao da Imagem................................................................................ 63

    5.3.2 Jacobiano da imagem ................................................................................ 64

    5.3.3 Jacobiano Completo .................................................................................. 65

    5.4 Sistema de Controle Por Viso......................................................................... 67

    5.5 Cinemtica do Erro ........................................................................................... 69

    6. EXPERIMENTOS................................................................................................. 71

    6.1 Identificao dos Objetos.................................................................................. 71

    6.1.1 Processamento Off-line Gerao do Banco de Invariantes ................ 71

    6.1.2 Processamento On-Line Identificao de Objetos............................... 80

    7. CONCLUSO E SUGESTES PARA TRABALHOS FUTUROS............... 107

    REFERNCIAS BIBLIOGRFICAS .......................................................................... 109

  • x

    LISTA DE TABELAS

    TABELA 2.1 - MATRIZ 8X8 DE UMA IMAGEM SINTTICA................................................................................... 17 TABELA 3.1 LISTA DE PONTOS (VRTICES) DO MODELO 1.............................................................................. 47 TABELA 3.2 - LISTA DE PONTOS (VRTICES) DO MODELO 2. ............................................................................. 47 TABELA 3.3 VALORES DOS VETORES INVARIANTES DOS MODELOS 1 E 2. ...................................................... 49 TABELA 6.1 VRTICES DO MODELO 1. ........................................................................................................... 75 TABELA 6.2 VRTICES DO MODELO 2. ........................................................................................................... 76 TABELA 6.3 VRTICES DO MODELO 3. ........................................................................................................... 76 TABELA 6.4 VRTICES DO MODELO 1. ........................................................................................................... 76 TABELA 6.5 VRTICES DO MODELO 2. ........................................................................................................... 76 TABELA 6.6 VRTICES DO MODELO 3. ........................................................................................................... 77 TABELA 6.7 VRTICES DO MODELO 1. ........................................................................................................... 78 TABELA 6.8 VRTICES DO MODELO 2. ........................................................................................................... 78 TABELA 6.9 VRTICES DO MODELO 3. ........................................................................................................... 78 TABELA 6.10 RESULTADO DOS CLCULOS DE PROJETIVA INVARIANTE PARA OS MODELOS 1, 2 E 3.............. 80 TABELA 6.11 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 1. ........................... 82 TABELA 6.12 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 2 ............................ 82 TABELA 6.13 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 3 ............................ 82 TABELA 6.14 VRTICES DO OBJETO (PIXEL).................................................................................................. 85 TABELA 6.15 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 1 ............................ 86 TABELA 6.16 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 2 ............................ 86 TABELA 6.17 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 3. ........................... 87 TABELA 6.18 VRTICES DO OBJETO (PIXEL).................................................................................................. 91 TABELA 6.19 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 1. ........................... 91 TABELA 6.20 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 2. ........................... 92 TABELA 6.21 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 3. ............................ 92 TABELA 6.22 VRTICES DO OBJETO (PIXEL).................................................................................................. 96 TABELA 6.23 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 1. ........................... 96 TABELA 6.24 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 2. ........................... 96 TABELA 6.25 ERROS ENCONTRADOS EM K-COMBINAES DO OBJETO COM O MODELO 3. ........................... 97 TABELA 6.26 LISTA DOS VRTICES (PIXEL) SELECIONADOS DO OBJETO 1. ................................................... 101 TABELA 6.27 LISTA DOS VRTICES (PIXEL) SELECIONADOS DO OBJETO 2. ................................................... 102 TABELA 6.28 LISTA DOS VRTICES (PIXEL) SELECIONADOS DO OBJETO 3. ................................................... 103

  • xi

    LISTA DE FIGURAS

    FIGURA 2.1 (A) IMAGEM EM FORMA DE SUPERFCIE. (B) IMAGEM SINTTICA................................................. 17 FIGURA 2.2 GEOMETRIA TICA DAS LENTES FINAS........................................................................................ 19 FIGURA 2.3 FORMAO DE IMAGENS ATRAVS DAS LENTES FINAS. .............................................................. 20 FIGURA 2.4 MODELO CMERA PERSPECTIVA................................................................................................. 22 FIGURA 2.5 EXEMPLO DE TRANSFORMAO ENTRE DOIS SISTEMAS MUNDO (PW) E CMERA (PC).............. 25 FIGURA 2.6 (A) IMAGEM ORIGINAL, (B) IMAGEM ATENUADA COM MSCARA AMEDIA1, (C) IMAGEM ATENUADA

    COM MSCARA AMEDIA2. ........................................................................................................................... 28 FIGURA 2.7 (A) IMAGEM ORIGINAL. (B) IMAGEM COM ATENUAO GAUSSIANA = 1.5. .............................. 30 FIGURA 2.8 (A) IMAGEM ORIGINAL. (B) CONTORNO EXTRADO POR CANNY EDGE DETECTOR. ....................... 32 FIGURA 2.9 (A) IMAGEM ORIGINAL. (B) EXTRAO DE CONTORNO POR ROBERT = 34.88. (C) EXTRAO

    DE CONTORNO POR SOBEL = 78.4. ..................................................................................................... 33 FIGURA 2.10 (A) IMAGEM ORIGINAL. (B) IMAGEM BINARIZADA COM LIMIAR = 170. (C) VRTICES DE IMAGEM

    BINARIZADA. .......................................................................................................................................... 36 FIGURA 2.11 (A) IMAGEM BINARIZADA COM CENTRO DE MASSA. (B) IMAGEM BINARIZADA ROTACIONADA

    COM CENTRO DE MASSA......................................................................................................................... 38 FIGURA 2.12 (A) IMAGEM ORIGINAL (B) IMAGEM BINARIZADA. (C) IMAGEM SEGMENTADA SEM O PRIMEIRO

    OBJETO. (D) IMAGEM SEGMENTADA SEM DOIS OBJETOS.......................................................................... 39 FIGURA 3.1 (A) IMAGEM DO MODELO 1 - APRESENTAO DA IMAGEM DO OBJETO MODELO 1 COM OS

    VRTICES; ............................................................................................................................................... 43 FIGURA 3.2 (A) IMAGEM DO MODELO 2. (A) - APRESENTAO DA IMAGEM DO OBJETO MODELO 2 COM OS

    VRTICES; (B) GEOMETRIA DO MODELO 2............................................................................................... 43 FIGURA 3.3 ESQUEMA DE ORDENAO DE VRTICES NO SENTIDO HORRIO.................................................. 44 FIGURA 3.4 FLUXOGRAMA DA TCNICA DE RECONHECIMENTO DE OBJETOS POR MEIO DO CLCULO DE

    INVARIANTES. PROCESSAMENTO OFF-LINE. ........................................................................................... 46 FIGURA 3.5 (A) IMAGEM DO MODELO 1. (B) IMAGEM DO MODELO 2. ............................................................. 47 FIGURA 3.6 GEOMETRIA DO MODELO 1 E LISTA DOS PONTOS NO SENTIDO HORRIO...................................... 48 FIGURA 3.7 GEOMETRIA DO MODELO 2 E LISTA DOS PONTOS NO SENTIDO HORRIO...................................... 49 FIGURA 3.8 FLUXOGRAMA DA TCNICA DE RECONHECIMENTO DE OBJETOS. PROCESSAMENTO ON-LINE. .... 50 FIGURA 4.1 FASES PARA A LOCALIZAO DO OBJETO. (A) IMAGEM DO POSICIONAMENTO DO OBJETO SOBRE

    UMA GRADE. (B) HISTOGRAMA DA IMAGEM DO OBJETO. (C) IMAGEM BINARIZADA. (D) POSIES DO

    OBJETO E MARCAS - PIXELS..................................................................................................................... 57 FIGURA 5.1 SISTEMAS DE COORDENADAS. (B) BASE DO MANIPULADOR, (G) GARRA E (C) CMERA............. 61 FIGURA 5.2 SISTEMAS DE COORDENADAS. (B) BASE DO MANIPULADOR, (OBJ) OBJETO E (C) CMERA. ....... 63 FIGURA 5.3 RELAO ENTRE OS JACOBIANOS MANIPULADOR, IMAGEM E COMPLETO.................................. 65 FIGURA 5.4 SISTEMAS DE CONTROLE POR POSIO (ALMEIDA, 2004). .......................................................... 68 FIGURA 5.5 SISTEMAS DE CONTROLE POR IMAGEM (ALMEIDA, 2004). .......................................................... 68 FIGURA 6.1 MODELOS DE OBJETOS UTILIZADOS. (A) MODELO 1. (B) MODELO 2. (C) MODELO 3.................. 72

  • xii

    FIGURA 6.2 HISTOGRAMAS. (A) HISTOGRAMA MODELO 1. (B) HISTOGRAMA MODELO 2. (C) HISTOGRAMA

    MODELO 3. ............................................................................................................................................. 73 FIGURA 6.3 IMAGEM BINARIZADA. (A) IMAGEM BINARIZADA DO MODELO 1. (B) IMAGEM BINARIZADA DO

    MODELO 2. (C) IMAGEM BINARIZADA DO MODELO 3. .............................................................................. 74 FIGURA 6.4 APS A EXTRAO DOS VRTICES. (A) MODELO 1 VRTICES TAU () = 1,0527E+5. (B) MODELO

    2 VRTICES TAU () = 1,0921E+5. (C) MODELO 3 VRTICES TAU () = 6.2502E+4. ........................ 75 FIGURA 6.5 IMAGEM DOS OBJETOS COM OS VRTICES NECESSRIOS GERAO DA GEOMETRIA DO MODELO.

    (A) MODELO 1. (B) MODELO 2. (C) MODELO 3........................................................................................ 77 FIGURA 6.6 GEOMETRIA DOS OBJETOS. (A) MODELO 1. (B) MODELO 2. (C) MODELO 3. ............................... 79 FIGURA 6.7 (A) IMAGEM ORIGINAL DO OBJETO. (B) IMAGEM BINARIZADA APS A EXTRAO DOS VRTICES.

    ............................................................................................................................................................... 81 FIGURA 6.8 GEOMETRIA DO OBJETO E TABELA DOS VRTICES EXTRADOS. ................................................... 81 FIGURA 6.9 RESULTADO DAS COMPARAES IDENTIFICAO DO OBJETO ................................................. 83 FIGURA 6.10 (A) IMAGEM ORIGINAL DO OBJETO. (B) IMAGEM BINARIZADA APS A EXTRAO DOS VRTICES.

    ............................................................................................................................................................... 84 FIGURA 6.11 GEOMETRIA DO OBJETO E TABELA DOS VRTICES EXTRADOS. ................................................. 85 FIGURA 6.12 RESULTADO DAS COMPARAES IDENTIFICAO DO OBJETO. .............................................. 89 FIGURA 6.13 (A) IMAGEM ORIGINAL DO OBJETO. (B) IMAGEM BINARIZADA APS A EXTRAO DOS VRTICES.

    ............................................................................................................................................................... 90 FIGURA 6.14 GEOMETRIA DO OBJETO E TABELA DOS VRTICES EXTRADOS. ................................................. 90 FIGURA 6.15 RESULTADO DAS COMPARAES IDENTIFICAO DO OBJETO. .............................................. 94 FIGURA 6.16 (A) IMAGEM ORIGINAL DO OBJETO TRANSLADADA E ROTACIONADA. (B) IMAGEM BINARIZADA

    APS A EXTRAO DOS VRTICES. .......................................................................................................... 95 FIGURA 6.17 GEOMETRIA DO OBJETO E TABELA DOS VRTICES EXTRADOS. ................................................. 95 FIGURA 6.18 RESULTADO DAS COMPARAES IDENTIFICAO DO OBJETO. .............................................. 98 FIGURA 6.19 IMAGEM ORIGINAL.................................................................................................................... 99 FIGURA 6.20 HISTOGRAMA DA IMAGEM ORIGINAL. ....................................................................................... 99 FIGURA 6.21 IMAGEM BINARIZADA E VRTICES EXTRADOS........................................................................ 100 FIGURA 6.22 IMAGEM DOS VRTICES SELECIONADOS DO OBJETO 1. ........................................................... 100 FIGURA 6.23 GEOMETRIA DO OBJETO 1....................................................................................................... 101 FIGURA 6.24 IMAGEM DOS VRTICES SELECIONADOS DO OBJETO 2. ........................................................... 101 FIGURA 6.25 GEOMETRIA DO OBJETO 2. ...................................................................................................... 102 FIGURA 6.26 IMAGEM DOS VRTICES SELECIONADOS DO OBJETO 3. ........................................................... 102 FIGURA 6.27 GEOMETRIA DO OBJETO 3. ...................................................................................................... 103 FIGURA 6.28 RESULTADO DA COMPARAO DO OBJETO 1 COM OS MODELOS 1, 2 E 3................................. 104 FIGURA 6.29 RESULTADO DA COMPARAO DO OBJETO 2 COM OS MODELOS 1, 2 E 3................................. 105 FIGURA 6.30 RESULTADO DA COMPARAO DO OBJETO 3 COM OS MODELOS 1, 2 E 3................................. 106

  • 13

    1. INTRODUO

    Com as palavras: ... Tomemos ua mquina autnoma que tenha energia e um motor para

    manifest-la e ainda sutis dispositivos para dosar e dirigir suas manifestaes, mas que no

    tenha um rgo que permita seu comando exterior. Ela pode variar e mesmo matizar sua

    ao, mas incapaz de agir sem que mensagens exteriores lhe digam quando e como. Em

    outras palavras, ela no tem nenhum programa ... (Latil, 1959), pode-se observar que

    Pierre de Latil, na dcada de 50 do sculo XX, definia como seriam as mquinas inteligentes

    nos tempos mais modernos, e que dependeriam essencialmente de suas programaes e de

    comportamentos pr-determinados.

    O autor completa seu pensamento quando compara a esttua de Condillac com a tartaruga de

    Grey Walter (uma das primeiras mquinas descrita com inteligncia artificial). ... Dotemo-

    la, porm, de um sentido eletrnico, depois de um outro e, depois, de muitos... Que

    acontecer, ento?... Se um clrigo do XVIII sculo pde, por extraordinrio golpe de

    audcia intelectual, demonstrar que sua esttua seria capaz de ter idias desde que fsse

    dotada de sentidos, um cientista do XX sculo poder bem demonstrar isso com um rob

    eletrnico....

    Nota-se que no final do pargrafo anterior aparecem as seguintes palavras: desde que,

    denotando a condio necessria e suficiente para a conclusiva capaz de ter idias, do

    silogismo, cuja premissa : dotada de sentidos, ou seja, o pensamento artificial dever ser

    dotado de conhecimentos prvios, necessrios para tomadas de decises.

    Atualmente, a comunidade de viso computacional consciente de que, em diversas

    pesquisas desenvolvidas, necessita-se de processamento de tarefas bastante complexas para

    interpretao de imagens, elevando assim o custo e reduzindo a velocidade computacional,

    comprometendo a preciso e a flexibilidade dos sistemas.

    Reconhecimento de objetos parte essencial de quase todos os sistemas de robtica de alto

    nvel. Reconhecer um objeto significa identific-lo e localiz-lo. Ainda no h uma tcnica

    geral que identifique e localize qualquer tipo de objeto, independente de suas propriedades

    intrnsecas como cor, forma, medidas e outras.

  • 14

    Tcnicas para reconhecimento de objetos podem ser classificadas em duas classes gerais:

    uma que se utiliza de bases de dados dos modelos de objetos (nessa classe, encontra-se a

    representao geomtrica dos mesmos que depende da imagem e de como so armazenados

    seus dados), e outra, que usa as aparncias de objetos, utilizando-se das suas caractersticas

    globais e locais (Bandlow, 1998).

    Trs tcnicas sero apresentadas para identificao de objetos: a) rvores de interpretao

    baseiam-se na identificao de todas as partes de um objeto em uma imagem que combine

    com um dado modelo, previamente armazenado; b) Invariantes indexam geometrias de

    modelos previamente armazenados para identificar objetos em uma imagem; e c) mtodos

    que se baseiam em aparncias utilizam aparencia ao invs das caractersticas do objeto na

    imagem.

    Em geral, a Geometria Projetiva fornece uma excelente ferramenta para identificao de

    objetos, atravs do emprego de geometria invariante de pontos caractersticos dos mesmos.

    Esses pontos caractersticos podem ser vrtices, linhas ou curvas.

    Essa pesquisa tem como foco principal o reconhecimento (identificao e localizao) de

    objetos em imagens, atravs de comparao desses objetos com modelos previamente

    armazenados. Os objetos modelos tm suas caractersticas geomtricas conhecidas e esto

    armazenadas em um banco de invariantes.

    O problema da localizao de um objeto consiste em conhecer a posio e a orientao desse

    objeto em uma determinada imagem. Para tanto, necessrio conhecer o modelo do sensor

    (cmera) e o modelo geomtrico do objeto. Existem dois mtodos de localizao de objetos

    em imagens que se baseiam em apenas uma imagem. O primeiro a localizao de objetos

    no espao 3-D atravs do mtodo iterativo de Newton, que resolve um sistema de equaes

    no lineares, sendo necessrio o conhecimento prvio de alguns pontos caractersticos dessa

    imagem e os parmetros intrnsecos e extrnsecos da cmera. O segundo o mtodo de

    modelo de cmera de perspectiva fraca que se utiliza do conhecimento prvio do objeto

    identificado na imagem, no sendo necessrio conhecer os parmetros intrnsecos e

    extrnsecos da cmera (Trucco et al, 1998). O segundo mtodo tambm foco deste

    trabalho.

  • 15

    Neste trabalho, no captulo 2, sero apresentados os principais conceitos de tica e

    processamento de imagens. A extrao de caractersticas da imagem (vrtices) o foco

    principal desse capitulo. No captulo 3, sero apresentados os modelos mais conhecidos para

    o reconhecimento de objetos identificao, e tambm descrever os procedimentos

    necessrios identificao de objetos por invariantes, abrangendo as fases off-line (gerao

    do banco de invariantes dos modelos) e on-line (identificao de objetos por comparao). O

    captulo 4 destinado s tcnicas de localizao de objetos por dois modelos: cmera

    perspectiva completa e cmera perspectiva fraca. No captulo 5 ser apresentado o controle

    de um manipulador face a um sistema de viso. Nesse captulo, dois subsistemas

    caracterizam o sistema de controle do espao de trabalho: subsistema de controle do

    manipulador e subsistema de viso. O captulo 6 apresenta os resultados de experimentos

    sobre reconhecimento de objetos. No captulo 7 as concluses e sugestes de trabalhos

    futuros.

    Espera-se neste trabalho, mostrar a aplicao de sistemas de viso computacional, no sentido

    de reconhecimento de objetos, com a finalidade da pega e classificao desses objetos, por

    um manipulador industrial.

  • 16

    2. NOES DE TICA E PROCESSAMENTO DE IMAGENS

    Os elementos bsicos de um sistema de viso computacional so: a) aquisio; b)

    armazenamento; c) processamento; d) comunicao; e e) exibio de imagens. O

    processamento de imagens o elemento em que a maioria de suas funes pode ser

    desenvolvida em software, ou seja, envolvem procedimentos que so expressos em forma de

    algoritmos. Essas funes consistem em avaliar as propriedades da imagem e suas

    transformaes.

    Com o processamento de imagens pode-se: a) melhorar a qualidade de apresentao dessas

    imagens; b) compactar imagens para melhorar a transmisso; c) restaurar imagens para

    eliminar efeitos de degradao; e d) extrair caractersticas (contorno, vrtices e outras) dessas

    imagens, com diversas finalidades, por exemplo, o reconhecimento de objetos.

    As rotinas utilizadas no processamento de imagens deste trabalho foram desenvolvidas em

    MATLAB (Verso 6.0), um software matemtico cujo ncleo est no processamento de

    matrizes e vetores. Alm de operaes algbricas comuns com matrizes, o MATLAB fornece

    operaes com vetores que permitem a manipulao rpida de um conjunto de dados, de

    muitas maneiras diferentes. Enfim, a combinao existente entre a estrutura de dados

    vetoriais, os recursos de programao e uma interface grfica que permite a utilizao em

    desenvolvimento de aplicativos, torna o MATLAB uma ferramenta poderosa para a

    resoluo de problemas em diversas reas, principalmente em viso computacional,

    considerando que uma imagem um vetor bidimensional (matriz).

    Utilizando-se da ferramenta MATLAB, possvel visualizar, atravs da Figura 2.1, como

    uma imagem pode ser apresentada. A Tabela 2.1 apresenta a matriz 8x8 de uma imagem

    sinttica, a Figura 2.1a apresenta esta mesma matriz na forma de superfcie e a Figura 2.1b

    mostra a imagem sinttica, representada como intensidade de brilho.

  • 17

    Tabela 2.1 - Matriz 8x8 de uma imagem sinttica.

    1 2 3 4 1 1 2 1

    2 2 3 2 1 2 2 1

    3 1 38 39 37 36 3 1

    4 1 45 44 41 42 2 1

    1 2 43 44 41 42 2 1

    2 1 39 41 42 40 2 1

    1 2 1 2 2 3 1 1

    1 2 1 3 1 1 4 2

    (a) (b)

    Figura 2.1 (a) Imagem em forma de superfcie. (b) Imagem sinttica.

    2.1 IMAGENS DIGITAIS NOES DE TICA

    O principal componente de viso computacional a imagem digital. Pode-se afirmar que

    existem dois tipos bsicos de imagens digitais: a) imagem de intensidade avalia-se a

    quantidade de luz capturada pelo dispositivo da cmera; e b) image de profundidade

    estima-se diretamente a estrutura 3-D da cena (mundo real). As imagens digitais, tanto de

    intensidade quanto de profundidade, so matrizes 2-D.

    2.1.1 Imagens de Intensidade

    Uma fotografia uma imagem de intensidade. Uma imagem de intensidade contm

    parmetros fsicos que esto diretamente relacionados com a imagem vista. So parmetros

    fsicos as caractersticas ticas das lentes, a fotometria e a geometria da imagem projetada. A

  • 18

    distncia focal, o campo de viso e a abertura angular so as principais caractersticas ticas

    das lentes. Os parmetros fotomtricos esto relacionados intensidade e direo da

    luminosidade; em outras palavras, referem-se s propriedades de reflexo da superfcie vista

    em relao quantidade de luz que atinge o fotorreceptor. Tipo de projeo, posio da

    cmera e distores introduzidas no processamento da imagem so alguns parmetros

    geomtricos que interferem na posio da imagem no qual um ponto 3-D da cena

    projetado.

    2.1.2 tica Bsica

    A formao de uma imagem depende da quantidade de raios de luz que penetram a cmera

    pela abertura angular e chega ao plano de projeo da imagem. Um aparelho fotossensvel na

    cmera registra essa intensidade de luz.

    Foco da imagem

    Um ponto de uma superfcie recebe raios de luz de vrias direes e consequentemente

    reflete esses raios, tambm em vrias direes, e alguns desses raios podem entrar na

    cmera. Uma imagem mais ntida quando esses raios convergem para um ponto no plano

    de projeo da imagem na cmera.

    Pode-se conseguir maior nitidez em uma imagem reduzindo o tamanho do diafragma da

    cmera para um ponto, chamado de pinhole, ou introduzindo um sistema tico composto de

    lentes e diafragmas que convirgam seus raios luminosos para um nico ponto.

    O tempo de exposio tambm um fator importante na qualidade da imagem. Esse tempo

    inversamente proporcional ao quadrado do dimetro do diafragma. Assim, quanto menor o

    dimetro do diafragma maior o tempo necessrio para a exposio. Por outro lado, necessita-

    se de um mnimo de luz para registrar uma imagem visvel, ento uma reduo do diafragma

    nem sempre a alternativa mais eficaz para se obter melhor nitidez da imagem. Um sistema

    tico permite uma abertura do diafragma maior num tempo menor de exposio, melhorando

    a capacidade de captar luminosidade.

  • 19

    Equao fundamental das lentes finas

    A Figura 2.2 mostra os principais elementos na construo das lentes finas. Onde FL e FR

    so chamados de foco esquerdo e direito respectivamente, e esto situados no eixo focal.

    Quando a lente tem curvaturas iguais nas duas superfcies, os focos tm distncias iguais e,

    neste caso, chamado de comprimento focal f.

    Figura 2.2 Geometria tica das lentes finas.

    Duas propriedades bsicas das lentes finas definem uma equao fundamental. A primeira,

    por construo das lentes, permite que qualquer raio de luz que entra na lente e paralelo ao

    eixo tico de um lado, passe pelo ponto focal do outro lado. A segunda, tambm por sua

    construo, permite que qualquer raio que entra na lente, passando pelo ponto focal de um

    lado, emerge paralelo ao eixo tico do outro lado, como mostra a Figura 2.3.

    Lente Fina

    Eixo ptico FL FR

    O

    f f

  • 20

    Figura 2.3 Formao de imagens atravs das lentes finas.

    Sejam os triangulos RRLL FOQFspFORFSP e,, . Pela teoria dos tringulos semelhantes

    pode-se demonstrar uma forma da equao fundamental das lentes, equao (2.1).

    2. fzZ = (2.1)

    Substituindo fzzefZZ +=+= , obtm-se a equao fundamental das lentes, equao (2.2).

    fzZ1

    1

    1 =+ (2.2)

    2.1.3 Radiometria Bsica

    Radiometria : designao comum s tcnicas de medidas de grandezas associadas

    energia radiante ( Novo Dicionrio Aurlio 15 Edio), em outras palavras, o estudo das

    Q

    FL FR

    O

    f f

    P

    S

    z Z

    R

    s

    p

  • 21

    relaes entre as quantidades de energia luminosa emitida de fontes de luz, refletida de

    superfcies e registrada por sensores.

    Irradiana da imagem Energia luminosa incidente, por unidade de rea, e em cada

    ponto p do plano da imagem, medida em watt.

    Radiana de imagem Energia luminosa, por unidade de rea, idealmente emitida por

    cada ponto P de uma superfcie no espao 3-D em uma dada direo d ao ponto p,

    medida em lumens.

    Superfcie lambertiana Uma superfcie dita lambertiana se seus pontos refletem

    igualmente a luz incidente em todas as direes, ou seja, no absorve energia luminosa.

    2.1.4 Formao Geomtrica da Imagem

    Pare entender a formao geomtrica de imagens necessrio conhecer o que significa uma

    transformao de perspectiva, tambm chamada de transformao de imagem. Essa

    transformao projeta pontos no espao 3-D sobre um plano, e mostra uma aproximao de

    como uma imagem formada ao se olhar para um mundo tridimensional.

    Cmera Perspectiva

    O mais comum modelo geomtrico para cmeras de intensidade a perspectiva, tambm

    chamado de modelo pinhole. Esse modelo consiste de um plano (plano da imagem), e um ponto O em espao 3-D (centro ou projeo do foco). A distncia entre e O chamado de comprimento focal f. A linha que passa por O e perpendicular a chamado de eixo tico. O ponto o onde o eixo tico intercepta o plano da imagem o centro de projeo da imagem,

    como mostra a Figura 2.4. O ponto p a imagem do ponto P determinado pela interseco

    do segmento de linhaOP com o plano da imagem .

    Considere o sistema de referncia de coordenadas 3-D no qual O a origem e o plano ortogonal ao eixo Z, e sendo P = [X, Y, Z]T e p = [x, y, z]T, possivel escrever as equaes

    (2.3) da projeo perspectiva para as coordenadas da cmera.

  • 22

    ZYye

    ZXx ff == (2.3)

    Note que se z = f , ento o ponto p pode ser escrito por [x,y]T ao invz de [x,y,z]T.

    Figura 2.4 Modelo cmera perspectiva.

    Cmera Perspectiva Fraca

    As Equaes 2.3 no so lineares devido ao fator 1/Z. Transform-las em equaes lineares

    o que se chama de modelo cmera perspectiva fraca. Para tanto, suponha que se a distncia

    relativa ao longo do eixo tico (z), de quaisquer dois pontos do objeto no espao 3-D (profundidade) seja muito menor que a distncia media Z desses pontos ao plano 2-D da

    imagem (na cmera), ento possvel reescrev-las para obter as equaes (2.4) lineares.

    YZ

    yeXZ

    x ff == (2.4)

    Se a variao de z < Z /20 (Trucco et al, 1998), pode-se considerar uma aproximao linear das Equaes 2.3, tambm chamada de projeo ortogrfica. Neste caso, significa que

    quaisquer pontos so projetados ao longo de raios paralelos ao eixo tico, tomando 1Z

    f .

    YX

    Z

    Plano da Imagem

    Eixo tico

    Sistema da cmera

    p o

    f

    O P

  • 23

    2.2 PARMETROS DE CMERAS

    Para conhecer a posio de objetos no espao, necessita-se de equaes que relacionem as

    coordenadas dos pontos no sistema 3-D com as coordenadas dos pontos correspondentes na

    imagem da cmera. As Equaes 2.3 definem bem essa situao e assumem que:

    Pode-se relacionar o sistema de referncia da cmera com algum outro sistema conhecido, por exemplo, sistema de coordenadas externa.

    As coordenadas dos pontos da imagem no sistema de referncia da cmera podem ser obtidas atravs das coordenadas em pixels.

    Algumas caractersticas das cmeras so chamadas em viso computacional como

    parmetros extrnsecos e intrnsecos.

    Parmetros extrnsecos So parmetros que definem a localizao e orientao do sistema

    de referncia da cmera em relao a um sistema de referncia conhecido.

    Parmetros intrnsecos So parmetros que relacionam as coordenadas em pixels de uma

    imagem com as coordenadas correspondentes no sistema de referncia da cmera.

    2.2.1 Parmetros Extrnsecos

    O sistema de referncia da cmera tem sido mencionado com o objetivo de escrever as

    equaes fundamentais da projeo perspectiva, equaes (2.3), numa forma mais simples.

    Normalmente o sistema de referncia da cmera desconhecido, ento o problema

    conhecer a localizao e a orientao do sistema da cmera em relao a um sistema

    conhecido, utilizando-se apenas dados da imagem.

    Trucco et al (1989), define parmetros extrnsecos como sendo qualquer conjunto de

    parmetros geomtricos que identifiquem univocamente as transformaes entre o sistema

    de referncia da cmera desconhecido e um sistema conhecido, chamado de sistema de

    coordenadas externo.

  • 24

    Para essas transformaes utilizam-se normalmente um vetor de translao, T, e uma matriz

    de rotao, R. O vetor 3-D de translao descreve a posio relativa das origens dos dois

    sistemas. A matriz de rotao uma matriz 3x3 ortogonal, ou seja, RT.R = R.RT = I, que

    permite o alinhamento entre os eixos dos dois sistemas. A Figura 2.5 mostra a relao entre

    as coordenadas de um ponto no sistema 3-D qualquer (PW = [25 35 19]T), e as coordenadas

    desse ponto no sistema de referncia da cmera (PC = [15 -17 26]T), tambm determinado

    pela equao (2.5).

    )( WC T - P R.P = (2.5)

    , onde

    =

    333231

    232221

    131211

    rrrrrrrrr

    R , o produto de trs matrizes de rotao ao longo dos eixos X,Y e Z.

    Essas matrizes de rotao so definidas como:

    =

    =

    cos0sin010sin0cos

    )(,cossin0sincos0001

    )( yx RR

    =

    1000cossin0sincos

    )(e z

    R

    No exemplo apresentado na Figura 2.5, a rotao se d no eixo Y em 180, gerando a matriz

    de rotao e o vetor de translao igual a [ ]455240e100010001

    =

    = TR ,

    respectivamente.

  • 25

    Figura 2.5 Exemplo de transformao entre dois sistemas Mundo (Pw) e Cmera (Pc).

    2.2.2 Parmetros Intrnsecos

    So os parmetros que definem as caractersticas ticas, geomtricas e digitais da cmera.

    Para o modelo pinhole, os parmetros intrnsecos so:

    A projeo perspectiva da qual o nico parmetro a distncia focal f; A transformao entre os sistemas da cmera e o sistema da imagem (pixel); e As distores geomtricas introduzidas pelo sistema tico.

    Para encontrar o conjunto de parmetros intrnsecos, devem-se relacionar as coordenadas

    (Xim , Yim ) de um ponto da imagem em unidade de pixel com as coordenadas (X , Y) do

    mesmo ponto no sistema de referncia da cmera, equao (2.6), considerando que a imagem

    no tenha distoro geomtrica, e que o sensor CCD seja um grid retangular de elementos

    fotossensveis.

    ( ) ( ) YYimXXim S.OYYeS.OXX == (2.6)

    35

    25

    Y

    Z

    X

    y

    z

    x

    20

    40

    45

    52

    Pw = [ 25 35 19 ]T

  • 26

    , onde ( )YX O,O so as coordenadas do centro da imagem em pixel e ( )YX S,S o tamanho dos pixels.

    So parmetros intrnsecos a distncia focal f, as coordenadas do centro da imagem em pixel

    e o tamanho efetivo dos pixels nas direes horizontais e verticais. O coeficiente de distoro

    radial, tambm um parmetro intrnseco.

    Resumindo, a equao (2.6) a equao matricial da projeo perspectiva e pode ser

    reescrita na forma da equao (2.7).

    =

    =

    =

    TRTRTR

    ff

    T3

    T2

    T1

    .rrr

    .rrr

    .rrr

    Me100OS/0O0S/

    Monde

    1ZYX

    .M.Mxxx

    333231

    232221

    131211

    extyy

    xx

    intw

    w

    w

    extint

    3

    2

    1

    (2.7)

    , onde Ri (i = 1, 2, 3) o vetor 3-D formado pela i-sima linha da matriz R.

    2.3 FILTRAGEM DE RUDOS

    Rudo qualquer detalhe na imagem, dado ou resultado intermedirio, que no seja

    interessante aos propsitos do clculo principal. Imagine duas imagens de uma mesma cena,

    adquiridas por uma mesma cmera e com a mesma intensidade de luz, em que os valores de

    pixels no sejam iguais. Esses valores diferentes podem introduzir erros nos resultados de

    clculos. Neste caso muito importante dimensionar a magnitude desse erro, tambm

    chamado de rudo.

    Em algoritmos de processamento de imagens, como por exemplo, na deteco de linhas ou

    contornos, considera-se rudo a flutuao de pixel esprios, normalmente introduzidos pelo

    sistema de aquisio de imagem. possvel reduzir a magnitude do rudo, atravs de tcnicas

    chamadas de filtragem, sem alterar significativamente a qualidade da imagem.

  • 27

    2.3.1 Filtro Linear

    Filtragem linear uma tcnica que tem como finalidade atenuar ou eliminar o rudo de uma

    imagem, e consiste, no domnio da freqncia, em efetuar uma convoluo entre os valores

    dos pixels da imagem e uma matriz (A) chamada de mscara, conforme mostra a equao

    (2.8), onde uma imagem I de dimenses NxM, tem sua verso filtrada IA atravs do uso da

    convoluo discreta com a mscara A de dimenses m x m, sendo m um valor muito menor

    que N e M (Cai, 1990).

    ( ) ( ) ( )==

    == 2m

    2m

    k

    2m

    2m

    h

    kj,hiIk,hAA*Ij,iAI (2.8)

    .divisodaeirointvaloro2meconvoluoindica*

    Filtros lineares baseiam-se em que a funo de transferncia e o impulso so Transformadas

    de Fourier inversas uma da outra. Os denominados filtros passa-baixas atenuam ou eliminam

    os componentes de alta freqncia no domnio de Fourier enquanto deixam as baixas

    freqncias inalteradas. Os componentes de alta freqncia caracterizam bordas ou outros

    detalhes finos de uma imagem, de forma que o efeito resultante da filtragem passa-baixas o

    borramento da imagem. Do mesmo modo, filtros passa-altas atenuam ou eliminam os

    componentes de baixa freqncia, e como esses componentes so responsveis pelas

    caractersticas que variam lentamente em uma imagem (contraste total e a intensidade

    mdia), o resultado dessa filtragem a reduo destas caractersticas, ou seja, um afinamento

    das bordas e outros detalhes finos. Por ltimo, os filtros passa-banda, cuja caracterstica

    remover regies selecionadas entre freqncias altas e baixas, so mais utilizados em

    restaurao de imagens, tendo pouca aplicao na eliminao ou atenuao de rudos para

    realce das imagens (Gonzalez et al, 2000).

    Atenuao pela mdia

    Nos filtros passa-baixas todos os coeficientes de suas mscaras devem ser positivos. Uma

    mscara para essa filtragem teria seus componentes iguais a 1 (um). Como a convoluo

    resulta em valores diferentes do previsto em escala de cinza (0 a 255), faz-se necessrio que

    se obtenha um valor mdio, e neste caso necessrio dividir o resultado pela quantidade de

    elementos da mscara. Essas mscaras podem ser:

  • 28

    =

    111111111

    91

    1mediaA ou

    =

    1111111111111111111111111

    251

    2mediaA

    A Figura 2.6a apresenta uma imagem em sua forma original. A Figura 2.6b apresenta a

    mesma imagem aps filtragem com uma mscara Amedia 1. A Figura 2.6c apresenta a mesma

    imagem aps filtragem com mscara Amedia 2.

    (a)

    (b)

    (c)

    Figura 2.6 (a) Imagem original, (b) Imagem Atenuada com mscara Amedia1, (c) Imagem atenuada com

    mscara Amedia2.

  • 29

    Atenuao gaussiana

    Atenuao gaussiana um caso particular da atenuao pela mdia, onde a mscara um 2-

    D gaussiano. Neste caso a convoluo da imagem com a mscara gaussiana 2-D igual

    convoluo de todas as linhas da imagem com a mscara gaussiana 1-D somada

    convoluo de todas as colunas da imagem com a mscara 1-D, desde que ambas tenham o

    mesmo desvio padro. A equao (2.9) mostra a separabilidade das mscaras gaussianas.

    ( ) ( ) ( )

    ( )

    ( )

    =

    =

    =

    +

    =

    ==

    ==

    ===

    ===

    2m

    2mk

    2k2

    m

    2mh

    2h

    2m

    2mk

    2kh2

    m

    2mh

    2m

    2mk

    2m

    2mh

    G

    kj,hiIee

    kj,hiIe

    kj,hiIk,hGG*Ij,iI

    2

    2

    2

    2

    2

    22

    (2.9)

    Para a construo da mscara gaussiana deve-se conhecer o desvio padro para obter o tamanho da mscara. Segundo Trucco et al (1998), a relao usada em geral w=w/5, onde w define a largura da mscara. Para a amostragem ser gaussiana, no intervalo de [- , ], w deve ser um valor maior ou igual a 0.8, logo a menor largura da mascara deve ser 5.

    A Figura 2.7a apresenta a imagem em sua forma original. A Figura 2.7b mostra a mesma

    imagem com atenuao gaussiana, com desvio padro = 1,5.

  • 30

    (a)

    (b)

    Figura 2.7 (a) Imagem original. (b) Imagem com atenuao gaussiana = 1.5.

    2.4 CARACTERSTICAS DAS IMAGENS

    As caractersticas mais importantes para anlise de imagem de peas industriais so as

    fronteiras e as medidas geomtricas derivadas dessas fronteiras. Essas caractersticas so

    agrupadas em trs tipos: Global, Local e Caracterstica relacional (Chin et al, 1986). So

    exemplos de caractersticas globais, o permetro, o centro de massa, distncias entre dois

    pontos da fronteira e o centro de massa, curvatura, rea e momento de inrcia. exemplo de

    caractersticas locais o segmento de linha, segmento de arco com curvatura constante e

    vrtices que definem fronteiras dos objetos. Exemplos de caractersticas relacionais so as

    medidas de distncia e a sua orientao relativa que interligam subestruturas e regio de um

    objeto.

    Antes de iniciar o processo de extrao de caractersticas deve-se obter uma imagem

    binarizada de uma imagem original em escala de cinza, e para isso necessrio escolher um

    limiar apropriado, ou um sensor que produza imagem binarizada. Uma imagem binarizada

    reduz a complexidade dos dados que sero trabalhados.

    Vrios algoritmos utilizados na extrao de caractersticas em imagens binarisadas so para

    obteno de contornos ou fronteiras. O problema que esses algoritmos detectam fronteiras

    de objetos planos e so normalmente falhos na obteno de fronteiras em superfcies. Apesar

  • 31

    dos sistemas serem bastante sofisticados na extrao de caractersticas, seus mtodos so

    aplicados em modelos 2-D.

    So caractersticas de imagens os contornos, vrtices, linhas, cnicas e outros. Neste trabalho

    ser dada nfase aos vrtices.

    2.4.1 Contorno

    Vrias interpretaes de imagens so baseadas em contornos, ou melhor, onde a imagem

    possui contraste. O contraste para viso humana significa a capacidade de perceber o

    permetro de um objeto, desde que esse objeto tenha diferentes intensidades de luz sua

    volta. Essencialmente, a fronteira de um objeto uma mudana de valor nos nveis da

    imagem de intensidade. Um contorno detectado pela derivada de primeira ordem,

    localizando assim regies onde ocorre uma diferena de intensidade ou um mximo local.

    Em viso computacional, a deteco de uma fronteira um processo de trs passos:

    Atenuar rudos Suprimir o mximo de rudos sem comprometimento do contorno;

    Realar contorno Projetar um filtro que tenha maior sada nos pontos do contorno que em

    outras regies. Assim o contorno o mximo local; e

    Localizar o contorno Estabelecer, por um limiar, quais os mximos que significam

    contorno. Os contornos devem estar bem afilados.

    Canny Edge Detector

    O operador Canny Edge Detector uma tcnica para deteco de fronteira em viso

    computacional. Seus principais objetivos so:

    Deteco tima Imagem de intensidade sem dados esprios ou rudos;

    Boa localizao Detectar arestas o mais prximo possvel da fronteira real; e

    Resposta nica O operador retorna apenas um ponto para cada ponto do contorno

    verdadeiro.

  • 32

    Canny [1986], mostra em seu trabalho os passos e o desenvolvimento completo do algoritmo

    do operador canny edge detector para a extrao de contornos.

    A Figura 2.8a apresenta a figura original. A Figura 2.8b apresenta o contorno da imagem

    utilizando-se do algoritmo de Canny Edge Detector.

    (a)

    (b)

    Figura 2.8 (a) Imagem original. (b) Contorno extrado por Canny Edge detector.

    Outros Operadores Robert e Sobel

    Ambos os operadores Robert e Sobel so mais simples de executar que o operador canny

    edge detector, pois suas formulaes matemticas so menos complexas. Em ambos os casos

    seus algoritmos seguem 4 passos bem definidos, alterando apenas a mscara aplicada na

    filtragem:

    1- Aplicar um filtro adequado para atenuar o rudo;

    2- Filtrar a imagem sem rudos com as mscaras AR1 e AR2 (Robert) ou AS1 e AS2

    (Sobel), obtendo duas imagens I1 e I2, respectivamente;

    =

    =1111

    1111

    R2R1 AA e

    =

    =

    101202101

    121000121

    S2S1 AA

    3- Calcular a magnitude do gradiente, equao (2.10), para cada pixel (i,j);

  • 33

    ( ) ( ) ( )j,iIj,iI 2221 +=ji,G (2.10) 4- Selecionar como contorno todos os pixels com valor de gradiente maior que um

    limiar ().

    A Figura 2.9a apresenta a imagem original. A Figura 2.9b apresenta o contorno da imagem

    utilizando o operador Robert com limiar = 34.88. A Figura 2.9c apresenta o contorno da imagem utilizando o operador Sobel com limiar = 78.4.

    (a)

    (b)

    (c)

    Figura 2.9 (a) Imagem original. (b) Extrao de contorno por Robert = 34.88. (c) Extrao de

    contorno por Sobel = 78.4.

  • 34

    2.4.2 Vrtices

    Vrtice definido por Deriche (1993) como sendo pontos pertencentes ao contorno da

    imagem onde ocorre um mximo local de curvatura, ou a interseo de 2 ou mais arestas do

    contorno.

    Existem vrias tcnicas para extrao de vrtices. Vicente et al. (2002) classificam em dois

    grupos: o primeiro consiste na operao sobre a imagem do objeto com a extrao prvia do

    contorno; e o segundo grupo consiste em operao diretamente nos valores dos pixels em

    escala de cinza. As tcnicas mais clssicas so de Beaudt, Kitchen, Noble e Trucco.

    Tcnica de extrao de vrtices por Beaudet

    Em Beaudet (1978), foi proposto o operador invariante rotacional, chamado DET, equao

    (2.11). Este operador obtido usando a segunda ordem da expanso de Taylor na imagem de

    intensidade I (i, j).

    2xyyyxx II.IDET += (2.11)

    Os vrtices so detectados tomando um valor limite entre os valores extremos desse

    operador. DET estimado como o determinante da matriz Henssiana H, que esta relacionado

    com o produto das curvaturas principais kmin.kmax , equao (2.12), chamada de curvatura

    gaussiana:

    2y

    2x

    maxminyyyx

    xyxx

    II1DETk.ke

    II

    II H ++=

    = (2.12)

    Ento, para o pixel I(i,j) se kmin.kmax = 0, o pixel parablico; se kmin.kmax > 0, o pixel

    elptico; e se kmin.kmax < 0, o pixel hiperblico. Como o denominador da equao (2.12)

    sempre positivo, o sinal da curvatura gaussiana tem o mesmo sinal de DET. Localizam-se os

    vrtices onde DET tem valor positivo ou negativo em ambos os lados do contorno.

  • 35

    Tcnica de extrao de vrtices por Kitchen

    Em Kitchen (1982), foi proposto que para se determinarem os vrtices, basta localizar onde

    ocorre a mudana de direo do gradiente ao longo do contorno, multiplicando esse ponto

    pela magnitude do gradiente local. Os vrtices so identificados pelos valores mximos de K,

    equao (2.13).

    2y

    2x

    yxxy2xyy

    2yxx

    II

    I.I.I.2I.II.IK +

    += (2.13)

    Tcnica de extrao de vrtices por Noble

    Noble (1982) utiliza-se da teoria de geometria diferencial para determinao de vrtices.

    Tcnica de extrao de vrtices por Trucco

    Em Trucco et al, (1998), faz-se uso da tcnica do gradiente espacial da imagem [ ]Tyx EE , . A extrao de vrtices feita utilizando-se do menor autovalor de uma matriz C, equao

    (2.14), que considera um ponto genrico p na imagem e calculado na sua vizinhana Q

    2N+1 x 2N+1 pxeis (por exemplo, 5x5), definida por Trucco et al, (1998):

    yE

    ExE

    EEEE

    EEEyx

    2yyx

    yx2x

    eonde,C

    ==

    = (2.14)

    Pode-se adotar um valor de limiar , determinado como uma porcentagem dos maiores valores dentre os menores autovalores de C. Isso garante que em duas direes de um ponto

    tm-se valores de gradiente suficientemente altos para caracterizar um vrtice.

    A Figura 2.10a apresenta a imagem original. A Figura 2.10b apresenta a imagem binarizada

    com limiar igual a 170. A Figura 2.10c apresenta os vrtices da imagem binarizada,

    utilizando a tcnica apresentada por Trucco.

  • 36

    (a)

    (b)

    (c)

    Figura 2.10 (a) Imagem original. (b) Imagem binarizada com limiar = 170. (c) Vrtices de imagem

    binarizada.

    2.4.3 Centro de Massa

    Uma boa caracterstica de imagens aquela que pode ser localizada sem ambigidades em

    diferentes vistas da mesma cena.

    Considerando imagens binrias, a funo caracterstica f(i,j) assume valores 1 (um) para

    pontos do objeto ou 0 (zero) para os demais (background).

    Assim, a rea de um objeto pode ser obtida em sua forma discreta pela equao (2.15):

  • 37

    =I

    )j,i(fA (2.15)

    O centro de rea o centro geomtrico da figura com a mesma forma e com massa constante

    por unidade de rea. O centro de massa o ponto onde toda a massa do objeto pode ser

    concentrada, sem que com isso se altere o momento da primeira ordem relativamente a

    qualquer um dos eixos.

    Numa imagem de intensidade 2-D, o momento de primeira ordem em torno de i e j dado

    pela equao (2.16).

    =

    =

    II

    II

    )j,i(f.j)j,i(f.j

    )j,i(f.i)j,i(f.i (2.16)

    , onde ( )j,i a posio do centro de rea. As equaes 2.16 podem ser reescritas na forma das equaes (2.17).

    A

    )j,i(f.jj

    A

    )j,i(f.ii

    I

    I

    =

    = (2.17)

    A Figura 2.10 apresenta a imagem de um objeto e seu centro de massa em duas posies

    diferentes. A Figura 2.101a apresenta a imagem e seu centro de massa. A Figura 2.10b

    apresenta a mesma imagem anterior, porm com uma rotao de 180, e seu centro de massa.

  • 38

    (a)

    (b)

    Figura 2.11 (a) Imagem binarizada com Centro de Massa. (b) Imagem Binarizada Rotacionada com Centro de

    Massa.

    2.4.4 Segmentao de Imagem

    O processo de segmentao de imagens consiste em separar a imagem nos seus diversos

    componentes, e assim separar os diversos objetos que nela existem. Esta separao consiste

    em agrupar todos os pixels que pertencem a um dado objeto ou regio, atravs de um critrio

    de semelhana, por exemplo, sua intensidade.

    A Figura 2.10 apresenta uma imagem contendo vrios objetos. A Figura 2.10a apresenta a

    imagem original. A Figura 2.10b apresenta a imagem original binarizada. A Figura 2.10c

    apresenta a imagem original sem o primeiro objeto. A Figura 2.10d apresenta a imagem

    original sem o primeiro e o segundo objetos.

  • 39

    (a)

    (b)

    (c)

    (d)

    Figura 2.12 (a) Imagem original (b) Imagem Binarizada. (c) Imagem Segmentada sem o primeiro objeto. (d)

    Imagem segmentada sem dois objetos.

  • 40

    3. RECONHECIMENTO DE OBJETOS IDENTIFICAO

    Reconhecimento de objetos significa que seus descritores ou simplesmente modelos estejam

    disponveis, ou melhor, reconhecer objetos significa que se conhece previamente sua

    geometria. No h como reconhecer aquilo que desconhecido, ou seja, que no tenha sido

    previamente armazenado em um banco de dados. Em viso computacional esta classe de

    reconhecimento chama-se reconhecimento baseado em modelos, onde a idia central est na

    comparao entre uma imagem plana 2-D e uma base de dados armazenada de modelos.

    Reconhecimento de objetos envolve duas operaes bsicas: Identificao e Localizao.

    Este captulo destinado s tcnicas de Identificao de objetos. Identificao determina a

    natureza e localizao determina a posio 3-D do objeto na imagem. As tcnicas mais

    clssicas para identificao de objetos utilizando-se de modelos so: rvore de

    interpretao, Identificao baseado em aparncias e Invariantes (Trucco et al, 1998).

    rvores de interpretao

    Essa tcnica engloba a classe de algortmos que se baseiam na identificao de

    caractersticas. So algortmos que identificam partes de um objeto em uma imagem, ou seja,

    identifica todos os subconjuntos da imagem que tenham forma de um modelo conhecido.

    Enfim, rvore de interpretao consiste em identificar as formas de um objeto o mais

    consistente possvel, sem ser necessrio efetuar todas as combinaes entre astas formas,

    pois isso seria impraticvel no mbito computacional.

    Identificao baseado em aparncias

    Essa tcnica engloba a classe de algoritmos que para identificar objetos, utilizam-se de

    imagens desses objetos e no de suas caractersticas. So algoritmos que identificam se em

    partes de uma imagem encontram-se partes de um determinado objeto. A idia central dessa

    tcnica consiste em simplesmente identificar um objeto por sua aparncia. Para tanto deve

    armazenar um conjunto de imagens, em diversos ngulos, que representem as aparncias do

    objeto modelo. Assim um objeto de uma determinada imagem poder ser identificado por

    comparao.

  • 41

    Invariantes

    Essa tcnica visa uma classe de algoritmos que identifica objetos, utilizando-se de

    caractersticas geomtricas invariantes de modelos previamente armazenados em um banco

    de dados. So algoritmos que identificam objetos ou partes deles, em uma imagem. A idia

    central dessa classe de algoritmos consiste em armazenar as caractersticas geomtricas

    invariantes dos objetos, para sua posterior identificao em uma determinada imagem.

    O foco deste trabalho est na classe de algoritmos de identificao de objetos por invariantes,

    e os pontos caractersticos utilizados na construo da geometria dos objetos sero seus

    vrtices.

    3.1 Projetiva Invariante para Gerao de Modelos

    Invariantes so propriedades funcionais de configuraes geomtricas que no se alteram sob

    certas classes de transformaes, por exemplo, o comprimento de um segmento de linha no

    varia em funo de uma rotao ou translao. Nas transformaes usuais, existem

    invariantes bem conhecidas como comprimentos e reas transformaes Euclidianas,

    (Vicente et al, 2002) ou razo de comprimentos e ngulos transformaes por

    similaridades (Hartley et al, 2000). Em transformaes projetivas ocorrem tambm

    invariantes, onde a mais conhecida a razo das razes de comprimentos (cross-ratio).

    Uma grande vantagem na utilizao de invariantes est na facilidade de aquisio de

    modelos para gerao da base de dados, bastando para isso adquirir uma nica imagem do

    objeto real e gerar um vetor de invariantes que ser armazenado como ndice do objeto.

    Assumindo que todos os objetos so planares, afirma-se que a transformao de imagens

    uma transformao entre planos. Assim, pode-se considerar diretamente o mapeamento entre

    pontos correspondentes do plano do objeto e o plano da imagem. O mapeamento

    construdo por uma transformao projetiva, da o nome: projetiva invariante.

    Seja p = [x,y,1]T as coordenadas homogneas de um ponto na imagem e P = [X,Y,1]T as

    coordenadas homogneas dos pontos correspondentes no plano real. A transformao

    projetiva que mapeia P em p pode ser escrita pela equao (3.1).

  • 42

    k.p=T.P (3.1)

    , onde T (matriz projetiva 3x3) e k so definidos como um fator de escala.

    Nessa seo sero apresentadas invariantes projetivas construdas em funo de pontos

    caractersticos da imagem (vrtices). Essas invariantes so calculadas utilizando 5 vrtices da

    imagem (pi i= 1,2,3,4,5) em coordenadas homogneas (no colineares). Vrios trabalhos

    (Trucco et al., 1998; Song et al., 2000 e Vicente et al., 2002) mostram duas projetivas

    invariantes independentes I1 e I2 definidas pelas equaes (3.2):

    SSSSISS

    SSI521432

    5324212

    531421

    5214311 .

    ... == (3.2)

    , ondeSijk o determinante da matrix 3x3 composta pelos pontos | pi pj pk | .

    3.2 Configurao Geomtrica do modelo

    Para a construo dos modelos de objetos aplica-se o algoritmo para determinao de

    vrtices, descrito no item 2.4.2 (Tcnica de extrao de vrtices por Trucco), sobre a imagem

    do objeto, e seleciona-se um conjunto desses vrtices cujo determinante associado seja

    diferente de zero, o que evita valores de I1 e I2 indesejveis (zero ou indefinido). Para tanto,

    deve-se evitar que 3 de cada grupo de 5 pontos sejam colineares. O conjunto selecionado

    deve ter a forma geomtrica do objeto modelo.

    Por exemplo, dois modelos de objetos so apresentados nas Figura 3.1 e Figura 3.2. A

    escolha se deu pela complexidade geomtrica da pea, mais prximos de objetos industriais

    comuns.

  • 43

    (a) (b)

    Figura 3.1 (a) Imagem do modelo 1 - Apresentao da imagem do objeto modelo 1 com os vrtices;

    (b) Geometria do modelo 1.

    (a)

    (b)

    Figura 3.2 (a) Imagem do modelo 2. (a) - Apresentao da imagem do objeto modelo 2 com os vrtices;

    (b) Geometria do modelo 2.

    A seqncia dos pontos extrados do conjunto de vrtices, obtidos na imagem original, deve

    seguir uma ordenao de maneira que forme um polgono fechado e numa seqncia de

    pontos no sentido horrio (Song, 2000), conforme esquema mostrado na Figura 3.3. Na

    Figura 3.1b e Figura 3.2b os vrtices esto ordenados no sentido horrio.

    O objetivo de se obter uma seqncia de pontos (vrtices) no sentido horrio reduzir o

    nmero de combinaes possveis para a identificao do objeto. Para se obter a seqncia

    de vrtices de um objeto em uma imagem, sugere-se usar uma imagem binarizada. Inicia-se

    o algoritmo em um ponto p pertencente ao contorno da imagem, e desloca-se a janela de

  • 44

    busca no sentido horrio, ao longo de todo o contorno do objeto, criando uma lista de

    vrtices, medida que os mesmos so encontrados.

    Figura 3.3 Esquema de ordenao de vrtices no sentido horrio.

    3.3 Criao do Banco de Invariantes

    Assumindo que o modelo composto de M vrtices (Song, 2000), definem-se dois vetores

    de invariantes g1 e g2, equao (3.3), que identificam o modelo:

    ( )( )( )

    ( )( )

    2,1

    4,3,2,1,

    3,2,1,,1

    7,6,5,4,3

    6,5,4,3,2

    5,4,3,2,1

    =

    = i

    M

    MM

    II

    III

    g

    i

    i

    i

    i

    i

    i

    (3.3)

    , onde Ii so invariantes dos vrtices calculados utilizando a equao 3.2.

    Utilizando-se do conjunto de pontos da Figura 3.3, onde M=8, os vetores gi so definidos

    pela equao (3.4):

    P1

    P2 P1

    P6

    P5

    P4

    P3

    P7 P8

  • 45

    ( )( )( )( )( )( )( )( )

    1,2i

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    P,P,P,P,P

    43218i

    32187i

    21876i

    18765i

    87654i

    76543i

    65432i

    54321i

    i

    IIIIIIII

    g =

    = (3.4)

    3.4 Identificao de Peas por Comparao

    A tcnica de identificao de objetos por invariantes desenvolvida neste Projeto considera

    que um modelo constitudo de um conjunto de pontos caractersticos (vrtices), e atravs

    desse conjunto pode-se calcular o vetor de invariantes (equao 3.3). Essa tcnica inicia com

    um processamento off-line para a gerao de um banco de objetos modelos associados a

    vetores invariantes. Na fase de identificao, onde o processamento on-line, o vetor de

    invariantes do objeto a ser identificado tambm gerado por um conjunto de pontos

    caractersticos. Esse vetor de invariantes ser utilizado na comparao com o banco de

    modelos, a fim de identificar o objeto na imagem.

    O objeto modelo ser chamado simplesmente de modelo e o objeto a ser identificado ser

    chamado simplesmente de objeto

    3.4.1 Processamento Off-Line

    A Figura 3.4 mostra o diagrama de blocos da tcnica de identificao, na fase do

    processamento off-line.

  • 46

    Figura 3.4 Fluxograma da tcnica de reconhecimento de objetos por meio do clculo de invariantes.

    Processamento Off-Line.

    O processo iniciado adquirindo uma imagem de cada objeto modelo (J). Em seguida

    executa-se a extrao dos vrtices, citado no item 2.4.2, utilizando a tcinca de extrao por

    Trucco. O resultado uma lista de pontos em ordem crescente do nmero das linhas. A

    Figura 3.5 apresenta o resultado da extrao de vrtices, sendo (a) e (b) os modelos 1 e 2,

    respectivamente. A Tabela 3.1 apresenta a lista dos pontos ordenados pelos nmeros das

    linhas para modelos 1 e a Tabela 3.2 apresenta a lista dos pontos ordenados pelos nmeros

    das linhas para modelos 2. Essa lista ser re-ordenada com o objetivo de se obter um

    polgono fechado (sentido horrio).

    Imagem do Modelo

    J=1

    Extrao dos vrtices

    Ordena lista de vrtices

    Exclui pontos colineares

    Geometria do Modelo - M(j)

    vertices

    Calcula/armazena vetor Invariante gi(j)

    J = J + 1

  • 47

    (a)

    (b)

    Figura 3.5 (a) Imagem do modelo 1. (b) Imagem do modelo 2.

    Tabela 3.1 Lista de pontos (vrtices) do modelo 1.

    i J

    142 128

    159 115

    209 260

    229 232

    249 217

    277 201

    303 369

    366 311

    Tabela 3.2 - Lista de pontos (vrtices) do modelo 2.

    i J

    49 313

    61 266

    67 341

    70 365

    98 312

    131 252

    131 355

    169 293

    328 99

    368 146

  • 48

    Em cada seqncia de 5 pontos, deve-se ter o cuidado de no conter 3 pontos colineares.

    Conhecer a geometria do objeto modelo facilita a construo do polgono fechado que

    represente sua melhor configurao, sendo que em algumas vezes importante eliminar

    vrtices desnecessrios.

    A Figura 3.6 e a Figura 3.7 mostram a geometria dos modelos 1 e 2, respectivamente, aps

    a ordenao dos pontos no sentido horrio. A inverso da figura ocorre porque, para a

    cmara (pixels), a ordem crescente do eixo y de cima para baixo.

    Figura 3.6 Geometria do modelo 1 e lista dos pontos no sentido horrio.

    Modelo 1

    0

    50

    100

    150

    200

    250

    300

    350

    400

    0 100 200 300 400

    I j

    142 128

    229 232

    209 260

    303 369

    366 311

    277 201

    249 217

    159 115

    Lista dos Pontos ordenados no sentido horrio

  • 49

    Figura 3.7 Geometria do modelo 2 e lista dos pontos no sentido horrio.

    Finalmente, calcula-se o vetor de invariante (equao 3.3), para gerar a tabela dos vetores

    que representam os modelos (Tabela 3.3).

    Tabela 3.3 Valores dos vetores invariantes dos modelos 1 e 2.

    Vetor Invariante

    Modelo 1 (g)

    Vetor Invariante

    Modelo 2 (g)

    I1 I2 I1 I2

    -0.5151 -0.6445 -0.1882 3.3081

    0.1948 7.8687 0.5867 2.7027

    0.9390 1.6208 0.8121 1.0127

    0.5579 0.6170 0.0381 0.2800

    15.3477 0.6240 -1.2576 -0.5731

    -0.0092 -49.0756 0.8507 0.8088

    0.9727 0.4582 -0.8020 0.0590

    9.1682 0.4706 -7.3112 -0.0935

    1.2222 0.3616

    1.0483 1.3560

    Modelo 2

    0

    50

    100

    150

    200

    250

    300

    350

    400

    0 100 200 300 400

    i J

    49 313

    98 312

    67 341

    70 365

    131 355

    169 293

    368 146

    328 99

    131 252

    61 266

    Lista dos Pontos ordenados no sentido horrio

  • 50

    3.4.2 Processamento On-Line

    A Figura 3.8 mostra o diagrama de blocos da tcnica de identificao, na fase do

    processamento on-line.

    Figura 3.8 Fluxograma da tcnica de reconhecimento de objetos. Processamento On-Line.

    Imagem Objeto

    Extrao dosvrtices

    Ordena lista de vrtices

    Excluir vrtices

    indesejaveis

    J = 1

    Verifica N de pontos do modelo(M) e objeto(N)

    Calcula n combinaes NCM = k

    Calcula o vetor -gik e Erro-E de k-combinao

    Cria a lista de erros (Emin) - modelo avaliado

    J = J + 1

    J < n de modelos

    Menor erro da lista Emin

    Identifica o Objeto

  • 51

    Inicia-se o processamento on-line com uma imagem em que se deseja identificar algum

    objeto, e semelhante ao processamento off-line, inclusive o processo de excluso dos

    pontos indesejveis. So pontos indesejveis os pontos colineares. Outra forma de excluir

    pontos indesejveis atravs das distncias mxima e mnima entre os pontos que compem

    a configurao geomtrica dos modelos.

    Em seguida, deve-se verificar se o nmero de vrtices que gerou o polgono fechado do

    objeto maior que o nmero de vrtices dos modelos. Conhecendo o nmero de vrtices do

    modelo e do objeto que se deseja identificar, possvel calcular o nmero de combinaes

    possveis (k). Para cada combinao calcula-se o vetor de invariantes, equao (3.3), e o erro

    associado em relao ao modelo, equao (3.5).

    =

    +=

    M

    k k

    kk

    k

    kk

    ggg

    gggE

    1 2

    22

    1

    11 (3.5)

    , onde ikg o k-simo elemento do vetor invariante ig do modelo, e ikg o invariante

    correspondente a ikg do objeto.

    Gera-se, assim, um vetor de erros (tamanho k), constitudo de erros para cada combinao. O

    menor valor a combinao que melhor identifica o objeto.

    Para cada modelo possvel gerar uma configurao do objeto associado ao erro mnimo,

    gerando uma lista de erros mnimos. O menor dos erros mnimos identifica finalmente o

    objeto.

  • 52

    4. RECONHECIMENTO DE OBJETOS LOCALIZAO

    4.1 Conceitos Bsicos

    Como j explanado anteriomente, o reconhecimento de um objeto envolve duas operaes

    bsicas: Identificao e localizao. Este captulo destinado s tcnicas de localizao de

    objetos. O problema de localizao conhecido em viso computacional como localizao

    de objetos baseados em modelos ou estimar sua de posio.

    A localizao de objetos significa determinar a posio 3-D e a sua orientao. Para isso

    necessrio que se tenha uma imagem, um sensor e a geometria do objeto que se deseja

    localizar. No espao 3-D a posio est vinculada translao T, e a orientao rotao

    R.

    A localizao de objetos desenvolvida neste trabalho, baseia-se na utilizao de apenas uma

    imagem, ou seja, no necessrio calibrar o sensor. Portanto, importante que seus

    parmetros intrnsecos sejam conhecidos. Tambm necessrio que os modelos sejam

    centrados em suas caractersticas geomtricas. A condio mais importante que o objeto j

    tenha sido identificado. Como os objetos esto vinculados s suas caractersticas

    geomtricas, neste caso devem-se excluir as tcnicas de identificao de objetos baseada em

    aparncias e outras tcnicas que no faam uso das caractersticas geomtricas do objeto.

    Podem-se utilizar imagens de intensidade ou imagens de profundidade. No caso de imagens

    de intensidade, os modelos esto apresentados em espao 3-D e as imagens dos objetos em

    2-D, necessitando, assim, de uma transformao adequada para a sua devida identificao e

    localizao. Para as imagens de profundidade, tanto os modelos quanto os objetos sob

    anlise esto definidos em espao 3-D, e nesse caso, podem ser comparados diretamente.

    Neste trabalho, aplicam-se apenas os casos de utilizao de imagens de intensidade.

    4.2 Localizao de Objetos Imagem de Intensidade

    A localizao de objetos a partir de uma imagem de intensidade, dado um modelo, consiste

    em que todos os pontos e vetores extrados da imagem esto definidos em funo do sistema

    de referncia da cmera e que os parmetros intrnsecos so todos conhecidos.

  • 53

    O problema consiste em solucionar a equao (4.1).

    [ ] TP.RZ,Y,X miTiii += (4.1)

    , onde [ ]Tiiii Z,Y,XP = so n pontos (n 3), expressos no sistema de referncia da cmera, e [ ]Tmimimimi Z,Y,XP = so os n pontos correspondentes do objeto, expressos no sistema de referncia do objeto. Como [ ]Tiii y,xp = so as projees de Pi no sistema da cmera (pixels), ento, torna-se necessrio conhecer o vetor de translao T e a matriz de

    rotao R , para efetuar as transformaes rgidas.

    Enfim, solucionar a equao (4.1) consiste em determinar os parmetros extrnsecos da

    cmera, que pode est conectada ao atuador de um robot.

    Dois mtodos so conhecidos: modelo da cmera de perspectiva completa e modelo de

    cmera de perspectiva fraca.

    4.2.1 Modelo de Cmera de Perspectiva Completa

    Este modelo aplica o mtodo iterativo de Newton (Trucco, et al 1998). O mtodo consiste

    em relacionar pontos do modelo e do objeto, ambos em coordenadas da cmera 3-D,

    tomadas atravs das projees perspectivas, conforme a equao (4.2)

    [ ] Ti

    i

    i

    iTiii Z

    Y,ZXy,xp

    == f.f. (4.2)

    Aplicando a equao (4.1) na equao (4.2), obtm-se a equao (4.3)

    3mi33

    mi32

    mi31

    2mi23

    mi22

    mi21

    i

    3mi33

    mi32

    mi31

    1mi13

    mi12

    mi11

    i

    TZ.rY.rX.rTZ.rY.rX.r

    y

    TZ.rY.rX.rTZ.rY.rX.r

    x

    ++++++=++++++=

    f.

    f. (4.3)

  • 54

    Como R e T so desconhecidos, basta aplicar os pontos conhecidos (no mnimo 3) para

    obter assim seis equaes com seis variveis. As variveis so Rx(), Ry() e Rz() Rotaes nos eixos x, y e z, respectivamente; e Tx ,Ty e Tz Translaes nos eixos x, y e z, respectivamente.

    Para determinar as variveis que solucionam o sistema de equaes no lineares, aplica-se o

    Mtodo Iterativo Newton (Trucco et al, 1998), que consiste em:

    1. Dados n 3 pontos do modelo 3-D e seus correspondentes pontos no sistema de referencia da cmera 3-D Estima-se R0 e T0 Valores inicias para Rotao e

    Translao, respectivamente;

    2. Utilizando R0 = R e T0 = T calcule Pi, que deve ser a localizao prevista para miP ;

    3. Projete Pi no plano da imagem () pixel, utilizando a equao (4.2); 4. Avalie o residual xi e yi atravs das equaes (4.4);

    xi = xi(R0 , T0) - ix e yi = yi(R0 , T0) - iy (4.4)

    5. Resolva o sistema linear equao (4.5);

    i

    3

    1jj

    j

    ij

    j

    i

    i

    3

    1jj

    j

    ij

    j

    i

    yR.RyT.

    Ty

    xR.RxT.

    Tx

    =

    +

    =

    +

    =

    = (4.5)

    Para determinar 3,2,1j,ReT jj =

    6. Altere os valores estimados para a rotao R e a translao T;

    7. Se xi e yi so valores muito pequenos, os novos valores de R e T so a soluo, caso contrrio voltar ao passo 2 com os novos valores de R e T.

  • 55

    4.2.2 Modelo de Cmera de Perspectiva Fraca

    O mtodo aplicado a modelos de cmera de perspectiva fraca matematicamente mais

    simples que o mtodo de cmera de perspectiva completa, porm mais restritivo. Neste

    caso no se utilizam os parmetros intrnsecos e extrnsecos da cmera. Como no possvel

    definir quo longe est o ponto (objeto), este modelo no fornece informaes em distncia.

    O problema de localizao de objetos, em viso monocular, torna-se mais complexo quando

    os parmetros intrnsecos e extrnsecos so desconhecidos. Uma tcnica proposta de

    localizao de objetos utiliza-se do conceito de transformaes perspectivas que preservam

    razes cruzadas (cross-ratio) (Horaud et al, 1989 e Michel, 1852).

    O mtodo tem referencia no trabalho do matemtico francs Michel Chasle (1852), que

    estudou transformaes perspectivas que preservam razes cruzadas (cross-ratio) de quatro

    (4) pontos colineares, e por extenso definiu uma relao entre coordenadas 2-D (x,y) de um

    ponto no plano do objeto e sua projeo perspectiva (x,y) no plano da imagem. Horaud, et

    al (1989) mostra que essa relao pode ser escrita pela equao (4.6).

    1qypx1dycx

    y'

    1qypx1byax

    x'

    2

    1

    ++++=++++=

    (4.6)

    , onde 21 eq,p,d,c,b,a, so constantes.

    Sejam as equaes (4.7)

    d.,wv'y,

    wu'x 2211 d' ,.c c' ,.b b' ,.a a' ====== (4.7)

    Aplicando as equaes (4.7) em (4.6), pode-se reescrev-las, gerando assim a equao (4.8).

    =

    1yx

    . b' a'

    wvu 1

    1qp'd'c 2

    (4.8)

  • 56

    Na prtica, deseja-se determinar (x, y) no plano do objeto, a partir das coordenadas da

    cmera (pixel). Enfim, devem-se determinar os coeficientes a, b, c, d, p, q, 1 e 2 da matriz.

    As equaes de Horaud et al, (1989), representam um sistema de 2 equaes com 8

    incgnitas, ento, necessitam-se de no mnimo 4 pontos no colineares marcados no plano da

    imagem (pixel (x, y)) e seus correspondentes no plano fsico do objeto (coordenadas

    homogneas (x , y , 1)), para resolver o sistema. Esse sistema matricial resulta na

    equao b A.x = e pode ser escrita pela equao (4.9).

    =

    '4

    '4

    '3

    '3

    '2

    '2

    '1

    '1

    2

    '

    '1

    '

    '

    '44

    '4444

    '44

    '4444

    '33

    '3333

    '33

    '3333

    '22

    '2222

    '22

    '2222

    '11

    '1111

    '11

    '1111

    1000

    0001

    1000

    00011000

    00011000

    0001

    yxyxyxyx

    qp

    dc

    ba

    yyyxyxxyxxyx

    yyyxyxxyxxyxyyyxyxxyxxyxyyyxyxxyxxyx

    (4.9)

    Pode-se melhorar a robustez do mtodo, admitindo-se mais alguns pontos, com o objetivo de

    mensurar os erros encontrados entre os valores previstos e os valores reais.

    O sistema de equaes (4.9) resolvido, utilizando-se do mtodo dos mnimos quadrados do

    sistema .bA .A.xA TT = .

    Finalmente, deseja-se localizar um ponto M de coordenadas desconhecidas ( xm , ym , 1), no

    plano do objeto a partir de coordenadas da imagem (pixel).

    4.2.3 Exemplo de Aplicao para Modelo de Cmera de Perspectiva Fraca

    A Figura 4.1 apresenta as fases do resultado de localizao de objetos. Na Figura 4.1a o

    objeto est sobre uma grade com marcas que definem suas posies no plano. A Figura 4.1b

    mostra o histograma da imagem (Figura 4.1a), utilizado na identificao do limiar (220)

  • 57

    necessrio binarizao da imagem. A Figura 4.1c apresenta a imagem binarizada, utilizada

    para extrao dos vrtices. Finalmente a Figura 4.1d identifica as posies da imagem no

    sistema da cmera (pixel).

    (a)

    (b)

    (c)

    (d)

    Figura 4.1 Fases para a localizao do objeto. (a) Imagem do posicionamento do objeto sobre uma grade. (b)

    Histograma da imagem do objeto. (c) Imagem binarizada. (d) Posies do objeto e marcas - pixels.

    Utilizando-se os pontos (1,1), (1,6), (6,1) e (6,6) no plano de referncia do objeto (Figura

    4.1a) e seus respectivos pontos (260,51), (52,51), (260,259) e (52,259) no plano de referncia

    da imagem em pixel (Figura 4.1c), na equao (4.9), possvel determinar os coeficientes

    a, b, c, d, p, q, 1 e 2. Enfim, atravs desses coeficientes e da equao (4.8) possvel determinar um ponto do plano de referncia da imagem fazendo uso de um ponto no plano

    de referncia d