Visión Computacional (VC) - Programa de Pós-Graduação...

30
Visión Computacional (VC) Alessandro L. Koerich IEEE Sociedad de Computación, R9, América Latina INVISYS Visión Computacional Ltda., Brasil Pontificia Universidad Católica do Paraná, Brasil 2do Congreso de Electrónica, Robótica y Mecánica Automotriz Cuernavaca, Morelos, México Objetivos Definir Visión Computacional Presentar componentes de un sistema de visión computacional Comprender como funciona un sistema de visión computacional Ejemplos y perspectivas. Plano da Presentación Introducción a Visión Computacional Perspectivas: Sistemas de visión computacional en América y en el Mundo. Captura de Imagen: Cámaras, formatos, iluminación e optica. Algoritmos: Tratamiento, análisis de la imagen y Decisión. Desafíos Persistentes: sistemas comerciales X investigaciones académicas. Resumo Que es Visión Computacional? Para industria Utilización de dispositivos ópticos para receptar y interpretar automáticamente una imagen de una cena real para obtener informaciones o controlar máquinas o procesos. Para academia Es un dominio da ciencia da computación cuyo objetivo es modelar el mundo real o reconocer objetos en imágenes digitales. Estas imágenes poden ser adquiridas usando vídeo, cámaras red infra, radares, o transductores especializados.

Transcript of Visión Computacional (VC) - Programa de Pós-Graduação...

Page 1: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Visión Computacional (VC)Alessandro L. Koerich

IEEE Sociedad de Computación, R9, América LatinaINVISYS Visión Computacional Ltda., Brasil

Pontificia Universidad Católica do Paraná, Brasil

2do Congreso de Electrónica, Robótica y Mecánica AutomotrizCuernavaca, Morelos, México

Objetivos

• Definir Visión Computacional

• Presentar componentes de un sistema de visión computacional

• Comprender como funciona un sistema de visión computacional

• Ejemplos y perspectivas.

Plano da Presentación

• Introducción a Visión Computacional

• Perspectivas: Sistemas de visión computacional en América y en el Mundo.

• Captura de Imagen: Cámaras, formatos, iluminación e optica.

• Algoritmos: Tratamiento, análisis de la imagen y Decisión.

• Desafíos Persistentes: sistemas comerciales X investigaciones académicas.

• Resumo

Que es Visión Computacional?

• Para industria– Utilización de dispositivos ópticos para receptar y

interpretar automáticamente una imagen de una cena real para obtener informaciones o controlar máquinas o procesos.

• Para academia– Es un dominio da ciencia da computación cuyo

objetivo es modelar el mundo real o reconocer objetos en imágenes digitales. Estas imágenes poden ser adquiridas usando vídeo, cámaras red infra, radares, o transductores especializados.

Page 2: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Visión Computacional X Humanos?

• Visión computacional puede ser vista como una substituta do sentido visual humano e da capacidad de juzgamiento con una cámara de vídeo e un computador para realizar una tarea.

• Con todo, a visión humana es falible!

X

Aplicaciones

BiometríaSeguridad e Controle de Acceso

Terminal Bancaria SupervisiónDocumentos / GED

Aplicaciones

OCV Presencia / Ausencia Calibración / Aferición

Metrología Código de Barras Verificación OCR

Aplicaciones

Medicina / Diagnóstico Supervisión de Tránsito

Page 3: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Tareas para Visión Computacional

• En la industria– Inspeccionar, medir, contar, identificar, verificar,

localizar, comparar, clasificar, leer, controlar, monitorear, reconocer

– Ambiente controlado, poca variabilidad

• En la academia– Clasificar, reconocer

– Ambiente irrestricto, alta variabilidad

Mercado

Mercado Mercado

Page 4: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Mercado Estado de la Tecnología de Visión

• Hasta el presente es considerada difícil:

– No es bien entendida

– Necesita de conocimiento multidisciplinar

– Cada aplicación necesita ser adaptada. No existe una solución general.

Puntos Importantes

• Los sistemas de visión computacional tienentecnología y bloques comunes:– Los costos pueden variar de US$1.000 a

US$$1.000.000– Tamaño y configuración variable:

• Cámaras Smart• Soluciones basadas en PC

• Existen múltiplas soluciones para un mismo problema.

Como Funcionan los Sistemas de VC?

• Capturar una imagen• Tratar y analizar la imagen

• Hacer algo con los resultados

Page 5: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Hardware

Computador

Iluminación Cámara

Tarjeta de Captura Interfaz conAplicación

Lentes

Smart Cameras

• Integran software e hardware para tratamiento de la imagen dentro de la cámara.

Computador

Cámara

Placa de Captura

http://www.cognex.comhttp://www.dvt.com

Captura de Imagen

• Principales componentes para la captura de una imagen

Iluminación

cámarase

lentes

Tarjeta de Captura

Transductor de Presencia

Captura de Imagen

• Parámetros que influyen en la captura:– Objeto en movimiento– Superficie do objeto– Iluminación– Tamaño– Distancia

Page 6: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Representación de la Imagen

• Las imágenes son representadas por una matriz con el nivel / color de los pixeles

Parámetros Fundamentales

• Un sistema de visón debe crear una imagen con calidad suficiente para permitir la extracción de las informaciones deseadas de la imagen.

• Note que “calidad de la imagen” varia de aplicación a aplicación.

Parámetros Fundamentales

• Existe una variedad de factores que contribuyen para la calidad de la imagen:– Resolución– Contraste– Profundidad de campo– Errores de perspectiva– Errores geométricos (distorsión).

Parámetros Fundamentales

Campo de Visión (FOV): A área visível do objeto sendo inspecionado. Porção do objeto que preenche o sensor da câmera.

Distancia de trabajo (WD): a distância entre a frente das lentes e o objeto sendo inspecionado.

Resolución: O tamanho mínimo dos detalhes do objeto que podem ser distinguidos pelo sistema de imagem.

Profundidad de Campo (DOF): A máxima profundidade do objeto que pode ser mantidainteiramente em foco. É também a quantidade do objeto que pode ser movimentada mantendo-se uma quantidade de foco desejada.

Tamaño del Transductor: Tamanho da área ativa do sensor da câmera geralmenteespecificada na dimensão horizontal. Este parâmetro é importante na determinaçãoda magnificação da lente necessária para obter um campo de visão desejado. A magnificação primária (PMAG) das lentes é definida como a razão entre o tamanho do sensor e o campo de visão.

Page 7: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Parámetros Fundamentales

A fórmula a seguir calcula a magnificação primária: PMAG = Tamanho do Sensor(mm) / Campo de Visão (mm).

A magnificação primária das lentes (PMAG) é definida como a razão entre o tamanhodo sensor e o campo de visão.

Parámetros Fundamentales

• A pesar de resolución e contraste de una imagen ser definidas individualmente, eles son relacionadas.

• Para determinar esta relación, es importante estudiarlos primeramente como elementos independientes.

Resolución e Contraste

Resolución é a quantidade de detalhes do objeto reproduzida pelo sistema de imagem.

Dois pixels da câmera CCD sãonecessários para cada par de linhas de resolução.

Resolución é uma medida da habilidade do sistema de imagem reproduzir detalhes de objetos. Umaimagem de baixa resolução é geralmente borrada e pobre em detalhes. A figura acima ilustra umavista simplificada de dois quadrados reproduzidos sobre pixel da câmera CCD.

Profundidad de Campo

• La profundidad de campo (DOF) de una lente es su habilidad de mantener una imagen de calidad deseada a medida que o objeto es posicionado más próximo e más distante de el mejor foco.

• DOF también se aplica a objetos con profundidad, visto que lentes con alto DOF poden capturar el objeto completo claramente.

• A medida que el objeto es colocado más cercano o más lejano de la distancia de trabajo, él tornase fuera de foco e tanto la resolución así como el contraste sufren.

Page 8: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Distorsión

• Distorsión es un error óptico (aberración) causado pelas lentes e que resulta en magnificaciones diferentes entre diferentes puntos da imagen

• Os puntos del objeto son mal posicionados en la imagen en relación a el centro de campo.

Distorsión

La distorsión porcentual es calculada pela siguiente formula:

% = (AD - PD / PD) x 100

donde: AD = Distancia actualPD = Distancia prevista

Errores de Perspectiva

• Errores de perspectiva, también llamados de paralaxe, faz parte da experiencia humana diaria.

• De hecho, paralaxe es el que permite el cerebro interpretar el mundo 3-D.

• Esperamos que objetos más cercanos parecían relativamente mayores que aquejes posicionados más distantes.

Errores de Perspectiva

Page 9: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Electrónica

• O transductor así como otros componentes electrónicos tienen un papel importante en el desempeño de un sistema de visión computacional.

Charge-Coupled Devices (CCDs)

• Son los transductores más utilizados en aplicaciones de visión computacional.

• A cámara CCD contén un chip de silicio que consiste de una matriz de elementos sensibles a luz, llamados pixels.

• Adicionalmente, CCDs ten una faja dinámica impresionante e levan a una relación altamente linear entre la energía de entrada e el sinal de salida.

Pixels CCD

• Cuando la luz atinge un chip CCD, ella é colectada por una matriz de pequeños elementos llamados pixels.

• La imagen es dividida en éstos pequeños pixelsdiscretos. La información de éstes elementos es colectada, organizada y transferida para un computador o monitor.

.

Pixels CCD

• Pixels asimétricos levan a una resolución horizontal mayor que la vertical.

• Cámaras CCD analógicas normalmente ten la misma resolución vertical. Por esta razón, el padrón de la industria es especificar resolución en termos de la resolución horizontal.

• Cámaras digitales non son limitadas pela largura de banda vertical e poden tener píxeles cuadrados o rectangulares.

Page 10: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Dimensión de Transductor CCD

• El tamaño da área activa del transductor es importante en la determinación del campo de visión.

• Dada una ampliación primaria fija (debido as lentes), transductores mayores llevan a campos de visión mayores. Existen varios tamaños de CCDs:

Cámaras Analógicas X Digitales

• El chip CCD es un componente analógico significando que “valores” de pixel son colectados atravez de selección (entrelazada o progresiva).

• El procesador de sinal y codificador convierte esta información en sinal analógico.

• En cámaras digitales, la digitalización ocurre a medida que la sinal es colectado por el chip.

Cámeras Analógicas X Digitais Digital

• Geralmente câmeras maiores

• A resolução vertical não é limitada, portanto, câmeras digitais podem ter maior resolução.

• Sem limitação de banda, oferecem um número maior de pixels e sensores CCDs maiores, resultando em resolução maior.

• Computador e placa de captura necessários para mostrar o sinal.

• O sinal pode ser comprimido e transmitido sem perdas.

• Têm geralmente pixels quadrados para resolução horizontal e vertical idênticas.

• O sinal de saída é digital, portanto pouca perda de sinal ocorre durante o processamento do sinal.

Analógica

• Tamanho geralmente menor.

• Resolução vertical é limitada pela largura de banda do sinal analógico.

• Sensores são geralmente de tamanho padrão.

• Computadores / placas de captura podem ser usadas para digitalização mas não são necessárias para mostrar o sinal.

• Impressão e gravação analógica pode ser facilmente incorporada ao sistema.

• Geralmente têm pixels retangulares.

• Sinais analógicos são susceptíveis a ruído e interferência que causam perdas no sinal.

Cámaras CCD Coloridas

• El chip CCD es basado en un efecto fotoelétricoy como resultado, no se puede distinguir entre colores.

• Existen dos tipos de cámaras CCD coloridas: – chip único.– tres chips (R, G, B).

Page 11: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Cámaras CCD Coloridas Entrelazado X Barredora Progresiva

• CCDs convencionales utilizan barredura entrelazada.

• El chip es dividido en dos campos: los campos impares (líneas 1, 3, 5..., etc.) y campos pares (líneas 2, 4, 6..., etc.).

• Estés campos son entonces integrados para producir un cuadro completo.

• Por ejemplo, con un escala de cuadros de 30 cps, cada campo leva 1/60 de segundo para ser leído.

Entrelazado X Barredora Progresiva

• Para la mayoría de las aplicaciones, barredura entrelazada no causa problemas.

• Los problemas pueden aparecer en aplicaciones de alta velocidad en el momento en que el segundo campo es barrido, y el objeto se haya movido.

• Esto causa fantasmas o borrones en la imagen resultante.

Objetos en Movimiento

• El CCD de barredura progresiva resolví este problema barriendo las líneas de manea secuencial (líneas 1, 2, 3, 4..., etc.).

Objetos duplicados

Page 12: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Entrelazado X Barredura Progresiva

• El CCD de barredura progresiva resolví este problema barriendo las líneas de manea secuencial (líneas 1, 2, 3, 4..., etc.).

• La salida de la barredura progresiva no es patronada, por tanto la escogencia de hardware debe ser cuidadosa.

• Algunas câmeras de barredura progresiva ofrecen una salida de señal analógico, pero pocos monitores son capaces de mostrar la imagen.

Taxa de Quadros X Velocidade do Shutter

• A taxa de quadros indica o número de quadros completos (que pode consistir de dois campos) compostos em um segundo.

• Em aplicações de alta velocidade, pode ser benéfico escolher uma taxa de quadros mais rápida para capturar mais "imagens" do objeto enquanto ele se move.

Taxa de Quadros X Velocidade do Shutter

• A velocidade do shutter corresponde ao “tempo de exposição” do chip CCD.

• O tempo de exposição controla a quantidade de luz incidente no chip.

• Super-exposição pode ser controlada pelo decréscimo da iluminação ou ganho da câmera, ou aumentando a velocidade do shutter.

Taxa de Quadros X Velocidade do Shutter

Page 13: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Resolución y Contraste de CCD

• La resolución de una cámara CCD pode ser especificada de diferentes maneras:– Número de píxeles– Líneas de TV

– En general, la resolución 640 x 480 es suficiente para la mayoría de las aplicaciones de visión computacional.

Número de Pixels

• Câmera digital CCD que tem 1392H x 1040V pixels em um sensor 6.5H x 4.4V (mm).

• Uma interpretação simples desta especificação é imaginar o campo de visão sendo dividido em 1392 x 1040 partes.

• O detalhe mínimo identificável são 2 destas partes.

• Não leva em conta a performance das lentes.

Linhas de TV

• Em CCDs analógicos, a especificação “Linhas de TV” é geralmente usada para avaliar resolução.

• A especificação “Linhas de TV", ou "TVL" é uma unidade de resolução baseada em uma barra alvo com linhas igualmente espaçadas.

• Se o alvo é estendido de modo que ele cubra o campo de visão, o número de linhas de TV é calculado somando todas as linhas resultantes e espaços.

• Existem também um fator de normalização usado no calculo do valor da Linhas de TV horizontal baseado na razão de aspecto 4:3 dos chips.

Profundidad de el Píxel

• Generalmente es referido como escala de gris o faja dinámica de una cámara CCD, representa el número de niveles de gris en la imagen.

• Esta ligada a la cuantidad mínima de contraste detectable por un transductor CCD.

• Varias cámaras fornecen 256 niveles de gris. Otros modelos operan en 8 bits (256 niveles de gris) y 10 bits (1024 niveles de gris).

Page 14: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Relação Sinal Ruído (SNR)

• A relação sinal ruído (SNR) está diretamente ligada a faixa dinâmica da câmera.

• Altas SNRs levam um alto número de passos na escala de cinzas (alto contraste) mostrados pela câmera. Em sistemas analógicos a SNR é expressa em dB e em bits em sistemas digitais.

• Em geral, 6dB de SNR analógico é convertido para 1-bit quando digitalizado. Para câmeras digitais ou analógicas, X bits corresponde a 2X níveis de cinza (i.e. câmeras de 8 bits têm 28 ou 256 níveis de cinza).

• Existem duas fontes de ruídos em CCDs: imperfeições no chip que resultam em crosstalk e ruído térmico.

Saída do Sinal CCD

• Existem poucos formatos para sinais de vídeo analógico.

• Nos Estados Unidos a Electronic Industries Association(EIA) definiu o sinal monocromático como RS-170. A versão em cores, definida como RS-170A, é mais conhecido por NTSC, que denota National TelevisionStandards Committee.

• Tanto RS-170 quanto NTSC são sinais compostos que significa que toda informação de cor e intensidade é combinado em um único sinal.

Saída do Sinal CCD

• Existem sinais componentes (Y-C e RGB) que separam crominância (cor) da luminância (intensidade da cor). CCIR é o padrão Europeu para monocromático enquanto PAL e SECAM são os padrões Europeus para cor.

• Câmeras digitais CCD ganham popularidade pois, ruído de transmissão, distorção ou outras degradações do sinal não afetam a informação sendo transmitida.

• Como o sinal de saída é digital, há pouca perda de informação na transmissão.

Ganho

• Os ajustes de ganho controlam a amplificação do sinal vindo do chip CCD.

• Deve ser observado que o sinal completo é amplificado, incluindo qualquer ruído de fundo associado.

• A maioria das câmera possuem um controle automático de ganho (autogain ou AGC) e algumas não permitem que o usuário desligue-o e faça o ajuste manual.

Page 15: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Gamma

• O controle gamma controla o nível de cinzas reproduzido na imagem. Uma imagem com gamma unitário indicaqueo CCD está reproduzindo precisamente os níveis de cinza do objeto (resposta linear).

• Gamma muito maior do que a unidade resulta em imagens com silhuetas, em branco e preto. Gammamuito menor do que a unidade gera uma imagem ligeiramente cinza.

• Gamma pode ser considerado com a habilidade de esticar um lado (ou o branco quanto o preto) da faixa dinâmica do pixel.

Tarjeta de Captura

• Una gran cantidad de tratamiento de la imagen es hecho en computadores.

• La tarjeta de captura permiten transferir lo señal de la cámara para un computador.

• Para un señal analógico (NTSC, PAL, YC, etc.), la tarjeta contén un conversor analógico-digital (ADC) para digitalizar lo señal.

Tarjeta de Captura Iluminación

• Una iluminación non apropiada causa problemas de resolución e contraste.

• De hecho, la calidad deseada de la imagen pode normalmente ser atingida mejorando la iluminación en lugar de modificar resolución, lentes e software.

• La intensidad de luz apropiada en la imagen final depende directamente de la selección de los componentes.

Page 16: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Iluminación

• Cada componente afecta la cuantidad de luz incidente sobre lo transductor e afecta luego la cualidad de la imagen.

• La abertura (f/#) de las lentes ten un impacto directo sobre la cuantidad de luz incidente en la cámara. La iluminación debe ser aumentada a medida en que la abertura de las lentes es diminuida. (i.e. alto f/#).

• La sensibilidad mínima de la cámara es también importante para determinar a mínima cuantidad de luz necesaria. Además, los ajustes de la cámara CCD afectan la sensibilidad de lo transductor.

Iluminación

• A abertura das lentes, magnificação do sistema, ajustes da câmera, filtragem e outros parâmetros de iluminaçãoirão afetar a luz incidente sobre o sensor.

• Estes fatores precisam ser ajustados para acomodar objetos com diferentes características (perfil, refletividade, etc.).

• O quadro a seguir ilustra alguns cenários que, quandoseguidos, podem refinar significantemente a performance de um sistema de imagens.

Iluminación

Luz EstruturadaObjeto com protuberâncias, objeto 3-D.Perfil da forma 3-D do objeto

Iluminação de FundoQualquer tipo de objetoSilhueta do objeto

Campo EscuroObjeto transparenteDestacar defeitos dentro do objeto

Difusa Frontal, Difusa Axial, Guia emAnel

Objeto com protuberâncias, objetos 3-D

Reduzir sombras

Direcional, Luz EstruturadaQualquer tipo de objetoDestacar a textura o objeto comsombras

Direcional Única, Luz EstruturadaObjeto 2D quase chatoDestacar os defeitos da superfície outopologia

Difusa frontal, Difusa Axial, Guia emAnel

Qualquer tipo de objetoIluminação par do objeto

Difusa frontal, Difusa Axial, PolarizadaObjeto brilhanteRedução da especularidade

Tipo de IluminaçãoSugerida

Tipo de Objeto sobInspeção

Requisitos da Aplicação

Ejemplos de Iluminación

Iluminación apropiada es generalmente el factor determinante entre el suceso e el fracaso en la captura de una imagen.

Page 17: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Ejemplos de Iluminación

Difusa FrontalPros: minimiza sombras e reflexões especulares.Cons: características da superfície são menos distintivas.Tipo: fluorescentes lineares, anéis fluorescentes.

Ejemplos de Iluminación

Direcional (Única ou Bilateral)

Pros: forte, iluminação relativamente regularCons: sombras, brilhoTipo: única e guias de luz de fibra ótica dual

Ejemplos de Iluminación

Direcional ÚnicaPros: mostra defeitos na superfície, topologiaCons: manchas de luz, sombreamento severoTipo: guias de luz de fibras óticas

Ejemplos de Iluminación

Luz EstruturadaPros: extração de características da superfícieCons: fonte extremamente intensa, absorvida por algumas coresTipo: Diodos laser em linha, guias de luz lineares de fibra ótica

Page 18: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Ejemplos de Iluminación

Anel GuiaPros: reduz sombras, iluminação relativamente regularCons: padrão de brilho circular de superfícies altamente reflexivas; algumas vezes difícil de montarTipo: fibra ótica ou anel de LEDs

Ejemplos de Iluminación

Luz PolarizadaPros: iluminação regular, remove especularidades.Cons: baixa intensidade através do polarizadorTipo: filtro é anexado a muitas lentes e fontes de luz.

Ejemplos de Iluminación

Difusa Axial Pros: livre de sombras, iluminação regular, pouco brilhoCons: baixa intensidade através do divisor de feixe interno, afeta FOV e WDTipo: LED de iluminação axial, adaptadores axiais de fibra óticas.

Como Funcionan los Sistemas de VC?

• Capturar una imagen • Tratar y analizar la imagen

• Hacer algo con los resultados

Page 19: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Como Funcionan los Sistemas de VC?

• Tratamiento de la imagen– Cálculos matemáticos sobre una imagen– Convertí una imagen en otra imagen donde los pixels

tienen valores diferentes

• Análisis de la Imagen– Cálculos matemáticos sobre una imagen– Extracción de características (features) que describan

lo contenido de la imagen en termos numéricos.

Tratamiento de la Imagen

• Técnicas para mejorar la imagen antes de analizarla.

Imagen original Imagen tratada

Binar

izac

ión

Por que Tratar una Imagen?

• Reducir o eliminar el ruido

• Mejorar la información sobre características significantes

• Eliminar informaciones de el fundo o desnecesarias.

• Tornar el proceso de decisión más fácil

Objetivos del Tratamiento

• Tener una mejor imagen para analizar

Remover ruidos Mejorar característicasEncontrar bordes

Page 20: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Técnicas de Tratamiento

• Transformaciones Puntuales:– Cada píxel de la imagen es considerado

individualmente– Binarizacion, ecualización de histograma,

estiramiento / mapeo de los niveles de gris.

• Filtraje Espacial:– Cada píxel es transformado con base también en los

píxel adyacentes– Filtros pasa-alta, pasa-baja e geométricos.

Transformaciones Puntuales

• Binarización

• Ecualización de histograma

• Mapeo de el nivel de gris

Transformaciones de Adyacencia

• Filtros pasa-alta

• Filtros pasa-baja

• Filtros geométricos o morfológicos

Definición de Adyacencia

2 X 2

3 X 3

5 X 5

7 X 7

Page 21: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Como los Filtros Funcionan?

• Una máscara es pasada sobre todos los pixels de la imagen original.

• Una operación matemática es realizada e lo pixel central de la imagen es substituido pelo novo valor calculado.

Como los Filtros Funcionan?

Filtros Pasa-Baja

• Mediana– Elimina pequeños detalles– Bueno para eliminar ruido

• Media– Reduce el brillo– Elimina pequeños detalles– Borra las bordes– Bueno para eliminar ruido

Filtros Pasa Alta

• Refuerza los pixels donde acontece una mudanza en el valor de el nivel de gris entre dos o más pixels adyacentes.

• Usado para encontrar bordes en imagens.

Filtro Sobel Filtro Laplace Filtro Prewitt

Page 22: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Operadores Morfológicos

• Operador non-linear de cercanía.

• Determina el valor de un píxel a partir de relaciones geométricas con sus vecinos.

• Aplicación: Filtro para remover pequeñas anomalías en la imagen

• Non altera el tamaño de lo objeto

Operadores Morfológicos

• Erosión

• DilataciónImagen original binaria

• Abertura– Remove pequeñas partículas

• Cerramiento– Llena pequeñas aberturas

Análisis de la Imagen

• El algoritmo opera sobre una imagen y extrae vectores de características.

Extracción de Características

Imagen de Entrada

Análisis de la Imagen

• El algoritmo opera sobre una imagen y extrae vectores de características.

Page 23: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Por que Analizar la Imagen?

• Para generar información cuantitativa sobre os datos complexos de la imagen para:– Decisión aceptar / recusar– Localización de objetos– Identificación– Clasificación– Enumeración

• Para tomar decisiones

Por que Analizar la Imagen?

Localización de objetos en la imagen

Enumeración de elementos en la imagen

Medición del diámetro

Analice Robusta de la Imagen

• Una imagen nunca es la misma...– Alteración en la imagen de objeto para objeto– Alteración en la imagen de uno mismo objeto

• Generalmente non es posible controlar la aparición de un objeto

• Cuantidad de dados es relativamente pequeña en relación a que el ojo humano puede ver.

Dificultades para VC Robusta

• Imagen pertenecen a un conjunto grande e variable

• Algoritmos para extracción de características son operaciones matemáticas fijas, en cuanto los dados son variables.

Page 24: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Como Tornar VC Robusta?

• Mejorar la cualidad de la imagen– Alto contraste: buena iluminación e campo de visión– Reducir la presencia de fundo

• Mantener constante las condiciones de el ambiente

• Definir regiones de interese

Regiones de Interese

• Encuadrar solamente la área donde la característica de interese aparecerá

• Permitir una cobertura extra (tolerancia)

Determinando Regiones de Interese

• Región de interese al derredor de cada característica a ser medida o verificada.

?

Informaciones en Imágenes

• Espectral– Non ha información de localización– Color o intensidad de los pixels.– Pode ser usada para verificar presencia / ausencia– Conteo de pixels– Análisis de histograma– Nivel de gris medio

• Espacial– Relación de la información do pixel en el espacio.

Page 25: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Análisis Espectral

• Mede cuanto claro o negra es la imagen y una decisión es tomada con base en el valor medido.

1. Definir la región de interese (ROI).

2. Binarizar la imagen 3. Contar el numero de pixels

blancos o negros.4. Comparar a un valor

conocido.Ventana de inspección de 17 x 14Objeto ocupa 70 pixels

Análisis Espacial

• Tipos de análisis espacial– Conectividad– Analice de bordes

• Medida• Localizacion

– Correlación– Geométricas

Análisis Espectral

• Análisis de Conectividad

1. Binarizar la imagen2. Definir la región de

interese (ROI).3. Iniciar el algoritmo4. Identificar cual

característica geométrica fornece la información necesaria Características

de lo objeto negrotamaño, forma, perímetro, etc.

Análisis Espacial

• Características geométricas disponibles a partir de análisis de conectividad:– Área– Perímetro– Compacto: relación entre el perímetro e la área– Centro de gravedad– Coordenada mínima– Número de perforaciones– Razón de aspecto– Etc.

Page 26: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Usando Características Geométricas

• Localización– Centro de gravedad o coordenada mínima que puede

indicar donde lo objeto es dentro de la imagen

• Identificación– Características geométricas pueden ser usadas para

diferenciar objetos

• Verificación– Similar a presencia / ausencia.

Técnicas para Comparacion de Patrones

• Correlacion de Nivel de Gris Normalizado

– El sistema es entrenado con una muestra padron.

– Durante la ejecución, el sistema intenta a encontrar la mejor coincidencia entre la muestra padrón e los pixeles de la imagen

• Correlación pixel a pixel• La distribución nivel de gris de los pixels es normalizada

– Fornece la mejor localización e % de coincidencia

Técnicas para Comparación de Patrones

• Correlación de lo patrón (Template Matching)

– El sistema es entrenado con muestras padrón, generando un modelo.

– El modelo es movido sobre la imagen– El sistema guarda la % de coincidencia entre el

padrón e la imagen.– El padrón repasa toda la imagen– La mejor coincidencia e % de coincidencia es

retornado.

Técnicas para Comparación de Patrones

• Correlación de Patrones (Template Matching)

Page 27: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Técnicas para Comparación de Patrones

• Comparación de Vectores

– Extracción de las bordes de la imagen• Características geométricas calculadas a partir de los

segmentos de la borde• Un conjunto de vectores generados a partir de buenas

muestras es guardado• Lo sistema compara los vectores guardados con los vectores

extraídos da imagen.

– Menos sensible a escala, rotación, contraste e oclusión.

Como los Sistemas de VC Funcionan?

• Capturar una imagen • Tratar y analizar las imágenes

• Hacer algo con los resultados

El Proceso de Decisión

• Capturar una imagen• Definir la región de

interese

• Binarizar

• Contar pixels• Repetir múltiplas veces

para– Mismo objeto, diferentes

posiciones– Diferentes objetos

70 75

El Proceso de Decisión

• El conteo de pixels pode variar, puesto que:

– Errores de cuatización:• Los pixels da borda

pueden ser clasificadas como de lo objeto o de el fundo

– Errores de binarización: • Pequeñas variaciones en

la iluminación pueden resultar en diferentes niveles de gris

Page 28: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

El Proceso de Decisión

• Para tornar el proceso de decisión más robusto:

– Obtener una variación nos objetos representativosque serón inspeccionados

• Diferentes lotes• Diferentes distribuidores

70 75

– Tenemos un esparcimiento de el desviación del standard.

Num pixels negros

Fre

cuen

cia

El Proceso de Decisión

– Obtener también una variación en los objetos defectuosos que poderá ser inspeccionados

• Diferentes tipos de fallas

• Demasiado fuera de especificación

• Poco fuera de especificación

40 50

Num pixels negros

Fre

cuen

cia

El Proceso de Decisión

– Del mismo modo, podemos establecer un limiar(threshold) para separar los buenos objetos de los defectuosos.

Limiar

40 50

Num pixels negros

70 75

Fre

cuen

cia

Falsa Rechazo e Falsa Aceptación

• Entretanto, para un dado problema, es posible tener una superposición entre las curvas.

• En este caso non conseguimos establecer un limiar ⇒ erros!

Page 29: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Razones de la Superposición

• Calidad de lo vector de características– Intolerancia a mudanzas de color o tamaño– Intolerancia a variación de luminosidad

• Cámara non esta forneciendo una imagen similar a la utilizada para entrenamiento e ajustes

• Lentes sucia o fuera de foco

Problema de la Falsa Rechazo

• Limiares son fijo para garantir que solamente os “bons” ítems son aceptos

• Buenos ítems son rechazados.

Limiar

Problema de la Falsa Aceptación

• Limiares son ajustados para aceptar algunos ítems “defectuosos”.

• Ítems “defectuosos” son aceptos.

Limiar

Desafíos Remanecientes

• Aplicaciones comerciales de visión computacional son sujetas a:– Ambientes controlados (iluminación)– Objetos presentados de manera consistente– Cenas pueden ser limitadas / ristritas.

Page 30: Visión Computacional (VC) - Programa de Pós-Graduação ...alekoe/Papers/Apresentacao-CERMA2005.pdf · rápida para capturar mais "imagens" do objeto enquanto ele se move. Taxa

Desafíos Remanecientes

• Pesquisas:– Ambientes non controlable– Objetos inconsistentes– Cenas sin restricciones– Extracción de características

• Aprendizaje de máquina e reconocimiento de patrones.

Imag

em Imag

em

Mel

hora

da

Vetor

de

Carac

terís

ticas

Vetor

de

Carac

terís

ticas

Recursos

• Biblioteca OpenCV Intelhttp://sourceforge.net/projects/opencvlibrary

• Automated Imaging Association (AIA)http://www.machinevisiononline.org

• Edmund Opticshttp://www.edmundoptics.com

• Cognexhttp://www.cognex.com

• Computer Vision Pagehttp://www-2.cs.cmu.edu/~cil/vision.html

Gracias por su atención

www.alekoe.org

[email protected]