Disparidades, Correspondências e Corte Mínimo para Estéreo Vitor Barata R. B. Barroso...

Disparidades, Correspondências e

Corte Mínimo para EstéreoVitor Barata R. B. Barroso

vbarata@tecgraf.puc-rio.br

INF 2064 - Visão Computacional eRealidade Aumentada

Trabalho Final

Introdução

O Problema de Visão em Estéreo Duas câmeras capturam a mesma cena

simultaneamente A partir das duas seqüências de imagens,

queremos: Descobrir pontos, vistos por cada câmera num

mesmo instante, que correspondem ao mesmo ponto real

Deduzir posições reais dos pontos e gerar um modelo virtual do mundo

Cam 2Cam 1

O Problema de Visão em Estéreo Simplificações comuns: Câmeras sincronizadas, imagens do mesmo

instante Modelo das câmeras conhecido, imagens

retificadas Deslocamento apenas em um eixo, horizontal nas

imagens Distância e ângulo pequenos entre as câmeras Ruído desprezível

O Problema das Disparidades Dadas duas imagens de estéreo: Encontrar os pixels correspondentes e oclusos

entre as duas Gerar um mapa indicando, para cada pixel de uma

imagem: A distância em relação ao pixel correspondente na

outra imagem Um valor especial para indicar oclusão

<x2,y2> = <x1,y1> d(x1,y1)

O Problema das Disparidades Modelagem do problema Superfícies lambertianas: a aparência não varia

com o ponto-de-vista Semelhança entre pontos individuais medida pela

intensidade (luminância) Superfícies suaves por partes

Regiões com variação suave de intensidade devem ter variação suave de disparidade

Descontinuidades na intensidade indicam bordas e devem poder ser preservadas na disparidade

Abordagens Análise local Correspondência entre dois pixels depende apenas das vizinhanças

(janelas) SSD/SAD (“sum of squared/absolute differences”) com janela fixa ou adaptativa Correlação cruzada normalizada

Análise global Correspondência entre pares de pixels estabelecida na imagem inteira por

meio de um problema de otimização (minimização de função de custo/erro/energia) Têmpera simulada (“Simulated annealing”) Difusão probabilística Corte mínimo de grafos

Análise por scanlines Dificuldade de preservar a ordem dos pixels e manter consistência entre

scanlines

Análise cooperativa Baseada na modelagem computacional da visão estéreo humana Operações locais iterativas resultando numa otimização global

Abordagens

Refinamento do mapa de disparidades Estimativas de disparidade sub-pixel Validação cruzada

Computam-se disparidades nos dois sentidos entre duas imagens

Se o pixel A for mapeado em B e este não for mapeado de volta, marca-se A como ocluso

Filtros para eliminar erros espúrios Preenchimento de “buracos” por ajuste de

superfícies

Algoritmos de Análise Local

Correlação Cruzada

SSD com janela fixa Idéia: a vizinhança de pixels correspondentes

deve ter alta correlação nas duas imagens

SSD com janela fixa Problema: essa heurística nem sempre

funciona, principalmente perto de descontinuidades de oclusão

SSD com janela fixa Erro associado a mapearmos um pixel A

(xA,yA) para um pixel B (xB,yB) com disparidade (u,v) Tomamos janelas de tamanho 2W ao redor de

ambos pixels Erro de intensidade = ||I2 – I1|| ou (I2 – I1)2

Erro de mapeamento = soma dos erros de intensidade ao longo de toda a janela

xB=xA+u

yB= yA +vA

SSD com janela fixa Escolha do mapeamento do pixel A na

segunda imagem (u,v) que minimize a expressão abaixo, dentre

todas as opções de disparidade consideradas

vyuxIyxIvuE 212 ),(),(),(

xB=xA+u

yB= yA +vA

SSD com janela fixa

Resultados após validação cruzada

Algoritmos de Análise Global

Corte Mínimo de Grafo baseado em Pixels

Minimização de Energia Encaramos a correspondência como um problema de

classificação de pixels A imagem é um conjunto P de pixels com um sistema de vizinhança

N O rótulo/etiqueta de um pixel p é sua disparidade fp, que pode

assumir apenas valores discretos (inteiros ou não) O mapeamento f pode ser associado à seguinte energia (a ser

minimizada):

Edata mede o erro de intensidade entre pixels correspondentes:

Eneighbor penaliza relações indesejadas entre disparidades de pixels vizinhos. Geralmente, é usado para garantir a conservação de regiões suaves ( V(a,a) = 0 ) e descontinuidades:

)()()( fEfEfE neighbordata

ppdata pIfpIfDfE

qppqsmoothneighbor ffVfEfE},{

Minimização Local de Energia Minimizar E(f) para uma imagem é um problema NP-

difícil Milhões de mapeamentos possíveis! Muitos mínimos locais ruins!

Buscamos um mínimo local forte, próximo ao global

Algoritmo iterativo: Começamos com um mapeamento f arbitrário Ciclo:

f pode ser alterado por “movimentos”, gerando vários possíveis f’ Para cada f’ que possa ser gerado a partir de f

Encontrar f’ que tem a menor energia Se E(f’) < E(f), fazemos f f’

Repetir o ciclo enquanto for possível qualquer atualização de f

Crítico: encontrar f’ de menor energia em cada iteração Conseguiremos em tempo polinomial, praticamente linear!

Tipos de movimentos Movimentos locais Alteração do rótulo (disparidade) de um pixel

para um valor qualquer Costuma achar mínimos locais muito distantes do

global

Movimentos globais Inversões

Substituímos, de uma só vez, rótulos por e vice-versa, para qualquer número de pixels

Achar mínimos locais muito fortes Expansões

Substituímos, de uma só vez, o rótulo de qualquer número de pixels por um rótulo

Acha mínimos locais a um fator pequeno e conhecido do global

Corte Mínimo de Grafos Solução por Grafos: Um nó para cada pixel da imagem

Apenas rótulos ou para inversões

Qualquer rótulo para expansões Nós terminais extras:

e para inversões e ! para expansões

Arestas entre cada pixel e ambos terminais Arestas entre pares de pixels vizinhos Pesos apropriados nas arestas

Corte do grafo: Conjunto mínimo de arestas que separa os terminais Partição dos nós em subconjuntos contendo cada terminal Custo do corte é dado pela soma dos pesos das arestas Corte mínimo: aquele com o menor custo possível

Corte Mínimo de Grafos Relacionando com o problema: Corte do grafo mapeamento f’

O corte separa cada pixel de um, e apenas um, dos terminais Os pixels recebem o rótulo do nó terminal que foi separado pelo

corte Custo do corte energia de f’ Corte mínimo f’ de menor energia

Corte Mínimo de Grafos Construção do grafo: Pesos das arestas são penalidades pelo corte passar por elas

Projetados para casar o custo do corte com a energia do mapeamento

Refeita dinamicamente a cada ciclo do algoritmo Pode ser necessário criar vértices auxiliares

Para expansões α, aparecem apenas entre vértices com rótulos diferentes em f

Grafo para Inversões

PqNq qpp

PpfVDt

,,, ),,(

Grafo para Expansões

ffNqpfVe

,,),,(

ComparaçãoImagem EsquerdaDisparidades Verdadeiras

Correlação Corte de Grafo por Pixels

Corte de Grafopor Atribuições

Algoritmos de Análise Global

Corte Mínimo de Grafo baseado em Atribuições

Reformulação do Problema A formulação anterior trata as imagens de forma

assimétrica e não trata: Oclusões – pixels de uma imagem sem correspondente na outra Unicidade – cada pixel só deveria ser mapeado a um único pixel

de destino

Abordagem alternativa Pixels:

Imagem da esquerda L com pixels l L Imagem da direita R com pixels r R União de todos os pixels p P = L R

Atribuições Conjunto A de todas as atribuições a = < l , r > que podem ser feitas

correspondendo pares de pixels nas duas imagens O rótulo fa de uma atribuição a só pode ser 1 (ativa) ou 0 (inativa) Unicidade: impomos que só pode haver uma (ou nenhuma) atribuição

ativa para cada pixel

Unicidade e Movimentos Unicidade

f = configuração de atribuições (ativas e inativas) active(f) = {a : fa = 1} = conjunto de atribuições ativas em f

Nl(f) = { <l,x> ativa } = atribuições ativas que envolvem o pixel l

Nr(f) = { <x,r> ativa } = atribuições ativas que envolvem o pixel r

Pixel ocluso: | Np(f) | = 0

Unicidade: | Np(f) | <= 1, p P

Expansão A = todas as atribuições com disparidade α active(f’) (active(f) A) Quaisquer atribuições podem ser desfeitas Atribuições com disparidade α podem ser acrescentadas

Inversão A = todas as atribuições com disparidade α ou β (active(f’) A) = (active(f) A) Atribuições com disparidades α ou β podem ser acrescentadas ou removidas

Função de Energia Usamos a seguinte função de energia:

Penalidades:

Vizinhança: atribuições são vizinhas quando partem ou chegam em pixels vizinhos Inversão: penaliza atribuições ativas próximas com disparidades diferentes

Expansão: penaliza a não existência de atribuições ativas próximas com a mesma disparidade

)()()()( fEfEfEfE smoothocclusiondata

factivea

srcdstdata aIaIfE

21 21},{ 21 1)(

adadNaa aasmooth afafTVfE

occlusion KpoccludedTfE

))(()(

21 21},{ 21)(

Definições: A0 = {aactive(f) : d(a) α} A = {aA : d(a) = α} F = (f : active(f) = Ã), Ã = A0 A

Np(F) {0,1,2}, p P

Vértices: terminais s,t cada atribuição a Ã

Arestas direcionadas: (s,a) e (a,t) entre cada atribuição e os terminais (a1,a2) e (a2,a1) entre a1 e a2 vizinhas ({a1, a2} N, ambas A0 ou ambas A )

(a1,a2) e (a2,a1) entre a1A0 e a2A ambas envolvendo um pixel p

Relacionando: aA0 f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aA f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada) aÃ f’(a) = 0

Grafo para Expansões

Custo de dados Lembrando: aA0 f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aA f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Então:

factiveafactivea

srcdstdata aDaIaIfE )()(2

AaaDas

AaaDta

,),( 0

Custo de oclusão e unicidade Lembrando: aA0 f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aA f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Definições:

Então:

))(()(

)1)(()(

FactiveTKpD

rDlDrlaD

occocc

occoccocc

apapPp

AaaDta

AaaDas

Docc(a0)

Docc(a)

Custo de (des)continuidade Lembrando: aA0 f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aA f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Definição:

Então:

21 21},{ 21)(

Ãaadad

Naaaasmooth VaD

2121)()(

AouAaa

AaaDta

smooth

Definição:

Então:

21 21},{ 21)(

Dsmooth(a0)

AouAaa

AaaDta

smooth

Ãaadad

Naaaasmooth VaD

2121)()(

Grafo para Expansões Pesos:

apapPp

AaaDas

AaaDaDta

AaaDta

AaaDas

smooth

ÃaadadNaa aasmooth

occoccocc

rDlDrlaD

22121 21),()(,, ,)(

Grafo para Inversões Definições: A0 = {aactive(f) | d(a) α e d(a) β} A = {aA | d(a) = α}, A = {aA | d(a) = β} A = A Aβ

Vértices: terminais s,t cada atribuição aA

Arestas direcionadas: (s,a) e (a,t) entre cada atribuição e os terminais (a1,a2) entre a1A e a2A vizinhas ({a1, a2}N)

(a2,a1) entre a1A e a2A ambas envolvendo um pixel p

Relacionando: aA f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aAβ f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada) aAβ f’(a) = f(a)

aβaα

Custo de dados Lembrando: aA f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aAβ f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Então:

factiveafactivea

srcdstdata aDaIaIfE )()(2

aβaα

D(aα)

D(aβ)

AaaDas

AaaDta

Custo de oclusão (e unicidade) Lembrando: aA f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aAβ f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Definições:

Então:

))(()(

)1)(()(

FactiveTKpD

rDlDrlaD

occocc

occoccocc

Docc(a)

Docc(aβ)

apapPp

AaaDta

AaaDas

Custo de (des)continuidade Lembrando: aA f’(a) = 1 se a ficar ligado a s (se (s,a) não for cortada) aAβ f’(a) = 1 se a ficar ligado a t (se (a,t) não for cortada)

Definição:

Então:

AaaDas

AaaDta

smooth

, ,)(Aa

Naa aasmooth VaD

21 21},{ 21 1)(

Definição:

Então:

Dsmooth(a)

21 21},{ 21 1)(

Dsmooth(aβ)

, ,)(Aa

Naa aasmooth VaD

AaaDas

AaaDta

smooth

Grafo para Inversões Pesos:

apapPp

AaaDaDas

AaaDaDta

AaaDta

AaaDas

smooth

AaNaa aasmooth

occoccocc

rDlDrlaD

Inversões e Unicidade Unicidade no algoritmo de inversões Não incluir atribuições aαβ=<l,r> se Nl(f) = {a0} ou Nr(f) =

{a0} Como a atribuição a0 não será desligada, não podemos ligar aα

nem aβ

Custo ∞ para ligar simultaneamente aα e aβ envolvendo um mesmo pixel

Vantagens Unicidade garantida por construção Implementação mais simples, cada pixel admite

apenas uma atribuição ativa em cada instante Problema Inversões ficam restritas demais e perdem poder Atingimos mínimos locais muito ruins

Parâmetros Custo de dados

Custo de oclusão: Kocc

Custo de suavidade: Fixo ou proporcional à descontinuidade? Rezudido onde há descontinuidade de

intensidade?

contráriocaso

daIaIaIaIseV rrll

,max, min2121, 21

,min)(

daIaIaD

srcdst

ComparaçãoImagem EsquerdaDisparidades Verdadeiras

Correlação Corte de Grafo por Pixels

Corte de Grafopor Atribuições

Melhor Resultado Expansão de atribuições Custo de dados quadrático limitado em 400 Custo de oclusão 15 Custo de continuidade 10 Aumentado para 100 se intensidades diferem

menos de 10

Referências Y Boykov, O Veksler, R Zabih, Fast Approximate

Energy Minimization via Graph Cuts - IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 11, pp. 1222-1239, November, 2001.

V Kolmogorov, R Zabih, Computing Visual Correspondence with Occlusions via Graph Cuts - International Conference on Computer Vision, 2001

D Scharstein, R Szeliski, A taxonomy and evaluation of dense two-frame stereo correspondence algorithms - International Journal of Computer Vision, vol. 47, no. 1-3, pp. 7-42, April, 2002

Disparidades, Correspondências e Corte Mínimo para Estéreo Vitor Barata R. B. Barroso...

Documents

Transcript of Disparidades, Correspondências e Corte Mínimo para Estéreo Vitor Barata R. B. Barroso...

ALTO-FALANTE ESTÉREO PARA AUTOMÓVEIS - jvc.net · alto-falante estÉreo para automÓveis car stereo speaker stereo-autolautsprecher haut-parleurs auto stereo auto stereo luidsprekers

Gestão do Conhecimento nas Organizaçõesriut.utfpr.edu.br/jspui/bitstream/1/2064/1/gestaoconhecimentoorganizacoes.pdf · o tempo de desenvolvimento. O espaço no mercado é conseguido

Auto-rádio FM estéreo/AM com toca-discos a · PDF fileCDX-GT317X Impresso no Brasil Auto-rádio FM estéreo/AM ... Para a instalação e conexões, veja o manual de instalação

Disparidades de Produto, Produtividade e Emprego no Brasil · Disparidades de Produto, Produtividade e Emprego no Brasil Dissertação para a obtenção do título de ... ARARAQUARA

Disparidades remunerativas en el mercado laboral ...

SBC8003P Fone de ouvido estéreo para som digital Projetado ... · SBC8003P Fone de ouvido intra auricular estéreo para som digital O fone de ouvido intra auricular estéreo eletrodinâmico

UNIVERSIDADE DE LISBOA - repositorio.ul.ptrepositorio.ul.pt/bitstream/10451/2064/1/23165_ulfl78284_tm.pdf · documento electrónico, assinatura digital, normas, globalização, informação

PT Auricular estéreo Bluetooth - download.p4c.philips.com · 7.3 Funcionamento do seu Auricular 10 7.4 Usando o seu auricular estéreo ... os quais podem ser reciclados e reutilizados.

Manual do Usuário do Fone de Ouvido Estéreo …download-fds.webapps.microsoft.com/supportFiles/files/...6 1. Introdução Com o Fone de Ouvido Estéreo Bluetooth Nokia BH-503, você

Disparidades territoriais em educação na Região do Norte ... · Fotografias CCDR‐N ... de setembro de 2012. Escolarização na Região do Norte [Evolução das Disparidades Territoriais

Disparidades Entre as Diretrizes e a Atual Realidade

Microscópio estéreo sem oculares de alta produtividade · Melhore sua produtividade Vantagem ergonômica Embora a vantagem do Lynx EVO seja advinda da incrível imagem 3D (estéreo),

VJing Urbano Kine#estéreo#gráfico: Identidades e interação … · 2015. 1. 28. · VJing Urbano Kine#estéreo#gráfico: Identidades e interação social na RUA SOM DA CIDADE RÍTMOS

TRIBUNA DO VALE EDIÇÃO Nº 2064

Auto-rádio FM estéreo/AM com toca-discos a laser

POBREZA INFANTIL E DISPARIDADES

O parkour em sua polissemia de - spcultura.prefeitura.sp ...spcultura.prefeitura.sp.gov.br/files/space/2064/ludicidade_e... · O parkour em sua polissemia de conceitos ainda vária

ESTUDO E AVALIAÇÃO COMPARATIVA DE TÉCNICAS DE VISÃO ESTÉREO

Disparidades e dinâmicas territoriais no Brasil

Algoritmos de Corte de Grafo para Mapas de Disparidades em Estéreo Vitor Barata R. B. Barroso vbarata@tecgraf.puc-rio.br INF 2064 - Visão Computacional.