Transformação para o Espaço Latente

20
Computer Vision Transformação para o Espaço Latente Paulo Sérgio Rodrigues PEL205

description

Transformação para o Espaço Latente. Paulo Sérgio Rodrigues PEL205. Matriz Ortogonal. Norma p de um Vetor. Por exemplo, a normas p usuais são:. Matriz Simétrica e Positiva Definida. Valor Singular. [Deewesteer, 1990] diz que: - PowerPoint PPT Presentation

Transcript of Transformação para o Espaço Latente

Page 1: Transformação para o Espaço Latente

ComputerVision

Transformação para o Espaço Latente

Paulo Sérgio RodriguesPEL205

Page 2: Transformação para o Espaço Latente

ComputerVision

Matriz Ortogonal

xAxAx nn

n

que modo de se deautovetor um é :2 Definição

A

AAaA nnT

nmji

deautovetor de chamado é onde

1 se ortogonal é matrizA :1 Definição ,

Page 3: Transformação para o Espaço Latente

ComputerVision

Norma p de um Vetor

pn

i

pip

n

xx

xp1

1

é vetor um de norma a :3 Definição

Por exemplo, a normas p usuais são:

ini

T

n

ii

xx

xxx

xx

1

21

2

11

max

Page 4: Transformação para o Espaço Latente

ComputerVision

Matriz Simétrica e Positiva Definida

n

i

Tiiinn

ii

eeAA

ne

1

:então , simétrica

matriz da sautovetore-sautovalore de pares os, Seja :Espectral) ção(Decomposi 1 Teorema

0 vetor todopara 0

se definida positiva é matriz Uma:4 Definição

xAxx

AT

nn

Page 5: Transformação para o Espaço Latente

ComputerVision

Valor Singular

ni

A

AA

A

ii

nrr

T

nn

,,2,1 onde

de singular"valor " de chamado é onde

0 :são de sautovalore os então

r, érank cujo matriz uma Dado :5 Definição

121

Page 6: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

[Deewesteer, 1990] diz que:

“A indexação no espaço latente (LSI) tenta resolver problemas de casamento lexicográfico usando índices conceituais derivados estatisticamente ao invés de usar palavras diretamente”. A LSI assume que existe alguma informação escondida (Estrutura Latente das Palavras) que é parcialmente obscurecida devido a variabilidade das escolhas das palavras”.

Page 7: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

• Uma vez que tanto textos quanto imagens podem ser interpretadas como espaços vetoriais, as idéias do LSI de que existe informação escondida e essa informação é essencial para caracterização de padrões, podem ser levadas para a interpretação de cenas

Por que trabalhar no espaço latente quando se procura padrões tanto textuais

quanto visuais?

Existe uma série de problemas em casamento de padrões que incluem pelo menos

...

Page 8: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

Sinônimos: palavras diferentes com o mesmo significadoExemplo: avaro-avarento, léxico-vocabulário, falecer-morrer, etc.. Tais palavras possuem baixasimilaridade no espaço vetorial euclidiano.

Imagens diferentes podem ter o mesmo significado:

Page 9: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

Polissemia:

Uma única palavra pode ter múltiplos significadosDependendo do contexto, o que leva a uma precisão pobre em casamento de padrões textuais.Ex: vários significados do verbo ter

Page 10: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

Polissemia: Uma única imagem, dependendo do contexto, pode ter vários significados, o que pode levar a uma pobre precisão em classificação.

Page 11: Transformação para o Espaço Latente

ComputerVision Espaço Semântico Latente

Alta dimensionalidade:

Tanto o espaço vetorial dos textos, quanto das imagens, possuemgeralmente uma alta dimensionalidade, gerando dificuldades degerenciamento e escondendo informações latentes.

Page 12: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

:então ,,,, e ,,, ortogonais matrizes duas existem , e

, érank cujo , matriz uma Dada :2 Teorema

2121 nnnnnm

nm

vvvVuuuUnm

rA

(1) 1

r

i

Tiii

T vuVUA

singulares valoresseus em de ãoDecomposiç de (1) chamamos , de

singulares valoresos são e ,,, onde 21

AAi

nnn

Page 13: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

:definindo e ,min com 3 Teorema pelo dada matriz uma de SVD a Seja

:Young)-Eckart de (Teorema 3 Teorema

nmpArankrA

k

i

Tiii

Tkkkk vuVUA

1

Então, Ak é uma aproximação ótima de A considerando que:

122)(

1

2

min

min

kkkBrank

p

kiiFkFkBrank

AABA

AABA

Page 14: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Interpretação Visual do SVD

nmA = nmU

nnS

TnnV

K

K

K

Page 15: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Conclusão 1: O teorema de de Eckart-Young, garante queAk, a matriz truncada de A, é a matriz de rank k mais próxima de A de acordo com as normas de Forbenius e norma 2

Conclusão 2: A decomposição em valores singulares de um espaçovetorial, pode separar informações latentes escondidas. Revelar essas informações pode ser uma maneira de representar esse espaçoEm sua essência semântica. Isso vale para textos, imagens, sons, vídeos, etc..

Page 16: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Exemplo numérico no Matlab

TUSVA

A = 0.95 0.49 0.46 0.44 0.23 0.89 0.02 0.62 0.61 0.76 0.82 0.79

[U,S,V] = svd(A)

Page 17: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Exemplo numérico no Matlab

TUSVA U = -0.55 0.54 -0.64 -0.45 -0.84 -0.31 -0.70 0.11 0.70

S = 2.10 0 0 0 0 0.67 0 0 0 0 0.39 0

V = -0.50 0.58 -0.64 0.05 -0.57 -0.59 -0.13 -0.55 -0.40 0.48 0.73 -0.28 -0.51 -0.28 0.21 0.78

Verifica-se que A = U*S*V’

Page 18: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Exemplo com uma imagem

Imagem Original

Valores Singulares

Page 19: Transformação para o Espaço Latente

ComputerVision Decomposição do Valor Singular

Exemplo com uma imagem

10% dos Valores Singulares

Imagem reconstruída com apenas 10% dos Valores Singulares

Page 20: Transformação para o Espaço Latente

ComputerVision Referências Bibliográficasa de SVD e LSI

1. S. T. Dumais, G. W. Furnas, T. K. Landauer, and S. Deerwester (1988),

Using latent semantic analysis to improve information retrieval. In

Proceedings of CHI’88: Conference on Human Factors in Computing,

New York: ACM, 281-285.

2. S. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, and R. A.

Harshman (1990), Indexing by latent semantic analysis. Journal of the

Society for Information Science, 41(6), 391-407.

3. P. W. Foltz (1990), Using Latent Semantic Indexing for Information

Filtering. In R. B. Allen (Ed.) Proceedings of the Conference on Office

Information Systems, Cambridge, MA, 40-47.

4. J. S. Yu, Z. H. Jin, and Z. S. Wen (2003), Automatic Detection of

Collocation. Report at the seminar of Statistical Machine Learning,

Peking University, http://icl.pku.edu.cn/yujs