Transformação para o Espaço Latente

ComputerVision

Transformação para o Espaço Latente

Paulo Sérgio RodriguesPEL205

ComputerVision

Matriz Ortogonal

xAxAx nn

n

que modo de se deautovetor um é :2 Definição

A

AAaA nnT

nmji

deautovetor de chamado é onde

1 se ortogonal é matrizA :1 Definição ,

ComputerVision

Norma p de um Vetor

pn

i

pip

n

xx

xp1

1

é vetor um de norma a :3 Definição

Por exemplo, a normas p usuais são:

ini

T

n

ii

xx

xxx

xx

1

21

2

11

max

ComputerVision

Matriz Simétrica e Positiva Definida

n

i

Tiiinn

ii

eeAA

ne

1

:então , simétrica

matriz da sautovetore-sautovalore de pares os, Seja :Espectral) ção(Decomposi 1 Teorema

0 vetor todopara 0

se definida positiva é matriz Uma:4 Definição

xAxx

AT

nn

ComputerVision

Valor Singular

ni

A

AA

A

ii

nrr

T

nn

,,2,1 onde

de singular"valor " de chamado é onde

0 :são de sautovalore os então

r, érank cujo matriz uma Dado :5 Definição

121

ComputerVision Espaço Semântico Latente

[Deewesteer, 1990] diz que:

“A indexação no espaço latente (LSI) tenta resolver problemas de casamento lexicográfico usando índices conceituais derivados estatisticamente ao invés de usar palavras diretamente”. A LSI assume que existe alguma informação escondida (Estrutura Latente das Palavras) que é parcialmente obscurecida devido a variabilidade das escolhas das palavras”.


• Uma vez que tanto textos quanto imagens podem ser interpretadas como espaços vetoriais, as idéias do LSI de que existe informação escondida e essa informação é essencial para caracterização de padrões, podem ser levadas para a interpretação de cenas

Por que trabalhar no espaço latente quando se procura padrões tanto textuais

quanto visuais?

Existe uma série de problemas em casamento de padrões que incluem pelo menos

...


Sinônimos: palavras diferentes com o mesmo significadoExemplo: avaro-avarento, léxico-vocabulário, falecer-morrer, etc.. Tais palavras possuem baixasimilaridade no espaço vetorial euclidiano.

Imagens diferentes podem ter o mesmo significado:


Polissemia:

Uma única palavra pode ter múltiplos significadosDependendo do contexto, o que leva a uma precisão pobre em casamento de padrões textuais.Ex: vários significados do verbo ter


Polissemia: Uma única imagem, dependendo do contexto, pode ter vários significados, o que pode levar a uma pobre precisão em classificação.


Alta dimensionalidade:

Tanto o espaço vetorial dos textos, quanto das imagens, possuemgeralmente uma alta dimensionalidade, gerando dificuldades degerenciamento e escondendo informações latentes.

ComputerVision Decomposição do Valor Singular

:então ,,,, e ,,, ortogonais matrizes duas existem , e

, érank cujo , matriz uma Dada :2 Teorema

2121 nnnnnm

nm

vvvVuuuUnm

rA

(1) 1

r

i

Tiii

T vuVUA

singulares valoresseus em de ãoDecomposiç de (1) chamamos , de

singulares valoresos são e ,,, onde 21

AAi

nnn


:definindo e ,min com 3 Teorema pelo dada matriz uma de SVD a Seja

:Young)-Eckart de (Teorema 3 Teorema

nmpArankrA

k

i

Tiii

Tkkkk vuVUA

1

Então, Ak é uma aproximação ótima de A considerando que:

122)(

1

2

min

min

kkkBrank

p

kiiFkFkBrank

AABA

AABA


Interpretação Visual do SVD

nmA = nmU

nnS

TnnV

K

K

K


Conclusão 1: O teorema de de Eckart-Young, garante queAk, a matriz truncada de A, é a matriz de rank k mais próxima de A de acordo com as normas de Forbenius e norma 2

Conclusão 2: A decomposição em valores singulares de um espaçovetorial, pode separar informações latentes escondidas. Revelar essas informações pode ser uma maneira de representar esse espaçoEm sua essência semântica. Isso vale para textos, imagens, sons, vídeos, etc..


Exemplo numérico no Matlab

TUSVA

A = 0.95 0.49 0.46 0.44 0.23 0.89 0.02 0.62 0.61 0.76 0.82 0.79

[U,S,V] = svd(A)


Exemplo numérico no Matlab

TUSVA U = -0.55 0.54 -0.64 -0.45 -0.84 -0.31 -0.70 0.11 0.70

S = 2.10 0 0 0 0 0.67 0 0 0 0 0.39 0

V = -0.50 0.58 -0.64 0.05 -0.57 -0.59 -0.13 -0.55 -0.40 0.48 0.73 -0.28 -0.51 -0.28 0.21 0.78

Verifica-se que A = U*S*V’


Exemplo com uma imagem

Imagem Original

Valores Singulares


Exemplo com uma imagem

10% dos Valores Singulares

Imagem reconstruída com apenas 10% dos Valores Singulares

ComputerVision Referências Bibliográficasa de SVD e LSI

1. S. T. Dumais, G. W. Furnas, T. K. Landauer, and S. Deerwester (1988),

Using latent semantic analysis to improve information retrieval. In

Proceedings of CHI’88: Conference on Human Factors in Computing,

New York: ACM, 281-285.

2. S. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, and R. A.

Harshman (1990), Indexing by latent semantic analysis. Journal of the

Society for Information Science, 41(6), 391-407.

3. P. W. Foltz (1990), Using Latent Semantic Indexing for Information

Filtering. In R. B. Allen (Ed.) Proceedings of the Conference on Office

Information Systems, Cambridge, MA, 40-47.

4. J. S. Yu, Z. H. Jin, and Z. S. Wen (2003), Automatic Detection of

Collocation. Report at the seminar of Statistical Machine Learning,

Peking University, http://icl.pku.edu.cn/yujs

Transformação para o Espaço Latente

Documents

Transcript of Transformação para o Espaço Latente