Transformação para o Espaço Latente
description
Transcript of Transformação para o Espaço Latente
ComputerVision
Transformação para o Espaço Latente
Paulo Sérgio RodriguesPEL205
ComputerVision
Matriz Ortogonal
xAxAx nn
n
que modo de se deautovetor um é :2 Definição
A
AAaA nnT
nmji
deautovetor de chamado é onde
1 se ortogonal é matrizA :1 Definição ,
ComputerVision
Norma p de um Vetor
pn
i
pip
n
xx
xp1
1
é vetor um de norma a :3 Definição
Por exemplo, a normas p usuais são:
ini
T
n
ii
xx
xxx
xx
1
21
2
11
max
ComputerVision
Matriz Simétrica e Positiva Definida
n
i
Tiiinn
ii
eeAA
ne
1
:então , simétrica
matriz da sautovetore-sautovalore de pares os, Seja :Espectral) ção(Decomposi 1 Teorema
0 vetor todopara 0
se definida positiva é matriz Uma:4 Definição
xAxx
AT
nn
ComputerVision
Valor Singular
ni
A
AA
A
ii
nrr
T
nn
,,2,1 onde
de singular"valor " de chamado é onde
0 :são de sautovalore os então
r, érank cujo matriz uma Dado :5 Definição
121
ComputerVision Espaço Semântico Latente
[Deewesteer, 1990] diz que:
“A indexação no espaço latente (LSI) tenta resolver problemas de casamento lexicográfico usando índices conceituais derivados estatisticamente ao invés de usar palavras diretamente”. A LSI assume que existe alguma informação escondida (Estrutura Latente das Palavras) que é parcialmente obscurecida devido a variabilidade das escolhas das palavras”.
ComputerVision Espaço Semântico Latente
• Uma vez que tanto textos quanto imagens podem ser interpretadas como espaços vetoriais, as idéias do LSI de que existe informação escondida e essa informação é essencial para caracterização de padrões, podem ser levadas para a interpretação de cenas
Por que trabalhar no espaço latente quando se procura padrões tanto textuais
quanto visuais?
Existe uma série de problemas em casamento de padrões que incluem pelo menos
...
ComputerVision Espaço Semântico Latente
Sinônimos: palavras diferentes com o mesmo significadoExemplo: avaro-avarento, léxico-vocabulário, falecer-morrer, etc.. Tais palavras possuem baixasimilaridade no espaço vetorial euclidiano.
Imagens diferentes podem ter o mesmo significado:
ComputerVision Espaço Semântico Latente
Polissemia:
Uma única palavra pode ter múltiplos significadosDependendo do contexto, o que leva a uma precisão pobre em casamento de padrões textuais.Ex: vários significados do verbo ter
ComputerVision Espaço Semântico Latente
Polissemia: Uma única imagem, dependendo do contexto, pode ter vários significados, o que pode levar a uma pobre precisão em classificação.
ComputerVision Espaço Semântico Latente
Alta dimensionalidade:
Tanto o espaço vetorial dos textos, quanto das imagens, possuemgeralmente uma alta dimensionalidade, gerando dificuldades degerenciamento e escondendo informações latentes.
ComputerVision Decomposição do Valor Singular
:então ,,,, e ,,, ortogonais matrizes duas existem , e
, érank cujo , matriz uma Dada :2 Teorema
2121 nnnnnm
nm
vvvVuuuUnm
rA
(1) 1
r
i
Tiii
T vuVUA
singulares valoresseus em de ãoDecomposiç de (1) chamamos , de
singulares valoresos são e ,,, onde 21
AAi
nnn
ComputerVision Decomposição do Valor Singular
:definindo e ,min com 3 Teorema pelo dada matriz uma de SVD a Seja
:Young)-Eckart de (Teorema 3 Teorema
nmpArankrA
k
i
Tiii
Tkkkk vuVUA
1
Então, Ak é uma aproximação ótima de A considerando que:
122)(
1
2
min
min
kkkBrank
p
kiiFkFkBrank
AABA
AABA
ComputerVision Decomposição do Valor Singular
Interpretação Visual do SVD
nmA = nmU
nnS
TnnV
K
K
K
ComputerVision Decomposição do Valor Singular
Conclusão 1: O teorema de de Eckart-Young, garante queAk, a matriz truncada de A, é a matriz de rank k mais próxima de A de acordo com as normas de Forbenius e norma 2
Conclusão 2: A decomposição em valores singulares de um espaçovetorial, pode separar informações latentes escondidas. Revelar essas informações pode ser uma maneira de representar esse espaçoEm sua essência semântica. Isso vale para textos, imagens, sons, vídeos, etc..
ComputerVision Decomposição do Valor Singular
Exemplo numérico no Matlab
TUSVA
A = 0.95 0.49 0.46 0.44 0.23 0.89 0.02 0.62 0.61 0.76 0.82 0.79
[U,S,V] = svd(A)
ComputerVision Decomposição do Valor Singular
Exemplo numérico no Matlab
TUSVA U = -0.55 0.54 -0.64 -0.45 -0.84 -0.31 -0.70 0.11 0.70
S = 2.10 0 0 0 0 0.67 0 0 0 0 0.39 0
V = -0.50 0.58 -0.64 0.05 -0.57 -0.59 -0.13 -0.55 -0.40 0.48 0.73 -0.28 -0.51 -0.28 0.21 0.78
Verifica-se que A = U*S*V’
ComputerVision Decomposição do Valor Singular
Exemplo com uma imagem
Imagem Original
Valores Singulares
ComputerVision Decomposição do Valor Singular
Exemplo com uma imagem
10% dos Valores Singulares
Imagem reconstruída com apenas 10% dos Valores Singulares
ComputerVision Referências Bibliográficasa de SVD e LSI
1. S. T. Dumais, G. W. Furnas, T. K. Landauer, and S. Deerwester (1988),
Using latent semantic analysis to improve information retrieval. In
Proceedings of CHI’88: Conference on Human Factors in Computing,
New York: ACM, 281-285.
2. S. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, and R. A.
Harshman (1990), Indexing by latent semantic analysis. Journal of the
Society for Information Science, 41(6), 391-407.
3. P. W. Foltz (1990), Using Latent Semantic Indexing for Information
Filtering. In R. B. Allen (Ed.) Proceedings of the Conference on Office
Information Systems, Cambridge, MA, 40-47.
4. J. S. Yu, Z. H. Jin, and Z. S. Wen (2003), Automatic Detection of
Collocation. Report at the seminar of Statistical Machine Learning,
Peking University, http://icl.pku.edu.cn/yujs