Post on 05-Oct-2020
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de CorrespondenciasUn Ejemplo:
Preferencias por los Componentes de un Menú• Variables (cualitativas):
– Primer Plato: Ensalada (1) Sopa (2) Macarrones (3)– Segundo Plato: Carne (1) Pescado (2)– Postre: Flan (1) Helado (2) Fruta (3)– Bebida: Agua (1) Vino (2) Cerveza (3)
• ¿Cómo explicar de forma simple cómo se atraen o repelenlas modalidades de estas variables?
Análisis Factorial de Correspondencias Nº 1
Caso Primer
Plato
Segundo
Plato
Postre Bebida
1 2 1 1 1
2 3 1 2 2
3 1 1 2 2
... ... ... ... ...
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de CorrespondenciasObjetivo:
• Visualizar de forma simple las relaciones (atracción-repulsión) existentes entre las distintas modalidades devarias variables cualitativas, enfrentadas en una tabla decontingencia.
• El Análisis de Correspondencias Simple estudia el caso de2 variables enfrentadas en una Tabla de Contingencia.
• El Análisis de Correspondencias Múltiple estudia el casode p>2 variables.
Análisis Factorial de Correspondencias Nº 2
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:
• Ideado por Benzecri en 1973
• Enfrenta dos variables cualitativas en una tabla decontingencia.
Análisis Factorial de Correspondencias Nº 3
pi
i
iq
i
i
i
i
f
f
f
f
f
f,...,1
··
2
·
1 ,·····
qj
j
pj
j
j
j
j
f
f
f
f
f
f,...,1
··
2
·
1,·····
Atributo B
(modalidades)
B1 B2 ... Bq Total
Atr
ibu
to A
(mo
dal
idad
es) A1 f11 f12 ... f1q f1·
A2 f21 f22 ... f2q f2·
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Ap fp1 fp2 ... fpq fp·
Total f·1 f·2 ... f·q 1
Modalidades de A
en espacio de dimensión q
Modalidades de B
en espacio de dimensión p
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:
• Notaciones
entonces:
Análisis Factorial de Correspondencias Nº 4
qqq
q
ppp
p
qppqpp
q
q
f
f
f
D
f
f
f
D
fff
fff
fff
F
··
2·
1·
··
·2
·1
·21
22221
11211
00
00
00
00
00
00
1
··2·
2
1·
1
·
2
2·
22
1·
21
·
1
2·
12
1·
11
1
···
2
·
1
·2
2
·2
22
·2
21
·1
1
·1
12
·1
11
q
qpq
pqpp
q
q
q
q
p
qpp
pq
p
p
p
p
q
q
FD
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
FD
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
1111111y11,11 ''''' qqqqppppqqpppq DFDDFDF
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Filas:
• Para medir el grado de proximidad entre las modalidades de A en elespacio q-dimensional se utiliza la distancia de Benzecri, la cualeuclidiza el espacio.
• y en el espacio euclidizado, la nube de puntos está formada por lospuntos “i” de coordenadas:
Análisis Factorial de Correspondencias Nº 5
q
j ji
ji
ji
ijq
j i
ji
i
ij
j ff
f
ff
f
f
f
f
f
fiid
1
2
·'·
'
··1
2
'·
'
··
2 1)',(
·
····1··
1 pesoscon ,...,,..., i
qi
iq
ji
ij
i
i fff
f
ff
f
ff
f
2/11
,...,·2,1,...,2,1··
21 ),...,,(
qp
qjpiji
ij
q FDDff
fXXXX
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Filas:
Análisis Factorial de Correspondencias Nº 6
x x x
x x x
x
x x
x
Espacio q-dimensional (filas) de
las modalidades de A
Ai
Ai
Ai
Espacio Cualitativo de las
Observaciones
Distancia EuclideaDistancia de Benzecri =
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Filas:
• La nube de puntos está contenida en el hiperplano dedimensión q-1:
• su centroide es:
• la matriz de datos centrada es
Análisis Factorial de Correspondencias Nº 7
q
j
jj Xf
1
· 1·
1')',...,,...,( ··1· xxfffx qj
pqqXD 112/1
qqDx 12/1
2/1'
,...,·2,1,...,2,1
·
··
11'1 qqpp
qjpi
j
ji
ij
c DXxXfff
fX
·
····1··
1 pesoscon ,...,,..., i
qi
iq
ji
ij
i
i fff
f
ff
f
ff
f
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Filas:
• y su matriz de Varianzas y Covarianzas, S=((Slk)), con
• Para obtener el espacio más simple que permita visualizarlas relaciones, aplicamos el ACP.
– Hay un autovalor q = 0 asociado al autovector“centroide”
– El resto de autovalores de S serán 1 2 ..... q-1 0con autovectores asociados w1, w2, ....., wq-1
Análisis Factorial de Correspondencias Nº 8
x
p
i
kl
kli
ikillk ff
fff
ffS
1
··
···
· ''' xxXDXXDXS pcpc
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:Análisis de las Filas.
Análisis Factorial de Correspondencias Nº 9
x x
x
x x x
x
x x
x
Espacio q-dimensional (filas)
de las modalidades de A Espacio factorial (filas)
de las modalidades de A
x x x
x x x
x
x x
x
(Ai,Bj)
(AirBs)
(AimBk)
Espacio Cualitativo de las
Observaciones
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Columnas:
• Para medir el grado de proximidad entre las modalidades de B en elespacio p-dimensional se utiliza la distancia de Benzecri, la cualeuclidiza el espacio.
• y en el espacio euclidizado, la nube de puntos está formada por lospuntos “j” de coordenadas:
Análisis Factorial de Correspondencias Nº 10
p
i ij
ij
ij
ijp
i j
ij
j
ij
i ff
f
ff
f
f
f
f
f
fjjd
1
2
·'·
'
··1
2
'·
'
··
2 1)',(
j
pj
pj
ij
ij
j
jf
ff
f
ff
f
ff
f·
·····1·
1pesoscon ,...,,...,
2/11
,...,2,1,...,·2,1··
**
2
*
1·* '),...,,(
pq
piqjij
ij
ppq DFDff
fXXXX
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Columnas:
• La nube de puntos está contenida en el hiperplano dedimensión p-1:
• su centroide es:
• Su matriz de datos centrada es:
Análisis Factorial de Correspondencias Nº 11
p
i
ii Xf
1
*· 1·
1')',...,,...,( **···1
* xxfffx pi
qppDX 112/1*
ppDx 12/1*
2/1'*'**
,...,2,1,...,·2,1
·
··
* 111 ppqq
piqj
i
ij
ij
c DXxXfff
fX
j
pj
pj
ij
ij
j
jf
ff
f
ff
f
ff
f·
·····1·
1pesoscon ,...,,...,
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Análisis por Columnas:
• y su matriz de Varianzas y Covarianzas, S*=((S*lk)), con
• Para obtener el espacio más simple que permita visualizarlas relaciones, aplicamos el ACP.
– Hay un autovalor p = 0 asociado al autovector“centroide”
– Los autovalores de S* son 1 2 ..... p-1 0 ,conautovectores asociados u1, u2, ....., up-1
Análisis Factorial de Correspondencias Nº 12
*x
q
j
kl
klj
kjlj
lk fffff
ffS
1
··
···
* · '***'**'** xxXDXXDXS qcqc
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:Análisis de las Filas y de las Columnas (Principal).
Análisis Factorial de Correspondencias Nº 13
x x x
x x x
x
x x
x
x x x
x x x
x
x x
x
Espacio q-dimensional (filas) de
las modalidades de A
Espacio p-dimensional (columnas) de
las modalidades de B
Espacio factorial (filas) de
las modalidades de A
x x x
x x x
x
x x
x
Espacio factorial (columnas) de
las modalidades de B
x x x
x x x
x
x x
x
(Ai,Bj)
(AirBs)
(AimBk)
Espacio Cualitativo de las
Observaciones
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Relación entre espacios.
• En el Análisis por Filas:
Si definimos la matriz V=((Vlk)), con
– el mayor autovalor de V es 1, asociado al autovector
– los demás autovalores y autovectores de V coincidencon los correspondientes a los 1 2 ..... q-1 de S.
La matriz V identifica el Espacio de ComponentesPrincipales de las modalidades filas
Análisis Factorial de Correspondencias Nº 14
p
i kli
ikillk
fff
ffV
1 ···
x
XDXV p
'
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple.Relación entre espacios.
• En el Análisis por Columnas:
Si definimos la matriz V* =((V*lk)), con
– el mayor autovalor de V* es 1, asociado al autovector
– los demás autovalores y autovectores de V* coincidencon los correspondientes a los 1 2 ..... p-1 deS*.
La matriz V identifica el Espacio de ComponentesPrincipales de las modalidades columnas
Análisis Factorial de Correspondencias Nº 15
q
j klj
kjlj
lkfff
ffV
1 ···
*
*x
*'** XDXV q
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:Relación entre espacios.
• Si
• Relación entre autovalores y autovectores de V y V*
– Si (,w) son de V, entonces (,Yw) lo son de V* , y– Si (,u) son de V*, entonces (,Y’u) lo son de V.
• En consecuencia:
– Los autovalores de Y’Y (V) y de YY’ (V*) son iguales:
1=1=1 2=2 ..... k=k ,
siendo kmin(p,q) y el resto de autovalores nulos.
– Las modalidades de ambas variables A y B pueden serrepresentadas en un mismo espacio fácilmente, ya que lascomponentes (autovectores) se relacionan mediante loscambios de bases: w= Y’u y u= Yw
Análisis Factorial de Correspondencias Nº 16
V=Y’Y y V*=YY’2/12/1
··
Y
qp
qpji
ijFDD
ff
f
x
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Simple:Relación entre espacios.
Análisis Factorial de Correspondencias Nº 17
x x x
x x x
x
x x
x
x x x
x x x
x
x x
x
Espacio q-dimensional (filas) de
las modalidades de A
Espacio p-dimensional (columnas) de
las modalidades de B
Espacio factorial común
x x x
x x x
x
x x
x
Espacio factorial (filas) de
las modalidades de A
x x x
x x x
x
x x
x
Espacio factorial (columnas) de
las modalidades de B
x x x
x x x
x
x x
x
(Ai,Bj)
(AirBs)
(AimBk)
Espacio Cualitativo de las
Observaciones
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de CorrespondenciasUn Ejemplo:
Análisis Factorial de Correspondencias Nº 18
Punt. de fila y columna
Canónica normalization
Dim
en
sió
n 1
,6
,4
,2
,0
-,2
-,4
-,6
-,8
-1,0
Segundo Plato
Bebida
Pescado
Carne
Cerv eza
Vino
Agua
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias: ”Inercias” en el Análisis Factorial de Correspondencias
• inercia de un punto xi, sobre el que actúa un peso wi, con respecto deotro punto O:
• inercia de la nube de puntos, con respecto de otro punto O:
• inercia de la dimensión j-ésima (a lo largo de la dimensión jésima):
• contribución absoluta del punto xi a la inercia de la dimensión j-ésima• contribución absoluta de la dimensión j-ésima a la inercia del punto xi
Análisis Factorial de Correspondencias Nº 19
p
j
jijii OxwOxI1
2)();(
p
j
j
p
j
n
i
jiji
n
i
p
j
jiji
n
i
i OIOxwOxwOxIOI11 1
2
1 1
2
1
)()()();()(
n
i
jijij OxwOI1
2)()(
2)( jiji Oxw
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias
Las Inercias en el Análisis Factorial de Correspondencias
• Inercias en el espacio de las Filas (con respecto del centroide)
que puede identificarse con:
• Inercias en el espacio de las Columnas (con respecto del centroide)
que puede identificarse con:
Análisis Factorial de Correspondencias Nº 20
nff
ffff
ff
fff
ff
ff
p
i
q
j ji
jiijp
i
q
j
j
ji
ij
i
q
j
p
i
j
ji
ij
i
k
j
j
2
1 1 ··
2
··
1 1
2
·
··
·
1 1
2
·
··
·
1
p
i
i
q
j
j
q
j
j xxIxIxIn 11
2
1
);()()(
p
i
q
j ij
ijijp
i
q
j
i
ij
ij
j
p
i
q
j
i
ij
ij
j
k
h
hnff
ffff
ff
fff
ff
ff
1
2
1 ··
2
··
1 1
2
·
··
·
1 1
2
·
··
·
1
q
j
j
p
i
i
p
i
j xxIxIxIn 1
**
1
**2
1
);()()(
© FJ Callealta ; LR Rivera (UAH)
Análisis Factorial de Correspondencias Múltiple:
• Enfrenta varias variables cualitativas, aplicando el AnálisisFactorial de Correspondencia Simple a la Tabla de Burr,construida con todas las respectivas tablas decontingencia de cada 2 variables.
Análisis Factorial de Correspondencias Nº 21
Var1 Var2 Var3
m1 ... mk n1 ... np ... r1 ... rq
m1 0 0 ...
Var1 ... 0 0 T12 ... T13
mk 0 0 ...
n1 0 0 ...
Var2 ... T21 0 0 ... T23
np 0 0 ...
... ... ... ... ... ... ... ... ... ... ...
r1 ... 0 0
Var3 T31 T32 ... 0 0
rq ... 0 0