© FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera...

21
© FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Un Ejemplo: Preferencias por los Componentes de un Menú • Variables (cualitativas): Primer Plato: Ensalada (1) Sopa (2) Macarrones (3) Segundo Plato: Carne (1) Pescado (2) Postre: Flan (1) Helado (2) Fruta (3) Bebida: Agua (1) Vino (2) Cerveza (3) • ¿Cómo explicar de forma simple cómo se atraen o repelen las modalidades de estas variables? Análisis Factorial de Correspondencias Nº 1 Caso Primer Plato Segundo Plato Postre Bebida 1 2 1 1 1 2 3 1 2 2 3 1 1 2 2 ... ... ... ... ...

Transcript of © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera...

Page 1: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de CorrespondenciasUn Ejemplo:

Preferencias por los Componentes de un Menú• Variables (cualitativas):

– Primer Plato: Ensalada (1) Sopa (2) Macarrones (3)– Segundo Plato: Carne (1) Pescado (2)– Postre: Flan (1) Helado (2) Fruta (3)– Bebida: Agua (1) Vino (2) Cerveza (3)

• ¿Cómo explicar de forma simple cómo se atraen o repelenlas modalidades de estas variables?

Análisis Factorial de Correspondencias Nº 1

Caso Primer

Plato

Segundo

Plato

Postre Bebida

1 2 1 1 1

2 3 1 2 2

3 1 1 2 2

... ... ... ... ...

Page 2: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de CorrespondenciasObjetivo:

• Visualizar de forma simple las relaciones (atracción-repulsión) existentes entre las distintas modalidades devarias variables cualitativas, enfrentadas en una tabla decontingencia.

• El Análisis de Correspondencias Simple estudia el caso de2 variables enfrentadas en una Tabla de Contingencia.

• El Análisis de Correspondencias Múltiple estudia el casode p>2 variables.

Análisis Factorial de Correspondencias Nº 2

Page 3: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:

• Ideado por Benzecri en 1973

• Enfrenta dos variables cualitativas en una tabla decontingencia.

Análisis Factorial de Correspondencias Nº 3

pi

i

iq

i

i

i

i

f

f

f

f

f

f,...,1

··

2

·

1 ,·····

qj

j

pj

j

j

j

j

f

f

f

f

f

f,...,1

··

2

·

1,·····

Atributo B

(modalidades)

B1 B2 ... Bq Total

Atr

ibu

to A

(mo

dal

idad

es) A1 f11 f12 ... f1q f1·

A2 f21 f22 ... f2q f2·

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Ap fp1 fp2 ... fpq fp·

Total f·1 f·2 ... f·q 1

Modalidades de A

en espacio de dimensión q

Modalidades de B

en espacio de dimensión p

Page 4: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:

• Notaciones

entonces:

Análisis Factorial de Correspondencias Nº 4

qqq

q

ppp

p

qppqpp

q

q

f

f

f

D

f

f

f

D

fff

fff

fff

F

··

··

·2

·1

·21

22221

11211

00

00

00

00

00

00

1

··2·

2

1

·

2

22

21

·

1

12

11

1

···

2

·

1

·2

2

·2

22

·2

21

·1

1

·1

12

·1

11

q

qpq

pqpp

q

q

q

q

p

qpp

pq

p

p

p

p

q

q

FD

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

FD

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

f

1111111y11,11 ''''' qqqqppppqqpppq DFDDFDF

Page 5: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Filas:

• Para medir el grado de proximidad entre las modalidades de A en elespacio q-dimensional se utiliza la distancia de Benzecri, la cualeuclidiza el espacio.

• y en el espacio euclidizado, la nube de puntos está formada por lospuntos “i” de coordenadas:

Análisis Factorial de Correspondencias Nº 5

q

j ji

ji

ji

ijq

j i

ji

i

ij

j ff

f

ff

f

f

f

f

f

fiid

1

2

·'·

'

··1

2

'

··

2 1)',(

·

····1··

1 pesoscon ,...,,..., i

qi

iq

ji

ij

i

i fff

f

ff

f

ff

f

2/11

,...,·2,1,...,2,1··

21 ),...,,(

qp

qjpiji

ij

q FDDff

fXXXX

Page 6: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Filas:

Análisis Factorial de Correspondencias Nº 6

x x x

x x x

x

x x

x

Espacio q-dimensional (filas) de

las modalidades de A

Ai

Ai

Ai

Espacio Cualitativo de las

Observaciones

Distancia EuclideaDistancia de Benzecri =

Page 7: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Filas:

• La nube de puntos está contenida en el hiperplano dedimensión q-1:

• su centroide es:

• la matriz de datos centrada es

Análisis Factorial de Correspondencias Nº 7

q

j

jj Xf

1

· 1·

1')',...,,...,( ··1· xxfffx qj

pqqXD 112/1

qqDx 12/1

2/1'

,...,·2,1,...,2,1

·

··

11'1 qqpp

qjpi

j

ji

ij

c DXxXfff

fX

·

····1··

1 pesoscon ,...,,..., i

qi

iq

ji

ij

i

i fff

f

ff

f

ff

f

Page 8: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Filas:

• y su matriz de Varianzas y Covarianzas, S=((Slk)), con

• Para obtener el espacio más simple que permita visualizarlas relaciones, aplicamos el ACP.

– Hay un autovalor q = 0 asociado al autovector“centroide”

– El resto de autovalores de S serán 1 2 ..... q-1 0con autovectores asociados w1, w2, ....., wq-1

Análisis Factorial de Correspondencias Nº 8

x

p

i

kl

kli

ikillk ff

fff

ffS

1

··

···

· ''' xxXDXXDXS pcpc

Page 9: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:Análisis de las Filas.

Análisis Factorial de Correspondencias Nº 9

x x

x

x x x

x

x x

x

Espacio q-dimensional (filas)

de las modalidades de A Espacio factorial (filas)

de las modalidades de A

x x x

x x x

x

x x

x

(Ai,Bj)

(AirBs)

(AimBk)

Espacio Cualitativo de las

Observaciones

Page 10: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Columnas:

• Para medir el grado de proximidad entre las modalidades de B en elespacio p-dimensional se utiliza la distancia de Benzecri, la cualeuclidiza el espacio.

• y en el espacio euclidizado, la nube de puntos está formada por lospuntos “j” de coordenadas:

Análisis Factorial de Correspondencias Nº 10

p

i ij

ij

ij

ijp

i j

ij

j

ij

i ff

f

ff

f

f

f

f

f

fjjd

1

2

·'·

'

··1

2

'

··

2 1)',(

j

pj

pj

ij

ij

j

jf

ff

f

ff

f

ff

·····1·

1pesoscon ,...,,...,

2/11

,...,2,1,...,·2,1··

**

2

*

1·* '),...,,(

pq

piqjij

ij

ppq DFDff

fXXXX

Page 11: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Columnas:

• La nube de puntos está contenida en el hiperplano dedimensión p-1:

• su centroide es:

• Su matriz de datos centrada es:

Análisis Factorial de Correspondencias Nº 11

p

i

ii Xf

1

*· 1·

1')',...,,...,( **···1

* xxfffx pi

qppDX 112/1*

ppDx 12/1*

2/1'*'**

,...,2,1,...,·2,1

·

··

* 111 ppqq

piqj

i

ij

ij

c DXxXfff

fX

j

pj

pj

ij

ij

j

jf

ff

f

ff

f

ff

·····1·

1pesoscon ,...,,...,

Page 12: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Análisis por Columnas:

• y su matriz de Varianzas y Covarianzas, S*=((S*lk)), con

• Para obtener el espacio más simple que permita visualizarlas relaciones, aplicamos el ACP.

– Hay un autovalor p = 0 asociado al autovector“centroide”

– Los autovalores de S* son 1 2 ..... p-1 0 ,conautovectores asociados u1, u2, ....., up-1

Análisis Factorial de Correspondencias Nº 12

*x

q

j

kl

klj

kjlj

lk fffff

ffS

1

··

···

* · '***'**'** xxXDXXDXS qcqc

Page 13: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:Análisis de las Filas y de las Columnas (Principal).

Análisis Factorial de Correspondencias Nº 13

x x x

x x x

x

x x

x

x x x

x x x

x

x x

x

Espacio q-dimensional (filas) de

las modalidades de A

Espacio p-dimensional (columnas) de

las modalidades de B

Espacio factorial (filas) de

las modalidades de A

x x x

x x x

x

x x

x

Espacio factorial (columnas) de

las modalidades de B

x x x

x x x

x

x x

x

(Ai,Bj)

(AirBs)

(AimBk)

Espacio Cualitativo de las

Observaciones

Page 14: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Relación entre espacios.

• En el Análisis por Filas:

Si definimos la matriz V=((Vlk)), con

– el mayor autovalor de V es 1, asociado al autovector

– los demás autovalores y autovectores de V coincidencon los correspondientes a los 1 2 ..... q-1 de S.

La matriz V identifica el Espacio de ComponentesPrincipales de las modalidades filas

Análisis Factorial de Correspondencias Nº 14

p

i kli

ikillk

fff

ffV

1 ···

x

XDXV p

'

Page 15: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple.Relación entre espacios.

• En el Análisis por Columnas:

Si definimos la matriz V* =((V*lk)), con

– el mayor autovalor de V* es 1, asociado al autovector

– los demás autovalores y autovectores de V* coincidencon los correspondientes a los 1 2 ..... p-1 deS*.

La matriz V identifica el Espacio de ComponentesPrincipales de las modalidades columnas

Análisis Factorial de Correspondencias Nº 15

q

j klj

kjlj

lkfff

ffV

1 ···

*

*x

*'** XDXV q

Page 16: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:Relación entre espacios.

• Si

• Relación entre autovalores y autovectores de V y V*

– Si (,w) son de V, entonces (,Yw) lo son de V* , y– Si (,u) son de V*, entonces (,Y’u) lo son de V.

• En consecuencia:

– Los autovalores de Y’Y (V) y de YY’ (V*) son iguales:

1=1=1 2=2 ..... k=k ,

siendo kmin(p,q) y el resto de autovalores nulos.

– Las modalidades de ambas variables A y B pueden serrepresentadas en un mismo espacio fácilmente, ya que lascomponentes (autovectores) se relacionan mediante loscambios de bases: w= Y’u y u= Yw

Análisis Factorial de Correspondencias Nº 16

V=Y’Y y V*=YY’2/12/1

··

Y

qp

qpji

ijFDD

ff

f

x

Page 17: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Simple:Relación entre espacios.

Análisis Factorial de Correspondencias Nº 17

x x x

x x x

x

x x

x

x x x

x x x

x

x x

x

Espacio q-dimensional (filas) de

las modalidades de A

Espacio p-dimensional (columnas) de

las modalidades de B

Espacio factorial común

x x x

x x x

x

x x

x

Espacio factorial (filas) de

las modalidades de A

x x x

x x x

x

x x

x

Espacio factorial (columnas) de

las modalidades de B

x x x

x x x

x

x x

x

(Ai,Bj)

(AirBs)

(AimBk)

Espacio Cualitativo de las

Observaciones

Page 18: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de CorrespondenciasUn Ejemplo:

Análisis Factorial de Correspondencias Nº 18

Punt. de fila y columna

Canónica normalization

Dim

en

sió

n 1

,6

,4

,2

,0

-,2

-,4

-,6

-,8

-1,0

Segundo Plato

Bebida

Pescado

Carne

Cerv eza

Vino

Agua

Page 19: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias: ”Inercias” en el Análisis Factorial de Correspondencias

• inercia de un punto xi, sobre el que actúa un peso wi, con respecto deotro punto O:

• inercia de la nube de puntos, con respecto de otro punto O:

• inercia de la dimensión j-ésima (a lo largo de la dimensión jésima):

• contribución absoluta del punto xi a la inercia de la dimensión j-ésima• contribución absoluta de la dimensión j-ésima a la inercia del punto xi

Análisis Factorial de Correspondencias Nº 19

p

j

jijii OxwOxI1

2)();(

p

j

j

p

j

n

i

jiji

n

i

p

j

jiji

n

i

i OIOxwOxwOxIOI11 1

2

1 1

2

1

)()()();()(

n

i

jijij OxwOI1

2)()(

2)( jiji Oxw

Page 20: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias

Las Inercias en el Análisis Factorial de Correspondencias

• Inercias en el espacio de las Filas (con respecto del centroide)

que puede identificarse con:

• Inercias en el espacio de las Columnas (con respecto del centroide)

que puede identificarse con:

Análisis Factorial de Correspondencias Nº 20

nff

ffff

ff

fff

ff

ff

p

i

q

j ji

jiijp

i

q

j

j

ji

ij

i

q

j

p

i

j

ji

ij

i

k

j

j

2

1 1 ··

2

··

1 1

2

·

··

·

1 1

2

·

··

·

1

p

i

i

q

j

j

q

j

j xxIxIxIn 11

2

1

);()()(

p

i

q

j ij

ijijp

i

q

j

i

ij

ij

j

p

i

q

j

i

ij

ij

j

k

h

hnff

ffff

ff

fff

ff

ff

1

2

1 ··

2

··

1 1

2

·

··

·

1 1

2

·

··

·

1

q

j

j

p

i

i

p

i

j xxIxIxIn 1

**

1

**2

1

);()()(

Page 21: © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de ...€¦ · © FJ Callealta ; LR Rivera (UAH) Análisis Factorial de Correspondencias Simple: •Ideado por Benzecri en 1973

© FJ Callealta ; LR Rivera (UAH)

Análisis Factorial de Correspondencias Múltiple:

• Enfrenta varias variables cualitativas, aplicando el AnálisisFactorial de Correspondencia Simple a la Tabla de Burr,construida con todas las respectivas tablas decontingencia de cada 2 variables.

Análisis Factorial de Correspondencias Nº 21

Var1 Var2 Var3

m1 ... mk n1 ... np ... r1 ... rq

m1 0 0 ...

Var1 ... 0 0 T12 ... T13

mk 0 0 ...

n1 0 0 ...

Var2 ... T21 0 0 ... T23

np 0 0 ...

... ... ... ... ... ... ... ... ... ... ...

r1 ... 0 0

Var3 T31 T32 ... 0 0

rq ... 0 0