Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de...

24
An´ alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An´ alise de componentes principais: parte 2

Transcript of Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de...

Page 1: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Analise de componentes principais: parte 2

Prof. Caio Azevedo

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 2: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Exemplo 1: dados da ıris “de Fisher”

Recapitulando: quatro variaveis, tres grupos, 50 observacoes por

grupo.

Objetivos: caracterizar os grupos em relacao a essas quatro variaveis

e compara-los.

Utilizaremos a analise de componentes principais (usando a matriz

de correlacoes) para esse fim.

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 3: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

● setosaversicolorvirginica

CS

2.0 2.5 3.0 3.5 4.0

●●

●●

●●

● ●

●● ●

●●

●●

●●

● ●

● ●

● ●

● ●

● ●●

● ●

●●

● ●

●●●

●●

●●

●●

●●

●●

●●

● ●

0.5 1.0 1.5 2.0 2.5

4.5

5.5

6.5

7.5

●●●●

●●

● ●

●● ●●●

●●

●●

●●

● ●

●●

●●

2.0

2.5

3.0

3.5

4.0

●●

● ●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

LS●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●● ●

●● ●● ● ●●

●● ●

●●●

●●

●●

●●

●● ●●● ● ●● ●●

● ●●●●

●●●●

●●

● ●● ●● ●● ●

●●●● ● ●●

●● ●

●●●

●●

●●

●●

● ● ●●●● ● ● ●●● ● ●●

●●● ●●

●●

● ●●

CP

12

34

56

7

●●●●●

●●●●● ●●●

● ●●●●

●●

●●

●●● ●●●●● ●● ●●●●

● ●●

●●●●

●●●●●

4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0

0.5

1.0

1.5

2.0

2.5

●●●● ●

●●

●●●

●●●●

●●● ●●

● ●

●●● ●

●●● ● ●

●● ●

●●●

●●

●● ●● ●● ●● ●

●●●●

●●●

●●●

●●● ●●

●●

●●●●

●●● ● ●

●● ●

●●●

●●

●● ●●

1 2 3 4 5 6 7

●●● ●●

●●

●●●●●

●●●

●●● ●●

●●

●● ●●

●●●●●●

● ●●●●

●●

●●●●

LP

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 4: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

autovaloresV

aria

nce

s

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Comp.1 Comp.2 Comp.3 Comp.4

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 5: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Variancias de cada componente:

λ1 = 2, 91,λ2 = 0, 91,λ3 = 0, 15,λ4 = 0, 02.

Variancia explicada

Comp. 1 Comp. 2 Comp. 3 Comp. 4

PVE (%) 72,96 22,85 3,67 0,51

PVEA (%) 72,96 95,81 99,48 100,00

Componentes principais

Comp. 1 Comp. 2

CS 0,52 (0,89) -0,37 (0,37)

LS -0,27 (-0,46) -0,92 (0,88)

CP 0,58 (0,99) -0,02 (0,02)

LP 0,56 (0,96) -0,07 (0,07)

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 6: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Primeira componente: constrate entre as variaveis CS, CP e LP e a

variavel LS.

Segunda componente: e uma media ponderada entre as variaveis CS

e LS.

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 7: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

●●

●●

●●

●●

● ●

●●

●●

● ●

●●

● ●●

−3 −2 −1 0 1 2 3

−2

−1

01

2

cp1

cp

2

setosa

versicolor

virginica

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 8: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

setosa versicolor virginica

−3

−2

−1

01

23

CP1

●●

setosa versicolor virginica

−2

−1

01

2

CP2

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 9: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

CP1

−2.8 −2.6 −2.4 −2.2 −2.0 −1.8

0.0

0.5

1.0

1.5

2.0

2.5

CP1

−0.5 0.0 0.5 1.0

0.0

0.2

0.4

0.6

0.8

1.0

CP1

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

0.0

0.2

0.4

0.6

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 10: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

CP2

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

CP2

−1 0 1 2 3

0.0

0.2

0.4

0.6

CP2

−3 −2 −1 0 1 2

0.0

0.1

0.2

0.3

0.4

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 11: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

−2 −1 0 1 2

−2

−1

01

2

setosa

quantil da N(0,1)

CP

1

● ●● ●

● ● ●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●● ●

● ●● ●

● ● ●

−2 −1 0 1 2

−2

−1

01

2

versicolor

quantil da N(0,1)

CP

1

● ●●

●● ● ● ● ●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●

●●●●● ● ● ●

● ● ● ●●

−2 −1 0 1 2

−2

−1

01

2

virginica

quantil da N(0,1)

CP

1

● ● ● ●● ● ● ●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●● ● ●● ●

● ●●

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 12: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

−2 −1 0 1 2

−2

−1

01

23

setosa

quantil da N(0,1)

CP

2

●● ●

● ● ●● ●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ● ● ●

● ●●

−2 −1 0 1 2

−1

01

2

versicolor

quantil da N(0,1)

CP

2

● ● ●● ● ● ●

● ●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●● ● ● ●

● ● ●●

−2 −1 0 1 2

−2

−1

01

2

virginica

quantil da N(0,1)

CP

2

● ●

● ● ● ● ● ●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

● ● ● ● ●●

●●

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 13: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

−0.2 −0.1 0.0 0.1 0.2

−0

.2−

0.1

0.0

0.1

0.2

Comp.1

Co

mp.2

setosa

setosa

setosasetosa

setosa

setosa

setosasetosa

setosa

setosa

setosa

setosa

setosasetosa

setosa

setosa

setosa

setosa

setosasetosa

setosa

setosa

setosa

setosasetosa

setosa

setosa

setosasetosa

setosasetosa

setosa

setosa

setosa

setosasetosa

setosasetosa

setosa

setosasetosa

setosa

setosa

setosa

setosa

setosa

setosa

setosa

setosa

setosa

versicolorversicolorversicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolorversicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolorversicolor

versicolorversicolor

versicolor

versicolor

versicolor

versicolor

versicolor

versicolorversicolor

versicolor

versicolor

versicolor

versicolor

versicolorversicolor

versicolor

versicolor

versicolor

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginica

virginicavirginica

virginica

virginicavirginica

virginica

virginica

virginica

virginicavirginica

virginica

virginicavirginica

virginica

virginica

virginicavirginicavirginica

virginica

virginicavirginica

virginica

virginica

virginica

virginica

virginica

−10 −5 0 5 10

−1

0−

50

51

0

CS

LS

CPLP

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 14: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Comparacao de grupos via modelos lineares

Yijk = µk + αik + ξijk ,

i = 1, 2, 3(tipo de iris, setosa, veriscolor, virginica), j = 1, ..., ni ,

ni = 50,∀i , k = 1, 2(componente principal), ξijki.i.d∼ N(0, σ2

k)

Yijk : valor da componente principal k , da planta j , do tipo de ıris i .

µk : media da componente principal k do grupo de referencia

(setosa).

αik : incremento na media da componente principal k, do grupo i ,

em relacao ao grupo de referencia.

Utilizou-se o resıduo “studentizado” (veja http://www.ime.

unicamp.br/~cnaber/aula_Diag_REG_2S_2014.pdf) (para

verificar a qualidade de ajuste do modelo).Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 15: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 1

0 50 100 150

−4−2

02

4

Índice

Res

íduo

Stu

dent

izad

o

−2 −1 0 1

−4−2

02

4

Valores Ajustados

Res

íduo

Stu

dent

izad

o

Resíduo Studentizado

dens

idad

e

−4 −2 0 2 4

0.0

0.1

0.2

0.3

−2 −1 0 1 2

−20

24

Percentil da N(0,1)

Res

íduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 16: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 1−3

−2−1

01

23

4

Res

íduo

Stu

dent

izad

o

−2 −1 0 1 2

−20

24

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 17: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 1

Parametro Estimativa EP Estat.t p-valor

µ1 -2,22 0,06 -35,65 < 0,0001

α21 2,72 0,09 30,83 < 0,0001

α31 3,95 0,09 44,79 < 0,0001

Ha diferenca entre o primeiro grupo e os outros dois. Vamos agora testar

a igualdade entre as medias dos dois outros grupos atraves de testes do

tipo Cβ = M (veja mais detalhes em http://www.ime.unicamp.br/

~cnaber/aula_testes_Cbeta_analise_REG_2S_2014.pdf).

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 18: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 1

Teste: α21 = α31 vs α21 6= α31, fc = 194, 83(< 0, 0001).

Medias preditas pelo modelo.

grupo Estimativa EP IC(95%)

setosa -2,22 0,06 [-2,35 ; -2,10]

versicolor 0,50 0,06 [0,37 ; 0,62]

virginica 1,73 0,06 [1,60 ; 1,85]

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 19: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2

0 50 100 150

−4−2

02

4

Índice

Res

íduo

Stu

dent

izad

o

−0.2 0.0 0.2 0.4

−4−2

02

4

Valores Ajustados

Res

íduo

Stu

dent

izad

o

Resíduo Studentizado

dens

idad

e

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

0.5

−2 −1 0 1 2

−3−2

−10

12

3

Percentil da N(0,1)

Res

íduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 20: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2−3

−2−1

01

23

Res

íduo

Stu

dent

izad

o

−2 −1 0 1 2

−3−2

−10

12

3

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 21: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2

Parametro Estimativa EP Estat.t p-valor

µ2 -0,2889 0,1247 -2,32 0,0219

α22 0,8391 0,1764 4,76 <0,0001

α32 0,0277 0,1764 0,16 0,8755

Ha diferenca entre o primeiro grupo e o segundo e uma equivalencia

entre aquele e o terceiro. Vamos ajustar um modelo reduzido (α32 = 0).

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 22: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2

0 50 100 150

−4−2

02

4

Índice

Res

íduo

Stu

dent

izad

o

−0.2 0.0 0.2 0.4

−4−2

02

4

Valores Ajustados

Res

íduo

Stu

dent

izad

o

Resíduo Studentizado

dens

idad

e

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

0.5

−2 −1 0 1 2

−3−2

−10

12

3

Percentil da N(0,1)

Res

íduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 23: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2−3

−2−1

01

23

Res

íduo

Stu

dent

izad

o

−2 −1 0 1 2

−3−2

−10

12

3

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

Prof. Caio Azevedo

Analise de componentes principais: parte 2

Page 24: Análise de componentes principais: parte 2cnaber/aula_ACP_Ana_Multi_P2_2S_2017.pdf · An alise de componentes principais: parte 2 Prof. Caio Azevedo Prof. Caio Azevedo An alise de

Componente 2

Estimativa dos parametros.

Parametro Estimativa EP Estat.t p-valor

µ2 -0,2751 0,0879 -3,13 0,0021

α22 0,8253 0,1523 5,42 <0,0001

Medias preditas pelo modelo.

grupo Estimativa EP IC(95%)

setosa/virginica -0,28 0,09 [-0,45 ; -0,10 ]

versicolor 0,55 0,12 [0,30 ; 0,80]

Prof. Caio Azevedo

Analise de componentes principais: parte 2