Tópicos Especiais em Análise Multivariada

Júlia Maria Pavan Soler

IME/USP

Foco na obtenção de vetores reducionistas da ”(co)variação”

Revisão de Metodologias: (n >> p)

- Componentes Principais - Análise Fatorial- Análise Discriminante - Correlação Canônica

Componentes Principais em Espaços Duais: O Problema n << p

Componentes Principais em Dados Agrupados: Formulação do Modelo Linear Misto Multivariado (Modelo de Componentes de Covariância)

AHP – Método de Análise Hierárquica (Analytic Hierarchy Process): Obtenção de vetores de prioridades no apoio multicritério à decisões

Seja uma matriz pxp e f(,) uma função do p , definida como:

;1',,'

k e 1 são o menor e maior autovalor de , respectivamente.

Neste Minicurso discutiremos várias pesquisas de redução de dimensionalidade de dados

multivariados que são casos particulares da função f(,) para diferentes escolhas de .

Parte I

Revisão de Metodologias: Foco na obtenção de vetores reducionistas de ”informação”

- Componentes Principais- Análise Fatorial- Análise Discriminante- Correlação Canônica

n >> pObservações IndependentesDecomposição Espectral de Matrizes

Estrutura de Dados Multivariados

Unidades Amostrais 1 2 … j … p

1 Y11 Y12 Y1j Y1p

2 Y21 Y22 Y2j Y2p

… … … … … …

i Yi1 Yi2 Yij Yip

… … … … … … …

n Yn1 Yn2 Ynj Ynp

Variáveis

:ijY resposta do i-ésimo “indivíduo” na j-ésima variável

Exemplos (Manly, 2005)

Objetivo de Análises Multivariadas: Caracterização das unidades amostrais relativamente ao conjunto das p variáveis Caracterização das variáveis (inter-relação)

Tamanho amostral: n > 5p e n > 100 (Hair et al., 2005)

Grau de correlação entre as variáveis |r| > 30%

Componentes Principais – Observações IndependentesSindrome Metabólica (SM): Doença multifarorial envolvendo

muitas variáveis inter-relacionadas.

Cálculo de Componentes Principais da Sindrome Metabólica: descrever a SM em termos de componentes não correlacionados e ordenados relativamente à informação que contêm).

Estrutura de Dados Multivariados

Linhas de Y: ipiipi YYYY ,...,, 21)1(

Colunas de Y:

)1(...

Espaço dos Indivíduos: n pontos em um espaço p-dimensional

Espaço das Variáveis: p pontos em um espaço n-dimensional

Explorar as propriedades geométricas de um espaço vetorial

YCovYE

............

Variáveis

1 Y11 Y12 Y1j Y1p

… … … … … … …

n Yn1 Yn2 Ynj Ynp

Média

Covariâncias

Estatísticas Descritivas Multivariadas

1Y2Y jY

12s js1 ps1

jjpp YYYYn

1)( 2/12/1

jjjj sspp SDDR

Variância total: tr ( S ) Variância Generalizada: | S |

Vetor de Médias Matriz de Covariâncias Matriz de Correlações Matriz de Distâncias

j jiijiinn YYdd 2

22s21s js2

2ps1pspjs

... ... ... ... ... ...

Box-plot Bivariado (Everitt, 2007)

1094,3

-5 0 5 10-1

2 4 6 8

0.95 0.99

-6 -4 -2 0 2 4 6

μyΣμy

Caracterização dos dados via seus eixos de “(co)variação”

Componentes Principais (Pearson, 1901)

Redução de dimensionalidade (n>p):

pmmp ;

jmnpn YaZZ Y ';

'...'...'

pppmmm

Y PPPPPP

Decomposição Espectral:

,maxarg

ZVar;aj

;; IPPPPDPPj

jjjp PPI ;0

PfPfPf

PPPfaf

;...;...;

';;maxarg

Variáveis

1 Y11 Y12 Y1j Y1p

… … … … … … …

n Yn1 Yn2 Ynj Ynptr()

Análise Fatorial (Spearman, 1904)Variáveis observadas são modeladas em função de variáveis latentes Descrever a estrutura dedependência entre as variáveis por meio da construção de fatores comuns e específicos

iiiiii

eCovICov

eCoveEEeY

ipimpmipipp

iimmii

2222212122

1121211111

pppmmppp

comunalidade especificidade

(diagonal)

Y pn ;

:,...,

Vetor de fatores comuns

Matriz diagonal de fatores específicos

Matriz de cargas fatoriais

2/12/1

PZYYPZPPPP

Solução via Componentes Principais

Fatores comuns: CP padronizados

Análise Discriminante (Fisher, 1938)

1 Y111 Y112 Y11j Y11p

2 Y121 Y122 Y12j Y12p

… … … … … …

n1 Y1n11 Y1n12 Y1n1j Y1n1p

1 Y211 Y212 Y21j Y21p

2 Y221 Y222 Y22j Y22p

… … … … … …

n2 Y2n21 Y2n22 Y2n2j Y2n2p

Variáveis

Obter funções (lineares) das p-variáveis para a máxima separação entre os grupos: Redução de dimensionalidade (n>p)

pg iYCoviYE |;|)1(

Suposição wG ...21

ii YlZ

lliYlVar

G grupos:

1;min; Gpmmp

Componentes de (co)variância

ENTRE e DENTRO de grupos

Situação ideal para discriminação: variáveis com covariâncias ENTRE e DENTRO de sinais contrários!

;ˆmaxarg

Análise

Discriminante (AD)

Análise de Componentes

Principais (ACP)

PPa Pf

;maxarg'

jbwPPw

;maxarg'

'max 1

igiggg

YYYYYYYYNYYYY1 1

......

PSSfjj

;maxarg 1

TS bS wS

Correlação Canônica (Hotteling, 1935, 1936)

Obter funções (lineares) das p-variáveis de Y1 e das q-variáveis de Y2 com máxima correlação Redução de dimensionalidade (n>(p+q))

Unidades Amostrais Y11 … Y1p Y21 … Y2q

1 Y111 Y1p1 Y211 Y2q1

… … … … … … …

n Y11n1 Y1pnp Y21n1 Y2qnq

Variáveis Y1 Variáveis Y2

qpmmqp ;min;

qpCov2221

)()(1)(ΣΣ

ΣΣΣY

Matriz de covariância entre os

dois conjuntos de variáveis

pp11Σpp22Σ

qp12Σ

VVarUVar

VUCovVUCorr

a, b; máxima correlação

Correlação Canônica Interpretação Geométrica

1, ,max VUCorrba

111111 YΣY eaU

221211 YΣY fbV

111111 ' YYΣY PPeeaU

Componente Principal de Y1

Fator Principal de Y1 (CP padronizado)

A variável canônica U1 resulta de uma rotação orthogonal (via o autovetor P1 e determinada por 11) do CP padronizado seguida por outra rotação orthogonal (via o autovetor e1 e determinada por )2/1

ΣΣΣΣΣ

Vetores Reducionistas

Componentes Principais

Análise Fatorial : solução via Componentes Principais (padronizados)

Análise Discriminante

Análise de Correlação Canônica:

YPZPf jPP jj

';;ˆmaxarg1;

YPZSSNPSSf wbjbwPP jj

';1ˆ;;maxarg11

1';;maxarg 21

YPUPf jPP jj

2';;maxarg 12

YPVPf jPP jj

i YP'2/1 f

)( 1pY

Suposições: n > p e Observações independentes

Parte II

Observações IndependentesRevisar: Escalonamento MultidimensionalDecomposição em Valores Singulares de Matrizes Retangulares

Espaços Duais

rnnrppn UVY pp

nnpn VUY

'' iiiinn

rppnrppp

dfbBUUYYB

VYZVVYY

Matriz de dados multivariados de posto r

Componentes Principais

Decomposição em valores singulares

Decomposição espectral

Quando p >> n os Componentes Principais de Y podem ser calculados a partir da decomposição espectral da matriz B (nxn), de dimensão muito menor que (ganho em tempo computacional).

Escalonamento Multidimensional: as coordenadas principais são obtidas a partir da Matriz de Distâncias (Y: Dist. Euclidiana ou Y padronizado: Dist. de Penrose)

Equivalência entre as Coordenadas Principais e os Componentes Principais (Mardia, 1979)

Tamanhos amostrais das 11 populações HapMap mais a brasileiran = 1.124

p = 365.116 variáveis (SNPs) distribuídas nos 22 cromossomos

Espaços Duais – Problema n << pAplicação em Genômica

Obter os Componentes Principais de Ancestralidade para a Caracterização da História Genética de Populações Mundiais

Componentes Principais de Ancestralidade Caracterização da História de Miscigenação da População Brasileira

Espaços Duais – Problema n << pAplicação em Genômica

Tópicos Especiais em Análise MultivariadaOficina 1 - R

Funções do R:

eigen(S) : flexível na escolha da matriz da forma quadrática a ser analisada (ex., S com 1/(n-1) ou 1/n, Y’Y)

princomp(Y): recebe a matriz Y e realiza a decomposição espectral de S (com divisor n)

prcomp(Y) : recebe a matriz Y e realiza a decomposição espectral de S (com divisor n-1) suporta n<p

svd(Y): recebe a matriz Y e realiza a decomposição em valores singulares de Y’Y e de YY’ . Para comparar com eigen é preciso “padronizar” as correspondentes matrizes de autovalores

n>>pn<<p

Foco na obtenção de vetores reducionistas da ”(co)variação”

Revisão de Metodologias: (n >> p)

- Componentes Principais - Análise Fatorial- Análise Discriminante - Correlação Canônica

Componentes Principais em Dados Agrupados: Formulação do Modelo Linear Misto Multivariado (Modelo de Componentes de Covariância)

AHP – Método de Análise Hierárquica (Analytic Hierarchy Process): Obtenção de vetores de prioridades no apoio multicritério à decisões

Parte III

Componentes Principais em Dados Correlacionados (unidades amostrais): Formulação do Modelo Linear Misto Multivariado

Casos: n > p e n << p

Formulação de Modelos Lineares Mistos Multivariados- Matrizes de Covariância Uniforme- Matrizes de Covariância mais Gerais: Estrutura Familiar (parentesco)

Componentes Principais - Observações “Correlacionadas”

Grupo Unidade Amostral Y1 Y2 … Yp

1 1 Y111 Y112 Y11p

1 2 Y121 Y122 Y12p

… …

1 n1 Y1n11 Y1n12 Y1n1p

Médias do Grupo 1

G 1 YG11 YG12 YG1p

G 2 YG21 YG22 YG2p

… …

G nG YGn11 YGn11 YGn11

Médias do Grupo G

Vetor de Médias Geral

11Y 12Y pY1

1.Y2.Y

Konishi and Rao (1992): Aplicação em dados de irmãos.Considera correlação uniforme e desbalanceamento:pnY

Dados com correlação entre as unidades amostrais (dentro do grupo)

Oualkacha et al. (2012): Aplicação em dados de famílias (grupos).Considera o grau de relacionamento

1 1 Y111 Y112 Y11p

1 2 Y121 Y122 Y12p

… …

1 n1 Y1n11 Y1n12 Y1n1p

Médias do Grupo 1

G 1 YG11 YG12 YG1p

G 2 YG21 YG22 YG2p

… …

Médias do Grupo G

11Y 12Y pY1

1.Y2.Y

Modelo de Componentes de (Co)Variância Multivariado(Konishi and Rao, 1992):

p euY 1

ppgNgNppgggg

wgbNNggpNpNg IYCov

pppppp

ΣΣΣ

.........

pppp wNbggpNpN

IGgDiagYCov

,...,1;11

Konishi and Rao (1992): Aplicação a dados de irmãos para muitas famílias.

Dados com correlação uniforme e Grupos desbalanceados

ppYCov

F.V. g.l. Matriz SQPC

Grupo (Entre) G-1

Resíduo (Dentro) N-G

TOTAL N-1

gggb YYYYNSpp

......

ppYYYYS

Modelo de Componentes de (Co)Variância Multivariado: (Konishi and Rao, 1992)

p euY 1

Tabela de MANOVA

pppp wNbggpNpN

IGgDiagYCov

,...,1;11

Componentes Principais de Y obtidos por meio da decomposição espectral de são os eixos da análise discriminante. “Além destes, outros Componentes Principais podem ser definidos”, como veremos a seguir.

1ˆˆ 1

Estimadores Consistentes dos Componentes de Covariância de Y (são funções lineares de Sb e Sw):

bw SS 1

1 1 Y111 Y112 Y11p

1 2 Y121 Y122 Y12p

… …

1 n1 Y1n11 Y1n12 Y1n1p

Médias do Grupo 1

G 1 YG11 YG12 YG1p

G 2 YG21 YG22 YG2p

… …

Médias do Grupo G

11Y 12Y pY1

1.Y2.Y

Modelo de Componentes de (Co)Variância Multivariado(Oualkacha et al., 2012):

ppgNgNppgNgNgg

wgbgpNpNg IYCov

Dados com correlação dependente do grau de parentesco entre indivíduos (famílias)

3 4 5 6

Família g 1 2 3 4 5 6 7

1 1 0 ½ ½ ½ 0 ¼

2 0 1 ½ ½ ½ 0 ¼

3 ½ ½ 1 ½ ½ 0 ¼

4 ½ ½ ½ 1 ½ 0 ¼

5 ½ ½ ½ ½ 1 0 ½

6 0 0 0 0 0 1 ½

7 ¼ ¼ ¼ ¼ ½ ½ 1

p euY 1

ppYCov

)/()()1/()/(

)/()1/(ˆGNGN

kjkgbga

g TraceN

NN1 11111

2;112 gbacggg NN

Estimadores dos componentes de Covariância de Y: são funções lineares de Sb e Sw (Oualkacha et al., 2012)

Soluções equivalentes: Konishi and Rao (1992) e Oualkacha et al. (2012)

pppp wbpppnY

ˆˆˆ;

ˆ'max

aaPC b

ˆ'max

aaPC w

ˆ'max

aaPC w

ˆˆ'max

ˆ'max

aaPC wb

Direção com máxima variação Entre grupos

Direção com máxima variação Dentro de grupos

Direção com máxima variação Total

Direção com máxima variação Entre grupos e mínima variação Dentro

(Oualkacha et al., 2012)

2/12/11 ˆˆˆˆˆ wbwbw

Elipses verticais: correspondm à variabilidade DENTRO dos grupos (dados de famílias)Elipse maior: corresponde à variação ENTRE famíliasPara situações em que n << p Wang et al. (2007) propôs uma solução penalizada com um parâmetro de regularização:

=0:: solução não penalizada=: solução para b.(maximização entre famílias)

Interpretação Geométrica (Wang et al., 2007)

ˆ'max

Projeto Corações de Baependi (MG): 1109 indivíduos de 80 famílias e 8.764 SNPs

Componentes Principais em Dados de FamíliasAplicação em Genômica - Ancestralidade

CP sob Independência (R)

Proporção da variância explicada pelos CP

CP de Herdabilidade (Rg)

Componentes Principais - Observações “Correlacionadas”Oficina 2 - R

Gerar dados com estrutura familiar de variáveis da Sindrome Metabólica (uma doença multifarorial)

ppppg wgbgpgpng INY

2;1~ 1

100 famílias de tamanho 8p=5 variáveis1 2

3 4 5 6

Família g

Cálculo de Componentes Principais:

aaaaaa

Parte IV

AHP – Análise Hierárquica de Processos: Obtenção de vetores de prioridades na tomada de decisões

AHP-Método de Análise Hierárquica (Saaty, 1980)

Tomada de decisões: análise de diferentes alternativas (objetos sob escolha)

- Complexo sistema de componentes “inter-relacionados” (não no sentido da covariância mas de importância)

Critérios para a Tomada de Decisões:

- Autoritário: baseado na experiência e julgamento de um indivíduo- Consensual: baseado na experiência e julgamento globais de vários indivíduos

Uso de Critérios Analíticos: construção de uma escala que relaciona opiniões a números, ordenando os objetos sob escolha por sua prioridade

A metodologia deve evitar simplificações

Estruturar hierarquicamente o (complexo) sistema de componentes “correlacionados”

- Definir os objetos sob escolha/comparação: nível mais baixo do fluxo- Definir os critérios / subcritérios para comparação dos objetos: níveis superiores do fluxo

Coleta dos julgamentos, par a par, tanto entre os objetos sob cada subcritério, quanto entre os subcritérios em relação ao nível imediatamente superior

Construção das Matrizes de Decisão

Obtenção do vetor de Prioridades entre os Objetos: Decomposição da Matriz de Decisão

Coleta dos julgamentos, par a par, tanto entre os objetos sob cada subcritério, quanto entre os subcritérios em relação ao nível imediatamente superior

- Uso de Questionário

A B CSubcritério 1.1

A 1 ? ?B ? 1 ?C ? ? 1

1.1 1.2 1.3Critério 1

1.1 1 ? ?1.2 ? 1 ?1.3 ? ? 1

9 7 5 3 1 3 5 7 9

Os julgamentos são, a posteriori, convertidos em índices quantitativos.Escala fundamental de atribuição de importâncias: escala de 9 pontos tendo o 1, 3, 5, 7 e 9 como referência e o 2, 4, 6 e 8 como intermediários.

A 1 3 6B 1/3 1 2C 1/6 1/2 1

AHP-Método de Análise Hierárquica (Saaty, 1980) Construção das Matrizes de Decisão (Importância)

Obtenção do vetor de Prioridades entre os Objetos: - Decomposição Espectral da Matriz de Decisão e Agregação dos Vetores de Prioridade

A B CSubcritério 1.1

A 1 3 6B 1/3 1 2C 1/6 1/2 1

Quadrada, Não simétrica e positiva (diferentemente das matrizes de covariância)

Matriz Recíproca:

Propriedade desejável: Matriz de Decisão Consistente

ijjiijij aaaaA /1,0);(

kjikijij aaaaA );( posto(A)=1

131213

121312

A B CEx.

Matriz Recíproca, quadrada e positiva (ordem p) pUUA 1;'

Matriz Recíproca, quadrada, positiva (ordem p) e Consistente ATrpUUA 1;' Autovalor único

Índice de Consistência da Matriz de Decisão: 1/1 ppIC quanto menor mais consistente

AHP- Decisão sobre a Melhor Escola (Saaty, 1980)

Aprendizado Colegas Vida EscolarTreinamento Vocacional

Prep. p/ Universidade

Aula de música

A C V T P M

aA aC aV aT aPaM bA

bC bV bT bPbM cA

cC cV cT cP cM

Objetos de Decisão: Escola A, B ou C

Critérios para a Decisão: Aprendizado, Colegas, Vida Escolar, Treinamento, Preparação para a Universidade, Aula de Música

Brainstorm entre especialistas para obtenção das matrizes de decisão

Critérios para a escolha da Escola

A 1 1/3 ½

B 3 1 3

C 2 1/3 1

A 1 1 1

B 1 1 1

C 1 1 1

A 1 5 1

B 1/5 1 1/5

C 1 5 1

ʎmax = 3,05 I.C.=0,025 ʎmax = 3,00 I.C. = 0

ʎmax = 3,00 I.C. = 0

A 1 9 7

B 1/9 1 1/5

C 1/7 5 1

A 1 1/2 1

B 2 1 2

C 1 1/2 1

A 1 6 4

B 1/6 1 1/3

C 1/4 3 1

ʎmax = 3,21 I.C. = 0,105

ʎmax = 3,00 I.C. = 0 ʎmax = 3,05 I.C. = 0,025

Aprendizado Colegas

Vida Escolar Trein. Vocacional

Prep p/ Universidade Aula de Música

Aprendizado

ColegasVida

Escolar

Treinamento

Vocacional

Prep p/ Universida

Aula de Música

Aprendizado 1 4 3 1 3 4

Colegas ¼ 1 7 3 1/5 1

Vida Escolar 1/3 1/7 1 1/5 1/5 1/6

TreinamentoVocacional

1 1/3 5 1 1 1/3

Prep p/ Universidade

1/3 5 5 1 1 3

Aula de Música

1/4 1 6 3 1/3 1

ʎmax = 7,49 I.C.= 0,30

Matrizes de Decisão: Entre os Objetos e Entre os critériosMétodo Numérico da Potência: Obtenção dos Autovetores

22,025,017,046,033,025,0

09,050,005,009,033,059,0

69,025,077,045,033,016,0

37,0 A

Autovetores Agregados:

A Escola A é melhor que B que é melhor que C

A C V T P MA

Critérios

Auto respeitosenso de

segurança Adaptar-se a outros

OutrosDiscipli

naÉtica

Afeição visível Outros

Disciplina

ÉticaAfeição visível

OutrosDiscipli

naÉtica

Afeição visível

Influência da Mãe Influência do Pai Influência de Ambos

V E D O V E D OV E D O

Nível 1: Bem estar geral da criança/adolescente (OW)Nível 2: Auto Respeito, Senso de segurança, Habilidade de Adaptar-se a outros (R, S, A)Nível 3: Afeição Visível mostrada por alguém (V)

Ideia de rigor e Ética (E)Disciplina da criança (D)Ênfase ou ajustamento pessoal com Outros (O)

Nível 4: Influência da Mãe, do Pai ou de AmBos (M, F, B)

AHP- Oficina 3 Psicoterapia - Influência dos Pais no Bem Estar da Criança

(Saaty, 1980)

R 1 6 4

S 1/6 1 3

A 1/4 1/3 1

ʎmax = 3,26I.C. = 0,07

V E D O

V 1 6 6 3

E 1/6 1 4 3

D 1/6 1/4 1 1/2

O 1/3 1/3 2 1

ʎmax = 4,35 I.C.= 0,12

V E D O

V 1 6 6 3

E 1/6 1 4 3

D 1/6 1/4 1 1/2

O 1/3 1/3 2 1

ʎmax = 4,35 I.C. = 0,12

V E D O

V 1 1/5 1/3 1

E 5 1 4 1/5

D 3 1/4 1 ¼

O 1 5 4 1

ʎmax = 5,42 I.C.=0,47

M 1 9 4

F 1/9 1 8

B 1/4 1/8 1

ʎmax = 4,00 I.C.=0,33

M 1 1 1

F 1 1 1

B 1 1 1

ʎmax = 3,00 I.C. = 0

Nível 1: Bem estar geral da criança/adolescente (OW)Nível 2: Auto Respeito, Senso de segurança, Habilidade

de adaptar-se a outros (R, S, A)Nível 3: Afeição visível mostrada por alguém (V)

Ideia de rigor, ética (E)Disciplina real da criança (D)Ênfase ou ajustamento pessoal com outros (O)

Nível 4: Influência da mãe, do pai, de ambos (M, F, B)

M 1 9 6

F 1/9 1 1/4

B 1/6 4 1

ʎmax = 3,11 I.C.=0,06

M 1 5 5

F 1/5 1 1/3

B 1/5 3 1

ʎmax = 3,14 I.C. = 0,07

AHP- Oficina 3 Psicoterapia - Influência dos Pais no Bem Estar da Criança

(Saaty, 1980)

Quem mais influencia o sentimento de bem estar da criança?Objeto de decisão: M, F, B

R 1 6 4

S 1/6 1 3

A 1/4 1/3 1

ʎmax = 3,26I.C. = 0,07

V E D O

V 1 6 6 3

E 1/6 1 4 3

D 1/6 1/4 1 1/2

O 1/3 1/3 2 1

ʎmax = 4,35 I.C.= 0,12

V E D O

V 1 6 6 3

E 1/6 1 4 3

D 1/6 1/4 1 1/2

O 1/3 1/3 2 1

ʎmax = 4,35 I.C. = 0,12

V E D O

V 1 1/5 1/3 1

E 5 1 4 1/5

D 3 1/4 1 ¼

O 1 5 4 1

ʎmax = 5,42 I.C.=0,47

M 1 9 4

F 1/9 1 8

B 1/4 1/8 1

ʎmax = 4,00 I.C.=0,33

M 1 1 1

F 1 1 1

B 1 1 1

ʎmax = 3,00 I.C. = 0

M 1 9 6

F 1/9 1 1/4

B 1/6 4 1

ʎmax = 3,11 I.C.=0,06

M 1 5 5

F 1/5 1 1/3

B 1/5 3 1

ʎmax = 3,14 I.C. = 0,07

202,0176,0333,0069,0

097,0061,0333,0210,0

701,0731,0333,0721,0

V E D 0

463,0119,0119,0

120,0064,0064,0

604,0R S A

701,0RSA

635,0MFB

A Mãe é mais importante que o Pai (0,635>0,209) no sentimento de bem estar do adolescente. O Pai deve ser aconselhado a participar mais!

Obtenção de Vetores Reducionistas - Perspectivas

Simulação de Dados: estudos mais gerais

AHP: Implementação no R, Estudar a Distribuição da Estatística IC (índice de consistência), Construção de Questionários para obtenção das Matrizes de Decisão

Observações Independentes Observações Correlacionadas

Formulação de modelos estruturais para Y (Modelo Linear Clássico Modelo Linear Misto)Estudar as propriedades dos Componentes Principais em Dados Correlacionados

UUYCov

wNNbNNg ppggppgg

Propriedades de Espaços Duais para a decomposição espectral do modelo linear misto

multivariado de components de (co)variância.

Bibliografia

Blangero J et al(2013) A kernel of truth: statistical advances in polygenic variance component models for complex human pedigrees.Adv. in Genetics vol.8.de Andrade et al. (2015). Global Individual Ancestry Using Principal Components for Family Data. Human Heredity 80: 1-11.Everitt, B. (2005). An R and S-Plus Companion to Multivariate Analysis. Springer.Fisher, R. A. (1938). The Statistical Utilization of Multiple Measurements. Annals of Eugenics 8: 368-378.Giolo et al. (2011). Brazilian urban population genetic structure reveals a high degree of admixture. European Journal of Human

Genetics 19: 111-116.Gower, JC. (1966). Some distance properties of latent root and vector methods used in multivariate analysis. Biometrika 53: 325–338.Hotelling, H. (1935). The most predictable criterion. J. Educ. Psych. 26: 139-142._________ . (1936). Relations between two sets of variates. Biometrika 28: 321-377.Konishi, S and Rao, CR. (1992). Principal component analysis for multivariate familial data. Biometrika 79: 631-641.Pearson, (1901).Mardia KV, Bibby JM, Kent JT. (1979). Multivariate analysis. London, Academic Press.Oualkacha, K, Labbe, A, Ciampi, A, Roy, MA and Maziade, M. (2012). Principal components of heritability for high dimension

quantitative traits and general pedigrees. Journal of Statistical Applications in Genetics and Molecular Biology 11, Issue 2, Article 4.R Development Core Team. (2014). R: A language and environment for statistical computing. http://www.R-project.org.Saaty, T. L. (1980). The analytic hierarchy process. New York: McGraw-Hill.______. (1991). Método de análise hierárquica. São Paulo: Markron Books.Spearman, C. (1904). General intelligence objectively determined and measured. American Journal of Psychology 15: 201-293.Wang Y, Fang Y, Jin M. (2007). A ridge penalized principal-components approach based on heritability for high-dimensional data. Hum

Heredity 64: 182-191.

Júlia Maria Pavan Soler

pavan@ime.usp.br

Tópicos Especiais em Análise Multivariada · Tópicos Especiais em Análise Multivariada Seja uma...

Transcript of Tópicos Especiais em Análise Multivariada · Tópicos Especiais em Análise Multivariada Seja uma...

Tópicos Especiais em Análise Multivariada · Tópicos Especiais em Análise Multivariada Seja uma...

Documents

Transcript of Tópicos Especiais em Análise Multivariada · Tópicos Especiais em Análise Multivariada Seja uma...

Tópicos Especiais em Resistência dos Materiais

Tópicos Especiais em Design - Ilustração

Tópicos Especiais em Marketing III

Tópicos Especiais em Desenvolvimento de Sistemas

TÓPICOS ESPECIAIS EM EDUCAÇÃO

Ventilação Mecânica 2013: tópicos especiais

Tópicos especiais em publicidade i

Tópicos Especiais de Contabilidade Administração ...cursoead.com.br/etepa.com.br/images/DS/PS_006_03_2018/catalogo%20... · Tópicos Especiais de Contabilidade ... Direito Economia

Tópicos especiais –– Corrosão Corrosão na construção civilfiles.prof-willyan.webnode.com/200000014-d85e4d95c5... · 2014. 11. 14. · Tópicos especiais –– Corrosão

Tópicos especiais 2015

Tópicos Especiais - Santa Isabel

TÓPICOS ESPECIAIS EM CORROSÃO (OPTATIVA)

408575 – tópicos especiais em cinema[2]

Apostila Grafoscopia - Tópicos Especiais

Tópicos especiais de rodovias - pavimentação

Tópicos Especiais em Inteligência Artificial

TÓPICOS ESPECIAIS EM GASTRONOMIA

Tópicos Especiais em Logística - 07

Tópicos Especiais de Marketing

Tópicos Especiais em TI 2