Apostila-ANALISEFATORIAL.doc

66
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza ANÁLISE FATORIAL Uma Introdução ÍNDICE Página 1. INTRODUÇÃO............................................ ......................................................1 2. MODELO TEÓRICO........................................ ......................................................2 3. PROCEDIMENTOS GERAIS PARA A ANÁLISE FATORIAL ("FACTOR ANALYSIS")............................................. ......................................................5 3.1. Considerações Iniciais............................ ...................................................5 3.2. Estágios.......................................... ...................................................5 4. MÉTODOS DE ESTIMAÇÃO DAS CARGAS DOS FATORES........... ......................................................6 4.1. Método do Componente Principal.................... ...................................................6 4.2. Método do Fator Principal......................... ..................................................10 4.2.1. O Problema da Comunalidade..................... ............................................... 12 4.3. Método da Máxima Verossimilhança.................. ..................................................12 5. ROTAÇÃO DOS FATORES................................... .....................................................15 5.1 Método Varimax..................................... ..................................................16 6. ESTIMAÇÃO DOS VALORES DOS FATORES..................... .....................................................20 6.1. Método da Regressão (Método de Thomson)........... ..................................................21 0

Transcript of Apostila-ANALISEFATORIAL.doc

completo. so para imprimir

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

ANLISE FATORIAL

Uma Introduo

NDICE

Pgina

11. INTRODUO

22. MODELO TERICO

53.PROCEDIMENTOS GERAIS PARA A ANLISE FATORIAL ("FACTOR ANALYSIS")

53.1. Consideraes Iniciais

53.2. Estgios

64. MTODOS DE ESTIMAO DAS CARGAS DOS FATORES

64.1. Mtodo do Componente Principal

104.2. Mtodo do Fator Principal

124.2.1. O Problema da Comunalidade

124.3. Mtodo da Mxima Verossimilhana

155. ROTAO DOS FATORES

165.1 Mtodo Varimax

206. ESTIMAO DOS VALORES DOS FATORES

216.1. Mtodo da Regresso (Mtodo de Thomson)

226.2. Mtodo dos Mnimos Quadrados Ponderados (Mtodo de Bartlett)

227. EXEMPLOS DE APLICAO

237.1. Exemplo 1

277.2. Exemplo 2

388. POSSVEIS FONTES DE ERROS EM ANLISE FATORIAL

399. NMERO E SIGNIFICADO DOS FATORES

4110. PERSPECTIVAS E ESTRATGIAS PARA ANLISE FATORIAL

4211. REFERNCIAS BIBLIOGRFICAS

1. INTRODUO

A anlise fatorial ("Factor Analysis") a principal e a mais antiga tcnica de anlise multivariada. A idia fundamental foi proposta por Sperman e por Pearson, no incio do sculo, para entender problemas relacionados psicologia educacional, na tentativa de definir inteligncia (MARRIOTT, 1974).

Seu desenvolvimento e principalmente, a sua utilizao, foram limitados durante muitos anos, devido complexidade dos clculos envolvidos. Com o advento do processamento de dados computadorizado, o uso e interesse pela anlise fatorial foi renovado e retomado (MENEZES et al., 1978). A anlise fatorial tem sido usada nas mais diversas reas do conhecimento, como por exemplo, Agronomia (FACHEL, 1978), Biologia (FOWLER, 1993), Floresta (QUEIROZ, 1984), Cincias Sociais (MENEZES et al., 1978), em que o pesquisador se depara com observaes de vrias variveis para cada elemento de uma amostra de plantas, animais, ou de outros tipos de unidades experimentais.

MENEZES et al., 1978 comentam que a anlise fatorial pode ser usada no agrupamento de variveis ou no agrupamento de unidades de observaes. No primeiro caso a matriz de dados iniciais tem as variveis nas colunas e as unidades de amostra nas linhas. No segundo caso, transpe-se a matriz anterior, obtendo-se as unidades nas colunas e as variveis nas linhas.

Se o nmero de variveis estudadas grande, uma estratgia de anlise seria a de tentar simplificar ou melhor estruturar o conjunto de dados, a partir das inter-relaes entre tais variveis. Tais inter-relaes podem ser medidas pelas covarincias ou pelos coeficientes de correlao entre as variveis. Duas tcnicas estatsticas de anlise multivariada so comumente utilizadas para tratar este problema: Anlise de Componentes Principais e Anlise Fatorial (JOHNSON & WICHERN, 1988).

A Anlise Fatorial um conjunto de mtodos estatsticos que, em certas situaes, permite "explicar" o comportamento de um nmero relativamente grande de variveis observadas, em termos de um nmero relativamente pequeno de variveis latentes ou fatores. Os fatores podem ser no correlacionados (fatores ortogonais) ou correlacionados (fatores oblquos). As variveis so agrupadas por meio de suas correlaes, ou seja, aquelas pertencentes a um mesmo grupo sero fortemente correlacionadas entre si, mas pouco correlacionadas com as variveis de outro grupo. Cada grupo de variveis representar um fator (JOHNSON & WICHERN, 1988).

Como uma tcnica de anlise multivariada, relevante mostrar como se situa a Anlise Fatorial em relao s outras tcnicas. Segundo Kendal (1950), citado por FACHEL (1976), as tcnicas de anlise multivariada podem ser distinguidas em:

a) Anlise de dependncia: quando queremos estudar a dependncia de uma ou mais variveis em relao s outras. Consideramos, ento, dois subconjuntos: um no qual as variveis so denominadas independentes e outro em que tratamos das variveis dependentes.

b) Anlise de interdependncia: quando estamos interessados nas relaes de um conjunto de variveis entre si, sem selecionarmos nenhuma delas em especial, como varivel dependente.

No primeiro tipo de anlise enquadram-se, por exemplo, Anlise de Regresso e Anlise de Varincia Multivariada, enquanto que no segundo tipo de classificao, salientando-se apenas o carter de interdependncia das variveis que se enquadram as tcnicas de Anlise Fatorial e de Componentes Principais.

2. MODELO TERICO

Considerando um conjunto de p variveis, com n observaes para cada varivel, obtm-se o arranjo de valores

[ x], i = 1, 2,..., n , j = 1, 2,..., p

partir do seguinte conjunto de dados

Variveis

indivduosX

X

...X

1x

x

...x

2x

x

...x

............

nx

x

...x

O modelo da anlise de fatores supe que cada varivel X linearmente dependente de poucas variveis aleatrias no observadas (m < p) chamadas fatores comuns, e p fontes adicionais de variao , chamadas erros ou, algumas vezes, fatores especficos (JOHNSON & WICHERN, 1988).

Em particular, o modelo da anlise de fatores pode ser escrito como* :

ou seja,

,

(eq.2.1)

onde X a j-sima varivel, so as cargas dos fatores para a j-sima varivel e so m fatores comuns no correlacionados, com m menor que p.

Os p valores observados so expressos em termos de p + m variveis aleatrias no observveis (). Isso distingue o modelo fatorial do modelo de regresso mltipla, no qual as variveis independentes podem ser observadas, e cujas posies so ocupadas por F no modelo fatorial.

Matricialmente teramos

(eq.2.2)

Uma verificao direta do modelo fatorial, partir das observaes X1,X2,...,Xp, impossibilitada por tantas quantidades no observveis. Entretanto, com algumas pressuposies impostas aos vetores aleatrios, F e \SYMBOL 101 \f "Symbol", o modelo fatorial implica em certas relaes de covarincia, que podem ser verificadas (JOHNSON & WICHERN, 1988). Assim os vetores F e \SYMBOL 101 \f "Symbol" devem satisfazer as seguintes condies:

E(F) = ,Cov(F) = E(FF`) =

E(\SYMBOL 101 \f "Symbol") = , Cov(\SYMBOL 101 \f "Symbol") = E[\SYMBOL 101 \f "Symbol"

\SYMBOL 101 \f "Symbol"`] = onde \SYMBOL 121 \f "Symbol" uma matriz diagonal

e que F e \SYMBOL 101 \f "Symbol" so independentes. Assim,

Cov(\SYMBOL 101 \f "Symbol",F) = E(\SYMBOL 101 \f "Symbol"F`) =

(eq.2.3)

Essas pressuposies e a relao em (eq.2.2) constituem o chamado modelo de fatores ortogonal.

Se admitirmos os fatores F serem correlacionados, de modo que Cov(F) no diagonal, teremos o chamado modelo de fatores obliquo. Este modelo no ser discutido neste trabalho.

Das pressuposies acima, obtemos a estrutura da matriz de covarincias de X, que ser representada por \SYMBOL 83 \f "Symbol".

Temos que XX`= (\SYMBOL 76 \f "Symbol"F + \SYMBOL 101 \f "Symbol") (\SYMBOL 76 \f "Symbol"F + \SYMBOL 101 \f "Symbol")`

= (\SYMBOL 76 \f "Symbol"F + \SYMBOL 101 \f "Symbol") [(\SYMBOL 76 \f "Symbol"F)` + \SYMBOL 101 \f "Symbol"`]

= \SYMBOL 76 \f "Symbol"F(\SYMBOL 76 \f "Symbol"F)` + \SYMBOL 101 \f "Symbol"(\SYMBOL 76 \f "Symbol"F)` + \SYMBOL 76 \f "Symbol"F\SYMBOL 101 \f "Symbol"` + \SYMBOL 101 \f "Symbol"

\SYMBOL 101 \f "Symbol"`

de modo que, de acordo com (eq.2.3) teramos:

\SYMBOL 83 \f "Symbol" = Cov(X) = E(XX`)

= \SYMBOL 76 \f "Symbol"E(FF`)\SYMBOL 76 \f "Symbol"` + E(\SYMBOL 101 \f "Symbol"F`)\SYMBOL 76 \f "Symbol"` + \SYMBOL 76 \f "Symbol"E(F\SYMBOL 101 \f "Symbol"`) + E(\SYMBOL 101 \f "Symbol"

\SYMBOL 101 \f "Symbol"`)

=\SYMBOL 76 \f "Symbol"I\SYMBOL 76 \f "Symbol"` + 0 + 0 + \SYMBOL 89 \f "Symbol"

=\SYMBOL 76 \f "Symbol"

\SYMBOL 76 \f "Symbol"` + \SYMBOL 89 \f "Symbol"

(eq.2.4)

De uma maneira mais fcil de entender e usando apenas propriedades da varincia, poderamos, partir da relao (eq.2.1), chegar ao mesmo resultado:

temos:

aplicando as propriedades da varincia, e com base nas pressuposies em (eq.2.3), teremos:

onde , ou seja \SYMBOL 76 \f "Symbol"

\SYMBOL 76 \f "Symbol"`, chamada de comunalidade da varivel Xj (a parte da sua varincia que est relacionada com os fatores comuns) enquanto que V(e) chamada especificidade de X (a parte da sua varincia que no est relacionada com os fatores comuns).

Temos, portanto, a estrutura de covarincia:

Pode tambm ser estabelecido que a correlao entre Xj e Xj'

Conseqentemente, duas variveis somente sero altamente correlacionadas se elas tiverem altas cargas no mesmo fator.

O modelo fatorial pressupe efeitos aditivos; fatores, variveis e resduos normalmente distribudos, resduos independentes e relaes lineares entre as variveis (JOHNSON & WICHERN, 1988)

Pelo teorema do limite central, generalizando da estatstica univariada para a multivariada, temos: se X1 , X2 , ..., Xp variveis tm varincias e correlaes ri j, com i e j = 1, 2, ..., p, ento as mdias , de uma amostra de tamanho n, possui uma distribuio que, com o aumento de n, se aproxima de uma distribuio normal multivariada, com varincias e correlaes estabilizadas e constantes para os valores de X. Esse teorema assegura que muitas das tcnicas e testes estatsticos baseados na distribuio normal multivariada so consistentes e no conduzem a resultados duvidosos, mesmo quando os dados originais no so derivados de uma distribuio normal multivariada (MARRIOT, 1974).

Na estatstica multivariada, assume-se que as matrizes de disperso so homogneas, ou seja, que as varincias e covarincias so independentes das mdias e so as mesmas entre os grupos. Se essa homogeneidade no ocorre, necessrio transformar os dados para estabilizar as varincias, seguindo os mesmos procedimentos adotados na estatstica univariada. Problema mais raro e irremedivel consiste na dependncia entre as correlaes e as mdias (MARRIOT, 1974).

O modelo fatorial assume que as p+p(p-1)/2=p(p+1)/2 varincias e covarincias para X podem ser reproduzidas a partir de pm cargas fatoriais (aij) e p varincias especficas (\SYMBOL 121 \f "Symbol"i). Quando m = p, qualquer matriz de covarincia (\SYMBOL 83 \f "Symbol") pode ser reproduzida exatamente como , e \SYMBOL 121 \f "Symbol" pode ser nula. Contudo, a anlise fatorial ser mais eficiente e til quando m for pequeno em relao a p, proporcionando uma explicao mais simples da covariao das variveis em X, com base num nmero de parmetros menor do que os p(p+1)/2 parmetros de \SYMBOL 83 \f "Symbol" (JOHNSON & WICHERN, 1988).

Em resumo o modelo fatorial implica na imposio de condies que permitem obter estimativas nicas de \SYMBOL 76 \f "Symbol" e \SYMBOL 121 \f "Symbol". Posteriormente, a matriz de cargas fatoriais (\SYMBOL 76 \f "Symbol") submetida rotao (multiplicao por uma matriz ortogonal), a qual determinada por critrios de facilidade de interpretao. Obtidas as cargas e as varincias especficas, os fatores so identificados e comumente calcula-se os valores dos escores fatoriais.

De alguma forma, pode-se dizer que a matriz de correlaes ou de covarincias das variveis constitui o gentipo responsvel pela variao das unidades de observao, enquanto a matriz de escores das unidades nos fatores constitui o fentipo, isso , o posicionamento das mesmas no gentipo. O gentipo pode ser constitudo por um (gentipo parcial) ou mais fatores (gentipo complexo ou geral) (MENEZES et al., 1978).

3. PROCEDIMENTOS GERAIS PARA A ANLISE FATORIAL ("FACTOR ANALYSIS")

3.1. Consideraes Iniciais

Dado n observaes de p variveis, geralmente, correlacionadas queremos saber se o modelo de fatores (eq.2.2), com um pequeno nmero de fatores m (m < p), representa adequadamente os dados. Essencialmente, poderamos solucionar este problema tentando verificar a relao das covarincias de X.

A matriz de covarincia amostral S um estimador da matriz de covarincias populacionais desconhecidas \SYMBOL 83 \f "Symbol". Se os elementos fora da diagonal principal de S forem pequenos ou ainda se os correspondentes elementos da matriz de correlao amostral R, forem essencialmente iguais a zero, ento as variveis no so relacionadas (ou muito pouco relacionadas), e a anlise de fatores no ter utilidade. Nessas circunstncias, os fatores especficos desempenham papel dominante e, portanto, a anlise fatorial ser pouco eficiente, pois busca a determinao de um pequeno nmero de fatores comuns importantes. Entretanto, se S aparenta desviar significativamente da matriz diagonal, ento o modelo de fatores pode ser ajustado (JOHNSON & WICHERN, 1988).

3.2. Estgios

Existem trs estgios na anlise de fatores. O problema inicial a determinao das cargas dos fatores (aj k) com j = 1 a p, e k = 1 a m (sendo m \SYMBOL 60 \f "Symbol" p). H vrios mtodos para a estimao de parmetros na anlise fatorial, dos quais os mais comuns so o Mtodo do Componente Principal e o Mtodo da Mxima Verossimilhana.

No importando qual mtodo seja usado para a determinao das cargas dos fatores, possvel mostrar que tais cargas no so nicas. Se F1, F2, ..., Fm so os fatores provisrios, ento, combinaes lineares desses fatores na forma

podem ser construidas, e "explicaro" os dados to bem quanto os anteriores. Existe um nmero infinito de solues alternativas para os modelos de anlise fatorial, e isto nos conduz ao segundo estgio da anlise, o qual chamado rotao dos fatores. Dessa forma, os fatores provisrios so transformados, com o objetivo de se encontrar novos fatores, mais fceis de serem interpretados. A "rotao", neste contexto, significa essencialmente a escolha dos nas equaes acima.

A rotao dos fatores pode ser ortogonal ou oblqua. Com a rotao ortogonal, os novos fatores sero no-correlacionados, enquanto que com a rotao oblqua os novos fatores sero correlacionados. Para qualquer tipo de rotao usada, desejvel que as cargas para os novos fatores sejam ou prximas de zero ou muito diferentes de zero. Uma carga aj k prxima de zero indica que a varivel Xj no muito relacionada com o fator Fk. Um grande (positivo ou negativo) valor de aj k (carga dos fatores) indica que Xj (a varivel j) determinada por Fk (fator k) em grande extenso. Se cada varivel for fortemente relacionada com alguns fatores, mas no de todo relacionada com outros, ento isto faz com que os fatores sejam mais facilmente identificados.

Um mtodo de rotao dos fatores ortogonal, que freqentemente usado, chamado Rotao Varimax (KARSON, 1982). Este mtodo ser explicado em seo posterior.

O ltimo estgio da anlise corresponde estimao dos valores dos fatores comuns F1, F2, ..., Fm para cada indivduo, como funo das variveis observadas.

4. MTODOS DE ESTIMAO DAS CARGAS DOS FATORES

Na literatura existem trs terminologias referentes anlise fatorial, ou seja, componentes principais, eixos principais e fatores principais. Elas diferem somente na composio das variveis. O eixo principal usualmente padronizado para ter uma mdia zero e uma varincia igual varincia total considerada. O componente principal o mesmo eixo principal, exceto que sua mdia no padronizada para zero. O fator principal normalizado para ter uma mdia zero e varincia unitria (KIM, 1975).

Segundo HARMAN (1968), a soluo da fatorao com valores unitrios nas diagonais da matriz de correlao pode ser chamada de soluo de componente principal, e a soluo com comunalidades nas diagonais da matriz de correlao denominada de soluo do fator principal.

JOHNSON & WICHERN (1988) consideram os Mtodos do Componente Principal e o da Mxima Verossimilhana como os mais recomendados para anlise fatorial.

4.1. Mtodo do Componente Principal

A anlise fatorial e a anlise de componentes principais so usadas para a mesma finalidade, ou seja, expressar a informao contida numa srie de observaes em um menor nmero de dimenses, e o relacionamento entre ambas grande. Os primeiros componentes podem ser tomados como uma aproximao para os fatores correspondentes. Se um modelo ligeiramente diferente for adotado, os componentes principais oferecem estimativas timas dos fatores, dentro de um senso perfeitamente vlido. Bartlett (1938), citado por MARRIOTT (1974), discute o problema do ponto de vista matemtico, buscando estimar as cargas fatoriais partir da anlise de componentes principais da matriz de correlaes. Trata-se de um procedimento mais simples do que os mtodos do Fator Principal e da Mxima Verossimilhana.

A anlise fatorial no se ocupa diretamente com a magnitude dos resduos, mas sim com as correlaes entre eles. Neste sentido, a anlise de componentes principais pode ser vista como uma aproximao da anlise fatorial, na medida que ao remover-se os primeiros componentes principais da matriz de correlaes, as correlaes entre os resduos usualmente so reduzidas. Entretanto, ao extrair os componentes mais importantes, a anlise de componentes principais no assume, necessariamente, que os resduos no sero correlacionados ou que sero normalmente distribudos. Portanto, a distino entre a anlise fatorial clssica e a anlise de componentes principais reside no fato de que a primeira assume um modelo matemtico definido, no qual o relacionamento entre as variveis explicado precisamente por m fatores, que os fatores e resduos so normalmente distribudos e as relaes so lineares (MARRIOTT, 1974).

Segundo MENEZES et al (1978), a diferena bsica entre o modelo de anlise de componentes principais e o modelo clssico de anlise fatorial que, no primeiro caso, considera-se a varivel como tal, sem tentar extrair dela o fator nico (soma do termo erro e varincia nica). Na anlise fatorial, faz-se uma estimativa atravs da comunalidade, que inserida na diagonal da matriz, obviamente com valores menores que um. Como a varincia explicada pelo modelo a relao entre a soma dos valores na diagonal e a soma dos valores fora da diagonal, quanto mais o valor diagonal exceder a comunalidade correta (aproximar-se de um), tanto maior ser a parcela da varincia no comum sendo tomada como se fosse varincia comum. Essa distoro ser tanto maior quanto mais inflada estiver a diagonal da matriz, cujo resultado ser a obteno de fatores que no sejam comuns, construdos com parcelas da varincia comum das variveis que o compem. Ao contrrio, eles estariam misturados com a varincia nica, de tal forma que poderia obscurecer (ao invs de simplificar) as relaes entre as variveis, gerando falsas interpretaes e resultados.

A matriz de covarincia \SYMBOL 83 \f "Symbol" pode ser fatorada pelo processo de expanso de matrizes simtricas, denominado decomposio espectral. Dessa forma, \SYMBOL 83 \f "Symbol" ser formada por pares de autovalores () e correspondentes autovetores normalizados (), com (JOHNSON & WICHERN, 1988). Ou seja:

\SYMBOL 83 \f "Symbol" =

(eq.4.1)

Um exemplo numrico poderia ilustrar essa igualdade:

Consideremos a matriz simtrica

Os autovalores, obtidos partir da equao caracterstica |B-\SYMBOL 108 \f "Symbol"I| = 0, so = 18, = 9 e = 9. Os correspondentes autovetores , obtidos aps substituio de cada autovetor na equao (B-I) = 0, com posterior processo de normalizao, so:

A decomposio espectral de B , ento:

B = ou

\EMBED Equation

como pode ser rapidamente verificado.

Os autovalores (\SYMBOL 108 \f "Symbol") e os autovetores (v) da matriz de covarincias ou correlaes so a essncia da anlise de componentes principais. Os autovetores determinam as direes de variabilidade mxima e os autovalores especificam as varincias. Quando os primeiros autovalores so muito maiores do que os restantes, a maior parte da varincia total pode ser explicada em um nmero menor do que p dimenses.

Se tomarmos o modelo da anlise fatorial tendo tantos fatores quanto variveis (ou seja, m=p) e as varincias especficas ej = 0 para todo j, ento a matriz de cargas dos fatores (\SYMBOL 76 \f "Symbol") teria m=p colunas e seria dada por . Ou seja, ns poderamos escrever:

(eq.4.2)

Apesar da representao da anlise de fatores em (eq.4.2) ser exata, isto no particularmente til. Ela usa tantos fatores comuns quantos so o nmero de variveis, alm de no permitir nenhuma variao nos fatores especficos ej como em (eq.2.2). Portanto, so preferveis modelos que expliquem a estrutura de covarincia levando em conta apenas alguns fatores comuns. Uma aproximao, quando os ltimos p-m autovalores so pequenos, omitir a contribuio dos termos para a matriz \SYMBOL 83 \f "Symbol" em (eq.4.1) (JOHNSON & WICHERN, 1988). Omitindo esta contribuio, podemos obter a aproximao

(eq.4.3)

o que corresponde (eq.2.4), porm omitindo-se \SYMBOL 89 \f "Symbol"

A representao aproximada em (eq.4.3) assume que os fatores especficos ej da matriz \SYMBOL 101 \f "Symbol" em (eq.2.2) so de menor importncia e podem tambm ser ignorados na fatorao de \SYMBOL 83 \f "Symbol". Se os fatores especficos forem includos no modelo, suas varincias poderiam ser tomadas como sendo os elementos diagonais de \SYMBOL 83 \f "Symbol" - \SYMBOL 76 \f "Symbol"

\SYMBOL 76 \f "Symbol"`, onde \SYMBOL 76 \f "Symbol"

\SYMBOL 76 \f "Symbol"` definido em (eq.4.3).

Para aplicar esta aproximao para um conjunto de dados x1j, x2j, ..., xnj, normalmente, as observaes so centradas pela subtrao da mdia amostral j. As observaes centradas

\EMBED Equation , i = 1, 2, ..., n

tero a mesma matriz de covarincia amostral S, que os dados originais.

Nos casos em que as unidades das variveis em estudo no so comensurveis, prefervel trabalhar com as variveis padronizadas

ou, matricialmente falando,

, i = 1, 2, ..., n

Com esta transformao, a matriz de covarincia corresponde matriz de correlao das observaes x1j, x2j, ..., xnj.

A padronizao evita o problema de ter uma varivel, com uma varincia relativamente grande, influenciando, inapropriadamente, a determinao das cargas dos fatores.

A representao em (eq.4.3), levando-se em considerao os fatores especficos, ou seja, \SYMBOL 83 \f "Symbol"=\SYMBOL 76 \f "Symbol"

\SYMBOL 76 \f "Symbol"' + \SYMBOL 101 \f "Symbol", quando aplicada matriz de covarincia amostral S, ou matriz de correlao amotral R, conhecida como soluo por componentes principais. O nome deriva do fato de que as cargas dos fatores so os coeficientes escalares da primeira amostra de componentes principais (JOHNSON & WICHERN, 1988).

Notemos que, por esta soluco, as estimativas das cargas dos fatores para um dado fator no mudam medida que o nmero de fatores aumentado. Por exemplo, se m=1, \SYMBOL 76 \f "Symbol" ser dado por e se m=2, \SYMBOL 76 \f "Symbol" ser dado por , onde (\SYMBOL 108 \f "Symbol"1, v1) e (\SYMBOL 108 \f "Symbol"2, v2) so os primeiros dois pares de autovalores e autovetores normalizados para a matriz de covarincia amostral S, ou para a matriz de correlao amostral R.

Um problema que surge agora com relao ao nmero de fatores m que deveremos considerar. Esse problema ser tratado posteriormente (seo 9). Vale ressaltar, entretanto, que o aumento do nmero de fatores considerados promove o aumento da comunalidade das variveis.

Voltando ao modelo de anlise fatorial dado por:

poderamos, ento, escrever da seguinte maneira:

onde

Aps a rotao, caso tenha sido necessria, a nova soluo ter a forma:

ou seja

onde representa o novo k-simo fator, e x representa os valores padronizados da varivel em apreo (ou seja, poderiam ser representados por z), e gpm representa as novas cargas dos fatores aps a rotao. importante salientar que aps a rotao a comunalidade no alterada.

4.2. Mtodo do Fator Principal

Conforme comentado por JOHNSON & WICHERN (1988) este mtodo se comporta como uma modificao do mtodo do componente principal, citado anteriormente.

Sero descritas as idias do mtodo, baseado na anlise de fatores da matriz de correlao amostral R, apesar do procedimento tambm ser apropriado para o caso de trabalharmos com a matriz de covarincia amostral S.

Se a matriz de correlao for adequadamente descrita pelo modelo fatorial , ento os m fatores comuns podem ser usados para determinar os elementos fora da diagonal principal de \SYMBOL 114 \f "Symbol" e as comunalidades da diagonal, ou seja, . Se a contribuio do fator especfico \SYMBOL 121 \f "Symbol"i for removida da diagonal, ou seja, se o valor um for substitudo por , a matriz resultante ser .

Do ponto de vista algbrico, o mtodo tem por base obter um conjunto de fatores, de modo que o mais importante fator comum (fator principal) seria o fator comum, com o mximo de contribuio para a comunalidade total, o segundo mais importante (segundo fator principal) seria o fator comum com a segunda maior contribuio para a comunalidade total, e assim por diante, at que toda comunalidade tenha sido analisada (FACHEL, 1976).

A soluo pelo mtodo do fator principal requer que as comunalidades sejam especificadas antes do primeiro fator ser extrado. A escolha das comunalidades a serem substitudas na matriz de correlaes conhecida como "o problema da comunalidade" (KARSON, 1982) e cinco propostas de escolha so dadas na seo 4.2.1.

Aps optar-se por um dos estimadores das comunalidades de cada varivel, substitumos a diagonal principal da matriz de correlao amostral pelas comunalidades estimadas. A matriz assim obtida denominada matriz de correlao amostral reduzida, e ser denotada por R*, ou seja,

em que so obtidos a priori, por um dos processos descritos na seo 4.2.1.

Dessa maneira, todos os elementos da matriz de correlao reduzida R* poderiam ser determinados pelos m fatores comuns.

partir da matriz de correlao reduzida R*, aplica-se o mtodo dos componentes principais conforme comentado na seo 4.1. Escolhe-se ento os m primeiros maiores autovalores dessa matriz e os m autovetores normalizados correspondentes, obtendo-se, ento, a matriz das cargas fatoriais estimadas pela soluo dos fatores principais e que dada por:

Dessa forma, as comunalidades poderiam, ento, ser reestimadas por

.

JOHNSON & WICHERN (1988) comentam tambm que tal procedimento pode ser usado iterativamente, com as comunalidades reestimadas pela expresso anterior como sendo as estimativas iniciais para o estgio seguinte.

Embora o mtodo do componente principal de R possa ser visto como mtodo do fator principal, com as comunalidades iniciais estimadas iguais a unidade, ou varincias especficas iguais a zero, os dois mtodos so filosfica e geometricamente diferentes (HARMAN, 1967). Na prtica, no entanto, os dois freqentemente geram carregamentos fatoriais comparveis, se o nmero de variveis for grande e o nmero de fatores comuns pequeno (JOHNSON & WICHERN, 1988).

4.2.1. O Problema da Comunalidade

Foi observado acima, que a soluo pelo mtodo do fator principal requer um conhecimento a priori das p comunalidades , para formar a matriz de correlao reduzida R*.

Existem vrios mtodos para estimar as comunalidades. Os mais comuns, conforme citado por KARSON (1982), so:

a) (j = 1, 2, ..., p), ou seja, tomar cada comunalidade como sendo igual a 1. Dessa forma R* = R e a soluo pelo mtodo do fator principal seria idntica soluo pelo mtodo do componente principal.

b) , onde o quadrado do coeficiente de correlao mltipla entre a varivel e todas as outras. Tipicamente esse valor calculado por

onde o j-simo elemento da diagonal principal de .

c) (j \SYMBOL 185 \f "Symbol" j'), o que significa que tomado como o maior valor absoluto da correlao simples entre e as outras variveis.

d) , assumindo que a mdia resultante das (p - 1) correlaes simples de com as outras variveis seja positiva.

e) tomado inicialmente por qualquer um dos quatro mtodos acima e uma soluo pelo mtodo do fator principal obtida. A partir dessa soluo, computado para cada j. Esses valores so tomados como novas comunalidades , e uma nova soluo obtida. Esse processo iterativo mantido at que tenhamos pequenas diferenas nas comunalidades de uma etapa para a outra.

Para um nmero de variveis (p) maior que 10, Gnanadesikan (1977), citado por KARSON (1982), diz parecer haver pequenas diferenas nas solues baseadas nos cinco mtodos

4.3. Mtodo da Mxima Verossimilhana

O mtodo da Mxima Verossimilhana para Anlise Fatorial foi introduzido por Lawley, em 1940, e no era muito usado anteriormente, por suas dificuldades computacionais. Atualmente, no entanto, devido aos trabalhos de Jreskog, j se encontram procedimentos rpidos e eficientes para a obteno dos estimadores por este mtodo (FACHEL, 1976). Mas a principal vantagem de utilizar o Mtodo da Mxima Verossimilhana para Anlise Fatorial , talvez, a possibilidade de se desenvolverem testes de hipteses, com o objetivo de testar a adequacidade do modelo, o que no possvel atravs dos outros dois mtodos apresentados anteriormente, devido s suas caractersticas no estatsticas.

Alm das suposies habituais do modelo fatorial, suporemos que os vetores aleatrios F (fatores comuns) e \SYMBOL 101 \f "Symbol" (fatores especficos) tm distribuio normal multivariada com vetores de mdia zero e com matrizes de covarincia I (pois estamos considerando os fatores no correlacionados) e \SYMBOL 89 \f "Symbol", respectivamente. Das suposies habituais (eq.2.3) e da suposio de normalidade, segue que F e \SYMBOL 101 \f "Symbol" so mutuamente independentes. Como X expresso em termos de F e \SYMBOL 101 \f "Symbol", conforme a equao (eq.2.2), temos que o vetor das variveis observveis tambm normal, com mdia zero e matriz de covarincia \SYMBOL 83 \f "Symbol". Portanto, as condies para a aplicao do Mtodo da Mxima Verossimilhana na Anlise Fatorial so:

a) X tem uma distribuio normal multivariada, com vetor de mdias zero e matriz de covarincia \SYMBOL 83 \f "Symbol";

b) X = \SYMBOL 76 \f "Symbol"F + \SYMBOL 101 \f "Symbol", onde E(F) = E(\SYMBOL 101 \f "Symbol") = 0, Var(F) = I, Var(\SYMBOL 101 \f "Symbol") = \SYMBOL 89 \f "Symbol" = diag(), Cov(F,\SYMBOL 101 \f "Symbol") = 0;

c) ;

d)As colunas de X so amostras aleatrias de tamanho n das variveis em questo e, portanto, a matriz de covarincia amostral S tem distribuio de Wishart*

O caminho a ser tomado ser o de maximizar a funo de verossimilhana de X, com respeito aos pm elementos de \SYMBOL 76 \f "Symbol" e os p elementos de \SYMBOL 89 \f "Symbol".

De acordo com o modelo fatorial, toda a informao da amostra est contida em S. Portanto, segundo KARSON (1982), ignorando os termos que no envolvem parmetros e usando a distribuio de Wishart, a qual nos d a distribuio de probabilidade multivariada para os elementos de S e tem a matriz de parmetros \SYMBOL 83 \f "Symbol" na funo de verossimilhana para os elementos de S, a funo de verossimilhana pode ser escrita como

Conforme feito usualmente, melhor maximizar L maximizando

(eq.4.4)

Quando \SYMBOL 83 \f "Symbol" em (eq.4.4) substitudo por , temos,

(eq.4.5)

O mtodo da mxima verossimilhana envolve determinar os pm elementos de \SYMBOL 76 \f "Symbol" e os p elementos de \SYMBOL 89 \f "Symbol" que maximizem (eq.4.5). A indeterminao de \SYMBOL 76 \f "Symbol", devido s eventuais rotaes (que sero discutidas na seo 5) ser aqui removida pela imposio da condio de que dever ser diagonal. Se denotar a matriz dos estimadores de mxima verossimilhana de \SYMBOL 76 \f "Symbol" e denotar o estimador de mxima verossimilhana de \SYMBOL 89 \f "Symbol", ento e sero obtidos diferenciando (eq.4.5) em relao a \SYMBOL 76 \f "Symbol" e \SYMBOL 89 \f "Symbol"; fazendo as p(m + 1) derivadas iguais a zero; e resolvendo o sistema das p(m + 1) equaes. Detalhes dessa soluo aparecem em Jreskog (1967) e Lawley e Maxwell (1971), citados por KARSON (1982). As equaes que requerem uma soluo numrica so:

(eq.4.6)

(eq.4.7)

onde em (eq.4.7) uma matriz diagonal, cujos elementos so os elementos diagonais da matriz (pxp) . Segundo KARSON (1982), numerosos mtodos iterativos tm sido propostos para resolver as equaes (eq.4.6) e (eq.4.7) com o objetivo de obter a soluo de mxima verossimilhana, para um determinado conjunto de dados. O referido autor afirma ainda que, independentemente do mtodo utilizado, uma grande quantidade de recursos computacionais exigida.

A soluo pelo mtodo da mxima verossimilhana usa a matriz de covarincia amostral S, no a matriz de correlao amostral R, e portanto no assume implicitamente, que os valores das variveis esto padronizados. Se os valores Xi na populao so supostos padronizados, ento \SYMBOL 83 \f "Symbol" = \SYMBOL 71 \f "Symbol"; e usando R nas expresses (eq.4.6) e (eq.4.7) no lugar da S, resultar em cargas dos fatores diferindo daquelas baseadas em S pelo fator , o termo constante na padronizao (KARSON, 1982).

Uma vantagem do mtodo da mxima verossimilhana que ele permite ao analista verificar se o modelo proposto adequado, a partir de um teste de hiptese formal. Independente de qual mtodo seja usado, o analista deveria observar as magnitudes dos elementos da matriz residual para um dado nmero de fatores m. Quanto menores estes elementos, melhor a soluo obtida reproduz \SYMBOL 83 \f "Symbol", sendo tambm melhor a estrutura proposta para .

Quando o mtodo da mxima verossimilhana usado, o teste pode ser feito da seguinte maneira:

pode ser testado contra

qualquer outra matriz positiva definida.

pelo teste devido a Lawley (1940) e Bartlett (1951), citado por KARSON (1982), tomando-se n > p e onde o nmero de graus de liberdade , em que a estatstica do teste :

JOHNSON & WICHERN (1988) mostram que, sob determinadas condies, igual a zero, de modo que, de uma maneira mais simplificada, teramos a seguinte estatstica do teste,

A hiptese H0 ser rejeitada se , para um determinado nvel de significncia \SYMBOL 97 \f "Symbol".

Se a hiptese rejeitada, ento o modelo de fatores escolhido inadequado. O nmero de fatores m deve, ento, ser aumentado de 1 e o modelo testado novamente, sendo o processo repetido at que um valor no-significativo seja obtido (SRIVASTAVA & CARTER, 1983).

JOHNSON & WICHERN (1988) comentam que se n grande e m pequeno (relativamente a p), a hiptese H0 ser, geralmente, rejeitada, ocasionando a reteno de mais fatores comuns. No entanto, pode estar suficientemente prxima de S, de modo que mais fatores no acrescentariam muita informao, apesar deles serem "significativos". Portanto, um julgamento pessoal por parte do analista deve ser levado em considerao na escolha do nmero de fatores m.

importante salientarmos que, se considerssemos a anlise a partir dos dados padronizados, teramos a seguinte hiptese a ser testada:

contra

em que a estatstica do teste seria

sendo R a matriz de correlao amostral, e e as matrizes das cargas dos fatores e das varincias especficas, respectivamente, obtidas partir dos dados padronizados. Pode-se provar (JOHNSON & WICHERN, 1988) que os valores dos qui-quadrados calculados, considerando a padronizao das variveis ou no , seriam exatamente os mesmos.

5. ROTAO DOS FATORES

Para procurar uma melhor interpretao dos fatores, prtica comum fazer uma rotao ou uma transformao dos fatores.

Pode ser mostrado que o conjunto de cargas fatoriais, obtidas por qualquer mtodo de soluo fatorial, quando o nmero de fatores comuns maior do que um, no nico, pois outros conjuntos equivalentes podem ser encontrados, por transformaes ortogonais de cargas. Em outras palavras, se ns multiplicarmos a matriz de cargas fatoriais p\SYMBOL 76 \f "Symbol"m, por uma matriz ortogonal mMmN, a decomposio da matriz de covarincia \SYMBOL 229 \f "Symbol" no nica, pois se M ortogonal, ento:

Assim, mesmo que os elementos de \SYMBOL 76 \f "Symbol"M sejam diferentes das cargas originais, sua habilidade em gerar as covarincias observadas inalterada.

Na expresso , se ns trocarmos F por , alm de \SYMBOL 76 \f "Symbol" por \SYMBOL 76 \f "Symbol"M, observamos que a expresso no se altera, pois M ortogonal. Na terminologia da anlise fatorial, temos o que se chama rotao dos fatores.

Apesar de estarmos livres para escolher qual rotao fazer, de modo a termos uma melhor interpretao dos fatores, no aconselhvel fazermos isto subjetivamente, porque poderamos estar forando o ajuste das cargas dos fatores com um padro preconcebido.

Partindo, portanto, para mtodos analticos de rotao dos fatores, uma escolha conveniente e mais utilizada o chamado mtodo Varimax, que ser descrito de maneira resumida.

5.1 Mtodo Varimax

Este mtodo de rotao ortogonal foi proposto por Kaiser (1958), citado por COOLEY & LOHNES, 1971. A idia do mtodo consiste no seguinte: Para cada rotao dos fatores que ocorre, h o aparecimento de altas cargas para poucas variveis, enquanto que as demais cargas ficaro prximas de zero. No incio Kaiser definiu a simplicidade de um fator k como a varincia do quadrado de suas cargas, isto :

onde ajk a nova carga para a varivel j no fator k, j = 1, 2, ..., p e k = 1, 2, ..., m.

Quando a varincia atinge o mximo, o fator tem maior interpretabilidade ou simplicidade, no sentido de que as cargas deste fator tendem ou unidade, ou zero. O critrio de mxima simplicidade de uma matriz fatorial completa definido como a maximizao da soma destas simplicidades.

Como este critrio d igual peso s variveis com comunalidades grandes ou pequenas, Kaiser sugeriu que antes de iniciar o processo de maximizao, as cargas fossem divididas pela raiz quadrada da comunalidade correspondente, o que equivalente a normalizar os vetores aj'. Aps a matriz M ter sido obtida, as cargas finais deveriam ser multiplicadas novamente pela raiz quadrada da comunalidade. A este critrio varimax modificado, Kaiser denominou critrio varimax normal, e o mais utilizado.

Portanto, este mtodo requer que as cargas dos fatores finais sejam tais que maximizem a funo:

onde a comunalidade da varivel j.

Ou, de uma maneira mais simples, aps a multiplicao da expresso anterior por , j que a multiplicao por uma constante no afeta o processo de maximizao:

(eq.5.1)

Esta expresso foi chamada por Kaiser como critrio varimax normal ou simplesmente critrio varimax.

O procedimento de clculo para a soluo varimax a que se segue. Os fatores so rotacionados dois por vez de acordo com o esquema abaixo:

onde k=1,2, ... , (m-1), e o correspondente q = p+1, p+2, ... , m.

Esta expresso indica que a matriz dos fatores finais, B, corresponde ao produto das transformaes de todas as combinaes de pares de fatores.

O conjunto completo de m(m-1)/2 pares de p e q (o que corresponde combinao de m fatores 2 a 2) chamado "ciclo". Este ciclo ser repetido at que o valor de V (eq.5.1) mantenha-se relativamente estvel.

As rotaes varimax de cargas fatoriais, obtidas a partir de diferentes mtodos de estimao (componentes principais, mxima verossimilhana, etc.), em geral, no so coincidentes. Da mesma forma, se fatores comuns adicionais so includos no modelo, o padro de carregamento rotacionado pode mudar consideravelmente. Se existe um nico (geral) fator dominante (no qual todas as variveis apresentam cargas altas), geralmente, ele obscurecido por qualquer rotao ortogonal. Entretanto, este fator pode ser mantido fixo e os demais rotacionados (MENEZES et al., 1978).

A rotao de fatores comuns particularmente recomendada para carregamentos obtidos pelo mtodo da mxima verossimilhana, porque as cargas iniciais so constrangidas a satisfazer a condio de unicidade (matriz diagonal). Esta condio, geralmente, facilita a maximizao da funo de verossimilhana, mas pode gerar fatores no facilmente interpretveis (JOHNSON & WICHERN, 1988).

Neste ponto, seria conveniente introduzirmos algumas notaes adicionais, com o objetivo de fazer as expresses seguintes mais compactas. Primeiro, as cargas dos fatores normalizados de cada varivel padronizada, para um particular par de fatores k e q, ser designado por:

e as cargas rotadas por Xj, Yj. A transformao de e em Xj e Yj se faz da seguinte maneira:

onde \SYMBOL 113 \f "Symbol" o ngulo de rotao no plano dos fatores k e q. Desde que quadrados e produtos cruzados das cargas normalizadas sero requeridas no clculo, as seguintes notaes sero necessrias:

onde todas as somas so em j de 1 a p.

Kaiser (1959), citado por HARMAN (1968), mostrou que o ngulo de rotao seria dado por:

(eq.5.2)

________________________

Obs.: Para cada rotao Tkq , o ngulo \SYMBOL 113 \f "Symbol" que faz com que (eq.5.1) seja mxima pode ser determinado do seguinte modo:

a) substitumos na expresso (eq.5.1) os valores das novas cargas normalizados, obtidos do produto

b) Diferenciamos a expresso obtida com relao a \SYMBOL 113 \f "Symbol";

c) Fazemos a derivada igual a zero e

d) resolvemos a equao para \SYMBOL 113 \f "Symbol".

Obtido o valor crtico \SYMBOL 113 \f "Symbol", precisaramos ainda verificar se um valor negativo da derivada segunda da funo V (eq.5.1) seria obtido, caso lhe fosse feita a substituio do valor crtico.

Atualmente, o trabalho formal do clculo da derivada segunda pode ser abreviado, j que o ngulo que nos daria o mximo pode ser determinado partir dos sinais algbricos do numerador e denominador.

Foi mostrado (HARMAN, 1968) que a soluo (eq.5.2) que faz com que (eq.5.1) seja mxima, precisa ser considerada somente para valores de \SYMBOL 113 \f "Symbol" entre -45o e +45o e que a condio suficiente para mximo conduz escolha do ngulo de rotao de acordo com os sinais algbricos do numerador e denominador da expresso (eq.5.2), podendo ser sumarizado no Quadro 1.

Quadro 1 ngulo de rotao

Sinais algbricos em (eq.5.2)QuadranteLimites de \SYMBOL 113 \f "Symbol"

NumeradorDenominadortg 4\SYMBOL 113 \f "Symbol"resultante de 4\SYMBOL 113 \f "Symbol"

+++I:0