ANOVA 1 Fator - Prof. Ivan Balducci

download ANOVA 1 Fator - Prof. Ivan Balducci

of 12

Transcript of ANOVA 1 Fator - Prof. Ivan Balducci

Anlise de Varincia (ANOVA) 1 fatorQueremos determinar se a diferena observada entre duas mdias amostrais devida, apenas, s variaes aleatrias de uma amostra a outra, ou se os dados vm de populaes onde as mdias so verdadeiramente diferentes. Esse um outro modo de dizer que ns queremos descobrir se a diferena entre as mdias estatisticamente diferente. Enfim, mesmo que ns possamos concluir que as mdias so diferentes, ns tambm temos de decidir se elas diferem o suficiente para poderem ser consideradas de importncia prtica (clnica). Vamos considerar trs situaes (A, B e C) onde os grupos Controle e Tratado apresentam a mesma mdia amostral, porm, diferem em termos de variabilidade (em disperso, ou seja, em desvio-padro).caso A

caso B

caso C

10 9 8 7 6 5 4 3 2 1 0

m m

C

T

C

T

C

T

C = grupo controle T = grupo tratado Caso A: duas mdias diferentes (no podemos dizer outra coisa, seno que diferem numericamente). Caso B: as mesmas duas mdias (de A) com valores bem dispersos (a diferena no estatisticamente significante). Devido disperso, a diferena no muito convincente. Caso C: as mesmas mdias (as duas de A e B) com valores concentrados (prximos ao valor mdio). Nesse caso, h diferena estatisticamente significante.

Q

O teste t (de Student) para a diferena entre duas mdias um caso especial de anlise de varincia (ANOVA 1 fator). A frmula para t pode ser expressa para F. Vale a relao: F = t2.

2 O problema como decidir quando as mdias so diferentes, em relao disperso dos valores em cada grupo, a fim de concluir se h diferena estatisticamente significante entre as mdias. A anlise de varincia ajuda-nos a responder esta questo. O que temos a fazer descobrir um modo de avaliar (medir) numericamente o quo diferentes so as mdias e quanto as observaes se afastam (encontram-se dispersas) ao redor das respectivas mdias. Com essas duas medidas (avaliaes) nossa disposio, somos capazes de dizer se as mdias diferem significantemente ou no. A idia da Anlise de Varincia Esta a idia principal para a comparao de mdias: o que importa no o quanto as mdias amostrais esto distantes , mas o quo distantes esto relativamente variabilidade de observaes individuais. A ANOVA compara a variao resultante de fontes especficas com a variao entre indivduos que deveriam ser semelhantes. Em particular, a ANOVA testa se vrias populaes tm a mesma mdia, comparando o afastamento entre as mdias amostrais com a variao existente dentro das amostras. A ANOVA pressupe que podemos decompor cada valor observado em trs termos aditivos; ou seja, ns somos capazes de escrever cada observao como uma soma de trs termos. A decomposio pode ser escrita como: Valor obtido (x) = mdia geral () + desvio da mdia do grupo em relao mdia geral ( x ) + desvio (ij ) entre o valor observado em relao mdia do grupo ( x - x ) ou Data = fit + residue (error) O modelo formal de ANOVA (1 fator ) : xij = + ij + ij

xij so os valores observados em cada grupoi refere-se ao grupo j refere-se observao dentro do grupo uma constante ( a mdia geral) so os termos residuais (diferena entre o valor observado e o fit, modelo ajustado)

3

Observao. Suposies do modelo ANOVA: (i) todas as populaes tm o mesmo desvio padro , de valor desconhecido; (ii) os resduos devem seguir uma curva normal com mdia igual a zero e varincia 2. A estatstica F da ANOVA F = variao (entre mdias amostrais)

/

variao (entre indivduos dentro das amostras)

As medidas de variao no numerador e denominador de F so chamadas de mdias quadrticas. Uma mdia quadrtica uma forma mais geral de uma varincia amostral. Uma varincia amostral usual s2 uma mdia dos desvios quadrticos das observaes a partir de suas mdias, logo se qualifica de mdia quadrtica. A estatstica F testa a hiptese nula de que todas as I populaes tm a mesma mdia: Ho: 1 = 2 = 3= .. = G Ha: nem todos os so iguais Sob Hiptese Ho, ento, a estatstica F tem distribuio F com G-1 e N-G graus de liberdade.

4 Exemplo resolvido: Na Tabela 1, mostrada a seguir, temos cinco grupos com cinco observaes em cada grupo. Queremos saber as diferenas nas mdias amostrais so variaes aleatrias que ocorrem apenas devido ao acaso (just by chance) ou se existem diferenas sistemticas entre as mdias. Tabela 1. Dados obtidos em cinco grupos num experimento inteiramente casualizado com cinco rplicas. B C D E A 6 7 4 5 3 6 8 4 5 4 6 8 5 6 4 8 8 6 6 4 9 9 6 8 5 x) mdias amostrais ( 7 8 5 6 4 mdia geral = 6 Observao: Primeira regra de anlise de dados: make a picture Segunda regra de anlise de dados: make a picture Terceira regra de anlise de dados: make a picture assim, um dot plot, e/ou um box-plot e/ou ou histograma convm serem apresentados!

5

Dotplot of Valores vs Grupos

A

Grupos

B C D

E

0

1

2

3

4

5 6 Valores

7

8

9

10

Dotplot for A-E

Mean Mean +- 1 StDev

E D C B A

3

4

5

6

7

8

9

Descriptive Statistics: A, B, C, D, E Grupos A B C D E N 5 5 5 5 5 Mdia DP CoefVar (%) 7.000 1.414 20.20 8.000 0.707 8.84 5.000 1.000 20.00 6.000 1.225 20.41 4.000 0.707 17.68 Obs.: 1.414 o dobro de 0.707

6 Resoluo: Grupo AIncio 6 6 6 6 6 Efeito tratamento +1 +1 +1 +1 +1 Grupo (-x-) 7 7 7 7 7 Resduo (jogo) -1 -1 -1 +1 +2 Final 6 6 6 8 9 2 1 1 1 1 4

SQ entre grupos: n( x - )2

5 (1)2

Grupo BIncio 6 6 6 6 6 Efeito tratamento +2 +2 +2 +2 +2 Grupo (-x-) 8 8 8 8 8 Resduo (jogo) -1 0 0 0 +1 Final 7 8 8 8 9 2 1 0 0 0 1

5(2)2

Grupo CIncio 6 6 6 6 6 Efeito tratamento -1 -1 -1 -1 -1 Grupo (-x-) 5 5 5 5 5 Resduo (jogo) -1 -1 0 +1 +1 Final 4 4 5 6 6 2 1 1 0 1 1

5(-1)2

Grupo DIncio 6 6 6 6 6 Efeito tratamento 0 0 0 0 0 Grupo (-x-) 6 6 6 6 6 Resduo (jogo) -1 -1 0 0 +2 Final 5 5 6 6 8 2 1 1 0 0 4

5(0)2

Grupo EIncio 6 6 6 6 6 Efeito tratamento -2 -2 -2 -2 -2 Grupo (-x-) 4 4 4 4 4 Resduo (jogo) -1 0 0 0 +1 Final 3 4 4 4 5 2 1 0 0 0 1

5(4-6)2 = 5(2)2

Clculo da Soma de Quadrados

7

SQ Entre grupos =SQE = 5 [12 +22 + (-1)2 + 02 + 22] = 50 SQ Dentro dos grupos = SQD = 2 = 22. 2 = (-1)2 +(-1)2+ (-1)2+ (1)2+ (2)2 + (-1)2+ (0)2 +(0)2+(0)+(1)2 + (-1)2+(-1)2+(0)2+(1)2+(1)2 + (-1)2 + (-1)2+(0)2+(0)2+(2)2 + 2 2 2 2 2 (-1) +(0) +(0) +(0) +(1) = 2 = 8+ 2 + 4 + 6 + 2 = 22 SQT = Soma de Quadrados Total = SQE + SQD = 50 + 22 = 72 SQT = (x x :mdia geral )2 = SQT = (x mdia geral )2 = (6-6)2 + (6-6)2 + (6-6)2 +(8-6)2 +(9-6)2 +(7-6)2 + ... +(4-6)2 + (56)2 = 72 (esse valor representa a soma de 25 valores de desvios elevados ao quadrados) Efetue o teste de Normalidade dos resduos e/ou avaliao grfica. Observao. Suposio do modelo ANOVA: (i) todas as populaes tm o mesmo desvio padro , de valor desconhecido; (ii) os resduos devem seguir uma curva normal com mdia igual a zero e varincia 2.

8Residual Plots for A, B, C, D, ENormal Probability Plot 99 Percent 90 50 10 1 -2 -1 0 1 Residual 2N AD P-Value 25 1.493 > Command Line Editor: cdf 2.87 k1; F 4 20. let k2 = 1 k1 print k2 ( X) Submit Commands: nesse caso temos p-valor = k2 = 0.05 confirmando como verdadeira a Tabela F. gl (4:20)

= 2,87 para

5%. A estatstica F razo de varincia foi calculada. Ela ocorre muito ou pouco num

12Curva Fgl (numerador) = 4

CDF 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 1

gl (denominador) = 20

5%

2

2.87

3

4

F calculado (= 11.36) maior que F (= 2.87) tabelado a 5%, ento, rejeita-se Ho

Para se obter o p-valor associado estatstica Fgl(4;20) = 11.36 Edit>> Command Line Editor: cdf 11.36 k1; F 4 20. let k2 = 1 k1 print k2 A resposta ser k2 = p-valor =1-p (=k1) = 0,00006 = < 5%, logo rejeita-se Ho. Concluso. H evidncia amostral de que as cinco mdias diferem do ponto de vista estatstico.