11
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr.http://www.pucrs.br/famat/viali/
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Objetivos
A Análise de variância (ANOVA) É
utilizada para mostrar os efeitos principais de
variáveis categóricas independentes
(denominadas de fatores) sobre uma variável
quantitativa dependente.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O Modelo Linear Geral (GLM -General
Linear Model) suporta, também, variáveis
categóricas dependentes.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Um “efeito principal" é um efeito direto
de uma variável independente sobre a variável
dependente. Um “efeito de interação” é o
efeito de duas ou mais variáveis
independentes sobre a variável dependente.
22
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Objetivos
Os modelos de regressão não podem
manejar interações a menos que um termo de
produto cruzado seja explicitamente
adicicionado. A ANOVA mostra efeitos de
interação como resultado da própria técnica.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Existe uma variante para a utilização
de variáveis de controle quantitativas
denominada de ANCOVA (Analysis of
Covariance).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Existe, também, para o caso de
múltiplas variáveis dependentes a
MANOVA (Multiple analysis of Variance) e
finalmente existe uma combinação das duas
denominada de MANCOVA.
(MANOVA + ANCOVA).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A estatística teste na ANOVA é a F
(de Snedecor) que testa a diferença entre as
médias grupos. A distribuição F é assim
denominada em homenagem a Sir Ronald
Aylmer Fisher (1890 – 1962).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Ela testa se as médias dos grupos
formados pelos valores da variável
independente (ou combinação de valores
para as múltiplas variáveis independentes)
pode ter ocorrido por acaso.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Se as médias dos grupos não diferem
significativamente então pode-se assumir que
a variável independente não tem efeito sobre
a variável dependente.
33
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
One-Way ANOVA
Testa a diferença entre uma única
variável quantitativa dependente contra
dois, três ou mais grupos formados pelas
categorias de uma uma única variável
categórica independente.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
É também conhecida cono
ANOVA univariada, ANOVA de
classificação simples ou ANOVA de
um fator.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
TwoTwo--Way ANOVAWay ANOVA
A Two-way ANOVA analisa umavariável quantitativa dependente emtermos de categorias (grupos) de duasvariáveis qualitativas independentes, umadas quais pode ser considerada comovariável de controle.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A Two-way ANOVA é também
comnhecida como Análise de Variância de
dupla classificação.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
n-Way ANOVA ou MANOVA
Generaliza a ANOVA lidando com “n”
variáveis independentes. Note-se que o
número de interações cresce neste caso. Duas
variáveis independentes apresentam uma
única interação de primeira ordem (AB).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Três variáveis independentes
apresentam três interações de primeira
ordem (AB, AC, BC) e uma de segunda-
ordem (ABC), ou seja, quatro no total.
44
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Quatro variáveis independentes
apresentam seis interações de primeira
ordem (AB, AC, AD, BC, BC, CD), três de
segunda-ordem (ABC, ACD, BCD) e uma
de terceira ordem (ABCD). Dez no total.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
à medida que o número de interações
aumenta, torna-se bastante difícil
interpretar o modelo.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
ijiij UY µ +=O Modelo:
Cada valor obsevado da variávelquantitativa dependente Yij é dado pelasoma da média (µi) da população de ondeeste valor foi retirado mais um erro aleatório(Uij).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1) Os erros são variáveis aleatórias com média zero, isto é, E(Uij) = 0, para i = 1, 2, ..., k e j = 1, 2, ..., n;
2) Os erros são variáveis aleatórias independentes, isto é, E(Uij.Uhl) = 0, se i ≠h ej ≠ l;
SuposiSuposiççõesões::
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
3) Os erros apresentam variância constante, isto é, , para i = 1, 2, ..., k e j = 1, 2, ..., ni ;
4) Os termos erro Uij seguem uma normal.
σU 22ij )(E =
55
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
ResumindoResumindo::
Supõem-se que os valores Yij são valoresque resultam da adição de um valor médio µi
com um termo erro Uij que são variáveisaleatórias independentes com distribuição normal de média zero e variância constanteigual a σ2.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
MetodologiaMetodologia::
Fazendo µi = µ + αi, onde os αι são osefeitos dos tratamentos, o modelo fica:
ijiij UµY α ++=
Os αι, estão sujeitos a restrição Σniαi = 0.
Então de µi = µ + αi, segue que: µn ii
in1
µ ∑=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Fazendo mi indicar as estimativas de µi
(i = 1, 2, ..., k). Tem-se que:
ijiij EY m +=
Onde Eij é o desvio da j-ésima observaçãoem relação a estimativa da média do tratamento i.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Dados os valores Yij com i = 1, 2, ..., k e j = 1,2, ..., ni, de acordo com o Método dos Mínimos Quadrados, as estimativas de mi sãoos valores que minimizam a soma dos quadrados dos desvios ou soma residual, dada por:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Derivando e igualando a zero, tem-se:
∑∑ −∑∑ ===k
i
n
jiij
2k
i
n
j
2ij
ii)mY(ER.Q.SQ
0)1)((2Q n
jiij
i
i
mYm
=−−=∂∂
∑
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Segue, então:
Y=n
Y=m i
i
jij
i
n i∑Ou
∑=n
jiji i
i
Ymn
Isto é, o estimador de Mínimos Quadradospara a média do i-ésimo tratamento é a média aritmética das observaçoes deste tratamento.
66
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Indicando por Ai o total do i-ésimotratamento, isto é, fazendo:
nA
=Y=mi
iii
∑=
=n
1jiji
i
YA
Tem-se:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Elevando o binômio ao quadrado, segue:
∑ ∑ −∑ ∑ −= == =
==k
1i
n
1jiij
2k
1i
n
1jiij
2 ii)YY()mY(R.Q.S
As Somas dos As Somas dos QuadradosQuadrados
YnYYY 2i
k
1ii
k
1i
n
1jiji
k
1i
n
1j
2ij
ii2R.Q.S ∑∑ ∑∑ ∑
== == =+−=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Substituindo as expresssões anteriores e simplificando, tem-se:
∑∑ ∑== =
−=k
1i i
2i
k
1i
n
1j
2ij n
AY
iR.Q.S
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Pela definição, tem-se:
∑ ∑ −= =
=k
1i
n
1jij
2i)YY(Total.Q.S
Onde:∑ ∑= =
=k
1i
n
1jij
i
Yn1
Y
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Pode-se verificar, também:
nTotal.Q.S
GY
2k
i
n
j
2ij
i−= ∑∑
∑∑ ∑ ==k
ii
k
i
n
jij AY
iG
Onde:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Pela definição, a soma de quadrados dos tratamentos é:
∑ −=k
ii
2i )YY(n.Trat.Q.S
Lembrando que:
nA
Ymi
iii == 0=∑α
k
1=iie
77
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tem-se:n
.Trat.Q.SG
nA 2k
i i
2i −= ∑
Juntando os resultados, segue que:
S.Q.Res. = S.Q.Total - S.Q.Trat. ou
S.Q.Total = S.Q.Trat. + S.Q.Res.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Esta expressão mostra que a Soma dos Quadrados Totais é composta de duasparcelas: A Soma dos Quadrados dos Tratamentos (variação entre tratamentos) e a Soma dos Quadrados dos Resíduos (variaçõesdentro de tratamentos).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Considere-se os valores Yij
de três amostrassupostamenteindependentes:
ExemploExemplo::
1191487181655161413151711171212191309201510
Am. 1Am. 1Am. 1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tem-se:
n1 = 5, n2 = 6 e n3 = 7 n = 18 e k = 3
A1 = 55, A2 = 87 e A3 = 119
14,5 Y e 17Y ; 5,14Y ;11Y 321 ====
50,160=n
G -Y=Total.Q.S
2k
i
n
j
2ij
i∑∑
1055,378450,3889n
.Trat.Q.SG
nA 2k
i i
2i =−=−= ∑
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A soma dos resíduos vale:
50,5550,38893945
R.Q.Sk
1i i
2i
k
1i
n
1j
2ij n
AY
i
=−=
=−= ∑∑ ∑== =
S.Q.Total = S.Q.Trat. + S.Q.Res.Assim: 160,50 = 105 + 55,50
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Temos: eµY iij )(E =
Então:
EspectânciaEspectância dada Somas de Somas de QuadradosQuadrados
σµY 22i
2ij )(E +=
σµnY 22i
k
1ii
k
i
n
j
2ij nE
i+=
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛∑∑ ∑=
Como: ∑=
=n
1jiji
i
YA
De acordo com o modelo, tem-se:
88
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Segue, então:
∑=
+=n
1jijiii
iµµnA
⎟⎟⎠
⎞⎜⎜⎝
⎛∑∑==
++=ni
1jij
2n
1jijii
2i
2i
2i µµνnµnA
i2
Mas:0E
n
1jij
iµ =⎟
⎟⎠
⎞⎜⎜⎝
⎛∑=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Com l ≠ j, segue:
σnµµµ)µ( 2iil
n
lij
n
1j
2ij
ni
1j ij
2)(EE
ii=+∑= ∑
=∑=
Daí: σnµnA 2i
2i
2i
2i )(E +=
Como: ∑ ∑= ==
+∑=k
1i
n
1jij
k
1iii
iµµnG
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Segue:
)µ(µµn)µn(Gk
1i
ni
1jij
2k
1i
n
1jij
k
1iii
k
1iii
22 ))(.(2
i
∑∑ ∑∑=
∑== ===
+∑+=
Mas: 0)(Ek
1i
n
1jij
iµ =∑ ∑
= =
E com h ≠ i e/ou l ≠ k, segue
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim:
Portanto:
σµµµ)µ( 2k
1i
k
1h
n
1lhl
n
1jij
k
1i
n
1j
2ij
k
1i
n i
1j ij
2n)(EE
i ii=+∑= ∑ ∑ ∑ ∑∑
= = = == =∑=
∑=
σ)µn(G(E 2k
1iii
22 n) += ∑
=
σ)µn(µn 2k
1iii
2k
1i
2ii )1n(
n1
)Total.Q.S(E −+−∑= ∑==
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Ou: σ 2)1n(W)Total.Q.S(E −+=
)µn(µnk
1iii
2k
1i
2ii n
1W ∑
==−∑=
Ou: ∑==
−k
1ii
2i )µµ(nW
A expressão mostra que W = 0, apenas se µ1 = µ2 = ... = µk = µ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Para os tratamentos, tem-se:
Ou
σ)µn(µn
σ)µn(σµn(
2k
1iii
2k
1i
2ii
2k
1iii
22
k
1i
2ii
)1k(n1
n1
).)Trat.Q.S(E
−+−∑=
=−−+∑=
∑
∑
==
==
σ2)1k(W.)Trat.Q.S(E −+=
99
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Soma dos Quadrados
(n - 1 )σ2(n - 1 )σ2Total
(n - k )σ2(n - k )σ2Resíduo
(k - 1)σ2W + (k - 1)σ2Tratamentos
Esp. da Soma (sob H0)
Espec. daSoma
CausaCausa dadaVariaVariaççãoão
nG
nA 2k
i i
2i -∑
nG
Y2k
i j
2ij
n i-∑ ∑
∑-∑ ∑k
1=i i
2i
k
1=i 1=j
2ij n
AY
ni
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Consideremos a hipótese de nulidade:H0: µ1 = µ2 = … = µk
Isto é, consideremos a hipótese de que as médias das “k” populações sob análise sejamidênticas.
Sob esta hipótese, o valor W, definidoanteriormente é igual a zero. Então, tem-se:
Os Os QuadradosQuadrados MMéédiosdios
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
E(S.Q.Total) = (n – 1)σ2 e ainda que;
E(S.Q.Trat.) = (k – 1)σ2
Pode-se mostrar que se, os µij são variáveis
aleatórias independentes com distribuição
normal de média “zero” e variância σ2 então:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
(S.Q.Res)/σ2 tem uma distribuição Qui-Quadrado com “n – k” graus de liberdade.
Além disso, pode-se demonstrar que sob H0: (S.Q.Trat.)/σ2 tem uma distribuição Qui-Quadrado com “k – 1” graus de liberdade e (S.Q.Total)/σ2 tem uma distribuição Qui-Quadrado com “n – 1” graus de liberdade e as três distribuições são independentes entre si.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Por definição o QuadradoQuadrado MMéédiodio é o quociente entre a Soma dos Soma dos QuadradosQuadrados pelorespectivo “NNúúmeromero de de GrausGraus de de LiberdadeLiberdade”. Desta forma, o Quadrado Médio dos Tratamentos é:
Q.M.Trat = (S.Q.Trat.)/(k – 1)Q.M.Res. = (S.Q.Res.)/(n – k)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Substituindo alguns resultadosanteriores, tem-se:
E(Q.M.Trat.)= σ2 + W/(k – 1) e
E(Q.M.Res.) = σ2
A tabela, seguinte, resume alguns
resultados.
1010
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Soma dos Quadrados
(S. Q.)
n – 1
n – k
k - 1
Grau de Liberdade
(G.L.)
Total
σ2σ2Resíduos
σ2Tratamentos
Esp. daSoma (sob
H0)
Espec. Do Quadrado
Médio
CausaCausa dadaVariaVariaççãoão
nG
nA 2k
i i
2i -∑
nG
Y2k
i j
2ij
n i-∑ ∑
∑-∑ ∑k
1=i i
2i
k
1=i 1=j
2ij n
AY
ni
σ+1-k
W 2
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
SQTotal
SQRes.
SQTrat.
Soma dos Quadrados
n – 1
n – k
k - 1
Grau de Liberdade
Total
MQResResíduos
MQTrat.
MQRes
MQTrat.Tratamentos
FQuadradoMédio
Causa daVariação
A A TabelaTabela dada ANOVAANOVA
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Pode-se demonstrar que se X1 e X2 sãovariáveis aleatórias independentes com distribuições Qui-Quadrado de g1 e g2 graus de liberdade, respectivamente, então a variávelresultante do quociente: (X1/g1)/(X2/g2) apresenta uma distribuição F com g1 e g2
graus de liberdade. Anota-se F(g1 ; g2).
O O TesteTeste FF
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Uma variável aleatória X tem uma distribuição “F” ou de Snedecor se sua fdp for do tipo:
( )
0 x se 0
0 > x se )
2n
(Γ)2m
(Γ
mx+nxnm)2
n+m(Γ
=)x(f2
n+m12m
2n
2m
≤
--
A DistribuiA Distribuiçção F (de Snedecor)ão F (de Snedecor)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Expectância e VariânciaExpectância e Variância
2- mm
=XE )(
)4 - )(n2 - m(nm- )2 - n+(m2
= Var(X)2
m é o grau de liberdade do numerador e ndo denominador
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0,0
0,2
0,4
0,6
0,8
1,0
0 1 2 3 4 5 6 7 8
fdp deF(1, 3)F(2, 5)
F(5, 10)F(20, 20)
DiagramasDiagramas
1111
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O que é tabelado é a área à direita de cada curva (fun(funçção direta),ão direta), isto é, dado um certo
valor de “f”, tem-se: P[F(m, n) ≥ f] = α, ou
dado uma área à direita α pode-se determinar o
valor “f” que satisfaça P[F(m, n) ≥ f] = α((funfunçção inversaão inversa).).
PlanilhaPlanilha
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
(a) Dada uma distribuição F com
parâmetros g.l. do numerador = 3 e g.l.
do denominador igual a 5, determinar
P(F ≥ 2,5)
(b) O valor de “f” tal que P(F ≤ f) = 80%.
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então P(F ≥ 2,5) = 17,39%
Item (a)Item (a)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então, o valor de “f” tal que, P(F ≤ f) = 80% é f = 2,25.
Item (b)Item (b)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Com base em um teste preliminar um grupode alunos foi classificado de acordo com o desempenho em: Ótimo, Bom, Regular e Fraco. Para verificar se este teste era útil como previsorda média final dos alunos, amostras de cadagrupo foram selecionadas. Teste se existediferença entre as médias dos grupos ao nível de 1% de significância.
ExercExercííciocio
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
6,56,88,07,87,67,37,0
Regular
6,57,48,86,58,38,07,27,78,57,06,89,06,87,59,4
FracoBom Ótimo
DadosDados
1212
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
IntervalosIntervalos de de confianconfianççaa
Um intervalo de confiança de (1 – α) para a média do i-ésimo tratamento µi é dado por:
nMQR
tYn
MQRtY
i
esknii
i
eskni −− +≤≤− µ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Um intervalo de confiança de (1 – α) para a diferença nas médias de doistratamentos µi - µj também pode ser determinado.
O estimador de µi - µj é e a variância desse estimador é:
Y-Y ji
)n1
+n1
(σ=nσ+
nσ=)Y-Y(V
ji
2
j
2
i
2
ji
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Utilizando MQRes para estimar σ2
então o intervalo de confiança para a diferença entre as médias de dois tratamentosserá:
n
MQR+
n
MQRt+YYµµ
n
MQR+
n
MQRtYY
j
es
i
esknjiji
j
es
i
esknji -- -≤-≤--
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A rejeição da hipótese nula na ANOVA
indica que existe uma diferença significativa
entre as médias populacionais. No entanto,
com grandes amostras, estas diferenças podem
ter pouca significância prática.
UmaUma MedidaMedida de de AssociaAssociaççãoão
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Uma medida da força da associação entre
a variável independente e a variável
dependente na ANOVA é w2 (ômega dois).
Este coeficiente indica a proporção da
variância da variável dependente que é
explicada pelos níveis da variável
independente.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Esta medida é análoga ao coeficiente de
determinação (r2) na regressão. A expressão
para o cálculo do w2 é dada por:
MQR+SQTMQR)1 -k( -SQT
=w.esotal
.es.rat2
1313
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Quando rejeitamos a hipótese nula em
uma ANOVA, estamos admitindo que as
médias não são todas iguais.
A estatística F, no entanto, não fornece
orientações sobre qual é (ou quais são) a média
(tratamento) responsável pela diferença.
ComparaComparaççõesões MMúúltiplasltiplas
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
As comparações múltiplas também são
conhecidas como Análise Post Hoc. A vantagem
do uso deste tipo de comparação ao invés de
vários testes t é que ela mantém a probabilidade
de erro do tipo I a mesma taxa α, mesmo fazendo várias comparações entre as médias.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Por exemplo se tivermos cinco grupos
(tratamentos) para serem comparados, teremos
10 comparações diferentes de médias para
serem feitas. Algumas são: média 1 com média
2, média 1 com média 4, etc.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A probabilidade de Erro do Tipo I, neste
caso, será dada por:
αf = 1 – (1 – α)c, onde:α = probabilidade de erro I em cada
comparação;
c = número de comparações.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim se tivermos cinco grupos e dez
comparações o nível de significância final ,
considerando cada teste com 5% de
significância, será de:
αf = 1 – (1 – α)c = 1 – (1 – 0,05)10 = = 40,13%
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O método de Tukey é também denominado
de Teste DHS (Diferenças Honestamente
Significativas – Honestly Significant
Difference). Ele foi projetado para manter a
taxa de Erro do Tipo I a um nível de
significância α.
O O mméétodotodo de Tukeyde Tukey
1414
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A hipótese nula para cada para sendo
comparado é:
H0: µi = µj para i ≠ j,Isto é, cada par das médias populacionais
são iguais. A estatística teste Q é definida
por:
EMQ/n
X–X=Q
ji
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A distribuição Q é denominada de
Distribuição da Amplitude Estudentizada
(Studentized Range Distribuition).
Suponha que se tenha n observações
independentes y1, ..., yr retiradas de uma
distribuição normal com média µ e desvio σ.
A A distribuidistribuiççãoão QQ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Seja w a amplitude desta amostra, isto é,
w = máx(y1, ..., yr) - mín(y1, ..., yr) .
Suponha agora que nós temos uma
estimativa s2 da variância σ2, que é baseada
em “ν” graus de liberdade e independente de yi.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A amplitude estudentizada é definida por:
Qr,ν = w/s
Esta distribuição já foi tabelada e aparece
em vários livros de Estatística. É possível
consultar seus valores on-line pela Internet.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Por exemplo seja r = 5 e ν = 10.
O percentil 95% da distribuição será:
Q0,95(10, 5) = 4,65.
Isso significa que:
P(w/s ≤ 4,65) = 95%
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A distribuição Q foi desenvolvida para
determinar a diferença mínima entre a maior e
a menor média em um conjunto de k médias
que é necessário para rejeitar a hipótese que as
médias correspondentes na população são
iguais.
1515
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
No desenvolvimento da distribuição Q o número de grupos variou, mas o número de observações em cada um dos grupos k é o mesmo. Isto e ni = n é o mesmo para os k grupos. Os valores críticos são dependentes do número de grupos comparados k e o glassociado com a estimativa da variância da população EQM, isto é, Q(n-k, k).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Esta expressão é válida quando a
ANOVA é balanceada, isto é, todos os grupos
apresentam o mesmo tamanho.
Quando os grupos diferem uma versão
modificada é utilizada. Neste caso o teste é
denominado de método de Tukey-Kramer
(TK).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A expressão para o cálculo da estatística
de TK é dada por:
)2
n/1+n1/EMQ(
X–X=Q
ji
ji
A distribuição amostral é Q e é dada em
função (para 5% e 1%) do grau de liberdade
(gl) e de k = número de tratamentos.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Suponha que um método de produção
possa ser executado de 4 formas diferentes:
A, B, C e D. A tabela da ANOVA é dada
(próxima lâmina). Como o valor F(3, 29) é
2,93 e o Fc = 10,47 é significativo, determinar
através do método de TK quais diferenças de
médias são significativas.
ExemploExemplo::
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
TabelaTabela dada AnovaAnova
491,3432Total8,13235,8929Resíduo
2,9310,4785,15255,453Trat.F0,05FMQSQGLCausa
Resumo da ANOVA10797ni
16,8017,2923,0021,86DCBAGrupo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O valor da estatística Q para o método
TK é encontrado através de tabelas. Neste
caso, r = 4 e v = 29 o valor para uma
significância de 5% é 3,86.
Assim µ1 é diferente de µ3 e µ4.
E µ2 é diferente de µ3 e µ4.
1616
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
12,1-=)
21/9+1/78,13(
23,00-21,86Q 2-1
*09,-5=)
21/10+1/78,13(
16,80-21,86Q 4-1
*69,6-=)
21/10+1/98,13(
16,80-23,00Q 4-2*24,4-=
)2
1/7+1/78,13(
17,29-21,86Q 3-1
*49,0-=)
21/10+1/78,13(
16,80-17,29Q 4-3
*62,5-=)
21/7+1/98,13(
17,29-23,00Q 3-2
Cálculos do valor Q utilizando o método TK
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Ao testar a hipótese H0 para amostras
independentes pode ser utilizado tanto o teste
t quanto a Análise de Variância. Os dois
procedimentos são equivalentes. A estatística
teste t para um grau de liberdade de n –k = n -
2, mantém a seguinte relação: t2 = F e
Relação entre a ANOVA e o teste t
F=t c2c
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O delineamento de medidas repetidas
envolve medir um mesmo sujeito duas ou mais
vezes na variável dependente.
Em virtude desta dependência as
variações precisam ser ajustadas de modo que
o valor F adequado seja calculado.
ANOVA: medidas repetidas
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A soma total dos valores SQT é
particionada em em três componentes: (1) a
variação entre sujeitos - SQI (2) a variação
entre duas ocasiões sucessivas – SQT e (3) a
variação restante que é denominada de
residual – SQR.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Os quadrados médios são calculados da
mesma forma que a anterior, isto é, pela divisão
da Soma dos Quadrados pelo número de graus
de liberdade adequado.
O erro quadrado médio da variação residual
(QMR = SQR/glR) é utilizado para testar o
efeito entre as repetições do tratamento.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Este é o efeito de maior interesse
(principal).
Se quisermos testar a diferença entre os
sujeitos é só fazer; MQI/MQR.
A tabela para a ANOVA de medidas
repetidas fica então:
1717
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
MQI/MQRMQISQIk - 1Sujeitos
MQT/MQRMQTSQOl – 1Ocasiões
MQRSQR(k-1)(l-1)Resíduo
SQT
Soma dos Quadrados
n – 1
Grau de Liberdade
Total
FQuadradoMédio
Causa daVariação
ANOVA de medidas repetidas
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1. As amostras são aleatórias;2. A variável dependente é normalmente
distribuída;3. As variâncias das repetições são
homogêneas;4. Os coeficientes de correlação entre os pares
de repetições são iguais.
Hipóteses da ANOVA MR:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Um teste foi aplicado a um conjunto de
10 pessoas em três ocasiões diferentes. A
variável dependente é o desempenho nos testes
nas diferentes ocasiões. O interesse é verificar
se existe diferença entre os testes.
Exemplo:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1586G20157F1061E
101211
108
1412
Teste 2
166J138I189H
123D154C169B186A
Teste3Teste 1SujeitoDadosDados
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Solução:
nG
lA
=SQ2k
1=i
2i
T -∑
nG
kB=SQ
2l
1=i
2i
I -∑
nG
Y=SQT2k
1=i
l
1=j
2ij -∑ ∑
SQR = SQT - SQI - SQO
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
k = número de repetições (tratamentos)
l = número de pessoas em cada repetição (casos)
n = total de dados ⇒ n = k.lAi = soma de cada repetição (tratamentos)
Bi = soma dos resultados do i-ésimo caso (linhas)
G = soma de todos os valores = ΣAi = ΣBi
1818
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
27,423=33,341360,3836=n
GlA
=SQ2k
1=i
2i
T --∑
--∑ 33,167=333,34136667,3580=n
GkB
=SS2l
1=i
2i
I
67,640=33,34134054=n
GY=SQT
2k
1=i
m
1=j
2ij --∑ ∑
SQR = SQT - SQI – SQO = 50,07
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
6,6818,59167,3310 – 1 = 9Sujeitos
76,09211,64423,273 – 1 = 2Testes
2,7850,07(3-1)(10-1) = 2.9 = 18
Resíduo
640,67
Soma dos Quadrados
30 – 1 = 29
Grau de Liberdade
Total
FQuadradoMédio
Causa daVariação
Resumo:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1. Existe diferença entre sujeitos pois a significância do F = 6,68 encontrado ép = 0,03%
2. Existe diferença entre as repetições (tratamentos) pois a significância do valor F = 76,09 encontrado é p = 0,00%
Conclusão:
Top Related