Download - Objetivos - pucrs.br · classificação simples ou ANOVA de um fator. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Two-Way ANOVA A Two-way ANOVAanalisa

Transcript

Page 1: Objetivos - pucrs.br · classificação simples ou ANOVA de um fator. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Two-Way ANOVA A Two-way ANOVAanalisa

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Prof. Lorí Viali, Dr.http://www.pucrs.br/famat/viali/

[email protected]

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Objetivos

A Análise de variância (ANOVA) É

utilizada para mostrar os efeitos principais de

variáveis categóricas independentes

(denominadas de fatores) sobre uma variável

quantitativa dependente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O Modelo Linear Geral (GLM -General

Linear Model) suporta, também, variáveis

categóricas dependentes.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Um “efeito principal" é um efeito direto

de uma variável independente sobre a variável

dependente. Um “efeito de interação” é o

efeito de duas ou mais variáveis

independentes sobre a variável dependente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Objetivos

Os modelos de regressão não podem

manejar interações a menos que um termo de

produto cruzado seja explicitamente

adicicionado. A ANOVA mostra efeitos de

interação como resultado da própria técnica.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Existe uma variante para a utilização

de variáveis de controle quantitativas

denominada de ANCOVA (Analysis of

Covariance).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Existe, também, para o caso de

múltiplas variáveis dependentes a

MANOVA (Multiple analysis of Variance) e

finalmente existe uma combinação das duas

denominada de MANCOVA.

(MANOVA + ANCOVA).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A estatística teste na ANOVA é a F

(de Snedecor) que testa a diferença entre as

médias grupos. A distribuição F é assim

denominada em homenagem a Sir Ronald

Aylmer Fisher (1890 – 1962).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ela testa se as médias dos grupos

formados pelos valores da variável

independente (ou combinação de valores

para as múltiplas variáveis independentes)

pode ter ocorrido por acaso.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Se as médias dos grupos não diferem

significativamente então pode-se assumir que

a variável independente não tem efeito sobre

a variável dependente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

One-Way ANOVA

Testa a diferença entre uma única

variável quantitativa dependente contra

dois, três ou mais grupos formados pelas

categorias de uma uma única variável

categórica independente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

É também conhecida cono

ANOVA univariada, ANOVA de

classificação simples ou ANOVA de

um fator.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

TwoTwo--Way ANOVAWay ANOVA

A Two-way ANOVA analisa umavariável quantitativa dependente emtermos de categorias (grupos) de duasvariáveis qualitativas independentes, umadas quais pode ser considerada comovariável de controle.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A Two-way ANOVA é também

comnhecida como Análise de Variância de

dupla classificação.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

n-Way ANOVA ou MANOVA

Generaliza a ANOVA lidando com “n”

variáveis independentes. Note-se que o

número de interações cresce neste caso. Duas

variáveis independentes apresentam uma

única interação de primeira ordem (AB).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Três variáveis independentes

apresentam três interações de primeira

ordem (AB, AC, BC) e uma de segunda-

ordem (ABC), ou seja, quatro no total.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Quatro variáveis independentes

apresentam seis interações de primeira

ordem (AB, AC, AD, BC, BC, CD), três de

segunda-ordem (ABC, ACD, BCD) e uma

de terceira ordem (ABCD). Dez no total.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ã medida que o número de interações

aumenta, torna-se bastante difícil

interpretar o modelo.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

ijiij UY µ +=O Modelo:

Cada valor obsevado da variávelquantitativa dependente Yij é dado pelasoma da média (µi) da população de ondeeste valor foi retirado mais um erro aleatório(Uij).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

1) Os erros são variáveis aleatórias com média zero, isto é, E(Uij) = 0, para i = 1, 2, ..., k e j = 1, 2, ..., n;

2) Os erros são variáveis aleatórias independentes, isto é, E(Uij.Uhl) = 0, se i ≠h ej ≠ l;

SuposiSuposiççõesões::

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

3) Os erros apresentam variância constante, isto é, , para i = 1, 2, ..., k e j = 1, 2, ..., ni ;

4) Os termos erro Uij seguem uma normal.

σU 22ij )(E =

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

ResumindoResumindo::

Supõem-se que os valores Yij são valoresque resultam da adição de um valor médio µi

com um termo erro Uij que são variáveisaleatórias independentes com distribuição normal de média zero e variância constanteigual a σ2.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

MetodologiaMetodologia::

Fazendo µi = µ + αi, onde os αι são osefeitos dos tratamentos, o modelo fica:

ijiij UµY α ++=

Os αι, estão sujeitos a restrição Σniαi = 0.

Então de µi = µ + αi, segue que: µn ii

in1

µ ∑=

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Fazendo mi indicar as estimativas de µi

(i = 1, 2, ..., k). Tem-se que:

ijiij EY m +=

Onde Eij é o desvio da j-ésima observaçãoem relação a estimativa da média do tratamento i.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Dados os valores Yij com i = 1, 2, ..., k e j = 1,2, ..., ni, de acordo com o Método dos Mínimos Quadrados, as estimativas de mi sãoos valores que minimizam a soma dos quadrados dos desvios ou soma residual, dada por:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Derivando e igualando a zero, tem-se:

∑∑ −∑∑ ===k

jiij

2ij

ii)mY(ER.Q.SQ

0)1)((2Q n

jiij

mYm

=−−=∂∂

∑

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Segue, então:

Y=n

Y=m i

jij

n i∑Ou

∑=n

jiji i

Ymn

Isto é, o estimador de Mínimos Quadradospara a média do i-ésimo tratamento é a média aritmética das observaçoes deste tratamento.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Indicando por Ai o total do i-ésimotratamento, isto é, fazendo:

=Y=mi

iii

∑=

1jiji

Tem-se:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Elevando o binômio ao quadrado, segue:

∑ ∑ −∑ ∑ −= == =

==k

1jiij

2 ii)YY()mY(R.Q.S

As Somas dos As Somas dos QuadradosQuadrados

YnYYY 2i

1ii

1jiji

2ij

ii2R.Q.S ∑∑ ∑∑ ∑

== == =+−=

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Substituindo as expresssões anteriores e simplificando, tem-se:

∑∑ ∑== =

−=k

1i i

2ij n

iR.Q.S

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pela definição, tem-se:

∑ ∑ −= =

1jij

2i)YY(Total.Q.S

Onde:∑ ∑= =

1jij

Yn1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pode-se verificar, também:

nTotal.Q.S

2ij

i−= ∑∑

∑∑ ∑ ==k

jij AY

Onde:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pela definição, a soma de quadrados dos tratamentos é:

∑ −=k

2i )YY(n.Trat.Q.S

Lembrando que:

Ymi

iii == 0=∑α

1=iie

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Tem-se:n

.Trat.Q.SG

nA 2k

i i

2i −= ∑

Juntando os resultados, segue que:

S.Q.Res. = S.Q.Total - S.Q.Trat. ou

S.Q.Total = S.Q.Trat. + S.Q.Res.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Esta expressão mostra que a Soma dos Quadrados Totais é composta de duasparcelas: A Soma dos Quadrados dos Tratamentos (variação entre tratamentos) e a Soma dos Quadrados dos Resíduos (variaçõesdentro de tratamentos).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Considere-se os valores Yij

de três amostrassupostamenteindependentes:

ExemploExemplo::

1191487181655161413151711171212191309201510

Am. 1Am. 1Am. 1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Tem-se:

n1 = 5, n2 = 6 e n3 = 7 n = 18 e k = 3

A1 = 55, A2 = 87 e A3 = 119

14,5 Y e 17Y ; 5,14Y ;11Y 321 ====

50,160=n

G -Y=Total.Q.S

2ij

i∑∑

1055,378450,3889n

.Trat.Q.SG

nA 2k

i i

2i =−=−= ∑

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A soma dos resíduos vale:

50,5550,38893945

R.Q.Sk

1i i

2ij n

=−=

=−= ∑∑ ∑== =

S.Q.Total = S.Q.Trat. + S.Q.Res.Assim: 160,50 = 105 + 55,50

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Temos: eµY iij )(E =

Então:

EspectânciaEspectância dada Somas de Somas de QuadradosQuadrados

σµY 22i

2ij )(E +=

σµnY 22i

1ii

2ij nE

i+=

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛∑∑ ∑=

Como: ∑=

1jiji

De acordo com o modelo, tem-se:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Segue, então:

∑=

+=n

1jijiii

iµµnA

⎟⎟⎠

⎞⎜⎜⎝

⎛∑∑==

++=ni

1jij

1jijii

2i µµνnµnA

Mas:0E

1jij

iµ =⎟

⎟⎠

⎞⎜⎜⎝

⎛∑=

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Com l ≠ j, segue:

σnµµµ)µ( 2iil

lij

2ij

1j ij

2)(EE

ii=+∑= ∑

=∑=

Daí: σnµnA 2i

2i )(E +=

Como: ∑ ∑= ==

+∑=k

1jij

1iii

iµµnG

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Segue:

)µ(µµn)µn(Gk

1jij

1iii

22 ))(.(2

∑∑ ∑∑=

∑== ===

+∑+=

Mas: 0)(Ek

1jij

iµ =∑ ∑

= =

E com h ≠ i e/ou l ≠ k, segue

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Assim:

Portanto:

σµµµ)µ( 2k

1lhl

1jij

2ij

n i

1j ij

2n)(EE

i ii=+∑= ∑ ∑ ∑ ∑∑

= = = == =∑=

∑=

σ)µn(G(E 2k

1iii

22 n) += ∑

σ)µn(µn 2k

1iii

2ii )1n(

)Total.Q.S(E −+−∑= ∑==

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ou: σ 2)1n(W)Total.Q.S(E −+=

)µn(µnk

1iii

2ii n

1W ∑

==−∑=

Ou: ∑==

−k

1ii

2i )µµ(nW

A expressão mostra que W = 0, apenas se µ1 = µ2 = ... = µk = µ

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Para os tratamentos, tem-se:

σ)µn(µn

σ)µn(σµn(

1iii

2ii

1iii

2ii

)1k(n1

).)Trat.Q.S(E

−+−∑=

=−−+∑=

∑

σ2)1k(W.)Trat.Q.S(E −+=

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Soma dos Quadrados

(n - 1 )σ2(n - 1 )σ2Total

(n - k )σ2(n - k )σ2Resíduo

(k - 1)σ2W + (k - 1)σ2Tratamentos

Esp. da Soma (sob H0)

Espec. daSoma

CausaCausa dadaVariaVariaççãoão

nA 2k

i i

2i -∑

Y2k

i j

2ij

n i-∑ ∑

∑-∑ ∑k

1=i i

1=i 1=j

2ij n

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Consideremos a hipótese de nulidade:H0: µ1 = µ2 = … = µk

Isto é, consideremos a hipótese de que as médias das “k” populações sob análise sejamidênticas.

Sob esta hipótese, o valor W, definidoanteriormente é igual a zero. Então, tem-se:

Os Os QuadradosQuadrados MMéédiosdios

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E(S.Q.Total) = (n – 1)σ2 e ainda que;

E(S.Q.Trat.) = (k – 1)σ2

Pode-se mostrar que se, os µij são variáveis

aleatórias independentes com distribuição

normal de média “zero” e variância σ2 então:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

(S.Q.Res)/σ2 tem uma distribuição Qui-Quadrado com “n – k” graus de liberdade.

Além disso, pode-se demonstrar que sob H0: (S.Q.Trat.)/σ2 tem uma distribuição Qui-Quadrado com “k – 1” graus de liberdade e (S.Q.Total)/σ2 tem uma distribuição Qui-Quadrado com “n – 1” graus de liberdade e as três distribuições são independentes entre si.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por definição o QuadradoQuadrado MMéédiodio é o quociente entre a Soma dos Soma dos QuadradosQuadrados pelorespectivo “NNúúmeromero de de GrausGraus de de LiberdadeLiberdade”. Desta forma, o Quadrado Médio dos Tratamentos é:

Q.M.Trat = (S.Q.Trat.)/(k – 1)Q.M.Res. = (S.Q.Res.)/(n – k)

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Substituindo alguns resultadosanteriores, tem-se:

E(Q.M.Trat.)= σ2 + W/(k – 1) e

E(Q.M.Res.) = σ2

A tabela, seguinte, resume alguns

resultados.

1010

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Soma dos Quadrados

(S. Q.)

n – 1

n – k

k - 1

Grau de Liberdade

(G.L.)

Total

σ2σ2Resíduos

σ2Tratamentos

Esp. daSoma (sob

H0)

Espec. Do Quadrado

Médio

CausaCausa dadaVariaVariaççãoão

nA 2k

i i

2i -∑

Y2k

i j

2ij

n i-∑ ∑

∑-∑ ∑k

1=i i

1=i 1=j

2ij n

σ+1-k

W 2

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

SQTotal

SQRes.

SQTrat.

Soma dos Quadrados

n – 1

n – k

k - 1

Grau de Liberdade

Total

MQResResíduos

MQTrat.

MQRes

MQTrat.Tratamentos

FQuadradoMédio

Causa daVariação

A A TabelaTabela dada ANOVAANOVA

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pode-se demonstrar que se X1 e X2 sãovariáveis aleatórias independentes com distribuições Qui-Quadrado de g1 e g2 graus de liberdade, respectivamente, então a variávelresultante do quociente: (X1/g1)/(X2/g2) apresenta uma distribuição F com g1 e g2

graus de liberdade. Anota-se F(g1 ; g2).

O O TesteTeste FF

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Uma variável aleatória X tem uma distribuição “F” ou de Snedecor se sua fdp for do tipo:

( )

0 x se 0

0 > x se )

(Γ)2m

(Γ

mx+nxnm)2

n+m(Γ

=)x(f2

n+m12m

≤

A DistribuiA Distribuiçção F (de Snedecor)ão F (de Snedecor)

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Expectância e VariânciaExpectância e Variância

2- mm

=XE )(

)4 - )(n2 - m(nm- )2 - n+(m2

= Var(X)2

m é o grau de liberdade do numerador e ndo denominador

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

0,0

0,2

0,4

0,6

0,8

1,0

0 1 2 3 4 5 6 7 8

fdp deF(1, 3)F(2, 5)

F(5, 10)F(20, 20)

DiagramasDiagramas

1111

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O que é tabelado é a área à direita de cada curva (fun(funçção direta),ão direta), isto é, dado um certo

valor de “f”, tem-se: P[F(m, n) ≥ f] = α, ou

dado uma área à direita α pode-se determinar o

valor “f” que satisfaça P[F(m, n) ≥ f] = α((funfunçção inversaão inversa).).

PlanilhaPlanilha

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

(a) Dada uma distribuição F com

parâmetros g.l. do numerador = 3 e g.l.

do denominador igual a 5, determinar

P(F ≥ 2,5)

(b) O valor de “f” tal que P(F ≤ f) = 80%.

ExemploExemplo

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Então P(F ≥ 2,5) = 17,39%

Item (a)Item (a)

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Então, o valor de “f” tal que, P(F ≤ f) = 80% é f = 2,25.

Item (b)Item (b)

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Com base em um teste preliminar um grupode alunos foi classificado de acordo com o desempenho em: Ótimo, Bom, Regular e Fraco. Para verificar se este teste era útil como previsorda média final dos alunos, amostras de cadagrupo foram selecionadas. Teste se existediferença entre as médias dos grupos ao nível de 1% de significância.

ExercExercííciocio

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

6,56,88,07,87,67,37,0

Regular

6,57,48,86,58,38,07,27,78,57,06,89,06,87,59,4

FracoBom Ótimo

DadosDados

1212

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

IntervalosIntervalos de de confianconfianççaa

Um intervalo de confiança de (1 – α) para a média do i-ésimo tratamento µi é dado por:

nMQR

tYn

MQRtY

esknii

eskni −− +≤≤− µ

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Um intervalo de confiança de (1 – α) para a diferença nas médias de doistratamentos µi - µj também pode ser determinado.

O estimador de µi - µj é e a variância desse estimador é:

Y-Y ji

)n1

+n1

(σ=nσ+

nσ=)Y-Y(V

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Utilizando MQRes para estimar σ2

então o intervalo de confiança para a diferença entre as médias de dois tratamentosserá:

MQR+

MQRt+YYµµ

MQR+

MQRtYY

esknjiji

esknji -- -≤-≤--

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A rejeição da hipótese nula na ANOVA

indica que existe uma diferença significativa

entre as médias populacionais. No entanto,

com grandes amostras, estas diferenças podem

ter pouca significância prática.

UmaUma MedidaMedida de de AssociaAssociaççãoão

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Uma medida da força da associação entre

a variável independente e a variável

dependente na ANOVA é w2 (ômega dois).

Este coeficiente indica a proporção da

variância da variável dependente que é

explicada pelos níveis da variável

independente.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Esta medida é análoga ao coeficiente de

determinação (r2) na regressão. A expressão

para o cálculo do w2 é dada por:

MQR+SQTMQR)1 -k( -SQT

=w.esotal

.es.rat2

1313

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Quando rejeitamos a hipótese nula em

uma ANOVA, estamos admitindo que as

médias não são todas iguais.

A estatística F, no entanto, não fornece

orientações sobre qual é (ou quais são) a média

(tratamento) responsável pela diferença.

ComparaComparaççõesões MMúúltiplasltiplas

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

As comparações múltiplas também são

conhecidas como Análise Post Hoc. A vantagem

do uso deste tipo de comparação ao invés de

vários testes t é que ela mantém a probabilidade

de erro do tipo I a mesma taxa α, mesmo fazendo várias comparações entre as médias.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por exemplo se tivermos cinco grupos

(tratamentos) para serem comparados, teremos

10 comparações diferentes de médias para

serem feitas. Algumas são: média 1 com média

2, média 1 com média 4, etc.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A probabilidade de Erro do Tipo I, neste

caso, será dada por:

αf = 1 – (1 – α)c, onde:α = probabilidade de erro I em cada

comparação;

c = número de comparações.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Assim se tivermos cinco grupos e dez

comparações o nível de significância final ,

considerando cada teste com 5% de

significância, será de:

αf = 1 – (1 – α)c = 1 – (1 – 0,05)10 = = 40,13%

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O método de Tukey é também denominado

de Teste DHS (Diferenças Honestamente

Significativas – Honestly Significant

Difference). Ele foi projetado para manter a

taxa de Erro do Tipo I a um nível de

significância α.

O O mméétodotodo de Tukeyde Tukey

1414

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A hipótese nula para cada para sendo

comparado é:

H0: µi = µj para i ≠ j,Isto é, cada par das médias populacionais

são iguais. A estatística teste Q é definida

por:

EMQ/n

X–X=Q

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A distribuição Q é denominada de

Distribuição da Amplitude Estudentizada

(Studentized Range Distribuition).

Suponha que se tenha n observações

independentes y1, ..., yr retiradas de uma

distribuição normal com média µ e desvio σ.

A A distribuidistribuiççãoão QQ

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Seja w a amplitude desta amostra, isto é,

w = máx(y1, ..., yr) - mín(y1, ..., yr) .

Suponha agora que nós temos uma

estimativa s2 da variância σ2, que é baseada

em “ν” graus de liberdade e independente de yi.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A amplitude estudentizada é definida por:

Qr,ν = w/s

Esta distribuição já foi tabelada e aparece

em vários livros de Estatística. É possível

consultar seus valores on-line pela Internet.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por exemplo seja r = 5 e ν = 10.

O percentil 95% da distribuição será:

Q0,95(10, 5) = 4,65.

Isso significa que:

P(w/s ≤ 4,65) = 95%

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A distribuição Q foi desenvolvida para

determinar a diferença mínima entre a maior e

a menor média em um conjunto de k médias

que é necessário para rejeitar a hipótese que as

médias correspondentes na população são

iguais.

1515

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

No desenvolvimento da distribuição Q o número de grupos variou, mas o número de observações em cada um dos grupos k é o mesmo. Isto e ni = n é o mesmo para os k grupos. Os valores críticos são dependentes do número de grupos comparados k e o glassociado com a estimativa da variância da população EQM, isto é, Q(n-k, k).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Esta expressão é válida quando a

ANOVA é balanceada, isto é, todos os grupos

apresentam o mesmo tamanho.

Quando os grupos diferem uma versão

modificada é utilizada. Neste caso o teste é

denominado de método de Tukey-Kramer

(TK).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A expressão para o cálculo da estatística

de TK é dada por:

n/1+n1/EMQ(

X–X=Q

A distribuição amostral é Q e é dada em

função (para 5% e 1%) do grau de liberdade

(gl) e de k = número de tratamentos.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Suponha que um método de produção

possa ser executado de 4 formas diferentes:

A, B, C e D. A tabela da ANOVA é dada

(próxima lâmina). Como o valor F(3, 29) é

2,93 e o Fc = 10,47 é significativo, determinar

através do método de TK quais diferenças de

médias são significativas.

ExemploExemplo::

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

TabelaTabela dada AnovaAnova

491,3432Total8,13235,8929Resíduo

2,9310,4785,15255,453Trat.F0,05FMQSQGLCausa

Resumo da ANOVA10797ni

16,8017,2923,0021,86DCBAGrupo

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O valor da estatística Q para o método

TK é encontrado através de tabelas. Neste

caso, r = 4 e v = 29 o valor para uma

significância de 5% é 3,86.

Assim µ1 é diferente de µ3 e µ4.

E µ2 é diferente de µ3 e µ4.

1616

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

12,1-=)

21/9+1/78,13(

23,00-21,86Q 2-1

*09,-5=)

21/10+1/78,13(

16,80-21,86Q 4-1

*69,6-=)

21/10+1/98,13(

16,80-23,00Q 4-2*24,4-=

1/7+1/78,13(

17,29-21,86Q 3-1

*49,0-=)

21/10+1/78,13(

16,80-17,29Q 4-3

*62,5-=)

21/7+1/98,13(

17,29-23,00Q 3-2

Cálculos do valor Q utilizando o método TK

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ao testar a hipótese H0 para amostras

independentes pode ser utilizado tanto o teste

t quanto a Análise de Variância. Os dois

procedimentos são equivalentes. A estatística

teste t para um grau de liberdade de n –k = n -

2, mantém a seguinte relação: t2 = F e

Relação entre a ANOVA e o teste t

F=t c2c

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O delineamento de medidas repetidas

envolve medir um mesmo sujeito duas ou mais

vezes na variável dependente.

Em virtude desta dependência as

variações precisam ser ajustadas de modo que

o valor F adequado seja calculado.

ANOVA: medidas repetidas

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A soma total dos valores SQT é

particionada em em três componentes: (1) a

variação entre sujeitos - SQI (2) a variação

entre duas ocasiões sucessivas – SQT e (3) a

variação restante que é denominada de

residual – SQR.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Os quadrados médios são calculados da

mesma forma que a anterior, isto é, pela divisão

da Soma dos Quadrados pelo número de graus

de liberdade adequado.

O erro quadrado médio da variação residual

(QMR = SQR/glR) é utilizado para testar o

efeito entre as repetições do tratamento.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Este é o efeito de maior interesse

(principal).

Se quisermos testar a diferença entre os

sujeitos é só fazer; MQI/MQR.

A tabela para a ANOVA de medidas

repetidas fica então:

1717

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

MQI/MQRMQISQIk - 1Sujeitos

MQT/MQRMQTSQOl – 1Ocasiões

MQRSQR(k-1)(l-1)Resíduo

SQT

Soma dos Quadrados

n – 1

Grau de Liberdade

Total

FQuadradoMédio

Causa daVariação

ANOVA de medidas repetidas

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

1. As amostras são aleatórias;2. A variável dependente é normalmente

distribuída;3. As variâncias das repetições são

homogêneas;4. Os coeficientes de correlação entre os pares

de repetições são iguais.

Hipóteses da ANOVA MR:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Um teste foi aplicado a um conjunto de

10 pessoas em três ocasiões diferentes. A

variável dependente é o desempenho nos testes

nas diferentes ocasiões. O interesse é verificar

se existe diferença entre os testes.

Exemplo:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

1586G20157F1061E

101211

108

1412

Teste 2

166J138I189H

123D154C169B186A

Teste3Teste 1SujeitoDadosDados

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Solução:

=SQ2k

1=i

T -∑

kB=SQ

1=i

I -∑

Y=SQT2k

1=i

1=j

2ij -∑ ∑

SQR = SQT - SQI - SQO

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

k = número de repetições (tratamentos)

l = número de pessoas em cada repetição (casos)

n = total de dados ⇒ n = k.lAi = soma de cada repetição (tratamentos)

Bi = soma dos resultados do i-ésimo caso (linhas)

G = soma de todos os valores = ΣAi = ΣBi

1818

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

27,423=33,341360,3836=n

GlA

=SQ2k

1=i

T --∑

--∑ 33,167=333,34136667,3580=n

GkB

=SS2l

1=i

67,640=33,34134054=n

GY=SQT

1=i

1=j

2ij --∑ ∑

SQR = SQT - SQI – SQO = 50,07

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

6,6818,59167,3310 – 1 = 9Sujeitos

76,09211,64423,273 – 1 = 2Testes

2,7850,07(3-1)(10-1) = 2.9 = 18

Resíduo

640,67

Soma dos Quadrados

30 – 1 = 29

Grau de Liberdade

Total

FQuadradoMédio

Causa daVariação

Resumo:

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

1. Existe diferença entre sujeitos pois a significância do F = 6,68 encontrado ép = 0,03%

2. Existe diferença entre as repetições (tratamentos) pois a significância do valor F = 76,09 encontrado é p = 0,00%

Conclusão:

Top Related

Artigo de Teoria das Organizações - pucsp.br · 6 Componentes principais Loading Plot, Principal Component Analysis, Scree plot, One-way ANOVA Análise de Conglomerados Loading

PREFEITURA MUNICIPAL DE SÃO BRÁS DO SUAÇUÍ · 16 Caixas Line Array Médio Grave/Médio Agudo Two Way 900 Watts Com Guia De Ondas, ... 01 Mesa De Mixagem ... 01 Amplificador Para

Importância e utilidade da informação financeira e ... · Utilização de testes de hipóteses paramétricos (t-Student, one-way ANOVA) e não paramétricos (Mann-Whitney, Kruskal-Wallis).

A Empresa: Desde 1997, A Wireless MDL do Brasil Ltda. WMDL, Empresa brasileira de soluções sem fio, com sólida tradição em Rádio Comunicação Two-Way HF,

ALTERAÇÕES PNEUMOFUNCIONAIS INERENTES A … · ANOVA one way, post hoc Teste T (LSD). ... Figura 1: Fluxograma da coleta de dados. 89 participantes Grupo Doença de Parkinson (GDP)

gafisa way

nupaf.ufsc.br · 2011. 5. 9. · descritiva, análise de variância (ANOVA one- way), teste Tukey, correlação de Pearson e análise de regressão simples e múltipla. Para todas

Anova Aula