Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e...

25
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 1 2 e 2 2 . Retire uma amostra aleatória de tamanho n 1 da primeira população, tendo uma variância s 1 2 , e outra amostra aleatória de tamanho n 2 da segunda população com variância s 2 2 . A estatística indica a relação entre as razões das variâncias amostral e da população. Supondo que as variâncias amostrais sejam oriundas de amostras aleatórias independentes e com as mesmas variâncias populacionais, então: F=s 1 2 /s 2 2 . A distribuição teórica que modela essa razão denomina- se Distribuição F ) / /( ) / ( 2 2 2 2 2 1 2 1 s s

Transcript of Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e...

Distribuição FConsidere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 1

2 e 22 .

Retire uma amostra aleatória de tamanho n1 da primeira população, tendo uma variância s1

2, e outra amostra aleatória de tamanho n2 da segunda população com variância s2

2 .

A estatística indica a relação entre as razões das variâncias amostral e da população.

Supondo que as variâncias amostrais sejam oriundas de amostras aleatórias independentes e com as mesmas variâncias populacionais, então: F=s1

2 /s22.

A distribuição teórica que modela essa razão denomina-se Distribuição F

)//()/( 22

22

21

21 ss

Teste igualdade de variâncias

Altura média de um país é de 1,68 m com variância 0,30m2. Em uma amostra de 31 pessoas de uma determinada região do país a variância foi 0,25m2 .

EXCELNo Menu Ferramentas, a opção Análise de Dados leva ao Teste F:duas amostras para variâncias, que realiza o teste de igualdade de variâncias.

Teste igualdade de variâncias

H0: 2 = 2

0

Ha: 2 2

0 (ou 2 > 20 ou 2 < 2

0 )

Para testar a hipótese H0, obtemos uma

amostra de tamanho n da população e

consideramos a quantidade:

2

2S)1n(

Teste igualdade de variâncias

S2 = variância amostral

se população da qual a amostra foi retirada se comporta de acordo com o modelo normal, então, sob a hipotese H0 temos que:

H0: 2 = 0,30

Ha: 2 < 0,30

21n2

2~

S)1n(

Utilizando-se a tabela 2 com 30 graus de liberdade e =0,05

crit= 18,49

logo obs > crit, portanto não rejeitamos H0

00,2530,0

25,0x30obs

Exercício - Teste F

X= medida do diâmetro de esferas por método antigo

Y= medida do diâmetro de esferas por método novo

xobs= 29,93 mm s2Xobs = 0,03 mm2 n1=15

yobs= 29,89 mm s2Yobs = 0,19 mm2 n2=15

Construir teste de hipótese

H0: 2X = 2

Y X ~ N(X, 2X)

Ha: 2X 2

Y Y ~ N(Y, 2Y)

Utilizaremos a quantidade:

F = S2X / S2

Y

Exercício - Teste F

Para a distribuição de Fisher-Snedecor utilizamos a notação F (a, b) sendo que a = n1-1 e b = n2-1 (portanto a e b são os graus de liberdade)

P (F > fc)

Exercício - Teste F

A região crítica para o teste bilateral é dada por:

RC= : < 1 ou > 2

Portanto se obs RC, rejeitamos a hipótese de

igualdade de variâncias

P (F < 1 ou F > 2 ) =

F F (n1-1; n2-1)

H0: 2X = 2

Y H0: 2X/2

Y =1

Ha: 2X 2

Y Ha: 2X/2

Y 1

F= S2X/S2

Y F (14; 14)

Exercício - Teste FDeterminamos a região crítica do teste, de modo que,

P(F < 1)=0,05 e P(F >2)=0,05

P (F >1) = 1 - P (F 1) = 0,95

Essas quantidades estão representadas nas figuras:

0,95 0,05

1 2

Exercício - Teste F

Da tabela a distribuição de Fisher-Snedecor com 14 GL para o numerador e 14 GL para o denominador temos: 1 = 0,403 e 2 = 2,484

Logo: RC= + : < 0,403 ou > 2,484

obs= S2X/S2

Y = 0,03/0,19 = 0,158 RC

Portanto, confirmando as evidências fornecidas pela análise descritiva, concluímos, ao nível de =10% que existem diferenças em termos de homogeniedades dos diâmetros das esferas, dependendo do método utilizado

Exercício - Teste F

Para panetones de 500 g, suspeita-se que o

produto de segunda qualidade apresenta maior

variabilidade que o de primeira, quanto ao peso.

X= peso de panetones de primeira qualidade

Y= peso de panetones de segunda qualidade

s2Xobs = 0,29 n1=26

s2Yobs = 0,73 n2=20

H0: 2X = 2

Y versus Ha: 2X < 2

Y

Exercício - Teste F

Para determinar a região crítica e quantidade de F

corretamente:

H0: 2X /2

Y=1 versus Ha: 2X / 2

Y <1 F = S2X /S2

Y

A região crítica será da forma:

RC= : < c

F~F(25, 19) para = 0,05 c=0,495

obs= S2X /S2

Y=0,29/0,73=0,356 RC, portanto,

concluímos que os panetones de segunda qualidade

apresentam pesos com maior variabilidade do que os de

primeira qualidade

Intervalo de Confiança para a Diferença de MédiasConsiderando iguais as variâncias das populações

A variável aleatória X1 é modelada por uma distribuição de Gauss com média 1 e variância 1

2, isto é, X1~N(1, 12) e a

variável X2, também é de Gauss, isto é, X2~N(2, 22)

O intervalo de 100(1-)% de confiança para a diferença (1 - 2 ) entre as médias das duas populações é dado por:

Com a variância comum, ponderada, dada por:

212,2/2121

212,2/21

11)(

112121 nn

stXXnn

stXX pnnpnn

2

)1()1(

21

222

2112

nn

snsns p

Distribuição Qui-quadrado

Considere uma população de tamanho n que tem uma distribuição de Gauss com média 0 e variância 1, ou seja,

z12, z2

2, ..., zn2.

A distribuição qui-quadrado(2) é definida como a soma

dos quadrados dos n valores de zi:

2=z12 + z2

2 + z32 + ... + zn

2

• Se continuarmos a retirar as amostras da mesma população, cada uma das n quantidades terá uma distribuição de probabilidade 2 que poderá ser representado por um histograma.

• Com o número de amostras(n) grande, tem-se a distribuição do qui-quadrado com n-1 graus de liberdade.

Distribuição Qui-quadrado

f(x)

região crítica

2

Análise de Variância

Considere um número qualquer de amostras amostras a>2, definidas por uma variável qualitativa (fator, por exemplo sexo, tratamento, etc.). A análise de variância faz a comparação entre as correspondentes médias de cada nível do fator.

É possível o cálculo:

• da variância total;

• da variância entre as amostras; e

• da variância dentro das amostras.

Análise de Variância

A variância total (sT2), é aquela que se obtém quando as a

amostras são reunidas de modo a constituir uma única amostra, composta de todos os seus elementos.

Consideremos a situação em que todas as a amostras têm o mesmo tamanho n, pode-se dizer a reunião de todas a amostras fornece an=N elementos

a

x

N

x

an

xa

1

N

1

a

1

n

1X

Análise de Variância

A soma de quadrados em relação as amostras reunidas(soma de quadrados total):

e considerando que esta soma de quadrados tem an-1 ou N-1 graus de liberdade, então tem-se também que a variância total é:

a

1

n

1

N

1

22T XxXxSQ

1N

Xx

1an

Xx2T

N

1

2a

1

n

1

2

s

Análise de Variância

A variância entre as amostras, ou simplesmente, a variância entre, que pode ser simbolizada por s2

E, mede a variação existente entre todas as a amostras. Consideremos as a médias fornecidas pelas amostras.

Soma de quadrados entre: Variância entre ou

Quadrado médio entre:

x

a

1

2E XxnSQ

1a

Xxn2E

a

1

2

s

Análise de Variância

A variância dentro das amostras, ou simplesmente, variância dentro pode ser simbolizada por s2

D, mede a variação dentro dentro das a amostras tomadas do em conjunto.

Soma de quadrados dentro: Variância dentro ou

Quadrado médio dentro:

a

1

n

1

2D xxSQ

aN

xx

)1n(a

xx2D

a

1

n

1

2a

1

n

1

2

s

Análise de Variância

Temos todos os elementos para testar a hipótese nula de que as a amostras representam a mesma população, contra a hipótese alternativa de que isto não é verdadeiro.

Ho:as a médias não diferem significativamente entre si

ou seja, as médias das a amostras estimam a mesma média .

Ha:as médias das a amostras não estimam a mesma média , porque elas diferem significativamente entre si.

x

Análise de Variância

De acordo com a fórmula geral da variância entre, tem-se que seu valor será tanto menor quanto mais semelhantes forem as médias amostrais , ocorrendo o inverso, quando as médias diferirem muito entre si.

A fórmula geral da variância dentro indica que seu valor não é afetado pela variação existente entre as diferentes médias amostrais.

A razão entre as variâncias entre e dentro, é o valor de F calculado por:

x

D

E2D

2E

QMQM

Fous

sF

Análise de Variância

O valor de F calculado, será tanto maior quanto forem as diferenças entre as médias das amostras analisadas.

Se F calculado for inferior ao F crítico ao nível de significância estabelecido, não rejeitamos Ho, ou seja, as médias das amostras não diferem significativamente.

Se F calculado for superior ao F crítico ao nível de significância estabelecido, rejeitamos Ho, ou seja, as médias das amostras diferem significativamente.

Análise de Variância

Fontes de Variação GL SQ QM F

--------------------------------------------------------------------------

entre tratamentos t -1 SQE E(QME) E(QME)

dentro tratamento N -t SQD E(QMD) E(QMD)

--------------------------------------------------------------------------

Total N - 1 SQT

E(QME)=E(QMtrat)=2res+ t2

trat E(QMD)=E(QMres)= 2res

2res

2trat

2res

res

trat t)QM(E)QM(E

F

Análise de Variância

t

1i

t

1i

r

1j

t

1i

2i

2ij

r

1j

2iijres yry)yy(SQ

t

1i

t

1i

22i

2itrat ytyr)yy(rSQ

t

1i

r

1j

22ij

t

1i

r

1j

2ijtotal yrtyyySQ