INE7002 - Testes de hipóteses: diferença entre 2 médias...

Post on 25-Sep-2020

1 views 0 download

Transcript of INE7002 - Testes de hipóteses: diferença entre 2 médias...

Inferência Estatística

Testes de Hipóteses: testes de diferença entre 2 médias, conceitos, grupos pareados, grupos independentes com variâncias conhecidas e

desconhecidas

1

Introdução

Considere o problema de comparar 2 materiais

(A e B), para sola de tênis, pelo grau de

desgaste após um período de uso. Seguem dois

projetos de experimentos alternativos:

2

Introdução

Projeto I – Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B.

Projeto II – Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio 3

Amostras independentes – Projeto I

Material B Material A divisão aleatória

Mensuração do grau de desgaste Mensuração do grau de desgaste

4

Amostras pareadas – Projeto II

Mensuração do grau de desgaste

B A B A A B B A A B

alocação aleatória de A e B em cada par

5

Amostras pareadas

Importância de considerar os pares na análise:

criança

1 2 3 4 5 ...

desgaste

material A

material B

desgaste

6

Teste de Diferença entre 2 médias populacionais

Duas populações, com variáveis quantitativas observáveis.

Médias dos valores de uma variável quantitativa nas 2 populações (1 e 2).

H0: μ1 - μ2 = d0

H1: μ1 - μ2 > d0 μ1 - μ2 < d0 μ1 - μ2 ≠ d0

Teste t.

7

Teste t

8

William Sealy Gossett

Desenvolveu o teste t para

comparar pequenas amostras

na produção de cerveja stout.

9

SIM

NÃO SIM

NÃO SIM

NÃO

Duas

amostrasRelacionadas?

Teste t para 2

amostras

pareadas

Avaliar variâncias

populacionaisConhecidas?

Teste Z para 2

amostras

independentes

Teste F de

diferença entre 2

variâncias

Usar Z como

variável de teste

Variância

semelhantes?

Teste t para 2

amostras

independentes

Teste t para 2

amostras

independentes

Variável de

interesse

quantitativa:

distribuição

normal em

ambas as

populações Usar t com

n1+n2 -2

graus de

liberdade

Usar t com

graus de

liberdade

Teste de Diferença entre 2 médias populacionais: grupos relacionados

Variável normal em ambas as populações.

Populações relacionadas (tamanhos de amostra têm que ser iguais).

Muito comum em situações do tipo antes-depois => PAREAMENTO.

10

Teste de Diferença entre 2 médias populacionais: grupos pareados

H0: μantes - μdepois = d0 => μD = d0

H1: μD > d0 μD < d0 μD ≠ d0

Distribuição da variável nas situações antes e depois: normal

Distribuição amostral da diferença média: t com n- 1 graus de liberdade.

n é o número de pares.

11

Teste de Diferença entre 2 médias populacionais: grupos pareados

12

ns

ddt

D

n/

01

Se H1: D > d0 => Rejeitar H0 se valor-p = P(tn-1 > tn-1,calculado)

Se H1: D < d0 => Rejeitar H0 se P(tn-1 < tn-1,calculado)

Se H1: D ≠ d0 => Rejeitar H0 se 2 × P(tn-1 > |tn-1,calculado|)

Exemplo 1

O gerente de uma loja de carros está testando duas marcas (1 e 2) de pneus radiais. Coloca ao acaso um pneu de cada marca nas duas rodas traseiras de 8 carros e anda com os carros até que os pneus se desgastem, sendo registrada a quilometragem. Para 1% de significância há evidência de diferença entre as vidas médias dos pneus?

13

Exemplo 1

Pareamento: duas marcas no mesmo carro.

H0: μ1 – μ2 = d0 => μD = d0

H1: μD ≠ d0

d0 = 0

H0: μ1 – μ2 = 0 => μD = 0

H1: μD ≠ 0

14

Exemplo 1

15

Carro Marca 1 Marca 2 Diferença

1 36925 34318 2607

2 45300 42280 3020

3 36240 35500 740

4 32100 31950 150

5 37210 38015 -805

6 48360 47800 560

7 38200 37810 390

8 33500 33215 285

375,868d

033,1290ds

Exemplo 1

16

904,18/033,1290

0375,868

/818

01

tt

ns

dt

D

n

Valor-p = 2 × P(t8 > |1,904|) = 2 × 0,049 = 0,098

Valor-p > 0,01 => Rejeitar H0 => Não há evidência de diferença

Teste de Diferença entre 2 médias populacionais: grupos independentes,

variâncias conhecidas

Variável normal em ambas as populações.

Populações independentes (tamanhos de amostra podem ser diferentes).

Variâncias populacionais da variável nas duas populações sejam conhecidas.

17

Teste de Diferença entre 2 médias populacionais: grupos independentes,

variâncias conhecidas H0: µ1 - µ2 = d0

H1: µ1 - µ2 > d0 H1: µ1 - µ2 < d0 H1: µ1 - µ2 ≠ d0

Estatística de teste: z.

Distribuição da estatística de teste: normal

18

D

dxxZ

021

2

2

2

1

2

1D

nn

Teste de Diferença entre 2 médias populacionais: grupos independentes,

variâncias desconhecidas

Variável normal em ambas as populações.

Populações sejam independentes (tamanhos de amostra podem ser diferentes).

E, as variâncias populacionais da variável nas duas populações são DESCONHECIDAS.

19

Teste de Diferença entre 2 médias populacionais: grupos independentes,

variâncias desconhecidas Estatística de teste t com gl:

Variâncias populacionais semelhantes, n1+n2 -2.

Variâncias populacionais diferentes, .

Como descobrir se são semelhantes?

Teste F de diferença entre 2 variâncias.

20

Teste F de diferença entre variâncias

21

• H0: σ12 = σ2

2 H1: σ12 σ2

2

• Estatística de teste F.

2

2

2

11,1 21 s

sF nn

Distribuição F de Fisher com n1-1 e n2-1 graus de liberdade

Rejeitar H0 se: Fn-1,n2-1 < Fn-1,n2-1;α/2 OU Fn-1,n2-1 > Fn-1,n2-1;1-α/2

22

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4

f(x)

Estatística F

Distribuição F de Fisher (dois exemplos)

F com 14,14 graus de liberdade F com 6,7 graus de liberdade

23

Fn-1,n2-1;α/2

α/2

Fn-1,n2-1;1-α/2

α/2

24

Teste de Diferença entre 2 médias populacionais: grupos independentes,

variâncias desconhecidas e semelhantes

• Estatística de teste: t.

• Distribuição da estatística de teste: t com n1 + n2 – 2

graus de liberdade.

d

_

2

_

12nn

s

xxt

21

2nn

n

1

n

1s)1n(s)1n(

s21

21

2

22

2

11

d

25

Teste de Diferença entre 2 médias populacionais: grupos independentes, variâncias desconhecidas e diferentes

d

_

2

_

1

s

xxt

2

2

2

1

2

1d

n

s

n

ss

1n

n/s

1n

n/s

n/sn/s

2

2

2

2

2

1

2

1

2

1

2

2

2

21

2

1

• Estatística de teste: t.

• Distribuição da estatística de teste: t com graus de

liberdade.

Exemplo 2

A Jabyl Circuits está avaliando o tempo de montagem de um novo modelo de circuito em 2 de suas unidades. Suspeita-se que o desempenho da fábrica 1 seja pior do que o da fábrica 2 (aquela seria mais lenta). Supõe-se que as distribuições dos tempos podem ser consideradas normais. Foram coletadas duas amostras de tempos de montagem: 8 na fábrica 1, resultando em média de 3,52 minutos, variância de 1,5 minutos2 e 10 na fábrica 2, resultando em média de 1,85 minutos e variância de 1,7 minutos2. A suspeita é procedente a 5% de significância?

26

Exemplo 2

H0: μ1 - µ2 = 0

H1: μ1 - µ2 > 0

Nível de significância: = 0,05; 1- = 0,95

Grupos independentes, variâncias populacionais desconhecidas: aplicar teste F de diferença entre variâncias.

27

Exemplo 2

H0: σ2

1 = σ22 (admite-se que não haja diferença)

H1: σ2

1 ≠ σ22

Nível de significância: = 0,05; 1- = 0,95

s21 = 1,5 min2 n1=8 s2

2 = 1,7 min2 n2=10

28

882,07,1

5,19,71,1 2

2

21

21 FF

s

s

nn

29

F7,9;0,925 = 4,2

F7,9;0,025 = 0,21

F7,9 = 0,882

Aceitar H0: 12 2

2

Exemplo 2

As variâncias populacionais podem ser consideradas semelhantes.

A variável t terá n1 + n2 – 2 graus de liberdade.

tn1+n2-2 = t8+10-2 = t16.

30

6023,0

2108

10

1

8

17,1)110(5,1)18(

2nn

n

1

n

1s)1n(s)1n(

s21

21

2

22

2

11

d

Exemplo 2

31

Valor-p = P(t16 > 2,772) = 0,0068

Como valor-p = 0,0068 < α = 0,05

REJEITAR H0 a 5% de Significância (há 5% de chance de erro)

Assim, concluímos com 95% de confiança (ou chance de erro de 5%) que a suspeita é procedente.

772,26023,0

85,152,3 =>

016

2116

t

s

xxt

d

32

α = 0,05

Valor - p = 0,0068

tcalculado = 2,772 tcrítico = 1,746

Exemplo 2

E se as variâncias fossem diferentes...

A variável t teria graus de liberdade.

33

13

18

8/5,3

110

10/6,0

8/5,310/6,0

1n

n/s

1n

n/s

n/sn/s22

2

2

2

2

2

2

1

2

1

2

1

2

2

2

21

2

1

6519,010

5,3

8

6,0

2

2

2

1

2

1 dd sn

s

n

ss

Exemplo 2

34

562,26519,0

85,152,3 =>

013

2113

t

s

xxt

d

Valor-p = P(t16 > 2,562) = 0,0118

Como valor-p = 0,0118 < α = 0,05

REJEITAR H0 a 5% de Significância (há 5% de chance de erro)

Assim, concluímos com 95% de confiança (ou chance de erro de 5%) que a suspeita é procedente.