Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c)...

Post on 13-Oct-2020

2 views 0 download

Transcript of Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c)...

Teste de hipóteseTeste de hipótese

1

a) a) UmaUma populaçãopopulação

b) b) DuasDuas populaçõespopulações

c) c) Três ou maisTrês ou mais populaçõespopulações

Teste Teste para comparação de para comparação de duasduas médiasmédias dededuasduas médiasmédias dede

populaçõespopulações normaisnormais

2

H0: 1 = 2

H1: 1 2

H0: 1 = 2

H : >

H0: 1 – 2 = 0H1: 1 – 2 0

H0: 1 – 2 = 0H : – > 0

t

Teste bilateral

Teste unilateral à direita

3

H1: 1 > 2

H0: 1 = 2

H1: 1 < 2

H1: 1 – 2 > 0

H0: 1 – 2 = 0H1: 1 – 2 < 0

t0

t0

Teste unilateral à esquerda

Comparar as médias de duas populações Comparar as médias de duas populações

a) dependentes

Duas

1º passo:As variáveis estão ou não relacionadas?

2º passo:As variâncias populacionais

são conhecidas?

3º passo:As variâncias populacionais

são iguais?

Var desconhecida

b) independentes

Var conhecidaDuas

populações

b2) variâncias diferentes

b1) variâncias iguais

4

a) Populações a) Populações dependentesdependentes

observações pareadasobservações pareadas(Teste (Teste tt--pareadopareado))

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

(Teste (Teste tt--pareadopareado))

São comparadas duas médias populacionais sendo que, para cada unidade amostral, realizou-se duas medições da

característica de interesse.

Correspondem a medidas tomadas antes e após uma dada intervenção.

5

Uma distribuidora de combustíveis deseja verificar se um novo tipo de gasolina é eficaz na revitalização de motores velhos. Selecionou-se 12 automóveis de um

mesmo modelo com mais de 8 anos de uso e, após regulagem dos motores, verifica-se a quilometragem média percorrida com 1 litro de combustível (X). Em seguida, o carro é abastecido com o novo tipo de combustível durante 15

semanas e uma nova aferição é feita (Y).

Automóveis

ExemploExemplo

6

Km/L 1 2 3 4 5 6 7 8 9 10 11 12

Antes (X) 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8

Após (Y) 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4

Como o desempenho dos automóveis foi medido antes e depois das 15 semanas, é razoável assumir que exista alguma

dependência entre as variáveis.

Essa é a típica situação que o teste t-pareado

deve ser utilizado.

Automóveis

1 2 3 4 5 6 7 8 9 10 11 12

Antes (X) 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8

Após (Y) 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4

D = Y – X 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6

Obtendo a variável diferença: Di= Yi – Xi

O efeito produzido pelo i-ésimo indivíduo, pode ser representado pela variável:

7

As hipóteses:H0: D = 0 (O novo combustível não aumenta o rendimento) Ha: D > 0 (O novo combustível aumenta o rendimento)

Fixando =5%, determina-se a região crítica, com base na hipótese

alternativa: D

Di= Yi – Xi

Supondo, para i = 1, ..., n, assumimos, por hipótese, que:

Estima-se a média e variância populacional de D por:

1

ˆ1

2

2

n

md

s

n

iDi

D

n

d

m

n

ii

D

nmNm D

D

2

,~ˆ 2,~ DDi mND

8

n

)1(0 ~

ˆ

n

D

DD t

ns

mmt

n

stmmIC D

nDD

2

)2/;1( 1ˆ%; • A estatística do teste de hipótese

é dada por:

• A estimação intervalar para a média será:

### 2 pop - pareado

X <- c(8.1, 7.9, 6.8, 7.8, 7.6, 7.9, 5.7, 8.4, 8.0, 9.5, 8.0, 6.8) # antesY <- c(11.6, 8.8, 9.9, 9.5, 11.6, 9.1, 10.6, 10.8, 13.4, 10.6, 10.5, 11.4) # aposD <- Y-X # Diferença

t.test(D, paired = F, conf.level = 0.95, alternative='greater')

2 populações dependentespopulações dependentes

Exemplo 2:Exemplo 2: Desempenho dos automóveis medido antes (X) e após (Y) a aplicação do novo tipo de combustível. α = 5%.

t.test(D, paired = F, conf.level = 0.95, alternative='greater')

# One Sample t-test## data: D# t = 6.5396, df = 11, p-value = 2.097e-05# alternative hypothesis: true mean is greater than 0# 95 percent confidence interval:# 2.133833 Inf# sample estimates:# mean of x # 2.941667

9

ttab = t(11; 5%) =1,796

4846,6

124,2

09,2

calct

• A média e a variância amostrais de D são:

d = 2,9 e s2=2,4.

t(11)

t0

Ao nível de 5% de significância, como tcalc > ttab , rejeitamos H0 e concluímos que o novo combustível é eficaz na melhora do

rendimento, ou seja, aumenta a km.

10

ttab0

Aumenta quanto? Responda essa pergunta ao pesquisador fazendo a tarefa:

Tarefa: Determine o IC(D, 95%) = IC[(1 – 2), 95%] para esse exemplo.

b) Populações b) Populações independentesindependentes

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

b) Populações b) Populações independentesindependentes

11

Teste Teste para comparação de para comparação de variânciavariância de de duasduas populaçõespopulaçõesvariânciavariância de de duasduas populaçõespopulações

normaisnormais

12

22 22

1.1.OO Passo: Passo: Defina as hipóteses

Considere uma amostra de uma população ; e),( 211 mN),...,,(

121 nXXX

uma amostra de uma população ,

sendo essas amostras independentes.

),( 222 mN),...,,(

221 nYYY

Teste para comparação das Teste para comparação das variânciavariância de de duasduas populações normaispopulações normais

22

211

22

210

:

:

H

H22

211

22

210

:

:

H

H

2.2.OO Passo: Passo: Sejam e as variâncias amostrais. Sob H0, a estatística dos teste será:21s

2Ys

)1;1(22

21

21~ nnF

s

sV

13

3.3.OO Passo:Passo: Dado o nível de significância , estabelecer a RR do teste:

v

1 V

vV

1 2

2

v

2

)1( nV ~

Teste para comparação das Teste para comparação das variânciavariância de de duasduas populações normaispopulações normais

4.4.OO Passo:Passo: Determinar os pontos críticos.

5.5.OO Passo:Passo: Concluir o teste.

RR de H0RA de H0

cvV

1cvV

RR de H0RA de H0RR de H0

2cv

14

Digitadores são treinados em uma empresa em duas turmas distintas:

_Na primeira (Turma J) utiliza-se um método japonês,

_Na segunda (Turma A) utiliza-se um método alemão.

Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o

tempo gasto na realização de uma tarefa para cada aluno. Os dados obtidos foram:

ExemploExemplo

Método Tempo (min)

15

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Ao nível de significância de 10%, é possível afirmar que as variância dessas populações são iguais?

nJ = 14, e s2J = 4,1

nA = 13, e s2A = 4,3

Assim, temos:

221

220

:

:

AJ

AJ

H

H

1.1.OO Passo: Passo: Defina as hipóteses

2.2.OO Passo: Passo: A estatística dos teste é: )1;1(2

2

~ mn

Y

X Fs

sV

ResoluçãoResolução

9535,03,4

1,42

2

A

Jcalc

s

sV

nJ = 14, e s2J = 4,1

n = 13, e s2 = 4,3

= 10%

16

3,4As

)12;13()113;114( FFVtab

nA = 13, e s2A = 4,3

RR de H0RA de H0RR de H0

V%5

%5%90

0,38 2,66

Ao nível de 10% de significância, aceitamos H0 e concluímos que as

variâncias das duas populações treinadas são iguais.

b.1) Populações b.1) Populações independentes independentes com com

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

variâncias variâncias desconhecidas iguaisdesconhecidas iguais

17

Suponha duas populações, onde os dados para essas populações são variáveisaleatórias independentes (X1, ..., Xn1) e (Y1, ..., Yn2), respectivamente e queseguem a distribuição Normal. Portanto,

Suponha que para ambas as populações temos a mesma variância (desconhecida!!!) .

Queremos testar se existe diferença entre as médias populacionais, ou seja:

Xi ~ N(m1, 12) , i = 1, 2, ..., n1

Yj ~ N(m2, 22) , j = 1, 2, ..., n2

18

Testar se as médias populacionais são iguais é equivalente a testar se a diferença entre elas é “estatisticamente” igual a 0. Logo podemos reescrever as hipóteses em termos de mD = m1 – m2:

H0: m1 = m2

H1: m1 m2 ou H1: m1 < m2 ou H1: m1 > m2

H0: mD = 0H1: mD 0 ou H1: mD < 0 ou H1: mD > 0

Desta forma, usaremos o estimador (intuitivo)

Do TLC tem-se que se n>30

mD = m1 – m2^ ^ ^

1

21

11 ,~ˆn

mNm

2

22

22 ,~ˆn

mNm

e

19

1n 2

Como as amostras são independentes:

21

212121 )ˆ()ˆ()ˆ)1(ˆ()ˆˆ(ˆ

mm

mEmEmmEmmEmE D

22

22

12121 )ˆ()1()ˆ()ˆ)1(ˆ()ˆˆ(ˆ mVarmVarmmVarmmVarmVar D

Como m1 e m2 têm distribuição normal (se n>30) então:

2

22

1

21

21 ,~ˆnn

mmNmD

2

22

1

21

21 )ˆ()ˆ(nn

mVarmVar

20

^ ^

Como 2 é desconhecida, precisará ser estimada.

Como e são estimadores não viciados dessa variância, usaremos como estimativa para 2 uma combinação deles dada por:

21s

22s

é uma média ponderada entre as variâncias das duas populações e é um estimador não viciado!!!

11

11

2

)ˆ()ˆ(

21

222

211

21

1

22

1

21

2

21

nn

snsn

nn

mYmX

s

n

jj

n

ii

C

• A estimação intervalar para a diferença entre as média será:

21

21

2)2/;2(2121

11ˆˆ%;

21 nnstmmmmIC Cnn

• A estimação intervalar para a diferença entre as média será:

)2(

21

2

020121

21~

11

ˆˆ

nn

C

t

nns

mmmmt

•A estatística do teste é dada por:

Digitadores são treinados em uma empresa em duas turmas distintas:

_Na primeira (Turma J) utiliza-se um método japonês,

_Na segunda (Turma A) utiliza-se um método alemão.

Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o

tempo gasto na realização de uma tarefa para cada aluno. Os dados obtidos foram:

ExemploExemplo

22

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Deseja-se comparar os dois métodos ao nível de significância de 10%.

H0: mJ = mA

H1: mJ mA

### 2 pop – indep, com var =tempo<- c(10, 13, 9, 10, 14, 13, 10, 15, 12, 10, 9, 10, 13, 14,

15, 12, 18, 16, 15, 17, 17, 15, 16, 17, 11, 17, 14)turma<- factor(c(rep("J",14), rep("A",13))); turmatapply(tempo, turma, mean)tapply(tempo, turma, var)

2 populações independentes2 populações independentesccom variâncias iguaisom variâncias iguais

Exemplo 3:Exemplo 3: Deseja-se comparar os dois métodos de digitação ao nível = 1%: método japonês com o método alemão.

t.test(tempo ~ turma, paired = F, var.equal = T, alternative="two.sided", conf.level =0.99)

Two Sample t-test# # data: tempo by turma# t = 4.7965, df = 25, p-value = 6.313e-05# alternative hypothesis: true difference in means is not equal to 0# 99 percent confidence interval:# 1.597201 6.029173# sample estimates:# mean in group A mean in group J # 15.38462 11.57143 23

Voltando ao exemplo:

nJ = 14, mJ = 11,57 e s2J = 4,1

nA = 13, mA = 15,38 e s2A = 4,3

^

^

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Então: md = 11,57 – 15,38 = – 3,81

2,425

3,4*121,4*13

11

11 222

AJ

AAJJC

nn

snsns

24

nA = 13, mA = 15,38 e s2A = 4,3^

^

Fixando = 0,10, como a hipótese alternativa é bilateral e n < 30, a regiãocrítica tem a forma:

Usando a estatística do teste temos:

83,4

13

1

14

12,4

081,3

11

ˆˆ

21

2

0

nns

mmt

C

DDcalc

Conclusão: Como -4,83 pertence a região crítica, concluímos que os métodos de fato diferem a um

nível de significância de 10%.

25

-ttab ttab

ttab = t(25; 10%)

1,7081–1,7081

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

b.2) Populações b.2) Populações independentes independentes com com

26

variâncias variâncias desconhecidas diferentesdesconhecidas diferentes

O teste para o caso com as variâncias desconhecidas e desiguais é semelhante ao anterior, mas a quantidade a ser usada para aceitar ou rejeitar H0 é:

)(

2

22

1

21

020121 ~ˆˆ

t

n

s

n

s

mmmmt

11 2

2

2

22

2

1

1

21

2

2

22

1

21

n

n

s

n

n

s

n

s

n

s

, sendo

27

11 21 nn

2

22

1

21

)2/;(2121ˆˆ%;

n

s

n

stmmmmIC

### 2 pop – indep, com var diferentesY <- c( )pop <- factor(c(rep(“pop1",n1), rep(“pop2",n2)))

2 populações independentes2 populações independentesccom variâncias diferentesom variâncias diferentes

ExemploExemplo 44:: Sendo Y a variável resposta observada 2 populações (pop),usando α = 5%

t.test(Y ~ pop, paired = F, var.equal = FALSE, conf.level =0.95)

28

Teste de hipóteseTeste de hipótese

29

a) a) UmaUma populaçãopopulação

b) b) DuasDuas populaçõespopulações

c) c) Três ou maisTrês ou mais populaçõespopulações

???? O que fazer ????