Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos...

72
Inferência Estatística – Testes de Hipóteses Introdução: hipóteses e erros de conclusão Testes de hipóteses para uma e duas médias Testes de hipóteses para uma e duas variâncias 1 Testes de hipóteses para uma e duas proporções

Transcript of Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos...

Page 1: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Inferência Estatística –

Testes de Hipóteses

� Introdução: hipóteses e erros de conclusão

� Testes de hipóteses para uma e duas médias

� Testes de hipóteses para uma e duas variâncias

1

� Testes de hipóteses para uma e duas proporções

Page 2: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Problema a ser resolvido pela Inferência Estatística

→→→→→→→→ testar uma hipótesetestar uma hipótese

��������

Testes de hipótesesTestes de hipóteses

→→→→→→→→ testar uma hipótesetestar uma hipótese

Feita uma afirmação a respeito de uma população (parâmetro)

→→→→→→→→ saber se os resultados amostrais contrariam tal afi rmaçãosaber se os resultados amostrais contrariam tal afi rmação

��������

2

Definição:Definição: o teste de hipóteses é um procedimento estatístico onde se busca verificar uma hipótese a respeito da populaçãopopulação, no sentido de rejeitá-la, tendo por base dados amostraisdados amostrais.

Page 3: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Lógica Lógica dos dos Testes de HipótesesTestes de Hipóteses

Hipótese : um novo medicamento é eficaz no controle da pressã o arterial

PopulaçãoValor

hipotético do parâmetro.

Qual é a magnitude da diferença entre o valor

observado da

Não rejeitar a hipótese

Questão a ser feita

µµµµ = 130 mmHg

Diferença pequena

Decisão a ser tomada

observado da estatística e o valor

hipotético do parâmetro?Amostra

Valor observado da

estatística.

Rejeitar a hipótese

Diferença grande

x = 135 mmHg

3

Page 4: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Hipótese estatística

A hipótese estatística é uma suposição feita a respeito de umou mais parâmetrosparâmetros (µ, σ2, π, etc.).

Existem dois tipos básicos de hipóteses estatísticas:

�������� Hipótese de nulidade Hipótese de nulidade (H(H00)):: hipótese sob verificação que supõe a igualdade dos parâmetros que estão sendo comparados.

4

�������� Hipótese alternativa Hipótese alternativa (H(HAA):): hipótese considerada caso a hipótese de nulidade seja rejeitada e supõe que os parâmetros comparados são diferentes .

Page 5: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Uma população

Exemplo: Para verificar se uma nova droga é eficaz no tratamento da pressão alta, a pressão média de um grupo de pacientes submetidos a esta droga (amostra) é comparada com um valor que é considerado normal (valor padrão).

Uma população

Uma estimativa ( ) do parâmetro de interesse (µ)

Um valor conhecido e comprovado (µ0)

Uma amostra

x

µµ =

5

0A µµ:H ≠0µµ >

0µµ <

00 µµ:H =BilateralBilateral

Unilateral direitaUnilateral direita

Unilateral esquerdaUnilateral esquerda

Escolher Escolher uma das trêsuma das três

Page 6: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Para verificar, entre métodos de ensino, qual dá melhor desempenho quanto ao aprendizado dos alunos, comparamos as notas dos alunos de duas turmas (duas amostras), cada uma submetida a um método de ensino.

População 1 População 2

Estimativa de µµµµ1

População 1

Amostra 1

População 2

Amostra 2

Estimativa de µµµµ2

1x 2x

6

BilateralBilateral

Unilateral direitaUnilateral direita

Unilateral esquerdaUnilateral esquerda

Escolher Escolher uma das trêsuma das três

21A µµ:H ≠

21 µµ >

21 µµ <

210 µµ:H =

Page 7: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo 1: TesteTeste unilateralunilateral

ProblemaProblema científicocientífico:: Um novo medicamento é eficaz nocontrole da pressão arterial?

População CPopulação C – pacientes com uso do medicamento µµCCPopulação CPopulação C – pacientes com uso do medicamentoPopulação SPopulação S – pacientes sem uso do medicamento

Variável em estudo Variável em estudo →→ X: pressão arterial

µµCC

µµSS

SC0 µµ:H =Hipóteses estatísticas:Hipóteses estatísticas:

7

UnilateralUnilateral

QuandoQuando temostemos motivosmotivos suficientessuficientes parapara suporsupor queque umaumadasdas médiasmédias seráserá maiormaior queque aa outra,outra, podemospodemos formularformularumauma hipótesehipótese alternativaalternativa unilateralunilateral ((maismais específicaespecífica ))..

SCA µµ:H <SC0

Page 8: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo 2: TesteTeste bilateralbilateral

Problema científico:Problema científico: O método de ensino A é melhor que o método de ensino B?

População APopulação A – alunos ensinados pelo método A µµAAPopulação APopulação A – alunos ensinados pelo método APopulação BPopulação B – alunos ensinados pelo método B

Variável em estudo Variável em estudo →→ X: notas dos alunos

µµAA

µµBB

µµ ≠BA0 µµ:H =

Hipóteses estatísticas:Hipóteses estatísticas:

8

BAA µµ:H ≠ BilateralBilateral

Quando Quando não temos motivosnão temos motivos suficientes para supor que suficientes para supor que uma das médias será maior que a outra, formulamos uma uma das médias será maior que a outra, formulamos uma

hipótese alternativa bilateralhipótese alternativa bilateral ((mais genéricamais genérica ). ).

Page 9: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Objetivo: verificar a hipótese

Podemos verificar a hipótese de duas formas:�������� avaliar as populações inteiras (todos os alunos ensinado

pelos dois métodos ou todas os pacientes com e sem uso do medicamento) e comparar suas médiasmedicamento) e comparar suas médias�������� avaliar amostras retiradas das populações e utilizar um

teste estatístico que compare as médias das amostras

Devemos considerar:�������� seria impossível avaliar todos os alunos ou todos os

pacientes

9

Será muito mais econômico e menos trabalhoso Será muito mais econômico e menos trabalhoso utilizar amostras das populações.utilizar amostras das populações.

pacientes�������� o processo de amostragem pode fornecer precisão suficiente

Page 10: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Suponha que um grupo econômico queira financiar a campanha do candidato X, se esse tiver condições de se eleger no primeiro turno.

O grupo econômico deve financiar a campanha do candidato X?

Erros de conclusão

O grupo econômico deve financiar a campanha do candidato X?

Hipótese

O candidato se elege no primeiro

turno

Decisão

Investir na campanha

Não investir na campanha

HipóteseHipóteseVerdadeira

HipóteseFalsa

10

Decisão corretaInveste e ganha

ErroInveste e perde

ErroNão investe e se elege

Decisão corretaNão investe e não ganha

Page 11: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Erro 1Erro 1AcertoAcerto

Decisão do juiz Réu

Não condenar Condenar

Inocente

Erros de conclusão

culpado réu:H

inocente réu:H

A

0

Decisão H0

Não rejeitar Rejeitar

Verdadeira Erro Tipo IErro Tipo IAcertoAcerto

Erro 1Erro 1

Erro 2Erro 2 AcertoAcerto

AcertoAcertoInocente

Culpado

BA0 µµ:H =

culpado réu:H A

11

Verdadeira

Falsa

Erro Tipo IErro Tipo I

Erro Tipo IIErro Tipo II AcertoAcerto

AcertoAcerto

ββββββββ = = Erro Tipo II:Erro Tipo II: Não declarar diferença quando ela existe

αααααααα = = Erro Tipo I:Erro Tipo I: Declarar diferença quando ela não existe

BAA

BA0

µµ:H ≠

Page 12: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Importante!!!Importante!!!

�������� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o

�������� As duas taxas de erro αααααααα e ββββββββ estão relacionadasrelacionadas negativamentenegativamente,de modo que a reduçãoredução dede αααααααα implica no aumentoaumento dede ββββββββ e vice-versa.

�������� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o tamanho da amostratamanho da amostra, o que nem sempre é viável.

�������� Em geral, a preocupação está voltada para o erro tipo I (α - nívelde significância), pois na maioria dos casos ele é considerado omais grave.

REALIDADE

DECISÃOAceitar H 0 Rejeitar H 0

12

REALIDADE Aceitar H 0 Rejeitar H 0

H0 é verdadeiraDecisão correta

1 - α = P(Aceitar H0 / H0 é V)

= P(H0 / H0)

Erro do Tipo Iαααα = P(Rejeitar H0 / H0 é V) = Nível de

significância do teste = P(H1 / H0)

H0 é falsa

Erro do Tipo IIββββ = P(Aceitar H0 / H0 é falsa)

= P(Aceitar H0 /H1 é V) = P(H0 /H1)

Decisão correta1 - ββββ = P(Rejeitar H0 / H0 é falsa)

= P(H1 / H1) = Poder do teste.

Page 13: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Passos para construção de um teste de hipóteses

11.. Definir as hipóteses estatísticas.

33.. Escolher a estatística para testar a hipótese everificar as pressuposições para o seu uso.

22.. Fixar a taxa de erro aceitável (α - nível de significância).

44.. Usar as observações da amostra para calcular o valorda estatística do teste.

13

55.. Decidir sobre a hipótese testada e concluir.

da estatística do teste.

Page 14: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Situações comuns em testes de hipóteses a respeito de µµµµµµµµ

1.1. Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

� σ2 conhecida ou n > 30

2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)

�Duas amostras independentes

� σ12 e σ2

2 conhecidas

� σ2 desconhecida e n ≤ 30

14

� σ12 e σ2

2 conhecidas

� σ12 e σ2

2 desconhecidas , mas iguais

� σ12 e σ2

2 desconhecidas , mas diferentes

�Duas amostras dependentes (pareadas)

Page 15: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 conhecida (ou n > 30)

1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

N(0,1)~

n

XZ

σ

µ0−=

Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0

Estatística do teste:Estatística do teste:

Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra

15

Page 16: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 desconhecida (e n ≤ 30)

1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0

~ tνEstatística do teste:Estatística do teste:

nSµX

T 0−=

16

onde:

ν = n – 1

n

Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra

Page 17: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

≠A 0H :µ µ

=0 0H :µ µ

µX −=

Critério de decisão Critério de decisão –– Teste bilateralTeste bilateral

HHAA bilateralbilateral supõe que a diferença

é negativa ou positiva .0X - µ

Mas quão grande

αααααααα/2/2

tα/2

αααααααα/2/2

-tα/2 0

Não rejeição de H0

Rejeição de H

Rejeição de H0

Este limite é dado Este limite é dado pelos valores pelos valores

críticos.críticos.

n

SµX

T 0−= Mas quão grande será essa diferença

para ser considerada significativa?

17

Não rejeição de H0

�������� Se o valor t (calculado na amostra) estiver entre --ttαα/2/2 e ttαα/2/2, não temos motivos para rejeitar H0

�������� Se o valor t (calculado na amostra) for menor que --ttαα/2/2 ou maior que ttαα/2/2, rejeitamos H0

de H0de H0 críticos.críticos.

Page 18: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

HHAA unilateral unilateral direitadireitasupõe que a diferença

é um valor positivo .0X - µ

µX −=

Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral

>A 0H :µ µ

=0 0H :µ µ

0 tα

αααααααα

Rejeição Não rejeição

n

SµX

T 0−=Mas quão grande

será essa diferença para ser considerada

significativa?

Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.

18

Rejeição de H0

���� Se o valor t (calculado na amostra) for menor que tα, não temosmotivos para rejeitar H0

���� Se o valor t (calculado) for maior que tα, rejeitamos H0

Não rejeição de H0

pelo valor crítico.pelo valor crítico.

Page 19: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

HHAA unilateral unilateral esquerdaesquerdasupõe que a diferença

é um valor negativo .0X - µ

<A 0H :µ µ

=0 0H :µ µ

µX −=

Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral

0-tα

αααααααα

Rejeição

Mas quão grande será essa diferença

para ser considerada significativa?

Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.

n

SµX

T 0−=

19

Não rejeição de H0

Rejeição de H0

�������� Se o valor t (calculado na amostra) for maior que --ttαα, não temos motivos para rejeitar H0

�������� Se o valor t (calculado) for menor que --ttαα, rejeitamos H0

pelo valor crítico.pelo valor crítico.

Page 20: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Um processo deveria produzir bancadas com 0,85 mde altura. O engenheiro desconfia que as bancadas que estãosendo produzidas são diferentes que o especificado. Umaamostra de 8 valores foi coletada e indicou média de 0,87 edesvio padrão de 0,010. Sabendo-se que os dados seguem adistribuição normal, teste a hipótese do engenheiro usando umnível de significância α=0,05.nível de significância α=0,05.Solução:

nSµX

T 0−=

0,85H0: µ =

0,85HA: µ ≠

0,87 - 0,85= 5,66t =

1) 2) α=0,05

3) Pressuposição:Pressuposição: A variável em estudo tem distribuição normal

4)

5)0,025 0,025

0

ν=n-1=7

20

0,87 - 0,85= 5,66

0,010/ 8tc =4)

Não se rejeita HNão se rejeita H0Rejeita HRejeita H00Rejeita HRejeita H00

Conclusão: Ao nível de 5% de significância, conclui-se que asbancadas que estão sendo produzidas devem ter alturadiferente do especificado, maiores que 0,85m.

-2,365 +2,3650

Page 21: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício proposto: A associação dos proprietários de

indústrias metalúrgicas está preocupada com o tempo perdido

em acidentes de trabalho, cuja média, nos últimos tempos, tem

sido da ordem de 60 horas/homem por ano com desvio padrão

de 20 horas/homem, segundo a distribuição normal. Tentou-se2)2)

de 20 horas/homem, segundo a distribuição normal. Tentou-se

um programa de prevenção de acidentes e, após o mesmo,

tomou-se uma amostra de 9 indústrias e mediu-se o número de

horas/homem perdidas por acidente, que foi de 50 horas. Você

diria, ao nível de 5%, que há evidência de melhora?

Solução:

As hipóteses a serem testadas são:

H0: µ = 60 hora/homens

HA: µ < 60 hora/homens

21

1)

Page 22: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Solução:

1,50

920

6050

µXz 0 −=−=−= 3) α=0,05

4)

Isto quer dizer que a diferença apresentada na amostra não é5) Isto quer dizer que a diferença apresentada na amostra não ésuficientemente grande para provar que a campanha deprevenção deu resultado. Então a conclusão é:

“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”

22

5)

Page 23: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício proposto: O tempo médio, por operário, para executaruma tarefa, tem sido 100 minutos, segundo a distribuição normal.Introduziu-se uma modificação para diminuir este tempo, e, apóscerto período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução gasto por cada um. O tempo médio daamostra foi 91 minutos com desvio padrão de 12 minutos. Este

2)

resultado evidencia uma melhora no tempo gasto para realizar atarefa? Apresente as conclusões ao nível de 5% de significância.

Solução:

H0: µ = 100

HA: µ < 100

α=0,05ν=n-1=15

-1,753

1)

3)

23

Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.

T =

nsµx 0−

-1,753

=

1612

10091− = -3 4)

5)

Page 24: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Medidos os diâmetros de 31 eixos de um lotealeatório, produzido pela empresa “Sofazredondo S.A.”obteve-se a distribuição abaixo:

Diâmetros (em mm) 56,5 56,6 56,7 56,8 56,9 57,0 57,1 57,2 57,3Número de eixos 1 2 2 4 10 5 4 2 1

Ao nível de significância de 5%, há evidência de que odiâmetro médio dos eixos esteja fora da especificação de57 mm?

Z = -2,557

Número de eixos 1 2 2 4 10 5 4 2 1

Zc = -2,557

24

Page 25: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Valor p:Valor p: Probabilidade de que seja obtido um valor de T mais extremo que o valor observado, dado que H0 é verdadeira

Outro critério de decisão Outro critério de decisão

c

25

c

Page 26: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Se p ≥ α

Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?

�� Se o valor pvalor p for maior ou igual a α: não rejeitamosnão rejeitamos a hipótese nula, pois tt cc está em uma região de alta probabilidade

Não rejeitamos a hipótese de nulidade

26

c

Page 27: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Se p < α

Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?

�� Se o valor pvalor p for menor que α: rejeitamosrejeitamos a hipótese nula, pois tt cc está em uma região de baixa probabilidade

Rejeitamos a hipótese de nulidade

27

c

Page 28: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: programa de prevenção de acidentes

1,50

920

6050

µXz 0 −=−=−=

H0: µ = 60 hora/homensHA: µ < 60 hora/homens

-1,645 -1,50

p = 0,0668

α = 0,05

“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”

-1,645 -1,50

28

Page 29: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: O tempo médio, por operário, para executar uma tarefa, temsido 100 minutos, segundo a distribuição normal. Introduziu-se umamodificação para diminuir este tempo, e, após certo período, sorteou-seuma amostra de 16 operários, medindo-se o tempo de execução gastopor cada um. O tempo médio da amostra foi 91 minutos com desviopadrão de 12 minutos. Este resultado evidencia uma melhora no tempogasto para realizar a tarefa? Apresente as conclusões ao nível de 5% degasto para realizar a tarefa? Apresente as conclusões ao nível de 5% designificância.

Solução:

H0: µ = 100

HA: µ < 100

α=0,05 e ν=n-1=15

-1,753

29

Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.

tc =

nsµx 0−

=

1612

10091− = -3

-1,753

Qual o valor p?p < αααα

p ≅≅≅≅ 0,005 (0,5%)

Page 30: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

tc = -3 α = 0,05 ν = n-1 = 15

30

Conclusão: Como a significância do resultado (0,45%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Page 31: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1

2 e σ22 são conhecidas

As amostras retiradas das populações são independentes

2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)

N(0,1)~

XXZ

22

21

21

+

−=

As amostras retiradas das populações são independentes

Hipótese sob verificação:Hipótese sob verificação: 210 µµ:H =

Estatística do teste:Estatística do teste:

nn 21

+

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra

31

Page 32: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Um fabricante produz dois tipos de pneus. Para o pneu dotipo A o desvio padrão é de 2500 km e para o pneu do tipo B é de3000 km, seguindo a distribuição normal. Uma empresa de táxistestou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km demédia para o tipo A e 26000 para o tipo B. Adotando α = 4% testar ahipótese de que a duração média dos dois tipos é a mesma.

Solução:

As hipóteses são: H0: µA = µBHA: µA ≠ µB

Como α = 4%, então zα/2 = 2,055

3,38

40

3000+

502500

2600024000z

22c −=−=

Portanto, rejeita-se a hipótese de igualdade entre as duraçõesmédias dos dois tipos de pneus. Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos depneus diferem quanto a durabilidade média, sendo o tipo B melhorque o tipo A.

Como α = 4%, então zα/2 = 2,055

32

Page 33: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1

2 e σ22 são desconhecidas mas supostas iguais

As amostras retiradas das populações são independentes

2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)

Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =

~ tνEstatística do teste:Estatística do teste:

onde: 2

21

S11

XXT

+

−=

33

onde:

ν = (n1 – 1) + (n2 – 1)21

Snn

+

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra

( ) ( )( ) ( )1n1n

1nS1nSS

21

2221

212

−+−−+−=

Page 34: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo:

Dez cobaias adultas criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do experimento. pesadas no início e no final do período de duração do experimento. Os ganhos de peso (em gramas) observados foram os seguintes:

Utilize um teste de hipótese, ao nível α = 0,01, para verificarse as duas rações diferem entre si quanto ao ganho de peso.

Ração experimental 220 200 210 220 210

Ração padrão 200 180 190 190 180

34

se as duas rações diferem entre si quanto ao ganho de peso.

210 µµ :H =α = 0,01

21A µµ :H ≠2x = 188

= 70

ExperimentalExperimental

2

1s

n1 = 5

= 212

= 70

PadrãoPadrão

n2 = 5

1x

2

2s

Page 35: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposições : variável ganho de peso com distribuição normal, amostras independentes e supõe-se que .2

221 σ=σ

( ) ( )( ) ( )1n1n

1nS1nSS

21

2221

212

−+−−+−=

( ) ( )( ) ( ) 70

1515157015702s =

−+−−×+−×=

4,54

7051

51

188212tc =

+

−=2

21

21

Sn1

n1

XXT

+

−=

α=0,01 e ν=(n1-1)+(n2-1)=80,99

35

Conclusão: ao nível de 1%, conclui-se que a ração experimental deve dar maior ganho de peso que a ração padrão.

⇒ H0 é rejeitada0,005 0,005

3,355-3.355

Page 36: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

tc = 4,54 α = 0,01 ν = (n1-1)+(n2-1) = 8

36

Conclusão: Como a significância do resultado (0,19%) é menor que a significância do teste (1%), é possível rejeitar a hipótese nula.

Page 37: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Um engenheiro desconfia que a qualidade de um material pode depender da matéria-prima utilizada. Há dois fornecedores de matéria-prima sendo usados. Testes com 10 observações de cada fornecedor indicaram:

=

Use um nível de significância α = 0,05 e teste a hipótese do engenheiro.

Obs.: Considere que as duas variâncias populacionais iguais.

39 x1 = 7s1 =43x2 = 9s2 =

Obs.: Considere que as duas variâncias populacionais iguais.

101,2t11,1t 18;025,0c =<=

37

Page 38: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1

2 e σ22 são desconhecidas e desiguais

As amostras retiradas das populações são independentes

2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)

22

21

21

SS

XXT

+

−=

As amostras retiradas das populações são independentes

Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =

~ tνEstatística do teste:Estatística do teste:

38

2

2

1

1

nn+

onde:

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra 1n

)nS(1n)nS(

)nSnS(

2

22

22

1

21

21

2 2

221

21

−+

+=ν

Page 39: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: As resistências de dois tipos de concreto, que segue o modelonormal, foram medidas, mostrando os resultados da tabela. Fixado umnível de significância de 10%, existe evidências de que o concreto do tipoX seja mais resistente do que o concreto do tipo Y?

Tipo X 54 55 58 50 61

Tipo Y 51 54 55 52 53

Os dados obtidos da tabela são:

X = 55,6 e Y = 53,0

S2 = 17,3 e S2 = 2,5 Tipo Y 51 54 55 52 53

XS2 = 17,3 e YS2 = 2,5

H0: µX = µYHA: µX ≠ µY

α = 0,10 α = 10% e ν = 5

5,133,0554

15,6816

4)52,5(

4)517,3(

)52,5517,3(22

2

==+

+=

1n)nS(

1n)nS(

)nSnS(

2

22

22

1

21

21

2 2

221

21

−+

+=ν

39

Com estas amostras, ao nível de 10% de significância, não é possível afirmarque o concreto do tipo X seja mais resistente do que o concreto do tipo Y.

2

22

1

21

21

nS

nS

XXT

+

−=0,05 0,05

2,015-2,015

1,31

52,5

517,3

53,055,6 =+

−=

Page 40: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

tc = 1,31 α = 0,10 ν = 5

40

Conclusão: Como a significância do resultado (24,71%) é maior que a significância do teste (10%), não é possível rejeitar a hipótese nula.

Page 41: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

α = 0,05No teste unilateral o valor t crítico é menor porque a área a sua direita deve corresponder a todo α. Assim, esta área é o dobro da área à direita do valor t crítico do teste à direita do valor t crítico do teste bilateral.

Como consequência, um valor t não rejeitado no teste bilateral pode ser

41

teste bilateral pode ser rejeitado no teste unilateral. Portanto, o teste unilateral é mais poderoso que o teste bilateral.

Page 42: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

�������� Os intervalosintervalos dede confiançaconfiança e os testestestes dede hipóteseshipótesesbilateraisbilaterais são procedimentos estatísticos relacionados.

�������� Se forem utilizados para analisar os mesmos dados, ao

ConsideraçõesConsiderações

�������� Se forem utilizados para analisar os mesmos dados, aomesmo nível de significância, devem conduzir aos mesmosresultados.

�������� O intervalo de confiança para uma médiauma média está relacionadocom o teste de hipóteses que compara uma média com umcompara uma média com umpadrãopadrão.H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo

42

�������� O intervalo de confiança para a diferença entre duasdiferença entre duasmédiasmédias está relacionado com o teste de hipóteses quecompara duas médiascompara duas médias.H0 não rejeitada ⇔⇔ zero está coberto pelo intervalo

H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo

Page 43: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Intervalo de confiança para uma média (Intervalo de confiança para uma média (µµ))

IC (µ; 1−−−−α): ± tαααα/2n

SX

EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))

n

SµX

T 0−=

�������� Se no teste de hipóteses, ao nível de 1% de significância,

Valor crítico: tαααα/2

�������� Se no teste de hipóteses, ao nível de 1% de significância,rejeitamos H0, significa que a diferença entre a média e o valorpadrão não é zero, ou seja, média e valor padrão são diferentes.

�������� Construindo o intervalo de confiança para µ, ao nível de 99%,devemos esperar que o valor padrão (µ0) esteja fora do intervalo.Caso contrário, os resultados seriam contraditórios.

43

Page 44: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Intervalo de confiança para a diferença entre duas médias (Intervalo de confiança para a diferença entre duas médias (µµ11 −− µµ22))

EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))

IC ( ; 1−−−−α): ± tαααα/22

21

Sn1

n1

+21 XX −21 µµ −

EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))

�������� Se no teste de hipóteses, ao nível de 5% de significância, não

Valor crítico: tαααα/22

21

21

Sn1

n1

XXT

+

−=

�������� Se no teste de hipóteses, ao nível de 5% de significância, nãorejeitamos H0, significa que a diferença entre as duas médias é zero,ou seja, as médias devem ser iguais.

�������� Construindo o intervalo de confiança, ao nível de 95%, para adiferença entre as médias (µ1−µ2), devemos esperar que o valorzero seja coberto pelo intervalo.

44

Page 45: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Um novo funcionário foi contratado para gerir os estoques da empresa. Ele recebeu a informação de que a quantidade semanal vendida de determinado produto é de 9,6kg. Para testar a veracidade da informação, tomou uma amostra aleatória de 30 semanas e verificou que a venda média do produto foi de 9,3kg, com desvio padrão de 3,2kg. Considerando que a variável em estudo segue a distribuição normal:

a) Verifique, utilizando teste de hipóteses ao nível de 5% de significância, se a informação recebida pelo funcionário é verdadeira.

45

b) Verifique se a informação é verdadeira, utilizando intervalo de confiança ao nível de 95%.

c) Houve coerência entre os resultados do teste de hipóteses e do intervalo de confiança?

Page 46: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

a) Teste de Hipótese

Variável em estudo: X = venda do produto (kg)

Pressuposição: A variável em estudo tem distribuição normal

1. Hipóteses estatísticas: 9,6:HA ≠µ

9,6:H0 =µ

46

2. Taxa de erro aceitável: α = 0,05

Page 47: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

a) Teste de Hipótese

3. Estatística do teste

sµx

T 0−= 0,51353,2

9,69,3 −=−=

4. Decisão e conclusão

ns

303,2

0,025 0,025

2,045-2,045

α = 5% e ν = 29

47

Não rejeitamos H0. Concluímos, ao nível de 5% de significância,que a quantidade média de venda semanal do produto nãodifere significativamente do valor informado (9,6kg). Portanto, ainformação recebida pelo funcionário pode ser verdadeira.

Page 48: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

b) Intervalo de confiança

Variável em estudo: X = venda do produto (kg)

Pressuposição: A variável em estudo tem distribuição normal.

Estimativas:

=x 9,3 ν = 30 − 1 = 29

/2S

IC( ; 1 ) : X tn

α− ±µ α

48

=x 9,3

= =s 3,20,5842

n 30

ν = 30 − 1 = 29

t0,025 (29) = 2,045

Page 49: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

b) Intervalo de confiança

IC (µ; 0,95): 9,3 ± 2,045 × 0,5842Limite inferior = 9,3 – 1,195 = 8,11

/2S

IC( ; 1 ) : X tn

α− ±µ α

Limite inferior = 9,3 – 1,195 = 8,11Limite superior = 9,3 + 1,195 = 10,50

P(8,11 < µ < 10,50) = 0,95

Concluímos que o intervalo de confiança, ao nível de 95%, para a verdadeira quantidade média semanal vendida do produto é de 8,11 a 10,50 kg.

49

c) Sim, o resultado do teste de hipóteses esta coerente com o do intervalo de confiança, pois o valor padrão 9,6, que segundo o teste de hipótese não difere de µ, está dentro do intervalo de confiança, ou seja, é um valor possível para µ.

Page 50: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Comparação de Pares de Observações(Comparação de duas médias para amostras pareadas)

Em algumas situações os dados de duas populações são coletados ecomparados em pares. Isso é feito para impedir que fatores nãocontroláveis inflacionem as estimativas das variâncias.controláveis inflacionem as estimativas das variâncias.

Exemplo: desempenho dos alunos com método A e B

X

hidratação da pele com creme A e B

A hipótese testada é se existe diferenças significativas entre os paresde observações, tendo como suposição que os dados seguem adistribuição normal.

50

distribuição normal.

O teste baseia-se na estatística:

1n

d

t~n/s

dT −=

)

)

)

)

21d

21d

21dA

21d0

( 0

( 0

( 0:H

( 0 :H

µµµ

µµµ

µµµ

µµµ

<<>>≠≠==

Page 51: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Cinco operadores de máquinas foram treinados emduas máquinas de diferentes fabricantes, para verificar qualdelas apresentava maior facilidade de aprendizagem. Mediu-seo tempo que cada um dos operadores gastou na realização deuma mesma tarefa com cada um dos dois tipos de máquinas.Os resultados estão na tabela. Ao nível de 5%, é possívelOs resultados estão na tabela. Ao nível de 5%, é possívelafirmar que a tarefa realizada na máquina X demora mais doque na máquina Y?

Solução:

H0: µX = µY (µd = 0)

H : µ ≠ µ (µ ≠ 0)

Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78

d i

52567

51

HA: µX ≠ µY (µd ≠ 0) 5 85 78

n/s

dT

d

=

7

α = 5%

Page 52: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

� = 5 e sd = 1,8708

Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78

d

d i

52567

1-n

)d(dS

2i

d∑ −

=n

dd i∑=

5,9851,8708/

5

n/s

dt

d

===� α = 5% e ν = n - 1 = 4

52

Com 5% de significância, rejeita-se H0, e conclui-se que realizar atarefa com a máquina X deve demorar mais do que com amáquina Y, esta apresentando maior facilidade de aprendizagem.

2,776-2,776

Page 53: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Uma empresa quer verificar se o conhecimento de seus funcionários a respeito de um determinado assunto melhorou após 30 horas de treinamento. Para isso foi realizado com os quinze alunos do treinamento um teste antes e após o treinamento. Os dados a seguir representam as notas obtidas. treinamento. Os dados a seguir representam as notas obtidas. Conclua a respeito da eficiência do treinamento, utilizando 5% de significância.

Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes 6,5 6,7 7,0 7,0 6,5 7,3 7,8 6,9 6,7 7,2 7,5 7,5 7,2 7,0 6,8 Depois 7,5 7,7 7,9 8,0 7,4 8,3 8,8 8,9 7,7 8,2 8,5 8,5 8,2 8,0 8,8 Difer. 1,0 1,0 0,9 1,0 0,9 1,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 1,0 2,0

53

360S

121d

d ,

,

==

Page 54: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Duas espécies de um certo tipo de cereal estão sendo testadas quanto ao seu crescimento. O experimento foi feito escolhendo 10 blocos de terreno e plantando em cada bloco mudas de ambas as espécies. Os resultados a seguir são as alturas medidas ao final do primeiro mês. Utilizar α = 0,05as alturas medidas ao final do primeiro mês. Utilizar α = 0,05

Os dados deste experimento foram coletados aos pares para

Terreno 1 2 3 4 5 6 7 8 9 10 Espécie 1 22 27 18 33 25 21 15 33 21 24 Espécie 2 21 31 24 32 29 23 19 37 22 27

Os dados deste experimento foram coletados aos pares para impedir que as diferenças de fertilidade entre os blocos de terreno (que podem ser grandes) mascarem os resultados.

262,2t54,3t 9;025,0c =>=

54

Page 55: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Teste para a variância de uma população

Para aplicar o teste para a variância é necessário supor anormalidade da população de onde será extraída a amostra.

Uma hipótese testada com frequência é que a variância tenhaUma hipótese testada com frequência é que a variância tenhaum valor especificado.

20

2

20

2

20

2A

20

20

σσ

σσ

σσ:H

σσ:H

<

>

=H0 é rejeitada se qc ultrapassar o valorcrítico da distribuição qui-quadrado :

55

A estatística do teste é

~−= −χσ

2

20

2(n 1)SQ (n 1)

0σσ <

Page 56: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

56

...

Page 57: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: A quantidade mensal de produtos entregues por uma empresa segue uma distribuição Normal com média e variância desconhecidas. Analise os dados a seguir, que representam uma amostra de 20 meses e teste a hipótese de que o desvio padrão da quantidade mensal de produtos entregues pela empresa é de 1 unidade, utilizando nível de significância de 5%.unidade, utilizando nível de significância de 5%.

Solução: H0: σ2 = 1

HA: σ2 ≠ 1

( )( ) 2− 2,5%

95%

α = 5%ν = n - 1 = 19

17,4 18,2 18,3 18,8 19,0 19,2 19,3 19,6 19,6 19,920,2 20,2 20,5 20,7 20,9 21,0 21,3 21,5 21,9 22,6 34,1S

01,20X

==

57

Com 5% de significância, rejeita-2 H0, isto é, é possível afirmar que odesvio padrão da quantidade mensal de produtos entregues pelaempresa é maior que 1 unidade.

( )34,12

11,34 1-20 2

==( )

20

2

σ

S1nQ

−= 8,91 32,85

2,5%2,5%

Page 58: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

qc = 34,12 α = 0,05 ν = 19

58

Como a significância do resultado (3,5575=2*1,7788) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Page 59: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Uma das maneiras de controlar a qualidade de umproduto é controlar a sua variabilidade. Uma máquina deempacotar café está regulada para encher os pacotes commédia de 500 g e desvio padrão de 10 g, onde o peso de cadapacote distribui-se normalmente. Colhida uma amostra de n=16,observou-se uma variância de 169 g2. É possível afirmar comobservou-se uma variância de 169 g . É possível afirmar comeste resultado que a máquina está desregulada quanto avariabilidade, supondo uma significância de 5%?

Solução: H0: σ2 = 100

HA: σ2 > 100

( )169 15( ) 2S1n −

95%α = 5%ν = n - 1 = 15

Com 5% de significância, rejeita-se H0, ou seja, é possívelafirmar que a máquina está desregulada.

59

( )25,35

100169 15 ==

( )20

2

σ

S1nQ

−=25,00

5%

Page 60: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

qc = 25,35 α = 0,05 ν = 15

60

Como a significância do resultado (4,54%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Page 61: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Teste de homogeneidade de variâncias

Considerando duas estimativas e , frequentemente, temosinteresse em verificar se tais estimativas são homogêneas.

21s 2

2s

Assim, as hipóteses a serem testadas são:

22

21A

22

210

σσ:H

σσ:H

=H0 é rejeitada se fc ultrapassar ovalor crítico da distribuição F:

61

A estatística do teste é

22

21

SS

F =Atenção : sempre variância maior sobre variância

menor

Page 62: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

62

...

Page 63: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: As resistências de dois tipos de concreto forammedidas, mostrando os resultados da tabela. Fixado um nível designificância de 10%, teste a hipótese de igualdade das variâncias,considerando que os dados seguem a distribuição normal?

Tipo X 54 55 58 50 61 Os dados obtidos da tabela são:

X = 55,6 e Y = 53,0 Tipo Y 51 54 55 52 53

X = 55,6 e Y = 53,0

XS2 = 17,3 e YS2 = 2,5

H0: σ2X = σ2YHA: σ2X ≠ σ2Y α = 10%

ν1 = nx - 1 = 4

ν2 = ny - 1 = 4

2

63

Neste caso, rejeita-se H0, ao nível de 10% de significância, eassume-se que as variâncias populacionais são diferentes.

6,922,5

17,3 ==6,39

0,050,0522

21

SS

F =

Page 64: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Utilizando o Excel para obter o valor p:

fc = 6,92 α = 10% ν1 = nx - 1 = 4 ν2 = ny - 1 = 4

64

Conclusão: Como a significância do resultado (8,76% = 4,38 x 2) é menor que a significância do teste (10%), é possível rejeitar a hipótese nula.

Page 65: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Uma alta quantidade de nitrato introduzida na alimentação animal tem mostrado possuir efeitos danosos incluindo baixa produção de tiroxina, aumento de incidência de cianose em recém nascidos e baixa produção de leite. Os dados que seguem referem-se a medida de ganho de peso percentual em ratos de laboratório, submetidos a uma dieta padrão e a uma dieta com 2000 ppm de nitrato na água de beber.

2 ==Nitrato: 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2Controle: 18,2 32,9 10,0 14,3 16,2 27,6 15,7.

a) Verifique, através do teste F, se as variâncias das populações são iguais.b) Verifique, através do teste t, o efeito do nitrato sobre o ganho de peso.

21 XXT

−= ( ) ( )1nS1nS 22 −+−

64,85s 19,27x

12,66s 15,07x2CC

2NN

==

==

65

22

21

SS

F =

2

22

1

21

21

nS

nS

XXT

+

−=

2

21

Sn1

n1

T

+

= ( ) ( )( ) ( )1n1n

1nS1nSS

21

2221

212

−+−−+−=

22

21A

22

210

σσ:H

σσ:H

=

1n)nS(

1n)nS(

)nSnS(

2

22

22

1

21

21

2 2

221

21

−+

+=ν

Page 66: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Calculadoras eletrônicas utilizam dois métodos diferentes de entrada e processamento numérico. Vamos denominar um dos métodos de “método algébrico” (MA) e o outro de “método polonês” (MP). Para comparar qual deles é mais eficaz é feito um teste com 20 usuários sem experiência prévia com calculadoras, onde 10 vão utilizar calculadoras de um tipo e o outros 10 as de outro tipo. A tabela mostra o tempo em segundos que cada operador gastou para realizar um conjunto padrão de cálculos. Testar a hipótese de existência de diferença entre os dois cálculos. Testar a hipótese de existência de diferença entre os dois métodos no que se refere ao tempo de operação, utilizando uma significância de 5%.

MA 12 16 15 13 16 10 15 17 14 12

MP 10 17 18 16 19 12 17 15 17 14 2,80s 15,50x

2,21s 14,00x

PP

AA

==

==

Exercício: Os valores a seguir representam os tempos de produção de

66

Exercício: Os valores a seguir representam os tempos de produção de duas máquinas. Analise os dados e conclua a respeito da variabilidade das máquinas 1 e 2:

8307,021 =S 316,12

2 =S

M1 91,0 90,3 90,2 92,1 91,8 91,3 89,3, 91,0 91,2 89,6M2 91,8 91,2 89,4 89,2 90,7 92,6 91,3 91,2

Page 67: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Teste para proporções

O teste para a proporção populacional, em geral, é utilizadopara verificar se a proporção π de elementos da população quepossuem uma determinada característica é igual a umdeterminado valor π .determinado valor π0.

As hipóteses estatísticas são:

0

0

0

ππππππ

>≠=

:H

:H

A

0

Usa-se a estatística:

( ) N(0,1)~

n1

pZ

00

0

πππ−

−=

67

O teste se baseia na aproximação da distribuição Normal.

Pressuposição: n é grande ⇒ np > 5 e n(1-p) > 5p → estimador de π

0

0

ππ <

nx

p =

n

Page 68: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: As condições de mortalidade de uma região são taisque a proporção de nascidos que sobrevivem até 70 anos é de0,60. Testar esta hipótese ao nível de 5% de significância se em1000 nascimentos amostrados aleatoriamente, verificou-se 530sobreviventes até os 70 anos.

Solução : 0,53530p ==Solução :

0,60 :H0 =π

( )p

z 0π

−−=

1,96-1,96

0,531000530p ==

0,60:HA ≠π

( ) 4,520,600,53 −=−

−=

α = 0,05

68

Decidi-se rejeitar H0, ao nível de 5% de significância.

Neste caso, pode-se afirmar que a taxa dos que sobrevivem até os 70 anos é menor do que 60%.

( )n

1z

00 ππ −= ( ) 4,52

10000,6010,60

−=−

=

Page 69: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercícios :

1) Um fabricante garante que 90% dos equipamentos que

fornece a uma fábrica estão de acordo com as especificações

exigidas. O exame de uma amostra de 200 peças desseexigidas. O exame de uma amostra de 200 peças desse

equipamento revelou 25 defeituosas. Teste a afirmativa do

fabricante, nos níveis de 5% e 1%.

2) Um engenheiro deseja testar a hipótese de que seu

Zc=1,18

fornecedor entrega lotes com 10% de não conformes. Um lote

de 180 unidades revelou 14 não conformes. Use α = 5% e

conclua a respeito.Zc=-0,98

69

Page 70: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

A aproximação Normal também pode ser usada para testara hipótese que dois parâmetros de Binomiais sejam iguais,ou seja, para testar:

21

21A

210

:H

:H

ππ

ππ

ππ

>≠=

Nesse caso, amostras de tamanho n1 e n2 são retiradasde cada população, gerando x1 e x2 itens pertencentes àclasse associada com p e calcula-se os estimadores de ππππpara cada população como: 1

1 nx

p =

21

21

ππ

ππ

<>

22 n

xp =

( ) ( ) N(0,1)~

n

p1p+

np1p

ppZ

2

22

1

11

21

−−−=

70

A estatística para o teste é:

11 n

p =2

2 np =

Page 71: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exemplo: Em uma pesquisa de opinião, 32 dentre 80 homensdeclararam apreciar certa revista, acontecendo o mesmo com26 dentre 50 mulheres. Ao nível de 5% de significância oshomens e as mulheres apreciam igualmente a revista?Solução : H0: πH = πM

π ≠ πpH = 32 / 80 = 0,40p = 26 / 50 = 0,52HA: πH ≠ πM

( ) ( )

np1p

+n

p1p

ppZ

M

MM

H

HH

MH

−−−=

Não se rejeita H , isto é, a

HpM = 26 / 50 = 0,52

α = 0,05

1,34

500,52)0,52.(1-

800,40)0,40.(1-

0,520,40 −=

+

−=

71

1,96-1,96

Não se rejeita H0, isto é, a5% de significância, não épossível afirmar que existadiferença entre aspreferências de homens emulheres quanto à revista.

Page 72: Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes

Exercício: Um empresário deseja saber se os percentuais desatisfação de seus clientes em relação a dois produtosoferecidos por sua empresa são similares. Para isso entrevistou150 pessoas, das quais 80 disseram estar satisfeitas com oproduto A e 100 com o produto B. Use α = 5% e conclua arespeito.respeito.

21

210

:

:

ππππ

≠=

AH

H 530150

80p1 ,== 0,67

150

100p2 ==

( ) ( ) 47,20567,0

14,0

33,0.67,047,0.53,0

67,053,0

p1pp1p

ppZ 21 −=−=

−=−−

−= ( ) ( ) 0567,0

15033,0.67,0

15047,0.53,0

np1p

np1p

2

22

1

11

+−−

+

961472 2 ,, / =>= αzz ���� Rejeita-se Ho

72