Post on 02-Sep-2019
Inferência Estatística –
Testes de Hipóteses
� Introdução: hipóteses e erros de conclusão
� Testes de hipóteses para uma e duas médias
� Testes de hipóteses para uma e duas variâncias
1
� Testes de hipóteses para uma e duas proporções
Problema a ser resolvido pela Inferência Estatística
→→→→→→→→ testar uma hipótesetestar uma hipótese
��������
Testes de hipótesesTestes de hipóteses
→→→→→→→→ testar uma hipótesetestar uma hipótese
Feita uma afirmação a respeito de uma população (parâmetro)
→→→→→→→→ saber se os resultados amostrais contrariam tal afi rmaçãosaber se os resultados amostrais contrariam tal afi rmação
��������
2
Definição:Definição: o teste de hipóteses é um procedimento estatístico onde se busca verificar uma hipótese a respeito da populaçãopopulação, no sentido de rejeitá-la, tendo por base dados amostraisdados amostrais.
Lógica Lógica dos dos Testes de HipótesesTestes de Hipóteses
Hipótese : um novo medicamento é eficaz no controle da pressã o arterial
PopulaçãoValor
hipotético do parâmetro.
Qual é a magnitude da diferença entre o valor
observado da
Não rejeitar a hipótese
Questão a ser feita
µµµµ = 130 mmHg
Diferença pequena
Decisão a ser tomada
observado da estatística e o valor
hipotético do parâmetro?Amostra
Valor observado da
estatística.
Rejeitar a hipótese
Diferença grande
x = 135 mmHg
3
Hipótese estatística
A hipótese estatística é uma suposição feita a respeito de umou mais parâmetrosparâmetros (µ, σ2, π, etc.).
Existem dois tipos básicos de hipóteses estatísticas:
�������� Hipótese de nulidade Hipótese de nulidade (H(H00)):: hipótese sob verificação que supõe a igualdade dos parâmetros que estão sendo comparados.
4
�������� Hipótese alternativa Hipótese alternativa (H(HAA):): hipótese considerada caso a hipótese de nulidade seja rejeitada e supõe que os parâmetros comparados são diferentes .
Uma população
Exemplo: Para verificar se uma nova droga é eficaz no tratamento da pressão alta, a pressão média de um grupo de pacientes submetidos a esta droga (amostra) é comparada com um valor que é considerado normal (valor padrão).
Uma população
Uma estimativa ( ) do parâmetro de interesse (µ)
Um valor conhecido e comprovado (µ0)
Uma amostra
x
µµ =
5
0A µµ:H ≠0µµ >
0µµ <
00 µµ:H =BilateralBilateral
Unilateral direitaUnilateral direita
Unilateral esquerdaUnilateral esquerda
Escolher Escolher uma das trêsuma das três
Exemplo: Para verificar, entre métodos de ensino, qual dá melhor desempenho quanto ao aprendizado dos alunos, comparamos as notas dos alunos de duas turmas (duas amostras), cada uma submetida a um método de ensino.
População 1 População 2
Estimativa de µµµµ1
População 1
Amostra 1
População 2
Amostra 2
Estimativa de µµµµ2
1x 2x
6
BilateralBilateral
Unilateral direitaUnilateral direita
Unilateral esquerdaUnilateral esquerda
Escolher Escolher uma das trêsuma das três
21A µµ:H ≠
21 µµ >
21 µµ <
210 µµ:H =
Exemplo 1: TesteTeste unilateralunilateral
ProblemaProblema científicocientífico:: Um novo medicamento é eficaz nocontrole da pressão arterial?
População CPopulação C – pacientes com uso do medicamento µµCCPopulação CPopulação C – pacientes com uso do medicamentoPopulação SPopulação S – pacientes sem uso do medicamento
Variável em estudo Variável em estudo →→ X: pressão arterial
µµCC
µµSS
SC0 µµ:H =Hipóteses estatísticas:Hipóteses estatísticas:
7
UnilateralUnilateral
QuandoQuando temostemos motivosmotivos suficientessuficientes parapara suporsupor queque umaumadasdas médiasmédias seráserá maiormaior queque aa outra,outra, podemospodemos formularformularumauma hipótesehipótese alternativaalternativa unilateralunilateral ((maismais específicaespecífica ))..
SCA µµ:H <SC0
Exemplo 2: TesteTeste bilateralbilateral
Problema científico:Problema científico: O método de ensino A é melhor que o método de ensino B?
População APopulação A – alunos ensinados pelo método A µµAAPopulação APopulação A – alunos ensinados pelo método APopulação BPopulação B – alunos ensinados pelo método B
Variável em estudo Variável em estudo →→ X: notas dos alunos
µµAA
µµBB
µµ ≠BA0 µµ:H =
Hipóteses estatísticas:Hipóteses estatísticas:
8
BAA µµ:H ≠ BilateralBilateral
Quando Quando não temos motivosnão temos motivos suficientes para supor que suficientes para supor que uma das médias será maior que a outra, formulamos uma uma das médias será maior que a outra, formulamos uma
hipótese alternativa bilateralhipótese alternativa bilateral ((mais genéricamais genérica ). ).
Objetivo: verificar a hipótese
Podemos verificar a hipótese de duas formas:�������� avaliar as populações inteiras (todos os alunos ensinado
pelos dois métodos ou todas os pacientes com e sem uso do medicamento) e comparar suas médiasmedicamento) e comparar suas médias�������� avaliar amostras retiradas das populações e utilizar um
teste estatístico que compare as médias das amostras
Devemos considerar:�������� seria impossível avaliar todos os alunos ou todos os
pacientes
9
Será muito mais econômico e menos trabalhoso Será muito mais econômico e menos trabalhoso utilizar amostras das populações.utilizar amostras das populações.
pacientes�������� o processo de amostragem pode fornecer precisão suficiente
Exemplo: Suponha que um grupo econômico queira financiar a campanha do candidato X, se esse tiver condições de se eleger no primeiro turno.
O grupo econômico deve financiar a campanha do candidato X?
Erros de conclusão
O grupo econômico deve financiar a campanha do candidato X?
Hipótese
O candidato se elege no primeiro
turno
Decisão
Investir na campanha
Não investir na campanha
HipóteseHipóteseVerdadeira
HipóteseFalsa
10
Decisão corretaInveste e ganha
ErroInveste e perde
ErroNão investe e se elege
Decisão corretaNão investe e não ganha
Erro 1Erro 1AcertoAcerto
Decisão do juiz Réu
Não condenar Condenar
Inocente
Erros de conclusão
culpado réu:H
inocente réu:H
A
0
Decisão H0
Não rejeitar Rejeitar
Verdadeira Erro Tipo IErro Tipo IAcertoAcerto
Erro 1Erro 1
Erro 2Erro 2 AcertoAcerto
AcertoAcertoInocente
Culpado
BA0 µµ:H =
culpado réu:H A
11
Verdadeira
Falsa
Erro Tipo IErro Tipo I
Erro Tipo IIErro Tipo II AcertoAcerto
AcertoAcerto
ββββββββ = = Erro Tipo II:Erro Tipo II: Não declarar diferença quando ela existe
αααααααα = = Erro Tipo I:Erro Tipo I: Declarar diferença quando ela não existe
BAA
BA0
µµ:H ≠
Importante!!!Importante!!!
�������� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o
�������� As duas taxas de erro αααααααα e ββββββββ estão relacionadasrelacionadas negativamentenegativamente,de modo que a reduçãoredução dede αααααααα implica no aumentoaumento dede ββββββββ e vice-versa.
�������� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o tamanho da amostratamanho da amostra, o que nem sempre é viável.
�������� Em geral, a preocupação está voltada para o erro tipo I (α - nívelde significância), pois na maioria dos casos ele é considerado omais grave.
REALIDADE
DECISÃOAceitar H 0 Rejeitar H 0
12
REALIDADE Aceitar H 0 Rejeitar H 0
H0 é verdadeiraDecisão correta
1 - α = P(Aceitar H0 / H0 é V)
= P(H0 / H0)
Erro do Tipo Iαααα = P(Rejeitar H0 / H0 é V) = Nível de
significância do teste = P(H1 / H0)
H0 é falsa
Erro do Tipo IIββββ = P(Aceitar H0 / H0 é falsa)
= P(Aceitar H0 /H1 é V) = P(H0 /H1)
Decisão correta1 - ββββ = P(Rejeitar H0 / H0 é falsa)
= P(H1 / H1) = Poder do teste.
Passos para construção de um teste de hipóteses
11.. Definir as hipóteses estatísticas.
33.. Escolher a estatística para testar a hipótese everificar as pressuposições para o seu uso.
22.. Fixar a taxa de erro aceitável (α - nível de significância).
44.. Usar as observações da amostra para calcular o valorda estatística do teste.
13
55.. Decidir sobre a hipótese testada e concluir.
da estatística do teste.
Situações comuns em testes de hipóteses a respeito de µµµµµµµµ
1.1. Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)
� σ2 conhecida ou n > 30
2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)
�Duas amostras independentes
� σ12 e σ2
2 conhecidas
� σ2 desconhecida e n ≤ 30
14
� σ12 e σ2
2 conhecidas
� σ12 e σ2
2 desconhecidas , mas iguais
� σ12 e σ2
2 desconhecidas , mas diferentes
�Duas amostras dependentes (pareadas)
Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 conhecida (ou n > 30)
1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)
N(0,1)~
n
XZ
σ
µ0−=
Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0
Estatística do teste:Estatística do teste:
Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra
15
Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 desconhecida (e n ≤ 30)
1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)
Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0
~ tνEstatística do teste:Estatística do teste:
nSµX
T 0−=
16
onde:
ν = n – 1
n
Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra
≠A 0H :µ µ
=0 0H :µ µ
µX −=
Critério de decisão Critério de decisão –– Teste bilateralTeste bilateral
HHAA bilateralbilateral supõe que a diferença
é negativa ou positiva .0X - µ
Mas quão grande
αααααααα/2/2
tα/2
αααααααα/2/2
-tα/2 0
Não rejeição de H0
Rejeição de H
Rejeição de H0
Este limite é dado Este limite é dado pelos valores pelos valores
críticos.críticos.
n
SµX
T 0−= Mas quão grande será essa diferença
para ser considerada significativa?
17
Não rejeição de H0
�������� Se o valor t (calculado na amostra) estiver entre --ttαα/2/2 e ttαα/2/2, não temos motivos para rejeitar H0
�������� Se o valor t (calculado na amostra) for menor que --ttαα/2/2 ou maior que ttαα/2/2, rejeitamos H0
de H0de H0 críticos.críticos.
HHAA unilateral unilateral direitadireitasupõe que a diferença
é um valor positivo .0X - µ
µX −=
Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral
>A 0H :µ µ
=0 0H :µ µ
0 tα
αααααααα
Rejeição Não rejeição
n
SµX
T 0−=Mas quão grande
será essa diferença para ser considerada
significativa?
Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.
18
Rejeição de H0
���� Se o valor t (calculado na amostra) for menor que tα, não temosmotivos para rejeitar H0
���� Se o valor t (calculado) for maior que tα, rejeitamos H0
Não rejeição de H0
pelo valor crítico.pelo valor crítico.
HHAA unilateral unilateral esquerdaesquerdasupõe que a diferença
é um valor negativo .0X - µ
<A 0H :µ µ
=0 0H :µ µ
µX −=
Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral
0-tα
αααααααα
Rejeição
Mas quão grande será essa diferença
para ser considerada significativa?
Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.
n
SµX
T 0−=
19
Não rejeição de H0
Rejeição de H0
�������� Se o valor t (calculado na amostra) for maior que --ttαα, não temos motivos para rejeitar H0
�������� Se o valor t (calculado) for menor que --ttαα, rejeitamos H0
pelo valor crítico.pelo valor crítico.
Exemplo: Um processo deveria produzir bancadas com 0,85 mde altura. O engenheiro desconfia que as bancadas que estãosendo produzidas são diferentes que o especificado. Umaamostra de 8 valores foi coletada e indicou média de 0,87 edesvio padrão de 0,010. Sabendo-se que os dados seguem adistribuição normal, teste a hipótese do engenheiro usando umnível de significância α=0,05.nível de significância α=0,05.Solução:
nSµX
T 0−=
0,85H0: µ =
0,85HA: µ ≠
0,87 - 0,85= 5,66t =
1) 2) α=0,05
3) Pressuposição:Pressuposição: A variável em estudo tem distribuição normal
4)
5)0,025 0,025
0
ν=n-1=7
20
0,87 - 0,85= 5,66
0,010/ 8tc =4)
Não se rejeita HNão se rejeita H0Rejeita HRejeita H00Rejeita HRejeita H00
Conclusão: Ao nível de 5% de significância, conclui-se que asbancadas que estão sendo produzidas devem ter alturadiferente do especificado, maiores que 0,85m.
-2,365 +2,3650
Exercício proposto: A associação dos proprietários de
indústrias metalúrgicas está preocupada com o tempo perdido
em acidentes de trabalho, cuja média, nos últimos tempos, tem
sido da ordem de 60 horas/homem por ano com desvio padrão
de 20 horas/homem, segundo a distribuição normal. Tentou-se2)2)
de 20 horas/homem, segundo a distribuição normal. Tentou-se
um programa de prevenção de acidentes e, após o mesmo,
tomou-se uma amostra de 9 indústrias e mediu-se o número de
horas/homem perdidas por acidente, que foi de 50 horas. Você
diria, ao nível de 5%, que há evidência de melhora?
Solução:
As hipóteses a serem testadas são:
H0: µ = 60 hora/homens
HA: µ < 60 hora/homens
21
1)
Solução:
1,50
920
6050
nσ
µXz 0 −=−=−= 3) α=0,05
4)
Isto quer dizer que a diferença apresentada na amostra não é5) Isto quer dizer que a diferença apresentada na amostra não ésuficientemente grande para provar que a campanha deprevenção deu resultado. Então a conclusão é:
“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”
22
5)
Exercício proposto: O tempo médio, por operário, para executaruma tarefa, tem sido 100 minutos, segundo a distribuição normal.Introduziu-se uma modificação para diminuir este tempo, e, apóscerto período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução gasto por cada um. O tempo médio daamostra foi 91 minutos com desvio padrão de 12 minutos. Este
2)
resultado evidencia uma melhora no tempo gasto para realizar atarefa? Apresente as conclusões ao nível de 5% de significância.
Solução:
H0: µ = 100
HA: µ < 100
α=0,05ν=n-1=15
-1,753
1)
3)
23
Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.
T =
nsµx 0−
-1,753
=
1612
10091− = -3 4)
5)
Exercício: Medidos os diâmetros de 31 eixos de um lotealeatório, produzido pela empresa “Sofazredondo S.A.”obteve-se a distribuição abaixo:
Diâmetros (em mm) 56,5 56,6 56,7 56,8 56,9 57,0 57,1 57,2 57,3Número de eixos 1 2 2 4 10 5 4 2 1
Ao nível de significância de 5%, há evidência de que odiâmetro médio dos eixos esteja fora da especificação de57 mm?
Z = -2,557
Número de eixos 1 2 2 4 10 5 4 2 1
Zc = -2,557
24
Valor p:Valor p: Probabilidade de que seja obtido um valor de T mais extremo que o valor observado, dado que H0 é verdadeira
Outro critério de decisão Outro critério de decisão
c
25
c
Se p ≥ α
Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?
�� Se o valor pvalor p for maior ou igual a α: não rejeitamosnão rejeitamos a hipótese nula, pois tt cc está em uma região de alta probabilidade
Não rejeitamos a hipótese de nulidade
26
c
Se p < α
Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?
�� Se o valor pvalor p for menor que α: rejeitamosrejeitamos a hipótese nula, pois tt cc está em uma região de baixa probabilidade
Rejeitamos a hipótese de nulidade
27
c
Exemplo: programa de prevenção de acidentes
1,50
920
6050
nσ
µXz 0 −=−=−=
H0: µ = 60 hora/homensHA: µ < 60 hora/homens
-1,645 -1,50
p = 0,0668
α = 0,05
“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”
-1,645 -1,50
28
Exercício: O tempo médio, por operário, para executar uma tarefa, temsido 100 minutos, segundo a distribuição normal. Introduziu-se umamodificação para diminuir este tempo, e, após certo período, sorteou-seuma amostra de 16 operários, medindo-se o tempo de execução gastopor cada um. O tempo médio da amostra foi 91 minutos com desviopadrão de 12 minutos. Este resultado evidencia uma melhora no tempogasto para realizar a tarefa? Apresente as conclusões ao nível de 5% degasto para realizar a tarefa? Apresente as conclusões ao nível de 5% designificância.
Solução:
H0: µ = 100
HA: µ < 100
α=0,05 e ν=n-1=15
-1,753
29
Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.
tc =
nsµx 0−
=
1612
10091− = -3
-1,753
Qual o valor p?p < αααα
p ≅≅≅≅ 0,005 (0,5%)
Utilizando o Excel para obter o valor p:
tc = -3 α = 0,05 ν = n-1 = 15
30
Conclusão: Como a significância do resultado (0,45%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.
Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1
2 e σ22 são conhecidas
As amostras retiradas das populações são independentes
2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)
N(0,1)~
nσ
nσ
XXZ
22
21
21
+
−=
As amostras retiradas das populações são independentes
Hipótese sob verificação:Hipótese sob verificação: 210 µµ:H =
Estatística do teste:Estatística do teste:
nn 21
+
Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra
31
Exemplo: Um fabricante produz dois tipos de pneus. Para o pneu dotipo A o desvio padrão é de 2500 km e para o pneu do tipo B é de3000 km, seguindo a distribuição normal. Uma empresa de táxistestou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km demédia para o tipo A e 26000 para o tipo B. Adotando α = 4% testar ahipótese de que a duração média dos dois tipos é a mesma.
Solução:
As hipóteses são: H0: µA = µBHA: µA ≠ µB
Como α = 4%, então zα/2 = 2,055
3,38
40
3000+
502500
2600024000z
22c −=−=
Portanto, rejeita-se a hipótese de igualdade entre as duraçõesmédias dos dois tipos de pneus. Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos depneus diferem quanto a durabilidade média, sendo o tipo B melhorque o tipo A.
Como α = 4%, então zα/2 = 2,055
32
Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1
2 e σ22 são desconhecidas mas supostas iguais
As amostras retiradas das populações são independentes
2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)
Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =
~ tνEstatística do teste:Estatística do teste:
onde: 2
21
S11
XXT
+
−=
33
onde:
ν = (n1 – 1) + (n2 – 1)21
Snn
+
Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra
( ) ( )( ) ( )1n1n
1nS1nSS
21
2221
212
−+−−+−=
Exemplo:
Dez cobaias adultas criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do experimento. pesadas no início e no final do período de duração do experimento. Os ganhos de peso (em gramas) observados foram os seguintes:
Utilize um teste de hipótese, ao nível α = 0,01, para verificarse as duas rações diferem entre si quanto ao ganho de peso.
Ração experimental 220 200 210 220 210
Ração padrão 200 180 190 190 180
34
se as duas rações diferem entre si quanto ao ganho de peso.
210 µµ :H =α = 0,01
21A µµ :H ≠2x = 188
= 70
ExperimentalExperimental
2
1s
n1 = 5
= 212
= 70
PadrãoPadrão
n2 = 5
1x
2
2s
Pressuposições : variável ganho de peso com distribuição normal, amostras independentes e supõe-se que .2
221 σ=σ
( ) ( )( ) ( )1n1n
1nS1nSS
21
2221
212
−+−−+−=
( ) ( )( ) ( ) 70
1515157015702s =
−+−−×+−×=
4,54
7051
51
188212tc =
+
−=2
21
21
Sn1
n1
XXT
+
−=
α=0,01 e ν=(n1-1)+(n2-1)=80,99
35
Conclusão: ao nível de 1%, conclui-se que a ração experimental deve dar maior ganho de peso que a ração padrão.
⇒ H0 é rejeitada0,005 0,005
3,355-3.355
Utilizando o Excel para obter o valor p:
tc = 4,54 α = 0,01 ν = (n1-1)+(n2-1) = 8
36
Conclusão: Como a significância do resultado (0,19%) é menor que a significância do teste (1%), é possível rejeitar a hipótese nula.
Exercício: Um engenheiro desconfia que a qualidade de um material pode depender da matéria-prima utilizada. Há dois fornecedores de matéria-prima sendo usados. Testes com 10 observações de cada fornecedor indicaram:
=
Use um nível de significância α = 0,05 e teste a hipótese do engenheiro.
Obs.: Considere que as duas variâncias populacionais iguais.
39 x1 = 7s1 =43x2 = 9s2 =
Obs.: Considere que as duas variâncias populacionais iguais.
101,2t11,1t 18;025,0c =<=
37
Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1
2 e σ22 são desconhecidas e desiguais
As amostras retiradas das populações são independentes
2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)
22
21
21
SS
XXT
+
−=
As amostras retiradas das populações são independentes
Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =
~ tνEstatística do teste:Estatística do teste:
38
2
2
1
1
nn+
onde:
Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra 1n
)nS(1n)nS(
)nSnS(
2
22
22
1
21
21
2 2
221
21
−+
−
+=ν
Exemplo: As resistências de dois tipos de concreto, que segue o modelonormal, foram medidas, mostrando os resultados da tabela. Fixado umnível de significância de 10%, existe evidências de que o concreto do tipoX seja mais resistente do que o concreto do tipo Y?
Tipo X 54 55 58 50 61
Tipo Y 51 54 55 52 53
Os dados obtidos da tabela são:
X = 55,6 e Y = 53,0
S2 = 17,3 e S2 = 2,5 Tipo Y 51 54 55 52 53
XS2 = 17,3 e YS2 = 2,5
H0: µX = µYHA: µX ≠ µY
α = 0,10 α = 10% e ν = 5
5,133,0554
15,6816
4)52,5(
4)517,3(
)52,5517,3(22
2
==+
+=
1n)nS(
1n)nS(
)nSnS(
2
22
22
1
21
21
2 2
221
21
−+
−
+=ν
39
Com estas amostras, ao nível de 10% de significância, não é possível afirmarque o concreto do tipo X seja mais resistente do que o concreto do tipo Y.
2
22
1
21
21
nS
nS
XXT
+
−=0,05 0,05
2,015-2,015
1,31
52,5
517,3
53,055,6 =+
−=
Utilizando o Excel para obter o valor p:
tc = 1,31 α = 0,10 ν = 5
40
Conclusão: Como a significância do resultado (24,71%) é maior que a significância do teste (10%), não é possível rejeitar a hipótese nula.
α = 0,05No teste unilateral o valor t crítico é menor porque a área a sua direita deve corresponder a todo α. Assim, esta área é o dobro da área à direita do valor t crítico do teste à direita do valor t crítico do teste bilateral.
Como consequência, um valor t não rejeitado no teste bilateral pode ser
41
teste bilateral pode ser rejeitado no teste unilateral. Portanto, o teste unilateral é mais poderoso que o teste bilateral.
�������� Os intervalosintervalos dede confiançaconfiança e os testestestes dede hipóteseshipótesesbilateraisbilaterais são procedimentos estatísticos relacionados.
�������� Se forem utilizados para analisar os mesmos dados, ao
ConsideraçõesConsiderações
�������� Se forem utilizados para analisar os mesmos dados, aomesmo nível de significância, devem conduzir aos mesmosresultados.
�������� O intervalo de confiança para uma médiauma média está relacionadocom o teste de hipóteses que compara uma média com umcompara uma média com umpadrãopadrão.H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo
42
�������� O intervalo de confiança para a diferença entre duasdiferença entre duasmédiasmédias está relacionado com o teste de hipóteses quecompara duas médiascompara duas médias.H0 não rejeitada ⇔⇔ zero está coberto pelo intervalo
H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo
Intervalo de confiança para uma média (Intervalo de confiança para uma média (µµ))
IC (µ; 1−−−−α): ± tαααα/2n
SX
EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))
n
SµX
T 0−=
�������� Se no teste de hipóteses, ao nível de 1% de significância,
Valor crítico: tαααα/2
�������� Se no teste de hipóteses, ao nível de 1% de significância,rejeitamos H0, significa que a diferença entre a média e o valorpadrão não é zero, ou seja, média e valor padrão são diferentes.
�������� Construindo o intervalo de confiança para µ, ao nível de 99%,devemos esperar que o valor padrão (µ0) esteja fora do intervalo.Caso contrário, os resultados seriam contraditórios.
43
Intervalo de confiança para a diferença entre duas médias (Intervalo de confiança para a diferença entre duas médias (µµ11 −− µµ22))
EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))
IC ( ; 1−−−−α): ± tαααα/22
21
Sn1
n1
+21 XX −21 µµ −
EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))
�������� Se no teste de hipóteses, ao nível de 5% de significância, não
Valor crítico: tαααα/22
21
21
Sn1
n1
XXT
+
−=
�������� Se no teste de hipóteses, ao nível de 5% de significância, nãorejeitamos H0, significa que a diferença entre as duas médias é zero,ou seja, as médias devem ser iguais.
�������� Construindo o intervalo de confiança, ao nível de 95%, para adiferença entre as médias (µ1−µ2), devemos esperar que o valorzero seja coberto pelo intervalo.
44
Exemplo: Um novo funcionário foi contratado para gerir os estoques da empresa. Ele recebeu a informação de que a quantidade semanal vendida de determinado produto é de 9,6kg. Para testar a veracidade da informação, tomou uma amostra aleatória de 30 semanas e verificou que a venda média do produto foi de 9,3kg, com desvio padrão de 3,2kg. Considerando que a variável em estudo segue a distribuição normal:
a) Verifique, utilizando teste de hipóteses ao nível de 5% de significância, se a informação recebida pelo funcionário é verdadeira.
45
b) Verifique se a informação é verdadeira, utilizando intervalo de confiança ao nível de 95%.
c) Houve coerência entre os resultados do teste de hipóteses e do intervalo de confiança?
a) Teste de Hipótese
Variável em estudo: X = venda do produto (kg)
Pressuposição: A variável em estudo tem distribuição normal
1. Hipóteses estatísticas: 9,6:HA ≠µ
9,6:H0 =µ
46
2. Taxa de erro aceitável: α = 0,05
a) Teste de Hipótese
3. Estatística do teste
sµx
T 0−= 0,51353,2
9,69,3 −=−=
4. Decisão e conclusão
ns
303,2
0,025 0,025
2,045-2,045
α = 5% e ν = 29
47
Não rejeitamos H0. Concluímos, ao nível de 5% de significância,que a quantidade média de venda semanal do produto nãodifere significativamente do valor informado (9,6kg). Portanto, ainformação recebida pelo funcionário pode ser verdadeira.
b) Intervalo de confiança
Variável em estudo: X = venda do produto (kg)
Pressuposição: A variável em estudo tem distribuição normal.
Estimativas:
=x 9,3 ν = 30 − 1 = 29
/2S
IC( ; 1 ) : X tn
α− ±µ α
48
=x 9,3
= =s 3,20,5842
n 30
ν = 30 − 1 = 29
t0,025 (29) = 2,045
b) Intervalo de confiança
IC (µ; 0,95): 9,3 ± 2,045 × 0,5842Limite inferior = 9,3 – 1,195 = 8,11
/2S
IC( ; 1 ) : X tn
α− ±µ α
Limite inferior = 9,3 – 1,195 = 8,11Limite superior = 9,3 + 1,195 = 10,50
P(8,11 < µ < 10,50) = 0,95
Concluímos que o intervalo de confiança, ao nível de 95%, para a verdadeira quantidade média semanal vendida do produto é de 8,11 a 10,50 kg.
49
c) Sim, o resultado do teste de hipóteses esta coerente com o do intervalo de confiança, pois o valor padrão 9,6, que segundo o teste de hipótese não difere de µ, está dentro do intervalo de confiança, ou seja, é um valor possível para µ.
Comparação de Pares de Observações(Comparação de duas médias para amostras pareadas)
Em algumas situações os dados de duas populações são coletados ecomparados em pares. Isso é feito para impedir que fatores nãocontroláveis inflacionem as estimativas das variâncias.controláveis inflacionem as estimativas das variâncias.
Exemplo: desempenho dos alunos com método A e B
X
hidratação da pele com creme A e B
A hipótese testada é se existe diferenças significativas entre os paresde observações, tendo como suposição que os dados seguem adistribuição normal.
50
distribuição normal.
O teste baseia-se na estatística:
1n
d
t~n/s
dT −=
)
)
)
)
21d
21d
21dA
21d0
( 0
( 0
( 0:H
( 0 :H
µµµ
µµµ
µµµ
µµµ
<<>>≠≠==
Exemplo: Cinco operadores de máquinas foram treinados emduas máquinas de diferentes fabricantes, para verificar qualdelas apresentava maior facilidade de aprendizagem. Mediu-seo tempo que cada um dos operadores gastou na realização deuma mesma tarefa com cada um dos dois tipos de máquinas.Os resultados estão na tabela. Ao nível de 5%, é possívelOs resultados estão na tabela. Ao nível de 5%, é possívelafirmar que a tarefa realizada na máquina X demora mais doque na máquina Y?
Solução:
H0: µX = µY (µd = 0)
H : µ ≠ µ (µ ≠ 0)
Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78
d i
52567
51
HA: µX ≠ µY (µd ≠ 0) 5 85 78
n/s
dT
d
=
7
α = 5%
� = 5 e sd = 1,8708
Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78
d
d i
52567
1-n
)d(dS
2i
d∑ −
=n
dd i∑=
5,9851,8708/
5
n/s
dt
d
===� α = 5% e ν = n - 1 = 4
52
Com 5% de significância, rejeita-se H0, e conclui-se que realizar atarefa com a máquina X deve demorar mais do que com amáquina Y, esta apresentando maior facilidade de aprendizagem.
2,776-2,776
Exercício: Uma empresa quer verificar se o conhecimento de seus funcionários a respeito de um determinado assunto melhorou após 30 horas de treinamento. Para isso foi realizado com os quinze alunos do treinamento um teste antes e após o treinamento. Os dados a seguir representam as notas obtidas. treinamento. Os dados a seguir representam as notas obtidas. Conclua a respeito da eficiência do treinamento, utilizando 5% de significância.
Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes 6,5 6,7 7,0 7,0 6,5 7,3 7,8 6,9 6,7 7,2 7,5 7,5 7,2 7,0 6,8 Depois 7,5 7,7 7,9 8,0 7,4 8,3 8,8 8,9 7,7 8,2 8,5 8,5 8,2 8,0 8,8 Difer. 1,0 1,0 0,9 1,0 0,9 1,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 1,0 2,0
53
360S
121d
d ,
,
==
Exercício: Duas espécies de um certo tipo de cereal estão sendo testadas quanto ao seu crescimento. O experimento foi feito escolhendo 10 blocos de terreno e plantando em cada bloco mudas de ambas as espécies. Os resultados a seguir são as alturas medidas ao final do primeiro mês. Utilizar α = 0,05as alturas medidas ao final do primeiro mês. Utilizar α = 0,05
Os dados deste experimento foram coletados aos pares para
Terreno 1 2 3 4 5 6 7 8 9 10 Espécie 1 22 27 18 33 25 21 15 33 21 24 Espécie 2 21 31 24 32 29 23 19 37 22 27
Os dados deste experimento foram coletados aos pares para impedir que as diferenças de fertilidade entre os blocos de terreno (que podem ser grandes) mascarem os resultados.
262,2t54,3t 9;025,0c =>=
54
Teste para a variância de uma população
Para aplicar o teste para a variância é necessário supor anormalidade da população de onde será extraída a amostra.
Uma hipótese testada com frequência é que a variância tenhaUma hipótese testada com frequência é que a variância tenhaum valor especificado.
20
2
20
2
20
2A
20
20
σσ
σσ
σσ:H
σσ:H
<
>
≠
=H0 é rejeitada se qc ultrapassar o valorcrítico da distribuição qui-quadrado :
55
A estatística do teste é
~−= −χσ
2
20
2(n 1)SQ (n 1)
0σσ <
56
...
Exercício: A quantidade mensal de produtos entregues por uma empresa segue uma distribuição Normal com média e variância desconhecidas. Analise os dados a seguir, que representam uma amostra de 20 meses e teste a hipótese de que o desvio padrão da quantidade mensal de produtos entregues pela empresa é de 1 unidade, utilizando nível de significância de 5%.unidade, utilizando nível de significância de 5%.
Solução: H0: σ2 = 1
HA: σ2 ≠ 1
( )( ) 2− 2,5%
95%
α = 5%ν = n - 1 = 19
17,4 18,2 18,3 18,8 19,0 19,2 19,3 19,6 19,6 19,920,2 20,2 20,5 20,7 20,9 21,0 21,3 21,5 21,9 22,6 34,1S
01,20X
==
57
Com 5% de significância, rejeita-2 H0, isto é, é possível afirmar que odesvio padrão da quantidade mensal de produtos entregues pelaempresa é maior que 1 unidade.
( )34,12
11,34 1-20 2
==( )
20
2
σ
S1nQ
−= 8,91 32,85
2,5%2,5%
Utilizando o Excel para obter o valor p:
qc = 34,12 α = 0,05 ν = 19
58
Como a significância do resultado (3,5575=2*1,7788) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.
Exemplo: Uma das maneiras de controlar a qualidade de umproduto é controlar a sua variabilidade. Uma máquina deempacotar café está regulada para encher os pacotes commédia de 500 g e desvio padrão de 10 g, onde o peso de cadapacote distribui-se normalmente. Colhida uma amostra de n=16,observou-se uma variância de 169 g2. É possível afirmar comobservou-se uma variância de 169 g . É possível afirmar comeste resultado que a máquina está desregulada quanto avariabilidade, supondo uma significância de 5%?
Solução: H0: σ2 = 100
HA: σ2 > 100
( )169 15( ) 2S1n −
95%α = 5%ν = n - 1 = 15
Com 5% de significância, rejeita-se H0, ou seja, é possívelafirmar que a máquina está desregulada.
59
( )25,35
100169 15 ==
( )20
2
σ
S1nQ
−=25,00
5%
Utilizando o Excel para obter o valor p:
qc = 25,35 α = 0,05 ν = 15
60
Como a significância do resultado (4,54%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.
Teste de homogeneidade de variâncias
Considerando duas estimativas e , frequentemente, temosinteresse em verificar se tais estimativas são homogêneas.
21s 2
2s
Assim, as hipóteses a serem testadas são:
22
21A
22
210
σσ:H
σσ:H
≠
=H0 é rejeitada se fc ultrapassar ovalor crítico da distribuição F:
61
A estatística do teste é
22
21
SS
F =Atenção : sempre variância maior sobre variância
menor
62
...
Exemplo: As resistências de dois tipos de concreto forammedidas, mostrando os resultados da tabela. Fixado um nível designificância de 10%, teste a hipótese de igualdade das variâncias,considerando que os dados seguem a distribuição normal?
Tipo X 54 55 58 50 61 Os dados obtidos da tabela são:
X = 55,6 e Y = 53,0 Tipo Y 51 54 55 52 53
X = 55,6 e Y = 53,0
XS2 = 17,3 e YS2 = 2,5
H0: σ2X = σ2YHA: σ2X ≠ σ2Y α = 10%
ν1 = nx - 1 = 4
ν2 = ny - 1 = 4
2
63
Neste caso, rejeita-se H0, ao nível de 10% de significância, eassume-se que as variâncias populacionais são diferentes.
6,922,5
17,3 ==6,39
0,050,0522
21
SS
F =
Utilizando o Excel para obter o valor p:
fc = 6,92 α = 10% ν1 = nx - 1 = 4 ν2 = ny - 1 = 4
64
Conclusão: Como a significância do resultado (8,76% = 4,38 x 2) é menor que a significância do teste (10%), é possível rejeitar a hipótese nula.
Exercício: Uma alta quantidade de nitrato introduzida na alimentação animal tem mostrado possuir efeitos danosos incluindo baixa produção de tiroxina, aumento de incidência de cianose em recém nascidos e baixa produção de leite. Os dados que seguem referem-se a medida de ganho de peso percentual em ratos de laboratório, submetidos a uma dieta padrão e a uma dieta com 2000 ppm de nitrato na água de beber.
2 ==Nitrato: 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2Controle: 18,2 32,9 10,0 14,3 16,2 27,6 15,7.
a) Verifique, através do teste F, se as variâncias das populações são iguais.b) Verifique, através do teste t, o efeito do nitrato sobre o ganho de peso.
21 XXT
−= ( ) ( )1nS1nS 22 −+−
64,85s 19,27x
12,66s 15,07x2CC
2NN
==
==
65
22
21
SS
F =
2
22
1
21
21
nS
nS
XXT
+
−=
2
21
Sn1
n1
T
+
= ( ) ( )( ) ( )1n1n
1nS1nSS
21
2221
212
−+−−+−=
22
21A
22
210
σσ:H
σσ:H
≠
=
1n)nS(
1n)nS(
)nSnS(
2
22
22
1
21
21
2 2
221
21
−+
−
+=ν
Exercício: Calculadoras eletrônicas utilizam dois métodos diferentes de entrada e processamento numérico. Vamos denominar um dos métodos de “método algébrico” (MA) e o outro de “método polonês” (MP). Para comparar qual deles é mais eficaz é feito um teste com 20 usuários sem experiência prévia com calculadoras, onde 10 vão utilizar calculadoras de um tipo e o outros 10 as de outro tipo. A tabela mostra o tempo em segundos que cada operador gastou para realizar um conjunto padrão de cálculos. Testar a hipótese de existência de diferença entre os dois cálculos. Testar a hipótese de existência de diferença entre os dois métodos no que se refere ao tempo de operação, utilizando uma significância de 5%.
MA 12 16 15 13 16 10 15 17 14 12
MP 10 17 18 16 19 12 17 15 17 14 2,80s 15,50x
2,21s 14,00x
PP
AA
==
==
Exercício: Os valores a seguir representam os tempos de produção de
66
Exercício: Os valores a seguir representam os tempos de produção de duas máquinas. Analise os dados e conclua a respeito da variabilidade das máquinas 1 e 2:
8307,021 =S 316,12
2 =S
M1 91,0 90,3 90,2 92,1 91,8 91,3 89,3, 91,0 91,2 89,6M2 91,8 91,2 89,4 89,2 90,7 92,6 91,3 91,2
Teste para proporções
O teste para a proporção populacional, em geral, é utilizadopara verificar se a proporção π de elementos da população quepossuem uma determinada característica é igual a umdeterminado valor π .determinado valor π0.
As hipóteses estatísticas são:
0
0
0
ππππππ
>≠=
:H
:H
A
0
Usa-se a estatística:
( ) N(0,1)~
n1
pZ
00
0
πππ−
−=
67
O teste se baseia na aproximação da distribuição Normal.
Pressuposição: n é grande ⇒ np > 5 e n(1-p) > 5p → estimador de π
0
0
ππ <
nx
p =
n
Exemplo: As condições de mortalidade de uma região são taisque a proporção de nascidos que sobrevivem até 70 anos é de0,60. Testar esta hipótese ao nível de 5% de significância se em1000 nascimentos amostrados aleatoriamente, verificou-se 530sobreviventes até os 70 anos.
Solução : 0,53530p ==Solução :
0,60 :H0 =π
( )p
z 0π
−−=
1,96-1,96
0,531000530p ==
0,60:HA ≠π
( ) 4,520,600,53 −=−
−=
α = 0,05
68
Decidi-se rejeitar H0, ao nível de 5% de significância.
Neste caso, pode-se afirmar que a taxa dos que sobrevivem até os 70 anos é menor do que 60%.
( )n
1z
00 ππ −= ( ) 4,52
10000,6010,60
−=−
=
Exercícios :
1) Um fabricante garante que 90% dos equipamentos que
fornece a uma fábrica estão de acordo com as especificações
exigidas. O exame de uma amostra de 200 peças desseexigidas. O exame de uma amostra de 200 peças desse
equipamento revelou 25 defeituosas. Teste a afirmativa do
fabricante, nos níveis de 5% e 1%.
2) Um engenheiro deseja testar a hipótese de que seu
Zc=1,18
fornecedor entrega lotes com 10% de não conformes. Um lote
de 180 unidades revelou 14 não conformes. Use α = 5% e
conclua a respeito.Zc=-0,98
69
A aproximação Normal também pode ser usada para testara hipótese que dois parâmetros de Binomiais sejam iguais,ou seja, para testar:
21
21A
210
:H
:H
ππ
ππ
ππ
>≠=
Nesse caso, amostras de tamanho n1 e n2 são retiradasde cada população, gerando x1 e x2 itens pertencentes àclasse associada com p e calcula-se os estimadores de ππππpara cada população como: 1
1 nx
p =
21
21
ππ
ππ
<>
22 n
xp =
( ) ( ) N(0,1)~
n
p1p+
np1p
ppZ
2
22
1
11
21
−−−=
70
A estatística para o teste é:
11 n
p =2
2 np =
Exemplo: Em uma pesquisa de opinião, 32 dentre 80 homensdeclararam apreciar certa revista, acontecendo o mesmo com26 dentre 50 mulheres. Ao nível de 5% de significância oshomens e as mulheres apreciam igualmente a revista?Solução : H0: πH = πM
π ≠ πpH = 32 / 80 = 0,40p = 26 / 50 = 0,52HA: πH ≠ πM
( ) ( )
np1p
+n
p1p
ppZ
M
MM
H
HH
MH
−−−=
Não se rejeita H , isto é, a
HpM = 26 / 50 = 0,52
α = 0,05
1,34
500,52)0,52.(1-
800,40)0,40.(1-
0,520,40 −=
+
−=
71
1,96-1,96
Não se rejeita H0, isto é, a5% de significância, não épossível afirmar que existadiferença entre aspreferências de homens emulheres quanto à revista.
Exercício: Um empresário deseja saber se os percentuais desatisfação de seus clientes em relação a dois produtosoferecidos por sua empresa são similares. Para isso entrevistou150 pessoas, das quais 80 disseram estar satisfeitas com oproduto A e 100 com o produto B. Use α = 5% e conclua arespeito.respeito.
21
210
:
:
ππππ
≠=
AH
H 530150
80p1 ,== 0,67
150
100p2 ==
( ) ( ) 47,20567,0
14,0
33,0.67,047,0.53,0
67,053,0
p1pp1p
ppZ 21 −=−=
−=−−
−= ( ) ( ) 0567,0
15033,0.67,0
15047,0.53,0
np1p
np1p
2
22
1
11
+−−
+
961472 2 ,, / =>= αzz ���� Rejeita-se Ho
72