Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos...

Inferência Estatística –

Testes de Hipóteses

� Introdução: hipóteses e erros de conclusão

� Testes de hipóteses para uma e duas médias

� Testes de hipóteses para uma e duas variâncias

� Testes de hipóteses para uma e duas proporções

Problema a ser resolvido pela Inferência Estatística

→→→→→→→→ testar uma hipótesetestar uma hipótese

��

Testes de hipótesesTestes de hipóteses

→→→→→→→→ testar uma hipótesetestar uma hipótese

Feita uma afirmação a respeito de uma população (parâmetro)

→→→→→→→→ saber se os resultados amostrais contrariam tal afi rmaçãosaber se os resultados amostrais contrariam tal afi rmação

��

Definição:Definição: o teste de hipóteses é um procedimento estatístico onde se busca verificar uma hipótese a respeito da populaçãopopulação, no sentido de rejeitá-la, tendo por base dados amostraisdados amostrais.

Lógica Lógica dos dos Testes de HipótesesTestes de Hipóteses

Hipótese : um novo medicamento é eficaz no controle da pressã o arterial

PopulaçãoValor

hipotético do parâmetro.

Qual é a magnitude da diferença entre o valor

observado da

Não rejeitar a hipótese

Questão a ser feita

µµµµ = 130 mmHg

Diferença pequena

Decisão a ser tomada

observado da estatística e o valor

hipotético do parâmetro?Amostra

Valor observado da

estatística.

Rejeitar a hipótese

Diferença grande

x = 135 mmHg

Hipótese estatística

A hipótese estatística é uma suposição feita a respeito de umou mais parâmetrosparâmetros (µ, σ2, π, etc.).

Existem dois tipos básicos de hipóteses estatísticas:

�� Hipótese de nulidade Hipótese de nulidade (H(H00)):: hipótese sob verificação que supõe a igualdade dos parâmetros que estão sendo comparados.

�� Hipótese alternativa Hipótese alternativa (H(HAA):): hipótese considerada caso a hipótese de nulidade seja rejeitada e supõe que os parâmetros comparados são diferentes .

Uma população

Exemplo: Para verificar se uma nova droga é eficaz no tratamento da pressão alta, a pressão média de um grupo de pacientes submetidos a esta droga (amostra) é comparada com um valor que é considerado normal (valor padrão).

Uma população

Uma estimativa ( ) do parâmetro de interesse (µ)

Um valor conhecido e comprovado (µ0)

Uma amostra

µµ =

0A µµ:H ≠0µµ >

0µµ <

00 µµ:H =BilateralBilateral

Unilateral direitaUnilateral direita

Unilateral esquerdaUnilateral esquerda

Escolher Escolher uma das trêsuma das três

Exemplo: Para verificar, entre métodos de ensino, qual dá melhor desempenho quanto ao aprendizado dos alunos, comparamos as notas dos alunos de duas turmas (duas amostras), cada uma submetida a um método de ensino.

População 1 População 2

Estimativa de µµµµ1

População 1

Amostra 1

População 2

Amostra 2

Estimativa de µµµµ2

BilateralBilateral

Unilateral direitaUnilateral direita

Unilateral esquerdaUnilateral esquerda

Escolher Escolher uma das trêsuma das três

21A µµ:H ≠

21 µµ >

21 µµ <

210 µµ:H =

Exemplo 1: TesteTeste unilateralunilateral

ProblemaProblema científicocientífico:: Um novo medicamento é eficaz nocontrole da pressão arterial?

População CPopulação C – pacientes com uso do medicamento µµCCPopulação CPopulação C – pacientes com uso do medicamentoPopulação SPopulação S – pacientes sem uso do medicamento

Variável em estudo Variável em estudo →→ X: pressão arterial

µµCC

µµSS

SC0 µµ:H =Hipóteses estatísticas:Hipóteses estatísticas:

UnilateralUnilateral

QuandoQuando temostemos motivosmotivos suficientessuficientes parapara suporsupor queque umaumadasdas médiasmédias seráserá maiormaior queque aa outra,outra, podemospodemos formularformularumauma hipótesehipótese alternativaalternativa unilateralunilateral ((maismais específicaespecífica ))..

SCA µµ:H <SC0

Exemplo 2: TesteTeste bilateralbilateral

Problema científico:Problema científico: O método de ensino A é melhor que o método de ensino B?

População APopulação A – alunos ensinados pelo método A µµAAPopulação APopulação A – alunos ensinados pelo método APopulação BPopulação B – alunos ensinados pelo método B

Variável em estudo Variável em estudo →→ X: notas dos alunos

µµAA

µµBB

µµ ≠BA0 µµ:H =

Hipóteses estatísticas:Hipóteses estatísticas:

BAA µµ:H ≠ BilateralBilateral

Quando Quando não temos motivosnão temos motivos suficientes para supor que suficientes para supor que uma das médias será maior que a outra, formulamos uma uma das médias será maior que a outra, formulamos uma

hipótese alternativa bilateralhipótese alternativa bilateral ((mais genéricamais genérica ). ).

Objetivo: verificar a hipótese

Podemos verificar a hipótese de duas formas:�� avaliar as populações inteiras (todos os alunos ensinado

pelos dois métodos ou todas os pacientes com e sem uso do medicamento) e comparar suas médiasmedicamento) e comparar suas médias�� avaliar amostras retiradas das populações e utilizar um

teste estatístico que compare as médias das amostras

Devemos considerar:�� seria impossível avaliar todos os alunos ou todos os

pacientes

Será muito mais econômico e menos trabalhoso Será muito mais econômico e menos trabalhoso utilizar amostras das populações.utilizar amostras das populações.

pacientes�� o processo de amostragem pode fornecer precisão suficiente

Exemplo: Suponha que um grupo econômico queira financiar a campanha do candidato X, se esse tiver condições de se eleger no primeiro turno.

O grupo econômico deve financiar a campanha do candidato X?

Erros de conclusão

O grupo econômico deve financiar a campanha do candidato X?

Hipótese

O candidato se elege no primeiro

Decisão

Investir na campanha

Não investir na campanha

HipóteseHipóteseVerdadeira

HipóteseFalsa

Decisão corretaInveste e ganha

ErroInveste e perde

ErroNão investe e se elege

Decisão corretaNão investe e não ganha

Erro 1Erro 1AcertoAcerto

Decisão do juiz Réu

Não condenar Condenar

Inocente

Erros de conclusão

culpado réu:H

inocente réu:H

Decisão H0

Não rejeitar Rejeitar

Verdadeira Erro Tipo IErro Tipo IAcertoAcerto

Erro 1Erro 1

Erro 2Erro 2 AcertoAcerto

AcertoAcertoInocente

Culpado

BA0 µµ:H =

culpado réu:H A

Verdadeira

Erro Tipo IErro Tipo I

Erro Tipo IIErro Tipo II AcertoAcerto

AcertoAcerto

ββββββββ = = Erro Tipo II:Erro Tipo II: Não declarar diferença quando ela existe

αααααααα = = Erro Tipo I:Erro Tipo I: Declarar diferença quando ela não existe

µµ:H ≠

Importante!!!Importante!!!

�� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o

�� As duas taxas de erro αααααααα e ββββββββ estão relacionadasrelacionadas negativamentenegativamente,de modo que a reduçãoredução dede αααααααα implica no aumentoaumento dede ββββββββ e vice-versa.

�� O único meio de reduzir ambos os tipos de erro é aumentando o aumentando o tamanho da amostratamanho da amostra, o que nem sempre é viável.

�� Em geral, a preocupação está voltada para o erro tipo I (α - nívelde significância), pois na maioria dos casos ele é considerado omais grave.

REALIDADE

DECISÃOAceitar H 0 Rejeitar H 0

REALIDADE Aceitar H 0 Rejeitar H 0

H0 é verdadeiraDecisão correta

1 - α = P(Aceitar H0 / H0 é V)

= P(H0 / H0)

Erro do Tipo Iαααα = P(Rejeitar H0 / H0 é V) = Nível de

significância do teste = P(H1 / H0)

H0 é falsa

Erro do Tipo IIββββ = P(Aceitar H0 / H0 é falsa)

= P(Aceitar H0 /H1 é V) = P(H0 /H1)

Decisão correta1 - ββββ = P(Rejeitar H0 / H0 é falsa)

= P(H1 / H1) = Poder do teste.

Passos para construção de um teste de hipóteses

11.. Definir as hipóteses estatísticas.

33.. Escolher a estatística para testar a hipótese everificar as pressuposições para o seu uso.

22.. Fixar a taxa de erro aceitável (α - nível de significância).

44.. Usar as observações da amostra para calcular o valorda estatística do teste.

55.. Decidir sobre a hipótese testada e concluir.

da estatística do teste.

Situações comuns em testes de hipóteses a respeito de µµµµµµµµ

1.1. Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

� σ2 conhecida ou n > 30

2.2. Comparação entre duas médias (µµµµµµµµ11 e µµµµµµµµ22)

�Duas amostras independentes

� σ12 e σ2

2 conhecidas

� σ2 desconhecida e n ≤ 30

� σ12 e σ2

2 conhecidas

� σ12 e σ2

2 desconhecidas , mas iguais

� σ12 e σ2

2 desconhecidas , mas diferentes

�Duas amostras dependentes (pareadas)

Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 conhecida (ou n > 30)

1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

N(0,1)~

µ0−=

Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0

Estatística do teste:Estatística do teste:

Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra

Pressuposição:Pressuposição: A variável em estudo tem distribuição normal e variância σ2 desconhecida (e n ≤ 30)

1.1.Comparação de uma média (µµµµµµµµ) com um valor padrão (µµµµµµµµ00)

Hipótese sob verificação:Hipótese sob verificação:0µµ =:H0

~ tνEstatística do teste:Estatística do teste:

T 0−=

ν = n – 1

Valor que deve Valor que deve ser calculado ser calculado na amostrana amostra

≠A 0H :µ µ

=0 0H :µ µ

µX −=

Critério de decisão Critério de decisão –– Teste bilateralTeste bilateral

HHAA bilateralbilateral supõe que a diferença

é negativa ou positiva .0X - µ

Mas quão grande

αααααααα/2/2

-tα/2 0

Não rejeição de H0

Rejeição de H

Rejeição de H0

Este limite é dado Este limite é dado pelos valores pelos valores

críticos.críticos.

T 0−= Mas quão grande será essa diferença

para ser considerada significativa?

�� Se o valor t (calculado na amostra) estiver entre --ttαα/2/2 e ttαα/2/2, não temos motivos para rejeitar H0

�� Se o valor t (calculado na amostra) for menor que --ttαα/2/2 ou maior que ttαα/2/2, rejeitamos H0

de H0de H0 críticos.críticos.

HHAA unilateral unilateral direitadireitasupõe que a diferença

é um valor positivo .0X - µ

µX −=

Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral

>A 0H :µ µ

=0 0H :µ µ

αααααααα

Rejeição Não rejeição

T 0−=Mas quão grande

será essa diferença para ser considerada

significativa?

Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.

Rejeição de H0

�� Se o valor t (calculado na amostra) for menor que tα, não temosmotivos para rejeitar H0

�� Se o valor t (calculado) for maior que tα, rejeitamos H0

pelo valor crítico.pelo valor crítico.

HHAA unilateral unilateral esquerdaesquerdasupõe que a diferença

é um valor negativo .0X - µ

<A 0H :µ µ

=0 0H :µ µ

µX −=

Critério de decisão Critério de decisão –– Teste unilateral Teste unilateral

αααααααα

Rejeição

Mas quão grande será essa diferença

para ser considerada significativa?

Este limite é dado Este limite é dado pelo valor crítico.pelo valor crítico.

T 0−=

Rejeição de H0

�� Se o valor t (calculado na amostra) for maior que --ttαα, não temos motivos para rejeitar H0

�� Se o valor t (calculado) for menor que --ttαα, rejeitamos H0

pelo valor crítico.pelo valor crítico.

Exemplo: Um processo deveria produzir bancadas com 0,85 mde altura. O engenheiro desconfia que as bancadas que estãosendo produzidas são diferentes que o especificado. Umaamostra de 8 valores foi coletada e indicou média de 0,87 edesvio padrão de 0,010. Sabendo-se que os dados seguem adistribuição normal, teste a hipótese do engenheiro usando umnível de significância α=0,05.nível de significância α=0,05.Solução:

T 0−=

0,85H0: µ =

0,85HA: µ ≠

0,87 - 0,85= 5,66t =

1) 2) α=0,05

3) Pressuposição:Pressuposição: A variável em estudo tem distribuição normal

5)0,025 0,025

ν=n-1=7

0,87 - 0,85= 5,66

0,010/ 8tc =4)

Não se rejeita HNão se rejeita H0Rejeita HRejeita H00Rejeita HRejeita H00

Conclusão: Ao nível de 5% de significância, conclui-se que asbancadas que estão sendo produzidas devem ter alturadiferente do especificado, maiores que 0,85m.

-2,365 +2,3650

Exercício proposto: A associação dos proprietários de

indústrias metalúrgicas está preocupada com o tempo perdido

em acidentes de trabalho, cuja média, nos últimos tempos, tem

sido da ordem de 60 horas/homem por ano com desvio padrão

de 20 horas/homem, segundo a distribuição normal. Tentou-se2)2)

de 20 horas/homem, segundo a distribuição normal. Tentou-se

um programa de prevenção de acidentes e, após o mesmo,

tomou-se uma amostra de 9 indústrias e mediu-se o número de

horas/homem perdidas por acidente, que foi de 50 horas. Você

diria, ao nível de 5%, que há evidência de melhora?

Solução:

As hipóteses a serem testadas são:

H0: µ = 60 hora/homens

HA: µ < 60 hora/homens

Solução:

µXz 0 −=−=−= 3) α=0,05

Isto quer dizer que a diferença apresentada na amostra não é5) Isto quer dizer que a diferença apresentada na amostra não ésuficientemente grande para provar que a campanha deprevenção deu resultado. Então a conclusão é:

“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”

Exercício proposto: O tempo médio, por operário, para executaruma tarefa, tem sido 100 minutos, segundo a distribuição normal.Introduziu-se uma modificação para diminuir este tempo, e, apóscerto período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução gasto por cada um. O tempo médio daamostra foi 91 minutos com desvio padrão de 12 minutos. Este

resultado evidencia uma melhora no tempo gasto para realizar atarefa? Apresente as conclusões ao nível de 5% de significância.

Solução:

H0: µ = 100

HA: µ < 100

α=0,05ν=n-1=15

-1,753

Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.

nsµx 0−

-1,753

10091− = -3 4)

Exercício: Medidos os diâmetros de 31 eixos de um lotealeatório, produzido pela empresa “Sofazredondo S.A.”obteve-se a distribuição abaixo:

Diâmetros (em mm) 56,5 56,6 56,7 56,8 56,9 57,0 57,1 57,2 57,3Número de eixos 1 2 2 4 10 5 4 2 1

Ao nível de significância de 5%, há evidência de que odiâmetro médio dos eixos esteja fora da especificação de57 mm?

Z = -2,557

Número de eixos 1 2 2 4 10 5 4 2 1

Zc = -2,557

Valor p:Valor p: Probabilidade de que seja obtido um valor de T mais extremo que o valor observado, dado que H0 é verdadeira

Outro critério de decisão Outro critério de decisão

Se p ≥ α

Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?

�� Se o valor pvalor p for maior ou igual a α: não rejeitamosnão rejeitamos a hipótese nula, pois tt cc está em uma região de alta probabilidade

Não rejeitamos a hipótese de nulidade

Se p < α

Como tomar a decisão a respeito de HComo tomar a decisão a respeito de H 00? ?

�� Se o valor pvalor p for menor que α: rejeitamosrejeitamos a hipótese nula, pois tt cc está em uma região de baixa probabilidade

Rejeitamos a hipótese de nulidade

Exemplo: programa de prevenção de acidentes

µXz 0 −=−=−=

H0: µ = 60 hora/homensHA: µ < 60 hora/homens

-1,645 -1,50

p = 0,0668

α = 0,05

“Não é possível, ao nível de 5% de significância, afirmarque a campanha deu resultado. ”

-1,645 -1,50

Exercício: O tempo médio, por operário, para executar uma tarefa, temsido 100 minutos, segundo a distribuição normal. Introduziu-se umamodificação para diminuir este tempo, e, após certo período, sorteou-seuma amostra de 16 operários, medindo-se o tempo de execução gastopor cada um. O tempo médio da amostra foi 91 minutos com desviopadrão de 12 minutos. Este resultado evidencia uma melhora no tempogasto para realizar a tarefa? Apresente as conclusões ao nível de 5% degasto para realizar a tarefa? Apresente as conclusões ao nível de 5% designificância.

Solução:

H0: µ = 100

HA: µ < 100

α=0,05 e ν=n-1=15

-1,753

Rejeita-se H0 ao nível de 5% de significância e pode-se concluir que amodificação deve ter diminuído o tempo de execução da tarefa.

nsµx 0−

10091− = -3

-1,753

Qual o valor p?p < αααα

p ≅≅≅≅ 0,005 (0,5%)

Utilizando o Excel para obter o valor p:

tc = -3 α = 0,05 ν = n-1 = 15

Conclusão: Como a significância do resultado (0,45%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Pressuposições:Pressuposições:A variável em estudo tem distribuição normalAs variâncias σ1

2 e σ22 são conhecidas

As amostras retiradas das populações são independentes

N(0,1)~

Hipótese sob verificação:Hipótese sob verificação: 210 µµ:H =

Estatística do teste:Estatística do teste:

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra

Exemplo: Um fabricante produz dois tipos de pneus. Para o pneu dotipo A o desvio padrão é de 2500 km e para o pneu do tipo B é de3000 km, seguindo a distribuição normal. Uma empresa de táxistestou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km demédia para o tipo A e 26000 para o tipo B. Adotando α = 4% testar ahipótese de que a duração média dos dois tipos é a mesma.

Solução:

As hipóteses são: H0: µA = µBHA: µA ≠ µB

Como α = 4%, então zα/2 = 2,055

502500

2600024000z

22c −=−=

Portanto, rejeita-se a hipótese de igualdade entre as duraçõesmédias dos dois tipos de pneus. Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos depneus diferem quanto a durabilidade média, sendo o tipo B melhorque o tipo A.

Como α = 4%, então zα/2 = 2,055

2 e σ22 são desconhecidas mas supostas iguais

Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =

onde: 2

ν = (n1 – 1) + (n2 – 1)21

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra

( ) ( )( ) ( )1n1n

1nS1nSS

−+−−+−=

Exemplo:

Dez cobaias adultas criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do experimento. pesadas no início e no final do período de duração do experimento. Os ganhos de peso (em gramas) observados foram os seguintes:

Utilize um teste de hipótese, ao nível α = 0,01, para verificarse as duas rações diferem entre si quanto ao ganho de peso.

Ração experimental 220 200 210 220 210

Ração padrão 200 180 190 190 180

se as duas rações diferem entre si quanto ao ganho de peso.

210 µµ :H =α = 0,01

21A µµ :H ≠2x = 188

ExperimentalExperimental

n1 = 5

PadrãoPadrão

n2 = 5

Pressuposições : variável ganho de peso com distribuição normal, amostras independentes e supõe-se que .2

221 σ=σ

( ) ( )( ) ( )1n1n

1nS1nSS

−+−−+−=

( ) ( )( ) ( ) 70

1515157015702s =

−+−−×+−×=

188212tc =

α=0,01 e ν=(n1-1)+(n2-1)=80,99

Conclusão: ao nível de 1%, conclui-se que a ração experimental deve dar maior ganho de peso que a ração padrão.

⇒ H0 é rejeitada0,005 0,005

3,355-3.355

tc = 4,54 α = 0,01 ν = (n1-1)+(n2-1) = 8

Conclusão: Como a significância do resultado (0,19%) é menor que a significância do teste (1%), é possível rejeitar a hipótese nula.

Exercício: Um engenheiro desconfia que a qualidade de um material pode depender da matéria-prima utilizada. Há dois fornecedores de matéria-prima sendo usados. Testes com 10 observações de cada fornecedor indicaram:

Use um nível de significância α = 0,05 e teste a hipótese do engenheiro.

Obs.: Considere que as duas variâncias populacionais iguais.

39 x1 = 7s1 =43x2 = 9s2 =

Obs.: Considere que as duas variâncias populacionais iguais.

101,2t11,1t 18;025,0c =<=

2 e σ22 são desconhecidas e desiguais

Hipótese sob verificação:Hipótese sob verificação: 210 :H µµ =

Valor que deve ser Valor que deve ser calculado na amostracalculado na amostra 1n

)nS(1n)nS(

)nSnS(

Exemplo: As resistências de dois tipos de concreto, que segue o modelonormal, foram medidas, mostrando os resultados da tabela. Fixado umnível de significância de 10%, existe evidências de que o concreto do tipoX seja mais resistente do que o concreto do tipo Y?

Tipo X 54 55 58 50 61

Tipo Y 51 54 55 52 53

Os dados obtidos da tabela são:

X = 55,6 e Y = 53,0

S2 = 17,3 e S2 = 2,5 Tipo Y 51 54 55 52 53

XS2 = 17,3 e YS2 = 2,5

H0: µX = µYHA: µX ≠ µY

α = 0,10 α = 10% e ν = 5

5,133,0554

15,6816

4)52,5(

4)517,3(

)52,5517,3(22

1n)nS(

)nSnS(

Com estas amostras, ao nível de 10% de significância, não é possível afirmarque o concreto do tipo X seja mais resistente do que o concreto do tipo Y.

−=0,05 0,05

2,015-2,015

53,055,6 =+

tc = 1,31 α = 0,10 ν = 5

Conclusão: Como a significância do resultado (24,71%) é maior que a significância do teste (10%), não é possível rejeitar a hipótese nula.

α = 0,05No teste unilateral o valor t crítico é menor porque a área a sua direita deve corresponder a todo α. Assim, esta área é o dobro da área à direita do valor t crítico do teste à direita do valor t crítico do teste bilateral.

Como consequência, um valor t não rejeitado no teste bilateral pode ser

teste bilateral pode ser rejeitado no teste unilateral. Portanto, o teste unilateral é mais poderoso que o teste bilateral.

�� Os intervalosintervalos dede confiançaconfiança e os testestestes dede hipóteseshipótesesbilateraisbilaterais são procedimentos estatísticos relacionados.

�� Se forem utilizados para analisar os mesmos dados, ao

ConsideraçõesConsiderações

�� Se forem utilizados para analisar os mesmos dados, aomesmo nível de significância, devem conduzir aos mesmosresultados.

�� O intervalo de confiança para uma médiauma média está relacionadocom o teste de hipóteses que compara uma média com umcompara uma média com umpadrãopadrão.H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo

�� O intervalo de confiança para a diferença entre duasdiferença entre duasmédiasmédias está relacionado com o teste de hipóteses quecompara duas médiascompara duas médias.H0 não rejeitada ⇔⇔ zero está coberto pelo intervalo

H0 não rejeitada ⇔⇔ valor padrão está coberto pelo intervalo

Intervalo de confiança para uma média (Intervalo de confiança para uma média (µµ))

IC (µ; 1−−−−α): ± tαααα/2n

EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))EstatísticaEstatística TT parapara comparaçãocomparação dede médiamédia ((µµ)) comcom valorvalor padrãopadrão ((µµ00))

T 0−=

�� Se no teste de hipóteses, ao nível de 1% de significância,

Valor crítico: tαααα/2

�� Se no teste de hipóteses, ao nível de 1% de significância,rejeitamos H0, significa que a diferença entre a média e o valorpadrão não é zero, ou seja, média e valor padrão são diferentes.

�� Construindo o intervalo de confiança para µ, ao nível de 99%,devemos esperar que o valor padrão (µ0) esteja fora do intervalo.Caso contrário, os resultados seriam contraditórios.

Intervalo de confiança para a diferença entre duas médias (Intervalo de confiança para a diferença entre duas médias (µµ11 −− µµ22))

EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))

IC ( ; 1−−−−α): ± tαααα/22

+21 XX −21 µµ −

EstatísticaEstatística TT parapara aa comparaçãocomparação entreentre duasduas médiasmédias ((µµ11 ee µµ22))

�� Se no teste de hipóteses, ao nível de 5% de significância, não

Valor crítico: tαααα/22

�� Se no teste de hipóteses, ao nível de 5% de significância, nãorejeitamos H0, significa que a diferença entre as duas médias é zero,ou seja, as médias devem ser iguais.

�� Construindo o intervalo de confiança, ao nível de 95%, para adiferença entre as médias (µ1−µ2), devemos esperar que o valorzero seja coberto pelo intervalo.

Exemplo: Um novo funcionário foi contratado para gerir os estoques da empresa. Ele recebeu a informação de que a quantidade semanal vendida de determinado produto é de 9,6kg. Para testar a veracidade da informação, tomou uma amostra aleatória de 30 semanas e verificou que a venda média do produto foi de 9,3kg, com desvio padrão de 3,2kg. Considerando que a variável em estudo segue a distribuição normal:

a) Verifique, utilizando teste de hipóteses ao nível de 5% de significância, se a informação recebida pelo funcionário é verdadeira.

b) Verifique se a informação é verdadeira, utilizando intervalo de confiança ao nível de 95%.

c) Houve coerência entre os resultados do teste de hipóteses e do intervalo de confiança?

a) Teste de Hipótese

Variável em estudo: X = venda do produto (kg)

Pressuposição: A variável em estudo tem distribuição normal

1. Hipóteses estatísticas: 9,6:HA ≠µ

9,6:H0 =µ

2. Taxa de erro aceitável: α = 0,05

a) Teste de Hipótese

3. Estatística do teste

T 0−= 0,51353,2

9,69,3 −=−=

4. Decisão e conclusão

0,025 0,025

2,045-2,045

α = 5% e ν = 29

Não rejeitamos H0. Concluímos, ao nível de 5% de significância,que a quantidade média de venda semanal do produto nãodifere significativamente do valor informado (9,6kg). Portanto, ainformação recebida pelo funcionário pode ser verdadeira.

b) Intervalo de confiança

Variável em estudo: X = venda do produto (kg)

Pressuposição: A variável em estudo tem distribuição normal.

Estimativas:

=x 9,3 ν = 30 − 1 = 29

IC( ; 1 ) : X tn

α− ±µ α

=x 9,3

= =s 3,20,5842

ν = 30 − 1 = 29

t0,025 (29) = 2,045

b) Intervalo de confiança

IC (µ; 0,95): 9,3 ± 2,045 × 0,5842Limite inferior = 9,3 – 1,195 = 8,11

IC( ; 1 ) : X tn

α− ±µ α

Limite inferior = 9,3 – 1,195 = 8,11Limite superior = 9,3 + 1,195 = 10,50

P(8,11 < µ < 10,50) = 0,95

Concluímos que o intervalo de confiança, ao nível de 95%, para a verdadeira quantidade média semanal vendida do produto é de 8,11 a 10,50 kg.

c) Sim, o resultado do teste de hipóteses esta coerente com o do intervalo de confiança, pois o valor padrão 9,6, que segundo o teste de hipótese não difere de µ, está dentro do intervalo de confiança, ou seja, é um valor possível para µ.

Comparação de Pares de Observações(Comparação de duas médias para amostras pareadas)

Em algumas situações os dados de duas populações são coletados ecomparados em pares. Isso é feito para impedir que fatores nãocontroláveis inflacionem as estimativas das variâncias.controláveis inflacionem as estimativas das variâncias.

Exemplo: desempenho dos alunos com método A e B

hidratação da pele com creme A e B

A hipótese testada é se existe diferenças significativas entre os paresde observações, tendo como suposição que os dados seguem adistribuição normal.

distribuição normal.

O teste baseia-se na estatística:

dT −=

( 0 :H

µµµ

<<>>≠≠==

Exemplo: Cinco operadores de máquinas foram treinados emduas máquinas de diferentes fabricantes, para verificar qualdelas apresentava maior facilidade de aprendizagem. Mediu-seo tempo que cada um dos operadores gastou na realização deuma mesma tarefa com cada um dos dois tipos de máquinas.Os resultados estão na tabela. Ao nível de 5%, é possívelOs resultados estão na tabela. Ao nível de 5%, é possívelafirmar que a tarefa realizada na máquina X demora mais doque na máquina Y?

Solução:

H0: µX = µY (µd = 0)

H : µ ≠ µ (µ ≠ 0)

Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78

HA: µX ≠ µY (µd ≠ 0) 5 85 78

α = 5%

� = 5 e sd = 1,8708

Operador Maq. X Maq. Y 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78

d∑ −

dd i∑=

5,9851,8708/

===� α = 5% e ν = n - 1 = 4

Com 5% de significância, rejeita-se H0, e conclui-se que realizar atarefa com a máquina X deve demorar mais do que com amáquina Y, esta apresentando maior facilidade de aprendizagem.

2,776-2,776

Exercício: Uma empresa quer verificar se o conhecimento de seus funcionários a respeito de um determinado assunto melhorou após 30 horas de treinamento. Para isso foi realizado com os quinze alunos do treinamento um teste antes e após o treinamento. Os dados a seguir representam as notas obtidas. treinamento. Os dados a seguir representam as notas obtidas. Conclua a respeito da eficiência do treinamento, utilizando 5% de significância.

Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes 6,5 6,7 7,0 7,0 6,5 7,3 7,8 6,9 6,7 7,2 7,5 7,5 7,2 7,0 6,8 Depois 7,5 7,7 7,9 8,0 7,4 8,3 8,8 8,9 7,7 8,2 8,5 8,5 8,2 8,0 8,8 Difer. 1,0 1,0 0,9 1,0 0,9 1,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 1,0 2,0

Exercício: Duas espécies de um certo tipo de cereal estão sendo testadas quanto ao seu crescimento. O experimento foi feito escolhendo 10 blocos de terreno e plantando em cada bloco mudas de ambas as espécies. Os resultados a seguir são as alturas medidas ao final do primeiro mês. Utilizar α = 0,05as alturas medidas ao final do primeiro mês. Utilizar α = 0,05

Os dados deste experimento foram coletados aos pares para

Terreno 1 2 3 4 5 6 7 8 9 10 Espécie 1 22 27 18 33 25 21 15 33 21 24 Espécie 2 21 31 24 32 29 23 19 37 22 27

Os dados deste experimento foram coletados aos pares para impedir que as diferenças de fertilidade entre os blocos de terreno (que podem ser grandes) mascarem os resultados.

262,2t54,3t 9;025,0c =>=

Teste para a variância de uma população

Para aplicar o teste para a variância é necessário supor anormalidade da população de onde será extraída a amostra.

Uma hipótese testada com frequência é que a variância tenhaUma hipótese testada com frequência é que a variância tenhaum valor especificado.

σσ:H

=H0 é rejeitada se qc ultrapassar o valorcrítico da distribuição qui-quadrado :

A estatística do teste é

~−= −χσ

2(n 1)SQ (n 1)

0σσ <

Exercício: A quantidade mensal de produtos entregues por uma empresa segue uma distribuição Normal com média e variância desconhecidas. Analise os dados a seguir, que representam uma amostra de 20 meses e teste a hipótese de que o desvio padrão da quantidade mensal de produtos entregues pela empresa é de 1 unidade, utilizando nível de significância de 5%.unidade, utilizando nível de significância de 5%.

Solução: H0: σ2 = 1

HA: σ2 ≠ 1

( )( ) 2− 2,5%

α = 5%ν = n - 1 = 19

17,4 18,2 18,3 18,8 19,0 19,2 19,3 19,6 19,6 19,920,2 20,2 20,5 20,7 20,9 21,0 21,3 21,5 21,9 22,6 34,1S

01,20X

Com 5% de significância, rejeita-2 H0, isto é, é possível afirmar que odesvio padrão da quantidade mensal de produtos entregues pelaempresa é maior que 1 unidade.

( )34,12

11,34 1-20 2

−= 8,91 32,85

2,5%2,5%

qc = 34,12 α = 0,05 ν = 19

Como a significância do resultado (3,5575=2*1,7788) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Exemplo: Uma das maneiras de controlar a qualidade de umproduto é controlar a sua variabilidade. Uma máquina deempacotar café está regulada para encher os pacotes commédia de 500 g e desvio padrão de 10 g, onde o peso de cadapacote distribui-se normalmente. Colhida uma amostra de n=16,observou-se uma variância de 169 g2. É possível afirmar comobservou-se uma variância de 169 g . É possível afirmar comeste resultado que a máquina está desregulada quanto avariabilidade, supondo uma significância de 5%?

Solução: H0: σ2 = 100

HA: σ2 > 100

( )169 15( ) 2S1n −

95%α = 5%ν = n - 1 = 15

Com 5% de significância, rejeita-se H0, ou seja, é possívelafirmar que a máquina está desregulada.

( )25,35

100169 15 ==

−=25,00

qc = 25,35 α = 0,05 ν = 15

Como a significância do resultado (4,54%) é menor que a significância do teste (5%) é possível rejeitar a hipótese nula.

Teste de homogeneidade de variâncias

Considerando duas estimativas e , frequentemente, temosinteresse em verificar se tais estimativas são homogêneas.

Assim, as hipóteses a serem testadas são:

σσ:H

=H0 é rejeitada se fc ultrapassar ovalor crítico da distribuição F:

A estatística do teste é

F =Atenção : sempre variância maior sobre variância

Exemplo: As resistências de dois tipos de concreto forammedidas, mostrando os resultados da tabela. Fixado um nível designificância de 10%, teste a hipótese de igualdade das variâncias,considerando que os dados seguem a distribuição normal?

Tipo X 54 55 58 50 61 Os dados obtidos da tabela são:

X = 55,6 e Y = 53,0 Tipo Y 51 54 55 52 53

X = 55,6 e Y = 53,0

XS2 = 17,3 e YS2 = 2,5

H0: σ2X = σ2YHA: σ2X ≠ σ2Y α = 10%

ν1 = nx - 1 = 4

ν2 = ny - 1 = 4

Neste caso, rejeita-se H0, ao nível de 10% de significância, eassume-se que as variâncias populacionais são diferentes.

6,922,5

17,3 ==6,39

0,050,0522

fc = 6,92 α = 10% ν1 = nx - 1 = 4 ν2 = ny - 1 = 4

Conclusão: Como a significância do resultado (8,76% = 4,38 x 2) é menor que a significância do teste (10%), é possível rejeitar a hipótese nula.

Exercício: Uma alta quantidade de nitrato introduzida na alimentação animal tem mostrado possuir efeitos danosos incluindo baixa produção de tiroxina, aumento de incidência de cianose em recém nascidos e baixa produção de leite. Os dados que seguem referem-se a medida de ganho de peso percentual em ratos de laboratório, submetidos a uma dieta padrão e a uma dieta com 2000 ppm de nitrato na água de beber.

2 ==Nitrato: 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2Controle: 18,2 32,9 10,0 14,3 16,2 27,6 15,7.

a) Verifique, através do teste F, se as variâncias das populações são iguais.b) Verifique, através do teste t, o efeito do nitrato sobre o ganho de peso.

21 XXT

−= ( ) ( )1nS1nS 22 −+−

64,85s 19,27x

12,66s 15,07x2CC

= ( ) ( )( ) ( )1n1n

1nS1nSS

−+−−+−=

σσ:H

1n)nS(

)nSnS(

Exercício: Calculadoras eletrônicas utilizam dois métodos diferentes de entrada e processamento numérico. Vamos denominar um dos métodos de “método algébrico” (MA) e o outro de “método polonês” (MP). Para comparar qual deles é mais eficaz é feito um teste com 20 usuários sem experiência prévia com calculadoras, onde 10 vão utilizar calculadoras de um tipo e o outros 10 as de outro tipo. A tabela mostra o tempo em segundos que cada operador gastou para realizar um conjunto padrão de cálculos. Testar a hipótese de existência de diferença entre os dois cálculos. Testar a hipótese de existência de diferença entre os dois métodos no que se refere ao tempo de operação, utilizando uma significância de 5%.

MA 12 16 15 13 16 10 15 17 14 12

MP 10 17 18 16 19 12 17 15 17 14 2,80s 15,50x

2,21s 14,00x

Exercício: Os valores a seguir representam os tempos de produção de

Exercício: Os valores a seguir representam os tempos de produção de duas máquinas. Analise os dados e conclua a respeito da variabilidade das máquinas 1 e 2:

8307,021 =S 316,12

M1 91,0 90,3 90,2 92,1 91,8 91,3 89,3, 91,0 91,2 89,6M2 91,8 91,2 89,4 89,2 90,7 92,6 91,3 91,2

Teste para proporções

O teste para a proporção populacional, em geral, é utilizadopara verificar se a proporção π de elementos da população quepossuem uma determinada característica é igual a umdeterminado valor π .determinado valor π0.

As hipóteses estatísticas são:

ππππππ

Usa-se a estatística:

( ) N(0,1)~

πππ−

O teste se baseia na aproximação da distribuição Normal.

Pressuposição: n é grande ⇒ np > 5 e n(1-p) > 5p → estimador de π

ππ <

Exemplo: As condições de mortalidade de uma região são taisque a proporção de nascidos que sobrevivem até 70 anos é de0,60. Testar esta hipótese ao nível de 5% de significância se em1000 nascimentos amostrados aleatoriamente, verificou-se 530sobreviventes até os 70 anos.

Solução : 0,53530p ==Solução :

0,60 :H0 =π

−−=

1,96-1,96

0,531000530p ==

0,60:HA ≠π

( ) 4,520,600,53 −=−

α = 0,05

Decidi-se rejeitar H0, ao nível de 5% de significância.

Neste caso, pode-se afirmar que a taxa dos que sobrevivem até os 70 anos é menor do que 60%.

00 ππ −= ( ) 4,52

10000,6010,60

−=−

Exercícios :

1) Um fabricante garante que 90% dos equipamentos que

fornece a uma fábrica estão de acordo com as especificações

exigidas. O exame de uma amostra de 200 peças desseexigidas. O exame de uma amostra de 200 peças desse

equipamento revelou 25 defeituosas. Teste a afirmativa do

fabricante, nos níveis de 5% e 1%.

2) Um engenheiro deseja testar a hipótese de que seu

Zc=1,18

fornecedor entrega lotes com 10% de não conformes. Um lote

de 180 unidades revelou 14 não conformes. Use α = 5% e

conclua a respeito.Zc=-0,98

A aproximação Normal também pode ser usada para testara hipótese que dois parâmetros de Binomiais sejam iguais,ou seja, para testar:

Nesse caso, amostras de tamanho n1 e n2 são retiradasde cada população, gerando x1 e x2 itens pertencentes àclasse associada com p e calcula-se os estimadores de ππππpara cada população como: 1

( ) ( ) N(0,1)~

−−−=

A estatística para o teste é:

2 np =

Exemplo: Em uma pesquisa de opinião, 32 dentre 80 homensdeclararam apreciar certa revista, acontecendo o mesmo com26 dentre 50 mulheres. Ao nível de 5% de significância oshomens e as mulheres apreciam igualmente a revista?Solução : H0: πH = πM

π ≠ πpH = 32 / 80 = 0,40p = 26 / 50 = 0,52HA: πH ≠ πM

( ) ( )

−−−=

Não se rejeita H , isto é, a

HpM = 26 / 50 = 0,52

α = 0,05

500,52)0,52.(1-

800,40)0,40.(1-

0,520,40 −=

1,96-1,96

Não se rejeita H0, isto é, a5% de significância, não épossível afirmar que existadiferença entre aspreferências de homens emulheres quanto à revista.

Exercício: Um empresário deseja saber se os percentuais desatisfação de seus clientes em relação a dois produtosoferecidos por sua empresa são similares. Para isso entrevistou150 pessoas, das quais 80 disseram estar satisfeitas com oproduto A e 100 com o produto B. Use α = 5% e conclua arespeito.respeito.

ππππ

H 530150

80p1 ,== 0,67

100p2 ==

( ) ( ) 47,20567,0

33,0.67,047,0.53,0

67,053,0

p1pp1p

ppZ 21 −=−=

−=−−

−= ( ) ( ) 0567,0

15033,0.67,0

15047,0.53,0

+−−

961472 2 ,, / =>= αzz �� Rejeita-se Ho

Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos...

Documents

Transcript of Inferência Estatística – Testes de Hipóteses · Exercício proposto: A associação dos...

Apostila - Inferência Estatística (1)

Inferência Causal em Estudos Seccionais Inferência Causal em Estudos Seccionais IX Congresso de Epidemiologia - II Episeminário Inferência causal em epidemiologia:

Sindicato dos Trabalhadores nas Indústrias Metalúrgicas ... · Filiação a FETraMEIaG-rS amplia força das reivindicações O Sindicato dos Trabalhadores nas Indústrias Metalúrgicas,

Inferência Filogenética

Estatística de Inferência

Inferência e testes de hipóteses

5 - Inferência Estatística (Minitab)

Reconstrução filogenética: Inferência Bayesiana

influência das propriedades metalúrgicas na vedação de flanges ...

Inferência em Cadeias de Markov

5 - Lógica Matemática Representação e Inferência€¦ · 5.6. Inferência em Lógica Primeira Ordem Regras de inferência para quantificadores 1. Instanciação universal (IU):

Sindicato dos Trabalhadores nas Indústrias Metalúrgicas ... · Sindicato dos Trabalhadores nas Indústrias Metalúrgicas, Mecânicas e de Material Elétrico de Passo Fundo, Marau

Introdução à Inferência Estatística - each.usp.br - Intro_Inferencia.pdf · ACH2053 INTRODUÇÃO À ESTATÍSTICA 1º Sem/2018 Introdução à Inferência Estatística Prof. Marcelo

Estudos Epidemilógicos. Causalidade e Inferência Causal.

Inferência Em Amostras Pequenas

RelLabFisII - Difração e Inferência da Luz

Inferência Estatística-2016

9 TÉCNICAS DE INFERÊNCIA GEOGRÁFICA

MARÇO 144Newsletter da Associação Nacional das Empresas Metalúrgicas e · 2018-04-16 · 144Newsletter da Associação Nacional das Empresas Metalúrgicas e Electromecânicas

Lógicas e Inferência para IA