Post on 01-Jul-2015
description
Estatística II
UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS
FACULDADE DE ECONOMIA
Prof. Dr. Ricardo Bruno Nascimento dos Santos
TESTES DE
HIPÓTESES
COM DUAS
AMOSTRAS
TESTES DE HIPÓTESES para DUAS amostras
A questão agora se baseia em verificarmos se duas amostras distintas
possuem ou não as mesmas características. Ou seja, podemos inferir para
comparar duas populações distintas. Vamos partir do exemplo sobre dois grupos
que fazem exercícios físicos e outro que não realiza temos as seguintes
informações:
Praticantes de Atividades Físicas (n=1.593)
Característica Frequência Proporção
40 a 49 anos 367 0,2304
Renda de R$ 5,000 a 10,000
239 0,1500
Não fumam 1.322 0,8299
Não Praticantes de Atividades Físicas (n=29.948)
Característica Frequência Proporção
40 a 49 anos 6.290 0,2104
Renda de R$ 5,000 a 10,000
5.990 0,2000
Não fumam 23.360 0,7800
TESTES DE HIPÓTESES para DUAS amostras
A pergunta que fica é: Podemos concluir que existe uma proporção
significativamente maior de pessoas que praticam ou não atividades
físicas entre 40 e 49 anos, com renda entre 5 a 10 mil e que não fumam?
Deve-se, diante desses elementos fazer alguns questionamentos com
relação a amostra que será observado a seguir.
TESTES DE HIPÓTESES para DUAS
amostras
Antes devemos verificar se as amostras são ou não independentes.
Duas amostras serão consideradas independentes se a amostra
selecionada de uma das populações não é relacionada à amostra da
segunda população.
Elas podem ser consideradas dependentes se cada informação de uma
amostra corresponde a um membro da outra amostra. Amostras
dependentes também são chamadas de amostras emparelhadas ou
amostras relacionadas.
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
Já foi frisado que trabalhar com a população é algo trabalhoso,
cansativo e demorado, por esse motivo inferimos sobre amostras. Teste
de médias visa identificar se amostras diferentes possuem
comportamentos ou características semelhantes.
Para visualizar essa diferença podemos assumir que não há diferenças
na médias das duas populações, ou seja 𝜇1 − 𝜇2 = 0, evidentemente que
expressando isso para amostras teríamos 𝑥1 − 𝑥2. Imagine que tenhamos
os seguintes resultados:
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
A situação anterior pode ser representada no gráfico da normal a
seguir. A situação a que se segue tem a característica de mostrar 𝜇1 −𝜇2 = 0. Pelo gráfico verifica-se que seja bem improvável obter médias
amostrais que se difiram por 4 minutos se a diferença real é zero. A
diferença amostral entre médias seria de mais de 2,5 desvios padrões da
diferença hipotética de 0! Então podemos concluir que existe uma
diferença significativa na quantidade de tempo que estudantes
universitários do sexo masculino e do sexo feminino passam conectados
no dia.
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
Já sabemos como são formadas as hipóteses nulas e alternativas.
Lembrando sempre que as alternativas de hipóteses abrangem:
TESTE Z DE DUAS AMOSTRAS PARA A DIFERENÇA ENTRE
MÉDIAS
O que devemos verificar então seria:
1. As amostras devem ser selecionadas aleatoriamente
2. As amostras devem ser INDEPENDENTES
3. Cada tamanho de amostra deve ser pelo menos 30 ou, se não, cada
população deve ter uma distribuição normal com o conhecido.
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
Então podemos proceder com o teste da seguinte forma:
𝑧 =𝐷𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 ℎ𝑖𝑝𝑜𝑡é𝑡𝑖𝑐𝑎
𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜
Assim formalmente o teste z para duas amostras para grandes
amostras (n>30), e considerando que as amostras são independentes será
dado por:
𝑧 = 𝑥1 − 𝑥2 − 𝜇1 − 𝜇2
𝜎 𝑥1− 𝑥2
Com
𝜎 𝑥1− 𝑥2=
𝜎1
𝑛1+
𝜎2
𝑛2
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
Exemplo: Teste z de duas amostras para diferenças de médias.
Um grupo de cartão de crédito quer testar se a diferença entre a média
de cartões de débito das famílias do Rio de Janeiro e de São Paulo. O
resultado da amostra aleatória de 250 famílias para cada estado são
mostradas na tabela abaixo:
As duas amostras são independentes. Assuma que 𝜎1 = 𝑅$ 1.045 para
Rio de Janeiro e 𝜎2 = 𝑅$ 1.350 para São Paulo. Os resultados suportam
a afirmação do grupo? Teste a 𝛼 = 0,05
Diferença entre médias (amostras grandes e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
As hipóteses nula e alternativa são:
Pelo fato de o teste de bicaudal e o nível de significância ser de 5%,
os valores críticos serão −𝑧0 = −1,96 𝑒 𝑧0 = 1,96 . A região de
rejeição será 𝑧 < −1,96 𝑒 𝑧 > 1,96. A estatística de teste padronizada
será:
Diferença entre médias (amostras grandes e
independentes)
Intepretação: Não há evidência a 5% de significância sobrea afirmação do grupo que exista diferença entre o uso docartão de débito das famílias do Rio e São Paulo.
TESTES DE HIPÓTESES para DUAS
amostras
Se o pressuposto de que as duas distribuições sã normais, então
podemos usar o teste de diferença de médias para populações menores
que 30 observações. Porém o que será retratado agora é de que ambas
devem ser independentes. Dessa forma:
1. Os desvios padrões populacionais são desconhecidos;
2. As amostras devem ser selecionadas aleatoriamente;
3. As amostras são independentes.
4. As populações são normalmente distribuídas ou cada tamanho da
amostra é de pelo menos 30.
Diferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
TESTES DE HIPÓTESES para DUAS
amostras
Assim os requisitos para o teste t serão:
Diferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
TESTES DE HIPÓTESES para DUAS
amostras
Exemplo: Teste t de duas amostras para diferença entre médias
O resultado de um teste matemático para amostras aleatórias simples
de estudantes para dois professores diferentes na mesma escola é
mostrado abaixo:
Podemos concluir que existe uma diferença na média das notas de
matemática dos estudantes para os dois professores? Use 𝛼 = 10%.
Assuma que as populações são normalmente distribuídas para os dois
professores.
Diferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras pequenas
e independentes)
No nível de significância de 10% não existe evidências que de suporte para aafirmação de que a média das notas de matemática dos estudantes sejamdiferentes para os dois professores
TESTES DE HIPÓTESES para DUAS
amostras
Exemplo: teste t para duas amostras para a diferença entre médias
A Renaut supõe o custo médio operacional por Km de um sedã é
menor que o custo de seu principal concorrente. Você é contratado para
conduzir um estudo usando uma amostra aleatória de 30 sedãs da
empresa Renaut e 32 amostras (aleatórias) do concorrente. Os resultados
podem ser observados na tabela abaixo:
A 𝛼 = 0,05, podemos afirmar a hipótese da Renaut? Assuma que as
variâncias das populações são iguais.
Diferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
A 5% de significância, podemos afirmar estatisticamente que existe
evidência de que a afirmação da Renaut está correta que o custo
operacional do sedã deles é menor que o concorrente.
Diferença entre médias (amostras pequenas
e independentes)
TESTES DE HIPÓTESES para DUAS
amostras
Quando as amostras são dependentes
Nessa situação devemos utilizar um procedimento diferente e
encontrar uma diferença entre médias para dados emparelhados dado por
𝑑 = 𝑥1 − 𝑥2
A estatística do teste é a média 𝑑 dessas diferenças:
𝑑 = 𝑑
𝑛As seguinte condições devem ser satisfeitas:
1. As amostras devem ser selecionadas aleatoriamente
2. As amostras devem ser dependentes
3. Ambas populações devem ser normalmente distribuídas.
Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras
Graficamente o teste se baseará na condição que:
Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras
O teste t para diferença de médias então será dado por:
Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras
Exemplo:
A fabricante de calçados afirma que os atletas podem aumentar suas
alturas de salto vertical usando sapatos de treinamento do fabricante. As
alturas de salto vertical de oito atletas selecionados aleatoriamente foram
medidos. Depois que os atletas usaram os sapatos por 8 meses, suas
alturas de salto vertical foram medidas novamente. As alturas de
impulsão vertical (em polegadas) para cada atleta são mostrados na
tabela abaixo.
Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras
A um α = 0,10, há evidência suficiente para apoiar a afirmação do
fabricante? Assuma as alturas de salto vertical são normalmente
distribuídas.
Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
Podemos afirmar que a nível10% de significância, que existeevidências que dão suporte aafirmação do fabricante.
TESTES DE HIPÓTESES para DUAS
amostras
Lembrando que as hipóteses serão:
Considerando que:
1. As amostras são aleatoriamente selecionadas
2. As amostras são independentes
3. As amostras são grandes ou normalmente distribuídas, lembrando
que a regra 𝑛𝑝 ≥ 5 e 𝑛𝑞 ≥ 5 ainda deve ser observada.
Caso a hipótese indique 𝒑𝟏 = 𝒑𝟐, 𝒑𝟏 ≤ 𝒑𝟐 𝒐𝒖 𝒑𝟏 ≥ 𝒑𝟐, então 𝒑𝟏 =𝒑𝟐 é assumida a expressão 𝒑𝟏 − 𝒑𝟐 = 𝟎
Diferença entre proporções
TESTES DE HIPÓTESES para DUAS amostras
Então as possibilidades serão:
A hipótese pautando-se em 𝜇 𝑝1− 𝑝2= 𝑝1 − 𝑝2
O desvio padrão para proporção de duas amostras será:
Diferença entre proporções
TESTES DE HIPÓTESES para DUAS amostras
Repare que precisamos conhecer a variância da proporção da
população calculada. Podemos calcular o peso da estimativa de 𝑝1 𝑒 𝑝2
usando:
Onde 𝑥1 = 𝑛1 𝑝1 e 𝑥2 = 𝑛2 𝑝2. Com o peso da estimativa 𝑝, o desvio
padrão amostral da distribuição para 𝑝1 − 𝑝2 será
Assim o teste z será dado por
𝑧 = 𝑝1 − 𝑝2 − 𝑝1 − 𝑝2
𝑝 𝑞1𝑛1
+1𝑛2
Diferença entre proporções
TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções
TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções
TESTES DE HIPÓTESES para DUAS amostras
Exemplo: Um estudo de 150 ocupantes selecionados aleatoriamente
em carros de passageiros e 200 ocupantes selecionados aleatoriamente
em picapes mostra que 86% dos ocupantes de veículos de passageiros e
74% dos ocupantes em picapes usam cintos de segurança. A um nível de
significância de 10%, podemos rejeitar a alegação de que a proporção de
ocupantes que usam cintos de segurança é o mesmo para carros de
passeio e picapes? Ver dados na tabela abaixo:
Diferença entre proporções
TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções
TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções
Há evidência suficiente a nível de 10% de significância para rejeitar a alegação de quea proporção de ocupantes que usam cintos de segurança é a mesma para carros depasseio e caminhonetes.
APLICAÇÃO NO R(Clique na Figura para ir ao vídeo Prático do R)
PRÓXIMA AULA
REGRESSÃO LINEAR
SIMPLES