Tópico 3 Testes de Hipóteses - 2 amostras

Estatística II

UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS

FACULDADE DE ECONOMIA

Prof. Dr. Ricardo Bruno Nascimento dos Santos

TESTES DE

HIPÓTESES

COM DUAS

AMOSTRAS

TESTES DE HIPÓTESES para DUAS amostras

A questão agora se baseia em verificarmos se duas amostras distintas

possuem ou não as mesmas características. Ou seja, podemos inferir para

comparar duas populações distintas. Vamos partir do exemplo sobre dois grupos

que fazem exercícios físicos e outro que não realiza temos as seguintes

informações:

Praticantes de Atividades Físicas (n=1.593)

Característica Frequência Proporção

40 a 49 anos 367 0,2304

Renda de R$ 5,000 a 10,000

239 0,1500

Não fumam 1.322 0,8299

Não Praticantes de Atividades Físicas (n=29.948)

Característica Frequência Proporção

40 a 49 anos 6.290 0,2104

Renda de R$ 5,000 a 10,000

5.990 0,2000

Não fumam 23.360 0,7800

A pergunta que fica é: Podemos concluir que existe uma proporção

significativamente maior de pessoas que praticam ou não atividades

físicas entre 40 e 49 anos, com renda entre 5 a 10 mil e que não fumam?

Deve-se, diante desses elementos fazer alguns questionamentos com

relação a amostra que será observado a seguir.

TESTES DE HIPÓTESES para DUAS

amostras

Antes devemos verificar se as amostras são ou não independentes.

Duas amostras serão consideradas independentes se a amostra

selecionada de uma das populações não é relacionada à amostra da

segunda população.

Elas podem ser consideradas dependentes se cada informação de uma

amostra corresponde a um membro da outra amostra. Amostras

dependentes também são chamadas de amostras emparelhadas ou

amostras relacionadas.

Diferença entre médias (amostras grandes e independentes)

amostras

Já foi frisado que trabalhar com a população é algo trabalhoso,

cansativo e demorado, por esse motivo inferimos sobre amostras. Teste

de médias visa identificar se amostras diferentes possuem

comportamentos ou características semelhantes.

Para visualizar essa diferença podemos assumir que não há diferenças

na médias das duas populações, ou seja 𝜇1 − 𝜇2 = 0, evidentemente que

expressando isso para amostras teríamos 𝑥1 − 𝑥2. Imagine que tenhamos

os seguintes resultados:

amostras

A situação anterior pode ser representada no gráfico da normal a

seguir. A situação a que se segue tem a característica de mostrar 𝜇1 −𝜇2 = 0. Pelo gráfico verifica-se que seja bem improvável obter médias

amostrais que se difiram por 4 minutos se a diferença real é zero. A

diferença amostral entre médias seria de mais de 2,5 desvios padrões da

diferença hipotética de 0! Então podemos concluir que existe uma

diferença significativa na quantidade de tempo que estudantes

universitários do sexo masculino e do sexo feminino passam conectados

no dia.

amostrasDiferença entre médias (amostras grandes e independentes)

amostras

Já sabemos como são formadas as hipóteses nulas e alternativas.

Lembrando sempre que as alternativas de hipóteses abrangem:

TESTE Z DE DUAS AMOSTRAS PARA A DIFERENÇA ENTRE

MÉDIAS

O que devemos verificar então seria:

1. As amostras devem ser selecionadas aleatoriamente

2. As amostras devem ser INDEPENDENTES

3. Cada tamanho de amostra deve ser pelo menos 30 ou, se não, cada

população deve ter uma distribuição normal com o conhecido.

amostras

Então podemos proceder com o teste da seguinte forma:

𝑧 =𝐷𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 ℎ𝑖𝑝𝑜𝑡é𝑡𝑖𝑐𝑎

𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜

Assim formalmente o teste z para duas amostras para grandes

amostras (n>30), e considerando que as amostras são independentes será

dado por:

𝑧 = 𝑥1 − 𝑥2 − 𝜇1 − 𝜇2

𝜎 𝑥1− 𝑥2

𝜎 𝑥1− 𝑥2=

𝑛1+

amostras

Exemplo: Teste z de duas amostras para diferenças de médias.

Um grupo de cartão de crédito quer testar se a diferença entre a média

de cartões de débito das famílias do Rio de Janeiro e de São Paulo. O

resultado da amostra aleatória de 250 famílias para cada estado são

mostradas na tabela abaixo:

As duas amostras são independentes. Assuma que 𝜎1 = 𝑅$ 1.045 para

Rio de Janeiro e 𝜎2 = 𝑅$ 1.350 para São Paulo. Os resultados suportam

a afirmação do grupo? Teste a 𝛼 = 0,05

amostras

As hipóteses nula e alternativa são:

Pelo fato de o teste de bicaudal e o nível de significância ser de 5%,

os valores críticos serão −𝑧0 = −1,96 𝑒 𝑧0 = 1,96 . A região de

rejeição será 𝑧 < −1,96 𝑒 𝑧 > 1,96. A estatística de teste padronizada

será:

Diferença entre médias (amostras grandes e

independentes)

Intepretação: Não há evidência a 5% de significância sobrea afirmação do grupo que exista diferença entre o uso docartão de débito das famílias do Rio e São Paulo.

amostras

Se o pressuposto de que as duas distribuições sã normais, então

podemos usar o teste de diferença de médias para populações menores

que 30 observações. Porém o que será retratado agora é de que ambas

devem ser independentes. Dessa forma:

1. Os desvios padrões populacionais são desconhecidos;

2. As amostras devem ser selecionadas aleatoriamente;

3. As amostras são independentes.

4. As populações são normalmente distribuídas ou cada tamanho da

amostra é de pelo menos 30.

Diferença entre médias (amostras pequenas

e independentes)

amostras

Assim os requisitos para o teste t serão:

e independentes)

amostras

Exemplo: Teste t de duas amostras para diferença entre médias

O resultado de um teste matemático para amostras aleatórias simples

de estudantes para dois professores diferentes na mesma escola é

mostrado abaixo:

Podemos concluir que existe uma diferença na média das notas de

matemática dos estudantes para os dois professores? Use 𝛼 = 10%.

Assuma que as populações são normalmente distribuídas para os dois

professores.

e independentes)

amostrasDiferença entre médias (amostras pequenas

e independentes)

No nível de significância de 10% não existe evidências que de suporte para aafirmação de que a média das notas de matemática dos estudantes sejamdiferentes para os dois professores

amostras

Exemplo: teste t para duas amostras para a diferença entre médias

A Renaut supõe o custo médio operacional por Km de um sedã é

menor que o custo de seu principal concorrente. Você é contratado para

conduzir um estudo usando uma amostra aleatória de 30 sedãs da

empresa Renaut e 32 amostras (aleatórias) do concorrente. Os resultados

podem ser observados na tabela abaixo:

A 𝛼 = 0,05, podemos afirmar a hipótese da Renaut? Assuma que as

variâncias das populações são iguais.

e independentes)

amostrasDiferença entre médias (amostras pequenas

e independentes)

amostras

A 5% de significância, podemos afirmar estatisticamente que existe

evidência de que a afirmação da Renaut está correta que o custo

operacional do sedã deles é menor que o concorrente.

e independentes)

amostras

Quando as amostras são dependentes

Nessa situação devemos utilizar um procedimento diferente e

encontrar uma diferença entre médias para dados emparelhados dado por

𝑑 = 𝑥1 − 𝑥2

A estatística do teste é a média 𝑑 dessas diferenças:

𝑑 = 𝑑

𝑛As seguinte condições devem ser satisfeitas:

1. As amostras devem ser selecionadas aleatoriamente

2. As amostras devem ser dependentes

3. Ambas populações devem ser normalmente distribuídas.

Diferença entre médias (amostras

dependentes)

amostras

Graficamente o teste se baseará na condição que:

dependentes)

amostras Diferença entre médias (amostras

dependentes)

amostras

O teste t para diferença de médias então será dado por:

dependentes)

amostras

Exemplo:

A fabricante de calçados afirma que os atletas podem aumentar suas

alturas de salto vertical usando sapatos de treinamento do fabricante. As

alturas de salto vertical de oito atletas selecionados aleatoriamente foram

medidos. Depois que os atletas usaram os sapatos por 8 meses, suas

alturas de salto vertical foram medidas novamente. As alturas de

impulsão vertical (em polegadas) para cada atleta são mostrados na

tabela abaixo.

dependentes)

amostras

A um α = 0,10, há evidência suficiente para apoiar a afirmação do

fabricante? Assuma as alturas de salto vertical são normalmente

distribuídas.

dependentes)

Podemos afirmar que a nível10% de significância, que existeevidências que dão suporte aafirmação do fabricante.

amostras

Lembrando que as hipóteses serão:

Considerando que:

1. As amostras são aleatoriamente selecionadas

2. As amostras são independentes

3. As amostras são grandes ou normalmente distribuídas, lembrando

que a regra 𝑛𝑝 ≥ 5 e 𝑛𝑞 ≥ 5 ainda deve ser observada.

Caso a hipótese indique 𝒑𝟏 = 𝒑𝟐, 𝒑𝟏 ≤ 𝒑𝟐 𝒐𝒖 𝒑𝟏 ≥ 𝒑𝟐, então 𝒑𝟏 =𝒑𝟐 é assumida a expressão 𝒑𝟏 − 𝒑𝟐 = 𝟎

Diferença entre proporções

Então as possibilidades serão:

A hipótese pautando-se em 𝜇 𝑝1− 𝑝2= 𝑝1 − 𝑝2

O desvio padrão para proporção de duas amostras será:

Repare que precisamos conhecer a variância da proporção da

população calculada. Podemos calcular o peso da estimativa de 𝑝1 𝑒 𝑝2

usando:

Onde 𝑥1 = 𝑛1 𝑝1 e 𝑥2 = 𝑛2 𝑝2. Com o peso da estimativa 𝑝, o desvio

padrão amostral da distribuição para 𝑝1 − 𝑝2 será

Assim o teste z será dado por

𝑧 = 𝑝1 − 𝑝2 − 𝑝1 − 𝑝2

𝑝 𝑞1𝑛1

+1𝑛2

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Exemplo: Um estudo de 150 ocupantes selecionados aleatoriamente

em carros de passageiros e 200 ocupantes selecionados aleatoriamente

em picapes mostra que 86% dos ocupantes de veículos de passageiros e

74% dos ocupantes em picapes usam cintos de segurança. A um nível de

significância de 10%, podemos rejeitar a alegação de que a proporção de

ocupantes que usam cintos de segurança é o mesmo para carros de

passeio e picapes? Ver dados na tabela abaixo:

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Há evidência suficiente a nível de 10% de significância para rejeitar a alegação de quea proporção de ocupantes que usam cintos de segurança é a mesma para carros depasseio e caminhonetes.

APLICAÇÃO NO R(Clique na Figura para ir ao vídeo Prático do R)

PRÓXIMA AULA

REGRESSÃO LINEAR

SIMPLES

Tópico 3 Testes de Hipóteses - 2 amostras

Education

Transcript of Tópico 3 Testes de Hipóteses - 2 amostras

A seringueira Tricomposta [Modo de Compatibilidade] · Texto – Arial 20 pt » Tópico – Arial 18pt » Tópico » Tópico » Tópico » Tópico ... Evolução da produção de

TÓPICO 1 - QUESTÕES

Hipóteses de escrita

Apresentação hipóteses

Hipóteses e cientistas

Sobre Hipóteses

Planificação Anual · do Apresentação e teste diagnóstico (incluindo correção) Tópico 1 – Números Racionais Tópico 2 – Isometrias Tópico 3 – Funções Tópico 4 –

Hipóteses da escrita

PROBLEMAS, HIPÓTESES E VARIÁVEIS. Introdução Problema A delimitação do problema de pesquisa A construção de hipóteses Níveis de hipóteses

EST56 - Tópico 2

TESTES DE HIPÓTESES - inf.ufsc.brmarcelo.menezes.reis/Aula10CPGCC.pdf · Os resultados da resistência para duas amostras de 10 ensaios cada estão a seguir. Os ... Testes de hipóteses:

Tópico de cáncer

Testes de Hipóteses

Hipóteses - Semana 07

Testes de Hipóteses. Testes de hipóteses Testes paramétricos Testes não paramétricos.

Tópico 6 6º_ano_redes_e_circulação

Teste de Hipóteses

Tópico 9. Sociodiversidade

Hipóteses de leitura

Coletânea hipóteses escrita_2014_rew