5.TestesHipoteses_1 (1)

16

Click here to load reader

Transcript of 5.TestesHipoteses_1 (1)

Page 1: 5.TestesHipoteses_1 (1)

1

Testes de hipóteses

Testes de hipóteses para médias

Teste de Hipóteses

� Definição: Uma hipótese estatística é uma afirmação acerca dos parâmetros de uma ou mais populações (testes paramétricos) ou acerca da distribuição da população (testes de ajustamento). É uma afirmação sobre uma população, e não sobre amostra.

� Normalmente são formuladas duas hipóteses:◦ H0: (hipótese nula) que é a hipótese que se vai testar;◦ H1: (hipótese alternativa) que será aceite se não for possível

provar que H0 é verdadeira.

◦ Ex.: H0: as mulheres têm uma altura média igual à dos homens;H1: as mulheres têm uma altura média inferior à dos homens

Page 2: 5.TestesHipoteses_1 (1)

2

Teste de Hipóteses

Exemplo: Máquina de encher pacotes de açúcar.

� O peso de cada pacote deve ser aproximadamente 8g (isto é µ = 8). Será que a máquina está a funcionar correctamente?

H0: µ = 8 (a máquina funciona correctamente)H1: µ ≠ 8 (a máquina não funciona correctamente)

Teste de Hipóteses

� Teste de hipóteses é um procedimento que conduz a uma decisão acerca das hipóteses (com base numa amostra).

� Exemplo (cont.): X – v.a. que representa o peso de um pacote de açucar, E(X)=µ e V(X)=σ2

H0: µ = 8 versus H1: µ ≠ 8Dispomos de uma amostra de 10 observações (X1, …,X10). Faz sentido decidir com base na média amostral ( )aceitando H0 se a média amostral estiver próxima de 8 e rejeitar se estiver longe desse valor.

X

Page 3: 5.TestesHipoteses_1 (1)

3

Teste de Hipóteses

Exemplo (cont.):

Erros de decisão

� Erro tipo I: rejeitar H0 quando esta é verdadeira;� Erro tipo II: não rejeitar H0 quando esta é falsa;

� A probabilidade de cometer erro tipo I é denominada “nível de significância” e é denotada por α.

� A probabilidade de cometer erro tipo II é denotada por β.

Decisão H0 é verdadeira H0 é falsa

Não rejeitar H0 Decisão Correta Erro tipo II

Rejeitar H0 Erro tipo I Decisão Correta

Page 4: 5.TestesHipoteses_1 (1)

4

Erros de decisão

� α = P (erro tipo I) = P (rejeitar H0 | H0 é verdadeira) � Β = P (erro tipo II) = P (não rejeitar H0 | H0 é falsa)

Voltando ao exemplo, admitindo c=0,5 e σ=1 e n=10, temos:

Erros de decisão

� Na prática é especificada a probabilidade máxima permissível de se cometer o erro tipo I, chamado nível de significância.

� Escolhas comuns para o nível de significância são:

0,05 (5%) e 0,01 (1%)

� Por outro lado, na prática não se observa a probabilidade de se cometer o erro tipo II, isto é, se decidimos aceitar H0 não podemos determinar quão confiantes podemos estar com aquela decisão.

� Assim recomenda-se que seja usado a declaração “não rejeitar H0” em vez de aceitar H0.

Page 5: 5.TestesHipoteses_1 (1)

5

Metodologia usada nos testes de hipóteses

� Passo 1: Pelo contexto do problema identificar o parâmetro de interesse;

� Passo 2: Especificar a hipótese nula;� Passo 3: Especificar uma hipótese alternativa

apropriada;� Passo 4: Escolher o nível de significância σ;� Passo 5: Escolher uma estatística de teste adequada;� Passo 6: Fixar a região crítica do teste;� Passo 7: Recolher uma amostra e calcular o valor

observado da estatística de teste� Passo 8: Decidir sobre a rejeição ou não de H0.

Formulação de hipóteses

� A hipótese alternativa H1 contém sempre uma desigualdade (> ou <) ou uma não-igualdade (≠)

� A hipótese nula Ho é sempre considerada como verdadeira até que haja evidência estatística clara em sentido contrário.

� A hipótese nula Ho contém sempre uma igualdade.

� Quando a hipótese alternativa H1 contiver uma desigualdade (> ou <) o teste é unilateral. Quando envolver uma não-igualdade o teste é bilateral.

Page 6: 5.TestesHipoteses_1 (1)

6

Tipo de testes

Parâmetro Amostra Dimensão População Teste

1GrandePequena

Qualquer Zt

Localização (µµµµ) 2 (independentes)GrandePequena

QuaisquerNormais

Zt

2 (emparelhadas)GrandePequena

QuaisquerNormais

Zt

Localização (p)Proporção Binomial

12

GrandeGrandes

DicotómicaDicotómicas

ZZ

Dispersão (σσσσ2)1

2 (independentes)QualquerQuaisquer Normais

χχχχ2

F

TESTES DE HIPÓTESESpara a média

Page 7: 5.TestesHipoteses_1 (1)

7

Teste de hipóteses para a média

� Passo 1: Pelo contexto do problema identifique o valor da média (µ) a testar;

� Passo 2: Construa as hipóteses, identificando se o teste é bilateral ou unilateral;

� Passo 3: Escolher o nível de significância σ;� Passo 4: Verifique qual o tipo de distribuição

mais apropriada (normal ou t-Student);� Passo 5: Calcule a estatística de teste, usando:

ou

(para a Normal) (t-Student)N

XET σ

µ0−=

N

sX

ET 0µ−=

Teste de hipóteses para a média

� Passo 6: Interprete a estatística de teste para verificar se a hipótese nula é ou não rejeitada. Se z ou t corresponder a valores da região crítica, rejeite H0, caso contrário, não rejeite H0. Região crítica

Diferentes níveis de significância podem gerar diferentes conclusões. Com um nível de 5%, H0 poderá ser rejeitada, mas com 1% poderá ser aceite.

Page 8: 5.TestesHipoteses_1 (1)

8

Teste de hipóteses para a média

� Para amostras pequenas (n ≤ 30) ou quando σ for desconhecido, usamos S ao invés de σ e consideramos (n-1) graus de liberdade;

� Para σ desconhecido, a distribuição é uma t-student, não uma normal. Contudo, para amostras de tamanho muito grandes, as diferenças entre as distribuições normal e t são desprezíveis. O uso da distribuição t-student dá melhores resultados.

Teste de hipóteses para a média

� As hipóteses podem ter várias formas:

Teste2.1 à direita

2. Unilateral

2.2 à esquerda

Onde µ0 é o valor numérico específico que está a ser considerado nas hipóteses nula e alternativa.

1. Bilateral

H0: µ = µ0

H1: µ > µ0

H0: µ = µ0

H1: µ < µ0

H0: µ = µ0

H1: µ ≠ µ0

Page 9: 5.TestesHipoteses_1 (1)

9

1. Teste de hipóteses bilateral

H0: µ = µ0

H1: µ ≠ µ0

α/2 α/2

Rejeitar H0 Rejeitar H0Não rejeitar H0

1. Teste de hipóteses bilateral� Exemplo: Um comprador de tijolos julga que a qualidade dos

tijolos está-se a deteriorar. Sabe-se, pela experiência passada, que a média de resistência ao esmagamento destes tijolos é de 400 libras com desvio padrão de 20 libras. Numa amostra de 100 tijolos obteve-se uma média de resistência de 395 libras. Teste a hipótese de que a qualidade média dos tijolos não se alterou contra a alternativa de que se tenha deteriorado (considere o nível de significância de 5%).

H0: µ = 400H1: µ ≠ 400

= 395 – 400 = -5 = -2,520/√100 2

Para 5%, zc = 1,96

CONCLUSÃO: rejeitamos H0, isto é, a resistência alterou-se.

zc = -1,96 zc = 1,96

N

XET σ

µ0−=

Page 10: 5.TestesHipoteses_1 (1)

10

2.1 Teste de hipóteses unilateral à direita

H0: µ = µ0

H1: µ > µ0

Não rejeitar H0 Rejeitar H0

2.1 Teste de hipóteses unilateral à direita

� Exemplo: Numa determinada estrada nacional, quando é utilizadoo radar, são verificadas em média 7 infracções diárias por excessode velocidade. O chefe da polícia acredita que este número podeter aumentado. Para verificar isso, um radar foi mantido por 10dias consecutivos. Os resultados foram:

8, 9, 5, 7, 8, 12, 6, 9, 6, 10 Os dados trazem evidências do aumento das infrações?

H0: µ = 7

H1: µ > 7

Média amostral = 8+9+5+7+8+12+6+9+6+10 = 8

10

Não conhecemos σ, logo estimamos s, onde s = 2,1

Usando t-Student: = = 1,5

t = 1,5 tc = 1,812

CONCLUSÃO: Não rejeitamos H0, o que implica que o número de

infracções não teve um aumento significativo.

N

sX

ET 0µ−=

Page 11: 5.TestesHipoteses_1 (1)

11

2.2 Teste de hipóteses unilateral à esquerda

H0: µ = µ0

H1: µ < µ0

Rejeitar H0Não rejeitar H0

2.2 Teste de hipóteses unilateral à esquerda

� Exemplo: Uma pesquisa mostrou que os políticos ganham em média 45.678€ por ano. Um deles contestou a pesquisa e disse que a média verdadeira seria de 48.000€, com um desvio padrão de 7.000€. Foram analisados 81 políticos na pesquisa para se obter aquela média amostral. Para um nível de significância de 5%, teste se o que o político disse é válido?

H0: µ = 48.000Ha: µ < 48.000

= 45.678- 48.000 = - 2.322 = - 0, 002987.000/√81 777,77

Para 5%, zc = 1,65

CONCLUSÃO: Não rejeitamos H0.

zc = - 1,65

N

XET σ

µ0−=

Page 12: 5.TestesHipoteses_1 (1)

12

Exercício

1) A vida média de uma amostra de 100 lâmpadas fluorescentes produzidas por uma empresa foi calculada em 1570 horas, com desvio padrão de 120 horas. Se µ traduz a vida média de todas as lâmpadas produzidas pela empresa, teste a hipótese µ = 1600 horas, face à hipótese alternativa µ ≠ 1600 horas, adoptando um nível de significância de 0,05.

� As hipóteses podem ter várias formas:

Teste2.1 à direita

2. Unilateral

2.2 à esquerda

Onde µ1 e µ2 são os valores numéricos específicos que são comparados nas hipóteses nula e alternativa.

1. Bilateral

H0: µ1 - µ2 ≤ 0

H1: µ1 - µ2 > 0

H0: µ1 - µ2 ≥ 0

H1: µ1 - µ2 < 0

H0: µ1 - µ2 = 0

H1: µ1 - µ2≠ 0

Teste de hipóteses para 2 amostras

Page 13: 5.TestesHipoteses_1 (1)

13

Teste de hipóteses para amostras de grande dimensão (ou com σ1 e σ2 conhecidos)

� Estatística de teste

� Usar a tabela da normal padrão.

)1.0(~)(

22

0 N

NN

XXET

B

B

A

A

BA >+

−−=σσ

δ

Teste de hipóteses para amostras de pequena dimensão (com σ1 e σ2 desconhecidos)

� Estatística de teste

� Usar a tabela t-student.

� Como σ1 e σ2 são desconhecidos, usa-se s1 e s2 (desvio-padrão amostral) em vez de σ1 e σ2;

GLt

N

s

N

s

XXET >

+

−−= ~)(

2

22

1

21

021 δ

Page 14: 5.TestesHipoteses_1 (1)

14

1. Teste de Hipótese Bilateral

H0: µ1 - µ0 = 0

H1: µ1 - µ0 ≠ 0

α/2 α/2

Rejeitar H0 Rejeitar H0Não rejeitar H0

1- α

µ1 - µ2 = 0

Teste de hipóteses bilateral

1. Teste de Hipótese Bilateral

α/2 = 0,025

Rejeitar H0 Rejeitar H0Não rejeitar H0

1- α = 0,95

µ1 - µ2 = 0

Estatística de teste

zc = 1,96-zc= -1,96

α/2 = 0,025

H0: µ1 - µ2 = 0

H1: µ1 - µ2 ≠ 0

Teste de hipóteses bilateral

2

22

1

21

021 )(

NN

XXET

σσδ

+

−−=

Page 15: 5.TestesHipoteses_1 (1)

15

Exercício

� Num estudo comparativo do tempo médio deadaptação, uma amostra de 100 funcionários,(sendo 50 homens e 50 mulheres) de um grandecomplexo industrial, produziu os resultadosabaixo. Teste o facto do tempo médio deadaptação dos homens ser igual ao das mulheres,para um nível de significância de 10%.

Estatísticas Homens Mulheres

Médias 3,2 anos 3,7 anos

Desvios-padrões 0,8 anos 0,9 anos

Outro método: p-value

� Em vez de fixar α, determinar a região crítica e, em seguida, verificar se o valor observado pertence à região crítica, pode olhar-se directamente para o valor observado da estatística de teste e determinar para que nível de significância a decisão muda.

� Definição: Dado o valor observado da estatística de teste, o valor-p (p-value) é o maior nível de significância que levaria à não rejeição da hipótese nula (ou o menor que levaria à rejeição).

Quanto mais baixo for o valor-p maior é a evidência contra a hipótese nula.

Page 16: 5.TestesHipoteses_1 (1)

16

Bibliografia

Pedrosa, A. C. e Gama, S. M. (2004) Introdução Computacional à Probabilidade e Estatística, Porto Editora.

Pires, A. (2000). Probabilidades e Estatística, Capítulo 8 – Testes de hipóteses, IST.

Souza, R. (s/d). Probabilidades,UFPE.