Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo...

24
Estatíst Estatíst ica ica Aula 21 Aula 21 Universidade Federal de Alagoas Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Prof. Marllus Gustavo Ferreira Passos das Neves Neves

Transcript of Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo...

Page 1: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

EstatísticaEstatísticaAula 21Aula 21

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves

Page 2: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Aula 21Aula 21

Teste de Hipóteses para duas médiasTeste de Hipóteses para duas médias

Page 3: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostrasAté o momento vimos testes de hipótese para média (com conhecido ou desconhecido) e para variância (e desvio padrão)Observe a série de vazões

abaixo ...Há algo acontecendo nela?

E se calcularmos a média em 2 períodos?

Page 4: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Com base nos dados das amostras de cada população, pode-se apresentar conclusões com relação a comparação das duas populações, usando para isto o teste de hipótese.

Inferência Estatística para Duas Populações

Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras

N1 N2

Page 5: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Nosso objetivo agora é realizar testes de hipóteses a respeito da diferença ou não entre 2 médias e 2 variâncias

Ou ainda testar se 2 grupos de dados, emparelhados ou independentes, vêm de populações com médias ou variâncias diferentes

Mas o que são grupos independentes ou dependentes (emparelhados)?

Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras

Page 6: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras

Duas amostras são independentes se os valores amostrais de uma população não estão relacionados ou de alguma forma emparelhados ou combinados com os valores amostrais selecionados de outra população. Se existe alguma relação de modo que cada valor em uma amostra esteja emparelhado com o valor correspondente na outra amostra, as amostras são dependentes ou emparelhadas

Page 7: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes

Suposições:

1)As 2 amostras são independentes;2)As amostras são aleatórias;3)Os 2 tamanhos amostrais são ambos grandes (n1 > 30 e n2 >30) ou ambas as amostras provêm de populações com distribuições normais

Estatística de teste

BA

XX 2121

)(

t1n

B1n

AB)(A

gl

2

2

1

2

2

Graus de

liberdade

onde e

1

21

ns

A 2

22

ns

B

Page 8: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentesValores críticos tabela da curva t

Hipóteses: H0: 1 = 2 ou 1 - 2 = 0 e H1: 1 ≠ 2

Intervalo de confiança:

BAE ct

EXXEXX 2121 )( 21

onde, 1

21

ns

A 2

22

ns

Be

Page 9: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes

Exemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentes

Com o que vimos anteriormente (IC para uma amostra), poderíamos já ter noção se há diferença ou não?

Gênero N n %N pop gl tc fatormédia

amostral s E EcorrLim inf

Lim sup

Masculino

606 32 5,28 finita 31 2,04 0,974 23,8 3,01,08 1,05 22,8 24,9

Feminino268 20 7,46 finita 19 2,09 0,964 21,0 1,60,60 0,58 20,4 21,6

Page 10: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes

Exemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentes

23,8

21,0

15,0 30,0

22,8 24,9

20,4 21,6

A não superposição de Ics parece indicar que há diferença significativa entre as médias. Entretanto, vamos realizar o teste formal

Page 11: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes

Exemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentes1) Parâmetro de interesse 1 - 1

2) Hipótese nula H0 1 - 1 = 0 3) Hipótese alternativa H1 1 ≠ 2 4) Nível de significância = 0,055) Estatística de teste t (desconhecemos e )6) Região de rejeição para a estatística

0

0 ,4

-3 -2 -1 0 1 2 3- tc tc

95%2,5% 2,5%

Page 12: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

7) Grandezas amostrais necessárias

2,995 s

23,81X

1

1

Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes

1,629 s

20,98X

2

2

Estatística de teste

0,28032

8,97ns

A1

21

0,13320

2,65ns

B2

22

4,41

0,1330,280

020,9823,81

t

Page 13: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

8) Decisão

Valor crítico de tc

gl = 49, o que significa tc = 2,009 (mais próximo gl = 50)

Como t de teste cai na região crítica, a hipótese H0 tem que ser rejeitada, ou seja, há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que os Índices de Massa Corpórea (IMC) para os homens são diferentes dos IMCs das mulheres, para alunos do curso diurno do Ctec, com exceção do curso de Eng. do Petróleo

AplicaçõesAplicações

49

120(0,133)

132(0,280)

0,133)(0,280

1nB

1nA

B)(Agl 22

2

2

2

1

2

2

Page 14: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Os resultados que vimos já seriam vislumbrados comestatística descritiva?

IMC masculino

IMC feminino

AplicaçõesAplicações

Page 15: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

IMC feminino

IMC masculino

E quanto à normalidade das populações?

AplicaçõesAplicações

Page 16: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Exemplo: estabeleça o IC para a diferença entre as médias do IMC do exemplo anterior

1,290,6432,0090,1330,2802,009BAE ct

Calculando a margem de erro para gl = 49 tc = 2,009

Intervalo de confiança:

EXXEXX 2121 )( 21

1,292,83 )( 1,292,83 21

4,12 )( 1,54 1 2Estamos confiantes 95% de que 1 excede 2por uma quantidade que está entre 1,54 e 4,12

O valor zero está neste IC?

AplicaçõesAplicações

Page 17: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Exemplos de amostras emparelhadas

Ao conduzir um experimento para testar a eficácia de uma dieta de baixa gordura, o peso de cada sujeito é medido uma vez antes da dieta e uma vez após a dieta

Para testar a eficácia de uma técnica de tratamento do esgoto com o objetivo de reduzir, por exemplo, a presença de patógenos, mede-se um indicador antes e depois do tratamento, em várias amostras

Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas

Page 18: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas

Suposições:

1)Os dados amostrais consistem em pares combinados;2)As amostras são aleatórias;3)O no de pares combinados de dados amostrais é grandes (n > 30) ou os pares de valores têm diferenças que são de uma população com distribuição normal

Page 19: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas

d

d diferença individual entre 2 valores em um único par combinadod valor médio das diferenças d para a população de todos os pares combinados valor médio das diferenças d para os dados amostrais emparelhados (igual à média dos valores x – y)sd desvio padrão das diferenças d para os dados amostrais combinadosn no de pares de dados Estatística

de testen

sd

d

dt

gl = n - 1

Page 20: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas

Hipóteses: H0: d = 0 e H1: 1 ≠ 2 ou H1: d > 0

ou H1: d < 0

Intervalo de confiança:

n

sE d ctEdEd d onde

Page 21: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

Exemplo: Um artigo no Journal of Strain Analysis (1983, Vol. 18, No 2) compara vários métodos para predizer a resistência de cisalhamento para traves planas metálicas. Dados para 2 desses métodos, os procedimentos de Karlsruhe e Lehigh, quando aplicados a 9 traves específicas, são mostrados na tabela. Desejamos determinar se há qualquer diferença (na média) entre os 2 métodos.

AplicaçõesAplicações

Trave Método de Karlsruhe Método de Lehigh Diferença dj

S1/1 1,186 1,061 0,119

S2/1 1,151 0,992 0,159

S3/1 1,322 1,063 0,259

S4/1 1,339 1,062 0,277

S5/1 1,200 1,065 0,138

S2/1 1,402 1,178 0,224

S2/2 1,365 1,037 0,328

S2/3 1,537 1,086 0,451

S2/4 1,559 1,052 0,507

Page 22: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

AplicaçõesAplicações

1) Parâmetro de interesse D = 1 - 1

2) Hipótese nula H0 D = 0 3) Hipótese alternativa H1 D ≠ 0 4) Nível de significância = 0,055) Estatística de teste t (desconhecemos e )6) Região de rejeição para a estatística

0

0 ,4

-3 -2 -1 0 1 2 3- tc tc

95%2,5% 2,5%

7) Grandezas amostrais necessárias

Estatística de teste

6,05

90,13560,2736

n

sd

d

d

t0,1356 s

0,2736d

D

Page 23: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

8) Decisão

Valor crítico de tcgl = 9 – 1 = 8, duas caudas tc = 2,306

Como t de teste cai na região crítica, a hipótese H0 tem que ser rejeitada, ou seja, há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que os métodos de previsão fornecem resultados diferentes.Especificamente, podemos dizer que o método Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh

AplicaçõesAplicações

- 2,306 0 2,306

t

6,05

Page 24: Estatística Aula 21 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves.

EstatísticaEstatísticaAula 21Aula 21

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves