Estatística Aplica à Educação Físcia Profa. Dra. Maria Ivanilde S. Araújo...

Post on 18-Apr-2015

104 views 0 download

Transcript of Estatística Aplica à Educação Físcia Profa. Dra. Maria Ivanilde S. Araújo...

Estatística Aplica à Educação Físcia

Profa. Dra. Maria Ivanilde S. Araújomiaraujo@ufam.edu.br

Inferência Estatística

Intervalo de ConfiançaTeste de Hipótese

Inferência Estatística

Consiste em um conjunto de procedimentos para o estabelecimento de conclusões e tomada de decisões sobre a população, baseados nas informações amostrais

A inferência estatística é o processo pelo qual informações a cerca da população são obtidas a partir de dados de uma determinada amostra.

Inferência Estatística

Esta técnica é dividida em:

• Estimação de parâmetros e

• Teste de Hipóteses.

Conceitos

ParâmetroÉ uma medida numérica que descreve alguma característica de uma população.

EstatísticaÉ uma função das observações amostrais, que não depende de parâmetros desconhecidos.

Conceitos

EstimaçãoEstudo de métodos para obter medidas representativas da população calculadas a partir da amostra.

Estimador É a função da amostra que corresponde a um parâmetro populacional.

EstimativaÉ o valor do estimador, calculado a partir de uma amostra.

População: Média = µ

Variância = σ²

Proporção = π

Amostra: Média = estimador de µ

Variância = S² estimador de σ²

Proporção = p estimador de π

X

Tipos de estimação de ParâmetrosUm parâmetro pode ser estimado de duas formas: por ponto ou por intervalo

Estimativa PontualÉ o valor que o estimador assume para uma determinada amostra.

Estimativa Intervalar

É o intervalo definido pela estimativa pontual mais/menos o erro máximo da estimativa.

Distribuição Amostral

A distribuição que descreve o padrão de variação dos valores de uma estatística, para diferentes amostras extraídas da população de interesse, é denominada distribuição amostral.

Amostra Aleatória

As observações x1, x2, ..., xn constituem uma amostra aleatória de tamanho n da população, se cada observação resulta de seleções independentes dos elementos da população e se cada xi tem a mesma distribuição da população da qual foi extraída.

Distribuição da Média Amostral

A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma população que tem média μ e desvio padrão σ, tem as seguintes características:

Média =

Variância =

Desvio Padrão =

X

xXE

n

XVAR x

22

n

XDP x

Distribuição da Média Amostral

A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma POPULAÇÃO NORMAL que tem média μ e desvio padrão σ, é NORMAL com média μ e desvio padrão .

X

n

Teorema Central do Limite

A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma população NÃO NORMAL, com média μ e desvio padrão σ, é APROXIMADAMENTE NORMAL com média μ e desvio padrão .

Este resultado significa que:

é aproximadamente N(0, 1).

n

X

n

XZ

Estimativas de Médias

Quando calculamos a média de uma amostra, na realidade estamos determinando a estimativa da média populacional.

σ é o desvio padrão

n.e Z

2

Erro Máximo da Estimativa

Representa a diferença (erro) máxima que será permitida entre a estimativa pontual ( ) e o valor verdadeiro do parâmetro que está sendo estudado (μ).

1 -

n

SZ 2

.

2 2

X

Erro Cometido na Estimação de μ por , segundo Montgomery, D.C. & Runger, G.C. (1994).

*

XErro

nZXI

2

nZXS 2

X

X

Intervalo de Confiança

Dado a limitação da estimação pontual, que reside no desconhecimento da magnitude do erro que se está cometendo, surge a idéia da construção de um intervalo que contenha, com um nível de confiança conhecido, o valor verdadeiro do parâmetro. Este intervalo é baseado na distribuição amostral do estimador pontual.

Intervalo de Confiança

n X(µ, σ²)

População

X

x 96,1 x 96,1xX 96,11

xX 96,12

xkX 96,1

1X

2X

kX

µ

n

n

amostra

amostra

amostra

95% dos intervalosContêm µ

Relação entre o Coeficiente de Confiança e o Comprimento do Intervalo de Confiança para a Média Populacional μ, segundo Neter; J., Wasserman, W. & Whitmore, G. A (1993).

Comprimento do Intervalo de Confiança

Coeficiente de Confiança

99,9%

95%

90%

80%

70%

60%

50%

eX

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida

nzX

nzX

..

22

Podemos afirmar com (1 – α )100% de confiança que o intervalo de , contém a média populacional que estamos procurando estimar;

O grau de confiança mais utilizado é 95% e o valor correspondente Zα/2 é 1,96;

O intervalo de confiança é definido pelo grau de confiança e pela variabilidade.

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida

Exemplo: Para uma amostra de 50 observações de uma população normal com média desconhecida e desvio padrão σ = 6, seja 20,5 a média amostral . Construir um intervalo de 95% de confiança para a média populacional.

X

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida

= 20,5; n = 50; σ = 6

O resultado obtido [18,84; 22,16] é um intervalo de confiança de 95% de confiança para a média populacional μ, calculado com base na amostra observada.

16,22;84,1850

696,15,20;

50

696,15,20

X

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

Se x1, x2, ..., xn é uma amostra aleatória de uma população normal com média μ e desvio padrão σ, então a distribuição de

é denominada distribuição t de Student com n – 1 graus de liberdade

nS

Xt

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

n

StX

n

StX nn ..

2;12;1

( n ≤ 30) Neste caso precisa-se calcular a

estimativa S (desvio padrão amostral) a partir dos dados;

O coeficiente t segue a distribuição "t" de Student, no caso com (n – 1) graus de liberdade.

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

Colete uma amostra de tamanho n ≤ 30 da população de interesse;

Calcule os valores de e S;Escolha o valor do coeficiente de confiança 1 – α ;

Determine os valores de tα/2; n – 1 a partir da tabela da distribuição t de Student;

Calcule os limites do intervalo de confiança.

X

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

Exemplo: Uma amostra de tamanho 9, extraída de uma população normal acusa = 1,0 e S = 0,264. Construir intervalos de 98% e 95% de confiança para média populacional.

X

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

Para 1 – α = 98% α = 0,02; α/2 = 0,01 graus de liberdade = 9 – 1 = 8.

Intervalo:

[1 2,896(0,264/3)] [0,745; 1,255]

nStX 8;01,0

Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida

Para 1 – α = 95% α = 0,05; α/2 = 0,025 graus de liberdade = 9 – 1 = 8.

Intervalo:

[1 2,306(0,264/3)] [0,797; 1,203].Note que, aumentando o nível de confiança, o tamanho do intervalo também aumenta.

nStX 8;025,0

Tamanho da Amostra para Estimar a Média

Para se ter 100(1 – α )% de confiança de que o erro de estimação seja inferior a um valor predeterminado e, o tamanho da amostra necessário é:

X

22

e

Zn

Etapas para determinação do tamanho da amostra necessária para estimação da média populacional μ

Especificar o coeficiente de confiança 1 – α;

Obter uma estimativa preliminar do desvio padrão σ;

Especificar o erro máximo e permitido na estimação;

Obter o valor de Zα/2 da distribuição normal;

24686,245)5,0(

16)96,1(2

2

nn

Exemplo: Suponha que desejamos estimar uma média populacional com erro amostral 0,5 e probabilidade de confiança 0,95. Como 2 (variância populacional) não é conhecida, foi retirada uma amostra de 10 observações da população para nos dar uma ideia sobre valor de 2, obteve-se S2 = 16. Determine o tamanho da amostra necessário para atender estas especificações.

Tamanho da Amostra para Estimar a Média

Estimativa de Proporções

Suponha que há interesse na proporção de elementos da população que possuem alguma característica de interesse (p).

Se o tamanho da amostra (n) for suficientemente grande, é possível fazer mensurações para: Intervalo de Confiança; Teste de Hipótese.

Intervalo de Confiança para p

n

)p̂1(p̂p̂p

n

)p̂1(p̂p̂ zz

22

Intervalo de Confiança para p

Colete uma amostra de tamanho n da população de interesse;

Determine o valor de y;Onde y = nº de elementos na amostra que possuem a característica de interesse;

Calcule ;Escolha o valor do coeficiente de confiança 1 – α ;Determine os valores de Zα/2 a partir da distribuição

normal; Calcule os limites do intervalo de confiança.

n

yp̂

Intervalo de Confiança para p

Exemplo: Entrevistam em uma cidade 1.500 pessoas em idade de trabalho, e constata-se que 145 estão desempregadas.

1) Estimar a taxa de desempregado com base nos dados,

2) Estabelecer um intervalo de 95% de confiança para a taxa populacional.

Intervalo de Confiança para p

1)

2) α = 0,05; α/2 = 0,025; Z0,025 = 1,96.

= [0,097 0,0149] = [0,082; 0,112]

= [8,2%; 11,2%].Assim um intervalo de confiança a 95% para p (proporção de pessoas desempregadas na população) é dado por (0,082; 0,112).

%7,9097,01500

145p̂

1500)097,01(097,096,1097,0

2

2

2

e

p1pn Z )(

Tamanho da Amostra para Estimar p

n

p1pe z 2

)(

Par que seja possível ter 100(1 – α)% de confiança que o erro de estimação é inferior a um valor predeterminado e, o tamanho da amostra necessário é:

onde erro máximo da estimativa é dado a partir de,

pp ˆ

Etapas para determinação do tamanho da amostra necessária para estimação da proporção p

• Especificar o coeficiente de confiança 1 – α;

• Obter uma estimativa preliminar da proporção p;

• Especificar o erro máximo e permitido na estimação;

• Obter o valor de Zα/2 da tabela normal

Estimativa preliminar da proporção p

Dados históricos sobre a população de interesse;

Resultados obtidos em estudos similares ao que está sendo realizado;

Extração de uma amostra-piloto;

Utilizar p = 0,5 (atitude conservadora), valor que corresponde a um máximo para n.

Intervalo de Confiança no MinitabVariância pop. (σ²) conhecida

Digite sua amostra em uma coluna, clique em Stat / Basic Statistic / 1_Sample Z...

Escolha “Confidence Interval”. Em “Level” digite o coeficiente de confiança. Em “Sigma” digite o valor do desvio padrão populacional. Se desejar gráficos clique em “Graphs...”, clique em OK.

Intervalo de Confiança no MinitabVariância pop. (σ²) desconhecida

Digite sua amostra em uma coluna, clique em Stat / Basic Statistic / 1_Sample t...

Escolha “Confidence Interval”. Em “Level” digite o coeficiente de confiança. Se desejar gráficos clique em “Graphs...”, clique em OK.

Teste de hipótese

Teste de hipóteses

Idéia básica: procurar condições que garantam que os resultados de experimentos possam ser generalizados além da situação experimental

O teste de hipóteses consiste na comparação de duas hipóteses, chamadas Hipótese nula e Hipótese alternativa.

Teste de hipóteses

A comparação de duas hipóteses é feita baseada

em evidências experimentais (amostras), sujeitas a

erros amostrais e/ou erros não-amostrais.

Teste de hipóteses

• Hipótese Nula (): É a hipótese a ser testada.

No problema de comparação de dois tratamentos é usual fixar como hipótese de interesse a inexistência de diferença entre os dois tratamentos comparados.

Teste de hipóteses

• Hipótese Alternativa (): A hipótese nula deve ser comparada com uma hipótese alternativa.

Para cada situação existem hipóteses alternativas adequadas.

Teste de Hipóteses

• Exemplo:

Fischl et al. (1987) publicaram o primeiro relato de um ensaio clínico que comprovou a eficácia de zidovudina (AZT) para prolongar a vida de pacientes com AIDS. Os dados centrais do trabalho estão na Tabela a seguir.

Teste de Hipóteses

GrupoSituação

TotalVivo Morto

AZT 144 1 145

Placebo 121 16 137

Total 265 17 282

Tabela: Número de sobreviventes tratados com AZT ou placebo

Teste de Hipóteses

A análise dos dados da tabela consiste basicamente na comparação de duas proporções. A proporção dos que estavam vivos depois de 24 semanas de tratamento foi de 144/145 = 0,993 entre os pacientes que receberam o AZT, enquanto que para o grupo placebo foi de 121/137 = 0,883.

Teste de Hipóteses

Será que o AZT de fato uma droga efetiva para prolongar a vida de pessoas com AIDS?

Teste de Hipóteses

As hipóteses a serem testadas neste exemplo são: Hipótese nula:

Ou seja, a proporção de pacientes com AIDS que tiveram sobrevida é igual para os grupos controle e tratamento

Teste de Hipóteses

Onde e são respectivamente as probabilidades de se observar a resposta de interesse entre os pacientes de grupo controle e os do grupo tratamento.

Teste de Hipóteses

Podemos ter como hipótese alternativa que a proporção de pacientes no grupo tratamento seja superior à do grupo controle.

Teste de Hipóteses

Podemos ter como hipótese alternativa que a proporção de pacientes no grupo tratamento seja inferior à do grupo controle.

Teste de Hipóteses

Ou ainda, a hipótese alternativa que a proporção de pacientes no grupo tratamento seja diferente à do grupo controle.

Critérios de decisão

• Decididas as hipóteses a serem testadas, o próximo passo é construir um critério baseado no qual a hipótese será julgada.

• O critério de decisão é baseado na estatística de teste.

• De uma forma bem genérica e intuitiva podemos dizer que a estatística do teste mede a discrepância entre o que foi observado na amostra e o que seria esperado se a hipótese nula fosse verdadeira.

Critérios de decisão

• Uma grande distância medida pela distribuição de probabilidade é indicação de que não é verdadeira, devendo portanto ser rejeitada.

• Rejeita-se a hipótese nula se o valor da estatística do teste é “grande”. Esse valor deve portanto ser comparado a alguma distribuição de probabilidade que depende de cada caso, como veremos mais a diante.

Erros na conclusão do teste de hipóteses

Por causa das flutuações amostrais, ao comparar duas hipóteses e tomar uma decisão, pode-se tomar a decisão errada.

Dois tipos de erro: Erro Tipo I (α): Rejeitar a hipótese nula quando na realidade ela é verdadeira. Erro Tipo II (): Não rejeitar a hipótese nula quando na realidade ela é falsa.

Erros na conclusão do teste de hipóteses

Realidade (na população)

H0 é verdadeira

H0 é falsa

Conclusão do Teste

(ação baseada na amostra)

Aceitar H0 correto βErro Tipo II

Rejeitar H0 αErro Tipo I

correto

p-valor

É a probabilidade de se observar um resultado tão ou mais extremo que o da amostra, supondo que a hipótese nula seja verdadeira:

p = P(Z ≥ z | H0)

Note que o valor p é calculado com base na amostra, enquanto que é o maior valor p que leva à rejeição da hipótese nula.

Teste de Hipóteses Bicaudal

Teste de Hipóteses monocaudal

Passos para a Construção de um Teste de Hipóteses

Passo 1. Fixe qual a hipótese H0 a ser testada e qual a hipótese alternativa H1;

Passo 2. Use a teoria estatística e as informações disponíveis para decidir qual estatística (estimador) será usada para testar a hipótese H0. Obter as propriedades dessa estatística (distribuição, média, desvio padrão)

Passos para a Construção de um Teste de Hipóteses

Passo 3. Fixe a probabilidade α de cometer o erro tipo I e use este valor para construir a região crítica (regra de decisão);

Passo 4. Use as observações da amostra para calcular o valor da estatística de teste;

Passo 5. Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica, não rejeite H0 ; caso contrário, rejeite H0.

Teste de Hipótese para Média em Populações Normais

Para as Hipóteses (2 é conhecido):

vs (a) H1: > 0 (0 é o valor especificado)

H0: = 0 vs (b) H1: < 0

vs (c) H1: 0

Estatística de Teste:

n

XZ

Regra de Decisão:

a)Rejeitamos H0 se

b)Rejeitamos H0 se

c)Rejeitamos H0 se ou

nzX

)(0

nzX

)(0

nzX

)2/(0 n

zX )2/(0

Teste de Hipótese para Média em Populações Normais

Teste de Hipótese para Média em Populações Normais

5,37X

Exemplo: Considere que desejamos testar as hipóteses abaixo com respeito a uma média populacional . H0 : = 40

HA : ≠ 40Supondo que a população seja normalmente distribuída com variância 2 = 9 e que para uma amostra de tamanho 25 obteve-se uma média igual a 37,5. Realize um teste, ao nível de 10% de significância para essas hipóteses.

),(~ 2 nNX

984,4025

364,140 seou

016,3925

364,140 se Rejeito 0

X

XH

Teste bicaudal;Decisão: Rejeito H0 Usando o valor p = 0,00001 rejeitamos H0;Conclusão: Ao nível de significância de 0,10 rejeitamos a hipótese de que a média é igual a 40, ou seja, aceitamos a hipótese alternativa.

Teste de Hipótese para Média em Populações Normais

Teste de Hipóteses no Minitab Digite sua amostra em uma coluna, Clique em Stat /

Basic Statistic / Store Discriptive Statistics . Escolha as opções que você deseja, clique em OK.

Novamente clique em Stat / Basic Statistic / 1_Sample Z.

Escolha “Test Mean” digite a média. Em “Alternative” escolha a opção unicaudal

inferior“less equal”, bicaudal“not equal”e unicaudal superior“greater than”

Em “Sigma” digite desvio padrão da população, clique em OK.

Teste de Hipótese para Média em Populações Normais

Para as Hipóteses (2 é desconhecido):

vs (a) HA: > 0 (0 é um valor especificado)

H0: = 0 vs (b) HA: < 0

vs (c) HA: 0

Estatística de Teste:

n

SX

TSdodesconheci

Regra de Decisão:

a)Rejeitamos H0 se

b)Rejeitamos H0 se

c)Rejeitamos H0 se ou

n

StX n );1(0

n

StX n );1(0

n

StX n );1(0

n

StX n );1(0

Teste de Hipótese para Média em Populações Normais

Exemplo: Um fabricante de baterias declarou que a capacidade média de um certo tipo de bateria que sua empresa produz é de pelo menos 140 amperes por hora. Um órgão independente de proteção ao consumidor deseja testar a credibilidade da declaração do fabricante e mede a capacidade de uma amostra aleatória de 20 baterias, de um lote produzido recentemente. Os resultados em amperes/hora, são os seguintes:

137,4 140,0 138,8 139,1 144,4 139,2 141,8 137,3 133,5 138,2

141,1 139,7 136,7 136,3 135,6 138,0 140,9 140,6 136,7 134,1

H0: = 140 n = 20 = 0,05

HA: < 140 S2= 7,0706 S = 2,66

Decisão: rejeita H0

Conclusão: há evidências que levam a crer que a declaração do fabricante está superestimada e o órgão de proteção ao consumidor deveria dar início a uma ação corretiva contra a firma.

138,47X

138,9720

2,66729,1140 se Rejeito 0 XH

Teste de Hipótese para Média em Populações Normais

Teste de Hipótese com grandes amostras para uma Proporção populacional

Para as Hipóteses

vs (a) HA: p > p0 (p0 é um valor especificado)

H0: p = p0 vs (b) HA: p < p0

vs (c) HA: p p0

Se n é grande

Estatística de Teste:n

p1p

ppZ

00

00

)(

ˆ

n

p1ppNormalp

)(,ˆ

Regra de Decisão:

a)Rejeitamos H0 se Z0 z()

b)Rejeitamos H0 se Z0 -z()

c)Rejeitamos H0 se Z0 z(/2) ou Z0 -z(/2)

Teste de Hipótese com grandes amostras para uma Proporção populacional

Exemplo: Um fabricante garante que 90% dos equipamentos que fornece a uma fábrica estão de acordo com as especificações exigidas. O exame de uma amostra de 200 peças desse equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, nos níveis de 5% e 1%.

p = proporção de equipamentos que estão de acordo com as especificações exigidas.

H0: p = 0,9

HA: p < 0,9

= 0,05 e = 0,01 p0 = 0,90 n = 200

880200

251p ,ˆ

Teste de Hipótese com grandes amostras para uma Proporção populacional

Como a amostra é igual (n = 200), vale a aproximação normal

Rej. H0 (90% dos equip. de acordo c/ especf.) se Z0 -z()Como –0,94 > -1,96 e –0,94 > -2,57

Decisão: Não rejeitamos H0 Conclusão: Aos níveis de significância de 5% e 1% não há evidências de que os equipamentos estejam fora das especificações exigidas.

94,0

2000,9)0,9(1

0,90,880

Z