Amostra Piloto

6
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Objetivo : Selecionar parte dos elementos de uma população, analisá-la e inferir propriedades para o todo. Definições : 1. População – é o conjunto de elementos (indivíduos ou objetos), tendo pelo menos uma variável comum observável. 2. Amostra – é qualquer subconjunto da população. Problemas: como escolher a amostra? Que informação (estatística) coletar de cada elemento que entra na amostra? Como se comportam estas informações? 3. Amostragem Casual Simples – é o caso mais simples de amostragem probabilística. Diz-se que uma amostra aleatória ou casual simples (AAS) de tamanho n de uma variável aleatória X com uma dada distribuição é o conjunto de n variáveis aleatórias independentes X 1 , X 2 , ... X n , cada uma com a mesma distribuição de X. Ou seja, a amostra será a n-upla ordenada (X 1 , X 2 , ... X n ), onde X i indica a observação do i-ésimo elemento sorteado. 4. Estatística ou Estimador – é uma característica da amostra, ou seja, uma estatística T é uma função de X 1 , X 2 , ... X n . As estatísticas ou estimadores mais comuns são: média amostral - variância amostral - mínimo - máximo - amplitude -

Transcript of Amostra Piloto

Page 1: Amostra Piloto

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Objetivo: Selecionar parte dos elementos de uma população, analisá-la e inferir

propriedades para o todo.

Definições:

1. População – é o conjunto de elementos (indivíduos ou objetos), tendo pelo

menos uma variável comum observável.

2. Amostra – é qualquer subconjunto da população.

Problemas:

• como escolher a amostra?

• Que informação (estatística) coletar de cada elemento que entra na

amostra?

• Como se comportam estas informações?

3. Amostragem Casual Simples – é o caso mais simples de amostragem

probabilística. Diz-se que uma amostra aleatória ou casual simples (AAS) de

tamanho n de uma variável aleatória X com uma dada distribuição é o

conjunto de n variáveis aleatórias independentes X1, X2, ... Xn, cada uma com

a mesma distribuição de X. Ou seja, a amostra será a n-upla ordenada (X1,

X2, ... Xn), onde Xi indica a observação do i-ésimo elemento sorteado.

4. Estatística ou Estimador – é uma característica da amostra, ou seja, uma

estatística T é uma função de X1, X2, ... Xn.

As estatísticas ou estimadores mais comuns são:

• média amostral -

• variância amostral -

• mínimo -

• máximo -

• amplitude -

Page 2: Amostra Piloto

5. Parâmetro – é uma medida usada para descrever uma característica da

população.

Estatística Parâmetro

Média X µ

Variância S2 σ2

No. de

elementos

n

N

Alguns Aspectos Importantes do Planejamento Amostral

1. Antes de iniciar o levantamento de dados, definir como os dados serão

registrados (codificação, elaboração de tabelas, os casos de falta de

informação ou impossibilidade de efetuar a medida).

2. Amostra piloto: é o estudo preliminar sobre a forma de coleta de dados.

Visa revelar as dificuldades dos métodos de apuração dos dados. É uma

simulação do estudo observacional ou experimento propriamente dito.

3. Um experimento é dito planejado quando estão definidos: a) unidade

experimental b) a variável ou variáveis em análise e a forma como será

ou serão medidas c) os tratamentos em comparação d) a forma como os

tratamentos serão designados às unidades experimentais.

4. Explicitação dos objetivos com bastante clareza.

5. Especificação do grau de precisão desejado.

6. Escolha dos instrumentos de medida e da forma de amostragem.

Page 3: Amostra Piloto

7. Em caso de aplicação de questionários, tomar cuidado com questionários

longos, pois eles costumam diminuir a qualidade da resposta. Também é

recomendável evitar questões onde o respondente pode assinalar mais

de uma alternativa como resposta.

Planejamento

Coleta de dados

Organização dos dados

Análise dos dados

Tomada de decisão

Amostral

Experimental

Problema

Page 4: Amostra Piloto

Distribuição Amostral da Média

Exemplo: Considere a seguinte população {1,3,5,5,7}. Selecione todas as AAS

de tamanho 2 possíveis. Para cada AAS determine a média amostral e a função

de probabilidade da média amostral.

Teorema: Seja X uma variável com média μ e variância σ2 conhecidos e seja

(X1,X2,...,Xn) uma amostra aleatória simples de X. Então, se

nXXX

X n+++=

...21 ,

temos E( X ) = μ e Var( X ) = σ2/n.

TEOREMA CENTRAL DO LIMITE

Para amostras aleatórias simples (X1,X2,...,Xn) retiradas de uma população com

média μ e variância σ2, a distribuição amostral da média X aproxima-se de uma

distribuição normal com média μ e variância σ2/n, quando n tende ao infinito.

Corolários:

1) n

XZ/σμ−

= ~ N(0,1)

2) Se e = X - μ, então e ~ N(0, σ2/n) para n suficientemente grande.

Exemplo: Um v.a X tem distribuição normal com média 100 e desvio-padrão 10.

a) Qual a P(90 < X < 110)?

b) Se X é a média de uma amostra de 16 elementos retirados dessa população,

calcule P(90 < X <110).

c) Esboce, num único gráfico, as distribuições de X e X .

d) Que tamanho deveria ter a amostra para que P(90 < X <110) = 0,8?

Page 5: Amostra Piloto

Intervalos de Confiança

Objetivo: Obter limites a e b (a<b) tais que com uma confiabilidade γ (0 < γ < 1) pré-

especificada, o parâmetro θ suposto desconhecido pertença a este intervalo. O propósito

deste procedimento é obter um indicador da precisão da estimativa pontual do

parâmetro.

Caso 1: Intervalo de Confiança para a média populacional (μ).

A média amostral X é a estimativa pontual da média populacional μ, que é chamada de

parâmetro.

Suposição: variância populacional (σ2) conhecida.

Procedimento Geral:

1) Colhe-se uma amostra aleatória simples (sorteio com reposição) de X de tamanho n.

2) Como X : N(μ,σ2/n), então Z = n

μ− : N(0,1). Fixe γ (0 < γ < 1) nível de confiança.

3) Achar Zγ/2 tal que P(0 < Z < Zγ/2 ) = γ/2, pois P(-Zγ/2 < Z < Zγ/2) = γ.

4) Assim, podemos escrever:

P( X - Zγ/2*nσ < μ < X + Zγ/2 *

nσ ) = γ.

Conclusão: Seja n o tamanho da amostra e γ (0 < γ < 1) o nível de confiança, então;

IC (μ,γ): X ± Zγ/2*nσ (1)

onde Zγ/2 é tal que P(0 < Z < Zγ/2 ) = γ/2.

Interpretação de (1): Se pudéssemos tomar todas as amostras possíveis de tamanho n, a

proporção de amostras tais que o verdadeiro valor de μ pertence ao intervalo ( X -

Zγ/2*nσ ; X + Zγ/2 *

nσ ) é γ.

Page 6: Amostra Piloto

Observações:

a) Se a população (X) for normal ou aproximadamente normal, (1) é válida para

qualquer n.

b) Caso contrário, (1) só será válido para n suficientemente grande (n>25).

c) Quanto maior o valor de n, menor será a amplitude do intervalo.

d) Quanto maior o nível de confiança γ, maior será a amplitude do intervalo.

e) Seja Rγ a amplitude do intervalo de confiança. Logo, Rγ = 2* Zγ/2*nσ .

Exemplo: Da experiência passada, sabe-se que o desvio-padrão da altura de crianças da

5a série do 1o. Grau é 5 cm.

a) Colhendo uma amostra de 36 dessas crianças, observou-se a média 150 cm. Qual o

intervalo de confiança de 95% para a média populacional?

b) Que tamanho deve ter uma amostra para que o intervalo 150 ± 0,98 tenha 95% de

confiança?

Observações Importantes:

1. Se a variância populacional (σ2) não for conhecida, pode-se substituir

nSpor

nσ , onde S2 é a variância amostral. Para n grande (≥ 100), o intervalo

com esta modificação pode ainda ser usado. Para n não muito grande, a

distribuição normal terá que ser substitída pela distribuição t de Student.

2. Se estivermos trabalhando com populações finitas conhecidas ou se a

amostragem é feita sem reposição, devemos usar o fator de correção para

populações finitas 1−

−N

nN no cálculo da Var( X ) e Var( p̂ ). Note que se n for muito

menor que N, então esse fator é aproximadamente igual a 1 e amostras com ou

sem reposição são praticamente equivalentes.