Amostra Piloto
-
Upload
profiriojunior -
Category
Documents
-
view
213 -
download
0
Transcript of Amostra Piloto
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA
Objetivo: Selecionar parte dos elementos de uma população, analisá-la e inferir
propriedades para o todo.
Definições:
1. População – é o conjunto de elementos (indivíduos ou objetos), tendo pelo
menos uma variável comum observável.
2. Amostra – é qualquer subconjunto da população.
Problemas:
• como escolher a amostra?
• Que informação (estatística) coletar de cada elemento que entra na
amostra?
• Como se comportam estas informações?
3. Amostragem Casual Simples – é o caso mais simples de amostragem
probabilística. Diz-se que uma amostra aleatória ou casual simples (AAS) de
tamanho n de uma variável aleatória X com uma dada distribuição é o
conjunto de n variáveis aleatórias independentes X1, X2, ... Xn, cada uma com
a mesma distribuição de X. Ou seja, a amostra será a n-upla ordenada (X1,
X2, ... Xn), onde Xi indica a observação do i-ésimo elemento sorteado.
4. Estatística ou Estimador – é uma característica da amostra, ou seja, uma
estatística T é uma função de X1, X2, ... Xn.
As estatísticas ou estimadores mais comuns são:
• média amostral -
• variância amostral -
• mínimo -
• máximo -
• amplitude -
5. Parâmetro – é uma medida usada para descrever uma característica da
população.
Estatística Parâmetro
Média X µ
Variância S2 σ2
No. de
elementos
n
N
Alguns Aspectos Importantes do Planejamento Amostral
1. Antes de iniciar o levantamento de dados, definir como os dados serão
registrados (codificação, elaboração de tabelas, os casos de falta de
informação ou impossibilidade de efetuar a medida).
2. Amostra piloto: é o estudo preliminar sobre a forma de coleta de dados.
Visa revelar as dificuldades dos métodos de apuração dos dados. É uma
simulação do estudo observacional ou experimento propriamente dito.
3. Um experimento é dito planejado quando estão definidos: a) unidade
experimental b) a variável ou variáveis em análise e a forma como será
ou serão medidas c) os tratamentos em comparação d) a forma como os
tratamentos serão designados às unidades experimentais.
4. Explicitação dos objetivos com bastante clareza.
5. Especificação do grau de precisão desejado.
6. Escolha dos instrumentos de medida e da forma de amostragem.
7. Em caso de aplicação de questionários, tomar cuidado com questionários
longos, pois eles costumam diminuir a qualidade da resposta. Também é
recomendável evitar questões onde o respondente pode assinalar mais
de uma alternativa como resposta.
Planejamento
Coleta de dados
Organização dos dados
Análise dos dados
Tomada de decisão
Amostral
Experimental
Problema
Distribuição Amostral da Média
Exemplo: Considere a seguinte população {1,3,5,5,7}. Selecione todas as AAS
de tamanho 2 possíveis. Para cada AAS determine a média amostral e a função
de probabilidade da média amostral.
Teorema: Seja X uma variável com média μ e variância σ2 conhecidos e seja
(X1,X2,...,Xn) uma amostra aleatória simples de X. Então, se
nXXX
X n+++=
...21 ,
temos E( X ) = μ e Var( X ) = σ2/n.
TEOREMA CENTRAL DO LIMITE
Para amostras aleatórias simples (X1,X2,...,Xn) retiradas de uma população com
média μ e variância σ2, a distribuição amostral da média X aproxima-se de uma
distribuição normal com média μ e variância σ2/n, quando n tende ao infinito.
Corolários:
1) n
XZ/σμ−
= ~ N(0,1)
2) Se e = X - μ, então e ~ N(0, σ2/n) para n suficientemente grande.
Exemplo: Um v.a X tem distribuição normal com média 100 e desvio-padrão 10.
a) Qual a P(90 < X < 110)?
b) Se X é a média de uma amostra de 16 elementos retirados dessa população,
calcule P(90 < X <110).
c) Esboce, num único gráfico, as distribuições de X e X .
d) Que tamanho deveria ter a amostra para que P(90 < X <110) = 0,8?
Intervalos de Confiança
Objetivo: Obter limites a e b (a<b) tais que com uma confiabilidade γ (0 < γ < 1) pré-
especificada, o parâmetro θ suposto desconhecido pertença a este intervalo. O propósito
deste procedimento é obter um indicador da precisão da estimativa pontual do
parâmetro.
Caso 1: Intervalo de Confiança para a média populacional (μ).
A média amostral X é a estimativa pontual da média populacional μ, que é chamada de
parâmetro.
Suposição: variância populacional (σ2) conhecida.
Procedimento Geral:
1) Colhe-se uma amostra aleatória simples (sorteio com reposição) de X de tamanho n.
2) Como X : N(μ,σ2/n), então Z = n
Xσ
μ− : N(0,1). Fixe γ (0 < γ < 1) nível de confiança.
3) Achar Zγ/2 tal que P(0 < Z < Zγ/2 ) = γ/2, pois P(-Zγ/2 < Z < Zγ/2) = γ.
4) Assim, podemos escrever:
P( X - Zγ/2*nσ < μ < X + Zγ/2 *
nσ ) = γ.
Conclusão: Seja n o tamanho da amostra e γ (0 < γ < 1) o nível de confiança, então;
IC (μ,γ): X ± Zγ/2*nσ (1)
onde Zγ/2 é tal que P(0 < Z < Zγ/2 ) = γ/2.
Interpretação de (1): Se pudéssemos tomar todas as amostras possíveis de tamanho n, a
proporção de amostras tais que o verdadeiro valor de μ pertence ao intervalo ( X -
Zγ/2*nσ ; X + Zγ/2 *
nσ ) é γ.
Observações:
a) Se a população (X) for normal ou aproximadamente normal, (1) é válida para
qualquer n.
b) Caso contrário, (1) só será válido para n suficientemente grande (n>25).
c) Quanto maior o valor de n, menor será a amplitude do intervalo.
d) Quanto maior o nível de confiança γ, maior será a amplitude do intervalo.
e) Seja Rγ a amplitude do intervalo de confiança. Logo, Rγ = 2* Zγ/2*nσ .
Exemplo: Da experiência passada, sabe-se que o desvio-padrão da altura de crianças da
5a série do 1o. Grau é 5 cm.
a) Colhendo uma amostra de 36 dessas crianças, observou-se a média 150 cm. Qual o
intervalo de confiança de 95% para a média populacional?
b) Que tamanho deve ter uma amostra para que o intervalo 150 ± 0,98 tenha 95% de
confiança?
Observações Importantes:
1. Se a variância populacional (σ2) não for conhecida, pode-se substituir
nSpor
nσ , onde S2 é a variância amostral. Para n grande (≥ 100), o intervalo
com esta modificação pode ainda ser usado. Para n não muito grande, a
distribuição normal terá que ser substitída pela distribuição t de Student.
2. Se estivermos trabalhando com populações finitas conhecidas ou se a
amostragem é feita sem reposição, devemos usar o fator de correção para
populações finitas 1−
−N
nN no cálculo da Var( X ) e Var( p̂ ). Note que se n for muito
menor que N, então esse fator é aproximadamente igual a 1 e amostras com ou
sem reposição são praticamente equivalentes.