ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Intervalos de Confiança para a média Aulas 7 e 9.
1.1 Intervalos de Confiança
-
Upload
yuri-magalhaes-silva -
Category
Documents
-
view
7 -
download
0
description
Transcript of 1.1 Intervalos de Confiança
-
Estatstica 2
1.1 Introduo a Intervalos de Confiana1.1 Introduo a Intervalos de Confiana
Prof. Gustavo B. Araujo
- Bibliografia: Anderson, Sweeney e Williams caps. 5 a 8Morettin e Bussab caps. 3, 7, 10 e 11
-
Relao entre Populao e Amostra
Pergunta central: quem deve ser estudado?
- Populao: o conjunto de todos os elementos ou resultados sobinvestigao.
Se for fcil obter informaes sobre a populao, nosso problema Se for fcil obter informaes sobre a populao, nosso problemaest resolvido. Se no for, precisamos estimar o resultado populacional atravsde uma amostra.
-
- Amostra: uma parte da populao.
queremos que a amostra represente to bem a populao quantopossvel.
=> PROBLEMA: diferentes amostras nos daro diferentes resultados.Qual o correto?
no h necessariamente um resultado correto o que h so bonsprocedimentos de pesquisa e a probabilidade do resultado se aproximar maisou menos do resultado populacional.
-
Entre os bons procedimentos de pesquisa est o procedimento deseleo amostral por amostragem aleatria.
- Amostragem aleatria: os indivduos que compem a amostra sosorteados aleatoriamente da populao de interesse.
por que a amostragem aleatria um bom procedimento ?
Porque nossa populao apresenta uma determinada distribuio devalores para a varivel de interesse. Assim, quando selecionamos indivduosaleatoriamente, a probabilidade de selecionarmos um indivduo comdeterminada caracterstica igual probabilidade de encontrarmos aquelacaracterstica na populao. Isso faz com que, em amostras suficientementegrandes, a distribuio amostral se aproxime da distribuio populacional, oque faz com que o valor amostral se aproxime do valor populacional.
-
(parnteses)- valores populacionais: parmetros.- valores amostrais: estatsticas/estimativas.
no entanto, a grande questo ainda permanece: como avaliar o graude incerteza presente nos valores amostrais encontrados ?
ou seja: se coletei apenas uma amostra, mesmo vinda de amostragemou seja: se coletei apenas uma amostra, mesmo vinda de amostragemaleatria, como garantir que o valor encontrado se aproxima do parmetropopulacional ?
no podemos garantir. Mas, se soubermos a distribuio amostral daestatstica de interesse (a mdia amostral, por exemplo), podemos dizer qual aprobabilidade de darmos azar e encontrarmos um valor to afastado doparmetro populacional quanto o que achamos.
-
o bom que sabemos qual a distribuio amostral de estatsticascomo a mdia amostral graas ao chamado Teorema do Limite Central.
=> Teorema do Limite Central:
para amostras aleatrias simples, retiradas de uma populao commdia e varincia finita G2, a distribuio da mdia de X aproxima-se,conforme n aumenta, de uma distribuio normal com mdia e varincia .conforme n aumenta, de uma distribuio normal com mdia e varincia .
ou seja, a distribuio amostral da mdia amostral : X ~ N( , ).
Se uma estatstica apresenta distribuio amostral normal, possveldizer, ento, qual a probabilidade de termos obtido o resultado amostral queobtivemos (porque sabemos calcular probabilidades sob a curva de umanormal padro).
-
=> Padronizao:
se X ~ N( , )
X ~ N(0 , )
~ N(0,1)
- como se quisssemos ver quo distante a mdia amostral estaria damdia populacional (X ); depois, dividimos essa distncia pelo desviopadro, para achar a quantos desvios padro essa distncia corresponde.
assim, no possvel dizer se o resultado correto. Podemosapenas dizer se o resultado um resultado provvel e o grau de confiana quetemos nele. Mas como podemos fazer isto ?
-
Se conhecssemos , bastaria padronizar para achar a probabilidade deencontrar o resultado que achamos, dado o valor de e o tamanho da amostra.
Mas no conhecemos . Ainda assim, podemos calcular a probabilidade deque o valor amostral encontre-se a tantos desvios padro do valor populacional.
Ex:
-
Interpretao:
Se coletssemos 100 amostras de tamanho n e construssemos intervalos deconfiana do tipo para cada X encontrado, esperaramos
que o parmetro de interesse, , estivesse contido em aproximadamente 98 dessesintervalos.
Resumindo: Resumindo:
Se pegarmos uma amostra de tamanho n, selecionada aleatoriamente, ecalcularmos sua mdia X, admitindo-se ainda conhecido o desvio padro G eoptando-se por determinado nvel de confiana (por ex. 95 %), podemos construir ointervalo:
IC(;0,95) = este intervalo pode ou no conter o parmetro , mas temos 95 % de
confiana de que contenha.
-
At o momento estamos trabalhando com uma simplificao: estamossupondo que a varincia populacional conhecida.
Mas se no conhecemos a mdia populacional, provavelmente noconhecemos tambm a varincia (ou o desvio padro).
se a varincia populacional G2 no conhecida, podemos substituirpor , onde s2 a varincia amostral (e s o desvio padro amostral).por , onde s a varincia amostral (e s o desvio padro amostral).
- para n grande, em geral maior do que 100, o intervalo de confianacalculado com essa modificao ainda poder ser baseado, por aproximao, nadistribuio normal.
- j para n no muito grande, a distribuio normal no dever serusada e ter de ser substituda pela distribuio t de Student.
-
- Exemplos:
1) A mdia de altura dos alunos da FECAP em 2004 era de 170 cm, comdesvio padro igual a 4 cm (foram medidos 100 alunos). Com o intuito de saberse essa mdia se alterou aps 10 anos, selecionamos 64 alunos aleatoriamente,os medimos e obtivemos a mdia de 172 cm. Vamos considerar que o desviopadro no se alterou nesses 10 anos.
a) Calcule um intervalo de confiana de 95% para a nova mdia.
b) Voc diria, ao nvel de confiana de 95%, que a mdia de altura de2015 diferente (maior) do que a de 2004? Por que?
-
- Exemplos:
2) Dois candidatos disputam o segundo turno de uma eleio. O candidato A teve 180 intenes de voto numa pesquisa com 400 eleitores. O candidato B teve 160
intenes de voto. Os demais se declararam indecisos ou com inteno de anular o
voto.
a) Calcule um intervalo de confiana de 95% para cada candidato.a) Calcule um intervalo de confiana de 95% para cada candidato.
b) Dados os intervalos calculados, devemos concluir que os candidatos esto
em empate tcnico? Por que?
Obs: lembrando que podemos calcular a varincia de uma proporo amostral da
seguinte maneira: