1.1 Intervalos de Confiança

Estatstica 2

1.1 Introduo a Intervalos de Confiana1.1 Introduo a Intervalos de Confiana

Prof. Gustavo B. Araujo

- Bibliografia: Anderson, Sweeney e Williams caps. 5 a 8Morettin e Bussab caps. 3, 7, 10 e 11

Relao entre Populao e Amostra

Pergunta central: quem deve ser estudado?

- Populao: o conjunto de todos os elementos ou resultados sobinvestigao.

Se for fcil obter informaes sobre a populao, nosso problema Se for fcil obter informaes sobre a populao, nosso problemaest resolvido. Se no for, precisamos estimar o resultado populacional atravsde uma amostra.

- Amostra: uma parte da populao.

queremos que a amostra represente to bem a populao quantopossvel.

=> PROBLEMA: diferentes amostras nos daro diferentes resultados.Qual o correto?

no h necessariamente um resultado correto o que h so bonsprocedimentos de pesquisa e a probabilidade do resultado se aproximar maisou menos do resultado populacional.

Entre os bons procedimentos de pesquisa est o procedimento deseleo amostral por amostragem aleatria.

- Amostragem aleatria: os indivduos que compem a amostra sosorteados aleatoriamente da populao de interesse.

por que a amostragem aleatria um bom procedimento ?

Porque nossa populao apresenta uma determinada distribuio devalores para a varivel de interesse. Assim, quando selecionamos indivduosaleatoriamente, a probabilidade de selecionarmos um indivduo comdeterminada caracterstica igual probabilidade de encontrarmos aquelacaracterstica na populao. Isso faz com que, em amostras suficientementegrandes, a distribuio amostral se aproxime da distribuio populacional, oque faz com que o valor amostral se aproxime do valor populacional.

(parnteses)- valores populacionais: parmetros.- valores amostrais: estatsticas/estimativas.

no entanto, a grande questo ainda permanece: como avaliar o graude incerteza presente nos valores amostrais encontrados ?

ou seja: se coletei apenas uma amostra, mesmo vinda de amostragemou seja: se coletei apenas uma amostra, mesmo vinda de amostragemaleatria, como garantir que o valor encontrado se aproxima do parmetropopulacional ?

no podemos garantir. Mas, se soubermos a distribuio amostral daestatstica de interesse (a mdia amostral, por exemplo), podemos dizer qual aprobabilidade de darmos azar e encontrarmos um valor to afastado doparmetro populacional quanto o que achamos.

o bom que sabemos qual a distribuio amostral de estatsticascomo a mdia amostral graas ao chamado Teorema do Limite Central.

=> Teorema do Limite Central:

para amostras aleatrias simples, retiradas de uma populao commdia e varincia finita G2, a distribuio da mdia de X aproxima-se,conforme n aumenta, de uma distribuio normal com mdia e varincia .conforme n aumenta, de uma distribuio normal com mdia e varincia .

ou seja, a distribuio amostral da mdia amostral : X ~ N( , ).

Se uma estatstica apresenta distribuio amostral normal, possveldizer, ento, qual a probabilidade de termos obtido o resultado amostral queobtivemos (porque sabemos calcular probabilidades sob a curva de umanormal padro).

=> Padronizao:

se X ~ N( , )

X ~ N(0 , )

~ N(0,1)

- como se quisssemos ver quo distante a mdia amostral estaria damdia populacional (X ); depois, dividimos essa distncia pelo desviopadro, para achar a quantos desvios padro essa distncia corresponde.

assim, no possvel dizer se o resultado correto. Podemosapenas dizer se o resultado um resultado provvel e o grau de confiana quetemos nele. Mas como podemos fazer isto ?

Se conhecssemos , bastaria padronizar para achar a probabilidade deencontrar o resultado que achamos, dado o valor de e o tamanho da amostra.

Mas no conhecemos . Ainda assim, podemos calcular a probabilidade deque o valor amostral encontre-se a tantos desvios padro do valor populacional.

Ex:

Interpretao:

Se coletssemos 100 amostras de tamanho n e construssemos intervalos deconfiana do tipo para cada X encontrado, esperaramos

que o parmetro de interesse, , estivesse contido em aproximadamente 98 dessesintervalos.

Resumindo: Resumindo:

Se pegarmos uma amostra de tamanho n, selecionada aleatoriamente, ecalcularmos sua mdia X, admitindo-se ainda conhecido o desvio padro G eoptando-se por determinado nvel de confiana (por ex. 95 %), podemos construir ointervalo:

IC(;0,95) = este intervalo pode ou no conter o parmetro , mas temos 95 % de

confiana de que contenha.

At o momento estamos trabalhando com uma simplificao: estamossupondo que a varincia populacional conhecida.

Mas se no conhecemos a mdia populacional, provavelmente noconhecemos tambm a varincia (ou o desvio padro).

se a varincia populacional G2 no conhecida, podemos substituirpor , onde s2 a varincia amostral (e s o desvio padro amostral).por , onde s a varincia amostral (e s o desvio padro amostral).

- para n grande, em geral maior do que 100, o intervalo de confianacalculado com essa modificao ainda poder ser baseado, por aproximao, nadistribuio normal.

- j para n no muito grande, a distribuio normal no dever serusada e ter de ser substituda pela distribuio t de Student.

- Exemplos:

1) A mdia de altura dos alunos da FECAP em 2004 era de 170 cm, comdesvio padro igual a 4 cm (foram medidos 100 alunos). Com o intuito de saberse essa mdia se alterou aps 10 anos, selecionamos 64 alunos aleatoriamente,os medimos e obtivemos a mdia de 172 cm. Vamos considerar que o desviopadro no se alterou nesses 10 anos.

a) Calcule um intervalo de confiana de 95% para a nova mdia.

b) Voc diria, ao nvel de confiana de 95%, que a mdia de altura de2015 diferente (maior) do que a de 2004? Por que?

- Exemplos:

2) Dois candidatos disputam o segundo turno de uma eleio. O candidato A teve 180 intenes de voto numa pesquisa com 400 eleitores. O candidato B teve 160

intenes de voto. Os demais se declararam indecisos ou com inteno de anular o

voto.

a) Calcule um intervalo de confiana de 95% para cada candidato.a) Calcule um intervalo de confiana de 95% para cada candidato.

b) Dados os intervalos calculados, devemos concluir que os candidatos esto

em empate tcnico? Por que?

Obs: lembrando que podemos calcular a varincia de uma proporo amostral da

seguinte maneira:

1.1 Intervalos de Confiança

Documents

Transcript of 1.1 Intervalos de Confiança