1.1 Intervalos de Confiança

13
 Estatística 2 1.1 Introdução a Intervalos de Confiança   Prof. Gustavo B. Araujo - Bibliografia: Anderson, Sweeney e Williams – caps. 5 a 8 Morettin e Bussab – caps. 3, 7, 10 e 11

description

FECAP

Transcript of 1.1 Intervalos de Confiança

  • Estatstica 2

    1.1 Introduo a Intervalos de Confiana1.1 Introduo a Intervalos de Confiana

    Prof. Gustavo B. Araujo

    - Bibliografia: Anderson, Sweeney e Williams caps. 5 a 8Morettin e Bussab caps. 3, 7, 10 e 11

  • Relao entre Populao e Amostra

    Pergunta central: quem deve ser estudado?

    - Populao: o conjunto de todos os elementos ou resultados sobinvestigao.

    Se for fcil obter informaes sobre a populao, nosso problema Se for fcil obter informaes sobre a populao, nosso problemaest resolvido. Se no for, precisamos estimar o resultado populacional atravsde uma amostra.

  • - Amostra: uma parte da populao.

    queremos que a amostra represente to bem a populao quantopossvel.

    => PROBLEMA: diferentes amostras nos daro diferentes resultados.Qual o correto?

    no h necessariamente um resultado correto o que h so bonsprocedimentos de pesquisa e a probabilidade do resultado se aproximar maisou menos do resultado populacional.

  • Entre os bons procedimentos de pesquisa est o procedimento deseleo amostral por amostragem aleatria.

    - Amostragem aleatria: os indivduos que compem a amostra sosorteados aleatoriamente da populao de interesse.

    por que a amostragem aleatria um bom procedimento ?

    Porque nossa populao apresenta uma determinada distribuio devalores para a varivel de interesse. Assim, quando selecionamos indivduosaleatoriamente, a probabilidade de selecionarmos um indivduo comdeterminada caracterstica igual probabilidade de encontrarmos aquelacaracterstica na populao. Isso faz com que, em amostras suficientementegrandes, a distribuio amostral se aproxime da distribuio populacional, oque faz com que o valor amostral se aproxime do valor populacional.

  • (parnteses)- valores populacionais: parmetros.- valores amostrais: estatsticas/estimativas.

    no entanto, a grande questo ainda permanece: como avaliar o graude incerteza presente nos valores amostrais encontrados ?

    ou seja: se coletei apenas uma amostra, mesmo vinda de amostragemou seja: se coletei apenas uma amostra, mesmo vinda de amostragemaleatria, como garantir que o valor encontrado se aproxima do parmetropopulacional ?

    no podemos garantir. Mas, se soubermos a distribuio amostral daestatstica de interesse (a mdia amostral, por exemplo), podemos dizer qual aprobabilidade de darmos azar e encontrarmos um valor to afastado doparmetro populacional quanto o que achamos.

  • o bom que sabemos qual a distribuio amostral de estatsticascomo a mdia amostral graas ao chamado Teorema do Limite Central.

    => Teorema do Limite Central:

    para amostras aleatrias simples, retiradas de uma populao commdia e varincia finita G2, a distribuio da mdia de X aproxima-se,conforme n aumenta, de uma distribuio normal com mdia e varincia .conforme n aumenta, de uma distribuio normal com mdia e varincia .

    ou seja, a distribuio amostral da mdia amostral : X ~ N( , ).

    Se uma estatstica apresenta distribuio amostral normal, possveldizer, ento, qual a probabilidade de termos obtido o resultado amostral queobtivemos (porque sabemos calcular probabilidades sob a curva de umanormal padro).

  • => Padronizao:

    se X ~ N( , )

    X ~ N(0 , )

    ~ N(0,1)

    - como se quisssemos ver quo distante a mdia amostral estaria damdia populacional (X ); depois, dividimos essa distncia pelo desviopadro, para achar a quantos desvios padro essa distncia corresponde.

    assim, no possvel dizer se o resultado correto. Podemosapenas dizer se o resultado um resultado provvel e o grau de confiana quetemos nele. Mas como podemos fazer isto ?

  • Se conhecssemos , bastaria padronizar para achar a probabilidade deencontrar o resultado que achamos, dado o valor de e o tamanho da amostra.

    Mas no conhecemos . Ainda assim, podemos calcular a probabilidade deque o valor amostral encontre-se a tantos desvios padro do valor populacional.

    Ex:

  • Interpretao:

    Se coletssemos 100 amostras de tamanho n e construssemos intervalos deconfiana do tipo para cada X encontrado, esperaramos

    que o parmetro de interesse, , estivesse contido em aproximadamente 98 dessesintervalos.

    Resumindo: Resumindo:

    Se pegarmos uma amostra de tamanho n, selecionada aleatoriamente, ecalcularmos sua mdia X, admitindo-se ainda conhecido o desvio padro G eoptando-se por determinado nvel de confiana (por ex. 95 %), podemos construir ointervalo:

    IC(;0,95) = este intervalo pode ou no conter o parmetro , mas temos 95 % de

    confiana de que contenha.

  • At o momento estamos trabalhando com uma simplificao: estamossupondo que a varincia populacional conhecida.

    Mas se no conhecemos a mdia populacional, provavelmente noconhecemos tambm a varincia (ou o desvio padro).

    se a varincia populacional G2 no conhecida, podemos substituirpor , onde s2 a varincia amostral (e s o desvio padro amostral).por , onde s a varincia amostral (e s o desvio padro amostral).

    - para n grande, em geral maior do que 100, o intervalo de confianacalculado com essa modificao ainda poder ser baseado, por aproximao, nadistribuio normal.

    - j para n no muito grande, a distribuio normal no dever serusada e ter de ser substituda pela distribuio t de Student.

  • - Exemplos:

    1) A mdia de altura dos alunos da FECAP em 2004 era de 170 cm, comdesvio padro igual a 4 cm (foram medidos 100 alunos). Com o intuito de saberse essa mdia se alterou aps 10 anos, selecionamos 64 alunos aleatoriamente,os medimos e obtivemos a mdia de 172 cm. Vamos considerar que o desviopadro no se alterou nesses 10 anos.

    a) Calcule um intervalo de confiana de 95% para a nova mdia.

    b) Voc diria, ao nvel de confiana de 95%, que a mdia de altura de2015 diferente (maior) do que a de 2004? Por que?

  • - Exemplos:

    2) Dois candidatos disputam o segundo turno de uma eleio. O candidato A teve 180 intenes de voto numa pesquisa com 400 eleitores. O candidato B teve 160

    intenes de voto. Os demais se declararam indecisos ou com inteno de anular o

    voto.

    a) Calcule um intervalo de confiana de 95% para cada candidato.a) Calcule um intervalo de confiana de 95% para cada candidato.

    b) Dados os intervalos calculados, devemos concluir que os candidatos esto

    em empate tcnico? Por que?

    Obs: lembrando que podemos calcular a varincia de uma proporo amostral da

    seguinte maneira: