Livro Estatistica II

113
Inferência Estatística Autor: Filipe Mahaluca [email protected] 3 Capitulo1: TEORIA DE AMOSTRAGEM Introdução A teoria de amostragem dedica-se ao desenvolvimento, análise e melhoramento dos métodos de recolha de informação necessária num inquérito, a selecção da amostra, a obtenção de informação da amostra, na tradução da informação em afirmações relacionadas com os objectivos do inquérito e na avaliação dessas afirmações. O problema da inferência Indutiva é do ponto de vista de estatística, encarado da seguinte forma: A finalidade da investigação é descobrir algo sobre determina característica da população ou universo. Por isso é importante definir alguns conceitos fundamentais na teoria da amostragem. 1.1 Alguns Conceitos Importantes na Teoria de Amostragem 1.1.2 População ou universo Conjunto de unidades bem definidas com características comuns, no tempo e no espaço. A unidade básica de uma população denomina-se elemento da população. Para definir uma população, nós temos que estar em condições de determinar o tipo de elementos que a constitui e indicar as regras de inclusão ou exclusão um elemento particular. Exemplos: 1. Países produtores de ouro. 2. O número de habitantes dum determinado país, ou cidade. 1. O número de desempregados dum país, duma província, num determinado período de tempo, etc. 1.1.2 Amostra – É um sub-conjunto do universo ou população. A obtenção de informação sobre parte de uma população denomina-se Amostragem.

description

2015

Transcript of Livro Estatistica II

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 3

    Capitulo1: TEORIA DE AMOSTRAGEM

    Introduo A teoria de amostragem dedica-se ao desenvolvimento, anlise e melhoramento dos mtodos de

    recolha de informao necessria num inqurito, a seleco da amostra, a obteno de

    informao da amostra, na traduo da informao em afirmaes relacionadas com os

    objectivos do inqurito e na avaliao dessas afirmaes.

    O problema da inferncia Indutiva do ponto de vista de estatstica, encarado da seguinte

    forma: A finalidade da investigao descobrir algo sobre determina caracterstica da

    populao ou universo. Por isso importante definir alguns conceitos fundamentais na teoria da

    amostragem.

    1.1 Alguns Conceitos Importantes na Teoria de Amostragem

    1.1.2 Populao ou universo

    Conjunto de unidades bem definidas com caractersticas comuns, no tempo e no espao. A

    unidade bsica de uma populao denomina-se elemento da populao.

    Para definir uma populao, ns temos que estar em condies de determinar o tipo de

    elementos que a constitui e indicar as regras de incluso ou excluso um elemento particular.

    Exemplos:

    1. Pases produtores de ouro.

    2. O nmero de habitantes dum determinado pas, ou cidade.

    1. O nmero de desempregados dum pas, duma provncia, num determinado perodo de tempo,

    etc.

    1.1.2 Amostra um sub-conjunto do universo ou populao. A obteno de informao

    sobre parte de uma populao denomina-se Amostragem.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 4

    Em geral, o investigador est interessado em certa(s) caracterstica(s) especfica(s) da populao

    em estudo. Define-se ento uma certa varivel X que representar a caracterstica que se

    pretende avaliar.

    A varivel X poder designar: O nmero de filhos por famlia; O rendimento mensal dos

    agregados familiares moambicanos ou de algumas provncias, ou distritos de interesse

    econmico:

    Plano de Amostragem constitudo por todas as etapas necessrias para seleccionar uma

    amostra depois da definio da populao.

    1.1.3 Tipos de variveis: As variveis podem ser: Discretas ou Contnuas

    Variveis Discretas

    So no numricas

    So normalmente codificadas;

    Variveis Contnuas: Podem ser:

    Discretas Neste caso assumem somente um e um s valor . Exemplo: Nmero de filhos

    Contnuas - Medidas com mais detalhes, ou sejam tomam um valor num certo intervalo, por

    exemplo a altura duma pessoa, o peso, etc.

    Mtodos de Amostragem Amostragem Aleatria Simples

    Amostragem Estratificada

    Amostragem por Conglomerados

    Amostragem por Estgios Mltiplos

    Fontes de Erro em levantamentos por Amostragem

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 5

    Amostragem Aleatria Simples Tambm conhecida por amostragem casual, randnica, acidental etc. Consiste basicamente em

    atribuir a cada elemento do universo um nmero nico para, depois, seleccionar alguns desses

    elementos de maneira casual.

    Este procedimento, embora seja o que mais se ajusta aos princpios da teoria das

    probabilidades, nem sempre o de mais fcil aplicao, sobretudo porque se exige que se

    atribua a cada elemento da populao um nico nmero. Alm disso, despreza o conhecimento

    prvio da populao que por ventura o pesquisador pode ter.

    Amostragem Sistemtica

    uma variao da amostragem aleatria simples. A sua aplicao requer que a populao seja

    ordenada de tal modo que cada um de seus elementos possa ser unicamente identificado pela

    posio. Apresentam condies para satisfao desse requisito uma populao identificada a

    partir de uma lista que englobe todos os seus elementos, uma fila de pessoas ou um conjunto de

    candidatos a um concurso identificado pela ficha de inscrio.

    Amostragem Estratificada

    Caracteriza-se pela seleco de uma amostra de cada subgrupo da populao considerada.

    O fundamento para delimitar os subgrupos ou estratos pode ser encontrados em propriedades

    como sexo, idade ou classe social. Muitas vezes essas propriedades so combinadas, o que

    exige uma matriz de classificao. Por exemplo quando se compara homem e mulher com

    "maior de 18 anos" e menor de 18 anos" resultam quatros extractos: homem menor de 18 anos,

    mulher menor de 18 anos, homem maior de 18 anos, mulher maior de 18 anos.

    A amostragem estratificada pode ser proporcional ou no-proporcional.

    No primeiro caso, selecciona-se de cada grupo uma amostra aleatria que seja proporcional

    extenso de cada subgrupo determinada por alguma propriedade tida como relevante. Este

    tipo de amostragem tem como principal vantagem o fato de assegurar representatividade em

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 6

    relao s propriedades adoptadas como critrios para estratificao.

    No caso da amostragem estratificada no-proporcional, a extenso da amostra dos vrios

    estratos no proporcional extenso desses estratos em relao ao universo. H situaes em

    que esse procedimento o mais adequado, particularmente naqueles em que se tem interesse na

    comparao entre os vrios estratos.

    Amostragem por Conglomerados

    So indicadas em situaes em que bastante difcil a identificao de seus elementos. o caso,

    por exemplo, de pesquisa cuja populao seja constituda por todos os habitantes de uma

    cidade. Em casos desse tipo possvel proceder-se seleco da amostra a partir de

    "conglomerados".(quarteires, organizaes, edifcios, fazendas, etc.)

    Amostragem Por Cotas

    Este tipo de amostragem muito utilizado em pesquisas eleitorais e de mercado, tendo como

    principal vantagem o seu baixo custo. De modo geral desenvolvida em trs fases :

    1 Classificao da populao em funo de propiedades tidas como relevantes para o

    fenmeno a ser estudado.

    2 Determinao da proporo da populao a ser colocada em cada classe com base na

    constituio conhecida ou presumida da populao.

    3 Fixao de cotas para cada entrevistador encarregado de seleccionar elementos da

    populao a ser pesquisada de modo tal que a amostra total seja composta em observncia

    proporo das classes consideradas.

    Amostragem por Estgios Mltiplos Esta estratgia de amostragem pode ser vista como uma combinao de dois ou mais planos

    amostrais. Considere por exemplo uma populao estratificada onde o nmero de estratos

    muito grande. Ao invs de sortear uma amostra de cada estrato, o que poderia ser invivel

    devido quantidade de estratos, o pesquisador poderia optar por sortear alguns estratos e em

    seguida seleccionar uma amostra de cada estrato sorteado. Neste caso, teramos uma

    amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples, sendo

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 7

    que no primeiro estgio as unidades amostrais so os estratos e no segundo so as componentes

    da populao.

    Nota: Nos levantamentos por Amostragem usam-se os Questionrios. Este tpico sera tratado

    mais tarde no curso.

    2. ESTIMAO DE PARMETROS

    Nesta seco introduziremos alguns conceitos aplicados na rea de inferncia Estatstica que

    sero dados nos captulos seguintes. A inferncia estatstica inclui assim trs grandes tipos de

    aplicao:

    1. Estimao pontual;

    2. Estimao por intervalos;

    3. Testes de Hipteses;

    2.1 Estimao Pontual O objectivo da estimao por pontos usar toda a informao disponvel a partir da amostra,

    para produzir um valor que melhor valor que se pode adiantar para um certo parmetro da

    populao ou universo.

    Um estimador para certo parmetro designa-se genericamente por e

    uma estatstica, ou seja, uma varivel aleatria funo duma amostra.

    Como resultado, obtm-se uma aproximao concreta ao valor do parmetro que lhe est

    associado. Esta designa-se por estimativa e denota-se, usualmente por: .

    Portanto, um estimador uma frmula, funo de variveis observveis a partir da amostra,

    que no pode envolver valores desconhecidos. Para um mesmo parmetro (desconhecido)

    possvel propor estimadores alternativos. Cada estimador uma varivel aleatria que

    fornece infinitas estimativas, uma para cada concretizao da amostra aleatria.

    Uma estimativa um valor concreto, resultante do estimador.

    ),...,,( 21 nXXX

    *

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 8

    Exemplo:

    Para estimar o parmetro (mdia da populao) duma populao normal poder-se-ia

    utilizar, entre outros estimadores, o estimador:

    ou seja a mdia amostral.

    2.2 Propriedades dos estimadores A preciso de qualquer estimativa feita da amostra depende do mtodo atravs do qual a

    estimativa calculada e do plano de amostragem.

    As principais propriedades dos estimadores em pequenas amostras so:

    1. No enviesamento (no viciamento);

    2. Eficincia;

    3. Suficincia.

    2.2.1 No Enviesamento Um estimador diz-se no enviesado (no viciado) se o valor mdio da estimativa (valor

    esperado), para todas as amostras possveis do tamanho n, for exactamente igual ao valor real

    da populao ou seja se para o parmetro se tem .

    Exemplos:

    A mdia amostral e a varincia amostral so exemplos de estimadores no viciados j

    que demonstra que:

    .

    n

    xX

    i

    ][E

    X 2s

    22 ][

    ][

    sE

    XE

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 9

    2.2.2 Eficincia

    Um estimador diz-se eficiente, de dentro da classe dos estimadores no viciado ou centrados

    tiver a menor varincia. Assim, dados dois estimadores 1 e 2 ambos no viciados, 1 ser mais

    eficiente que 2 , se )()( 21 VarVar .

    Exemplo:

    De entre os estimadores para a mdia da populao normal, pode se demonstrar que X um

    estimador eficiente; pois:

    ][][

    ][

    VarXVar

    XE , Onde designa qualquer outro estimador no viciado para .

    2.2.3 Suficincia

    O estimador diz-se suficiente, se utiliza toda a informao disponvel na amostra, relevante

    para estimao de

    Exemplo: Os estimadores Mo e Me so estimadores suficientes para a mdia duma populao

    normal .

    2.3. Amostragem Aleatria Simples

    Inquritos por amostragem envolvem a escolha de amostras duma populao que contem um

    nmero finito N de unidades. Se essas unidades podem ser distinguidas uma da outra, o nmero

    de amostras diferentes de tamanho n que podem ser formadas a partir de N unidades, 1qual

    a:

    !!!

    nNn

    N

    n

    N

    Exemplo: Se uma populao contm 5 unidades, representadas por A, B, C, D e E,

    respectivamente, existem 10 amostras diferentes de tamanho 3, que so.

    .

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 10

    ABC ABD ABE ACD ACE

    ADE BCD BCE BDE CDE

    Neste exemplo, podemos notar que:

    No h letras repetidas na mesma amostra;

    A ordem das letras no tem importncia;

    E as seis amostras ABC, ACB, BAC, BCA, CAB e CBA so consideradas de forma idntica.

    2.3.1 Amostragem aleatria simples

    um mtodo de seleco de n unidades a partir de N atravs do qual, cada uma das

    n

    N

    amostras tm igual chance (probabilidade) de serem escolhidas. Este tipo de amostragem

    tambm conhecido pelo nome de amostragem aleatria sem restries.

    Na prtica, a amostra aleatria simples seleccionada unidade por unidade. As unidades na

    populao so enumeradas de 1 at N. E depois, uma srie de nmeros aleatrios entre 1 e N,

    da tabela dos nmeros aleatrios, so lidos em sequncia at se atingir o nmero n, o tamanho

    da amostra. As unidades que tomarem os nmeros lidos da tabela constituiro a amostra.

    Em cada etapa da escolha, este processo d aos nmeros a mesma chance de serem escolhidos.

    Se o nmero escolhido no devolvido para a lista, pois isso daria a possibilidade de a mesma

    unidade entrar na amostra mais do que uma vez, na prtica no se repete. Por essa razo este

    tipo de amostragem se d o nome de amostragem sem reposio.

    Desta forma, ao usarmos a tabela dos nmeros aleatrio, o nmero que j foi escolhido

    anteriormente ignorado.

    Muitas vezes, no plausvel o uso deste tipo de amostragem preferindo-se outros tipos de

    amostragem, por razes de convenincia ou mesmo aumento de preciso.

    2.3.2. Definies Bsicas e Notaes Ao seleccionarmos uma amostra ns estamos interessados em certas propriedades que ns

    pretendemos medir ou registar para cada unidade que entra na amostra. Estas propriedades

    so denominadas de caractersticas ou mais simplesmente itemes.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 11

    Assim:

    Os valores obtidos para cada item nas N unidades que compem a populao so

    representados por: y1, y2, y3,..., yN .

    E os valores correspondentes na amostra por: y1, y2, y3, ..., yn ou simplismente yi (i =1, 2, ...,n)

    Exemplos sobre caractersticas:

    Populao Algumas caractersticas

    Todas as pessoas moradoras

    duma cidade

    Peso mdio;

    Rendimento Total;

    Percentagem de rendimento gasto em comida;

    Nmero de mulheres;

    Distribuio do rendimento total entre as famlias

    por tamanho de rendimento;

    Portanto, caracterstica da populao no tem que ser obrigatoriamente numrica. Caracterstica

    tudo aquilo que nos possa interessar saber sobre a populao em estudo.

    Usam-se letras maisculas para representar as caractersticas da populao e as minsculas para

    representar as da amostra: Para os totais e as mdias, temos as seguintes definies:

    Populao Amostra

    Total: N

    N

    i

    i yyyyY

    ...211

    n

    n

    i

    i yyyy

    ...211

    Mdia

    N

    y

    N

    yyyY

    N

    i

    i

    N

    121

    ...

    n

    y

    n

    yyyy

    n

    i

    i

    n

    121

    ...

    Embora a amostragem seja realizada para diferentes objectivos, geralmente o interesse centras

    em quatro caractersticas da populao, nomeadamente:

    1. A mdia = Y , por exemplo, o nmero mdio de crianas por escola;

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 12

    2. O total = Y, Por exemplo, o nmero total de moradores dum distrito;

    3. A razo entre dois totais ou duas mdias

    X

    You

    X

    YR ;

    4. A proporo de unidades que pertencem a uma certa classe ou categoria. Por exemplo a

    proporo de habitantes do sexo Feminino, a proporo de estudantes dispensados, etc.

    O Simbolo ^ usado para indicar a estimativa duma caracterstica da populao obtida atravs

    da amostra. Nesta seco ns somente consideraremos as estimativas mais simples:

    Estimativa (estimante)

    Media da populao Y yY mdia da amostra

    Total da populao Y

    n

    y

    NyNY

    n

    i

    i 1

    Razo da populao R

    n

    i

    i

    n

    i

    i

    x

    y

    x

    yR

    1

    1

    Em Y o factor n

    N a que se multiplica o total da amostra chamado de factor de expanso, ou

    factor de inflao. O seu inverso N

    n, a razo entre o tamanho da amostra e o tamanho da

    populao, chamado de fraco de amostragem e representado por f.

    2.3.3 Propriedades dos Estimadores Para Amostragem Aleatria Simples (AAS) Para investigar se y ou no viciado, para amostragem Aleatria Simples ns calculamos o

    valor de y para todas as

    n

    N amostras e depois achamos a mdias das estimativas. O

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 13

    Smbolo E denota, mdia de todas possveis amostras, ou seja o valor esperados das mdias

    amostrais

    Teorema 3.1:

    A mdia amostral y um estimador no viciado de Y , isto : YXE ][

    Demonstrao: Por definio

    n

    yyy

    N

    nNn

    nNn

    Nn

    yyy

    n

    N

    yyE

    n

    n

    )...(

    !

    )!(!

    )!(!

    !

    )...(

    21

    21

    (3.1)

    Onde o somatrio se estende para todas as

    n

    N amostras. Para calcular esta soma, ns

    determinamos em quantas amostras um dado valor especfico iy aparece. Dado que existem

    outras (N-1) unidades para o resto da amostra e (n-1) lugares para preencher na amostra, o

    nmero de amostras contendo iy :

    )!()!1(

    )!1(

    1

    1

    nNn

    N

    n

    N

    Consequentemente,

    )...(

    )!()!1(

    )!1()...( 2121 Nn yyy

    nNn

    Nyyy

    De (a) teremos

    YN

    yyy

    yyynN

    nNn

    nNn

    nNyE

    N

    N

    )...(

    )...(!

    )!_(!

    )!()!1(

    )!(

    21

    21

    Corolrio 3.1:

    yNY um estimador no viciado do total da populao Y. (3.2)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 14

    2.3.4 As Varincias dos Estimadores

    A varincia de iy numa populao finita geralmente definida como:

    N

    YyN

    i

    i

    1

    2

    2

    )(

    (3.4)

    Agora vamos considerar a varincia de y a mdia amotral, considerada para todas as

    n

    N mostras possveis, ou seja 2YyE .

    Teorema 3.2: A varincia da mdia amostral para Amostragem Aleatria Simples igual a:

    fn

    S

    n

    nN

    n

    SYyEyV

    1

    222

    (3.5)

    Onde N

    nf a fraco amostral.

    Corolrio 3.2: O erro padro para y

    fn

    SNnN

    n

    Sy

    1/ (3.6)

    Corolrio 3.3: A varincia de yNY , como estimador do total da populao Y, na

    amostragem Aleatria Simples dada pela frmula:

    fn

    SN

    N

    nN

    n

    SNYYEYV

    1

    )()()(

    22222

    (3.7)

    Corolrio 3.4: O Erro padro para a estimativa do o total da populao Y igual a:

    fn

    NSNnN

    n

    NSY

    1/)( (3.8)

    2.3.5 O Factor de Correco da Populao Finita

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 15

    Sabemos que para qualquer populao infinita, para uma amostra de tamanho a varincia

    da mdia amostral igual a:

    n

    yV2

    Quando a populao finita, introduz-se o factor N

    nN )( para a varincia e o factor

    N

    nN )( para o desvio padro.

    Esses factores do-se o nome de factores de correlao da populao finita. Na pratica, o

    factor de correco pode ser ignorado sempre que ele no exceder 5% e para muitas

    aplicaes mesmo quando for superior a 10%. O efeito da ignorncia do factor da

    correco super estima o erro padro do estimador y .

    2.3.6 Clculo do Erro Padro a Partir da Amostra

    Para Amostragem Aleatria Simples tem lugar o seguinte Teorema.

    Teorema 3.3: Para a Amostragem Aleatria Simples (AAS)

    )1(

    )(1

    2

    2

    n

    yy

    s

    n

    i

    i

    um estimador no viciado para

    1

    )(1

    2

    2

    N

    Yy

    S

    N

    i

    i

    Nota: Ns tivemos um resultado idntico para populao infinita, onde provamos que

    22 ][ SE . A nica diferena que na demonstrao entra o factor de correco.

    Corolrio 3.5: Os estimadores no viciados das varincias da mdia amostral y e do total

    da populao yNY so:

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 16

    fn

    s

    N

    nN

    n

    ssyv

    s

    y

    1)(

    22

    (3.9)

    e,

    fn

    sN

    N

    nN

    n

    sNsYv

    s

    Y

    1)(

    2222 (3.10)

    Respectivamente.

    Para os erros padro toma-se.

    fs

    ss

    y 1 e f

    n

    Nss

    Y 1 (3.11)

    Nota: Esses estimadores so ligeiramente enviesados (viciados). Para muitas aplicaes o

    enviesamento no importante.

    2.3.7 Intervalos de Confiana

    Os intervalos de confiana para a mdia e para o estimador do total so dados por:

    a) Para Mdia, tem-se:

    fn

    tsyY 1 (3.12)

    b) Para o Total:

    fn

    tNsyNY 1

    (3.13)

    O smbolo t o valor do desvio da mdia na distribuio Normal e depende do intervalo de

    confiana desejado ( ou da probabilidade de confiana desejada)

    Os valore mais comuns no:

    Intervalo de confiana (%) 50 80 90 95 99

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 17

    Valor de t corresponte 0.67 1.28 1.64 1.96 2.58

    NOTA: Se o tamanho da amostra for menor do que 60, os pontos percentuais acima referidos

    so tirados da tabela de distribuio t de Student com (n-1) graus de liberdade, graus

    liberdades usados no calcula da varincia 2s .

    Exerccio:

    Numa localidade com 250 Famlias (Agregados familiares), fez-se um levantamento por

    amostragem com o objectivo de determinar o nmero de crianas com idades compreendias

    entre 0 e 14 anos na aldeia independentemente de quem so os pais. Decidiu-se trabalhar com

    uma amostra de 80 famlias (AF). A tabela abaixo indica os resultados do inqurito.

    # filhos yi 2 3 5 6 7 8

    Fi 13 19 15 20 10 3

    Com base nesse dados estimar:

    a) o nmero mdio de crianas por agregado Familiar;

    b) o nmero total de crianas existentes nessa aldeia;

    c) o intervalo de confiana da mdia e do da estimativa do total.

    Estimao de um ndice (duma Razo)

    Frequentemente, a quantidade que deve ser estimada, atravs de uma amostra aleatria

    simples, uma relao entre duas variveis, as quais variam de unidade para unidade. Em

    inquritos aos agregados familiares, so exemplos disso o nmero de casacos por homem adulto,

    a mdia das despesas com cosmticos por mulher adulta, o nmero mdio de horas semanais

    passadas assistindo televiso por crianas de idade entre 10 e 15 anos, etc. A fim de estimar a

    primeira dessas quantidades, registaramos, para os i agregados familiares ( i = 1, 2, ..., n),o

    nmero de homens adultos que a vivem xi e o nmero de mudas de roupa que eles possussem yi.

    O parmetro da populao a ser estimado o ndice

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 18

    N

    i

    i

    N

    i

    i

    x

    y

    adultosensdetotalNumero

    casadetotalNumeroR

    1

    1

    hom

    cos

    o estimativa da amostra correspondente :

    x

    y

    x

    y

    Rn

    i

    i

    n

    i

    i

    1

    1 (3.14)

    Exemplos dessa natureza ocorrem, frequentemente, quando a unidade de amostragem (no caso

    do AF) e o nosso interesse est no valor mdio da populao por elemento. Os ndices tambm

    aparecem em muitas outras aplicaes, como, por exemplo, o ndice de emprstimos para

    construes imobilirias no total de emprstimos de um banco, ou o ndice de acres plantadas

    com trigo, no total dos acres cultivados de uma fazenda.

    Teorema 3.4:

    Se as variveis iy e ix so medidas em cada unidade de uma amostra aleatria simples de

    tamanho n, que se presume grande, a varincia da razo xyR / , aproximadamente igual

    a:

    1

    )(1

    2

    2

    N

    Rxy

    Xn

    fRVar

    ii

    (3.15)

    Onde

    X

    YR o ndice dos valores mdios da populao e

    N

    nf .

    Demonstrao:

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 19

    x

    xRyR

    x

    yRR

    (3.16)

    X

    xRyRR

    0 X

    XRY

    X

    xRyERRE

    Visto que X

    YR . Isto mostra que a ordem de aproximao usada, ou seja R um estimador

    no viciado de R .

    De (3.16), ns obtemos o seguinte resultado

    2

    2)(

    1)()( xRyE

    XRRERVar

    A quantidade xRy a mdia amostral da varivel iii Rxyd , cuja mdia populacional

    .0 XRYD

    Assim, podemos calcular ][RVar aplicando o teorema (2.2) a varincia da mdia da

    Amostragem Aleatria Simples.

    Como estimativa amostral de

    1

    )(1

    2

    N

    RxyN

    i

    ii

    comum tomar-se

    1

    )( 2

    1

    n

    xRy i

    n

    i

    i

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 20

    E para o estimador do erro padro para R o seguinte:

    1

    )(1)(

    2

    n

    xRy

    Xn

    fRs

    ii (3.17)

    Se X no conhecido, o estimador amostral x substitudo no denominador. A forma mais

    rpida de calcular )(Rs com mquina de calcular expressa da forma:

    1

    21)(

    22

    n

    xRxyRy

    nX

    fRs

    iiii (3.18)

    2.4 Estimao do Valor Mdio das Sub-Populaes

    Em muitos inquritos, as estimativas so feitas em cada classe na qual a populao se encontra

    sub-divida. Por exemplo, o Agregado familiar podemos estar interessados em achar as

    estimativas para AF com 0, 1,.., n filhos.

    A Comisso de Amostragem dos Estados Unidos (1950), chamou dessas sub-divises da

    populao por Domnios de Estudo.

    Na situao mais simples cada unidade da populao pertence um dos domnios.

    Seja jth o domnio que contm Nj unidades e

    nj = o nmero de unidades na Amostragem Aleatria Simples de tamanho n.

    Se yjk (k= 1, 2,.., nj ) so as medies nessas unidades, a mdia da populao jY para o domnio

    jht estimado por

    jn

    k j

    jk

    jn

    yy

    1 (3.19)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 21

    Assim:

    1. jy um estimador no viciado para jY ;

    2. O erro padro para jy igual a

    j

    j

    j

    j

    y N

    n

    n

    Ss

    j

    1 (3.20)

    Onde

    jN

    k j

    jjk

    jN

    YyS

    1

    2

    2

    1 (3.21)

    Uma estimativa do erro padro para jy dada por

    j

    j

    j

    j

    N

    n

    n

    s1 (3.22)

    Onde

    jN

    k j

    jjk

    jn

    yys

    1

    2

    2

    1 (3.23)

    Se o valor de Nj for desconhecido, a quantidade N

    n pode ser utilizada em llugar de

    j

    j

    N

    n, no

    calculo do cpf.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 22

    2.5 Estimao dos valores Totais das Sub-Populaes

    Consideremos um exemplo, duma lista de clientes da Mcel com contractos, onde uns pagaram a

    sua mensalidade e outros no. Podemos estar interessados em estimar, atravs duma amostra, o

    total do dinheiro ainda em divida. Se (o nmero de dividas no pagas na populao) for Nj

    conhecido, ento a estimativa do total na amostra ser:

    jjj yNY

    (3.24)

    Se Nj nem o total de recebimentos forem desconhecidos, as estimativas no se podem calcular. No

    seu lugar usa-se a estimativa. Seguinte:

    jn

    k

    jkj yn

    NY

    1

    (3.25)

    E o o seu erro padro correspondente :

    N

    n

    n

    NSY j 1)(

    '

    (3.26)

    Em cuja S um afastamento padro da populao de 'iy .A fim de calcularmos S, admitamos

    que a populao seja constituda de Nj valores de yi que esto compreendidos no sector j, e e

    de N Nj valores. Vem ento

    Onde

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 23

    )(1

    1

    sec

    22'

    N

    Yy

    NS

    j

    jtor

    i

    (3.27)

    Assim, uma estimativa amostral do erro padro de jY^

    para ser:

    N

    n

    n

    NsYs

    i

    j 1

    (3.28)

    3. AMOSTRAGEM PARA PROPORCES E PERCENTAGENS

    3.1 Varincias dos Estimadores Amostrais

    s vezes, deseja-se estimar o nmero total, a proporo de unidades na populao que possuem

    uma certa caracterstica ou atributo, ou que integram uma determinada categoria. Muitos dos

    resultados dos censos e inquritos, habitualmente divulgados assumem essa forma, como, por

    exemplo, o nmero de pessoas desempregadas numa populao C e C. Admite-se que qualquer

    unidade da populao se integra em uma das duas categorias.

    A notao usada a seguinte:

    Nmero de unidades na categoria C Proporo de unidades em C

    Na populao Na amostra Na populao Na Amostra

    A a P = A/N p = a/n

    Teorema 4.1: A proporo amostral n

    ap um estimador no viciado da proporo da

    populao N

    AP .

    N

    nN

    n

    PQ

    N

    nN

    N

    SPpEpVar

    22)()(

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 24

    Corolrio 1:

    Corolrio 2: A varincia de NpA , o estimador do nmero total de unidades na classe/

    categoria C, :

    1)(

    2

    N

    nN

    n

    PQNAVar (37)

    Teorema 4.2 (3.3): O estimador no viciado da varincia de p, obtido da amostra :

    pqn

    nNsp p

    )1()var(

    2

    (3.8)

    Demonstrao:

    Corolrio: O estimador no viciado da varincia de NpA , estimado do nmero total de

    unidades na classe C na populao dada por:

    pqn

    nNNsA Np

    1

    )()var(

    2

    (3.11)

    4. CLCULO DO TAMANHO DA AMOSTRA

    4.1. A Especificao da Preciso

    4.2. A Frmula para o Tamanho da Amostra para Propores

    As unidades so classificadas em duas classes C e C. Admite se uma margem de erro d, na

    proporo estimada p das unidades da classe C e existe um pequeno risco que ns aceitamos

    incorrer e o erro real admitido de ser maior do que d, isto ,

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 25

    dPpPr (3.12)

    Assumindo que p distribuda de forma normal, e que se trata de amostragem Aleatria

    Simples, sabemos que:

    n

    PQ

    N

    nNp

    1

    (3.13)

    Consequentemente, a frmula que liga n com o grau de preciso desejado :

    n

    PQ

    N

    nNtd

    1

    (3.14)

    Onde t a abcissa da curva normal que corta a rea nas regio em dois lados.

    Resolvendo em relao a n, temos:

    11

    12

    2

    2

    2

    d

    PQt

    N

    d

    PQt

    n (3.15)

    Para o uso prtico, como estimador aproximado para P, toma-se p na frmula. Se N for grande,

    como primeira aproximao para n, toma-se:

    V

    pq

    d

    pqtn

    2

    2

    0 (3.16)

    Onde

    2

    2

    t

    dV = Varincia da populao desejada.

    Na prtica, primeiro calcula-se 0n . Se N

    n0 for negligencivel, 0n uma aproximao

    satisfatria de n. Se no, o n obtido atravs da frmula:

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 26

    N

    n

    n

    N

    n

    nn

    0

    0

    0

    0

    1)1(

    1

    (3.17)

    4.3 A Frmula do Tamanho da Amostra para Dados Contnuos

    Se y for a mdia de n observaes duma amostra aleatria simples, ns pretendemos que:

    dYyPr (3.18)

    Onde d, a margem de erro escolhido e uma probailidade pequena. Dos captulos

    anteriores sabemos que, que o erro padro da mdia :

    n

    S

    N

    nNy

    (3.19)

    Ento

    n

    S

    N

    nNtd

    (3.20)

    Elevando ambos os membros ao quadrado, e expressando em funo a n ebtemos:

    2

    2

    11

    d

    tS

    N

    d

    tS

    n (3.21)

    Como para o caso das propores, toma-se como primeira aproximao para o tamanho da

    amostra n o nmero:

    V

    S

    d

    tSn

    22

    0

    (3.22)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 27

    Esta frmula da resultado aceitvel, a no que N

    n0 seja grande. Caso seja, ento calculamos

    n, como

    N

    n

    nn

    0

    0

    1

    (3.23)

    Se o que se pretende estimar o total da populao Y, com a margem de erro d , toma-se como

    a primeira aproximao para n

    V

    NS

    d

    NtSn

    22

    0

    (3.24)

    no lugar de (3.23), e o resto mantm-se.

    4.4 Mtodos Avanados na Estimao da Varincia da Populao.

    Geralmente, a varincia da populao 2S desconhecida. Na, prtica existem quatro mtodos

    de estimao da varincia da populao no clculo do tamanho da amostra.

    1. Escolha do tamanho da amostra em duas etapas, onde na primeira etapa se escolhe o

    tamanho 1n duma amostra aleatria simples no qual os valores de 2S e P e o tamanho

    exigido de n so Obtidos;

    2. Atravs dos resultados dum estudo piloto;

    3. Atravs de inquritos de populaes similares;

    4. Atravs dum guess work sobre a estrutura da populao com apoio de resultados

    matemticos

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 28

    4.5 Estimao de Y com varincia V

    Se 2

    1s for a varincia resultante da primeira amostra, tome unidades adicionais para tornar o

    tamanho da amostra igual a:

    1

    2

    1 21nV

    sn . (3.23)

    Assume se que y aproximadamente normal. Se S fosse exactamente conhecido, o tamanho

    necessrio (exigido) seria ./2 VS O efeito de no conhecer S o de aumentar o tamanho mdio

    pelo factor

    1

    21

    n. (3.24)

    4.6 Estimao de P com a varincia V

    Seja 1p a estimada de P, resultante da primeira amostra. O tamanho da amostra combinado as

    duas primeiras amostras ser:

    1

    11

    11

    1111 3183

    Vn

    qp

    qp

    qp

    V

    qpn

    (3.25)

    O primeiro termo em (x) o tamanho da amostra requerido se sabido que P e igual a 1p .

    Com este mtodo o estimador binomial de p obtido atravs duma amostra completa de

    tamanho n, ligeiramente viciado. Para corrigir este enviesamento, use:

    pq

    pVpp

    )21(

    (3.26)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 29

    5.7 Estimao de P dado o coeficiente de varincia

    Ccv

    Para n toma-se

    11111

    1 13

    nCpqpCp

    qn (3.27)

    A estimativa torna-se:

    q

    CppP (3.28)

    6. AMOSTRAGEM ALEATRIA ESTRATIFICADA

    Neste mtodo a populao dividida em L sub-populaes mutuamente exclusivas ou estratos, e

    a amostragem aleatria Simples realizada para cada estrato. Essas sub amostras so

    combinadas numa nica amostra, estatsticas da qual so usadas para estimar os parmetros da

    populao.

    Notaes

    O sufixo h denota o estrato e i a unidade dentro do estrato. Geralmente, so usados os seguintes

    smbolos.

    hN = Nmero total de unidades no estrato h;

    hn = O nmero de unidades na amostra no estrato h;

    hiy = Valor obtido para a unidade i no estrato h

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 30

    h

    kh

    N

    nf = a fraco amostral no estrato

    N

    NW hh = O peso do estrato h

    h

    N

    i

    hi

    h

    N

    y

    Y

    k

    1 = A mdia do estrato h na populao = h

    h

    n

    i

    hi

    hn

    y

    y

    h

    1 = Mdia amostral do estrato h

    hN

    i

    hhi

    h

    h YYN

    S1

    22

    1

    1 == a varincia verdadeira do estrato h;

    hn

    i

    hhi

    h

    h yyn

    s1

    22

    1

    1 = a varincia amostral do estrato h

    6.1 Alocao da Amostra

    Na amostragem aleatria estratificada, o total da amostra n, pode ser alocada aos vrios

    estratos de diferentes maneiras. O tamanho total da amostra e o tamanho da amostra em cada

    estrato depende do mtodo de alocao usado. Ns vamos descrever trs dos mais usados

    mtodos de alocao.

    6.2 Propriedades dos estimadores na Amostragem Estratificada

    Para o valor mdio, por unidade, da populao, a estimativa usada na amostragem estratificada

    representada por sty (onde st significa stratified), onde

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 31

    N

    yN

    y

    L

    h

    hh

    st

    1 (6.1)

    na qual LNNNN ...21 .

    A estimativa sty , de modo geral, no o mesmo valor mdio amostral. Esse valor mdio

    amostral, y , dado pela frmula:

    n

    yn

    y

    L

    h

    hh 1 (6.2)

    A diferena que, em sty , as estimativas dos estratos individuais recebem os seus pesos

    correctos correspondentes N

    NW hh .

    evidente que y coincide com sty , desde que em cada estrato se verifique a condio

    N

    N

    n

    n hh N

    n

    N

    n

    h

    h ou seja ffh (6.3)

    Significando assim, que a fraco amostral a mesma em todos os estratos.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 32

    As principais propriedades da estimativa sty

    Teorema 6.1: Se, em todos os estratos, a estimativa amostral hy for sem tendncia, ento o sty

    uma estimativa sem tendncia do valor mdio da populacional Y .

    Corolrio 6.1: Uma vez que hy um estimador no viciado para hY para a amostragem

    aleatria simples dentro do estrato, sty um estimador no viciado para a mdia populacional

    Y para a amostragem aleatria estratificada.

    Isto significa, que na amostragem aleatria estratificada, como estimador da mdia da

    populao Y , usa-se:

    N

    yN

    y

    L

    h

    hh

    st

    1 (6.4)

    Teorema 6.2: Para a amostragem estratificada, a varincia do estimador sty , sendo este uma

    estimativa do valor mdio da populao Y :

    L

    h

    hh

    L

    h

    hh

    st yVarWN

    yVarN

    yVar1

    2

    2

    1

    2

    )(

    )(

    )( (6.5)

    Onde

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 33

    2)( hhh YyEyVarV (6.6)

    Nota Importante: A varincia de sty depende das varincias dos estimadores das mdias hY

    de cada.

    Teorema 6.3: Para a amostragem aleatria estratificada, a varincia da estimativa sty

    L

    h

    L

    h

    h

    h

    hh

    h

    hhhhst f

    n

    SW

    n

    SnNN

    NyV

    1 1

    22

    2

    2)1()(

    1)( (6.8)

    Corolrio 6.2: Se as fraces de amostragem h

    h

    N

    n forem desprezveis em todos os estratos,

    tem-se:

    L

    h h

    hhL

    h h

    hh

    stn

    SW

    n

    SN

    NyV

    1

    22

    1

    22

    2

    1)( (6.9)

    Esta frmula apropriada quando se podem desprezar as correces das para populaes

    finitas.

    Corolrio 6.3:

    No caso em que a repartio proporcional, pode-se substituir hn por seu valor na frmula

    (6.8),

    N

    nNn hh

    Desse modo, reduzindo a varincia para mm

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 34

    L

    h

    L

    h

    hhhh

    st SWn

    f

    N

    nN

    n

    S

    N

    NyV

    1 1

    22

    1)( (6.10)

    Corolrio 6.4: Se a amostragem for proporcional ao tamanho e as varincias de todos os

    estratos tiverem o mesmo valor 2

    wS , obtm-se a frmula simplificada

    fn

    S

    N

    nN

    n

    SyV wwst

    1

    22

    (6.11)

    Tem lugar o seguinte resultado.

    Teorema 6.4: Se stst yNY a estimativa do valor total da populao Y, ento temos:

    h

    hnnnst

    n

    SnNNYV

    2

    )()( (6.12)

    (Nota: Incluir o exemplo da pag.133-134)

    6.3.1 Alocao proporcional

    A amostra alocada ao estrato, proporcionalmente ao tamanho do estrato, isto :

    N

    N

    n

    n hh (6.1)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 35

    6.3.2 Alocao ptima

    Na amostragem estratificada os valores dos tamanhos das amostras kn nos estratos so

    escolhidos pelo amostrista. Esses valores podem ser escolhidos de modo a minimizar

    estyVarV para um dado custo especfico para a mostra ou para minimizar o custo para um

    valor especfico para estyVarV .

    A funo custo mais simples tem a forma:

    L

    i

    hhnCCCcusto1

    0 (6.2)

    Onde

    0C = Custo de contingncias

    hC = Custo por unidade em cada estrato e pode variar de unidade por unidade, e para cada

    estrato, este custo proporcional ao tamanho da amostra.

    Se a amostra alocada ao estrato de tal modo que a varincia do estimador seja mnima, na

    condio de que o total oramento disponvel para cobrir a varivel custos fixa e igual a C e

    que o custo de amostragem por unidade no estrato h Ch . Essa alocao dada por:

    L

    i

    hhh

    hhh

    L

    i

    hhh

    hhhn

    CSN

    CSN

    CSW

    CSW

    n

    n

    11

    /

    /

    /

    / (6.3)

    A equao (6.3) d hn em termo de n . Se os custos so fixos, ento n pode ser expresso como:

    L

    i

    hhh

    L

    i

    hhh

    CSN

    CSNCC

    n

    1

    1

    0 /

    (6.4)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 36

    Se estyVarV for fixo, ento n dado por:

    L

    i

    hh

    L

    i

    hhhhh

    SWN

    V

    CSWSW

    n

    1

    2

    1

    1

    /

    (6.5)

    Onde, NNW hh / .

    6.3.3 Alocao de Neyman (1934)

    A amostra alocada ao estrato de modo que a varincia do estimador seja mnima, na condio

    de que o oramento total disponvel para cobrir a varivel custo fixo e iqual a C e que o custo

    de amostragem por unidade o mesmo para cada. Essa alocao dada por:

    L

    i

    hh

    hh

    L

    i

    hh

    hhn

    SN

    SN

    SW

    SW

    n

    n

    11

    (6.7)

    CONFECAO DO QUESTIONRIO

    Sob a denominao genrica de " formulrio " se inclui toda forma impressa destinada a colecta

    de dados, tal como pronturios, formulrios de declarao de imposto de renda, formulrio de

    atestado de bito ou questionrio que por sua vez permitem recolher dados ou sirvam para sua

    apuraro.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 37

    Os formulrios devem ser planejados cuidadosamente, de tal forma que sejam realmente teis e

    que facilitem e no dificultem a obteno de dados. Eles devem ajudar a colectar informaes

    de maneira completa e eficiente, permitindo uniformidades nas diferentes observaes e

    evitando a colecta de dados inteis ou irrelevantes ao estudo.

    1. Formas de aplicao de um questionrio:

    I) QUESTIONRIO - enviado (distribudo pelo correio) apresentado (distribudos por

    pesquisadores que mais tarde vo busc-los.

    Desvantagens:

    1. Dificuldades de esclarecer dvidas do informante;

    2. Uso de abreviaturas nas respostas, m letra, etc;

    3. Impossibilidades fazer comprovaes;

    S devem ser usadas em grupos seleccionados, cujos componentes possam, sozinhos,

    preencher os questionrios e tenham compreenso do valor e do alcance da pesquisa.

    Nesse caso, possvel sua utilizao preferindo-se o processo por questionrio

    apresentado.

    II) QUESTIONRIO E ENTREVISTA

    O prprio entrevistador preenche o questionrio, interrogando o informante;

    o melhor de todos os processos;

    Custo maior devido a necessidade de entrevistadores;

    2.Principios de construo de um questionrio:

    Antes de ser elaborado o questionrio devem ser considerados:

    I) o propsito para qual ser utilizado;

    II) as circunstncias sob as quais se recolher a informao;

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 38

    O primeiro tem importncia para se decidir sobre os dados que em ultima estncia se recolhero

    e o seguro para a adopo do tamanho, forma e tamanho mais conveniente.

    O questionrio deve permitir reconhecer duas classes de dados:

    I) Dados administrativos ou de Identificao - ajudaro a identificar as unidades em

    observao.

    II) Dados sobre o problema que se estuda - devem ter o propsito perfeitamente definido a ser

    pertinentes ao estudo

    Embora seja impossvel dar regras fixas para a correcta elaborao de um questionrio, os

    seguintes princpios devem ser usados:

    I) Decidir sobre os dados que sero colectados:

    Fazer uma lista de todas as informaes que so " desejveis " colectar de acordo com a

    finalidade do estudo;

    Considerar aqueles que so factveis de colectar de maneira fidedigna e exactas;

    Limitar os dados queles prticos de colectar;

    Limitar a informao quela que se usar; (s perguntar o estritamente necessrio)

    II) Decidir a ordem em que se alocaro as perguntas do questionrio.

    O questionrio deve ser dividido em grupos de questes que denominamos de Blocos .As

    questes de um bloco so de um mesmo assunto;

    O 1 Bloco geralmente constitudo de dados dos informantes (bloco e identificao);

    O desenho o questionrio deve separar os blocos visando uma melhor visualizao;

    III) Considerar como sero feitas as perguntas:

    S perguntar aquilo que o informante tem o conhecimento directo;

    Perguntar fato e no juzos, a no ser em caso especiais;

    No exigir clculos e sim dados;

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 39

    Empregar linguagem simples e sem ambiguidades;

    Enunciar perguntas sem prolixidade;

    Evitar perguntas: insinuantes, pouco explcitas, que faam apelam a memria;

    Fazer pergunta de carcter quantitativos e no qualitativos, sempre que possvel;

    IV) Planear como se anotaro as respostas.

    No utilizar perguntas abertas, somente em pesquisas especiais esta pergunta

    admitida. Pois as respostas podem, ser as mais diversas possveis.

    As perguntas de um questionrio podem ser classificadas em funo das respostas em:

    Perguntas Abertas - informante expressa livremente sua opinio sobre determinado assunto.

    Perguntas Fechadas - informante selecciona sua resposta dentre um conjunto de opes.

    V) Determinar as caractersticas do formulrio.

    Quem colectar a informao?

    De Quem ser colectada?

    Onde e Quando se registar?

    Como se processar os dados?

    De acordo com as respostas s perguntas acima se decidir sobre:

    A Forma

    O Tamanho

    O Material

    A Cor

    VI) Provar a operacionalidade do questionrio - PESQUISA PILOTO.

    Testar o questionrio no mnimo com 10 informantes com a mesma caracterstica da

    populao em estudo;

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 40

    Reformular se necessrio

    VII) Redigir as informaes necessrias:

    Apresentao explicando o objectivo da pesquisa e enfatizando a importncia das

    respostas do informante;

    Manual de resposta se necessrio;

    No entanto antes de entramos nos temas especficos introduziremos alguns conceitos necessrios

    para compreenso dessas matrias.

    Exerccios Resolvidos Um pesquisador deseja estimar a proporo de ratos nos quais se desenvolve um certo tipo de

    tumor quando submetidos a radiao. Ele deseja que sua estimativa no se desvie da proporo

    verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.

    (a) Quantos animais ele precisa examinar para satisfazer essa exigncia?

    Pelo enunciado acima temos:

    - Erro da estimativa: =0,02.

    - Coeficiente de confiana: P()= 0,90.

    Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,95, portanto,

    z=1,64.

    Como no temos uma informao preliminar sobre p, devemos utilizar p=0,5, que maximiza p (1-

    p).

    Assim, podemos calcular o tamanho da amostra da seguinte forma:

    221,64

    (1) 0,250,02

    zn pp

    1681

    Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve

    certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade

    igual a 0,90, o pesquisador precisa examinar 1.681 animais.

    .

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 41

    (b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que

    em geral esse tipo de radiao no afeta mais que 20% dos ratos?

    Se p for no mximo 20%, o tamanho da amostra ser:

    221,64

    (1) 0,20*0,800,02

    zn pp

    1076

    Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de

    ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo

    0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.

    Exerccio 02

    Antes de uma eleio, um determinado partido est interessado em estimar a proporo de

    eleitores favorveis a seu candidato.

    (a) Determine o tamanho de amostra necessrio para que o erro cometido na estimao seja de,

    no mximo 0,01, com probabilidade de 80%.

    Pelo enunciado acima temos:

    - Erro da estimativa: =0,01.

    - Coeficiente de confiana: P() =0,80.

    Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,90, portanto,

    z=1,28.

    Como no dispomos de uma informao preliminar sobre p, devemos usar p=0,5, que maximiza

    p(1-p).

    Assim, podemos calcular o tamanho da amostra da seguinte forma:

    221,28

    (1) 0,250,01

    zn pp

    4096

    Logo, para que o erro cometido na estimao seja de no mximo 0,01, com probabilidade de

    80%, o tamanho da amostra teria que ser de 4.096 eleitores.

    .

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 42

    (b) Uma amostra piloto revelou que entre 60% e 70% dos eleitores eram favorveis ao

    candidato em questo. Com base nessa informao, qual deve ser o tamanho de amostra de

    modo que as condies em (a) estejam satisfeitos?

    Nesse caso, o mximo de p (1-p) ocorre quando p=0,60. Assim,

    221,28

    (1) 0,60*0,400,01

    zn pp

    3933

    ou seja, sabendo que p dever estar entre 0,60 e 0,70, o tamanho da amostra teria que ser

    3.933, para que as condies em (a) sejam satisfeitas.

    (c) Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram

    favorveis ao candidato, construa um intervalo de confiana para a proporo de eleitores

    do candidato com coeficiente de confiana de 0,95.

    Temos que:

    n = 4096

    p =0,55

    P()= 0,95

    Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,975, portanto,

    z=1,96.

    (1) (;0,95)

    ppICp pz

    n

    0,55(10,55)

    (;0,95)0,551,96 0,550,01520,5348;0,56524096

    ICp

    Exerccio 03

    Um cientista resolve estimar a proporo p de indivduos com certa molstia numa regio. Ele

    deseja que a probabilidade de que a sua estimativa no se desvie do verdadeiro valor de p

    por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que

    .

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 43

    essas condies sejam satisfeitas? Um outro cientista descobre que a doena em questo est

    relacionada com a concentrao da substncia A no sangue e que considerado doente todo

    indivduo para o qual a concentrao A menor que 1,488 mg/cm3. Sabe-se que a

    concentrao da substncia A no sangue tem distribuio normal com desvio padro 0,4 mg/cm3

    e mdia maior que 2,0 mg/cm3. Voc acha que essas novas informaes podem ser utilizadas

    pelo primeiro cientista para diminuir o tamanho amostral? Em caso afirmativo, qual seria o novo

    tamanho amostral?

    = 0,02

    P()= 0,95

    z tal que A(z) = 0,975 ,z = 1,96

    Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).

    Assim, podemos calcular o tamanho da amostra da seguinte forma:

    221,96

    (1) 0,250,02

    zn pp

    2401

    O tamanho da amostra deve ser 2.401 indivduos para que as condies acima sejam satisfeitas.

    Seja X: concentrao da substncia A no sangue em mg/cm3

    X~N (; 0,42), >2.

    P = P (estar doente) = P(X1,28] =

    = 1 - P[Z1,28] = 1 A(1,28) = 1 0,9 =0,1.

    Assim, segundo um outro cientista, p menor ou igual a 0,10.

    A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da

    amostra, pois como o valor de p no mximo 0,1, o valor mximo de p(1-p) atingido quando

    p=0,10, e assim:

    221,96

    (1) 0,10*0,900,02

    zn pp

    865

    .

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 44

    Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para

    aproximadamente 865 indivduos.

    Exerccio 04

    Um centro de estudos de pesquisa de opinio realizou uma pesquisa para avaliar a opinio dos

    telespectadores de uma regio, sobre um certo comentarista desportivo. Para isso entrevistou

    380 telespectadores, seleccionados ao acaso da regio, e constatou que 180 desejavam que o

    comentarista fosse afastado da TV.

    (a) Determine um intervalo de confiana de 90% para p:proporo de telespectadores,

    favorveis ao afastamento do comentarista.

    Uma estimativa pontual da proporo p de telespectadores da regio favorveis ao

    afastamento do comentarista desportivo dada por:

    180 0,47370,47380

    p

    Considerando o coeficiente de confiana =0,90, temos que z tal que A(z)=0,95 e,

    portanto, z=1,64.

    Assim, o intervalo de confiana para p ser:

    (1) (;0,90)

    ppICp pz

    n

    0,47(10,47)

    (;0,90)0,471,64 0,470,040,43;0,51380

    ICp

    (b) Suponha agora que o centro decida que um intervalo de confiana, com coeficiente de 90%

    para p, deve ter comprimento 0,05. Voc acha que os dados do item (a) atingem esse

    objetivo? Justifique e comente.

    Os dados do item (a) no atingiram o objectivo, j que, o intervalo obtido no item (a) tem

    comprimento igual a 0,08.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 45

    Para que o objectivo seja atingido, deveramos ter comprimento 0,05.

    Para diminuir o comprimento do intervalo, necessrio diminuir o erro, ou seja,

    Comprimento 0,05 = 0,025.

    Para um erro menor, necessrio aumentar o tamanho da amostra para:

    *

    *

    0,47(10,47)1,64 0,025n

    n

    =1072.

    Assim, os dados do item(a) atingem os objectivos se o nmero de telespectadores

    entrevistados aumentar para 1.072.

    Os dados do item (a) no atingem o objectivo, somente se o nmero de telespectadores

    entrevistados aumentar para 1072, ou seja:

    Comprimento = 0,05 = 0,025.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 46

    Exerccios

    1. Seja X1, X2, ..., X6, variveis aleatrias independentes, identicamente distribudas de forma

    normal com a mdia, e varincia, 2 . Defina os seguintes estimadores:

    a) 5

    3 53211

    XXXX b)

    4 43212

    XXXX

    c) 4

    2 43213

    XXXX d)

    6 543214

    XXXXX

    e) 5

    543215

    XXXXX

    Diga qual desses estimadores no viciado e qual o mais eficiente.

    2. Sejam X1 = 25, X2 = 30, X3 = 27, X4 = 35, X5 = 40, as idades dos estudantes duma turma

    do DMI (Departamento de Matemtica e Informtica).

    a) Com base nesses dados determine a idade mdia da turma.

    b) Forme todas as amostras de tamanho trs e calcule as mdias de cada amostra e

    comprove que XE e n

    X2

    ]var[

    .

    c) Quantas amostras de tamanho 4 so possveis formar? Forme essas amostras e repita o

    exerccio da alnea b).

    3. Determine a distribuio por amostragem da diferena entre duas mdias amostrais, isto

    determine 21 XXE e 21var XX .

    4. Mostre que a varincia amostral 2S um estimador no enviesado (no viciado da

    varincia da populao 2 .

    5. Num estudo sobre a relao existente entre uma atitude de criana e a idade na qual ela

    fala primeiro, os pesquisadores registaram a idade (em meses) da primeira fala da criana e

    o nmero de pontos (escore) obtido pela criana num teste sobre a atitude. Seguem-se os

    dados para 21 crianas:

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 47

    criana 1 2 3 4 5 6 7 8 9 10 11

    Idade 15 2 10 9 15 20 18 11 8 20 7

    Escore 95 71 83 91 102 87 93 100 104 94 113

    Criana 12 13 14 15 16 17 18 19 20 21

    Idade 9 10 11 11 10 12 42 17 11 10

    Escore 96 83 84 102 100 105 57 121 86 100

    a) Fazendo o uso da tabela de nmeros aleatrios seleccione uma amostra de tamanho 8. Inicie

    a sua leitura da tabela em anexo na linha um, coluna dois. A leitura deve ser feita atravs das

    colunas.

    b) Com base na sua amostra determine:

    (i) a idade mdia da primeira fala;

    (ii) o nmero mdio de pontos (escores) dessa amostra e a sua varincia;

    (iii) estime o nmero total de pontos para a populao em estudo;

    (iv) estime o erro padro da estimativa do total e, d o intervalo de confiana de 95%

    dessa estimativa.

    6. Numa Biblioteca Privada, os livros esto arrumados em 130 estantes de igual tamanho. Duma

    amostra aleatria de 15 estantes deu as seguintes quantidades de livros em cada estante:

    28, 23, 25, 33, 31, 18, 22, 29, 30, 22, 26, 20, 21, 28, 25

    a) Estimar o valor total de livros dessa biblioteca e o intervalo de confiana dessa estimativa do

    total.

    b) Suponha agora que o resultado da estimativa no suficientemente correcto e pretendemos ser

    95% certos de que a estimativa do do total duma amostra aleatria esteja a 100 de unidades

    do valor verdadeiro. Quantas estantes devero ser inclusos na amostra?

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 48

    7. Num sector particular duma fbrica foi realizado um inquerido para tentar investigar at que

    ponto o absentismo no este ligado com doenas ou frias oficiais. Uma amostra de 500

    pessoas, num total de 36000 trabalhadores foi perguntada sobre o nmero de dias que eles

    j tinham solicitado para descansar, nos anteriores seis meses.

    Os resultados do inqurito foram os seguintes:

    No. De dias de licena 1 2 3 4 5 6 7 8 9 10

    No. De trabalhadores 157 192 90 31 18 5 2 40\ 0 1

    a) Estimar o nmero total de licenas solicitadas, o o erro padro e o respectivo intervalo

    confiana de 95% dessa estimativa.

    b) Repita o mesmo exerccio pra uma amostra de1000.

    8. Uma amostra aleatria simples de 30 Agregados Familiares (AF) foi seleccionada em uma

    zona urbana que contem 14848 AFs. O nmero de pessoas (membros do AF) em cada um

    dos AFs que integram a mostra o seguinte:

    3, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2, 4, 3, 4, 2, 4.

    a) Estimar o nmero total de pessoas que vivem na zona.

    b) Calcular a probabilidade de que essa estimativa esteja dentro do limite de 10% do valo

    real.

    9. Numa populao em que N = 6, os valores de yi so 8, 3, 1, 11, 4 e 7.

    a) Calcular o valor mdio amostral y para todas as possveis amostras simples de tamanho 2.

    Provar que um estimador y no viciado (sem tendncia) de Y .

    b) Dada a mesma populao, calcular 2s para todas as amostras aleatrias simples de tamanho

    3 e provar que 22 ][ SsE .

    10 Duma populao de 2400 estudantes residentes fora da residncia universitria, foram

    escolhidas duas amostras independentes (sem reposio) de tamanhos 200 e 450

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 49

    respectivamente. Cada estudante foi perguntado sobre a distncia entre a sua casa e a

    universidade. Os resultados amostrais foram os seguintes:

    14.51 y 90.42 y

    87.321 s 02.42

    2 s

    Calcule o intervalo de confiana aproximado de 99% para a distncia mdia entre a

    universidade e a zona de residncia dos estudantes.

    11.Sabe-se que duma populao de tamanho N = 430 unidades, 19Y e 6,852 S . Qual o

    tamanho da amostra necessria para estimar Y com a probabilidade de 10% e a margem de

    erro de 1,9.

    12.O instituto Internacional de Democracia pretende realizar um inqurito nalguns distritos do

    pas com objectivo de determinar a percentagem de pessoas que tm uma certa percepo

    sobre democracia. O nmero total da populao (Universo) em causa N = 50000 pessoas.

    a) Determine o tamanho da amostra necessrio para a realizao deste levantamento por

    amostragem, com um erro aceitvel de 5% e com um intervalo de confiana de 95%.

    b) Alteraes haver no tamanho da amostra se o intervalo de confiana for de 90%?

    13.Numa Amostra Aleatria simples de tamanho 100, duma populao de tamanho 500, existem

    37 unidades na classe C. Determine o intervalo de confiana de 95% da proporo para o

    nmero total de unidades em C na populao

    14. Pretende se realizar um inqurito ao Agregados familiares com o objectivo de determinar a

    proporo de famlias que possuem certos atributos. Numa populao com 4000 Agregados

    familiares, qual o tamanho da amostra necessrio para determinar P, com uma margem de erro

    de 5% com 95% de confiana?

    a) Se sabe de estudos anteriores de que a proporo p = 30%.

    b) Se o valor p desconhecido?

    15.Os dados seguintes mostram a estratificao de todas as empresas agrcolas, de acordo com

    o tamanho da farma e o nmero mdio de hectares de milho por farma em cada estrato.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 50

    Tamanho

    da farma

    Nmero

    de Farmas

    Mdia

    de milho

    Desvio

    Padro

    hN hY hS

    0- 40 394 5.4 8.3

    41-80 461 16.3 13.3

    81-120 391 24.3 15.1

    121-160 334 34.5 19.8

    161-200 169 42.1 24.5

    201-240 113 50.1 26.0

    241 - 148 63.8 35.2

    Total ou

    mdias

    2010 26.3

    Para uma amostra de 100 farmas, calcule o tamanho da amostra para cada estrato, usando:

    a) A alocao proporcional;

    b) A alocao ptima

    16. Um amostrista pretende seleccionar uma amostra aleatria estratificada e suspeita que os

    custos do trabalho de campo sero da forma hhnC . As estimativas das quantidades relativas

    para os dois estratos so:

    Estrato hW hS hC

    1 0.4 10 $4

    2 0.6 20 $9

    a) Determine valores de nn /1 e nn /2 que minimizam o custos para dado valor de estyVar .

    b) Determine o tamanho da amostra necessrio, para esta alocao, de modo que .1estyVar

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 51

    Capitulo 2: INTEVALO DE CONFIANCA

    Introduo

    Intervalo de confiana uma tcnica para se fazer inferncia estatstica. Ou seja, a

    partir de um intervalo de confiana, construdo com elementos amostrais, pode-se inferir sobre um

    parmetro populacional.

    A lgica da construo de intervalos de confiana a seguinte:

    Seja um parmetro populacional;

    Seja um estimado de q.

    Conhecida a distribuio de probabilidade de , possvel construir um intervalo:

    1 2

    que contm , e se exigir que a probabilidade do intervalo seja de (1 ) = nvel de

    confiana.

    Geralmente (1-).100=90%, 95%, 99%, .

    Esta tcnica diferencia-se da estimao por ponto, onde se calcula um nico valor (estimativa)

    para o parmetro populacional. No caso do intervalo de confiana busca-se um segmento, ou

    intervalo 1: 2 que contm o parmetro desconhecido.

    Por exemplo, retira-se uma amostra de 500 Moambicanos e calcula-se a mdia de suas alturas

    encontrando-se 1,66 m. Logo, uma estimao pontual da verdadeira altura mdia (m) dada

    por x =1,66 m. J atravs do intervalo de confiana poder-se-ia encontrar um intervalo, por

    exemplo [1,58; 1,68] que, em 95% das vezes, incluiria (a verdadeira altura mdia dos

    Moambicanos).

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 52

    2.1 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL QUANDO A VARINCIA (2) CONHECIDA

    Como se sabe, o estimador de X . Tambm conhecida a distribuio de probabilidade de

    X :

    X ~N(;

    ) para as populaes infinitas

    X ~N(;

    ) para as populaes finitas

    Assim, para o caso de populaes infinitas, a varivel padronizada de X ser:

    Z=

    Fixando se um nvel de confiana: 1- tem se:

    Ou seja:

    P( -Z/2ZZ/2)=1-

    Substituindo se o valor de Z,

    P(-Z/2

    Z/2)=1-

    Resolvendo -se as duas inequaes para , tem-se o intervalo de confiana para a mdia

    populacional () quando a varincia (2) conhecida:

    P( X -Z/2

    X +Z/2

    )

    Exemplo:

    A durao da vida de uma pea de equipamento tal que = 5 horas.

    Foram amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se construir um

    intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95%.

    Resolucao:

    Do problema se tem: = 5; n = 100; X = 500; (1 a).100 = 95%

    Z/2=1.96

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 53

    Lembre-se que para descobrir a abcissa 1,96, entrou-se na tabela com 0.475= 47.5%, j que a

    tabela da faixa central.

    Substituindo se os dados na formula:

    P(500-1,96.

    500+1,96.

    ) =95%

    Efectuando os clculos:

    P(499.02500.98)=95%

    que o intervalo solicitado.

    A interpretao desse resultado dada por:

    O intervalo [499,02; 500,98] contm a durao mdia da pea com 95% de confiana. Isto

    significa que se forem construdos intervalos dessa mesma maneira, para um grande nmero de

    amostras, em 95% dos casos tais intervalos incluiriam.

    Para o caso de populaes finitas usa-se a seguinte frmula:

    P( X -Z/2

    X +Z/2

    )=1-

    Um intervalo unilateral de 100(1-)% com limite superior estabelecido a partir de:

    X +Z

    Um intervalo unilateral de 100(1-)% com limite inferior estabelecido a partir de:

    X -Z/2

    ERRO DE ESTIMACAO

    O intervalo de confiana bilateral tem a forma;

    X Z/2

    Aumentando a amplitude do intervalo, aumenta se o nvel de confiana do intervalo, no entanto,

    aumenta se o erro mximo de estimacao que o valor absoluto da diferena entre o parmetro

    amostral ( X ) e o parametro papulacional(), representado como =| X |.

    Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual a

    metade da amplitude do intervalo.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 54

    Como X Z/2

    , pode se escrever X erro

    Logo = Z/2

    n= (

    )2

    Logo, o tamanho da amostra depender:

    do grau de confiana;

    da disperso na populao ;

    dee certo valor especifico para o erro tolervel.

    2.2 INTERVALO DE CONFIANA PARA A MDIA () QUANDO A VARINCIA (2) DESCONHECIDA

    O processo para se obter o intervalo de confiana semelhante quele mostrado no item

    anterior. Como no se conhece , porm, preciso substitu-lo por S (desvio-padro amostral)

    que, contrariamente a , uma varivel aleatria. Da se

    ter o quociente entre duas variveis aleatrias, X e S, pois:

    Pode-se demonstrar que:

    t=

    Tem distribuio t de Student com (n 1) graus de liberdade.

    Fixando-se um nvel de confiana: 1 tem-se:

    P( -Z/2ZZ/2)=1-

    Substituindo se o valor de t e resolvendo -se as duas inequaes para , obtm-se o intervalo

    para a mdia quando a varincia (2) desconhecida.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 55

    P( X -t/2

    X +t/2

    )=1-

    Onde a varivel t possui (n 1) graus de liberdade.

    Exemplo:

    A amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao normal. Construir um

    intervalo de confiana para a mdia a nvel de 95%.

    Resolucao:

    Calculando-se a mdia e o desvio-padro da amostra obtm-se: X = 8,7 e S = 2.

    Como: 1 - = 95% e g. l. = = n 1 = 10 1 = 9

    t/2=2.2622 (tabela)

    Logo

    P(8.7-2.2622.

    8.7+2.2622.

    )=95%

    Ou

    P(7.2710.13)=95%

    A interpretao desse resultado dada por:

    O intervalo [7,27; 10,13] contm a verdadeira mdia com 95% de confiana.

    Para o caso de populaes finitas usa-se a seguinte frmula:

    Para o caso de populaes finitas usa-se a seguinte frmula:

    P( X -t/2

    X +t/2

    )=1-

    2.3 INTERVALO DE CONFIANA PARA A VARINCIA O estimador de 2 S2.

    Demonstra-se que )

    tem distribuio qui-quadrado com (n 1) graus de liberdade. Ou

    seja:

    n-1 )

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 56

    Ento, substituindo-se o valor de 2, e isolando-se 2 obtm-se o seguinte intervalo:

    P( )

    )

    )

    Exemplo:

    Admita n = 10, S2=4 e que se deseja construir um IC para a varincia a nvel de 90%

    Resolucao:

    Tem se n=10, S2=4, (1-).100=90% e =(n-1)=(10-1)+9

    Consultando-se a tabela de distribuio qui-quadrado:

    Logo:

    P(

    )=90%

    P(2,13 )=90%

    A interpretao que o intervalo [2,13; 10,81] contm a verdadeira varincia com 90% de

    confiana.

    2.4 INTERVALO DE CONFIANA PARA O DESVIO-PADRO

    Como o desvio-padro a raiz quadrada da varincia, pode-se usar a seguinte: frmula:

    P( S. )

    )

    )=1-

    Com a distribuio qui-quadrado de parmetros: = (n 1).

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 57

    A interpretao segue o modelo j apresentado.

    2.5 INTERVALO DE CONFIANA PARA PROPORO f o estimador de e tem distribuio dada por:

    f (

    )

    f (

    )

    Assim, para o caso de populaes infinitas, a varivel padronizada de f dada por:

    Z=

    Fixando-se um nvel de confiana 1 a tem-se:

    P( -Z/2ZZ/2)=1-

    Substituindo-se o valor de Z:

    P( -Z/2

    Z/2)=1-

    Isolando-se do denominador, encontra-se:

    P(f-Z/2

    f+

    )=1-

    Para amostras grandes (n > 30) pode-se substituir p e q = (1 p) do radicando por f e (1 f).

    Assim, o IC para a proporo ser:

    P(f-Z/2 )

    f+

    )

    )=1-

    Para o caso de populaes finitas o IC ser:

    P(f-Z/2 )

    f+

    )

    )=1-

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 58

    Exemplo: Examinadas 500 peas de uma grande produo encontrou-se 260 defeituosas. No

    nvel de 90% construir um IC para a verdadeira proporo de peas defeituosas.

    Tem-se: n = 500, p = 260, 1 - a = 90%.

    Logo:

    f=

    =

    =0.52

    Z/2=1.64

    Ento, o IC ser:

    P(0.52-1.64 )

    (0.52+1.64

    )

    =1-

    Ou

    P(0.483 )

    Ou ainda

    P(48.3% )

    E a interpretao de que o intervalo [44,8%; 55,2%] contm a verdadeira percentagem (ou

    proporo) de peas defeituosas.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 59

    Capitulo3: TESTE DE HIPTESES

    INTRODUO

    Teste de Hipteses uma tcnica para se fazer inferncia estatstica. Ou seja, a partir

    de um teste de hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.

    No caso das inferncias atravs dos IC, busca-se cercar o parmetro populacional

    desconhecido. Aqui formula-se uma hiptese quanto ao valor do parmetro populacional, e pelos

    elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.

    CONCEITO DE HIPTESE ESTATSTICA Hiptese estatstica uma suposio quanto ao valor de um parmetro populacional, ou quanto

    natureza da distribuio de probabilidade de uma varivel populacional.

    Nesta sesso trabalharemos apenas com os testes referentes aos parmetros da populao.

    So exemplos de hipteses estatsticas:

    a) A altura mdia da populao Moambicana 1,65m, isto : H: = 1,65 m;

    b) A varincia populacional dos salrios vale 2.0002mt, isto : H : 2= 2.000 2mt

    c) A proporo de Maputenses com a doena X 40%, ou seja: H: = 40%;

    d) A distribuio dos pesos dos alunos da nossa faculdade normal;

    e) A chegada de navios ao porto de Nacala descrita por uma distribuio de Poisson.

    3.1 TESTE DE HIPTESES E TIPOS DE HIPTESE

    Teste de hipteses uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com

    base nos elementos amostrais.

    Uma hiptese pode ser definida como uma afirmativa sobre a populao.

    Por exemplo, um psiclogo pode levantar a hiptese de que as meninas tm melhor desempenho

    verbal do que os meninos, ou um mdico pode levantar a hiptese de que os fumantes vivem

    menos do que os no-fumantes. O testes de hipteses permitem estabelecer se tais afirmativas

    so confirmadas pelos dados disponveis.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 60

    A primeira hiptese denominada hiptese nula e a segunda denominada hiptese

    alternativa. Indica-se a primeira hiptese por H0 (l-se agzero) e a segunda por H1 (l-se ag-

    um). Escreve-se: H

    H0:as mdias so iguais H

    H1 as mdias so diferentes

    Para decidir por uma das hipteses isto , para decidir se as mdias na populao so, ou

    no so, iguais o pesquisador submete os dados da sua amostra a um teste de hipteses. Mas

    em que consiste este teste? O pesquisador supe que as mdias, na populao, so iguais. Se

    sob essa hiptese for pouco provvel ocorrer uma diferena de mdias to grande ou maior

    do que a que se observou na amostra, o pesquisador rejeita a hiptese inicial e conclui que as

    mdias, na populao, so diferentes.

    Exemplo:

    Um professor quer saber se dois mtodos de alfabetizao, A e B, tm a mesma eficincia. Na

    amostra, as mdias das notas dos alunos foram 5,0 para o mtodo A e 7,0 para o mtodo B. Se

    sob a hiptese de que, na populao, as mdias so iguais for pouco provvel ocorrer, na

    amostra, uma diferena de dois pontos ou mais entre mdias, lgico rejeitar a hiptese inicial e

    concluir que B mais eficiente do que A.

    Mas preciso insistir neste ponto pouco provvel no significa impossvel. Ento, o

    pesquisador pode cometer erro quando conclui que, na populao, as mdias so diferentes s

    porque seria pouco provvel ocorrer uma diferena de mdias to grande, ou maior do que a

    que ele prprio observou, se as mdias da populao fossem iguais. O pesquisador no sabe se

    est ou no cometendo esse tipo de erro, embora a probabilidade de ocorrer o erro seja

    conhecida. o que os estatsticos denominam nvel de significncia do teste (probabilidade de

    rejeitar H0 quando H0 verdadeira).

    Finalmente, toda vez que se rejeita H0, ao nvel de significncia de 5%, usual afirmar que o

    resultado significante e indicar isso com um asterisco. Quando se rejeita H0 ao nvel de

    significncia de 1%, usual afirmar que o resultado altamente significante e indicar isso com

    dois asteriscos.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 61

    O exemplo a seguir mostra diferentes tipos de testes de hipteses.

    Exemplo:

    a) H0: =1.65m

    H1: 1.65m Dar origem a um teste bicaudal

    b) H0: =1.65m

    H1: 1.65m Dar origem a um teste unicaudal direita

    c) H0: =1.65m

    H1: 1.65m Dar origem a um teste unicaudal esquerda

    3.2 TESTES DE SIGNIFICNCIA Os testes de significncia so os mais usados nas pesquisas educacionais, scio-econmicas, etc.

    O procedimento para realizao dos testes de significncia resumido nos seguintes passos:

    1) Enunciar as hipteses H0 e H1;

    2) Fixar o limite de erro a, e identificar a varivel de teste;

    3) Com o auxlio das tabelas estatsticas, considerando e a varivel do teste, determinar a RC

    (regio crtica) e RA (regio de aceitao) para H0

    4) Com os elementos amostrais, calcular o valor da varivel do teste;

    5) Concluir pela aceitao ou rejeio de H0 pela comparao do valor obtido no passo

    anterior com RA e RC.

    3.2.1 TESTE DE SIGNIFICNCIA PARA MDIAS

    1) H0: =0

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 62

    H1: Uma das alternativas

    0 (a)

    0 (b)

    0 (c)

    2) Fixar . Admitindo-se que 2 desconhecida, a varivel do teste ser t de

    Student, com = (n 1).

    3) Com auxlio da tabela t determinam-se RA e RC.

    4) Clculo do valor da varivel

    onde:

    X = Media amostral

    0= Valor da hiptese nula

    S= desvio padro amostral

    n = tamanho da amostra

    5) Concluses

    a) Se -t/2 tcal t/2 no se rejeita H0

    Se tcal> t/2 ou tcal t rejeita se H0

    c) Se tcal -t no se rejeita H0

    Se tcal

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 63

    Resoluo

    1) H0: =1.65m

    H1: 1.65m

    2) = 0,05

    Varivel t com 19 graus de liberdade.

    3) t/2=2,093

    4)

    =0,67

    5) Como 2,093 tcal 2,093, no se pode rejeitar H0: = 115 com esse nvel de

    significncia.

    3.2.2 TESTE DE SIGNIFICNCIA PARA VARINCIAS 1) H0: 2= 20

    H1: 2 20 (a)

    2>20 (b)

    2< 20 (c)

    2) Fixar . Escolher a varivel qui-quadrado com = (n 1).

    3)

    4) Com auxlio da tabela 2 determinam-se RA e RC.

    5) Clculo do valor da varivel

    )

    onde:

    n = tamanho da amostra;

    S2= varincia amostral;

    2 = valor da hiptese nula.

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 64

    6) Conclusoes:

    a) Se 2inf 2cal 2sup no se pode rejeitar H0

    Se 2cal> 2sup ou 2cal < 2inf rejeita se H0

    b) Se 2cal 2sup no se pode rejeitar H0

    Se 2cal> 2sup rejeita se H0

    c) 2ca 2inf no se pode rejeitar H0

    2ca 2inf rejeita se H0

    Exemplo: Para testar a hiptese de que a varincia de uma populao 25, tirou-se uma

    amostra aleatria de 25 elementos obtendo se S2=18,3. Admitindo-se = 0,1, efectuar o teste

    de significncia unicaudal esquerda.

    Resolucao:

    1) H0: 2= 25

    2< 25

    2) = 0,01; varivel 2 com 25-1=24 graus de liberdade

    3) 2inf=15.7

    4) 2cal= )

    =17,56

    5) Como 2cal> 15.7, no se pode rejeitar H0: 2= 25 ao nvel de significncia de 10%.

    3.2.3 TESTE DE SIGNIFICNCIA PARA PROPORES 1) H0: p=p0

    H1: Uma das alternativas

    p=p0 (a)

    p>p0 (b)

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 65

    p Z/2 ou Zcal Z regeita se H0

    c) Se Zcal Z no se pode rejeitar H0

    Se Zcal Z rejeita se H0

    Exemplo:

    As condies de mortalidade de uma regio so tais que a proporo de nascidos que

    sobrevivem at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos

    amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.

    1) H0: p=0.6

    H1: p

    2) =0.05 e a varivel escolhida, a normal (0;1).

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 66

    3) RA e RC

    Z/2=1.96

    4) Zcal=

    )

    =

    )

    =-4,51

    5) Como Zcal , todavia, o mais comum

    2) Fixar . Escolher a varivel F com (n1 1) graus de liberdade no numerador, e (n2 1)

    graus de liberdade no denominador.

    3)

    4) Com auxlio da tabela da distribuio F, determinam-se RA e RC.

    =(n-1)

    5) Clculo do valor da varivel

    Fcal=

    6) Concluses

    Se Fint Fsup no se pode rejeitar H0;

    Se Fcal > Fsup ou Fcal < Fint, rejeita se H0

    Exemplo

    Dois programas de treinamento de funcionrios foram efectuados. Os 21 funcionrios treinados no programa antigo apresentam uma varincia 146 em suas taxas de erro. No novo programa,

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 67

    13 funcionrios apresentaram uma varincia de 200. Sendo = 0,1, pode-se concluir que a varincia diferente para os dois programas?

    1) H0: 21= 22

    H1: 21 22

    2) = 0,1. A varivel F com 1=n1-1=20 e 2=n2-1=12

    3) RA e RC

    Fint=0,43 e Fsup=2.54

    4) Fcal=

    =

    =0.73

    5 Como 0,43 Fcal2.54, no se pode rejeitar H, portanto, no se pode concluir que as varincias sejam diferentes em esse nvel de significncia.

    3.2.5 TESTE DE SIGNIFICNCIA PARA A IGUALDADE DE DUAS MDIAS

    1 Caso: As varincias so conhecidas, independentes e normais.

    1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.

    H1: 1 2 ou 1-2 d

    2) Fixar . Escolher a varivel normal padro: Z.

    3) Com auxilio da tabela da distribuicao normal padro, determinar RA e RC.

    4) Clculo do valor da varivel

    Zcal =( X X )

    5) Conclusoes

    Se -Z/2ZcalZ/2 no se pode regeitar H0;

    Se Zcal> Z/2 ou Zcal

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 68

    Exemplo

    Um fabricante de pneus produz dois modelos. Para o modelo A, = 2500 milhas, e para o

    modelo B, = 3000 milhas. Um txi testou 50 pneus do modelo A e 40 do modelo B, obtendo

    24000 milhas e 26000 milhas de durao mdia dos respectivos modelos. Adoptando-se um

    risco = 0,04 testar a hiptese de que a vida mdia dos dois modelos a mesma.

    Resolucao:

    1) H0: A=B

    H1: A B

    2) =0.04, a varivel N(0;1)

    3) RA e RC

    Z/2=2.05

    4) Zcal =

    =-3,38

    5) Como Zcal 0 uma diferena admitida entre as medias.

    H1: 1 2 ou 1-2 d

    2) Fixar . Escolher a varivel t, com =(n1+n2-2)

    3) Com auxlio da tabela da distribuio t, determinam-se RA e RC.

    4) Clculo do valor da varivel

  • Inferncia Estatstica

    Autor: Filipe Mahaluca [email protected] 69

    tcal =( X X )

    5) Concluses

    Se -t/2tcalt/2 no se pode rejeitar H0;

    Se tcal> t/2 ou tcal < -t/2 , rejeita se H0.

    Exemplo: Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A

    registou uma mdia de 80 com um desvio de 5 em 5 partes. O tipo B, uma mdia de 83 com um

    desvio de 4 em 6 partes. Adoptando-se = 0,05 testar a hiptese da igualdade das mdias.

    Resolucao:

    1) H0: A=B

    H1: A B

    2) =0,05 e a varivel t