Estatística Inferencial

download Estatística Inferencial

of 59

description

Robson Dyodi

Transcript of Estatística Inferencial

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 1

    Sumrio

    Captulo 3 - Inferncia Estatstica ............................................................................................ 2

    3.1. Estimadores ..................................................................................................................... 2

    3.2. Intervalos de Confiana ................................................................................................. 7

    3.3. Erro amostral e Tamanho da Amostra ...................................................................... 19

    3.4. Teste de Hipteses ....................................................................................................... 23

    3.5. Probabilidade de Significncia, Nvel Descritivo do Teste ou p-valor .................. 31

    3.6. Teste de Hipteses para Propores com Qui-Quadrado ..................................... 32

    3.7. Regresso e Correlao .............................................................................................. 35

    3.8. Amostragem .................................................................................................................. 57

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 2

    Captulo 3 - Inferncia Estatstica

    Ao estudar a estatstica descritiva, o nosso objetivo era resumir um conjunto de dados atravs das medidas resumo. A inferncia estatstica muito parecida com a estatstica descritiva, mas neste caso, estamos trabalhando com amostras. No mundo real, muitas vezes fica difcil de analisar todos os dados de uma populao e, para contornar a situao, utilizam-se amostras desta populao. No entanto, as pessoas devem saber analisar se os resultados da amostra foram ou no condizentes com o valor real da populao. Ento, utiliza-se a inferncia estatstica para podermos inferir algo sobre a populao atravs da amostra.

    Antes de iniciar o estudo sobre o tema, quero alertar para um problema prtico que

    ocorre na hora da prova. Alm do assunto ser muito parecido com o da estatstica descritiva, a inferncia utiliza a distribuio normal como principal instrumento. Assim, como saber no decorrer da prova que se trata de inferncia, de probabilidade ou de estatstica descritiva, uma vez que as frmulas so diferentes e a escolha errada ocasionar um erro na questo? A minha dica o seguinte: se o enunciado mencionar a palavra amostra devemos trabalhar com a inferncia estatstica; se o enunciado mencionar populao, ou no mencionar nada, usaremos as frmulas dos captulos 1 e 2.

    3.1. Estimadores

    Enquanto as caractersticas da populao so chamadas de parmetros, as

    caractersticas da amostra so chamadas de estatsticas (ou estimativas). Por exemplo, a mdia dos pesos de uma populao de cachorros num canil igual a 10kg (como estamos calculando a mdia da populao, temos um parmetro); por outro lado, a estatstica mdia amostral de uma certa amostra dessa populao igual a 9kg. Dizemos que o parmetro mdia da populao igual a 10kg e a estatstica mdia amostral igual a 9kg.

    O primeiro ponto fundamental entender que os parmetros no mudam de valor,

    enquanto a estatstica (ou estimativa) poder variar de valor em cada amostra diferente. Como assim?

    Suponha que uma populao seja constituda de 4 pessoas: Alessandro, Bruno, Carla

    e Dbora. Queremos analisar os pesos deste grupo de pessoas (Alessandro possui 80 kg, Bruno 90kg, Carla 50kg e Dbora 60kg). O parmetro mdia da populao igual a 70kg, no importa quantas vezes faamos a pesagem dos 4 elementos. Agora, se utilizssemos amostras, a estatstica mdia amostral ir variar de valor dependendo da amostra: escolher Bruno, Carla e Dbora gerar um resultado diferente para a estatstica mdia amostral do resultado obtido se escolhssemos Alessandro, Bruno e Carla. Alessandro: 80 kg Bruno: 90 kg Carla: 50 kg Dbora: 60 kg

    Mdia da populao:

    Amostra 1 (Alessandro e Bruno):

    Amostra 2 (Bruno e Carla):

    Amostra 3 (Dbora e Carla):

    Perceberam que no caso de amostras, a mdia pode variar? Para cada amostra

    diferente, temos que calcular a mdia novamente.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 3

    Para calcular o valor da estatstica, precisamos de um estimador (que nada mais do que uma frmula algbrica). Veremos agora quais so os principais estimadores utilizados, comparando-os com as frmulas do captulo 1:

    Populao possui parmetros Amostra possui estatsticas (ou estimativas), que so calculadas atravs de um estimador

    Mdia:

    Mdia:

    Varincia 1 frmula:

    Varincia 1 frmula:

    Varincia 2 frmula:

    Varincia 2 frmula:

    Proporo:

    Onde Y o total de elementos portadores da caracterstica na populao

    Proporo:

    Onde Y o total de elementos portadores da caracterstica na amostra

    Que tipo de informao podemos tirar do quadro acima? Em 1 lugar, as notaes

    utilizadas para populaes e amostras so diferentes. Mas, Dyodi...acho que isso muito detalhe! No deve cair na prova, ainda mais que eu no sou formado em estatstica.... Cai na prova sim e bom decorar. Pare um pouco, respire, estamos quase no final da apostila. No desista, pois se voc estudou tudo direitinho at aqui, eu posso dizer que milhares de candidatos j ficaram para trs. J vamos ver um exerccio cobrado pela ESAF para candidatos que no possuem formao em estatstica.

    Em 2 lugar, as frmulas de mdia e proporo so iguais tanto para amostras quanto

    para populao. Isso quer dizer que podemos utilizar a mesma frmula tanto para a estatstica descritiva quanto para a inferncia estatstica. Assim, a nica frmula nova que devemos decorar a da varincia amostral. Viu como os assuntos esto interligados e muitas frmulas utilizadas neste captulo voc j tinha decorado desde o captulo 1? A sua persistncia ser recompensada!

    Exerccio resolvido sobre parmetros e estimadores: (ESAF - 2006 - Sefaz CE - Analista de TI) A mdia aritmtica discreta de uma populao qualquer dada pela seguinte formulao:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 4

    Letra C Resoluo: Como o enunciado menciona populao, estamos trabalhando com estatstica descritiva. A notao utilizada para a mdia de uma populao letra grega , ento podemos descartar as alternativas B e D. A letra A no tem nada a ver e a letra E representa a varincia amostral com notao errada e denominador errado, restando a letra C que a alternativa correta.

    Exerccio resolvido sobre varincia amostral: (FCC - 2010 - Sefaz SP APOF) Seja uma amostra aleatria simples extrada de uma populao, com tamanho 10 e representada por Xi; i = 1, 2, ... , 10. Sabe-se que

    e

    A varincia desta amostra apresenta o valor de (A) 67,3 (B) 63,0 (C) 61,0 (D) 59,7 (E) 57,0 Letra E Resoluo: Voc se lembra do que eu disse sobre decorar a 2 frmula de varincia no captulo 1? O mesmo vale para a varincia amostral, e este um tipo de exerccio que s pode ser resolvido com a 2 frmula. Sabemos que a questo trata de inferncia estatstica porque o enunciado citou a palavra amostra. A 2 frmula da varincia amostral :

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 5

    Ento,

    Exerccio resolvido sobre varincia amostral:

    (ESAF - 2009 - Sefaz SP APOF) Considerando que as observaes apresentadas na questo anterior constituem uma amostra aleatria simples X1, X2, ..., Xn de uma varivel aleatria X, determine o valor mais prximo da varincia amostral, usando um estimador no tendencioso da varincia de X. Considere que:

    a) 90,57 b) 96,85 c) 94,45 d) 92,64 e) 98,73 Letra B Resoluo: A questo quer saber qual o valor da varincia. A chave do sucesso neste caso saber se devemos utilizar o denominador n ou o denominador n-1 para o clculo. Como o enunciado pediu a varincia amostral, devemos utilizar o n-1. Alm disso, como o enunciado tambm forneceu valores de somatrio, j sabemos de antemo que precisamos utilizar a 2 frmula da varincia. Assim:

    A alternativa correta a letra B.

    Exerccio resolvido sobre varincia amostral:

    (ESAF - 2009 - Receita Federal Analista) Obtenha o valor mais prximo da varincia amostral da seguinte distribuio de frequncias, onde representa o i-simo valor observado e a respectiva frequncia.

    a) 1,5. b) 1,225. c) 1,429. d) 1,39. e) 1, 4. Letra A

    Resoluo: O enunciado pediu o valor da varincia amostral, ento devemos utilizar o denominador n-1. Vamos calcular os somatrios para podermos utilizar a 2 frmula da varincia. Sabemos que a varivel assume os seguintes valores: 5, 6, 7, 8 e 9.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 6

    O valor 5 aparece duas vezes, o valor 6 aparece seis vezes, e assim por diante. Ento:

    Exerccio resolvido sobre varincia amostral: (ESAF 2012 Receita Federal Analista) A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a a) 3. b) 2. c) 1. d) 4. e) 5. Letra B Resoluo: Falou em varincia amostral, n-1 no denominador. Como so seis nmeros, n igual a 6.

    Voc deve estar se perguntando por que o denominador da varincia amostral igual a

    (n 1) ao invs de n. Quando utilizamos um estimador para determinar o valor da estatstica desejada, queremos que o estimador possua algumas propriedades. Qualquer pessoa pode criar um estimador, mas ele ser bom para inferir algo sobre a populao? Para dizer se um estimador bom, ele deve possuir certas caractersticas:

    O estimador deve ser consistente

    O estimador deve ser no viesado, ou no tendencioso

    Um estimador no viesado, ou no tendencioso, quando o clculo de sua esperana resulta no valor do parmetro em anlise da populao. Se a mdia da populao for igual a 4, a esperana do estimador mdia amostral deve ser igual a 4, por exemplo.

    Um estimador consistente quando ele no viesado e, alm disso, a sua varincia se

    aproxima de zero quando o nmero de elementos da amostra tende ao infinito. Em provas da rea fiscal, creio que no deve haver cobrana sobre as caractersticas dos

    estimadores. Mas, como isso j foi tema de questo no concurso do ICMS/RJ em 2008, vou

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 7

    dizer o que acho que voc deve levar para a prova, com a ressalva de que muito pouco provvel que aparea em seu exame:

    Todos os estimadores que esto na tabela so consistentes, no viesados e de varincia mnima

    Um estimador mais eficiente do que outro quando sua varincia menor do que a do outro estimador

    Na varincia amostral, se, ao invs de (n 1), o denominador for igual a n, o estimador passa a ser viesado, ou tendencioso, e inconsistente

    Exerccio resolvido sobre caractersticas dos estimadores: (FGV - 2008 - Sefaz RJ Auditor) Considere uma Amostra Aleatria Simples de n unidades extradas de uma populao na qual

    a caracterstica, X, estudada tem distribuio Normal com mdia e varincia , ambas desconhecidas, mas finitas. Considere, ainda, as estatsticas mdia da amostra,

    , e a varincia da amostra

    . Ento, correto afirmar que:

    (A) e so, ambos, no tendenciosos para a estimao da mdia e da varincia da populao, respectivamente.

    (B) no-tendencioso, mas tendencioso para a estimao da mdia e da varincia da populao, respectivamente.

    (C) tendencioso, mas no-tendencioso para a estimao da mdia e da varincia da populao, respectivamente.

    (D) e so, ambos, tendenciosos para a estimao da mdia e da varincia da populao, respectivamente.

    (E) e so, ambos, no-tendenciosos para a estimao da mdia e da varincia da populao, mas apenas X consistente. Letra B Resoluo:

    Sabemos que um estimador consistente, no viesado e de varincia mnima. Logo, podemos descartar as letras C e D.

    Como o denominador igual a n, passa a ser viesado (tendencioso) e inconsistente. A nica alternativa que pode ser assinalada a letra B.

    3.2. Intervalos de Confiana

    No tpico anterior eu fiz questo de ressaltar a importncia de saber diferenciar as

    notaes dos parmetros e estimadores. Isso ser de grande valia para todo o resto do nosso

    estudo. Muitas vezes teremos que utilizar , , e na mesma frmula. Um pequeno deslize aqui poder levar ao erro da questo.

    Aprendemos que o objetivo da inferncia estatstica inferir algo sobre a populao

    atravs dos dados de uma amostra e o intervalo de confiana um dos meios para que possamos inferir algo sobre a populao. A metodologia do intervalo de confiana consiste basicamente em calcular um intervalo, atravs dos dados amostrais, para o verdadeiro valor do parmetro. Para clarear as idias, vamos analisar um exemplo.

    Suponha que estamos fazendo uma pesquisa que ir revolucionar o mercado de

    alimentos. Podemos ganhar muito dinheiro com isso, mas precisamos saber qual a mdia de peso dos jovens entre 20 e 30 anos de todo o Brasil. Concordam que praticamente impossvel fazer essa pesquisa com TODOS os jovens entre 20 e 30 anos do pas inteiro?

    Esse problema muito comum na vida real: impossvel obter um parmetro da

    populao, por questes de tempo, dinheiro, logstica etc. Voltando ao exemplo, vamos deixar de ganhar dinheiro? No, lgico que no! Basta colhermos uma amostra representativa e

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 8

    assim podemos inferir algo sobre a populao. Podemos continuar nossa pesquisa sobre o mercado de alimentos!

    Percebam o seguinte: no temos a mnima idia de qual a mdia de peso da

    populao, qual o valor correto. Lembrem-se de que a mdia da populao um parmetro, ou seja, um valor que no varia. No entanto, colhendo uma certa amostra, podemos calcular o valor dessa mdia amostral. At a tudo bem, pessoal? Ok, vamos em frente.

    Selecionamos 5000 pessoas com idade entre 20 e 30 anos de todo o pas e

    calculamos a mdia de seus pesos. Com essa mdia amostral calculada, podemos construir um intervalo de confiana para a mdia populacional. Por exemplo: Mdia populacional: no temos a menor idia de qual seja o seu valor Mdia amostral: 70 kg Intervalo de confiana de 90%: [60;80] kg O que esse intervalo quer dizer? Esse intervalo quer dizer que temos 90% de chance de a mdia populacional estar entre 60 e 80 quilos. Ns no sabemos qual o valor da mdia populacional. No entanto, se pudssemos calcular o seu verdadeiro valor, podemos afirmar que temos 90% de chance de esse valor estar entre 60 e 80 quilos. Perceberam para que serve o intervalo de confiana? um modo de poder afirmar algo sobre a populao, apenas com base em uma amostra. Agora, vamos aprender como se constri um intervalo de confiana.

    Para dar continuidade ao nosso estudo, devemos saber quais so os fatores que influenciam no clculo do intervalo:

    O nvel de confiana desejado intuitivo pensar que construir um intervalo com 90% de confiana deve ser diferente do que construir um intervalo com 80% de confiana; quanto maior o nvel de confiana, maior o intervalo;

    Varincia da populao um intervalo para uma populao com baixa variabilidade ser diferente de um intervalo para uma populao com alta variabilidade; alm disso, pode acontecer de no termos nenhuma informao sobre a variabilidade da populao;

    Tamanho da amostra tambm intuitivo pensar que construir um intervalo para uma amostra pequena difere da construo do intervalo para amostras consideravelmente grandes.

    Para concursos da rea fiscal, os exerccios podero cobrar intervalos de confiana

    para a mdia e para a proporo populacionais. Vamos aprender o passo a passo de cada uma.

    Se voc estiver cansado, pare um pouco e volte daqui a pouco. Essa uma parte da

    matria que necessita de mais concentrao. Apesar de ser fcil, ela s se torna fcil depois que voc parar de se confundir com o que ser dito. um pouco besta isso que eu falei, mas assim mesmo! A matria simples, mas pode confundir muitos candidatos que no estudaram direito os captulos anteriores. O intervalo de confiana para a mdia populacional ser estudado em 1 lugar, e depois faremos o passo a passo para os intervalos da proporo populacional. 1 caso: Intervalos para a mdia populacional

    Sabemos que a mdia populacional ( ) um parmetro, isto , no muda de valor. A mdia sempre ser aquilo e acabou! Agora, a mdia amostral ( ) ir variar de valor sempre que uma amostra diferente for escolhida. Alguns valores so mais provveis de acontecer do que outros, mas eles iro variar. Para ilustrar isso, suponha o seguinte conjunto de dados (populao):

    {1,5,5,5,5,6,15}

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 9

    A mdia populacional igual a 6. Se tomarmos uma amostra de 3 valores, mais

    provvel que o valor fique mais prximo de 5-6, mas pode ocorrer de ser maior ou menor do que isso. Tudo que varia de valor pode ser considerado uma varivel, com uma certa distribuio de probabilidades, ou seja, cada um dos valores possveis possui uma certa probabilidade de ocorrer.

    Ento, podemos ver que possui uma distribuio de probabilidades, ou seja, pode ser considerada uma varivel aleatria. U, mas no um nmero? Se a amostra for {5,5,5}, no ser igual a 5? Ento como voc pode dizer que a mdia amostral uma varivel aleatria? Como voc pode dizer que ela tem uma distribuio de probabilidades? Esse o ponto que confunde muita gente: uma varivel aleatria que possui uma distribuio de probabilidade (nvel macro), mas para cada amostra escolhida, possvel

    calcular (nvel micro). A mdia amostral deve ser vista sob estes 2 aspectos na resoluo dos exerccio: uma varivel aleatria de maneira geral, e um valor para uma amostra especfica.

    Ok, Dyodi. Entendi. Mas que distribuio essa? Eu preciso saber?. Surpresa! A distribuio de a distribuio normal. No tente entender, apenas saiba

    que existe um teorema chamado Teorema do Limite Central que diz que possui uma distribuio normal. isso que necessitamos saber.

    Para mostrar o passo a passo, devemos saber que o modo de resolver os exerccios

    ir variar dependendo das informaes fornecidas. Vamos ver numa tabela comparativa quais so as possibilidades:

    A varincia da populao conhecida A varincia da populao desconhecida

    Utilizaremos a distribuio normal Utilizaremos a distribuio t de Student

    A distribuio de ainda pode variar dependendo de outros fatores:

    Se a populao possui uma distribuio normal ou no

    Se o tamanho da amostra considerado grande ou pequeno

    Se a populao finita ou infinita

    Se h reposio ou no No entanto, nunca vi questes sobre estes outros fatores em uma prova que no seja

    especfica para o cargo de estatstico. Por este motivo, creio que devemos nos concentrar apenas na tabela acima. Iniciaremos com o caso de varincia populacional conhecida.

    Quando a varincia da populao ( ) conhecida, ter a seguinte distribuio:

    A informao do quadro acima uma das chaves para o sucesso nas questes

    de inferncia. Por favor, decorem esta informao. Assim, podemos dizer que possui uma distribuio normal com os seguintes parmetros:

    Mdia de :

    Varincia de :

    Isso quer dizer que a distribuio da mdia amostral ser uma normal com mdia igual

    ao valor do parmetro em anlise e com varincia igual varincia da populao dividida pelo nmero de elementos da amostra. Se a populao tiver varincia igual 9, por exemplo, e for escolhida uma amostra com 10 elementos, a mdia amostral ter a distribuio a seguir:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 10

    Observao: No estranhe o fato de ser desconhecido, porque isso faz todo o sentido. Se conhecssemos o verdadeiro valor de , no haveria lgica em tentar inferir algo sobre .

    Na verso antiga deste material, eu fiz a demonstrao de como chegar no intervalo de

    confiana. No entanto, creio que este no o nosso objetivo. Queremos apenas resolver as questes, pontuar de maneira rpida e efetiva, certo? Ento o que vamos fazer! Deixarei as demonstraes de lado e vamos direto para a resoluo.

    assim que voc vai decorar o intervalo de confiana:

    Intervalo de confiana para a mdia populacional: 1 termo: mdia amostral mais ou menos

    2 termo: z

    3 termo: desvio padro de (lembrem-se da informao chave)

    Pronto, acabou. Este o intervalo de confiana para a mdia populacional.

    Dyodi, que valor de z esse?. Esse valor ns vamos buscar nos dados do enunciado, na tabela normal. No tem que

    fazer clculo nenhum. Vamos resolver as questes para ficar mais claro.

    Exerccio resolvido sobre intervalo de confiana para mdias:

    (FCC - 2012 ISS SP - Auditor) Desejando-se estimar a mdia dos salrios de uma populao, que deve ser considerada de tamanho infinito, com desvio padro conhecido e igual a R$ 100,00, selecionou-se uma amostra aleatria de 100 elementos da populao que forneceu os resultados apresentados na tabela abaixo:

    Sabendo que x y = 2, e utilizando para a estimativa pontual de a mdia aritmtica dos 100 salrios apresentados, calculada considerando que todos os valores includos num intervalo de classe so coincidentes com o ponto mdio do intervalo, um intervalo de confiana para , com coeficiente de confiana de 95%, , em reais, dado por Se Z tem distribuio normal padro, ento: P(Z < 0,84) = 0,80, P(Z < 1,5) = 0,933, P(Z < 1,96) = 0,975, P(Z < 2,5) = 0,994 (A) (3410,40; 3449,60) (B) (3409,40; 3450,60) (C) (3400,40; 3439,60)

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 11

    (D) (3420,60; 3459,40) (E) (3410,00; 3450,00) Letra A Resoluo: Parece confuso? No confuso, precisamos ter frieza na hora da prova. O que a questo pede? Ela pede um intervalo de confiana para a mdia. Ento, precisamos encontrar:

    Agora, vamos ver quais dados o enunciado forneceu. O enunciado disse que a amostra tem 100 elementos: O enunciado tambm disse que o desvio padro populacional conhecido e igual a 10: Como o nvel de confiana de 95%, o valor de z igual a 1,96 (2,5% para a direita e 2,5% para a esquerda).

    Gente, a nica coisa que est faltando o valor de ! Todo o resto foi fornecido pelo enunciado!

    O enunciado diz que a mdia dos 100 salrios apresentados, ento vamos calcular. O 1 passo encontrar o valor de x e y. Sabemos que:

    E

    Resolvendo o sistema:

    Clculo da mdia:

    Assim, o nosso intervalo de confiana ser:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 12

    Exerccio resolvido sobre intervalo de confiana para mdias: Ateno: Para resolver questo, utilize os valores que julgar mais apropriados (observar sempre a melhor aproximao) da tbua da distribuio normal padro.

    (FCC 2013 Sefaz SP Auditor) A tabela abaixo apresenta a distribuio de frequncias de uma amostra aleatria de tamanho 100 da varivel X, que representa os percentuais de aumento do IPTU do ano de 2013 relativamente ao ano de 2012, num determinado municpio.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 13

    Suponha que X tem distribuio normal com mdia desconhecida, , e desvio padro conhecido e igual a 5%. Utilizando para a estimativa pontual de a mdia aritmtica dos 100 valores apresentados (na tabela acima), calculada considerando que todos os valores includos num intervalo de classe so coincidentes com o ponto mdio do intervalo, um intervalo de confiana para , com confiana de 95%, dado por (A) (15,64% ; 17,64%) (B) (15,66% ; 17,62%) (C) (15,60% ; 17,68%) (D) (15,34% ; 17,94%) (E) (15,68% ; 17,60%) Letra B Resoluo: Novamente, a questo pede o intervalo de confiana para a mdia. Temos que lembrar que o intervalo dado por

    Quais foram as informaes do enunciado? Desvio padro populacional conhecido e igual a 5: Tamanho da amostra igual a 100: Intervalo com nvel de confiana de 95%: (2,5% para a esquerda e 2,5% para a direita)

    Ento, s nos resta encontrar o valor de :

    O intervalo pedido :

    Exerccio resolvido sobre intervalo de confiana para mdias: (FGV - 2010 - SEAD AP Auditor) Uma amostra aleatria simples de tamanho 400 de uma varivel populacional normalmente distribuda com mdia desconhecida e varincia igual a 25 foi observada e indicou uma mdia amostral igual a 12,52. O intervalo de 95% de confiana para dado por: Dados: Se Z tem distribuio normal padro, P[0 < Z < 1,64] = 0,45 ;P[0 < Z < 1,96] = 0,475; P[0 < Z < 2,33] = 0,49

    (A) (12,03, 13,01) (B) (11,65, 13,39)

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 14

    (C) (10,99, 15,05) (D) (10,44, 15,60) (E) ( 9,99 , 16,05) Letra A Resoluo: O enunciado diz que a varincia populacional conhecida e seu valor igual a 25. Alm disso, o enunciado informa que a mdia amostral igual a 12,52. Resumindo as informaes do enunciado (faam isso na hora da prova):

    A nica coisa que falta para definirmos o nosso intervalo o valor de z. Que valor esse? Como o nvel de confiana igual a 95%, queremos encontrar . Utilizando os dados do exerccio, podemos observar que . Observe graficamente:

    O intervalo (rea hachurada) dado por:

    Pode acontecer de a questo fornecer o valor do intervalo e pedir para voc encontrar

    o valor do tamanho da amostra ou o valor do desvio padro, mas a metodologia ser a mesma. Vamos ver como funciona?

    Exerccio resolvido sobre intervalo de confiana para mdias: (FCC - 2010 - Dnocs Economia) Seja X uma varivel aleatria normalmente distribuda representando o salrio dos empregados em um determinado ramo de atividade. Uma amostra aleatria de 100 empregados foi selecionada e apurou-se um intervalo de confiana de 95% para a mdia de X como sendo [760,80; 839,20], supondo a populao de tamanho infinito e sabendo-se que o desvio padro populacional igual a R$ 200,00. Caso o tamanho da amostra tivesse sido de 1.600 e obtendo-se a mesma mdia anterior, o intervalo de confiana de 95% apresentaria uma amplitude igual a (A) R$ 78,40. (B) R$ 39,20. (C) R$ 49,00. (D) R$ 58,80. (E) R$ 19,60. Letra E

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 15

    Resoluo: Em 1 lugar, vamos passar as informaes para o papel:

    Sabemos que o intervalo de confiana dado por

    . Ento, a mdia amostral ficar

    exatamente no meio do intervalo (isso meio lgico, porque a mdia amostral possui uma distribuio normal, que simtrica). Uma maneira rpida de encontrar o meio do intervalo somar os 2 extremos e dividir por 2. Assim,

    Como igual a 800, o termo

    deve ser igual a 39,20. O valor de z no foi fornecido pelo

    enunciado, mas possvel calcul-lo, pois temos o valor de n e o valor de

    Se o valor da mdia amostral no se alterar, mas o tamanho da amostra subir para 1600, para um mesmo nvel de confiana, o novo intervalo ficaria assim:

    Portanto, a amplitude do novo intervalo seria igual a 19,6.

    Exerccio resolvido sobre intervalo de confiana para mdias: (FCC - 2011 - Infraero - Analista Superior Estatstico) A populao das medidas dos comprimentos de um tipo de cabo considerada normalmente distribuda e de tamanho infinito.

    Seja a mdia desta populao com uma varincia populacional igual a 2,56 . Uma amostra aleatria de 64 cabos apresentou um intervalo de confiana de (1 ), em metros, igual

    a [61,6 ; 62,4]. Se na distribuio normal padro (Z) a probabilidade

    , ento z

    igual a (A) 0,80. (B) 1,20. (C) 1,60. (D) 2,00. (E) 2,40. Letra D Resoluo: O enunciado nos forneceu as seguintes informaes:

    Como o enunciado forneceu o intervalo de confiana, vamos calcular o valor de :

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 16

    Se o valor da mdia amostral igual a 62, o termo

    deve ser igual a 0,4.

    Exerccio resolvido sobre intervalo de confiana para mdia:

    (FCC - 2006 - Bacen - Analista - rea 4) A distribuio dos valores dos aluguis dos imveis em uma certa localidade bem representada por uma curva normal com desvio padro populacional de R$ 200,00. Por meio de uma amostra aleatria de 100 imveis neste local, determinou-se um intervalo de confiana para a mdia destes valores, com um determinado nvel de confiana, como sendo [R$ 540,00 ; R$ 660,00]. A mesma mdia amostral foi obtida com um outro tamanho de amostra, com o mesmo nvel de confiana anterior, sendo o novo intervalo [R$560,00; R$ 640,00]. Nos dois casos considerou-se infinito o tamanho da populao. O tamanho da amostra considerada no segundo caso foi de (A) 225 (B) 256 (C) 324 (D) 400 (E) 625 Letra A Percebam que temos dois exerccio neste enunciado. Primeiro trabalhamos com uma amostra de tamanho 100. Depois, trabalhamos com outra amostra, de tamanho a ser definido. Informaes do enunciado: desvio padro populacional de R$ 200,00: amostra de tamanho 100:

    intervalo: [R$ 540,00 ; R$ 660,00]

    Se o valor da mdia amostral igual a 600, o termo

    deve ser igual a 60.

    Agora, vamos para a 2 parte do exerccio. O enunciado diz que na 2 amostra, obtivemos a mesma mdia amostral com o mesmo nvel de confiana. Ento:

    E o novo intervalo de confiana dado por: [R$560,00; R$ 640,00]

    Se a mdia amostral 600, o termo

    deve ser igual a 40.

    Quando a varincia populacional desconhecida, no podemos mais utilizar a

    distribuio normal, mas o procedimento ser muito semelhante. Se a varincia populacional

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 17

    for desconhecida, o exerccio ir fornecer o valor da varincia amostral ( que ser utilizada no lugar de . Alm disso utilizaremos a distribuio t de Student.

    Quer ver como fcil? Como era o intervalo de confiana para a mdia, com varincia populacional

    conhecida?

    Agora, quando a varincia populacional desconhecida, o intervalo fica assim:

    Como no conhecemos o desvio padro populacional, devemos utilizar o valor amostral mesmo. Como diz o ditado: quem no tem co, caa com gato. bem a lgica do negcio mesmo. Alm disso, ao invs de usar o valor z da normal padro, vamos utilizar o valor t da distribuio t de Student. Nos exerccios, para encontrar o valor de t nas informaes do enunciado, sempre vamos procurar o nmero de graus de liberdade igual a (n-1). Vamos treinar:

    Exerccio resolvido sobre intervalo de confiana para mdias: (FCC - 2012 - TRE SP - Analista Estatstica) As medidas dos comprimentos de uma pea fabricada por uma empresa apresentam uma distribuio normal com desvio padro desconhecido. Uma amostra aleatria de 9 peas apresentou uma mdia igual a 85 cm e um desvio padro igual a 15 cm. Considerando a

    populao de tamanho infinito e o quantil da distribuio t de Student para teste unicaudal tal que P(t > ) = 0,005 com n graus de liberdade, obteve-se, com base nessa amostra, um intervalo de confiana de 99% para a mdia populacional. Este intervalo de confiana, em cm, igual a

    (A) [67,50 ; 102,50]. (B) [68,20 ; 101,80]. (C) [68,75 ; 101,25]. (D) [69,15 ; 100,85]. (E) [69,50 ; 100,50]. Letra B Resoluo: Da leitura do enunciado, podemos tirar as seguintes informaes:

    Como temos 9 elementos na amostra, o nmero de graus de liberdade (n 1) ser igual a 8. Assim o valor de t tabelado igual a 3,36. O intervalo ser dado por:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 18

    Intervalo de confiana para mdias populacionais

    A varincia da populao conhecida A varincia da populao desconhecida

    Utilizaremos a distribuio normal Utilizaremos a distribuio t de Student

    Observao: quando n > 30, tambm poder ser usada a distribuio normal. Na prtica, o enunciado da questo ir dizer qual distribuio usar

    2 caso: Intervalos para a proporo populacional

    Assim como no caso da mdia, a proporo populacional um parmetro e a proporo amostral ( ) possui uma distribuio de probabilidades, que ser a seguinte:

    A informao no quadro acima uma das chaves para o sucesso nas questes

    de inferncia. Podemos dizer que possui uma distribuio normal com os seguintes parmetros:

    Mdia de :

    Varincia de :

    Agora, vamos fazer aquele esqueminha para voc decorar o intervalo de confiana no

    caso de proporo? 1 termo: proporo amostral mais ou menos

    2 termo: z

    3 termo: desvio padro de

    Pronto, este o nosso intervalo de confiana para a proporo populacional!

    Dyodi, tem um problema com esse intervalo...Para o clculo do intervalo, de acordo com a frmula, a gente precisa saber o valor de p. No entanto, esse valor desconhecido, no ? E agora, como fazer?.

    Temos 2 solues possveis:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 19

    Quando o exerccio mencionar varincia mxima, utilize (a FGV j cobrou isso)

    Caso contrrio, utilize (a maioria das questes utiliza esta soluo)

    Exerccio resolvido sobre intervalo de confiana para propores: (FCC - 2009 - Sefaz SP Auditor)

    Em uma pesquisa de tributos de competncia estadual, em 2008, realizada com 400 recolhimentos escolhidos aleatoriamente de uma populao considerada de tamanho infinito, 80% referiam-se a determinado imposto. Deseja-se construir um intervalo de confiana de 95,5% para a estimativa dessa proporo. Considerando normal a distribuio amostral da frequncia relativa dos recolhimentos desse imposto e que na distribuio normal padro a probabilidade P ( ) = 95,5%, o intervalo (A) [0,70; 0,90] (B) [0,72; 0,88] (C) [0,74; 0,86] (D) [0,76; 0,84] (E) [0,78; 0,82] Letra D Resoluo: Da leitura do enunciado, obtemos as seguintes informaes:

    O intervalo da proporo populacional dado por:

    Fazendo a aproximao de , o intervalo igual a

    3.3. Erro amostral e Tamanho da Amostra

    Um outro modo de realizar a inferncia estatstica ocorre quando desejamos definir o

    tamanho da amostra para que a diferena entre a mdia amostral e o valor do parmetro no ultrapassem um valor mximo predefinido, que chamaremos de erro amostral ( ). Vou explicar melhor.

    Por exemplo, queremos analisar a nota dos alunos de uma grande universidade

    brasileira. Para isso, selecionaremos uma amostra dessa populao de alunos. Queremos tambm que o resultado dessa amostra seja bem representativa, ou seja, queremos que a mdia das notas da amostra no difira demais da verdadeira mdia populacional (vamos supor que 1 ponto est de bom tamanho). Para que isso acontea, qual o tamanho da amostra que devemos selecionar, ou seja, quantos alunos devemos selecionar para que a nossa condio seja satisfeita?

    Este o caso das questes de erro amostral. A diferena entre o valor amostral e o

    verdadeiro valor populacional chamada de erro amostral. No nosso exemplo, queremos que essa diferena no seja maior do que 1 ponto. Assim, se a verdadeira mdia populacional for igual a 7, a mdia da nossa amostra tem que estar entre 6 e 8. Para que isso acontea, qual o tamanho da amostra?

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 20

    Em outras palavras, devemos calcular qual tamanho de amostra ser necessrio para que o erro amostral no ultrapasse certo valor predefinido, com um nvel de confiana . E como vamos fazer isso?

    Voc se lembra do intervalo de confiana para a mdia?

    Basta voc igualar o valor do erro mximo que o enunciado pede com a parte circulada

    abaixo:

    Assim:

    Vamos treinar!

    Exerccio resolvido sobre erro amostral para mdias: (FCC - 2007 - ISS SP Auditor) Uma varivel aleatria X tem distribuio normal com mdia e desvio padro 100. O tamanho da amostra para que a diferena, em valor absoluto, entre a mdia amostral e seja menor do que 2, com coeficiente de confiana de 89%, Dados: P(0 < Z < 1) = 0,341 , P(0 < Z < 1,6) = 0,445 , P(0 < Z < 2) = 0,477

    (A) 1.000 (B) 2.200 (C) 2.800 (D) 3.600 (E) 6.400 Letra E Resoluo: Sabemos que a questo trata de erro amostral porque ela cita a diferena, em valor absoluto, entra e mdia amostral e . Os dados que o enunciado fornece so os seguintes:

    Como temos o nvel de confiana, e utilizando os dados do exerccio, pode-se observar que

    Fazendo a igualdade:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 21

    Isso rpido ou no ?! Gabarito letra E.

    Exerccio resolvido sobre erro amostral:

    Para resolver questo, considere as informaes dadas a seguir: Se Z tem distribuio normal padro, ento: P(Z < 0,75) = 0,773; P(Z < 1,25) = 0,894; P(Z < 1,4) = 0,919; P(Z < 1,75) = 0,96: P(Z < 2,05) = 0,98; P(Z < 2,4) = 0,992

    (FCC - 2012 - TRT 6a - Analista Estatstica) Seja X o consumo mensal de gua por residncia de um bairro de determinada cidade. Sabe-

    se que X tem distribuio Normal com = 10 e = 2 . Seja a mdia amostral de uma amostra de n residncias, selecionadas aleatoriamente e com reposio. Sabendo que P | | , o valor de n (A) 64. (B) 36. (C) 25. (D) 16. (E) 9. Letra C Resoluo: Falou em diferena entre mdia amostral e mdia populacional, estamos diante de uma questo de erro amostral. Os dados fornecidos pelo enunciado so:

    Como temos o nvel de confiana, e utilizando os dados do enunciado:

    Obs: para quem ficou em dvida sobre como achar este valor de z, faa o desenho da normal, treine! Agora vocs j possuem toda essa base. Fazendo a igualdade:

    No caso de propores, o procedimento idntico. O erro amostral dado por:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 22

    O intervalo de confiana para propores era igual a:

    Da mesma maneira que fizemos para a mdia, devemos igualar o erro mximo pedido pelo enunciado com a parte circulada abaixo:

    Assim:

    Exerccio resolvido sobre erro amostral para propores: (FCC - 2011 - TRT 1a - Analista Estatstico) A proporo p dos funcionrios do sexo feminino de um rgo pblico de 20%. Colheu-se uma amostra aleatria simples (AAS) com reposio de 64 funcionrios desse rgo e calculou-se a proporo amostral, , de funcionrios do sexo feminino na amostra. Fazendo-se uso da aproximao pela normal para a distribuio de , a probabilidade de que essa proporo difira de p em menos do que 10% Dados: P (Z < 0,28) = 0,61; P (Z < 1,28) = 0,9; P (Z < 1,5) = 0,933; P (Z < 1,96) = 0,975; P (Z < 2) = 0,977.

    (A) 0,875. (B) 0,895. (C) 0,912. (D) 0,944. (E) 0,954. Letra E Resoluo: Sabemos que a questo se trata de erro amostral porque ela diz a probabilidade de que essa proporo ( ) difira de p em menos do que 10%. Neste caso, o enunciado nos fornece o valor de n, que igual a 64, e quer que encontremos o nvel de confiana : Os dados fornecidos so:

    Fazendo a igualdade:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 23

    Pelos dados da normal padro fornecidos pelo enunciado, temos que:

    A alternativa correta a letra E.

    3.4. Teste de Hipteses

    Algumas vezes, temos a intuio sobre alguma caracterstica da populao, mas no

    temos certeza se a nossa intuio est certa. Qual o procedimento que deve ser feito? Podemos colher uma amostra e testar a nossa teoria. O teste de hipteses consiste basicamente nesse procedimento. Dependendo do resultado do teste, podemos descartar ou no a nossa teoria.

    Para testar uma teoria, do que iremos precisar? Em 1 lugar, lgico, precisaremos de

    uma teoria que consideramos verdade (chamaremos esta teoria de hiptese nula). Alm disso, precisaremos de uma teoria alternativa, ou seja, se o nosso teste der errado, essa hiptese alternativa aquela que ser considerada verdadeira. E, por fim, precisaremos de um critrio que possa nos dizer se possvel, ou no, considerar a nossa hiptese nula como verdade.

    Vou utilizar um exemplo simples que eu costumo utilizar em sala de aula. Imagine que

    eu tive um sonho revelador esta noite e que neste sonho eu me tornava um lutador de MMA (para contextualiz-los, sou um japons magrinho de 1,65m de altura rsrs). Hmmm, acho que eu tenho potencial mesmo! Vou fazer um teste antes de abandonar o servio pblico!. Como eu acredito que posso ser um lutador de MMA, esta ser a minha hiptese nula:

    Por outro lado, e se o teste no der certo? Qual ser a hiptese que considerarei como

    verdadeira? Logicamente, a hiptese alternativa ser:

    Agora, s nos resta estabelecer o critrio para dizer se aceito ou rejeito a minha

    hiptese nula. Um critrio possvel seria: aguentar em p uma luta de 15 minutos na academia do bairro. Assim, se eu conseguir aguentar esta luta de 15 minutos, aceito a minha hiptese nula e rejeito a hiptese alternativa. Contudo, se eu no aguentar a luta em p, rejeito a hiptese nula e aceito a hiptese alternativa.

    A idia por trs do teste de hiptese esta! Vamos reparar numa coisa: podemos cometer dois erros na realizao do teste. Como

    assim, Dyodi?. Vamos detalhar, no se preocupe. Imagine que eu nasci com o DNA de lutador e realmente tenho um dom para o MMA (note que eu no sei desse fato, e por isso estou realizando o teste). Acontece que eu acabei dando azar e o adversrio que enfrentei era um lutador espetacular, o novo Anderson Silva. Consequentemente, no aguentei os 15 minutos em p. O que aconteceu neste caso?

    Aconteceu que eu realmente tenho potencial para o MMA (fato que eu no sei), mas o

    meu teste deu errado e rejeitamos a hiptese nula. Em outras palavras, a hiptese nula

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 24

    verdadeira mas eu a rejeito. Perceberam que eu cometi um erro? Chamaremos este erro de erro tipo I.

    Outro erro possvel: no levo o menor jeito para o esporte, mas acabo enfrentando um

    adversrio menor do que eu, um completo mo de alface, e nocauteio no 1 minuto de luta. O que aconteceu neste caso?

    Aconteceu que eu fiquei me achando o cara! Rsrs! Mas, alm disso, a hiptese nula

    falsa, mas acabei aceitando-a. Temos aqui o que chamamos de erro tipo II. Entenderam a lgica da coisa? Vamos trabalhar agora com a matria que vai cair na

    sua prova. Para a rea fiscal, o teste de hiptese pode ser sobre a mdia ou sobre propores. Suponha que uma pessoa tenha a intuio de que a mdia dos pesos dos porcos de

    um chiqueiro igual a 100 kg (este valor populacional desconhecido para ns). Colhendo uma amostra de porcos, verificou-se que a mdia amostral foi igual a 90 kg. E agora, descartamos a nossa hiptese ou ela pode ser considerada vlida? A resposta da pergunta a base do teste de hipteses.

    Quando realizamos um teste de hipteses, o 1 passo definir qual hiptese queremos testar (chamaremos de hiptese nula) e definir tambm qual ser a hiptese alternativa, ou seja, qual ser a hiptese que iremos aceitar caso a nossa hiptese no seja vlida. No exemplo acima:

    Observe que formulamos 3 possibilidades para a hiptese alternativa, que so as 3 possibilidades que podero cair na sua prova. Existem outras possibilidades, mas eu nunca as vi sendo cobradas para cargos que no so especficos na rea de estatstica. A forma como definimos a hiptese alternativa influenciar todo o procedimento do teste de hipteses. Antes de continuarmos, devemos lembrar que poderemos cometer dois tipos de erro: erro tipo I e erro tipo II.

    Erro tipo I: ocorre quando a hiptese nula verdadeira, mas ela rejeitada Erro tipo II: ocorre quando a hiptese nula falsa, mas ela aceita

    Dyodi, e quando a hiptese nula verdadeira e eu a aceito? E quando ela falsa e eu a rejeito?. Bom, isso no erro e sim o procedimento certo, correto?

    Exerccio resolvido sobre teste de hipteses: (ESAF - 2006 - SUSEP - Analista Tecnico de Controle e Fiscalizao) Em uma distribuio de sinistro S, formulando-se a hiptese de que no h diferena entre a freqncia esperada e a observada (hiptese nula: Ho). Donde, segundo um determinado nvel de significncia, podemos afirmar que ocorreu a) um erro do tipo I, se for aceita a hiptese Ho. b) um erro do tipo II, se for rejeitada a hiptese Ho. c) um erro do tipo I, se for aceita a hiptese Ho, sendo esta correta. d) um erro do tipo II, se for rejeitada a hiptese Ho, sendo esta correta. e) um erro do tipo I, se for rejeitada a hiptese Ho, sendo esta correta. Letra E Resoluo: Se o erro for do tipo I, a hiptese nula rejeitada. Assim, descartamos as letras A e C. Se o erro for do tipo II, a hiptese nula aceita. Assim, descartamos as letras B e D. A alternativa E corresponde definio que demos na teoria.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 25

    De que maneira a hiptese alternativa influencia o teste de hipteses? Primeiramente,

    devemos saber que sempre trabalharemos com o erro tipo I. Isso quer dizer que sempre iremos considerar a hiptese nula como verdadeira, e que cometeremos um erro se rejeitarmos a hiptese quando ela for verdadeira. Gostaria de reiterar que isso serve para as provas de fiscal, ok? Para provas que cobram a estatstica de maneira mais aprofundada, os exerccios podem cobrar o erro tipo II tambm.

    Rejeitando a hiptese nula, estaremos aceitando a hiptese alternativa. Ento, se

    fixarmos uma probabilidade mxima ( ) de cometermos o erro tipo I, que chamaremos de nvel de significncia, conseguimos construir um critrio, uma regio crtica, para optar pela rejeio ou no de :

    Se os dados da amostra indicarem que os valores obtidos pertencem regio crtica, rejeitaremos ;

    Se os dados da amostra indicarem que os valores obtidos no pertencem regio crtica, no rejeitaremos .

    Vamos visualizar o problema. Imagine uma rea protegida por um campo de fora e

    quem ultrapassar esse campo de fora recebe um choque mortal. Quem estiver fora do campo de fora no sofre nada, mas se ultrapassar vai morrer! a mesma coisa do teste de hipteses: ultrapassou o campo de fora (regio crtica) a hiptese nula rejeitada; no ultrapassou, a hiptese nula aceita.

    Em 1 lugar, veremos o procedimento do teste para mdias. Lembrando que possuem distribuio normal, suponha que o nvel de significncia fixado igual a 1%. Observe como fica a construo da regio crtica (rea hachurada):

    Temos um exemplo de regio crtica para uma hiptese alternativa . A regio crtica regio na qual rejeitamos e aceitamos . Por isso ela deve ficar no lado esquerdo da distribuio.

    Temos um exemplo de regio crtica para uma hiptese alternativa . A regio crtica regio na qual rejeitamos e aceitamos . Por isso ela deve ficar no lado direito da distribuio.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 26

    Observao: Da mesma maneira como ocorreu no intervalo de confiana, utilizaremos a

    distribuio normal se a varincia da populao for conhecida e a distribuio t de Student se a

    varincia da populao for desconhecida.

    Para a construo da regio crtica quando a varincia populacional conhecida, devemos trabalhar com a normal padro Z. Assim, podemos achar o valor de z, tal que

    Em outras palavras, o valor de z que vai definir onde comea a regio crtica obtido atravs da tabela normal, dos dados do enunciado. Este valor de z chamado de . Nas figuras acima, este valor representa o z que define onde comea a rea hachurada.

    Agora, s nos resta converter o valor da amostra em Z para descobrirmos se o valor obtido atravs da amostra pertence ou no regio crtica. Este valor convertido ser chamado de .

    Vamos ver como as questes sobre teste de hipteses so simples e rpidas:

    Exerccio resolvido sobre teste de hipteses:

    (FCC - 2010 - Dnocs Economia) Em um teste de hiptese estatstico, sendo H0 a hiptese nula e H1 a hiptese alternativa, o nvel de significncia do teste consiste na probabilidade de (A) aceitar H0 dado que H0 verdadeira. (B) rejeitar H0 dado que H0 falsa. (C) aceitar H0, independentemente se H0 verdadeira ou falsa. (D) aceitar H0 dado que H0 falsa. (E) rejeitar H0 dado que H0 verdadeira. Letra E Resoluo: Conforme a explicao, nvel de significncia a mesma coisa que a probabilidade de cometer o erro tipo I. Assim, o gabarito s pode ser a letra E.

    Exerccio resolvido sobre teste de hipteses para mdias: (FCC - 2009 - Sefaz SP Auditor)

    Temos um exemplo de regio crtica para uma hiptese alternativa . A regio crtica regio na qual rejeitamos e aceitamos . Uma vez que o erro pode ser cometido em ambas as direes, e regio crtica deve ficar nos lados esquerdo e direito. Como , cada uma das reas hachuradas deve valer 0,5%.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 27

    O gerente de uma indstria de determinado componente eletrnico garante que a vida mdia do produto fabricado igual a 100 horas. Um comprador desta indstria decide testar a afirmao do gerente e faz um teste estatstico formulando as hipteses H0: = 100 e H1 : , sendo que H0 a hiptese nula, H1 a hiptese alternativa e a mdia da populao considerada de tamanho infinito com uma distribuio normal. O desvio padro populacional igual a 10 horas e utilizou-se a informao da distribuio normal padro (Z), segundo a qual a probabilidade P(Z 1,64) = 5%. H0 foi rejeitada com base em uma amostra aleatria de 64 componentes em um nvel de significncia de 5%. Ento, o valor da mdia amostral foi, em horas, no mximo, (A) 94,75 (B) 95,00 (C) 96,00 (D) 96,50 (E) 97,95 Letra E Resoluo: Como a hiptese alternativa do tipo , sabemos que a regio crtica fica do lado esquerdo da distribuio normal. Devemos encontrar o valor de z tal que , pois o nvel de significncia do teste igual a 5%. Com os dados do enunciado, sabemos que .

    Agora, s nos resta encontrar o valor de , que ser obtido pela converso de em Z, e considerando a hiptese nula como verdadeira. Assim:

    Como o enunciado disse que foi rejeitada, o valor de deve pertencer regio crtica, ou seja, deve ser menor do que -1,64. Ento

    Exerccio resolvido sobre teste de hipteses para mdia:

    (FCC - 2006 - Sefaz SP Auditor) Seja X uma varivel aleatria representando o valor arrecadado de um determinado tributo. Suponha que X tem distribuio normal (populao de tamanho infinito) com mdia e desvio padro de 500 reais. Desejando-se testar H0 : = 1.000 reais (hiptese nula) H1 : 1.000 reais (hiptese alternativa) tomou-se uma amostra aleatria de 400 valores de X, obtendo-se para a mdia amostral o valor de 1.060 reais. Seja o nvel de significncia do teste e suponha que a regio de rejeio

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 28

    de H0 {| | }, onde representa o escore da curva normal padro tal que P(| |

    ) = . Tem-se que

    (A) Se H0 foi rejeitada, existe um nvel de significncia ( > ) tal que H0 no seria rejeitada. (B) Para qualquer nvel de significncia , H0 ser rejeitada, uma vez que 1.060 1.000. (C) H0 no ser rejeitada para .

    (D) H0 ser rejeitada para .

    (E) Para , H0 no ser rejeitada.

    Letra D Resoluo: Como a hiptese alternativa do tipo 1.000, sabemos que a regio crtica fica do lado direito e do lado esquerdo do grfico. Percebam que o enunciado no nos disse qual o nvel de significncia, ento no temos o valor de . Obs: a questo chama o de . Este sobre 2 significa que a regio crtica fica nos

    dois lados do grfico, coisa que j sabamos de antemo. Vamos encontrar o valor de .

    Agora, vamos analisar as alternativas. Alternativa A: Se a hiptese nula foi rejeitada para um nvel de significncia , qualquer outro nvel de significncia MAIOR do que tambm rejeitaria a hiptese nula. O nosso campo de fora, a regio crtica iria aumentar de tamanho! Item incorreto. Alternativa B: bullshit! Pessoal, toda alternativa que afirmar que sempre vai rejeitar, que sempre no vai rejeitar, sem fornecer condio nenhuma, est falando besteira, pra no colocar outra palavra mais feia aqui. Alternativa C: Item errado, vamos ver como ficaria o nosso esquema.

    Se o for igual a 3, realmente a nossa hiptese nula no rejeitada. Mas olhe novamente para a alternativa: o item fala de menor do que 3. Aquela rea hachurada iria aumentar de tamanho, se aproximando do eixo central. Assim, em algum nvel de significncia, o valor de 2,4 ficaria dentro da regio crtica. Por este motivo, a letra C fica incorreta.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 29

    Alternativa D: Perfeito! Observem abaixo como o nosso fica dentro da regio crtica.

    Alternativa E: Se a hiptese nula rejeitada para igual a 2, ela tambm o ser para qualquer maior do que 2.

    Para a construo da regio crtica quando a varincia populacional desconhecida,

    devemos trabalhar com a distribuio t de Student. Assim, podemos achar o valor de t, tal que

    Agora, s nos resta converter o valor da amostra em T para descobrirmos se o valor obtido atravs da amostra pertence ou no regio crtica. Este valor convertido ser chamado de .

    Exerccio resolvido sobre teste de hipteses para mdias: (FCC - 2010 - Metro - Analista Trainee Estatstica) Um grande fabricante de certo produto afirma que as unidades produzidas por sua empresa pesam em mdia 10 kg. Considera-se que os pesos das unidades produzidas so normalmente distribudos. Para testar a hiptese do fabricante, selecionou-se aleatoriamente 9 unidades do produto apurando-se uma mdia correspondente igual a 9 kg com a soma dos

    quadrados dos pesos destas 9 unidades igual a 761 . Foram formuladas as hipteses H0: = 10 kg (hiptese nula) contra H1: < 10 kg (hiptese alternativa). Utilizando o teste t de Student, obtm-se que o valor da estatstica t (t calculado) a ser comparado com o t tabelado igual a (A) -1,50. (B) -1,40. (C) -1,25. (D) -1,00. (E) -0,75. Letra A Resoluo: Vamos por partes. Os dados fornecidos pelo enunciado so:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 30

    Percebe-se que a varincia populacional no foi fornecida, ento devemos trabalhar com a distribuio t de Student. Como o enunciado forneceu uma soma de quadrados, utilizaremos a segunda frmula da varincia para calcular a varincia amostral :

    Assim, o valor igual a:

    No caso de propores, o procedimento ser idntico ao utilizado para os testes de hipteses para mdias, com a nica diferena de que a distribuio normal da proporo possui parmetros diferentes da distribuio normal da mdia. Vamos ver atravs de um exerccio:

    Exerccio resolvido sobre teste de hipteses para propores: (FCC - 2009 - TRT 7a - Analista Estatstica) Em uma cidade realizada uma pesquisa sobre a preferncia dos eleitores com relao a um determinado candidato, que afirma ter 60% da preferncia. Uma amostra aleatria de tamanho 600 foi extrada da populao, considerada de tamanho infinito, sendo que 330 eleitores manifestaram sua preferncia pelo candidato. Com base nesta amostra, deseja-se testar a hiptese H0 : p = 60% (hiptese nula) contra H1 : p 60% (hiptese alternativa), em que p a proporo dos eleitores que tm preferncia pelo candidato. Para a anlise considerou-se normal a distribuio amostral da frequncia relativa dos eleitores que tm preferncia pelo candidato e que na distribuio normal padro Z a probabilidade P(|Z| 1,96) = 95% e P(|Z| 2,58) = 99%. A concluso que H0 (A) no rejeitada tanto ao nvel de significncia de 1% como ao nvel de significncia de 5%. (B) rejeitada ao nvel de significncia de 5%. (C) rejeitada ao nvel de significncia de 1%. (D) no rejeitada para algum nvel de significncia superior a 5%. (E) rejeitada para algum nvel de significncia inferior a 1%. Letra B Resoluo: O enunciado nos fornece as seguintes informaes:

    Como a hiptese alternativa do tipo , temos que a nossa regio crtica, para um nvel de significncia , ser do tipo:

    O valor de ser igual a:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 31

    Agora, para sabermos se a hiptese deve ou no ser rejeitada, devemos ver se pertence ou no regio crtica. Para um nvel de significncia de 5%, . Ento, o valor de pertence regio crtica e rejeitada. Para um nvel de significncia de 1%, . Ento, o valor de no pertence regio crtica e no rejeitada.

    3.5. Probabilidade de Significncia, Nvel Descritivo do Teste ou p-valor

    Probabilidade de significncia, nvel descritivo do teste ou p-valor so denominaes

    diferentes para uma mesma metodologia. Em provas, pode aparecer como qualquer uma das trs.

    Trata-se de um mtodo alternativo para o teste de hipteses, com a diferena que no

    ser preciso construir uma regio crtica. Voc se lembra do e do nos teste de hipteses? O p-valor apenas

    uma probabilidade de ocorrer um valor mais extremo do que o ou . Assim, se o for igual a 2, o p-valor o valor da probabilidade . Se o for igual a -3, o p-valor o valor da probabilidade .

    Quando o exerccio fornecer o valor do nvel de significncia do teste, a hiptese nula

    ser rejeitada quando o p-valor for menor do que o nvel de significncia.

    Condies Resultado do teste de hipteses

    Se p-valor < nvel de significncia Devemos rejeitar a hiptese nula

    Se p-valor > nvel de significncia Devemos aceitar a hiptese nula

    Exerccio resolvido sobre p-valor: (FCC - 2012 ISS SP - Auditor) Testes realizados pela industria Cookwell indicam que seu forno de microondas tem probabilidade 0,1 de apresentar a 1a falha antes de 1000 horas de uso. Um novo mtodo de produo est sendo implantado e os tcnicos garantem que a probabilidade acima deve diminuir. Com o objetivo de verificar esta afirmao, tomou-se uma amostra de 144 aparelhos e os resultados indicaram 9 com a 1a falha antes de 1000 horas de uso. O valor do nvel descritivo do teste, calculado atravs da proporo amostral, supondo que a mesma tem distribuio aproximadamente normal e no considerando qualquer correo de continuidade, , Se Z tem distribuio normal padro, ento: P(Z < 0,84) = 0,80, P(Z < 1,5) = 0,933, P(Z < 1,96) = 0,975, P(Z < 2,5) = 0,994

    (A) 0,6%. (B) 1%. (C) 2,5%. (D) 6%. (E) 6,7%. Letra E Resoluo: Como o enunciado cobra o valor do nvel descritivo do teste, a nossa 1 tarefa encontrar o

    valor de .

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 32

    Observe que a nossa hiptese nula a seguinte: Ento,

    3.6. Teste de Hipteses para Propores com Qui-Quadrado

    Existe um tipo de questo sobre teste de hipteses que frequentemente visto em

    provas especficas de estatstico. No entanto, a FCC j cobrou o tema na prova do ICMS/SP em 2009 e a FGV tambm j cobrou o tema em 2006 na prova do ICMS/MS. Trata-se do teste de hipteses para propores com qui-quadrado.

    Sei que voc j est muito cansado, mas estamos quase no final do curso. Prepare o

    flego para o ltimo sprint. O tema em questo simples e fcil, alm de ser cobrado sempre da mesma maneira em provas. o tipo de questo que o concurseiro sempre torce para cair na prova, pois no tem como errar (para quem estudou, lgico) e normalmente os candidatos se assustam s de ouvir falar em qui-quadrado.

    Neste tipo de teste, as hipteses nula e alternativa sero:

    Alm disso, utilizaremos

    Outro dado importante: o nmero de graus de liberdade ser igual a

    Quando

    Quando

    Dyodi, no entendi merd* nenhuma! Como assim ou no proporcional? O que ou

    no proporcional? Me explica melhor, por favor?. Lgico que sim, vamos l. Imagine que, durante a semana, eu beba coca-zero da seguinte maneira (o nmero

    representa a quantidade de garrafas 600ml):

    Segunda Tera Quarta Quinta Sexta Sbado Domingo

    3 3 3 3 3 3 3

    Eu pergunto: a quantidade de garrafas 600ml de coca-zero que eu bebo por semana

    depende do dia da semana? Neste caso, no depende do dia da semana. Em outras palavras, a quantidade de coca-zero proporcional aos dias da semana.

    Observe um outro caso:

    Segunda Tera Quarta Quinta Sexta Sbado Domingo

    0 0 0 0 0 10 11

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 33

    Fao a mesma pergunta: a quantidade de garrafas 600ml de coca-zero que eu bebo por semana depende do dia da semana? Neste caso, est claro que a quantidade ingerida de refrigerante depende do dia da semana. Durantes os dias teis, no bebo nada. No entanto, nos finais de semana o refrigerante liberado. A quantidade ingerida no proporcional em relao aos dias da semana.

    Um ltimo caso:

    Segunda Tera Quarta Quinta Sexta Sbado Domingo

    2 4 2 4 1 5 3

    E agora? proporcional ou no? Alguns podem achar que sim, enquanto outros podem achar que no. Perceberam que analisar apenas pelo olho muito subjetivo? O teste qui-quadrado uma maneira de analisar o problema com objetividade, seguindo certos critrios.

    A maneira mais fcil de entender o mecanismo atravs de um exerccio, ento vamos a ele.

    Exerccio resolvido sobre teste de hipteses para propores com qui-quadrado: (FCC - 2012 - TRE SP - Analista Estatstica) Em uma cidade foi realizada uma pesquisa entre 600 eleitores, escolhidos aleatoriamente, com relao preferncia entre 2 candidatos X e Y para o cargo de prefeito. Esta pesquisa forneceu 2 grupos de eleitores, sendo 375 homens e 225 mulheres. Cada eleitor forneceu uma e somente uma resposta, na pesquisa, se preferia X ou Y.

    O objetivo verificar, com relao a estes eleitores, se a preferncia pelos candidatos depende do sexo, utilizando o teste quiquadrado a um determinado nvel de significncia . Dados: Valores crticos da distribuio qui-quadrado [P(qui-quadrado com n graus de liberdade) < valor tabelado = 95%]

    correto afirmar que (A) o valor do qui-quadrado observado igual a 4,0. (B) existe um nvel de significncia inferior a 5% tal que a concluso que depende do sexo. (C) o valor do qui-quadrado observado igual a 3,2 e o nmero de graus de liberdade igual a 2. (D) no existe um nvel de significncia tal que a concluso que depende do sexo. (E) para qualquer nvel de significncia inferior a 5%, a concluso que independe do sexo. Letra E Resoluo: Neste tipo de teste, vimos que a hiptese nula sempre diz que as propores populacionais so todas iguais. Neste exemplo, isso quer dizer que a preferncia por um dos candidatos independe se a pessoa escolhida for homem ou mulher. Homens e mulheres pertencem a uma mesma populao, ou seja, a preferncia pelo candidato X ser proporcionalmente igual tanto para o grupo de homens como para o grupo de mulheres. Observe a tabela:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 34

    Existem 600 pessoas na amostra e 1/3 preferem o candidato X enquanto 2/3 preferem o candidato Y. Considerando a hiptese nula verdadeira, 1/3 dos homens e 1/3 das mulheres preferem o candidato X enquanto que 2/3 dos homens e 2/3 das mulheres preferem o candidato Y. Agora, o macete da questo inserir os valores esperados entre parnteses ao lado dos valores observados:

    Para calcular o valor da estatstica basta elevar a diferena entre o valor observado e o valor esperado e dividir pelo valor esperado:

    Para concluir a questo, devemos comparar o qui-quadrado calculado com o qui-quadrado tabelado. O qui-quadrado tabelado depende do nmero de graus de liberdade:

    Observe que quando contamos as linhas e colunas, no devemos incluir o valor dos totais, mas somente as linhas e colunas que representam realmente os dados. Como qui-qudrado calculado < qui-qudrado tabelado, a hiptese nula no rejeitada para um nvel de significncia de 5% ou menor.

    Exerccio resolvido sobre teste de hipteses para propores com qui-quadrado: (FCC - 2009 - Sefaz SP Auditor)

    Espera-se que o nmero de reclamaes tributrias em um rgo pblico durante determinada semana seja igual a 25, em qualquer dia til. Sabe-se que nesta semana ocorreram 125 reclamaes com a seguinte distribuio por dia da semana:

    Para decidir se o nmero de reclamaes tributrias correspondente no depende do dia da

    semana, a um nvel de significncia , calculado o valor do qui-quadrado ( ) que se deve comparar com o valor do qui-quadrado crtico tabelado com 4 graus de liberdade. O valor de

    ( ) (A) 1,20 (B) 1,90

    (125) (250)

    (75) (150)

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 35

    (C) 4,75 (D) 7,60 (E) 9,12 Letra D Resoluo: Neste tipo de teste, vimos que a hiptese nula sempre diz que as propores populacionais so todas iguais. Neste exemplo, isso quer dizer que todas as reclamaes vieram de uma mesma populao, de modo que o seu valor esperado igual para todos os dias da semana. Como ocorreram 125 reclamaes em 5 dias teis, espera-se que ocorra 25 reclamaes em cada dia da semana.

    O exerccio pede apenas o valor que igual a

    3.7. Regresso e Correlao

    Muitas vezes, gostaramos de analisar 2 variveis conjuntamente para saber se existe alguma relao entre elas. Para fins de concurso, os dois procedimentos para uma anlise bivariada (2 variveis em estudo) so a correlao e a regresso.

    A correlao uma medida que quantifica o grau de associao entre duas variveis. A regresso um procedimento que busca encontrar uma equao matemtica para

    descrever o relacionamento entre as duas variveis.

    Um dispositivo til para verificar se h relao entre as variveis o diagrama de

    disperso. Observe os diagramas de disperso abaixo:

    Enquanto o diagrama do lado esquerdo nos mostra uma relao linear entre X e Y, o diagrama do lado direito nos mostra que as variveis X e Y no possuem uma relao linear. Cuidado, no ter uma relao linear no significa que as variveis no possuem nenhum tipo de relao. No entanto, estamos interessados apenas em estudar as relaes lineares.

    Exerccio resolvido sobre regresso e correlao: (FCC - 2012 ISS SP - Auditor)

    (25) (25) (25) (25) (25)

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 36

    Considere as seguintes afirmaes: I. Um dispositivo til quando se quer verificar a associao entre duas variveis quantitativas o grfico de disperso entre essas duas variveis. II. (suprimido) III. (suprimido) IV. (suprimido) (A) I e II. (B) I e III. (C) II e IV. (D) I. (E) II e III. Letra D Resoluo: Sem muitos comentrios. Vimos nos exemplos acima que o diagrama de disperso nos ajuda a avaliar o grau de associao entre duas variveis.

    Exerccio resolvido sobre regresso e correlao: (FCC 2013 Sefaz SP Auditor) Considere: I. (suprimido) II. Um dispositivo til quando se deseja verificar se existe correlao linear entre duas variveis o grfico de colunas justapostas. III. (suprimido) IV. (suprimido) Est correto o que se afirma APENAS em (A) I. (B) II. (C) III. (D) I e IV. (E) IV. Resoluo: Para analisar a correlao linear entre duas variveis, o correto seria utilizar um diagrama de disperso. Item incorreto.

    Vamos iniciar com o estudo sobre a regresso linear, e posteriormente estudaremos a correlao linear.

    A regresso linear consiste basicamente em traar uma linha reta que melhor represente o conjunto de pontos do diagrama de disperso. A reta no precisa passar por cima de todos os pontos do diagrama, mas isso no a impede de representar bem a relao entre as variveis.

    Os conceitos de populao e amostra tambm se aplicam ao estudo sobre regresso.

    Imagine que temos todos os dados da populao sobre as variveis X e Y. Desta maneira, escolhendo um critrio, seria possvel traar a reta que melhor representasse a relao entre as duas variveis. No entanto, como no temos os dados da populao na maioria das vezes, devemos encontrar uma reta que represente bem a relao populacional baseada em uma amostra das duas variveis. Observe alguns resultados possveis:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 37

    Ento, o nosso objetivo encontrar uma reta, com base em dados amostrais, que

    melhor possa representar a relao populacional entre as variveis X e Y. Agora, voc deve se fazer a seguinte pergunta: Mas se eu no conheo a reta de regresso populacional, como vou saber se a reta que eu tracei representa bem a populao?. Por conta deste problema, criou-se um mtodo chamado de Mtodo dos Mnimos Quadrados, que consiste basicamente em minimizar o quadrado dos desvios em relao reta de regresso populacional. Observe:

    A utilizao do Mtodo dos Mnimos Quadrados no significa que, necessariamente, a reta encontrada ir representar bem a populao. No entanto, a sua utilizao nos permite dizer que a reta encontrada a melhor reta possvel de se encontrar com aquela amostra. Perceba que so duas coisas diferentes.

    Assim, podemos dizer que uma estimativa de , que uma estimativa de e que uma estimativa de . Alm disso, o desvio a diferena entre e e o mtodo dos mnimos quadrados busca minimizar o

    .

    Exerccio resolvido sobre regresso linear: (ESAF - 2009 - Receita Federal Auditor)

    Na anlise de regresso linear simples, as estimativas e dos parmetros e da reta de regresso podem ser obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi com (i =1,

    2, ....,n), obtendo-se: = + X i , onde a estimativa de Yi = + Xi . Para cada par de valores Xi Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resduo aqui denotado por entre a reta de regresso Yi e sua estimativa . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como estimativas dos parmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Mtodo de Mnimos Quadrados consiste em minimizar a expresso dada por:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 38

    Questo anulada

    Resoluo:

    Pelo mtodo dos mnimos quadrados, devemos minimizar o somatrio ( ) , que pode

    ser escrito da seguinte forma:

    ( )

    ( )

    ( )

    Questo muito simples para quem estudou, mas muito enrolada para quem nunca viu o assunto. A resposta correta seria a letra B, mas a banca esqueceu de tirar o parntese da alternativa...

    A maioria das questes sobre regresso versa sobre o clculo dos parmetros . Eu costumo brincar em sala de aula que, neste caso, elas podem aparecer em trs nveis diferentes: jnior, fcil e mdio. Comearemos pelo nvel jnior, que no demanda nenhum conhecimento que vocs j no tenham adquirido. Nvel Jnior:

    Neste nvel, a questo basicamente pede que encontremos uma equao para a reta, dado que o enunciado fornece dois pontos que passam por ela. Assim, se a equao da reta

    for do tipo , teremos que calcular o valor do coeficiente angular (sempre ser o termo que est multiplicando a varivel, ou seja, ser o ) e o valor do intercepto .

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 39

    Conhecendo dois pontos que pertencem reta, podemos encontrar o valor dos

    parmetros .

    O valor de ser encontrado por substituio.

    S gostaria de fazer uma pequena observao: algumas vezes, pode parecer que o enunciado s forneceu um ponto pertencente reta. Se fosse assim, no teramos como sair do lugar. O 2 ponto provavelmente estar implcito no enunciado. Como assim, Dyodi?. Uma informao importante diz que a reta calculada pelo mtodo dos mnimos quadrados sempre

    passar pelo ponto . Isso ser utilizado em alguns exerccios.

    Exerccio resolvido sobre regresso linear: (FCC - 2012 - TRF 2a - Analista Estatstica) Pelo grfico correspondente reta obtida pelo mtodo dos mnimos quadrados com base em 10 pares de observaes (X1,Y1), (X2,Y2), . . . ,(X10,Y10), verifica-se que a reta passa pelo ponto (2 , 100). O modelo adotado foi Yi = + Xi + , em que Yi representa o valor da varivel dependente na i-sima observao, Xi o valor da varivel explicativa na i-sima observao e o erro aleatrio com as respectivas hipteses consideradas para a regresso linear simples. e so os parmetros do modelo, cujas estimativas foram obtidas pelo mtodo dos mnimos quadrados. Dado que as mdias das observaes de Xi e Yi so iguais a 10 e 75, respectivamente, ento a previso do valor de Y, quando X = 16, igual a (A) 60,75. (B) 56,25. (C) 50,75. (D) 48,25. (E) 40,75. Letra B Resoluo: Sabemos que a reta passa pelo ponto (2, 100).

    Alm disso, sabemos que a reta de mnimos quadrados sempre passar por , que igual a (10, 75).

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 40

    Ento, o valor de ser igual a

    Para facilitar a visualizao, sempre bom fazer um esboo da reta de regresso passando

    pelos dois pontos. Deste modo, pelo menos teremos certeza se o sinal encontrado para (positivo ou negativo) est certo ou errado. Como a inclinao para baixo, o sinal de deve ser negativo.

    Escolhendo qualquer um dos pontos e substituindo o valor de na equao, encontramos o valor de :

    Assim, a equao da reta ser:

    Ento, quando X for igual a 16, Y ser igual a:

    Em relao aos nveis fcil e mdio, devemos decorar algumas frmulas. No me xingue e no fique desesperado, por favor! Sei que vocs precisam decorar muitas coisas para a prova, mas o sacrifcio necessrio. Alm disso, voc deve concordar que essa apostila bem menor do que o livro de Tributrio, de Constitucional, Administrativo...

    Para facilitar a decoreba, inventei alguns mnemnicos para a frmula de . Nvel Fcil:

    O nvel fcil aparece quando o enunciado nos fornece o valor de e pede para que calculemos o valor de , ou vice-versa. Neste caso precisamos apenas decorar a frmula do .

    Frmula do alfa: AY, BiXo No!

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 41

    Nvel Mdio:

    No nvel mdio, alm da frmula do , devemos saber a frmula do . Frmula do beta: Bem, XiXi no YoYo da XuXa2!

    Frmula alternativa do beta (decore-a tambm): XYXY No! XuXa No!

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 42

    A frmula a ser utilizada para encontrar o valor de ir depender dos dados do exerccio.

    Dyodi, na boa...No vou decorar as duas frmula no!. Para quem for fazer provas da FCC, eu digo que a frmula alternativa do beta a que mais cai em provas, mas eu aconselho a decorar somente a 1 frmula.

    H?! Voc t louco?! Se a 2 frmula a que mais cai em provas, porque voc

    aconselha a decorar somente a 1?. Eu s coloquei a 2 frmula para auxili-los na visualizao, mas saibam que quem

    decora a 1 consegue chegar na 2. Mais uma vez, aqui podemos utilizar todo o conhecimento j adquirido nas aulas passadas! Para que decorar uma coisa que voc j sabe? Vou provar que quem estudou direitinho at aqui sabe desenvolver a 2 frmula sem decor-la. Assim, peo que vocs observem a 1 e a 2 frmulas da varincia (lembram disso, n?):

    Se a varincia calculada pelas duas frmulas tem que dar o mesmo resultado, ento as

    duas frmulas se equivalem, correto? Notem que o denominador igual nas duas frmulas. Concluso: as partes circuladas tem que ser iguais!

    Agora, vamos ver como a 2 frmula do beta pode ser desenvolvida sabendo apenas a

    1:

    Ok, Dyodi. Mas e o numerador?. Pessoal, no a mesma coisa que 2.2? Ento

    no a mesma coisa que ?

    Ento, por analogia:

    Espero ter ajudado desta maneira. Mas, para quem preferir decorar, sempre existem os mnemnicos.

    Exerccio resolvido sobre regresso linear:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 43

    (FCC - 2011 - Copergas - Analista Economia) A tabela abaixo apresenta os lucros (varivel Y), em milhes de reais, de uma companhia no perodo de 5 anos (varivel X):

    A previso de lucro para o ano 6, em milhes de reais, calculada quando se ajusta aos dados a reta de mnimos quadrados, igual a (A) 7,6. (B) 7,7. (C) 7,8. (D) 7,9. (E) 8,0. Letra A Resoluo: Pelos valores da tabela, conseguimos descobrir mais valores de somatrio: e Trata-se de uma questo de regresso de nvel mdio, ou seja, devemos utilizar as frmulas de alfa e beta. Em 1 lugar, devemos encontrar o valor de beta:

    Com o valor de beta, podemos calcular o valor de alfa:

    Assim, a nossa reta de regresso :

    Agora, s nos resta encontrar o lucro no ano 6, ou seja, o valor de Y quando X for igual a 6:

    Exerccio resolvido sobre regresso: (FCC - 2010 - Bahiagas - Analista de Processos Organizacionais Economia) Uma empresa utiliza o modelo = + t + (t = 1, 2, 3, . . . ) para estimar o seu faturamento no ano (1999 + t). representa o faturamento da empresa no ano (1999 + t) em milhes de reais. e so parmetros desconhecidos e o erro aleatrio com as respectivas hipteses consideradas para o modelo de regresso linear simples. Com base nas observaes dos

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 44

    faturamentos anuais de 2000 at 2009 e utilizando o mtodo dos mnimos quadrados obteve-se a e b (estimativas de e , respectivamente). O grfico abaixo corresponde equao da reta y = a + bt :

    O valor da mdia aritmtica das observaes de 2000 at 2009, em milhes de reais, (A) 3,2. (B)