RESUMÃO

download RESUMÃO

of 61

Transcript of RESUMÃO

Clculo das Probabilidades e Estatstica IProf. Dr. Eufrsio de Andrade Lima Neto Departamento de [email protected] do Curso: www.de.ufpb.br/~ eufrasio/CPE Carga horria: 60 horas Crditos: 04EmentaConceitosFundamentais. DistribuiodeFrequncia. TabelaseGrficos. MedidasdePosioe Disperso. Introduo Probabilidade. Variveis Aleatrias Unidimensionais. Esperana Matemtica.Distribuies Discretas e Contnuas. Noes Elementares de Amostragem. Estimao Pontual. Intervalos de Confiana e Testes de Hipteses. Correlao e Regresso.DescrioEstadisciplinaservirdeapoioaoEngenheironoprocessodetomadadedeciso. Aolongodo curso o aluno ser apresentado a um leque de mtodos estatsticos, descritivos e inferenciais, com o intuito facilitar a manipulao e anlise de dados.Contedo Programtico Conceitos Bsicos de Estatstica Fases do Experimento Estatstico Estatstica Descritiva Medidas Estatsticas Espao Amostral e evento Probabilidade Probabilidade em Espaos Amostrais Finitos Probabilidade Condicional Independncia de Eventos Variveis Aleatrias Discretas e Contnuas Esperana e Varincia Experimentos Binomiais e a Distribuio Binomial Distribuio Normal Distribuies Amostrais da Mdia e da Proporo Estimao de Parmetros Intervalos de Confiana para a Mdia Populacional Intervalo de Confiana para uma Proporo Populacional Testes de Hipteses para a Mdia Populacional Testes de Hipteses para uma Proporo Populacional Correlao e Regresso Unidade I: Os Anlise de Dados Estatsticos 1. Situando a TemticaA Estatstica considerada por alguns autores como Cincia no sentido do estudo de uma populao. considerada como mtodo quando utilizada como instrumento por outra Cincia.A palavra estatstica frequentemente est associada imagem de aglomerao de nmeros, dispostos em uma imensa variedade de tabelas e grficos, representando informaes to diversas quanto nascimentos,mortes, taxas, populaes, rendimentos, dbitos, crditos, etc. Istodevidoaousocomumdapalavra estatstica como sinnimo de dados, como,por exemplo,quando falamos das estatsticas de uma eleio,estatsticas da sade, estatsticas de acidente de trnsito ou as estatsticas de acidentes de trabalho.No sentido moderno da palavra, estatstica lida com o desenvolvimento e aplicao de mtodos para coletar, organizar, analisar e interpretar dados de tal modo que a segurana das concluses baseada nos dadospode ser avaliada objetivamente por meio de proposies probabilsticas.Opropsitodaestatsticanoexclusivodequalquercinciaisolada. Aocontrrio, aestatstica forneceumconjuntodemtodos teis emtodareacientficaondehajaanecessidadedesecoletar,organizar, analisar e interpretar dados. Estes mtodos podem ser usados to eficazmente em farmacologia como em engenharia, em cincias sociais ou em fsica.2. Problematizando a TemticaAo estudarmos fenmenos naturais, econmicos ou biolgicos tais como, a precipitao de chuvas em uma determinada regio, a evoluo da taxa de inflao em uma regio metropolitana, a influncia das mars no desenvolvimento de animais marinhos, etc., estamos lidando com experimentos cujos resultados no conhecemos e desejamos saber se as hipteses que afirmamos so verdadeiras, isto , se os fenmenosesto ocorrendo como espervamos. Para isto, necessrio que os dados oriundos das observaes possam nos dar informaes claras e precisas. Estes dados devem ser organizados de forma adequada para podermosfazer uma anlise crtica e fundamentada do fenmeno.A partir de agora voc est convidado a participar de uma experincia que consiste em obter um conjunto de dados, represent-lo em distribuies de frequncia e apresent-lo atravs de tabelas e grficos.Ver como algumas medidas estatsticas podem nos auxiliar nesta anlise e como utiliz-las.3. Conhecendo a Temtica3.1 Conceitos Bsicos de Estatstica Podemos considerar a Estatstica como um conjunto de mtodos e processos quantitativos queserve para estudar e medir os fenmenos coletivos.Aestatsticateveaceleradoseudesenvolvimentoapartir dosculoXVII, atravsdosestudosde BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSONe outros que estabeleceram suas caractersticas essenciais.A Estatstica tem como OBJETIVO o estudo dos fenmenos coletivos. A Estatstica a cincia que trata da coleta, do processamento e da disposio dos dados.Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos vrios campos daatividadecientfica, aEstatsticamanipuladoisconjuntosdedadosfundamentais: a"populao" ea "amostra".Populao (ou Universo) o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno coletivo segundo alguma(s) caracterstica(s). , portanto, um conjunto definido de informaes relativas a qualquerrea de interesse, podendo, quanto ao nmero de elementos,ser: finita (tamanho N)ou infinita. Na maioria das vezes no conveniente, ou mesmo possvel, realizar o levantamento dos dados referentes a todos os elementos de uma populao. Portanto, analisamos parte da populao, isto , uma amostra.2Amostraumsubconjuntonovaziooupartedapopulao. Duasconsideraesdevemserfeitassobreo estudoamostral dosfenmenos. Umadizrespeitoaoscuidadosquesedevetomarparaassegurarquea amostra seja representativa da populao. Para atender a essa exigncia, deve-se selecionar os elementos de forma aleatria, de modo que todo e qualquer elemento da populao tenha a mesma chance de participar da amostra,a outra dizrespeito preciso dosdadoscoletados,buscando minimizaros errosque poderiam induzir aconcluses equivocadas. Onmerodeelementos deumaamostrachamadoo tamanhoda amostra, e denotado por n.Definio 1.1: ParmetroUma caracterstica numrica estabelecida para toda uma populao denominadaparmetro.So valores, geralmente desconhecidos (e que portanto tmde ser estimados), que representamcertas caractersticas da populao.Definio 1.2: Estimador uma caracterstica baseada em observaes amostrais e usada para indicar o valor de um parmetro populacional desconhecido.Definio 1.3: Estimativa O valor numrico assumido pelo estimador numa determinada amostra denominada estimativa.Exemplo 1.1:No fenmeno coletivo eleio para reitor da UFPB, a populao o conjunto de todos os eleitores habilitados na Universidade. Um parmetro a proporo de votos do candidato A. Uma amostra pode ser umgrupode300eleitores selecionados emtodaaUFPB. Um estimadoraproporodevotos do candidato A obtida na amostra. O valor resultante do estimador, a proporo amostral, a estimativa. Processos Estatsticos de AbordagemQuandosolicitados aestudar umfenmenocoletivopodemos optar entreosseguintes processos estatsticos:a) CENSO-avaliaodiretadeumparmetro, utilizando-setodososcomponentesdapopulao.Entre as principais caractersticas de um Censo, podemos destacar: admite erro processual zero e tem confiabilidade 100%, caro, lento e quase sempre desatualizado. Nem sempre vivel.b) AMOSTRAGEM(INFERNCIA) - avaliao indireta de umparmetro, combase emum estimador atravs do clculo das probabilidades. Entre as principais caractersticas, podemos destacar: admite erro processual positivo e tem confiabilidade menor que 100%, barata, rpida e atualizada. sempre vivel.Dados EstatsticosNormalmente, no trabalho estatstico, o pesquisador se v obrigado a lidar com grande quantidade de valores numricos resultantes de um censo ou de uma amostragem. Estes valores numricos so chamadosdados estatsticos.Nosentidodadisciplina, aEstatsticaensinamtodosracionaisparaaobtenodeinformaesa respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir tomada de decises, atravs dos dados estatsticos observados. Desta forma, a estatstica pode ser dividida em duas reas: Estatstica Descritiva e Estatstica Inferencial.Estatstica Descritiva a parte da Estatstica que tem por objetivo descrever os dados observados. A Estatstica Descritiva, na sua funo de descrio dos dados, tem as seguintes atribuies: A obteno dos dados estatsticos; A organizao dos dados; A reduo dos dados; A representao dos dados e A obteno de algumas informaes que auxiliam a descrio do fenmeno observado.3A obteno ou coleta dos dados normalmente feita atravs de um questionrio ou de observao direta de uma populao ou amostra. A organizao dos dados consiste na ordenao e crtica quanto correo dos valores observados, falhas humanas,omisses,abandono de dados duvidosos,etc. Areduo dos dados envolve o entendimento e a compreenso de grande quantidade de dados atravs de simples leitura de seusvalores individuais uma tarefa extremamente rdua e difcil mesmo para o mais experimentado pesquisador. A representao dos dados compreende detcnicas para uma melhor visualizao dos dados estatsticos, facilitando sua compreenso. Por exemplo, os grficos, quando bem representativos, tornam-se importantesinstrumentosdetrabalho. aindaatributodaEstatsticaDescritivaaobtenodealgumas informaes que sumarizam os dados, facilitando a descrio dos fenmenos observados.Estatstica Inferencial (ou Indutiva) a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partir de uma amostra. Complementando o processo descritivo, a Estatstica Indutiva estuda parmetros a partir do uso de estimadores usando o clculo das probabilidades, elemento este que viabiliza a Inferncia Estatstica.Dadosou Variveis EstatsticasAsinformaesoudadoscaractersticosdosfenmenosoupopulaessodenominadosvariveis estatsticasou simplesmentevariveis. Conforme suas caractersticas particulares, podem ser classificadas da seguinte forma: Quantitativas - So aquelas que podem ser expressas em termos numricos. Em geral so as resultantes de medies, enumeraes ou contagens. So subdivididas emcontnuas e discretas,conforme abaixo:o Contnuas - so aquelas que podem assumir qualquer valor num certo intervalo de medida,podendo ser associados ao conjunto dos nmeros reais, ou seja, um conjunto no enumervel. Entre outras,enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, rea, volume, peso, velocidade,dosagem de hemoglobina no sangue, concentrao de flor na gua oferecida populao, etc.o Discretas - quando s podem assumir determinados valores num certo intervalo, ou seja, umconjuntofinitoouenumervel. Emgeral, representamnmeros inteiros resultantesdeprocessode contagem, como o nmero de alunos porsala, de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc.De modo geral, as medies do origem a variveis contnuas e as contagens ou enumeraes, a variveis discretas. Designamos estas variveis por letras latinas, em geral, as ltimas: X, Y, Z. Qualitativas- Nem sempre os elementos de uma populao so exclusivamente contveis.Muitas vezes, eles podem ser qualificados tambm segundo algumas de suas caractersticas tpicas. Nesses casos, as variveis podem ser agrupadas em nominais ou ordinais (por postos)o Nominais - quando puderem ser reunidas em categorias ou espcies com idnticos atributos.Aqui se incluem os agrupamentos por sexo, rea de estudo, desempenho, cor, raa, nacionalidade e religio.o Ordinais- quando os elementos foremreunidos segundo a ordememque aparecem dispostos numa lista ou rol. So tpicas desta forma de agrupamento, variveis como classe social, grau de instruo, entre outras.Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de varivel. Assim, os inscritosnum vestibular,por exemplo, podem sercontados,medidosoupesados,podem seragrupadossegundo o sexo ou rea de estudo e podem ainda ser classificados segundo as notas obtidas nas provas prestadas.3.2 Fases do Experimento EstatsticoEm linhas gerais, podemos distinguir no mtodo estatstico as seguintes etapas:3.2.1 Planejamento o trabalho inicial de coordenao no qual define-se a populao a ser estudada estatisticamente,formulando-se o trabalho de pesquisa atravs da elaborao de questionrio, entrevistas, etc. A organizao do plano geral implica em obter respostas para uma srie tradicional de perguntas,antes mesmo do exame das informaes disponveis sobre o assunto, perguntas que procuram justificar a necessidade efetiva da pesquisa, a saber:4- "quem","o que","sempre","por que","para que","para quando". Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter informaes acerca do desempenho em Matemtica dos estudantes matriculados na rede pblica de ensino. O primeiro trabalho da equipe encarregada da pesquisa, ser evidentemente, o de obter respostas para aquelas perguntas. Seriam ento:- Quem deseja as informaes?- O que devemos perguntar no questionrio?- A pesquisa ser peridica ou ocasional? Ser executada sempre?- Por que desejam as informaes?- Quando dever estar concluda a pesquisa?- Qual a poca oportuna para a aplicao dos questionrios?- Para que desejam as informaes?Ainda na fase do planejamento, temos: Oexame das informaes disponveis: trabalho inicial de coleta de trabalhos ou publicaes sobre o assunto, obtendo-se relatrios sobre atividades semelhantes ou correlatas; A DefiniodoUniverso, isto, saber qual oconjuntoaser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em subpopulaes, para permitir um trabalho maisfcil, mais lgico, mais racional; Otipo de levantamento,CensoouAmostragem, dever ser decidido coma devida antecedncia e a necessria anlise das vantagens e desvantagens de um e de outro,em virtude do custo financeiro e do prazo determinado para a concluso do trabalho.3.2.2 Coleta de DadosAps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dadosnumricos necessrios sua descrio.A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza os recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestar, a frequncia de sua ocorrncia, e outras particularidades julgadas importantes.Quando os dados se referirem ou estiverem em poder de pessoas,sua coleta poder ser realizada medianterespostasaquestionriospreviamenteelaborados. Essesquestionriospodemserenviadosaosentrevistados para devoluo posterior ou podemser aplicados pelos prprios pesquisadores ou por entrevistadores externos ou contratados.Os dados ou informaes representativas dos fenmenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por via indireta.1.Por via direta - quando feita sobre elementos informativos de registro obrigatrio (p. ex.: fichas no servio de ambulatrio,nascimentos, casamentos,bitos,matrculasde alunos etc.)ou, ainda,quandoosdadosso coletados pelo prprio pesquisadoratravsdeentrevistas ou questionrios. Acoletadiretade dados, com relao ao fator tempo, pode ser classificada em:1.1.Contnua - tambm denominada registro, feita continuamente, tal como a de nascimentos e bitos,etc. Tambmsodotipocontnuooregistrodecertasdoenas, comocncer, hansenase, tuberculosee tambm algumas doenas infecciosas agudas com finalidade de controle.1.2.Peridica - quando feita em intervalos constantes de tempo, como os censos(de 10 em 10 anos), os balanos de uma farmcia, etc.;1.3.Ocasional -quandofeita extemporaneamente, a fimde atender a uma conjuntura oua uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos52.Por via indireta - quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.3.2.3 Crtica dos DadosOs dados colhidos por qualquer via ou forma e no previamente organizados so chamados dedados brutos. Essesdadosbrutos, antesdeseremsubmetidosaoprocessamentoestatsticopropriamentedito, devem ser"criticados", visando eliminar valores imprprios e erros grosseiros que possam interferir nos resultados finais do estudo.A crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas; interna quando se observa o material constitudo pelos dados coletados. o caso, por exemplo, da verificao de somas de valores anotados.3.2.4 Apurao ou Processamento dos DadosUma vez assegurado que os dados brutos so consistentes, devemos submet-los ao processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode sermanual, eletromecnica ou eletrnica.Os processos e mtodos estatsticos a que um conjunto de dados pode ser submetido sero nosso objeto de estudo nas sees seguintes. 3.2.5 Exposio ou Apresentao dos DadosPor mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob formaadequada(tabelasougrficos), tornandomais fcil oexamedaquiloqueestsendoobjetode tratamento estatstico. No caso particular da estatstica descritiva, o objetivo do estudo se limita, na maioria dos casos, simples apresentaodos dados, assimentendida a exposioorganizadaeresumida das informaes coletadas atravs de tabelas ou quadros, bem como dos grficos resultantes.Anlise dos ResultadosComo jdissemos, oobjetivo ltimoda Estatstica tirarconclusessobreotodo (populao)a partir deinformaes fornecidaspor parterepresentativadotodo(amostra). Assim, realizadasasfases anteriores(EstatsticaDescritiva), fazemosumaanlisedosresultadosobtidos, atravsdosmtodosda Estatstica Inferencial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.3.3 Estatstica DescritivaA EstatsticaDescritivaapartedaestatsticaqueseocupacomacoleta, crtica, ordenaoe apresentao das informaes fundamentais caracterizao e descrio do fenmeno que se deseja estudare interpretar. Aqui se trabalhar com alguma caracterstica notvel do objeto de estudo, a qual ter de sercoletada de alguma forma e em algum lugar. Na coleta das informaes deve-se considerar,preferencialmente, toda a populao; caso a obteno de dados sobre toda a populao (censo) seja difcil ou at mesmo impossvel (dado o grande nmero de elementos ou a sua disperso no tempo ou no espao), o estudo poder ser feito com base numa amostra representativa.3.3.1 Distribuies de FrequnciaOs dados numricos, aps coletados, so colocados em srie e apresentados em tabelas ou quadros.Quando se estuda uma varivel (qualitativa ou quantitativa), o maior interesse do pesquisador conhecer a distribuiodessavarivel atravs das possveis realizaes (valores) damesma. Iremos, pois, ver uma maneira de se dispor um conjunto de valores, de modo a se ter uma boa ideia global sobre esses valores, ou seja, de sua distribuio. Uma distribuio de frequncias pode ser apresentada nas seguintes maneiras: 6 Distribuio de Frequncias por Valores (varivel qualitativa ou quantitativa discreta): construda considerando-se todos os diferentes valores ou categorias, levando emconsiderao suas respectivas repeties. Distribuio de Frequncias por Intervalos ou Classes(varivel quantitativa): Constroem-se classes de valores, levando em considerao o nmero de valores que pertencem a cada classe e quando a variabilidade dos dados grande. A construo de tabelas de frequncias para variveis contnuasnecessita de certos cuidados.Exemplo 1.1 - A tabela 01 apresenta a distribuio de frequncia da varivel PROCEDNCIA, a partir dos dados do Quadro 1Quadro 1- Informaes sobre sexo, curso, idade (anos), procedncia, renda familiar, nmero de disciplinas matriculado(a),peso(kg)ealtura(cm) de46alunosmatriculadosnadisciplinaCLCULO DAS PROBABILIDADE E ESTATSTICA (CPE) - perodo 97.1 turma 01 ID SEXO CURSO IDADE(Anos)PROCEDNCIA RENDA FAMILIARNO. DISCIP. MATRIC.PESO(kg)ALTURA (cm)1 Fem Fsica 19 Interior Mdia 6 47 1562 Masc Matem. 18 Capital Mdia 6 75 1673 Fem Matem. 18 Outra Regio Mdia 6 61 1694 Fem Matem. 18 Capital Mdia 6 56 1635 Masc Matem. 18 Capital Mdia 6 80 1786 Fem Matem. 20 Interior Mdia 6 44 1587 Fem Matem. 20 Interior Mdia 6 52 1588 Masc Matem. 19 Capital Mdia 6 67 1749 Fem Matem. 19 Outra Regio Mdia 3 48 16710 Masc Matem. 18 Capital Mdia 6 83 18011 Fem Matem. 18 Capital Mdia 6 53 16312 Masc Matem. 21 Outra Regio Mdia 5 66,5 17513 Masc Matem. 18 Interior Mdia 6 78 18014 Fem Matem. 18 Interior No Info. 6 46 15815 Fem Matem. 18 Capital Mdia 6 54 16016 Fem Matem. 19 Capital Mdia 6 56 16217 Fem Matem. 19 Capital Mdia 7 53 16018 Fem Matem. 18 Capital Mdia 6 57 16419 Fem Fsica 23 Outra Regio Mdia 6 53 16020 Masc Matem. 18 Interior Mdia 6 76 18021 Masc Matem. 21 Outra Regio Mdia 6 65 17122 Masc Matem. 19 Capital Mdia 6 78,5 18023 Masc Matem. 19 Outra Regio Mdia 6 104 18324 Fem Matem. 17 Interior Mdia 6 47,5 1557Tabela01-FrequnciasePercentuaisdos46EstudantesdeCPETurma 01- Perodo: 97.1, segundo a Regio de ProcednciaPROCEDNCIANO Estudantes ( Fi ) Percentual( fi %)Capital 20 43,5Interior 16 34,8Outra Regio 10 21,7Total 46 100,0FONTE: Quadro 125 Masc Matem. 18 Interior Baixa 6 67,5 17526 Masc Matem. 19 Outra Regio Mdia 6 61 16027 Masc Matem. 17 Interior No Info. 6 68 16928 Masc Matem. 21 Interior Mdia 5 75 17829 Fem Matem. 18 Interior Mdia 5 58 15430 Masc Matem. 21 Outra Regio Mdia 6 65 16531 Masc Matem. 21 Capital Mdia 6 67 17832 Fem Matem. 18 Capital Alta 6 47 16733 Masc Matem. 21 Capital Mdia 5 69 17934 Fem Matem. 19 Outra Regio Mdia 6 68 17035 Masc Matem. 18 Capital Mdia 6 53 16636 Fem Matem. 17 Capital Mdia 6 51 15337 Fem Matem. 19 Capital Mdia 6 63 16838 Masc Matem. 19 Capital Mdia 6 60 16639 Masc Matem. 18 Capital Mdia 6 72 17440 Masc Matem. 21 Interior Mdia 5 54 16341 Masc Matem. 18 Interior Baixa 6 60 16542 Masc Matem. 19 Interior Mdia 6 75 18143 Fem Matem. 18 Capital Mdia 6 52 16044 Masc Matem. 18 Outra Regio Mdia 6 100 17545 Masc Matem. 22 Interior Mdia 6 80 17946 Masc Matem. 21 Interior Mdia 6 50 166FONTE: Questionrio aplicado - aula 24/03/97Exemplo1.2- Atabela02apresentaadistribuiodefrequnciadavarivel NODEDISCIPLINAS MATRICULADO(A), a partir dos dados do quadro 1 (Dados Agrupados sem Intervalos)OBS.: ==> letra grega "SIGMA", indica total ou somatrio.Regras Bsicas paraElaboraodeumaDistribuiodeFrequncias porClasses ouIntervalos (Dados Agrupados em Intervalos)1. Colete n dados referentes varivel cuja distribuio ser analisada. aconselhvel quen seja superior a 50 para que possa ser obtido um padro representativo da distribuio.2. Efetua-se um ROL ESTATSTICO (ordenao crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda no organizados numericamente).3. Identifique o menor valor( )minXe o maior valor ( )maxX da amostra.4. Calcule a AMPLITUDE TOTAL dos dados( ) AT :min maxX X AT 8Tabela 02 - Frequncias e Percentuais do N0 de Disciplinas Matriculadas dos 46 Estudantes de CPE Turma 01- Perodo: 97.1.No DISC. MATRIC. (Xi)NO Estudantes ( Fi ) Percentual ( fi %)3 1 2,25 5 10,96 39 84,87 1 2,2Total ou 46 100,0FONTE: Quadro 15. Escolhe-se convenientemente o nmero de classesk (inteiro); 15 5 k , onde podemos tomar:n k ou( ) n k log 3 , 3 1+ , se50 n6. Calcule o comprimento de cada classe dos dados( ) h :kATh aconselhvel construir classes de mesma amplitude.7. Efetua-se o AGRUPAMENTO EM CLASSES, calculando os limites de cada classe:1 Classe:Limite Inferior: min 1X LI Limite Superior:h LI LS + 1 12 Classe:Limite Inferior: 1 2LS LI Limite Superior:h LI LS + 2 2i-sima Classe:Limite Inferior: 1 i iLS LILimite Superior:h LI LSi i+ Continueestesclculos at que seja obtido umintervalo quecontenhaomaiorvalordaamostra ( )maxXentre seus limites.8. Construa a tabela de distribuio de frequncias.Uma tabela de distribuio de frequncias (por classes ou valores), dever conter as seguintes colunas: Nmero de ordem de cada classe (i) ou valor; Limites de cada classe (no caso da distribuio de frequncias por classes)o As classes so fechadas esquerda e abertas direita.o As observaes iguais ao limite superior da classe i-1, o qual igual ao limite inferior da classe i, pertencem classe i. NOTAO: |------. Ponto Mdio ipm da i-sima classe denotado por: 2i iiLS LIpm+ Tabulao: contagem dos dados pertencentes a cada classe ou a quantidade de vezes que o valor se repete. Frequncia simples ou absoluta ( )iF da i-sima classe ou do i-simo valoriFnmero de observaes da i-sima classe (ou do i-simo valor) Observe que: n Fkii 1 Frequncia Relativa ( )if da i-sima classe (ou do i-simo valor)ifnmero de observaes da i-sima classe (ou do i-simo valor) dividido pelo tamanho da amostra, isto , nFfii Observequeasomadetodososvaloresdeifdeveserigual a1, ouseja,11kiif. Multiplicando cadaif por 100 obtm-se o percentual da classe (ou valor) correspondente, isto , 100 % i if f . Existem outros tipos de frequncias que tambm podem ser calculadas: Frequncia Simples Acumulada (do tipo abaixo de):frequncia simples acumulada da i-sima classe ou valori iF F F Fac + + + 2 1 Frequncia Relativa Acumulada: frequncia relativa acumulada da i-sima classe ou valor. i if f f fac + + + 2 1.9Normas Tcnicas para Apresentao TabularDe um modo geral tem-se a destacar em uma tabela (disposio escrita que se obtm referindo-se a uma coleodedados numricos auma determinada ordemdeclassificao) os seguintes elementos essenciais (obrigatrios) e complementares (no-obrigatrios): Elementos essenciais: Ttulo: Indicao que precede a tabela e que contm a designao do fatoobservado, o local e a poca em que foi registrado. Cabealho: Parte superior da tabela que especifica o contedo das colunas. Coluna Indicadora: Parte da tabela que especifica o contedo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a varivel em estudo. Fonte: Entidade responsvel pela informao. Elementos complementares:o Notas: Informaesdenaturezageral destinadasaconceituar ouesclarecer ocontedodas tabelas ou a indicar a metodologia adotada no levantamento ou na elaborao dos dados.o Chamadas: Informaes de natureza especfica sobre determinada parte da tabela, destinada a conceituar ou a esclarecer dados.o Sinais Convencionais:Nenhuma casa da tabela deve ficar em branco, apresentando sempre um smbolo, a saber: (hfen): quando o valor numrico nulo;(reticncia): quando no se dispe de dado; ? (ponto de interrogao): quando h dvidas quanto exatido do valor numrico;0,0: quando o valor numrico muito pequeno para ser expresso pela unidade utilizada. Se os valores so expressos em nmeros decimais, acrescenta-se o mesmo nmero de casas decimais ao valorzero; x (letra x): quando o dado for omitido a fim de evitar individualizao da informao. As tabelas apresentadas oficialmente devem atender s normas da ABNT (resoluo 886 de 20/10/60).Exemplo1.3Elaboreumatabeladedistribuiodefrequncias(dadosagrupadosemintervalos) da varivel ALTURA (em cm), dos 46 estudantes de CPE, turma 01 Perodo 07.1, usando-se os dados do Quadro 1.10Soluo:Passo 1: Estabelecer o nmero de classes: 7 46 kPasso 2: Amplitude Total: 30 153 183 ATPasso 3: Amplitude das Classes: 3 , 4730 kAThPasso 4: Construo da Tabela de Distribuio de FrequnciasTabela 03 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo: 97.1.ALTURA (Xi)NO Estudantes ( Fi ) Percentual ( fi %)153,0 |----- 157,3 4 8,7157,3 |----- 161,6 8 17,4161,6 |----- 165,9 7 15,2165,9 |----- 170,2 10 21,7170,2 |----- 174,5 3 6,5174,5 |----- 178,8 6 13,0178,8 |----- 183,1 8 17,4Total ou 46 100,0FONTE: Quadro 1Exemplo1.4- Elaboreumatabeladedistribuiodefrequncias(dadosagrupadosemintervalos) da varivel IDADE (em anos) de 33 estudantes de CPE, conformeDados Brutos abaixo: A Tabela 5, a seguir, um exemplo de como calcular os outros tipos de frequncias a partir da Tabela 3Exemplo 1.53.3.2Representao Grfica de Distribuies de FrequnciaO grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo produzir, no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em estudo..Paratornarmospossvel umarepresentaogrfica, estabelecemosumacorrespondnciaentreos termosdasrie(Tabela)edeterminadafigurageomtrica, detal modoquecadaelementodasrieseja representado por uma figura proporcional.11DADOS BRUTOS ROL DE DADOS ORDENADOS22 25 23 22 23 26 25 3323 35 20 21 22 22 22 22 2222232327 24 24 22 24 22 24 2122 28 23 24 24 24 24 24 2425252530 25 28 29 24 25 20 2734 26 25 26 26 27 27 28 2829303036 30 22 34 35 36Soluo:Passo 1: Estabelecer o nmero de classes: 6 33 kPasso 2: Amplitude Total: 16 20 36 ATPasso 3: Amplitude das Classes: 7 , 2616 kAThPasso 4: Construo da Tabela de Distribuio de FrequnciasTabela 04 - Distribuio de Frequncias das IDADES de 33 Estudantes de CPE, Perodo: 97.1.IDADE (Xi)Fi 20,0 |----- 22,7 822,7 |----- 25,4 1325,4 |----- 28,1 628,1 |----- 30,8 330,8 |----- 33,5 033,5 |----- 36,2 3Total ou 33FONTE: Quadro 1Soluo:Tabela 05 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo: 97.1.ALTURA (Xi)Freq. AbsolutaFiFreq. RelativafiFreq. Percentualfi %Freq. Abs. Acum.FaciFreq. Relat. Acum.faciPonto Mdiopmi153,0 |----- 157,3 4 0,087 8,7 4 0,087 155,15157,3 |----- 161,6 8 0,174 17,4 12 0,261 159,45161,6 |----- 165,9 7 0,152 15,2 19 0,413 163,75165,9 |----- 170,2 10 0,217 21,7 29 0,630 168,05170,2 |----- 174,5 3 0,065 6,5 32 0,695 172,35174,5 |----- 178,8 6 0,130 13,0 38 0,825 176,65178,8 |----- 183,1 8 0,174 17,4 46 1,000 180,95Total ou 46 1,000 100,0 - - -FONTE: Quadro 1RequisitosA representao grfica de um fenmeno deve obedecer aos seguintes requisitos primordiais: Simplicidade - indispensvel devido necessidade de levar a uma rpida apreenso do sentidogeral dofenmenoapresentadoafimdenonosperdermosnaobservaodeminciasde importncia secundria; Clareza - o grfico deve possibilitar uma correta interpretao dos valores representativos do fenmeno em estudo; Veracidade - indispensvel qualquer comentrio, postoque, senorepresentauma realidade, perde o grfico sua finalidade.Os principais tipos de grficos estatsticos para as distribuies de frequncias so os diagramas, que so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso s do sistema cartesiano. Dentre os principais tipos de diagramas, destacamos:Variveis Qualitativas:Para representarmos as variveis qualitativas graficamente usamos os grficos de Barras, Colunas, Setores ou Linha. GrficoemBarrasouColunas:arepresentaodeumasriepormeioderetngulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas); GrficodeSetores:ogrficoquerepresentaaspartesdeumtodo, porsetoresdeum crculo, visando justamente comparar estas partes entre si em relao ao todo. Grfico de Linha:til na representao de tabelas ou sries que evoluem ao longo do tempo (sries temporais), possibilitando a identificao de tendncias.Exemplo 1.6: Construindo um Grfico de Barras0510152025Capital Interior Outra RegioNum. EstudantesProcednciaProcedncia dos Estudantes de CPE - Per. 97.1FONTE: Quadro 1Exemplo 1.7: Construindo um Grfico de SetorCapital43%Interior35%Outra Regio22%Procedncia dos Estudantes de CPE - Per. 97.1FONTE: Quadro 112Variveis Quantitativas Discretas:para representarmos as variveis quantitativas discretas graficamente usamos grficos em Barras ou Colunas; Contnuas: para representarmos as variveis quantitativas contnuas graficamente usamos o Histograma ou o Polgono de Frequncias.Histogramaarepresentaogrficadeumadistribuiodefrequncias devarivel quantitativacontnua (dadosagrupadosemintervalos) por meioderetngulosjustapostos, centradosnospontosmdios das classes e cujas reas so proporcionais s frequncias das classes.Exemplo 1.8: Construindo um Histograma024681012155.15 159.45 163.75 168.05 172.35 176.65 180.95Frequencia AbsolutaAltura (cm)Distribuio das Alturas dos Estudantes de CPE, Per. 97.1FONTE: Quadro 1Polgono de Frequnciaarepresentaogrficadeumadistribuiodefrequncias devarivel quantitativacontnua (dados agrupados em intervalos) por meio de uma linha poligonal fechada ou polgono, cuja rea total igual do histograma.Exemplo 1.9: Construindo um Polgono de Frequncias024681012150.85 155.15 159.45 163.75 168.05 172.35 176.65 180.95 185.25Frequencia AbsolutaAltura (cm)Distribuiodas Alturasdos Estudantesde CPE,Per. 97.1 FONTE: Quadro 1133.4 Medidas EstatsticasVimos anteriormentea sintetizaodos dados soba forma detabelas,grficos e distribuies de frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes numricas), relativos observao de determinado fenmeno de forma reduzida.Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais importantes, citamos as Medidas de Tendncia Central, que recebem tal denominao pelo fato dos dados observados tenderem,em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendncia central, destacamos:Mdia aritmtica ou Mdia;Moda;Mediana.As outras medidas de posio so as SEPARATRIZES, que englobam:a mediana;os quartis;os percentis.3.4.1 Medidas de Tendncia CentralMdia Aritmtica (ou simplesmente MDIA)Notao: X = a mdia da amostra ou mdia amostral = a mdia da populao ou mdia populacional(a) Distribuio de Frequncias por ValorSejam kx x x , , ,2 1 as medidas da varivel de interesse, realizadas para uma amostra de tamanho n extrada de uma populao. Definimos a mdia da amostra( ) Xcomo:kiikii iFF xX11 ou, simplesmente, nF xXkii i 1onde:ix o i-simo valor da varivel de interesse;iF a frequncia absoluta do i-simo valor;n o tamanho da amostra.Exemplo 1.11 : Determinar a mdia do seguinte conjunto (amostra) de valores11 , 10 , 8 , 7 , 3Logo, 8 , 7511 10 8 7 3+ + + + nXXiExemplo 1.12 : Determinar a mdia do seguinte conjunto (amostra) de valores2 , 8 , 5 , 2 , 8 , 5 , 2 , 2 , 8 , 3 , 5 , 8 , 2 , 2 , 2 , 5 , 8 , 8 , 3 , 2Ento: Dados Agrupados sem Intervalosxi iFi iF x 2 8 163 2 65 4 208 6 48 20 90145 , 420904141 XFF xXiiii i e2041 iiF n(b) Distribuio de Frequncias por ClassesSejam kpm pm pm , , ,2 1 ospontos mdiosdasclasses,ocorrendocom frequnciaskF F F , , ,2 1 , respectivamente, de modo que kiin F1. Definimos a mdia da amostra( ) Xcomo:kiikii iFF pmX11 ou, simplesmente, nF pmXkii i 1onde:ipm o ponto mdio da i-sima classe;iF a frequncia absoluta da i-sima classe;n o tamanho da amostraVantagens e Desvantagens da Mdia uma medida de tendncia central que, por uniformizar os valores de um conjunto de dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente influenciada pelos valores extremos (grandes)do conjunto. Almdisso, no pode ser calculada para distribuies de frequncias com limites indeterminados (indefinidos).Propriedades:1. A soma dos desvios tomados em relao mdia nula, isto ,( )X Xiin 10.2. Somando-seousubtraindo-seumaconstante catodos osvaloresde umavarivel,amdia do conjunto fica aumentada ou diminuda dessa constante, isto ,Y X c Y X ci i t t .3. Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante c, a mdia doconjuntoficamultiplicadaoudivididapor essaconstante, isto, c X Y c X Yi i ou cXYcXYii , para0 c .Exemplo1.13:Utilizandoos dadosapresentadosnaTabela5, determineaALTURAMDIAdos33 estudantes de Estatstica Vital - 97.1 turma 06ALTURA (Xi)Freq. AbsolutaFiPonto Mdiopmii iF pm153,0 |----- 157,3 4 155,15 620,60157,3 |----- 161,6 8 159,45 1275,60161,6 |----- 165,9 7 163,75 1146,25165,9 |----- 170,2 10 168,05 1680,50170,2 |----- 174,5 3 172,35 517,05174,5 |----- 178,8 6 176,65 1059,90178,8 |----- 183,1 8 180,95 1447,60Total ou 46 - 7747,50Ento:42 , 1684650 , 774711 kiikii iFF pmX cm 15ModaNotao:MoDado um conjunto ordenado de valores. A moda (so) o(s) valor(es) que ocorre(m) com maior frequnciano conjunto de dados, ou seja (so) o(s) valor(es) mais frequente(s) do conjunto de dados.Exemplo 1.14: Determine a moda dos seguintes conjuntos de dados abaixoa) 2, 2, 3, 3, 5, 5, 8, 8 No existe moda (ou amodal)b) 2, 2, 3, 5, 5, 5, 8, 8 5 Moc) 2, 2, 2, 3, 3, 5, 5, 5, 8 2 Moe5 MoObservao:i) A moda de um conjunto de dados pode no existir(figura 1 (a) )ii) A moda de um conjunto de dados pode no ser nica(figura 1 (c) )Figura 1: Caracterizao de Dados quanto modaClculo da Moda em uma Distribuio de Frequncias por ClassesEm uma distribuio de frequncias com dados agrupados em classes, denominamos classe modal a classe que possui a maior frequncia, e, consequentemente, ser esta classe que conter a moda.Exemplo 1.15: Utilizando os dados apresentados na Tabela 5, apresentamos o clculo determine a ALTURA MODAL (Moda) para dados agrupados em intervalos, a partir da frmula de Czuber apresentada na Figura 2.Figura 2: Clculo da moda para dados distribudos em classesSoluo:16FRMULA de CZUBER (interpretao geomtrica atravs de Histograma)mo moh L Mo

,_

+ + 2 11onde:moL: limite inferior da classe modalmoh: amplitude da classe modalanterior alF F mod 1posterior alF F mod 2A Classe modal ser o intervalo com maior frequencia absoluta (Fi). Neste caso a classe modal (4a) ser165,9 |----- 170,2 9 , 165 moL , 3 , 4 moh , 3 7 10mod 1 anterior alF F e 7 3 10mod 2 posterior alF F.Da,19 , 167 3 , 47 339 , 1652 11

,_

++

,_

+ + mo moh L Mocm.Vantagens e Desvantagens da Moda Nodependedetodos os valores doconjuntodedados, podendomesmo nosealterar coma modificao de alguns deles; No influenciada por valores extremos (grandes) do conjunto de dados Pode ser calculada para distribuies com limites indeterminados (indefinidos) na maioria dos casos.MedianaNotao:MeConsidere um conjunto de dados ordenado constitudo de n valores. A mediana o valor que divide o conjunto em duas partes iguais (isto , em duas partes de 50% cada).1 Caso: n mparPara a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana o valor central, isto ,Me= elemento que est na posio 21 + n.2 Caso: n parPara a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana a mdia aritmtica dos valores centrais, isto ,Me= mdia aritmtica entre os elementos das posies 2n e12+n.3o Caso: Clculo da Medida em uma Distribuio de Frequncias por ClassesNo caso de dados agrupados, relembramos que uma distribuio de frequncias pode ser representada por meio de um Histograma. Dizemos ento que a mediana ser o valor deX(abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais.Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe mediana a classe que contm o elemento que est na posio 2n e, consequentemente, ser esta a classe que conter a mediana.Figura 3: Clculo da mediana para dados distribudos em classesmemeantmehFFacnLI Me

,_

+ 2onde: meLI o limite inferior da classe mediana; meF a frequncia absoluta da classe mediana;antFac a freq.absoluta acumulada da classe anterior classe mediana; meh a amplitude da classe mediana;n o nmero de observaes.17Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de acordo com a frmula dada na figura 3.Propriedades da Mediana1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados;2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.Exemplo 1.16:Determinar a ALTURA MEDIANA dos 46 estudantes da turma de CPE, - Perodo: 97.1, conforme os dados agrupados na tabela 5.Classe mediana a classe que contm o elemento que est na posio 2n, ou seja, a classe mediana a classe que contm o elemento que est na 23 posio. Logo, a classe mediana ser a 4: 165,9 |----- 170,2 (Classe mediana: primeira classe que ultrapassar 50% (n/2) oumais das observaes)9 , 165 meLI 10 meF 3 , 4 meh19 antFEnto:62 , 167 72 , 1 9 , 165 3 , 410192469 , 1652 +

,_

+

,_

+ memeantmehfFnLI Me cm.3.4.2 Medidas de DispersoNoitemanterior, aprendemos a calcular e entender convenientemente as medidas de posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a moda e a mediana.Sejam quatro conjuntos A, B, C e D com os seguintes valores:ConjuntoA====>7, 7, 7, 7, 7ConjuntoB====>5, 6, 7, 8, 9ConjuntoC====>4, 5, 7, 9, 10ConjuntoD====>0, 5, 10, 10, 10Para representarmos cada conjunto, podemos calcular a sua respectiva mdia aritmtica, encontrando X X X X A B C D 7 .Vemos assim que, apesar de constitudos de valores diferentes, os grupos revelam uma mesma mdia aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo, isto , conjunto de dados, osvaloressedistribuemdiferentementeemrelaomdia. Necessitamosassimdeumamedidaestatstica complementar para melhor caracterizar cada conjunto apresentado.As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto de dados so as medidas de disperso ou de variabilidade, onde se destacam a amplitude total, a varincia, o desvio padro e o coeficiente de variao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais disperso (ou menos homogneo ) aquele que tem a maior medida de disperso.Amplitude TotalNotao:ATMedida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em classes, definida por:min maxX X AT ,onde:maxX o maior valor do conjunto de dados e minX o menor valor do conjunto de dados.18VarinciaNotao: 2S a varincia da amostra ou varincia amostral 2 a varincia da populao ou varincia populacionalA varincia de um conjunto de dados (amostra ou populao ) mede a variabilidade do conjunto em termos dedesviosquadradosemrelaomdiaaritmtica. umaquantidadesemprenonegativae expressa em unidades quadradas do conjunto de dados, sendo de difcil interpretao.Distribuio de Frequncias por valorSejam kx x x , , ,2 1 as medidas da varivel de interesse, realizadas para uma amostra de tamanho n extrada da populao considerada. Definimos a varincia da amostra( )2Scomo:( )1122 nF X xSkii ionde:ix o i-simo valor da varivel de interesse;iF a frequncia absoluta do i-simo valor;X a mdia da amostra;n o tamanho da amostra.Observao:A equao acima utilizada quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para uma respectiva populao. Distribuio de Frequncias por ClassesSejam kpm pm pm , , ,2 1os pontos mdios das classes, ocorrendo com frequncias kF F F , , ,2 1de modo que kiin F1. A varincia da amostra( )2S definida por como:( )1122 nF X pmSkii ionde:ipm o ponto mdio da i-sima classe;iF a frequncia absoluta da i-sima classe;X a mdia da amostra; n o tamanho da amostra.Desvio-PadroNotao:S o desvio-padro da amostra ou desvio-padro amostral o desvio-padro da populao ou desvio-padro populacional uma outra medida de disperso mais comumente empregada do que a varincia, por ser expressa na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e obtida a partir da varincia.Desvio Padro = Varincia(Raiz quadrada da Varincia ).Assim, 2S SCoeficiente de Variao uma medida que expressa a variabilidade em termos RELATIVOS, comparando o desvio-padro com a mdia:19% 100 XSCV , sendo que 0 X.Notequeimportanteexpressar avariabilidadeemtermos relativosporque, por exemplo, um desvio-padro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas pode serconsiderado muito elevado se esta magnitude for da ordem de 10.Observe tambmque o coeficiente de variao adimensional e por este motivo permite a comparao das variabilidades de diferentes conjuntos de dados.Comentrios sobre as principais Medidas de Tendncia Central e Disperso1.O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma populao estatstica. Suamdiaamdiapopulacional, usualmenterepresentadapelaletragrega.Nagrande maioria das situaes prticas, a mdia populacional desconhecida e deve ser estimada a partir de dadosamostrais. Se a amostra for extrada de forma adequada, a mdia amostral X uma boa estimativa de . 2.Comparandoamdiaeamediana, temosqueamedianapoucosensvelpresenadevaloresmuito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a esta situao. Para ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:5 14 47 61 122 620A mediana deste conjunto de dados :54261 47+ Meenquanto que a mdia dada por:8 , 14468696620 122 61 47 14 5 + + + + + X .Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia somente este dado maior do que a mdia, o que ento no sintetiza de forma adequada as informaes contidas na massa de dados. Portanto, neste exemplo, a mediana parece ser a melhor medida para indicar a localizao dos dados.De modo geral,quando ohistograma construdo para os dadosdaamostra dotipo assimtrico, devemos preferir a mediana como medida de tendncia central.3.A amplitude,apesarde sermuito fcil de calcular, tem a desvantagem delevar emconsiderao apenas os dois valores extremos (mximo e mnimo) da massa de dados, desprezando os demais. 4.Avarincia populacional representada por2 . Usualmente, a varincia populacional desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extrada de forma adequada,a varincia amostral 2S uma boa estimativa de 2.5.As medidas X,2S eS tomadas na amostra, denominadas ESTATSTICAS, so estimativas dos PARMETROS POPULACIONAIS , 2 e (supostos desconhecidos). Exemplo1.17:UtilizandoosdadosapresentadosnaTabela5, determineaVARINCIA, oDESVIO-PADRO e o COEFICIENTE DE VARIAO DAS ALTURAS dos 46 estudantes de CPE - 97.ALTURA (Xi)Freq. AbsolutaFiPonto Mdiopmii iF pmi iF pm2153,0 |----- 157,3 4 155,15 620,60 96286,09157,3 |----- 161,6 8 159,45 1275,60 203394,42161,6 |----- 165,9 7 163,75 1146,25 187698,44165,9 |----- 170,2 10 168,05 1680,50 282408,03170,2 |----- 174,5 3 172,35 517,05 89113,57174,5 |----- 178,8 6 176,65 1059,90 187231,34178,8 |----- 183,1 8 180,95 1447,60 261943,22Total ou 46 - 7747,50 1308075,1020A expresso ( )1 12112122

,_

nnF pmF pmnF X pmSkii ikii ikii i. Assim,( )22121 22cm 35 , 714583 , 32101 46465 , 774710 , 13080751

,_

nnF pmF pmSkikii ii i .Logo,cm 44 , 8 cm 35 , 712 2 S Se % 01 , 5 % 100cm 42 , 168cm 44 , 8% 100 XSCVExemplo 1.18:Uma fbrica classifica operrios de acordo com os graus obtidos em testes de aptido. Os dados so apresentados na distribuio de frequncia abaixo:Notas Teste Aptido (Xi)Fi Faci pmix pmi ( )2x pmi ( )i iF x pm20 |----- 2 6 6 1 -4,172 17,409 104,4542 |----- 4 10 16 3 -2,172 4,719 47,1934 |----- 6 23 39 5 -0,172 0,030 0,6846 |----- 8 11 50 7 1,828 3,340 36,7418 |---- 10 8 58 9 3,828 16,650 117,203Total ou 58 - - 40,149 306,276a)Calcule o grau mdio obtido pelos operrios;b)O operrio que tirar nota acima deS X 2___+ receber um prmio. Um operrio para receber esta meno dever ter tirado quanto?c)Com base nos dados da tabela, a partir de que nota temos 50% dos operrios mais aptos.Soluo:a) O grau mdio dado por:172414 , 55830051___ nF pmXii ib) A varincia para os dados agrupados dada pela frmula:373 , 557276 , 3061) (512__2 nF X pmSii i. Logo o desvio padro S = 2,318,Desta forma S X 2___+ =9,808, portanto qualquer operrio com nota maior que 9,808 receber o premio.c)A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual calculada para dados agrupados em intervalos por:13 , 5 13 , 1 423264 223) 16258(4)2( +

,_

+ + + MdMdantMd dhFFacnL M.21Unidade II Probabilidade1. Situando a TemticaA teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta parte que o aluno compreenda os conceitos mais importantes da probabilidade. O conceito de probabilidade faz parte do dia-a-dia dos trabalhadores das rea das cincias exatas,cinciasbiolgicas, engenharia, etc., umavezqueseuconceitofrequentementeusadonacomunicao diria. Por exemplo, podemos dizer que um aluno tem chance de 70% de ser aprovado em uma determinada disciplina. Umprofessor est90%segurodequeumnovomtododeensinoproporcioneumamelhorcompreensopelosalunos. Umengenheirodeproduoafirmaqueumanovamquinareduzem20%o tempo de produo de um bem. Tal como mostram os exemplos, as pessoas expressam a probabilidade em porcentagem. Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as porcentagens resultam da multiplicao das fraes por 100).2. Problematizando a TemticaOconceitodeprobabilidadefundamental paraoestudodesituaes ondeos resultados so variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo, jogando-se um dado, temosseisresultadospossveisdecadavez; aobservaodosexodoscandidatosinscritosnum concurso pblico conduz a dois resultados possveis - masculino ou feminino. Em ambos os casos, embora no sejamos capazes de afirmar de antemo que resultado particular ocorrer, temos condies de descrevero conjunto de todos os resultados possveis do experimento. A sua repetio continuada mostra uma certa regularidade nos resultados, o que nos permite estudar o experimento, apesar da incerteza nele presente.3. Conhecendo a Temtica3.1 Espaos Amostrais e EventosAntes de passarmos definio de probabilidade necessrio fixarmos os conceitos deexperimento aleatrio, espao amostral e evento.Experimento Aleatrio o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus resultados. Umexperimentocaracteriza-se como aleatrio, emfunode poder ser repetidoindefinidamente sob condies, essencialmente inalteradas, e embora no sejamos capazes de afirmar que resultadoparticular ocorrer, seremos sempre capazes de descrever o conjunto de todos os possveis resultados do mesmo.Espao Amostral ( Notao: S ou (mega) ) o conjunto formado por todos os possveis resultados de um experimento aleatrio.Eventos ( Notao: A, B. C, ... ) qualquer subconjunto do espao amostral.3.1.1 Operaes entre EventosCombinaes de EventosSejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes operaes entre conjuntos: Evento UnioB A(l-se: A unio B): o evento unio de A e B equivale ocorrncia de A ou de B ou de ambos. Contm os elementos do espao amostral que esto em A ou emB ou em ambos.22 EventoInterseo A B (l-se:AinterseoB): oeventointerseodeAeBequivale ocorrncia de A e de B, simultaneamente. Contm os elementos do espao amostral que esto em A e em B. Evento Complementar A (l-se:A evento complementar de A): o evento complementar de A equivale no ocorrncia do evento A. Contm os elementos do espao amostral que no esto em A. Eventos Disjuntos ou Mutuamente Exclusivos:dois eventosAeBdizem-se mutuamente exclusivos ou mutuamente excludentes quando a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tmnenhumelemento emcomum. Exprime-se isto escrevendo:A B UNIO INTERSEOEVENTO COMPLEMENTAR EVENTOS DISJUNTOS3.2 O Conceito de ProbabilidadeDefinio 2.1:Uma funo P : R dita uma probabilidadese satisfazos seguintes axiomas:i) ( ) P 1; ii)( ) 0 1 P A ;iii) Sejam Ae Beventos em um mesmo espao amostral. Se Ae Bforem mutuamente exclusivos, ento( ) ( ) ( ) P A B P A P B U + .Por enquanto, ainda no sabemos calcular a probabilidade de ocorrncia de um evento A P(A). No entanto, vamos enunciar algumas propriedades relacionadas a P(A) que decorrem das condies acima e que no dependem da maneira pela qual calculamos P(A). 3.2.1Propriedade de ProbabilidadeSejam A e B eventos em um mesmo espao amostral:1. Se o evento impossvel, ento( ) P 0;2. Se AC o evento complementar de A, ento ( ) ( ) A P A PC 1 .3. Se AeBso dois eventos quaisquer, ento( ) ( ) ( ) ( ) B A P B P A P B A P + ;4. Se o evento A B, ento( ) ( ) P A P B .233.2.2Probabilidade em Espaos Amostrais FinitosSeja umespaoamostral associadoaumexperimentoaleatrioconstitudodeNresultados igualmenteprovveis(equiprovveis). SejaAumeventoqualquerconstitudoderresultadospossveis(0 r N ). A probabilidade de ocorrncia do evento A, denotada P(A), dada por:( )Nr AnA nA P possveis casos de nmeroa favorveis casos de nmero) () (Exemplo 2.1: Em uma seleo para uma vaga de engenheiro mecnico de uma grande empresa verificou-se que dos 100 candidatos 40 tinham experincia anterior e 30 possuam curso de especializao. Vinte dos candidatos possuam tanto experincia profissional como tambm algumcurso de especializao.Escolhendo um candidato ao acaso, qual a probabilidade de que:a) Ele tenha experincia ou algum curso de especializao?b) Ele no tenha experincia anterior nem curso de especializao?SoluoVamos definir os seguintes eventos:A = {O candidato possui experincia anterior}B = {O candidato possui especializao}Dados: p(A) = 0,4, p(B) = 0,3p(AB) = 0,2pede-se as seguintes probabilidades: a) Ele tenha experincia ou algum curso de especializao p(AB) = p(A) + p(B) p(AB) = 0,4 + 0,3 0,2 = 0,5b) Ele no tenha experincia anterior nem curso de especializao?P(AcBc) = P((AB)C) = 1- P(AB) = 1- [P(A) + P(B) P(AB)]== 1 [0,4 + 0,3 0,2] = 1 - 0,5 = 0,5.3.2.3 Probabilidade Condicional e Independncia de Eventos Dados dois eventos A e B contidos num espao amostral , muitas das vezes, estamos interessados na ocorrncia de A dado que o evento B tenha ocorrido.Para dar consistncia ideia de uma probabilidade condicional, suponhamos que uma organizao de pesquisa junto a consumidores tenha estudado os servios prestados dentro da garantia por 200 comerciantes de pneus em uma grande cidade, obtendo os resultados resumidos na tabela seguinte:Vendedores de PneusDentro da GarantiaTotalBom Servio Servio DeficienteCom marca 64 16 80Sem marca 42 78 120Total 106 94 200Selecionado aleatoriamente um desses vendedores de pneus (isto , cada vendedor tem probabilidade de serselecionado), constatamos que as probabilidades de se escolher um vendedor de determinada marca (M), um vendedor que presta bons servios dentro da garantia (Bs),ou um vendedor de marca determinada e que presta bons servios dentro da garantia (MBs) so:32 , 020064) ( e53 , 0200106) (, 40 , 020080) ( Bs M P Bs P M P.Todasessasprobabilidadesforamcalculadaspor meiodadefinioclssicadeprobabilidade. Comoa segunda dessas probabilidades P(Bs) prxima a 0,50 (50%), vejamos o que acontece se limitamos a escolha 24a vendedores de uma marca determinada. Isto reduz o espao amostral s 80 escolhas, correspondentes 1a linha da tabela.Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (Bs),sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de80 , 08064) | ( M Bs P , tendo-se uma melhora em relao a P(Bs) = 0,53 . Note que a probabilidade condicional que obtivemos aqui, 80 , 0 ) | ( M Bs P pode escrever-se como:) () () | (2008020064M PBs M PM Bs P Generalizando, formulamos a seguinte definio de probabilidade condicional, que se aplica a dois eventos quaisquer A e B pertencentes a um dado espao amostral :Probabilidade CondicionalSeP(B)diferentedezero, entoaprobabilidadecondicional de ArelativaaB, isto, a probabilidade de A dado que B ocorreu denotada por0 ) (que desde ,) () () | ( > B PB PB A PB A P.Teorema da MultiplicaoOresultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(AB):) | ( ) ( ) ( ou) | ( ) ( ) ( B A P B P B A P A B P A P B A P dependendo da ordem de ocorrncia dos eventos.Independncia de EventosDizemos que dois eventosAe B so independentes, se as probabilidades condicionais P(A |B) = P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicao, escrevermos a ocorrncia simultnea de A e B como sendo:) ( ) ( ) ( B P A P B A P .Exemplo 2.2: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retiram-se, ao acaso, 3 lmpadas sem reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.Soluo: Seja Ai a i-sima lmpada boa, ento:P(A1 A2 A3) = P (A1) P(A2 | A1) P(A3 | A1 A2) =51425364 Exemplo 2.3:Sejam A e B dois eventos tais que P(A) = 0,4 e P(AB) = 0,7. Seja P(B) = p. Para que valor de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero independentes?Soluo: A e B so mutuamente exclusivos se B A =. Logo0 ) ( B A P, com isso ) ( ) ( ) ( B P A P B A P + 0,7 = 0,4 + p p = 0,7 0,4 = 0,3.Se A e B so independentes p B P A P B A P 4 , 0 ) ( ) ( ) ( . Como ) ( ) ( ) ( ) ( B A P B P A P B A P + temos que: 0,7 = 0,4 + p 0,4p.Logo,p = 0,5.253.2.4 Teorema de Bayes Sejam B1, B2, ..., Bk uma partio do espao amostral , onde Bi Bj = i j e kiiB1 , ou seja, os eventos eventos B1, B2, ..., Bk so mutuamente exclusivos. Seja A um evento qualquer associado a, ento:Figura 4: Visualizao de um problema envolvento Teorema de BayesB1B2B3B4ASExemplo 2.3: Numa certa turma, 1% dos homens e 4% das mulheres tem menos que 1,60m de altura. Alm disso, 60% dos estudantes so homens. Considere que um estudante, selecionado aleatoriamente, tem menosque 1,60m de altura. Qual a probabilidade do estudante ser homem?Soluo: Sejam os eventos: A = {estudantes com menos de 1,60m de altura}; M = {estudantes do sexo feminino}; H = {estudantes do sexo masculino}.Note que os eventos M e H so mutuamente excludentes e representam uma partio do espao amostral, ou seja,M H = e M H = . Alm disso, sabemos que o evento A ocorreu, visto que dito que o estudante possui menos que 1,60m de altura.Assim, pelo Teorema de Bayes: 26. , , 1 ,) ( ). | ( ) ( ). | () ( ). | () () () | (1 1k iB P B A P B P B A PB P B A PA PA B PA B Pk ki i ii + +113022 , 0006 , 040 , 0 04 , 0 60 , 0 01 , 060 , 0 01 , 0) ( ). | ( ) ( ). | () ( ). | () () () | ( + +M P M A P H P H A PH P H A PA PA H PA H PUnidade III Variveis Aleatrias e Distribuies de Probabilidade1.Situando a TemticaNa unidade anterior estudamos alguns fenmenos probabilsticos por meio de espaos amostrais mais simples. Noentanto, emsituaes prticas mais gerais, necessrioampliar esses conceitos paraque tenhamos modelos probabilsticos que atendam as necessidades do problema.A definio do conceito de varivel aleatria possibilitar uma maior flexibilidade e aplicabilidade dos conceitos de probabilidade em problemas diversos.2. Problematizando a TemticaAo estudarmos fenmenos aleatrios tais como, a renda de uma populao, o desempenho escolar de um grupo de alunos, o impacto de uma dieta no peso de animais, etc.,desejamossaber como controlar esses experimentos e tentar extrair concluses sobre as respostas obtidas. Neste caso, usaremos uma ferramenta valiosa que so as variveis aleatrias.3. Conhecendo a TemticaQuandonaprticadesejamosinvestigar algumfenmeno, estamosnarealidadeinteressadosem estudaradistribuiodeumaoumaisvariveisrelacionadasaeste. Assim, porexemplo, podemosestar interessados em estudar a distribuio das notas de estudantes em uma determinada disciplina, do grau de instruo, da altura, etc.Oque pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de um grande nmero de problemas prticos.3.1. O Conceito de Varivel Aleatria e Variveis Aleatrias DiscretasDefinio 3.1:Seja E um experimento e um espao amostral associado a E. Um funo X, que associe a cada elemento um nmero real, X(), denominada varivel aleatria.Observao:1. Cada elemento de corresponder a exatamente um valor;2. Diferentes valores , podem levar a um mesmo valor de X;3. Nenhum elemento poder ficar sem valor de X.Definio 3.2:Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria definida em e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B Rx. Ento, define-se o evento A como) ( } ) ( | {1B X B X A .Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.27Exemplo 3.1:Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas. Considere o espao amostral associado a este experimento: = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)} Agora, defina uma varivel aleatria X = nmero de caras obtidas no lanamento de 2 moedas. Assim, temosque X = {0, 1, 2}, visto que X(Co,Co) = 0; X(Ca,Co) = X(Co,Ca) = 1 e X(Ca,Ca) =2.Variveis Aleatrias DiscretasDenomina-se X uma varivel aleatria discreta se o nmero de valores possveis de X for um conjunto de pontos finito ouinfinito enumervel. DigamosRX = {x1, x2, . . . , xn , . . . }.Definio3.2: (FunodeProbabilidade) - SejaXuma varivel aleatriadiscreta. Acadapossvel resultado xi de X est associado um nmero pi =P(X = xi), denominado probabilidade da varivel aleatria X assumir o valor xi, satisfazendo as seguintes condies:a)0 ippara todo xi RX b)1 ... ...2 1 + + + + n ip p p p(a soma das probabilidades igual a 1).Definio3.3: (FunodeDistribuiodeProbabilidade) - Dadaumavarivel aleatriadiscretaX, definimosF(x) afunodedistribuio acumuladaou,simplesmente,funodedistribuio(f.d) de X, dada por: nii i i ix X P x F x X P x F1) ( ) () ( ) (Exemplo 3.2: Considerando o exemplo 3.1, denote a funo de probabilidade e a funo de distribuio da varivel aleatria X.Soluo:Seja X = nmero de caras obtidas no lanamento de 2 moedas, temos que a varivel aleatria X assume os seguintes valores, X = {0, 1, 2}.Temos que, P(Co,Co) = P(X = 0) = ;P(Ca,Co) = P(Co,Ca) = P(X = 1) = ;P(Ca,Ca) =P(X = 2) = .Denotamos a funo de probabilidade de X porxi0 1 2P(X = xi) 1/4 1/2 1/4Por conseguinte, a funo de distribuio acumulada de X dada porxi0 1 2F(xi) = P(X xi) 1/4 3/4 1Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto (d1, d2) de a soma desses nmeros, isto , X(d1, d2) = d1 + d2. Determine a funo de probabilidade de X.Soluo:O espao amostral formado de 36 pares ordenados, representando as possibilidades no lanamentos de dois dados = {(1,1), (1,2), ..., (5,6), (6,6)}.Ento, a varivel aleatria X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por conseguinte, a funo de probabilidade de X obtida, calculando-se:28P (X = 2) = P(d1=1,d2=1) =1/6 1/6 = 1/36P (X = 3) = P(d1=1,d2=2) + P(d1=2,d2=1) = 1/36 + 1/36 = 2/36..P (X = 12) = P(d1=6,d2=6) = 1/36Logo, a funo de probabilidade de X ser representada porxi2 3 4 5 6 7 8 9 10 11 12P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/363.2. Variveis Aleatrias ContnuasUma varivel aleatria dita contnua se o seu contradomnio for um intervalo ou uma unio de sub-intervalos.Definio 3.4:Uma varivel aleatria X contnua se existir uma funo f, denominada funo densidade de probabilidade (fdp) de X, que satisfaa as seguintes condies:1. XR x x f , 0 ) ( ;2.1 ) ( + dx x f ;3. Sejam a e b quaisquer no intervalo+ < < < b a , temos quedx x f b X a Pba ) ( ) ( .Observaes) ( b X a P representa a rea sob a curva da funo densidade de probabilidade f(x). Para qualquer valor especfico de X, digamos x0, P(X = x0) = 0, pois 0 ) ( ) (000 dx x f x X Pxx. Como a probabilidade de Xassumir valores empontos isolados nula, temos que ) ( ) ( ) ( ) ( b X a P b X a P b X a P b X a P < < < < .Definio 3.5:A definio de funo de distribuio para o caso contnuo dada pordx x f x X P x Fx ) ( ) ( ) ( .Observao: Seja F(x) a funo de distribuio acumulada de uma varivel aleatria contnua X, com fdp f(x). Ento,) () () ('x Fdxx dFx f , para todo x no qual F(x) seja derivvel.Exemplo 3.4:Suponha que X uma varivel aleatria contnua com a seguinte fdp:' < > Z Pnq pp pP p P.Se considerarmos um grande nmero de amostras, cada uma contendo 60 itens, em aproximadamente 9,85% das amostras a proporo de itens defeituosos seria superior a 15%.40Unidade V Intervalos de Confiana e Teste de Hiptese1. Situando a TemticaQuando estudamos fenmenos probabilsticos estudamos tambmo comportamento de alguns parmetros relacionados aesteexperimento. Tais parmetros, muitas vezes, soimpossveis deserem determinados restando-nosapenastentarestim-los damelhorforma possvel. Osprocedimentosparatalestimao, juntamentecomofatodetermos certezaqueestamos obtendouma boaestimativaparao parmetro, ser abordado nessa unidade quando estudaremos intervalos de confiana e testes de hiptese.2. Problematizando a TemticaQual a altura mdia do povo brasileiro? Qual a proporo de pessoas com nvel superior em Joo Pessoa? A resposta para essas perguntas no so to fceis, mas para respond-las com exatido teramos que medir todos os cidados brasileiros ou verificar quantos habitantes em Joo Pessoa possuem nvel superior, o que impossvel. No entanto se coletarmos uma amostra e calcularmos a mdia e a proporo,respectivamente, ser que essas estimativas esto prximas dos verdadeiros valores populacionais (parmetros)?Umaoutraperguntaseriaaseguinte: Seaquantidademdiadeguaingeridaporumserhumano de 10 litros por semana, os brasileiros bebem muito ou pouca gua? Como responderamos a esta questo? A resposta para essas questes veremos nessa unidade.3. Conhecendo a Temtica3.1. Estimao de ParmetrosH inmeras situaes reais em que se procura determinar valores para quantidades desconhecidas como mdias e propores. Certamente, de interesse para muitos empresrios saber a quantia mdia gasta por um turista em sua cidade; um produtor de televiso procura sempre saber qual o ndice de audincia de determinados programas; um engenheiro de controle de qualidade procura determinar a proporo de itens produzidos com defeito em uma linha de produo.A estimaoconsisteemdeterminar umvaloramostral quesubstituaorespectivovalorreal do parmetro populacional desconhecido.3.1.1. Conceitos FundamentaisParaumamelhor compreensodostemasmaisimportantesdestaunidade, vamosdefiniralguns conceitos fundamentais dentro da inferncia estatstica: Estimador - uma funo matemtica que leva em considerao os dados amostrais. Como tal funo calculada baseada em uma amostra, considerada uma varivel aleatria, caracterizada por uma distribuiodeprobabilidade. Assim,niixnX11, ondex1, x2, ... , xnsonvaloresamostrais, um estimador que representa a mdia populacional (parmetro). Estimativa - um valor particular do estimador para uma dada amostra coletada. Assim, por exemplo, paraumadadaamostram, kg X 9 , 3 podeser umaestimativaparaoverdadeiropesomdio, desconhecido, de recm-nascidos do sexo feminino em certa localidade. Estimao por pontoou Estimao Pontualchamamos de estimao pontual quando,a partirdeumaamostra, umnicovalorusadoparaestimarumparmetrodesconhecido. Umestimadorpontual para um parmetro populacional, geralmente representado por. Assim,X, S2, S epso estimadorespontuaisparaosparmetros,2,eprespectivamente, isto,=X,2 =S2, =Se nxp p , onde x = no de elementos da amostra que possuem certa caracterstica de interesse. 41Quandoachamosumaestimativapontual, elararamentecoincidecomovalorrealdoparmetro. Uma desvantagem do uso de estimadores pontuais que, se nenhuma informao adicional for dada, no h maneira de decidir oquoboa a estimativa, pois notemos nenhuma ideia da sua preciso. Um procedimento mais desejvel para estimao , ento,calcular um intervalo que tenh uma probabilidade pr-estabelecida de conter o parmetro desconhecido.A Estimao por intervalo ou Intervalos de Confiana um mtodo de estimao onde, a partir de uma amostra aleatria, determinamos um intervalo [T1, T2] que contm o verdadeiro parmetro com uma probabilidade conhecida 1 - , chamada deGrau ou Nvel de Confiana, onde (alfa) a probabilidade do intervalo no conter o verdadeiro valor do parmetro desconhecido. Assim,se amostras aleatrias, do mesmotamanho, soobtidasrepetidamentedamesmapopulao, umacertapercentagemdeintervalos (nvel de confiana) incluir o parmetro populacional desconhecido. Alm disso, veremos que a partir das estimativasintervalarespossvel inferirsobreoquoconfiveissorealmenteasestimativaspontuais obtidas.3.2 Intervalos de Confiana para Mdia PopulacionalUmintervalodeconfianaparaumamdiaespecificaumintervalodevaloresdentrodoqual o parmetro populacional desconhecido, neste caso a mdia, pode estar. Estes intervalos podem ser usados, porexemplo,por um fabricante que deseja estimar sua produo mdia diria ou um pesquisador que deseja estimar o tempo de resposta mdia, por paciente, a uma nova droga.De modo geral, estamos interessados em encontrar um intervalo na forma] [ ] ; [0 0 2 0 1 t + X X T X T ,onde0representaasemiamplitudedointervalodeconfiana, sendochamadodeErrodePrecisoem relao a . Portanto, o objetivo encontrar 0, tal que < 1 ) | (|0X P ,que equivalente a + < < 1 ) (0 0X P .Note que essa afirmao probabilstica pode ser reescrita por + < < 1 ) (0 0X X P .Em breve, entenderemos a necessidade destas duas ltimas afirmaes probabilsticas.3.2.1. Intervalos de Confiana para Mdia Populacional Caso 1: 2 conhecidaSuponha que temos uma amostra aleatria de tamanho n, X1, X2, ... , Xn, de uma populao cuja distribuio normal com mdia e varincia 2. EntoniixnX11 apresenta distribuio

,_

nN X2, e ( ) 1 , 0 NnXZ

,_

.Sejam 1- um nvel de confiana qualquer, 0 < 1- < 1. Temos que, + < < 1 ) (0 0X P +< < 1 )/ /(0 0nZnP < 0 463.3.2 Definio da Regra de Deciso, Erros e Nvel de SignificnciaQuandotestamos hipteseestatsticas, qualquer quesejaadecisotomada, estamos sujeitos a cometer dois possveis tipos de erros: Erro do Tipo I: quando se rejeita a hiptese nula H0 e a mesma verdadeira. Denotamos por a probabilidade de cometer este erro, isto , = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira). O erro tipo I () tambm conhecido como nvel de significncia de um teste de hipteses. Erro do Tipo II: no se rejeita a hiptese nula H0, quando a mesma falsa. Denotamos por a probabilidade de cometer este erro, isto , = P(erro tipo II) = P(no rejeitar H0 | H0 falsa).O quadro abaixo resume as possibilidades das decises envolvidas em um teste de hiptese, com asprobabilidades de ocorrncias dos erros tipo I () e II ().Quadro 1: Avaliao das Decises em um Teste de HiptesesDecisoSituao RealH0 Verdadeira H0 FalsaNo Rejeitar H0 Deciso Correta Erro do Tipo II ()Rejeitar H0 Erro do Tipo I () Deciso CorretaDevido as dificuldades de se conseguir minimizar os dois tipos de erros ao mesmo tempo, em geral,nos preocupamos mais na possibilidade de rejeitar uma hiptese sendo ela verdadeira. Dessa forma, teremos uma maior ateno no controle do erro do tipo I. Por exemplo, se definimos as hipteses H0: uma nova droga no eficaz para certos pacientes; H1: uma nova droga eficaz para certos pacientes.A aceitao de H0, sendo esta hiptese falsa, possibilita a busca de outros meios de tratamentos, enquanto que a rejeio de H0, sendo esta verdadeira, exclui a possibilidade de se prosseguir com outras opes para os pacientes.Logo, desejvel exercer umcontrole sobree mant-lo pequeno.Dessa forma,os testesde hiptese podem ser montados de maneira que, fixado o erro do tipo I,o erro do tipo II seja minimizado aumentando-se o tamanho da amostra.Observao: O significado de usado nos Testes de Hipteses totalmente diferente de seu significado na Estimao por Intervalos. Nos Testes de Hiptese, representa a probabilidade de rejeitar uma hiptese nula suposta verdadeira, enquanto que na Estimao por Intervalos representa a probabilidade de que os limites de confiana construdos no contenham o verdadeiro valor do parmetro.Estatstica do TesteA deciso de rejeitar ou no a hiptese nula (H0) baseada nos dados amostrais, que so usados para calcular o valor daEstatstica de Testee que servir de referncia para a tomada da deciso. Para isso,divide-se a curva da distribuio amostral da estatstica em duas regies, uma chamadaRegio Crtica (ou Regio de Rejeio de H0), e a outra Regio de No Rejeio de H0. Temos, ento, a seguinte Regra de Decisodo teste:se o valor calculado da estatstica do teste pertencer regio crtica, rejeita-se H0em favor da hiptese alternativa; caso contrrio, H0 no ser rejeitada em relao hiptese alternativa.Outras definies importantes, necessrias na formulao de um problema de Testes de Hipteses so: Regio Crtica do Teste - a regio de rejeio de H0, isto , o conjunto de valores de uma estatstica que determina a rejeio de H0. Rejeitamos a hiptese nula se a estatstica de teste est na regio crtica, porque isto indica uma discrepncia significativa entre a hiptese nula e os dados amostrais. Valor Crtico do Teste: o valor, ou valores, que separa(m) a regio crtica (que levam a estatstica do teste a rejeitar a hiptese nula) da regio de no rejeio de H0.Dependendo da hiptese alternativa, temos os seguintes tipos de Testes de Hipteses:47 Teste Unilateral:quando a regio crtica do teste localizada completamente em uma das extremidades da curva da distribuio amostral da estatstica do teste.o Teste Unilateral Esquerda:a regio crtica (sombreada) localiza-se no extremo esquerdo da distribuio.Hipteses: H0: = 0vsH1: < 0o TesteUnilateralDireita:aregiocrtica(sombreada)localiza-senoextremodireitoda distribuio.Hipteses: H0: = 0vs H1: > Teste Bilateral: a regio crtica (sombreada) localiza-se nas duas extremidades da distribuio.Hipteses: H0: = 0vs H1: 0A escolha entre usar um teste unilateral e um teste bilateral determinada pelos objetivos do problema, no qual se deseja verificar uma afirmao a cerca do parmetro populacional.3.3.3 Fases na Realizao de um Teste de Hipteses1 - Formular as hipteses nula (H0) e alternativa (H1);2 - Decidir qual estatstica de teste ser usada para julgar a hiptese nula;3 - Fixar o nvel de significncia ;4 - Determinar a regio crtica;5 - Usar os valores amostrais para calcular o valor da estatstica citada na fase 2;6- Seovalor citadonafaseanterior pertencer regiocrtica, rejeitar H0. Caso contrrio, no rejeitar H0.3.3.4. Teste de Hipteses para a Mdia Populacional Caso 1: 2 conhecidaO primeiro passo num Teste de Hipteses consiste em formular a hiptese a ser testada. No quadro 1, podemos observar que para cada possvel hiptese existe uma regio crtica e regra de deciso associada. No caso do teste de hipteses para mdia populacional, supondo a varincia populacional conhecida, utilizamos a seguinte estatstica do teste:n X0CZ.Note que a estatstica calculada com base nas informaes contidas na amostra.O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos os valores mais usados para Z e Z/2. 1% 5% 10%Z2,33 1,64 1,28Z/22,57 1,96 1,64 48Quadro 2: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional, considerando 2 conhecido.Hiptese Regio Crtica (sombreada)Regra de Deciso (Rejeitar H0)H0: = 0H1: 0Zc -Z/2 ou Zc Z/2H0: = 0 (*)H1: < 0Zc -ZH0: = 0 (**)H1: > 0Zc Z(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0. (**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0. Exemplo 5.7: O gerente de uma indstria de carnes enlatadas tem estabelecido a seguinte especificao: um novilho com 12 meses de vida resulta numa mdia de 250kg de carne. A experincia passada indica que,mesmo com uma mudana na mdia, o desvio padro permanece ligeiramente constante, em = 18kg. Para determinarseaespecificaoestsendoobservada, ogerenteselecionaumaamostraaleatriacom100 novilhoseobteveumamdiaX=253kgdecarne. Realizeumtestedehipteseparaverificarsehouve mudana na especificao, a um nvel de significncia de 5%.Soluo:H0: = 250kg H1: 250kg (a especificao no est sendo observada)Temos que = 18kg; n = 100, X= 253kg e = 5%.Dessa forma, a estatstica do teste Zc = 253 25018100= 1,67. Como o teste bilateral, o valor crtico ao nvel = 5% ser Z/2 = 1,96.Deciso: Como Z/2< Zc< Z/2No existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e com 5% de significncia no podemos rejeitar a hiptese H0, ou seja, no existem evidncia para afirmar que a especificao est sendo violada.3.3.5. Teste de Hipteses para a Mdia Populacional Caso 2: 2 NO conhecidaQuando a varincia populacional (2) desconhecida, precisamos estim-la a partir das informaes contidas na amostra, atravs da expresso491) (1 2nx xSnii.Dessa forma, a estatstica do teste para mdia populacional quando 2 desconhecida ser expressa porn S X0CT,que segue uma distribuio t-Student com n-1 graus de liberdade.O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos as regies crticas e regras de deciso para as respectivas hipteses.Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional, considerando 2 desconhecido.Hiptese Regio Crtica (sombreada)Regra de Deciso (Rejeitar H0)H0: = 0H1: 0Tc -t(n-1,/2) ou Tc t(n-1,/2)H0: = 0 (*)H1: < 0Tc -t(n-1,)H0: = 0 (**)H1: > 0Tc t(n-1,)(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0. (**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0. Exemplo5.8:Otempomdionecessrioparacompletarumatarefaerade15minutos. Obtm-seuma amostra aleatria de nove indivduos e, durante o perodo de teste, seus tempos (X) para concluir a tarefaforam 11, 12, 15, 10, 12, 14, 15, 13 e 15. Assumindo que estes dados vm de uma distribuio normal, teste ahiptesedequehouvealteraonotempomdioparacompletar atarefa. Useumnvel de5%de significncia.Soluo:H0: = 15minH1: 15min (houve alterao no tempo mdio)Com base nas informaes amostrais, temos que n = 9; X= 13min e S = 1,871 min.50Dessa forma, a estatstica do teste ser Tc = 13 151 8719,= 3,207. Como o teste bilateral , o valor crtico ao nvel = 5%, sendo n = 9, ser tn-1;/2 = t8;0,025 = 2,306 (obtido da tabela da distribuio t-Student).Deciso: Como Tc < tn-1;/2, existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e com 5%de significncia podemos rejeitar a hipteseH0, ouseja, existemevidncias paraafirmar que os indivduos apresentaramumtempo mdio para executar a tarefa diferente do que era observado anteriormente.3.3.6. Teste de Hipteses para a uma Proporo Populacional pAose fazer inferncias sobre uma proporopopulacional,p, tomamos nossas combase nas evidncias sobre seu valor amostral, p, de elementos com a caracterstica de interesse. Pelo Teorema Central do Limite, sabe-se que, para n suficientemente grande, a proporo amostral, nxp segue, aproximadamente, uma distribuio,_

np pp N p) 1 (, ~ . Dessa forma, sob a hiptese H0: p = p0, a estatstica do teste para a proporo populacionalp ser expressa por( ) 1 , 0 ~) 1 (0 00Nnp pp pZC,que segue uma distribuio normal padro.Aps fixar o nvel de significncia do teste (), apresentamos a seguir as regies crticas e regras de deciso para as respectivas hipteses. Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Proporo Populacional p.Hiptese Regio Crtica (sombreada)Regra de Deciso (Rejeitar H0)H0: p = p0H1: p p0 Zc -Z/2 ou Zc Z/2H0: p = p0 (*)H1: p < p0 Zc -ZH0: p = p0 (**)H1: p > p0 Zc Z(*) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0. (**) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0 , com base no conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0. 51Exemplo 5.9: Afirma-se que em um alqueire de mas, 10% esto estragadas. De uma amostra aleatria de 150 mas examinadas, 30 estavam estragadas. O que voc conclui sobre a proporo de mas estragadas em um alqueire a um nvel de 5% de significncia?Soluo: H0: p = 0,1H1: p 0,1 Com base nas informaes amostrais, temos que n = 150 e p= 30/150 = 0,2.Dessa forma, a estatstica do teste ser ZC = 0 2 0 101 0 9150, ,( , ).( , )= 4,08. Como o teste bilateral, o valor crtico ao nvel de significncia de = 5% ser Z/2 = 1,96.Deciso: Como ZC> Z/2 Existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e ao nvel de 5% de significncia, podemos concluir que a porcentagem de mas estragadas diferente de 10%.Exemplo 5.10: De registros de vendas passadas sabe-se que 30% dos consumidores compram a pasta dental C. Uma nova propaganda desse produto feita e, para testar sua eficcia, de uma amostra aleatria de 1000 consumidores que viram a propaganda, 334 responderam que compram a pasta dental C. Isso indica que a nova propaganda foi bem sucedida? Use um nvel de 5% de significncia para testar se a nova propaganda aumentou a proporo de consumidores da pasta dental C.Soluo: H0: p= 0,3H1: p > 0,3 (a nova propaganda aumentou as vendas da pasta C)Com base nas informaes amostrais, temos que n = 1000 e p = 334/1000 = 0,334. Dessa forma, a estatstica do teste ser ZC= 0 334 0 3000 3 0 71000, ,( , ).( , )= 2,35. De acordo com a hipteses H1, temos que o teste ser unilateral e, portanto, o valor crtico ao nvel = 5% ser Z = 1,64.Deciso: Como ZC > ZExistem evidncias para rejeitar H0. Logo, com base nos dados amostrais e ao nvel de 5% de significncia, podemos concluir a nova propaganda aumentou a proporo de consumidores que compram a pasta dental C. 52Unidade VI Correlao e Regresso1. Situando a TemticaCorrelaoeRegressosoduastcnicasestritamenterelacionadasqueenvolvemumaformade estimao. Adiferena entreessas duastcnicas eo tipode estimaoestudados anteriormenteque as tcnicas anteriores foram utilizadas para estimar um nico parmetro, enquanto que as tcnicas que sero estudadas nesta unidade se referem estimao de uma relao que possa existir na populao.2. Problematizando a TemticaA correlao e regresso permite-nos investigar uma relao entre duas variveis. O estudo de talrelao pode ser a resposta a perguntas, tais como: Qual o preo de venda para uma casa com 200m2 ? ou Pais mais altos tendem a ter filhos mais altos? ou, ainda, De cada unidade adicional de renda quanto, em mdia, gastocomdespesasadicionaiscomvesturio?. Anoodecasualidadeestimplcitanestasquestes. Por exemplo, o tamanho de uma casa determina, ou contribui, para a definio do preo de venda,mas no o contrrio. Ao estudar a correlao entre variveis, a determinao da direo da casualidade entretais variveis deve ser o primeiro passo ao se analisar dados para o uso dessas tcnicas inferenciais, que sero melhor discutidas a seguir.3. Conhecendo a Temtica3.1. CorrelaoO objetivo do estudo da correlao a determinao do grau de relacionamento entre duas variveis.Otermocorrelaosignificaco-relacionamento, sinalizandoatquepontoosvaloresdeumavarivelesto relacionados com os da outra. Caso os pontos das variveis, representados num plano cartesiano (X, Y) ou grfico de disperso, apresentem uma disperso ao longo de uma reta imaginria, dizemos que os dados apresentam uma correlao linear.Diagrama de DispersoUmaformadevisualizarmosseduasvariveis(X,Y)apresentam-secorrelacionadasatravsdo diagrama de disperso, onde os valores das variveis so representados por pontos, num sistema cartesiano.A figura abaixo representa dois exemplos de grficos de disperso. O primeiro grfico apresenta a relao entre as variveis horas de treinamento e no de acidentes. O segundo grfico relaciona as variveis nota no vestibulare mdia na graduao.Figura 5: Exemplos de Grficos de Disperso60504030201000 2 4 6 8 10 12 14 16 18 20Horas de treinamentoAcidentesMdia de notas na graduao4,003,753,503,002,752,502,252,001,501,753,25300 350 400 450 500 550 600 650 700 750 800Nota no vestibular53CorrelaoUma medida dograue dosinal dacorrelaolinear entre duas variveis (X,Y) dadopelo Coeficiente de Correlao Linear de Pearson, definido por: Y XS SY X Covr) , (,onde SXe SYrepresentam o desvio padro amostral das variveis X e Y, respectivamente, e Cov(X,Y) a covarincia entre elas, definida por:1) )( () , (1 ny y x xY X Covinii.Portanto, aps alguma lgebra, possvel denotar o coeficiente de correlao linear pela expresso abaixo:Propriedades do Coeficiente de Correlao Linearo Este coeficiente adimensional, logo no afetado pelas unidades de medidas das variveis X e Y;o Osinalpositivoindicaqueas variveisso diretamente proporcionais,enquanto que o sinal negativo indica que a relao entre as variveis inversamente proporcional;o O valor de r estar sempre no intervalo de -1 a 1. Teremos r = +1 se os pontos estiverem exatamente sobre uma reta ascendente (correlao positiva perfeita). Por outro lado, teremos r = -1se os pontos estiverem sobre uma reta descendente (correlao negativa perfeita) 01-1 ausncia Sentido: negativanegativanegativa positivapositivapositiva Fora:forte moderada fraca fraca moderada forte Teste de Hipteses para o Coeficiente de Correlao LinearComoovalordercalculadocombasenosnelementosdeumaamostra, esterepresentauma estimativa do verdadeiro valorparaocoeficiente de correlao populacional(). Logo,faz-senecessrio alguma ferramenta de inferncia estatstica que permita saber se o valor der, combinado com o respectivo tamanho de amostran,aumdado nveldesignificncia, suficiente para afirmarmosque existe uma correlao linear entre duas variveis.Dessa forma, sob a hiptese H0: = 0, a estatstica do teste para correlao linear populacional ser expressa por2 / ), 2 (2~12 n Ctrnr T ,que segue uma distribuio t-Student com n-2 graus de liberdade.5421 1221 121 1 1

,_

,_

niiniiniiniiniiniinii iy y n x x ny x y x nrAps fixar o nvel de significncia do teste (), apresentamos a seguir a regio crtica e a regra de deciso para o teste bilateral. Quadro 4: Hipteses, Regio Crtica e Regra de Deciso para a Correlao Linear Populacional Hiptese Regio Crtica (sombreada)Regra de Deciso (Rejeitar H0)H0: = 0H1: 0Tc -t(n-2,/2) ou Tc t(n-2,/2)Exemplo 6.1: A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados pela Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de correlao de Pearson, interprete o resultado e verifique sua significncia a nvel de 5%.Ano Aes (X) Ttulos (Y)1950 35,22 102,431951 39,87 100,431952 41,85 97,431953 43,23 97,811954 40,06 98,321955 53,29 100,071956 54,14 97,081957 49,12 91,591958 40,71 94,851959 55,15 94,65Total () 452,64 974,66Soluo:Para o clculo do coeficiente de correlao r, necessitamos de alguns clculos preliminares a partir da tabela acima:Ano Aes (x) Ttulos (y) xy x2y21950 35,22 102,43 3607,58 1240,45 10491,901951 39,87 100,43 4004,14 1589,62 10086,181952 41,85 97,43 4077,45 1751,42 9492,601953 43,23 97,81 4228,33 1868,83 9566,801954 40,06 98,32 3938,70 1604,80 9666,821955 53,29 100,07 5332,73 2839,82 10014,001956 54,14 97,08 5255,91 2931,14 9424,531957 49,12 91,59 4498,90 2412,77 8388,731958 40,71 94,85 3861,34 1657,30 8996,521959 55,15 94,65 5219,95 3041,52 8958,62Total () 452,64 974,66 44025,03 20937,69 95086,72Logo, temos que55( ) ( )4561 , 066 , 974 ) 72 , 95086 ( 9 64 , 452 ) 69 , 20937 ( 9) 66 , 974 64 , 452 ( ) 03 , 44025 ( 92 2 21 1221 121 1 1

,_

,_

niiniiniiniiniiniinii iy y n x x ny x y x nrConclumos que existe uma correlao negativa entre os preos mdios das aes e de ttulos, ou seja, existe uma tendncia de baixa nos preos das aes quando se verifica alta nos preos dos ttulos e vice-versa,embora tal relao no seja acentuada.Paratestarasignificnciadacorrelao, devemosrealizarumtestedehiptesesparacorrelao populacional. As hipteses H0 e H1 so definidas por:H0: = 0H1: 0Com base nas informaes amostrais, temos que n = 9 e r = -0,4561. Dessa forma, a estatstica do teste ser 4496 , 1122 rnr TC.Deacordo com ahiptesesH1,temos que oteste serbilaterale, portanto,o valor crtico ao nvel = 5% ser t(n-2,/2) = t(7,0.025) = 2,37.Deciso: Como t(n-2,/2)< TC < t(n-2,/2) No existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e ao nvel de 5% de significncia, no podemos afirmar que exista uma correlao entre os preos mdios das aes e dos ttulos entre 1950 e 1959.3.2. RegressoQuando analisamos dados que sugerem a existncia de uma relao funcional entre duas variveis,surge ento o problema de se determinar uma funo matemtica que exprima esse relacionamento, ou seja,uma equao de regresso.Portanto, ao imaginar uma relao funcional entre duas variveis, digamos Xe Y, estamos interessados numa funo que explique grande parte da variao de Y por X. Entretanto, uma parcela davariabilidade de Y no explicada por X ser atribuda ao acaso, ou seja, ao erro aleatrio.Admitimos que a varivel X seja coletada sem erro, isto , X no ser aleatrio. Enquanto que a varivel Y apresenta uma variao na qual, acreditamos, que possa ser explicada por X. Essa situao admite a formulao do problema de modo que uma varivel Y, chamada devarivel resposta ou dependente, seja apresentada em funo de uma varivel X, denominada de varivel explicativa ou independente.Formalmente, aanlisederegressopartedeumconjuntodeobservaespareadas(x1, y1), (x2, y2), ..., (xn, yn), relativassvariveisXeYeconsideraquepodemosescreverarelaoentreasduas variveis, da seguinte maneira:yi = + xi + i,onde:o yi a varivel resposta associada i-sima observao de Y;o xi a i-sima observao do valor fixado para a varivel independente (e no aleatria) X;o ioerroaleatrioparaai-simaobservao, isto, oefeitodefatoresqueestoafetandoa observao de Y de forma aleatria. Por suposio, consideramos que i ~ N(0,2);o e so parmetros que precisam ser estimados.Estimando os Parmetros do ModeloO nosso objetivo ser estimar valores para e atravs dos dados fornecidos pela amostra. Alm disso, queremos encontrar a reta que passe o mais prximo possveldos pontos observados segundo um critrio pr-estabelecido.56O mtodo de mnimos quadrados usado para estimar os parmetros do modelo ( e ), segundo um critrio, e consiste em fazer com que a soma dos erros quadrticos seja menor possvel, ou seja, este mtodoconsiste em obter os valores de e que minimizam a expresso: ). , ( ) x (y 2i i2i f SQE .Aplicando-se derivadas parciais em relao a e na expresso acima e igualando-se a zero,vamos encontrar as seguintes estimativas para e , as quais chamaremos de a e b, respectivamente:( ) 2i2ii i i ix x ny x y x nbnx yi i ba.A chamada equao (reta) de regresso dada porx y b a + ,e para cada valor xi (i = 1, ..., n) temos, pela equao de regresso, o valor predito:i ix y b a + .Adiferena entre os valores observados e os preditosser chamada deresduodomodelode regresso, sendo denotado por:i i iy y e .O resduo relativo i-sima observao (ei) pode ser considerado uma estimativa do erro aleatrio (i), como ilustrado abaixo.57yiO Coeficiente de Determinao (R2)O coeficiente de determinao uma medida descritiva da proporo da variao de Y que est sendo explicada pela varivel X, segundo o modelo de regresso especificado. Ele expresso pela seguinte razo:( )( ) total variaomodelo pelo explicada variaoy yy yR2i2i 2,onde nyi y.Teste de Hipteses para o Coeficiente Notequeocoeficienterepresentaainclinaodaretaderegresso. Dessaforma, umtestede hipteses sobre este parmetro pode ser usado como uma maneira de verificar se a equao de regresso ajustada com base em dados amostrais estatisticamente significante. Para tanto, vamos definir as hipteses nula e alternativa por: