Tabelas

download Tabelas

of 70

Transcript of Tabelas

ESTATSTICA Regiane Slongo Fagundes Cascavel - 2011 FACULDADE ASSIS GURGACZFACULDADE ASSIS GURGACZFACULDADE ASSIS GURGACZFACULDADE ASSIS GURGACZ FAG FAG FAG FAG Avenida das Torres, 500 Fone: (45) 321-3900 Fax: (045) 321-3913 CEP: 85802-640 Cascavel Paran Email: [email protected] PARTE I Introduo Estatstica Aestatsticaumprocessoquepermiteaanliseeainterpretaodedados provenientesdeumaoumaisamostras,comoobjetivodeinferircaractersticasde populaes.Sendoaplicvelaqualquerramodoconhecimentoondesemanipulam dados experimentais. 1.O Crescimento e o Desenvolvimento da Estatstica Moderna Historicamente,ocrescimentoeodesenvolvimentodaestatsticamodernapodem ser relacionados a trs fenmenos isolados a necessidade do governo de coletar dados sobreoscidades,odesenvolvimentodateoriadaprobabilidadeeoadventoda informtica. Dadostmsidocoletadosatravsdetodaahistria.NascivilizaesEgpcias, GregaeRomana,dadosprimrioseramcoletadoscompropsitodetaxaese finalidadesmilitares.NaidadeMdia,igrejasregistramdadoseinformaessobre nascimentos,mortesecasamentos.NosEstadosUnidos,aConstituiode1790 determinava a realizao de censo a cada 10 anos. Atualmente, informaes numricas so necessrias para cidades e organizaes de qualquer natureza, e de qualquer parte do globo. 2.Estatstica Descritiva versus Inferncia Estatstica A estatstica pode ser dividida em duas partes: 2.1 - Estatstica Descritiva Ocupa-sedaorganizao,sumarizaoedescriodeumconjuntodedados. Estaanliseservecomoumprimeiroguiaaopesquisador,fornecendoinformaes sobreaqualidadedeseusdadoseindicandoalgumastendncias(seexistirem)e,em geral, no tem um fim em si prpria, exceto o caso do censo. 2.2 - Estatstica Inferencial umaetapadaestatsticaquecuidadacoleta,reduo,anlise,modelageme interpretao dos dados. Oobjetivodaestatsticainferencial(ouindutiva)odetirarconclusescom base nos resultados observados em amostras extradas dessas populaes. Oprpriotermoindutivadecorredaexistnciadeumprocessodeinduo, isto,umprocessoderaciocnioequepartindo-sedoconhecimentodeumaparte, procura-se tirar concluses sobre a realidadeno todo. 3.Pesquisa Estatstica Pesquisaumconjuntodeatividadesorientadasparaabuscadeum determinado conhecimento. Para merecer qualificativo de cientfica a pesquisa deve ser feita de modo sistematizada, utilizando para isto mtodos prprios e tcnicas especfica. Apesquisacientficasedistinguedeoutrasmodalidadesquaisquerdepesquisapelo mtodo,pelatcnica,porestarvoltadaparaarealidadeempricaepelaformade comunicar o conhecimento. 3.1 Finalidade da Pesquisa Descobrir respostas para questes, mediante a aplicaes de mtodos cientficos; Tentar conhecer e explicar fenmenos que ocorrem no mundo existente. 3.2 Tipos de Pesquisas 3.2.1 Pesquisa de Reconhecimento ou Survery estudo de opinio, mercado e diagnstico 3.2.2Pesquisa Bibliogrfica Procura material j elaborado 3.2.3Pesquisa documental Coletadeinformaesapartirdedocumentosquantitativostaiscomo arquivos pblicos e privados, imprensa, revistas, etc. 3.2.4Pesquisa Experimental Experinciasrealizadasemlaboratrios,fbricas,parcelasdeterras. utilizado o Delineamento de Experimento e Controle de Qualidade. 3.3 Etapas de uma Pesquisa Estatstica Cadaumaessaspassagensmereceumestudoaprofundadoetemcaractersticas prprias. 3.3.1 - Populao o conjunto de interesse final para a pesquisa. Em geral o conjunto do qual a amostra retirada. 3.3.2 - Amostra Chamaremosdeamostraqualquersubconjuntodapopulaodeinteresse,quer os dados tenham sido coletados de um estudo observacional, quer sejam provenientes de um experimento realizado sob certas condies de controle. 3.3.3 - Tratamento dos Dados Conjunto de tcnicas usadas para descrever os dados observados. 3.3.4 - Inferncia Conjunto de mtodos que permitem inferir o comportamento de uma populao a partir do conhecimento da amostra 3.3.5 - Clculo de Probabilidade Teoriamatemticaquededuzapartirdeummodelo,aspropriedadesdeum fenmeno aleatrio. Determinar os Objetivos: Para que? populao amostra Tratamento dos dados inferncia 4Terminologia Estatstica PopulaoAmostraUnidade experimental 4.1 - Unidade experimental ou de Anlise o objeto ou indivduo que ser estudado na populao, e sobre os quais obtm-se os dados. 4.2 - Dados o valor ou resposta que toma a varivel em cada unidade experimental. o resultado de uma observao. a matria prima da estatstica. 4.3 - Varivel umacaractersticaobservvel,susceptveldeadotardistintosvaloresouser expresso em vrias categorias. Variveis: Idades; Sexo; Srie; Horas de estudo; Horas de treino; etc... 4.4 Informao oresultadodosdadosprocessados(ouorganizados)deacordocomcertos objetivos. 4.5 - Estatstica qualquerfunodosdadosempricos*queusadacomfinsdescritivosou analticos. uma medida resumo dos dados. *Dados Empricos: baseado apenas na experincia, e no no estudo. 4.6 - Parmetros So as caractersticas mais importantes da populao. Comumente so desconhecidas. 5Classificao Das Variveis QualitativasQuantitativas NominaisOrdinaisDiscretasContnua 5.1 - Variveis qualitativas So caractersticas cujos dados no so numricos, isto , so apresentados como uma qualidade ou atributo. Ex: Sexo, estado civil, nvel de escolaridade. 5.1.1 - Nominal No existe nenhuma ordenao ou hierarquia nos possveis resultados. Ex: sexo, estado civil, regio de procedncia. 5.1.2 - Ordinal Existeumacertaordemouhierarquianospossveisresultados.Ex:Nvelde escolaridade, nvel de satisfao. 5.2 - Variveis Quantitativas uma caracterstica em estudo cujos resultados se referem a quantidades, isto , so medidas numa escala numrica. Ex: idade, salrio, nmero de filhos, etc. 5.2.1 - Discretas Cujosresultadossereferemadadosquepodemassumirvaloresinteiros(IN). Ex: idade, nmero de pessoas, nmero de filhos por famlia, etc. 5.2.2 - Contnuas So dados que podem assumir qualquer valor deum conjunto de nmeros reais (IR). Ex: peso, altura, consumo mensal de energia, etc. MODELO DE UM QUESTIONRIO Esperamos beneficiarvoc atravs de umestudo que estamosrealizando para conhecer suas preferncias na escolha de supermercado, gostaramos que nos auxiliasse respondendo as seguintes perguntas: 1. Sexo1() Masculino2 () Feminino 2. Idade ___________ anos 3. Estado Civil: 1() Solteiro (a)4 () Divorciado 2 () Casado (a) sem filhos5 () Outros ___________________ 3 () Casado (a) com filhos 4. Nvel Escolar 1 () Sem instruo5 () Ensino Mdio completo 2() Ensino Fundamental Incompleto6 () Ensino Superior Incompleto 3 () Ensino Fundamental completo7 () Ensino Superior completo 4 () Ensino Mdio Incompleto8 () Outros _____________ 5. Nmero de Pessoas que Moram com voc _________ 6. Renda Mensal da Famlia ______________ 7. Com que freqncia voc visita um supermercado 1 () Diariamente4 () Mensalmente 2 () Semanalmente5 () Outros ______ 3 () Quinzenalmente 8. Quantos mercados diferentes voc visita em suas compras? _____________ 9. Quanto da sua renda voc gasta em suas comprar mensais de supermercado? 1 () menos de 25% da renda3 () acima de 50% at 75% da renda 2 () de 25% at 50% da renda4() acima de 75% da renda 10. Ao escolher um supermercado voc observa: 10.1 () A tradio da empresa 10.2 () Propaganda 10.3 () Higiene 10.4 () Atendimento 10.5 () Diversificao de produtos 10.6 () Preos 10.7 () Tamanho da Loja 10.8 () Prazos 10.9 () Distncia 10.10 () Promoes 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 1 () sim2 () no 11. O atendimento no supermercado em que voc compra freqentemente :1 () Insatisfatrio3 () Muito Satisfatrio 2 () Mdio Satisfatrio4 () Satisfatrio AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes7 PARTE II Anlise Exploratria Dos Dados ou Estatstica Descritiva 1.Introduo AEstatsticaDescritivaafasenaqualosdadosdeumexperimentoou pesquisa, so organizados, resumidos, descritos, apresentados e interpretados. Esta fase de grande importncia para uma pesquisa, pois nela, podemos perceber as tendncias do nosso conjunto de dados. Apsacoletadosdadosexperimentais,devemosorganiz-loseapresent-los;esta apresentao, pode ser feita atravs de tabelas e grficos. 2.Tabelas de distribuio de freqncias Asapresentaesatravsdetabelasdeveroserrealizadasemumapesquisa, mediantealgumaconvenoounorma,dependendodequalinstituio,congressoou rgo, esta tabela ser apresentada. Mas alguns princpios bsicos podem ser utilizados, segundo as normas do IBGE (Instituto Brasileiro de Geografia e Estatstica): -Ttulo: aonde dada uma noo inicial ao leitor sobre o que a tabela; -Cabealho:paraquesejamidentificadososcontedosreferentesacadacolunada tabela. O cabealho deve conter o suficiente para responder as questes: o que est sendo representado? onde ocorreu ? Quando ocorreu? -Coluna Indicadora: que especifica as diferentes categorias da varivel; -Corpo: representado por colunas e subcolunas dos quais so registrados os dados numricos e informaes. -Rodapoup:ondeidentificadaafonteoriginaldosdados,oualgumanota referente a tabela. Exemplo: Tabela01:Casosregistradosdeintoxicaohumanasegundoacausa determinante. Brasil, 1993 CausaFreqncia Acidente29.601 Abuso2.604 Suicdio7.965 Profissional3.735 Outras 1.959 Ignorada1.103 Fonte: Mensrio Estatstico 259/260 Observao: No h linhas laterais, ponto final em cada linha e linhas horizontais no corpo da tabela separando as linhas. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes8 2.1 - Tabela de distribuio de freqncias Uma tabela de distribuio de freqncias composta, alm dos itens citados acima: -Freqnciaabsoluta(fi ):onmerodevezesemquecadaelementoaparecena amostra ou populao. Na tabela acima, esta freqncia absoluta est sendo expressa pela empresas fiscalizadas. -FreqnciaAbsolutaAcumulada(Fi):asomadasfreqnciasdosdados anteriores. -FreqnciaRelativa(hi):arazoentreovalordecadafreqnciaeonmero total de dados existentes na observao. Ou seja: nf= hii -FreqnciaRelativaAcumulada(Hi):asomadasfreqnciasrelativasdos dados anteriores. Astabelasdedistribuiodefreqnciassovlidasparavariveisquantitativase qualitativas.Masquandohumnmerograndededadosparaadistribuiode freqncias,ouquandoavariveldeinteressequantitativacontnua,convm utilizarmos intervalos(ouclasses);estesintervalospodemserdeigualtamanho,oude tamanho diferentes. Ou ainda, os intervalos podem ser abertos ou fechados. Segundo Bussab e Morettin, a escolha dos intervalos depender da familiaridade do pesquisadorcomosdados.Mas,valeassinalarque,comumpequenonmerode intervalos pode-se perder informaes, e com um grande nmero de intervalos pode-se prejudicar o resumo dos dados. Entretanto, segundo Fonseca, h duas aparentes solues para a definio do nmero de intervalos: a)Seonmerodeelementos(n)formenorque25entoonmerodeclasses(k) iguala5;senformaiorque25,entoonmerodeclassesaproximadamentea raiz quadrada positiva de n. Ou seja: Para n 25,k = 5 Para n > 25, K =n b)Frmula de Sturges: k 1 + 3,33 log n. -Amplitudetotalourange(R):adiferenaentreomaioreomenorvalor observados no conjunto de dados. -Amplitudedosintervalosoudasclasses(h):omaiorinteirodadivisoda amplitude total (R) pelo nmero de intervalos (k). Ou seja: h kR AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes9 2.2 - Tabela de distribuio de freqncias bidimensional Muitasvezes,estamosinteressadosemanalisarocomportamentoconjuntode duas ou mais variveis. Assim, vamos estudar como organizamos e resumimos os dados paraumadistribuioconjuntadeduasvariveisemformadetabelas.Essastabelas podemapresentarfreqnciasrelativasasquaisservemparaapresentarestimativasde riscos, ou seja, do estimativas das probabilidades de dano.Oexemplomostradoabaixoapresentaonmerodenascidosvivosregistrados, classificados segundo dois fatores: o ano de registro e o sexo. Tabela 02: Nascidos vivos registrados segundo o ano de registro e o sexo. Ano de registrosexoTotal Masculino Feminino 19841.307.7581.251.2802.559.038 19851.339.0591.280.5452.619.604 19861.418.0501.361.2032.779.253 Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro ATIVIDADE DESENVOLVIDA EM SALA DE AULA 1.Osdadosaseguirdeterminamaproduodesacas/hadesojaemdeterminada regio. Tabela 01-Produo de sacas/ha67656867676469666666 68716767706565667064 67686668646567666968 65696867686767676666 Organizeosdadoseconstruaumatabeladedistribuiodefreqnciaeohistograma da produo. 2.Osdadosaseguirrepresentamaidade50funcionriosselecionados aleatoriamente da populao de uma agroindstria X. 3. Tabela 02-Idades de 50 funcionrios(colocados em ordem crescente) 18202021222425252627 29293030313132333435 36363737373738383840 41434444454545464748 49505153545456586265 Organizeosdadoseconstruaumatabeladedistribuiodefreqnciaeohistograma da produo. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes10 3.Representao Grfica para Variveis Qualitativas e Quantitativas A apresentao dos dados atravs degrficos, nos fornece uma excelenteidia dos resultadosobtidosedecomoserelacionamosdados.Todogrficooudiagramadeve serauto-explicativoedefcilcompreenso,devemtertrsrequisitosbsicos: simplicidade,clarezaeveracidade.Masalgumassugestesdevemserseguidasnasua construo: -O tamanho do grfico deve ser adequado sua publicao; -Todo grfico dever ter sempre um ttulo e uma escala, sendo que, esta escala deve ser adequada para que no desfigure os fatos. 3.1 Representao grfica de variveis qualitativas Paraarepresentaogrficadevariveisqualitativas,ostiposdegrficosmais usadosso:grficosdeordenadas,grficoembarras,grficoemcolunas,pictograma, dot plot, grfico de setores. Grfico de Ordenadas Para a sua construo traada uma reta horizontal (ou vertical) que servir de base; apartirdepontoscomamesmadistncianestareta,constroem-setraos perpendiculares, cujo comprimento seja proporcional a freqncia. Grfico em Barras Ogrficoembarrasarepresentaoemquesobreoeixoverticalconstroem-se retngulosparaasdiferentescategoriasdanossavarivel,comlarguraapropriadae alturaproporcionalasrespectivasfreqnciasdecadacategoria.Asbarrasnoso justapostas ou ligadas, pois na maioria das vezes as categorias das variveis qualitativas no apresentam relao de continuidade. Tabela 04: Internaes em estabelecimento de sade, por espcie de clnica - 1992 Espcie de ClnicaFreqnciaFreqncia relativa (%) Mdica645792332,51 Ginecologia e Obstetrcia391830819,73 Cirurgia303107515,26 Pediatria 294393914,82 Outros351318617,69 Fonte: IBGE, Diretoria de Pesquisa, Pesquisa de Assistncia Mdico-Sanitria AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes11 Figura1:Internaesemestabelecimentodesade,porespciedeclnica-IBGE 1992. Grfico em Colunas Aconstruodogrficoemcolunassemelhanteaoembarras,comumanica diferena, os retngulos sero sustentados no eixo horizontal. Figura2:Internaesemestabelecimentodesade,porespciedeclnica-IBGE 1992. Pictograma Ogrficopictogramasemelhanteaogrficoemcolunas,comadiferenaqueno lugar de retngulos sero figuras que representaram as distribuies de freqncia. Grfico de Setores Circulares Geralmenteestegrficousadoparaevidenciaradistribuiopercentualdeuma populao ou amostra. Para a construo deste tipo de grfico, divide-se a rea total de umcrculoemsubreas(setores)proporcionaissrespectivasfreqnciasabsolutaou relativa. Lembrandoqueumcrculotem360,entousaremosaseguinteregradetrspara calcularmos o ngulo de cada setor : 05101520253035MdicaGinicologiaeObstretrciaCirurgiaPediatria OutrosFrequncia relativa (%)0 5 10 15 20 25 30 35MdicaGinicologia e ObstretrciaCirurgiaPediatria OutrosFrequncia relativa (%)AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes12 n360 fix x = nfi 360 Onde n o total de elementos no conjunto de dados e fi a respectiva freqncia absoluta da categoria da varivel. Para calcularmos o ngulo para a freqncia relativa, basta substituirmos o total de elementos pelo nmero 1. Sabendo-seongulodecadasetor,traa-seumacircunfernciaeassim,basta marcarmososvaloresdacadangulonacircunfernciaetraarosraios,separandoos setores. Figura3:Internaesemestabelecimentodesade,porespciedeclnica-IBGE 1992. Dot Plot ogrficoonde,noeixohorizontalmarca-secomespaamentosiguaiscada categoriasdavariveleverticalmenteaestas,desenha-sepontos,sendoque,a quantidadedepontosemcadacategoriaigualaovalordafreqnciaabsolutadesta. Este grfico no usual e recomendado apenas, quando as freqncias so pequenas. 32%20%15%15%18%MdicaGinicologia eObstretrciaCirurgiaPediatria OutrosAGRONOMIA-FAGEstatstica Regiane Slongo Fagundes13 3.2 Representao grfica de variveis quantitativas Alguns tipos de grficos que construmos anteriormente: grfico em colunas, em barras, dot plot, de setores circulares tambm so usados para representar a distribuio de variveis quantitativas. Histograma Este um grfico usado para apresentar dados organizados em intervalos, utilizado principalmente para representar a distribuio de variveis contnuas. Figura 4: peso ao nascer dos nascidos vivos, em quilogramas. -Histograma para classes com amplitudes iguais Paraasuaconstruo,traceosistemadeeixocartesiano;marqueosextremosdas classesnoeixohorizontal(dasabscissas);noeixovertical(dasordenadas)marqueas freqnciasabsolutasoufreqnciasrelativas;eparacadaclasse,traceumretngulo com base igual ao intervalo de classe e altura igual a freqncia. -Histograma para classes com amplitude diferentes Para a sua construo, calcule a densidade de freqncia absoluta ou relativa. hfdii =ouhhdii = Traceumsistemadeeixocartesianos;marqueosextremosdeclassesnoeixo horizontal;noeixoverticalmarqueadensidadeeparacadaclasse,traceumretngulo com base igual ao intervalo da classe e altura igual a densidade de freqncia. Polgono de freqncias arepresentaogrficadeumadistribuiodefreqnciaspormeiodeum polgono. Paraasuaconstruo,traceosistemadeeixocartesianos;marqueospontos mdiosdecadaclassenoeixohorizontal(pontomdiodeumintervaloasomados extremosdointervalodivididopordois);noeixoverticalcoloqueasfreqncias;faa 024681012141,75 2,25 2,75 3,25 3,75 4,25 4,75 MaisPeso ao nascerFreqnciaAGRONOMIA-FAGEstatstica Regiane Slongo Fagundes14 pontos na interseco do ponto mdio de cada intervalo com sua respectiva freqncia; una todos estes pontos por segmentos de reta. Figura 5: peso ao nascer dos nascidos vivos, em quilogramas. Ogiva ogrficoquerepresentaadistribuiodafreqnciaabsolutaacumulada.Sua construosemelhanteaodopolgonodefreqncias,comadiferenaque consideraremos a freqncia absoluta acumulada. 024681012141,75 2,25 2,75 3,25 3,75 4,25 4,75 MaisPeso ao nascerFreqnciaAGRONOMIA-FAGEstatstica Regiane Slongo Fagundes15 EXERCCIOS 1. AWWIndstriaeComrcio,desejandomelhoraronveldesuesfuncionrios emcargosdechefia,montouumcursoexperimentaleindicou25funcionrios para a primeira turma. Os dados referentes seo a que pertencem, sexo, idade, notas e graus obtidos no curso esto na tabela a seguir: Tabela 01 Informaes sobre a seo, sexo, idade e aproveitamento dos funcionrios da indstria WW, nas disciplinas oferecidas durante o curso experimental. Funcionrio seosexoidade Administrao direito redao estatstica ingls metodologia poltica economia 1PM25898,09AA9,08,5 2PM45897,59AB8,58,0 3PM43899,59AA9,58,5 4PM32695,06BB7,07,0 5PF309910,010AB7,58,0 6PF299910,010AB9,09,5 7PF409910,09BA9,57,5 8TF3510910,09AA1,09,5 9TM20697,08CC6,06,0 10TM23697,55DC4,05,0 11TF21696,59CC5,05,0 12TF259910,010AA9,59,5 13TF391099,510AA9,59,5 14TM37798,07BB9,08,0 15VM40798,07BA9,08,5 16VM27798,07AA8,59,5 17VF35898,58BA9,59,5 18VF34898,58BB7,07,5 19VF37897,08AB8,08,0 20VM2910910,09AA9,58,5 21VM3010910,010AA9,59,5 22VM42899,58AA8,58,0 23VF24696,05DC5,05,0 24VF26999,09AA9,59,5 25VM32695,05DC5,05,0 Observaes: Seo: P= Seo Pessoal, T= Seo Tcnica e V= Seo de Vendas. Sexo: M= Masculina, F= Feminino. Como havia dvidas quanto adoo de um nico critrio de avaliao, cada professor adotouseuprpriosistemadeaferio.Usandoosdadosdatabela,respondaas questes: a)Apsobservaratentamentecadavarivel,ecomintuitoderesumi-las,comoque voc identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contnua) cada uma das 11 variveis listadas? b)Compareeindiqueasdiferenasexistentesentreasdistribuiesdasvariveis Direito, Poltica e Estatsticas. c)Construa o histograma para as notas da varivel Redao. Interprete os resultados. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes16 d)Construaadistribuio,defreqnciadavarivelMetodologiaefaaumgrfico (poderserdesetor,barras,colunasdesuapreferncia)paraindicaressa distribuio. Interprete os resultados. e)ConstruiradistribuiodefreqnciaconjuntaparaasvariveisSexoeIdade. Interprete os resultados. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes17 PARTE III Medidas de Posio 1.Introduo Atravsdetabelasegrficosconstrudosanteriormente,vimoscomoresumire apresentar um conjunto de dados. Contudo, podemos resumir ainda mais este conjunto, apresentandoumoualgunsvaloresquerepresentamtodooconjunto.Essesvalores so chamados de medidas de posio. 2. Medidas de Tendncia Central Sovaloresestabelecidosnumpontocentralemtornodoqualosdadosse distribuem.Asmedidasdetendnciacentralqueiremosestudarso:mdiaaritmtica, mediana e moda. 2.1 - Mdia Aritmtica a soma de todos os elementos em nosso conjunto de dados dividido pelo total de elementos. Isto , = xnxnii =1 Onde n o total de elementos no conjunto de dados. A mdia aritmtica um valor que pode substituir todos os valores da varivel, isto , o valor que a varivel teria se em vez de varivel ela fosse constante. 2.1.1 Propriedades da Mdia Aritmtica Asomaalgbricadosdesviosdeumconjuntodevaloresemrelaoao mdia aritmtica zero; A soma algbrica dos quadrados dos desvios de um conjunto de valores em relao a mdia aritmtica mnima; Somando ou subtraindo uma constante a todos os valores de uma varivel, a mdia ficar acrescida ou subtrada a essa constante; Multiplicandooudividindotodososvaloresdeumavarivelporuma constante, a mdia ficar multiplicada ou dividida por essa constante. 2.1.2Vantagens do emprego da mdia Comofazusodetodososdadosparaseuclculo,podeserdeterminada com preciso matemtica; Podeserdeterminadaquandosomenteovalortotaleonmerode elementos forem conhecidos. 2.1.3Desvantagens do emprego da mdia aritmtica No pode ser empregada para dados qualitativos; influenciadaporvaloresextremos,podendo,emalgunscasos,no representar a srie. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes18 2.2 - Mediana (Md) ovalorqueocupaaposiocentraldeumconjuntodedadosordenados.Ou seja, o valor que tiver o mesmo nmero de elementos no seu lado esquerdo e direito. Sejam os nmeros a seguir, as cinco observaes de uma varivel qualquer: 5 6 7 88 Amedianaparaesteconjunto7,correspondente3a observaoqueocupaa posio central. Assim, se o nmero de elementos for mpar, a mediana o elemento cuja ordem da posio central : ||

\| +=21) (nx x MdOnde n o nmero de elementos no conjunto de dados. Sejam as seguintes observaes: 5,0 5,5 7,0 8,0 8,5 10,0 Como o nmero de elementos par, a mediana a mdia aritmtica dos dois elementos centrais, cuja ordem: 2) (222||

\| +||

\|+=n nx xx Md Neste exemplo: X1 = 6/2 = 3(3O termo)e X2 = (6+2)/2 = 4(4O termo), logo a mediana : Md =5 728 7, =+ Observe que este um valor terico, pois no figura entre os dados originais. 2.2.1 Vantagens do emprego da mediana A mediana no influenciada por valores extremos. 2.2.2 Desvantagens do emprego da mediana A mediana uma medida que exige uma ordenao de categorias, da mais altaamaisbaixa,assimelaspodeserobtidaparavariveisqualitativas ordinaisouparaasquantitativas,jamaisparavariveisqualitativas nominais; No inclui todos os valores da distribuio; 2.3 - Moda (Mo) o valor que ocorre com maior freqncia em um conjunto de dados. Exemplo:Conjunto de dados: 7857775897 Moda = Mo = 7 AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes19 Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuio quepossuiduasmodaschamamosdedistribuiobimodalemaisdeduasmodas, multimodais.Existemaindadistribuiesquenoapresentamnenhumamoda:so chamadas de amodais. 2.3.1 Vantagens do emprego da moda Amodaumamedidaquerequerapenasoconhecimentodafreqncia absolutaepodeserutilizadaparaqualquertipodevariveis,tanto qualitativas, quanto quantitativas; deusoprtico.Exemplificando:osempregadoresgeralmenteadotama refernciamodaldesalrio.Tambmcarroseroupassoproduzidos tomando como referncia o tamanho modal 2.3.2 Desvantagens do emprego da moda No inclui todos os valores da distribuio; Mostra-se ineficiente quando a distribuio amplamente dispersa. 3.Outras Medidas de Posio, as SEPARATRIZ 3.1 - Quartis (Q1 e Q3) Somedidasdeposioquedividemumconjuntodedadosordenadosem quatro partes iguais. Mn. Q1Md Q3 Mx. Onde: -O 1O Quartil (Q1) significa que 25% dos dados so inferiores a Q1, ou que 75% dos dados so superiores a Q1. -O 3O Quartil (Q3) significa que 75% dos dados so inferiores a Q3, ou que 25% dos dados so superiores a Q3. Em geral Q1 < Me < Q3. Q1 =1 1 114 4 40.75n n nX X X+ + + | | | | | |+ |||\ \ \ | |+ | |\ Q3 =( 1) ( 1) ( 1)3. 3. 3. 14 4 40.25n n nX X X+ + | | | | | | + | |+ ||||\ \ \ \ | | |+ |\ AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes20 3.2 - Box plot ou desenho esquemtico umtipoderepresentaogrfica,emqueserealamalgumascaractersticas daamostra,fornecendoumaidiadaposiocentral,disperso,assimetria,caudae dados discrepantes. O conjunto dos valores da amostra compreendidos entre o 1 e o 3 QUARTIS, que vamos representar por Q1 e Q3 representado por um retngulo (caixa) comaMEDIANAindicadaporumabarravertical.Alarguradoretngulonod qualquer informao. Consideram-se seguidamente duas linhas que unem os meios dos lados do retngulo com os extremos da amostra. Para obter esta representao, comea porserecolherdaamostra,informaessobre5nmeros,queso:os2extremos (mnimo e mximo), a mediana e o 1 e 3 quartis. A posio central dos valores dada pela mediana e a dispersod = Q3 - Q1.As posies relativas Q1, Me e Q3 do umanoodasimetriadadistribuio.Oscomprimentosdascaudassodadospelas linhasquevodoretnguloaosvaloresmaisafastadosquenosejamoutliersepelos prpriosoutliers.Arepresentaododiagramadeextremosequartistemoseguinte aspecto: Existemfundamentalmente3caractersticas,quenosdoidiadasimetriaou enviesamento e da sua maior ou menor concentrao: distncia entre a linha indicadora damedianaeosladosdoretngulo;comprimentodaslinhasquesaemdosladosdos retnguloseocomprimentodacaixa.Apresentamosaseguir3exemplosdeboxplot, correspondentes a tipos diferentes de distribuio de dados. Exemplo: Dados os nmeros: 34217542178521435567 9888 Achar mdia, mediana, moda, Q1, Q3 e construir o Boxplot 3.3 Decis:Somedidasdeposioquedividemumconjuntodedados ordenados em dez partes iguais. 3.4 Percentis:Somedidasdeposioquedividemumconjuntodedados ordenados em cem partes iguais. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes21 3.5 Medida de Assimetria H um momento em que o pesquisador far a seguinte pergunta: Qual a medida detendnciacentralquerepresentamelhoroconjuntodedadosemestudo?Assim,no caso das variveis quantitativas, quando o valor da Mediana muito diferente da Mdia, aconselhvel considerar sempre a Mediana como valor de referncia mais importante. Quando a distribuio dos dados considerada "normal", ento a melhor medida delocalizaodocentro,amdia,fatoquejustificaagrandeutilizaodamdia. Esquematicamentepodemosposicionaramdiadaformaseguinte,tendoemcontaa representao grfica na forma de histograma.

Mo Md X < < X Md Mo < < assimetria negativa ou a esquerdaassimetria positiva ou a direita Mo Md X = = distribuio simtrica Para determinar o grau de assimetria, uma regra muito utilizada : COEFICIENTE DE ASSIMETRIA DE PEARSON OSM XA= ou1 33 1* 2Q QMd Q QAs +=Desse modo, pode-se concluir que: Se As > 0, a distribuio assimtrica positiva; Se As < 0, a distribuio assimtrica negativa; Se As = 0, a distribuio simtrica. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes22 PARTE IV Medidas de Disperso ou Medidas de Variabilidade 1. Introduo Asinformaesfornecidaspelasmedidasdeposionecessitamemgeralser complementadapelasmedidasdedisperso.Estasservemparaindicaroquantoos dadosseapresentamdispersosemtornodaregiocentral.Caracterizam,portanto,o grau de variao ouoscilaes existente no conjunto de valores. Exemplo: Seja os quatro conjuntos abaixo, as notas de quatro turmas: Turma A: 4 4 5 6 6 Turma B: 5 5 5 5 5 Turma C: 2 3 6 6 8 Turma D: 0 0 5 10 10 Os conjuntos so iguais?Em qual das turmas h maior variao ou disperso dos dados em relao mdia? Para calcularmos esta disperso em relao mdia, utilizaremos algumas medidas: 1.1 Amplitude: a diferena entre o maior e o menor dado observado. Como utiliza apenasdoisvalores,contmpoucainformaosobreadisperso.utilizadaem amostra muito pequenas. R= Xmaior - Xmenor 1.2.Varinciaamostral:Avarinciamedeoquantoosvaloresemumaamostragem variam. uma medida que avalia o grau de disperso dos valores da varivel em torno damdia.Quantomenoravarincia,maiorograudeconcentraodosdadosem torno da mdia. Podemos representar o clculo dos dados da seguinte forma: 21 2 2111niniiixS xn n== (| | ( |\ (= ( ( ( (para dados de uma amostra agrupados) 1.3.DesvioPadroamostral:Avarinciaumquadrado,emuitasvezesoresultado torna-seartificial.Porexemplo:aalturamdiadeumgrupodepessoas1,70mea varincia 25cm2. Fica um tanto esquisito cm2 em altura. Para contornamos este problema definindo Desvio Padro como sendo a raiz quadrada positiva de sua Varincia. 2S S = (para dados amostrais) AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes23 Usando a tabela de distribuio normal, vemos que no intervalo de: De) S X ( a) S X ( + ograudeconcentraodeprobabilidadesemtornoda mdia de 68%; De) S X ( 2 a ) S X ( 2 + , o grau de concentrao de probabilidades em torno da mdia de 95%; De) S X ( 3 a) S X ( 3 + , o grau de concentrao de probabilidades em torno da mdia de 99,7%. Exemplificando,sedissermosqueaalturamdia( ) X dohomembrasileiro adulto de 1,70m e desvio Padro (S) 5cm, estaremos dizendo que entre; 1,65me1,75m encontramos 68% da populao masculina adulta brasileira. 1,60me1,80m encontramos 95% da populao masculina adulta brasileira. 1,55me1,85m encontramos 99,7% da populao masculina adulta brasileir.a OBSERVAO: O desvio Padro representa a maneira mais comum de se medir a variao deumconjuntodeobservaes.Paraduasamostras,aqueapresentarumdesvio padro maior acusar uma maior disperso. Quantomenorodesviopadro,maisosvaloresdavarivelseaproximam de sua mdia. Quantomaioravarinciaedesviopadro,maioressoosindciosde heterogeneidade entre os elementos do conjunto. 1.4.CoeficientedeVariaodePEARSON:Ocoeficientedevariaomedea homogeneidade dos dados em conjunto em relao mdia, sua frmula expressa por: 100 =xSCVO valor obtido ser dado em porcentagem. Acima de 30% o conjunto de dados considerado heterogneo Abaixo de 30% o conjunto considerado homogneo. Em algumas regras empricas para interpretaes do coeficiente de variao: Se 0 CV < 10% tem-se baixa disperso Se 10% CV ) t , X ( P H3: O nmero de ocorrncias constituem varivel aleatrias independentes. Seja X: nmero de sucessos no intervalo, ento: Frmula:P(X = x) = ! xe .x Onde: =coeficientedeproporcionalidade,outaxadefreqnciaporunidadede tempo, rea, etc. t =tempo, rea; e = base dos logaritmos naturais; x = nmero de ocorrncias (sucessos) = .t Parmetros da distribuio de Poisson Esperana:E(x) = (x) = .t Varincia:Var(x) = 2 (x) = .t AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes41 EXERCCIOS 1.Uma moeda jogada 10 vezes. Calcule as seguintes probabilidades: a)de dar pelo menos duas caras;R: 98,93% b)de ocorrer seis caras;R: 20,51% c)de no dar nenhuma coroa;R: 0,098% d)de dar pelo menos uma coroa;R: 99,90% e)de no dar 5 caras e 5 coroas R: 75,39% 2.Admitindoqueonascimentodemeninosemeninassejamiguais,calculea probabilidadedeumcasalcomseisfilhosterquatrofilhoshomenseduas mulheres. R: 23,44% 3.Umaurnatem20bolaspretase30brancas.Retira-se25bolascomreposio. Qual a probabilidade de que: a)2 sejam pretas?R: 0,038% b) Pelo menos 3 sejam pretas?R: 99,96% 4.Numa estrada h 2 acidentes para cada 100 km. Qual a probabilidade de que em; a) 250Km ocorram pelo menos 3 acidentes?R: 87,53% b) 300Km ocorram 5 acidentes?R: 16,06% 5.Aprobabilidadedeumarqueiroacertarumalvoumanicaflechade0,20. Lana 30 flechas no alvo. Qual a probabilidade de que: a) exatamente 4 acertem o alvo? R: 13,25% b) pelo menos 3 acertem o alvo? R: 95,58 6.Opessoaldeinspeodequalidadeafirmaqueosrolosdefitaisolante apresentam,emmdiaumaemendaacada50metros.Admitindo-sequea probabilidadedonmerodeemendasdadapelaPoisson,calculeas probabilidades; a) de nenhuma emenda em um rolo de 125 metros.R: 8,21% b) De ocorrer no mximo duas emendas em um rolo de 125 metros. R: 54,40% c)De ocorrer pelo menos uma emenda em um rolo de 100 metros. R: 86,47% 7.AdmitindoqueXtemdistribuiodeprobabilidadedePoisson,encontreas probabilidades: a) P(X=5) quando = 3,0R: 10,08% b) P(X 2) quando = 5,5)R: 8,84% c) P(X 4) quando = 7,5)R: 5,91% d) P(X = 8) quando = 4,0 R: 2,98% 8.Sabe-seque20%dosanimaissubmetidosaumcertotratamentono sobrevivem. Se esse tratamento foi aplicado em 20 animais e se X o nmero de no sobreviventes: a) qual a distribuio de X? Binomial = B(20 ; 0,2) b) calcular a E[X] e Var [X]R: E[X] = 4Var[X] AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes42 c) calcular P(2 < X 4)R : 42,36% d) calcular P(X 2) R = 93,08% 9. O nmero de mortes por afogamento em fins de semana, numa cidade praiana de 2 para cada 50.000 habitantes. Qual a probabilidade de que em: a) 200.000 habitantes ocorram 5 afogamentosR: 9,16% b) 112.500 habitantes ocorram pelo menos 3 afogamentos?R: 82,64% 10. A mdia de chamadas telefnicas numa hora trs. Qual a probabilidade de: a) Receber exatamente trs chamada numa hora?R: 22,41% b) Receber quatro ou mais chamadas em 90 minutos?R: 65,8% 11. CertopostodeBombeirosrecebeemmdiatrschamadaspordia.Calculara probabilidade de: a) receber quatro chamadas num dia;R: 16,8% b) receber trs ou mais chamadas num dia.R: 57,67% 12. Uma loja atende em mdia dois cliente por hora. Calcule a probabilidade de em uma hora: a) atender exatamente dois cliente;R: 27% b) atender trs clientes.R: 18% 13. Suponha 400 erros de impresso distribudos aleatoriamente em um livro de 500 pginas. Encontre a probabilidade de que dada pgina contenha: a) nenhum erro;R: 44,9% b) exatamente dois erros. R: 14,37% 14. Se5%daslmpadasdecertamarcasodefeituosas,acheaprobabilidadede que, numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos: a) nenhuma defeituosa;R: (0,95)100 b) trs defeituosas;R: |||

\|3100) 95 , 0 ( ) 05 , 0 (97 3 15. A probabilidade de um atirador acertar uma alvo de 31. Se ele atirar seis vezes, qual a probabilidade de: 1.acertar exatamente dois tiros?R: 32,92% 2.no acertar nenhum tiro?R: 8,78% 16. Emumtestedotipocerto-errado,com100perguntas,qualaprobabilidadede uma aluno, respondendo s questes ao acaso, acertar 70% das perguntas? R: |||

\|||

\|7010021100 AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes43 PARTE VII Distribuio Tericas De Probabilidade De Variveis Aleatrias Contnuas 1.Varivel Aleatria Contnua Seja X uma varivel aleatria. Se o contradomnio de X um intervalo, ou uma coleo de intervalos, denominamos X de Varivel Aleatria Contnua. Exemplos: X: Altura acima do solo que um dardo atinge o painel. X: O intervalo de tempo de vida de uma lmpada. X: Tempo de vida til de uma bateria de automvel. X: Tempo de vida de uma pessoa. 2.DefinioPodemos dizer que uma varivel aleatria contnua aquela que assume valores em um intervalo da reta real dos nmeros reais. Por definio, uma varivel aleatria X contnua em IR se existir uma funo f(x), tal que: 1.0 ) ( x f (no negativa) 2. =1 ) ( dx x f . A funo f(x) chamada funo densidade de probabilidade (f.d.p.). Observamos que: = badx x f b X a P ) ( ) (A rea sobre a curva expressa a funo densidade de probabilidade de uma f.d.p. definida. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes44 Parmetros: ESPERANA MATEMTICA: Pode ser entendida como um centro de distribuio de probabilidade. = = dx x f x x X E ) ( ) ( ) ( VARINCIA MATEMTICA: 2 2)] ( [ ) ( ) ( X E X E X VAR =onde: = dx x f x X E ) ( ) (2 2 Tambm podemos definir: = =xds s f x X P x F ) ( ) ( ) ( 2.1DISTRIBUIO NORMAL O nome normal deve-seao fato de que muitas distribuies de freqncias de erros de observaes e mensuraes podem ser descritas por uma distribuio dessa natureza. A funo f(x) chamada funo densidade de probabilidade (f.d.p.) de uma distribuio normal definida por: 22121) (||

\| = xe x f , para+ < < xO grfico de f(x) ; As principais caractersticas dessa funo so: a)o ponto mximo de f(x) o ponto X = ; AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes45 b)os pontos de inflexo da funao so: X = + eX = ; c)a curva simtrica com relao a ; d)E(X) = eVAR(X) = 2 Se quisermos calcular a probabilidade indicada na figura, devemos fazer: ||

\| = baxdx e b x a P22121) ( Graficamente: Essaintegralrequerumtrabalhocomputacionalemsriespararesolv-la,pois de forma analtica a mesma se torna invivel. Para solucionarmos este problema usamos umatransformaodevariveisquenosconduzchamadadistribuionormal padronizada,oudistribuionormalreduzida.Usaremosaseguintenotao: ) , ( :2 N XPara transformao de variveis , consideraremos a seguinte transformao linear de X para Z: =iiXZLogo,paraencontrarmosasreas(probabilidade)sobacurvaf(x),mudam-sesuas abscissasparaZ,determinando-seaprobabilidadecomauxiliodeumatabelanormal padronizada. Assim: ) ( ) (2 1z Z z P b x a P < < = < t0) = 0te AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes47 EXERCCIOS 1.Foifeitoumestudosobreaalturadeumafaculdade,observando-sequeelase distribuanormalmentecommdiade1,72medesvioPadrode5cm.Quala porcentagem dos alunos com altura: a)entre 1,67me1,77m? b)entre 1,62me1,82m? c)entre 1,57me1,87m? d)acima de 1,90m? R: a) 68,27%b) 95,45%c) 99,73%d) 0,02% 2.Umestudodasmodificaespercentuaisdospreos,noatacado,deprodutos industrializados,mostrouquehdistribuionormalcommdiade50%e desvio padro de 10%. Qual a porcentagem dos artigos que: a)sofreram aumentos superiores a 75%? b)sofreram aumentos entre 30% e 80%? R: a) 0,626b) 97,59% 3.Ovolumedecorrespondnciarecebidoporumafirmaquinzenalmente,tem distribuionormalcommdiade4000cartasedesviopadrode200cartas. Qual a porcentagem de quinzenas em que a firma recebe: a)entre 36000 e 4250 cartas? b)menos de 3400 cartas? c)mais de 4636 cartas? R: a) 87,16%b) 0,14%c) 0,07% 4.Numafbricaforaminstaladas1000lmpadasnovas.Sabe-sequeadurao mdiadaslmpadasde800horasedesviopadrode100horas,com distribuio normal. Determinar a quantidade de lmpadas que duraro: a)Menos de 500 horas. b)Mais de 700 horas. c)Entre 516 e 814 horas. R:a) 1,4b) 841,3c) 120,8 5.Aduraodecertocomponenteeletrnicopodeserconsideradanormalmente distribudacommdiade850diasedesviopadrode45dias.Calculara probabilidade de um componente durar: a)entre 700 e 1000 dias; b)mais de 800 dias; c)menos de 750 dias; d)exatamente 1000 dias. R: a) 1b) 0,8665c) 0,0132d) 0 6.Uma fbrica de pneumticos fez um teste para medir o desgaste de sues pneus e verificouqueeleobedeciaaumadistribuionormaldemdia48.000kme desvioPadrode2.000km.Calculeaprobabilidadedeumpneuescolhidoao acaso: a)Durar mais de 46.000km; b)Durar menos de 52.000km c)Durar entre 45.000 e 50.000km. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes48 7.Suponhaqueodimetromdiodevidadosparafusosproduzidosporuma fbricasejade0,25polegadas,eodesviopadrode0,02polegadas.Um parafusoconsideradodefeituososeseudimetromaiorque0,28polegadas ou menor que 0,20 polegadas. a)Encontre a porcentagem de parafusos defeituosos. b)Qualdeveseramedidamnimaparaquetenhamosnomximo12%de parafusos defeituosos? R: a) 7,3%b) 0,2266 polegadas 8.Seasinterrupesnosuprimentodeenergiaeltricaocorremsegundouma distribuiodePoissoncommdiadeumainterrupopormes(quatro semanas), qual a probabilidade de que entre duas interrupes consecutivas haja um intervalo de: a)Menos de uma semana? b)Entre 10 e 12 semanas? c)Exatamente um ms? d)Mais de trs semanas? R: a) 0,2212b) 0,0323c) 0d) 0,4724 9.Otempodeatendimentonumaoficinaaproximadamenteexponencialcom media de quatro minutos. Qual a probabilidade de: a)espera superior a quatro minutos? b)Espera inferior a cinco minutos? c)Espera de exatamente quatro minutos? R:a) 0,3679b) 0,7135c) 0 10. Sabemos que o intervalo de ocorrncias sucessivas de uma doena contagiosa uma varivel aleatria que tem distribuio exponencial com mdia de 100 dias. Qualaprobabilidadedenoseterregistrodeincidnciadadoenaporpelo menos 200 dias a partir da data em que o ltimo caso for registrado? R:0,1353 AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes49 PARTE VIII Regresso e Correlao Amostral 1. CONCEITO DE MODELO De modo geral, a palavra modelo pode ser entendida como uma representao abstrata darealidade,estruturadadeformatalquepermitacompreenderofuncionamentototal ouparcialdessarealidadeoufenmeno.Refere-seaumconjuntodehipteses estabelecias a priori sobre o comportamento de um fenmeno, com base numa teoria j existente ou a partir de novas proposies tericas. 1.1 CLASSIFICAO DE MODELOS Osmodelos,nosentidoaquireferido,podemserpuramentetericosou estatsticos que chamaremos de modelos de regresso. Modelostericossoaquelesqueexpressamleissemnecessariamentecontera especificaoefetivadaformamatemticanemaenumeraoexaustivadasvariveis que o compem. Josmodelosderegressosoaquelesquenecessariamentecontmas especificaes(formamatemtica,definiodasvariveisenmerodeequaes)para aplicao emprica, alm de incorporar um termo residual (ou erro) com a finalidade de levaremcontavariveisououtroselementos,queporalgumarazo,nopuderamser considerados explicitamente. Contrastandocomosmodelosdeterminsticosquesupemaexistnciade variveis que satisfazem exatamente as equaes matemticas, os modelos de regresso ou probabilsticos no admitem relaes exatas em virtude da no-incluso de todas as variveisquedeterminamocomportamentodofenmenoedeerrosdemedidasdas variveis. 1.2 MODELOS DE REGRESSO Trs aspectos dos modelos de regresso destacam-se: a estrutura, a classificao quanto s caractersticas dos fenmenos a serem modelados e as qualidades desejveis. 1.2.1 Estruturas do modelo de regresso Aformulaodeummodeloderegressoenvolvequatroelementosbsicos,a saber: i) variveis; ii) relaes ou equaes; iii) parmetros ou coeficientes; iv) termo aleatrio ou permutao aleatria ou erro aleatrio. Variveissocaractersticasobservveisdealgumaentidade,quepodem apresentar diferentes valores. So, portanto, magnitudes sujeitas a alteraes. Asvariveispodemserclassificadasemdependentesouexplicadase independentes ou explicativas. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes50 Variveisdependentesouexplicadassoaquelasquerecebeminflunciade outrasvariveis.So,tambm,chamadasdevariveisendgenasouvariveisefeito. Variveisindependentesouexplicativas,tambmdenominadasdecausaouexgenas, soaquelasqueafetamasvariveisdependentes,cujocomportamentosedeseja explicar. Oconjuntodevariveisexplicativasmaisotermoconstantesodenominados costumeiramente de regressores. Asrelaesouequaesdescrevemouexpressamomecanismoqueacionaos elementos singulares de um fenmeno. Parmetrosouequaesdescrevemouexpressamomecanismoqueacionaos elementos singulares de um fenmeno. Parmetrossomagnitudesquepermanecemconstantesnombitodeum fenmeno concreto. O termo constante, especificamente, indica a ausncia de alterao significativa davariveldependenteaolongodotempoouentreunidadesdeobservaono temporais,nombitodaamostrautiliza,apstersidodescontadasainflunciadas variveis explicativas sobre a explicada. Otermoaleatrioouerroaleatrioaexpressodeumgrandenmerode pequenascausas,queproduzemumdesvioemrelaoaoqueavariveldependente deveria ser, se a relao fosse determinstica.Por conseguinte, o tal indica: variveis omitidas imprevisibilidade do comportamento humano; variao do comportamento erros de medidas da varivel dependente; especificaes imperfeita das relaes. 1.2.2 Classificaes teis dos modelos de regresso tilclassificarosmodelosderegressoemfunodascaractersticasdos fenmenos que se desejam modelar. Osmodelospodemserclassificadosquantoformafuncional,aonmerode equaes, s associao das variveis com o tempo e a finalidade. Dessa forma, ter-se-o os seguintes modelos: a)quanto a forma funcional Lineares aqueles que so expressos por funes lineares nos parmetros. i iy a bx e = + +No-lineares aqueles expressos por funes no lineares nos parmetros. Exemplos: 2.exp( )ti i iy a bt ey a bx cx e= += + + + b)quanto ao nmero de equaes Uni-equacionais contem apenas uma equao i iy a bx e = + + Multi-equacionais contem pelo menos, duas equaes. t t t tM a bY cP u = + + + AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes51 c)quanto a associao das variveis com o tempo Estticos-quandooajustamentodavariveldependenteemfunodoefeito da varivel explicativa ocorre simultaneamente no mesmo perodo de tempo. Dinmico quando as variveis se referem a perodos de tempo diferentes. d)quanto a finalidade Modelosdedecisosoaquelesorientadosparaoprocessodetomadade decises. Modelos de previso que visam previso de valores de uma varivel. Tais classificaes no so exclusivas. Portanto, um modelo pode ser, por exemplo linear, uni-equacional, dinmico e de deciso ao mesmo tempo. 1.2.3 Qualidades desejveis dos modelos de regresso A qualidade de um modelo de regresso normalmente avaliado em funo das seguintes propriedades. a)Plausibilidadetericasegundotalpropriedade,omodelodevedescrevere explicar adequadamente o fenmeno sob anlise. b)Capacidadeexplanatrionessecaso,omodelodevesercapazdeexplicaros dados observados, cuja relao ele determina. c)Exatidodasestimativasdosparmetrososparmetrosestimadosdeveroser exatosnosentidodeaproximar-setantoquantopossveldoverdadeiroparmetro estrutural. d)capacidadedeprevisoomodelodevesercapazdegerarprevisessatisfatrias de valores futuros da varivel dependente. e)Simplicidadeomodelodeverepresentarasrelaesentreasvariveiscomo mximo de simplicidade em termo de nmero de equaes e da forma matemtica. 1.3 - ESPECIFICAO DO MODELO DE REGRESSO Aespecificaodeummodeloumadasetapasmaisimportantesdapesquisa estatstica,poisrequerconhecimentostantodateoriaquantodamatemtica, sobre tudo de funes e derivadas. Nasespecificaesdeummodelo,dever-se-oconsiderar,inicialmente,aos seguintes requisistos: i)delimitao do fenmeno ou grupo de fenmenos a serem estudados; ii)identificao das variveis; iii)estabelecimentos de relaes entre variveis; iv)definiodafinalidadedomodelo,afimdeorientaraespecificaoda forma matemtica, a seleo de variveis e o nmero de equaes. Em conseqncia, a especificao a etapa do trabalho estatstico que envolve: i)a determinao das variveis dependentes e explicativas a serem includas no modelo; ii)a expectativa a priori dos sinais e magnitude dos parmetros; iii)a formulao (linear, ou no linear); iv)o nmero de equaes; v)aformademediodasvariveis,comounidadesadotadas,defasagensou avanos de efeitos de variveis temporais, etc. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes52 Asfontesdeinformaesparaaespecificaodemodelosquesecostuma recorrer para defini-las so: i)teoria; ii)estudo de casos anteriores; iii)conhecimentos sobre as condies especificas do fenmeno; iv)termo aleatrio. Aconstruodeummodeloderegresso,semaexistnciadeumateoriaou outro raciocnio a priori subjacente, tem as seguintes implicaes negativas: i)descrio, mais no explicao do fenmeno; ii)esterilidadedomodelomedidaquenopermiteatuarsobreocursodo fenmeno estudado; iii)o modelo descrito fica excessivamente dependente das condies ou fatores envolvidos. 1.4 - CORRELAO Ocoeficientedecorrelaodetermina,emproporo,quantodavariaona resposta explicado pela regresso em questo. Usamos r() para indicarmos o grau de correlao eR2 = Para indicarmos ograu de determinao, que nada mais que o quadrado do coeficiente de correlao. Quando maior o coeficiente de correlao entre duas variveis, maior o R2. O valor de r pode variar de -1 a + 1. Os valores indicam o mximo de correlao; o sinal (+ou-)indicaosentidodacorrelao;ovalor0significaaindependnciadas variveis, isto , no existe correlao. Observamos que quando0 > e 0 < , as nuvensde pontos dos diagramas dedisperso(a)e(b)apresentamumatendncialinear.Quantomaisprximoforde +1 e de -1, maior o grau de dependncia entre as variveis e maior a confiabilidade de se escrever uma varivel em funo da outra. 1 1 1 + a) Quando. 0 ) , cov( , 0 > > Y X O diagrama de disperso :( ) 1 + xy b) Quando. 0 ) , cov( , 0 < < Y X O diagrama de disperso :( ) 1 xy AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes53 c) Quando. 0 ) , cov( , 0 = = Y X O diagrama de disperso :( ) 0 xy importantedestacarofatodeque,apesardoforterelacionamentoexistente entre a anlise de regresso e de correlao, na maioria dos casos a anlise de regresso uma ferramenta mais poderosa Isso acontece porque a correlao fornece apenas uma medidadaassociaoentreasvariveisenemsemprepodeserutilizadaparaa realizao de predies. J a anlise de regresso muito til para desenvolver modelos querepresentam,deformaquantitativa,otipoderelacionamentoexistenteentreas variveis. Estes modelos podem ser empregados para as realizaes de predies. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes54 EXERCCIOS 1.NumexperimentofoiestudadoarelaoentreaalturadamudaeoDimetro (D)dostubetesdepapel,utilizadosnaformaodemudasdeeucalipto.Osdadosse encontram no quadro a seguir. Quadro 1: Altura das mudas de eucalipto (cm) em funo do dimetro do tubete Dimetro (cm)3,556,5 Altura da muda (cm)4,9817,9122,13 Com bases nas informaes anteriores, determine: a)O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b)Faa um estudo matemtico do comportamento do grfico. c)Qual seria a altura esperada para um dimetro de 4cm? E 6 cm? d)Qual a taxa de variao de crescimento das mudas em funo do dimetro? 2.Os dados da tabela abaixo representam a velocidade de um mvel em relao ao tempo. t(segundos)010203040 v(m/s)0307590110 a)O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b)Faa um estudo matemtico do comportamento do grfico. c)Qual seria a velocidade esperada aps se passarem 15segundos?e 35segundos?e 1 minuto? d)Qual a taxa de variao da velocidade em funo do tempo? 3.NotrabalhoEfeitodedosesdegessonaculturadofeijoeiro(Phaseolus vulgarisL.), Ragazzi (1979) utilizou um experimento inteiramente casualizado com 4 repeties,paraestudarosefeitosde7dosesdegesso(Tratamentos):0,50,100,150, 200, 250, e 300 kg/ha sobre diversas caractersticas do feijoeiro. Os dados do quadro a seguir indica o peso de 1.000 sementes (g). Quadro 3: Produo de colmos de cana-de-acar em funo da adio de Nitrognio Doses (kg/ha) 050100150200250300 Peso de 1000 sem. 138,60153,60164,53164,93163,20159,98154,43 a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b) Faa um estudo matemtico do comportamento do grfico. c) Estime o pesomximo de 1000 sementes em funo da dosagem de gesso. 4.EmumexperimentorealizadoporMELOetal.(1993)sobreFertilidadedo Solo, obteve-se os dados apresentados no Quadro 4, que mostra a produo de colmos da cana-de-acar (kg/ha), dada como funo da adio de Nitrognio (kg/ha). Quadro 4: Produo de colmos de cana-de-acar em funo da adio de Nitrognio x - kg/ha102030405060708090100 f(x)-kg/ha380,43394,6412,8423,96432,4441,6444,45446,16445,31441,9 AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes55 Com bases nas informaes anteriores, determine: a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b) Faa um estudo matemtico do comportamento do grfico. c) Estime a produo mxima em funo da dosagem de nitrognio. 5.Em um estudo realizado por DAO (1996), publicado em um artigo do Agronomy Journal,obteve-sedadosdadensidadevolumtricadosolof(mg/m3)emdiferentes alturasdosolox(m),paradadotipodemanejodosolo.Osdadosobtidosesto apresentados no Quadro 5. Quadro 5: Densidade volumtrica em diferentes alturas dos solo. x - m00,050,10,150,20,250,30,350,40,450,5 f(x)-mg/m3 1,141,251,29991,31981,29981,21,25571,2721,3371,45881,6913 Com bases nas informaes anteriores, determine: a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b) Faa um estudo matemtico do comportamento do grfico. 6.Em um experimento realizado por PATERNIANI.(1978) sobre Melhoramento daProduode milho noBrasil,obteve-seos dadosapresentadosnoQuadro 6, que descrevem a produo de matria seca f(x)(g/planta) do milho em funo da idade da planta x (dias). Quadro 6: Produo de matria seca do milho em funo da idade da planta x - dias2030405060708090100 f(x)-g/planta0,5833,5880,58135,58192,58245,58288,58315,58320,58 Com bases nas informaes anteriores, determine: a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia) e determine seu grau de correlao. b) Faa um estudo matemtico do comportamento do grfico. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes56 PARTE IX Tcnicas De Amostragem POPULAO Erro! 1.Amostra Aleatria N o nmero de indivduos da populao (N conhecido ou desconhecido) Os problemas de amostragem so: 1)Como coletar a amostra? 2)Quanto vale n? 3)Tcnica de amostragem a ser utilizada? OelementofundamentalemEstatsticaaestimativa.Isto,emuma pesquisa muitas vezes h a necessidade de se fazer previses: Luis Incio Lula da Silva, vai ganhar a eleio com uma margem de 2,5% de erro; a inflao do ms que vem deve chegaraos17%.Emquasetodososcasos,aestimativaestassociadaaumapesquisa ouaumaverificaodecaractersticas,quedevidocustosacessveiscomresultados satisfatrios, no realizada sobre todos os elementos da populao, mas sim sobre uma partedela,chamadadeamostra.Assim,umdosobjetivosdaestatsticatirar conclusessobreotodo(populao)apartirdasinformaesfornecidasporparte representativadotodo(amostra).Assim,realizadasasfasesdedescriodosdados. (estatsticadescritiva),feitaumaanlisedosresultados,obtidosatravsdosmtodos daEstatsticaInferencialouIndutiva,quetemporbaseainduo,infernciadedados com induo da preciso, obtida por meio da teoria da probabilidade. Quantomaisseconhecersobreapopulao,melhoresseroasinformaes colhidaspelaobservaodeumaamostra.Porexemplo,umacozinheiraparaverificar seoensopadoqueelaestpreparandotemounoumaquantidadedesaldesejada, experimenta apenas uma colher de ensopado, pois se sabe que a distribuio do sal em todo o ensopado homognea, e de qualquer lugar que se tivesse retirado a amostra do ensopado,elaseriarepresentativa.Masnemsempreaescolhadeumaamostra representativaimediata.Amaneiradeseescolheroselementosparacomporuma amostra denominada Amostragem. Como as concluses relativas populao vo estar baseadas nos resultados obtidos nas amostras dessa populao, vemos o quo importante a fase de coleta dos AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes57 dados(amostragem),poisseerrosforemcometidosnomomentodeselecionarmosos elementosdaamostraotrabalhoficacomprometidoeosresultadosfinaissero provavelmenteincorretos.Devemos,portanto,tomarcuidadosespeciaisquantoaos critrios que sero utilizados na seleo da amostra. O que necessrio garantir, em suma que a amostra seja representativa dapopulao.Istosignificaque,amenosdecertasdiscrepnciasinerentes aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a amostra deve possuir as mesmas caractersticas bsicas da populao no que diz respeito (s) varivel(eis) que desejamos pesquisar. 2.Vantagens De Um Levantamento Por Amostragem 2)Menor custo; 3)Menor tempo; 4)Maior amplitude do universo; 5)Menor erro da medida. 3.Tipo De Amostragem Probabilstica 3.1 - Amostragem simples aleatria (m.s.a.) aamostragememquesepressupequetodooelementodapopulaotema mesmaprobabilidadedeserincludonaamostraextrada.Umadasformaspelasquais se pode executar este tipo de amostragem atribuindo a cada elemento da populao um nmerodistintoeefetuandosucessivossorteiosatecompletarotamanhodaamostra. Estaseleodoselementosaindapodeserfeitaatravsdetabelasdenmeros aleatrios,programascomputacionaisoudecalculadorascientficasquepossuama funo RANDOM (ALEATORIZAO). RESUMO: equivalente a um sorteio de loteria; Considera a populao homognea; Cadaelementodapopulao(umidadeexperimental),temamesma oportunidade de ser escolhida; Utilizam-senmerosaleatrios,programas,computacionais,calculadoras, bolinhas numeradas, etc. MTODOS DE ESCOLHA 1)Enumeramos a populao 1, 2, ...., N; 2)Determinamos o tamanho da amostra N; 3)Escolhemos a amostra. ELEMENTO ESCOLHIDO = N * (Ran) + 1 UTILIZANDO A CALCULADORA AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes58 Exerccio: N = 20 alunos de uma turma da FAG n = 7 alunos escolhidos aleatoriamente (amostra) 1 -2 -3 -4 - 5 - 6 -7 - Amostra 1Amostra 2 3.2 - Amostragem Estratificada Muitasvezesapopulaosedivide,emsub-populaesouestratos,sendo razovelsuporque,deestratoparaestrato,avariveldeinteresseapresenteum comportamentosubstancialmentediverso,tendo,entretanto,comportamento razoavelmentehomogneodentrodecadaestrato.Emtaiscasos,seosorteiodos elementosdaamostraforrealizadosemselevaremconsideraoaexistnciados estratos,podeacontecerqueosdiversosestratosnosejamconvenientemente representados na amostra, a qual seria mais influenciada pelas caractersticas da varivel nosestratosmaisfavorecidospelosorteio.Evidentementeatendnciaocorrnciade tal fato ser tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se adotar uma amostragem estratificada. Aamostragemestratificadaconsisteemespecificarquantoselementosda amostra sero retirados em cada estrato. costume considerar trs tipos de amostragem estratificada:uniforme,proporcionaletima.Naamostragemestratificadauniforme: sorteia-seigualmenteonmerodeelementosemcadaestrato.Naproporcionalo nmero de elementos sorteados em cada estrato proporcional ao nmero de elementos existentes no estrato. Evidentemente a amostragem estratificada uniforme ser em geral, recomendvelseosestratosdapopulaoforempelomenosaproximadamentedo mesmotamanho,casocontrario,seremgeralprefervelaestratificaoproporcional porfornecerumaamostramaisrepresentativadapopulao.AAmostragem estratificadatimaporsuaveztomaemcadaestrato,umnmerodeelementos proporcionalaonmerodeelementosdoestratoetambmavariaodavarivelde interessenoestrato,medidapeloseudesviopadro.Pretende-seassimotimizara obtenodeinformaessobreapopulao,combasenoprincipiodeque,ondea variaomenor,menoselementossonecessriosparabemcaracterizaro comportamento da varivel. Dessa forma, com um menor nmero total de elementos na amostra,conseguir-se-iaumaquantidadedeinformaoequivalenteaobtidosnos demaiscasos.Asprincipaisdificuldadesparaautilizaodessetipodeamostragem residemnascomplicaestericasrelacionadascomaanlisedosdadoseemque, muitasvezesnopodemosavaliardeantemoodesviopadrodavarivelnos diversos estratos. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes59 CASADOS 210 RESUMO: utilizada quando existir diferenas (populao heterognea) entre diversas partes da populao. Essas diferenas denominaro os estratos. MTODOS DE ESCOLHA 1)Determinamos o tamanho da populao N; 2)Definimos: We = Ne N Onde: N o tamanho da populao; Ne tamanho do estrato; We a proporo de cada estrato. Para e = 1, 2, .. e 1 Tal queNe = N

E =1 Onde: n o tamanho da amostra; ne tamanho da amostra por estrato; We a proporo da populao por estrato. Exemplo: N1 = 50 solteiros; N2 = 210 casados; N3 = 40 outros N = 300 W1 = N1 =50proporo de solteiros N 300 W2 = N2 = 210proporo de casados N300 W3 = N3 =40 proporo de outros ne = n*We SOLTEIROS 50 OUTROS 40 N = 300 pessoas n = 60 pessoas amostra total AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes60 N300 Logo a amostra por estrato ser: n1 = nW1 = 60 (50/300) = 10 n2 = nW2 = 60 (210/300) = 42 n3 = nW3 = 60 (40/300) = 8 n = 60 total Solteiros (10) Elementos = 50 (Ram) +1 =Escolhido= Casados (42) Elementos = 210 (Ram) +1 = Escolhido= Outros (8) Elementos = 40 (Ram) +1 =Escolhido= 3.3 - Amostragem sistemtica Quando os elementos da populao se apresentam ordenados e a retirada dos elementos da amostra feita periodicamente, temos uma amostragem sistemtica. Assim por exemplo em uma linha de produo, podemos a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. A principal vantagem da amostragem sistemtica est na grande facilidade na determinao dos elementos da amostra. O perigo em adot-la est na possibilidade da existncia de ciclos de variao da varivel de interesse, especialmente se o perodo desses ciclos coincidir com o perodo de retirada dos elementos da amostra. 10Solteirosescolhidosporm.s.a. 42 casados escolhidos porm.s.a. 8 Outros escolhido por m .s.a. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes61 Poroutrolado,seaordemdoselementosnapopulaonotiverqualquer relacionamento com a varivel de interesse, ento a amostragem sistemtica ter efeitos equivalentes a casual simples, podendo ser utilizada sem restries. RESUMO: utilizada quando a populao encontra-se cadastrado ou enumerado. Vantagens: Fcil escolha da amostra; Mais preciso que o m.s.a; to preciso quanto amostragem estratificado. MTODO DE ESCOLHA DA AMOSTRA 1)Define-se o tamanho da populao e o tamanho da amostra Ntamanho da populao n tamanho da amostra 2) Determina-se a proporo entre populao e amostra: K = N n 3) Escolhe-se um nmero aleatoriamente menor ou igual a K, suponhamos a > 0. Logo a amostra sistemtica ser: a, a+k, a+2k, ....., a+(n-1)k Exemplo: Suponhamosquedesejamosestudaroestadodeconservaodarodovia BR277 com 190 Km. Para o qual estudaremos uma amostra aleatria de 30 Km (isto n = 30). N = 190 n = 30 (foi determinado) R = 190 = 6,33 6 30 a = 4escolhido aleatoriamente As amostras so: a, a+2k 4, 10, 16, 22, 28, 34, 40 46, 52, 58, 64, 70, 76, 82,......,178 0km 1km ...190km CascavelFoz AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes62 3.4 - Amostragem por Conglomerados Quandoapopulaoapresentaumasubdivisoempequenosgrupos,chamado deconglomeradospossvelemuitasvezesconvenientefazer-seaamostragempor meiodeconglomerado,aqualconsisteemsortearumnmerosuficientede conglomerados,cujoselementosconstituiroaamostra.Ouseja,asunidadesde amostragem, sobre as quais feito o sorteio, passam a ser os conglomerados e no mais os elementos individuais da populao. Esse tipo de amostragem s vezes adotado por motivos de ordem prtica e econmica. RESUMO: utilizada quando a populao pode ser dividida em pequenos grupos, chamados de conglomerados. Fcil escolha da amostra; 4.Tipo De Amostragem No - Probabilstica 4.1 - Amostragem Intencional uma amostragem noprobabilstica e consiste em selecionar um subgrupo de populaoque,combasenasinformaesdisponveis,possaserconsiderado representativo,detodaapopulao.Aprincipalvantagemdaamostragemintencional esta nos baixos custos de sua seleo. A amostragem intencional no considerada um bommtodo,poisosdadospodemserfacilmentemanipulados,direcionadosaos interesses do pesquisador ou de quem encomendou a pesquisa. 4.6 - Amostragem a Esmo aamostragememqueoamostrador,parasimplificaroprocesso,procuraser aleatriosem,noentantorealizarpropriamenteosorteiousandoalgumdispositivo aleatrio confivel. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de uma caixa contendo 1000 evidentemente no faremos uma amostragem casual simples, pois seria extremamente trabalhosa, mas procederemos a retirada simplesmente a esmo. Osresultadosdaamostragemaesmosoemgeralequivalentesaosdeuma amostragem probabilstica se a populao homognea e se no existe apossibilidade deoamostradorserinconscientementeinfluenciadoporalgumacaractersticados elementos da populao. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes63 EXERCCIOS 1.Osassociadosdeumacooperativaestoorganizadosemumarquivo,porordem alfabtica.Qualamaneiramaisrpidadeamostra1/3dototaldefichasde associados? 2.Umpesquisadortemdezgaiolasquecontm,cadauma,seisratos.Comoo pesquisador pode selecionar dez ratos para uma amostra? 3.Paralevantardadossobreonmerodefilhosporcasal,emumacomunidade,um pesquisadororganizouumquestionrioqueenviou,pelocorreio,atodasas residncias.Arespostaaoquestionrioerafacultativa,poisopesquisadornotinha condiesdeexigiraresposta.Nessequestionrioperguntava-seonmerodefilhos por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo de tendenciosidade? Justifique. 4.Umpesquisadorpretendelevantardadossobreonmerodemoradorespor domiclio,usandoatcnicadeamostragemsimplessistemtica.Paraisso,o pesquisadorvisitarcadadomiclioselecionado.Senenhumapessoaestiverpresente naocasiodavisita,opesquisadorexcluraodomicliodaamostra.Estaltima determinao introduz tendenciosidade. Por qu? 5.Dadaumapopulaode40alunos,descrevaumaformadeobterumaamostra casual simples de 6 alunos. 6.Organizeumalistacom10nomesdepessoasemordemalfabtica.Depois descreva uma forma de obter uma amostra sistemtica de 5 indivduos. 7.Emumapesquisademercadoparaserviosodontolgicostomou-sealista telefnica,ondeosnomesdosassinantesestoorganizadosemordemalfabticado ltimosobrenome,eseamostrouodcimodecada10assinantes.Critiqueesse procedimento. 8.Por que os estatsticos estudam amostra e no populaes? 9.Como podemos dizer que uma determinada amostra representa adequadamente a populao? 10. Para as questes a seguir imagine um experimento em que se dividam os elementos em dois grupos: Um grupo experimental e um grupo de controle. a)Por que os grupos devem ser to semelhante quanto possvel? b)As pessoas devem saber em que grupo esto? c)Qual o melhor sistema de dividir os indivduos pelos dois grupos 11. Diferencie Estatstica Descritiva de Estatstica Inferencial. 12. Defina e diferencie com suas palavras Variveis Quantitativas de Variveis Qualitativas com suas respectivas subdivises. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes64 13. Fale sobre as etapas de uma pesquisa. 14. Fale sobre os tipos de amostragem Probabilstica, suas caractersticas, suas aplicaes e restries. Cite exemplos de seu cotidiano para cada caso. 15. Fale amostragem no Probabilstica, suas caractersticas, suas aplicaes e restries. Cite exemplos. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes65 PARTE X Inferncia Estatstica: Estimativa por Ponto e Intervalos De Confiana 1. - INTRODUO O objetivo da Estatstica o de conhecer populaes por meio das informaes amostrais.Comoaspopulaessocaracterizadaspormedidasnumricasdescritivas, denominadasparmetros,aestatsticadizrespeitorealizaodeinfernciassobre essesparmetrospopulacionaisdesconhecidos.Parmetrospopulacionaistpicossoa mdia( X ou ),odesviopadro(Sou )eaproporo(p)dedeterminado evento populacional. Osnmtodospararealizarinfernciasarespeitodosparmetrospertencema duas categorias: Estimao : determinao de estimativas dos parmetros populacionais; Tesesdehipteses:tomadadedecisorelativaaovalordeumparmetro populacional. 1.1 Estimativa por Ponto Quandocombaseemdadosamostraiscalculamosumvalordaestimativado parmtro populacional, temos uma estimativa por ponto do parmetro considerado. Assim,ovalordamdiaamostral( x )umaestimativaporpontodamdia populacional ( ). De maneira anloga, o valor do desvio padro amostral (S) constitui uma estimativa do parmetro ( ). EXEMPLO: Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes revelounotamdiaamostralde5,2.logo:x =5,2umaestimativapontualda verdadeira mdia dos 20.000 alunos. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes66 1.2 Estimativa por Intervalo umaestimativaporintervaloparaumparmetropopulacionalumintervalo determinadopordoisnmeros,obtidosapartirdeelementosamostrais,queseespera contenham o valor do parmetro com dado nvel de confiana que se espera contenham ovalodoparmetrocomdadonveldeconfianaouprobabilidadede(1-)%. Geralmente (1-)% = 90%, 95%, 97,5%, . . .Seocomprimentodointervalopequeno,temosumelevadograudepreciso da inferncia realizada. As estimativas dessa natureza so denominadas de intervalos de confiana. EXEMPLOS: Ointervalo[1,60m;1,64m]contmaalturamdiadosmoradoresdomunicpioX, com um nvel de confiana de 95%; Com 97,5% de confiana, o intervalo [8%; 10%] contm a proporo de analfabetos da cidade Y; O intervalo [37mm; 39mm] contm o desvio padro do comprimento de uma pea, com 90% de confiana. importanteatentarparaoriscodoerro,quandoseconstriumintervalode confiana.Seonveldeconfianade95%,oriscodoerrodainfernciaestatstica serde5%.Assim:seconstrussemos100intervalos,baseadosem100amostrade tamanhosiguais,poderamosesperarque95dessesintervalos(5%deles)noiriam conter o parmetro. 1.3IntervalodeConfianaparaaMdiaPopulacionalquandoavarincia desconhecida Quandotemosamostrasenoconhecemosovalordodesviopadro populacional,podemosconstruirintervalosdeconfianaparaamdiaapartirda frmulaexpressaaseguir.Paratanto,necessriaqueapopulaodeondeaamostra foi extrada tenha distribuio normal. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes67 Geometricamente Equao IC (, (1-)%) = ||||

\|+ ||

\|||

\| nS. t xnS. t x, n , n2121 Onde: t = distribuio t de Student (n 1) = grau de liberdade S = desvio padro x= mdia n = tamanho da amostra = probabilidade de erro na estimao do intervalo. 1.4 Intervalo de Confiana para o Desvio Padro Populacional Considerando que a distribuio de probabilidade populacional de onde se extraiu a amostra seja normal, ser dado pela distribuio Qui-quadrado (iX2) Geometricamente 1- 2 2 2t 2t = n-1 0 2 2 = n-1 f(iX2) 1- X2inferior X2superior X2 AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes68 Equao IC (, (1-)%) = ||||

\| inf X) n (2S

sup X) n (2S2121Onde: 2X= distribuio normal da tabela X2(n 1) = grau de liberdade S2= Varincia n = tamanho da amostra Exerccios: 1.Considerandoumaamostrade4elementosextradadeumapopulaocom distribuio normal forneceu mdia de 8,2 e desvio padro de 0,4. Construir um intervalodeconfianaparaamdiadessapopulaocom95%e99%de confiana. Interprete os resultados. 2.Aamostra9,8,12,7,6,11,6,10,9,foiextradadeumapopulaonormal. Construaumintervalodeconfianaparaamdiaaonvelde95%e99%e interprete os resultados. 3.Adistribuiodosdimetrosdeparafusosporumamquinanormal,com desvio padro igual a 0,17mm. Uma amostra de seis parafusos retirada ao acaso da produo apresentou os seguintes dimetros (mm): 25,425,225,625,325,025,4 Construaumintervalocom95%e99%deconfianaparaodimetromdioda produo dessa mquina. 4.A cronometragem de certa operao forneceu os seguintes valores para diversas determinaes em segundos: 141613131515171415141614 Construa um intervalo de 95% e 99% de confiana para o tempo mdio dessa operao. Suponha que a distribuio seja normal. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes69 5.Umaamostradeonzeelementosextradasdeumapopulaocomdistribuio normal,forneceuvarinciaS2=7,08.Construirumintervalode95%de confiana para o desvio padro populacional. Interprete os resultados. 6.Sabe-se que a variao das dimenses fornecidas por uma mquina independem dosajustesdovaloresmdios.Duasamostrasdedimensesdaspeas produzidas forneceram: Amostra 01: 12,212,412,11212,712,4 Amostra 02: 14,013,713,914,113,9 Estabelea um intervalo de 90%e95%de confiana para a mdia e para o desvio padro com que a mquina opera. Interprete os resultados. AGRONOMIA-FAGEstatstica Regiane Slongo Fagundes70 BIBLIOGRAFIA BUSSAB,W.O.;MORETTIN,P.A.EstatsticaAplicada.EditoraSaraiva,5 edio, 2002. DOWNING,D.;CLARK,J.EstatsticaAplicada.EditoraSaraiva,2edio, 2002. LEVINE,D.D.M.;BERENSON,M.L.;STEPHAN,D.Estatstica,Teoriae aplicaes. Editora ABPDEA, 2000. MORETTIN,L.G.EstatsticaBsica-Probabilidade.EditoraMcGraw-Hill,4 edio, 1992. V. 1 MORETTIN, L.G. Estatstica Bsica-Inferncia . Editora McGraw-Hill, 4 edio, 1992. V. 2 MARTINS, G.A. Estatstica Geral e Aplicada. Editora Atlas, 2 edio, 2002. MEYER,P.L.ProbabilidadeAplicaesEstatstica.LivrosTcnicose Cientficos Editora, 2 edio, 1983. NETO, P. L. O. Estatstica. Editora Edgard Blucher, 2 edio, 2002.