Probabilidade e Estatstica Sonia Maria Barros Barbosa Correa
2 Edio
Pontifcia Universidade Catlica de Minas Gerais
Gro Chanceler Dom Serafim Fernandes de Arajo
Reitor Prof. Pe. Geraldo Magela Teixeira
PUC Minas Virtual
Diretora de Ensino a Distncia Maria Beatriz Ribeiro de Oliveira Gonalves
Coordenao Acadmico-pedaggica Stela Beatris Trres Arnold (coordenadora) Agnela da Silva Giusta Liana Portilho Mattos Maria Ceclia de Ruiz Combat Stortini Mercia Moreira Wilba Lcia Maia Bernardes
Coordenao Tecnolgica Luiz Flvio F. B. Oliveira (coordenador) Antnio Bosco de Oliveira Jnior Eduardo Marques Duarte Guilherme C. V. Costa Mrcio Tlio Morato Rosiane C. M. Oliveira Simone Nogueira Tlio Nogueira
Coordenao da rea de Televiso Iara Cordeiro de Melo Franco (coordenadora)
Assessoria de Comunicao e Marketing Jnia Cludia Carvalho (assessora de comunicao) Carolina Franco
Gerncia de Projetos Eduardo Silva Ladeira
Secretaria Eloisa A. T. Lott Carvalho (secretria) Cludio Elias Marques Cristina Maria Isoni Auad Jacqueline C. Carvalho
PUCMINAS, 2003
Design Grfico e diagramao: Simone Nogueira / Slvia Fonseca (Trainee I)
Reviso: PUC Minas Virtual
Reproduo proibida. Art. 184 do Cdigo Penal
e Lei 9.610 de 19 de fevereiro de 1998. Todos os direitos reservados PONTIFCIA UNIVERSIDADE
CATLICA DE MINAS GERAIS
DIRETORIA DE ENSINO A DISTNCIA R. Esprito Santo, 1.059 - 12 andar Centro
CEP 30160-922 - Belo Horizonte - MG Telefone: (0xx31) 3273-7898 - Fax: 3274-2805
http://www.virtual.pucminas.br e-mail: [email protected]
ATENDIMENTO E INFORMAES:
Belo Horizonte: (0xx31) 3274-1862 Demais localidades: 0300 313 3 313*
e-mail: [email protected] * O custo da ligao 0300 de R$ 0,27/min, para telefones fixos,
ou de R$ 0,63/min, para telefones celulares, e ser pago pelo usurio. Os valores indicados no incluem impostos
(ref. 30/06/03). Valores sujeitos a alteraes sem aviso prvio. Confira os valores atualizados em
http://www.virtual.pucminas.br/0300
FICHA CATALOGRFICA
Elaborada pela Biblioteca da Pontifcia Universidade Catlica de Minas Gerais
Correa, Sonia Maria Barros Barbosa
C824p Probabilidade e estattica / Sonia Maria
Barros Barbosa Correa. 2 ed. - Belo Hori-zonte: PUC Minas Virtual, 2003
116 p.
Bibliografia
1. Probabilidade. 2. Estatstica matemtica. 3. Amostragem (Estatstica). I. Pontifcia Uni- versidade Catlica de Minas Gerais.
II. Ttulo. CDU: 519.2
Bibliotecria - Eunice dos Santos - CRB 6/1515
Impresso no Brasil
sumrio Unidade 1 Natureza e Fundamentos do Mtodo Estatstico........................ 07
1.1 - Introduo Estatstica ........................................................ 07
1.2 - Importncia da Estatstica ..................................................... 08
1.3 - Grandes reas da Estatstica .................................................. 09
1.4 - Fases do Mtodo Estatstico ................................................... 12
1.5 - Sries Estatsticas ............................................................... 15
1.6 - Apresentao de dados
Tabelas e Grficos: Construo e Interpretao .......................... 22
Unidade 2 Amostragem.................................................................... 28
2.1 Importncia da Amostragem................................................... 28
2.2 Conceitos Fundamentais ....................................................... 29
2.3 Amostragem Aleatria Simples................................................ 31
2.4 Amostragem Aleatria Estratificada ......................................... 32
2.5 Amostragem por Conglomerado.............................................. 34
2.6 Amostragem Sistemtica ...................................................... 34
Unidade 3 Distribuio de Freqncia ................................................. 37
3.1 Conceitos ......................................................................... 37
3.2 - Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto mdio
da classe, freqncia absoluta, relativa e acumulada .................... 40
3.3 - Regras Gerais para a elaborao de uma distribuio de freqncia... 44
3.4 - Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva ................................ 45
Unidade 4 - Medidas de Posio ........................................................... 48
4.1. Introduo......................................................................... 48
4.2. Mdia aritmtica simples e ponderada e suas propriedades .............. 49
4.3. Moda: Dados agrupados e no agrupados em classes....................... 50
4.4. Mediana: Dados agrupados e no agrupados em classes ................... 52
4.5. Mdia Geomtrica: Dados agrupados e no agrupados em classes....... 54
4.6. Mdia Harmnica: Dados agrupados e no agrupados em classes ........ 54
4.7. Separatrizes: Quartis, Decis e Percentis ..................................... 55
Unidade 5 Medidas de Disperso ........................................................ 59
5.1 Disperso ......................................................................... 59
5.2 Assimetria ....................................................................... 61
5.3 Curtose............................................................................ 63
Unidade 6 Probabilidade .................................................................. 65
6.1 Experimento aleatrio, espao amostral e eventos ....................... 65
6.2 Probabilidade:Definio clssica; Probabilidade e freqncia relativa ............................................................. 70
6.3 Tipos de eventos ................................................................ 70
6.4 Axiomas de Probabilidade ..................................................... 72
6.5 Probabilidade condicional e independncia de eventos ................. 74
Unidade 7 Variveis Aleatrias .......................................................... 78
7.1 Conceito de varivel aleatria ............................................... 78
7.2 Distribuio de probabilidade ................................................. 79
7.3. Funo de densidade de probabilidade....................................... 79
7.4. Esperana matemtica, varincia e desvio padro: propriedades ....... 79
7.5. Distribuies discretas: Hipergeomtrica, Binomial e Poisson............ 80
7.6. Distribuio contnua: Normal - propriedades, distribuio normal padro, a Normal como aproximao da Binomial ................ 85
Unidade 8 - Inferncia Estatstica ......................................................... 93
8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais ......................................................... 93
8.2. Estimao ......................................................................... 96
8.3. Testes de Hipteses ............................................................. 100
Unidade 9 Correlao e Regresso Linear ............................................. 106
9.1. Diagrama de disperso .......................................................... 107
9.2. Correlao Linear ................................................................ 107
9.3. Coeficiente de Correlao Linear ............................................. 108
9.4. Regresso Reta de regresso ................................................. 112
Referncias Bibliogrficas .................................................................. 116
UNIDADE 1
Natureza e Fundamentos do Mtodo Estatstico
1.1. Introduo Estatstica 1.2. Importncia da Estatstica 1.3. Grandes reas da Estatstica 1.4. Fases do Mtodo Estatstico 1.5. Sries Estatsticas 1.6. Apresentao de dados Tabelas e Grficos:
Construo e Interpretao
Nesta unidade, sero abordados temas relacionados ao mtodo estats-
tico. Oferecer exemplos de tabelas e grficos que podem representar, de
forma sinttica, as informaes obtidas atravs de processos de pesqui-
sa, so objetivos especficos desta unidade, que tem o propsito de:
Demonstrar a importncia da Estatstica na vida diria;
Mostrar como podemos utiliz-la de forma correta;
Ensinar como compor tabelas a partir de dados numricos;
Ensinar como representar dados numricos em grficos.
1.1. Introduo Estatstica
A palavra estatstica lembra, maioria das pessoas, recenseamento. Os censos
existem h milhares de anos e constituem um esforo imenso e caro feito pelos
governos, com o objetivo de conhecer seus habitantes, sua condio socioeconmi-
ca, sua cultura, religio, etc. Portanto, associar estatstica a censo perfeitamente
correto do ponto de vista histrico, sendo interessante salientar que as palavras
estatstica e estado tm a mesma origem latina: status.
A estatstica tambm comumente associada s pesquisas de opinio pblica, aos
vrios ndices governamentais, aos grficos e s mdias publicados diariamente na
imprensa. Na realidade, entretanto, a estatstica engloba muitos outros aspectos,
sendo fundamental na anlise de dados provenientes de quaisquer processos onde
exista variabilidade.
PUC Minas Virtual 7 Probabilidade e Estatstica
possvel distinguir duas concepes para a palavra ESTATSTICA: no plural (esta-
tsticas), indica qualquer coleo de dados numricos, reunidos com a finalidade de
fornecer informaes acerca de uma atividade qualquer. Assim, por exemplo, as
estatsticas demogrficas referem-se aos dados numricos sobre nascimentos,
falecimentos, matrimnios, desquites, etc. As estatsticas econmicas consistem
em dados numricos relacionados com emprego, produo, vendas e com outras
atividades ligadas aos vrios setores da vida econmica. No singular (Estatstica),
indica a atividade humana especializada ou um corpo de tcnicas, ou ainda uma
metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e
a interpretao de dados quantitativos e a utilizao desses dados para a tomada
de decises.
1.2. Importncia da Estatstica
O mundo est repleto de problemas. Para resolvermos a maioria deles, necessita-
mos de informaes. Mas, que tipo de informao? Que quantidade de informa-
es? Aps obt-las, que fazer com elas? A Estatstica trabalha com essas informa-
es, associando os dados ao problema, descobrindo como e o que coletar, assim
capacitando o pesquisador (ou profissional ou cientista) a obter concluses a partir
dessas informaes, de tal forma que possam ser entendidas por outras pessoas.
Portanto, os mtodos estatsticos auxiliam o cientista social, o economista, o enge-
nheiro, o agrnomo e muitos outros profissionais a realizarem o seu trabalho com
mais eficincia.
A Estatstica uma parte da Matemtica que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados, viabili-
zando a utilizao dos mesmos na tomada de decises.
Vejamos alguns exemplos:
Os estatsticos do governo conduzem censos de populao, moradia, produtos
industriais, agricultura e outros. So feitas compilaes sobre vendas, produo,
inventrio, folha de pagamento e outros dados das indstrias e empresas. Essas
estatsticas informam ao administrador como a sua empresa est crescendo, seu
crescimento em relao a outras empresas e fornece-lhe condies de planejar
aes futuras. A anlise dos dados muito importante para se fazer um plane-
jamento adequado.
PUC Minas Virtual 8 Probabilidade e Estatstica
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,
com seus processos e tcnicas, tm contribudo para a organizao de empresas
e utilizao dos recursos do mundo moderno.
Em geral, as pessoas, quando se referem ao termo estatstica, desconhecem que o
aspecto essencial o de proporcionar mtodos inferenciais, que permitam conclu-
ses que transcendam os dados obtidos inicialmente.
1.3. Grandes reas da Estatstica
Para fins de apresentao, usual se dividir a estatstica em trs grandes reas,
embora no se trate de ramos isolados:
Estatstica Descritiva e Amostragem Conjunto de tcnicas que objetivam cole-
tar, organizar, apresentar, analisar e sintetizar os dados numricos de uma po-
pulao, ou amostra;
Estatstica Inferencial Processo de se obter informaes sobre uma populao
a partir de resultados observados na amostra;
Probabilidade - Modelos matemticos que explicam os fenmenos estudados
pela Estatstica em condies normais de experimentao.
Em estatstica, utilizamos extensamente os termos: populao, amostra, censo,
parmetros, estatstica, dados discretos, dados contnuos, dados quantitativos e
dados qualitativos; que estaremos definindo abaixo para maior compreenso::
Populao: uma coleo completa de todos os elementos a serem
estudados.
Amostra: uma subcoleo de elementos extrados de uma popula-
o.
Censo: uma coleo de dados relativos a todos os elementos de
uma populao.
Parmetros: uma medida numrica que descreve uma caractersti-
ca de uma populao.
Estatstica: uma medida numrica que descreve uma caracterstica
de uma amostra.
Dados contnuos: resultam de um nmero infinito de valores poss-
veis que podem ser associados a pontos em uma escala contnua de
tal maneira que no haja lacunas.
PUC Minas Virtual 9 Probabilidade e Estatstica
Dados discretos: resultam de um conjunto finito de valores possveis,
ou de um conjunto enumervel de valores.
Dados quantitativos: consistem em nmeros que representam conta-
gens ou medidas.
Dados qualitativos:podem ser separados em diferentes categorias
que se distinguem por alguma caracterstica no-numrica.
Amostragem
o processo de escolha da amostra. a parte inicial de qualquer estudo estatstico.
Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Ge-
ralmente, as pesquisas so realizadas atravs de estudo dos elementos que com-
pem uma amostra, extrada da populao que se pretende analisar.
Exemplo 1.1. Pesquisas sobre tendncias de votao
Em pocas de eleio, comum a realizao de pesquisas com o objeti-
vo de se conhecer as tendncias do eleitorado. Para que os resultados
sejam de fato representativos, toma-se o cuidado de se entrevistar um
conjunto de pessoas com caractersticas socioeconmicas, culturais, re-
ligiosas, etc. to prximas quanto possvel da populao qual os resul-
tados da pesquisa sero estendidos. A escolha da amostra, a redao do
questionrio, a entrevista, a codificao dos dados e a apurao dos re-
sultados so as etapas deste tipo de pesquisa.
Populao e amostra
O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico,
exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase
inicial de qualquer pesquisa.
sobre os dados da amostra que se desenvolvem os estudos, visando a fazer infe-
rncias sobre a populao.
Exemplo 1.2. Avaliao de um programa de ensino
Toma-se certo nmero de pares de turmas: a um conjunto de turmas
ensina-se um assunto por um novo mtodo e, ao outro, pelo mtodo
clssico. Aplica-se uma prova a ambos os grupos. As notas observadas
PUC Minas Virtual 10 Probabilidade e Estatstica
nesses conjuntos de turmas constituem a nossa amostra. Se os resulta-
dos do novo mtodo forem melhores, iremos aplic-lo a todas as tur-
mas, isto , populao. A partir da amostra, estabelecemos o que
conveniente para a populao, ou seja, fazemos uma inferncia sobre a
populao.
Exemplo 1.3. Renda mdia per capita em diversas regies do pas
Toma-se um conjunto de indivduos em cada regio, escolhidos ao aca-
so, e sobre esse grupo so feitos os estudos. Os indivduos assim esco-
lhidos constituem a amostra e os resultados nela observados sero es-
tendidos populao.
Estatstica Descritiva
a parte mais conhecida. Quem v o noticirio, na televiso ou nos jornais, sabe
quo freqente o uso de mdias, ndices e grficos nas notcias.
Exemplo 1.4. INPC (ndice Nacional de Preos ao Consumidor)
Sua construo envolve a sintetizao, em um nico nmero, dos au-
mentos dos produtos de uma cesta bsica.
Exemplo 1.5. Anurio Estatstico Brasileiro
O IBGE publica esse anurio apresentando, em vrias tabelas, os mais
diversos dados sobre o Brasil: educao, sade, transporte, economia,
cultura, etc. Embora simples, fceis de serem entendidas, as tabelas so
o produto de um processo demorado e extremamente dispendioso de
coleta e apurao de dados.
Exemplo 1.6. Anurio Estatstico da Embratur
A Embratur publica esse anurio apresentando, em vrias tabelas e gr-
ficos, os mais diversos dados sobre Turismo Interno e dados sobre en-
trada de turistas estrangeiros no Brasil.
PUC Minas Virtual 11 Probabilidade e Estatstica
Estatstica Inferencial (ou Indutiva)
A tomada de decises sobre a populao, com base em estudos feitos sobre os da-
dos da amostra, constitui o problema central da inferncia estatstica.
Exemplo 1.7. Suponha que a distribuio das alturas de todos os habi-
tantes de um pas possa ser representada por uma distribuio normal.
Mas no conhecemos de antemo a mdia da distribuio. Devemos,
pois, estim-la.
Exemplo 1.8. Anlise financeira. Os analistas financeiros estudam dados
sobre a situao da economia, visando explicar tendncias dos nveis de
produo e de consumo, projetando-os para o futuro.
Exemplo 1.9. Ocorrncia de terremotos. Os gelogos esto continua-
mente coletando dados sobre a ocorrncia de terremotos. Gostariam de
inferir quando e onde ocorrero tremores, e qual a sua intensidade. Tra-
ta-se, sem dvida, de uma questo complexa, que exige longa experi-
ncia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.
Probabilidade
O processo de generalizao, que caracterstico do mtodo indutivo, est associa-
do a uma margem de incerteza. A existncia da incerteza deve-se ao fato de que a
concluso, que se pretende obter para o conjunto de todos os indivduos analisados
quanto a determinadas caractersticas comuns, baseia-se em uma parcela do total
das observaes. A medida da incerteza tratada mediante tcnicas e mtodos que
se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a
incerteza existente em determinada situao.
1.4. Fases do Mtodo Estatstico
Quando se pretende empreender um estudo estatstico completo, existem diversas
fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais
de um estudo capaz de produzir resultados vlidos. As fases principais so as
seguintes:
Definio do problema
PUC Minas Virtual 12 Probabilidade e Estatstica
Planejamento
Coleta de dados
Apurao dos dados
Apresentao dos dados
Anlise e Interpretao dos dados
Definio do problema
A primeira fase do trabalho consiste em uma definio ou formulao correta do
problema a ser estudado. Alm de considerar detidamente o problema objeto do
estudo, o analista dever examinar outros levantamentos realizados no mesmo
campo e que sejam anlogos, uma vez que parte da informao de que se necessi-
ta pode, muitas vezes, ser encontrada nesses ltimos.
Planejamento
O passo seguinte, aps a definio do problema, compreende a fase do planeja-
mento, que consiste em se determinar o procedimento necessrio para se resolver
o problema e, em especial, como levantar informaes sobre o assunto, objeto do
estudo. preciso planejar o trabalho a ser realizado tendo em vista o objetivo que
se pretende atingir. nessa fase que ser escolhido o tipo de levantamento a ser
utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:
Levantamento censitrio, quando a contagem for completa, abrangendo todo o
universo;
Levantamento por amostragem, quando a contagem for parcial.
Outros elementos importantes que devem ser tratados nesta mesma fase so:
Cronograma das atividades, atravs do qual so fixados os prazos para as vrias
fases;
Custos envolvidos;
Exame das informaes disponveis;
Delineamento da amostra, etc.
PUC Minas Virtual 13 Probabilidade e Estatstica
Coleta dos dados
O terceiro passo essencialmente operacional, compreendendo a coleta das infor-
maes propriamente ditas. Nesta fase do mtodo estatstico, conveniente esta-
belecer uma distino entre duas espcies de dados:
Dados primrios quando so publicados ou coletados pelo prprio pesquisador
ou organizao que os escolheu;
Dados secundrios quando so publicados ou coletados por outra organizao.
Um conjunto de dados , pois, primrio ou secundrio em relao a algum. As
tabelas do Censo Demogrfico so fontes primrias. Quando determinado jornal
publica estatsticas extradas de vrias fontes e relacionadas com diversos setores
industriais, os dados so secundrios para quem desejar utilizar-se deles em algu-
ma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
Coleta Direta quando obtida diretamente da fonte, como no caso da empresa
que realiza uma pesquisa para saber a preferncia dos consumidores pela sua
marca;
Coleta Indireta quando inferida a partir dos elementos conseguidos pela cole-
ta direta, ou atravs do conhecimento de outros fenmenos que, de algum mo-
do, estejam relacionados com o fenmeno em questo.
Apurao dos dados
Antes de comear a analisar os dados, conveniente que lhes seja dado algum tra-
tamento prvio, a fim de torn-los mais expressivos. A quarta etapa do processo ,
ento, a da apurao ou sumarizao, que consiste em resumir os dados atravs de
sua contagem e agrupamento. Pode ser manual, eletromecnica ou eletrnica.
Apresentao dos dados
Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma
adequada, tornando mais fcil o exame do fenmeno que est sendo objeto de tra-
tamento estatstico.
PUC Minas Virtual 14 Probabilidade e Estatstica
H duas formas de apresentao ou exposio dos dados observados, que no se
excluem mutuamente:
Apresentao tabular uma apresentao numrica dos dados. Consiste em
dispor os dados em linhas e colunas distribudas de modo ordenado, segundo al-
gumas regras prticas adotadas pelos diversos sistemas estatsticos. As tabelas
tm a vantagem de conseguir expor, sinteticamente e em s local, os resultados
sobre determinado assunto, de modo a se obter uma viso global mais rpida
daquilo que se pretende analisar.
Apresentao grfica uma apresentao geomtrica dos dados numricos.
Embora a apresentao tabular seja de extrema importncia no sentido de facili-
tar a anlise numrica de dados, no permite ao analista obter uma viso to
rpida, fcil e clara do fenmeno e sua variao como aquela conseguida atra-
vs de um grfico.
Anlise e interpretao dos dados
Nesta ltima etapa, o interesse maior reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema. A anlise dos estatsticos est ligada essenci-
almente ao clculo de medidas, cuja finalidade principal descrever o fenmeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por nmeros-
resumo, as estatsticas que evidenciam as caractersticas particulares desse conjun-
to. O significado exato de cada um dos valores obtidos atravs do clculo das vrias
medidas estatsticas disponveis deve ser bem interpretado. possvel mesmo, nes-
ta fase, arriscar algumas generalizaes, as quais envolvero, como mencionado
anteriormente, algum grau de incerteza, porque no se pode estar seguro de que o
que foi constatado para aquele conjunto de dados (a amostra) se verificar igual-
mente para a populao.
1.5. Sries Estatsticas
Define-se srie estatstica como toda e qualquer coleo de dados estatsticos refe-
ridos a uma mesma ordem de classificao: quantitativa. No sentido mais amplo,
srie uma sucesso de nmeros referidos a qualquer varivel. Se os nmeros
expressarem dados estatsticos, a srie ser chamada de srie estatstica.
Em sentido mais restrito, pode-se dizer que uma srie estatstica uma sucesso
de dados estatsticos referidos a caracteres qualitativos, ao passo que uma suces-
PUC Minas Virtual 15 Probabilidade e Estatstica
so de dados estatsticos referidos a caracteres quantitativos configurar uma Dis-
tribuio de Freqncia.
Em outros termos, a palavra srie usada normalmente para designar um conjunto
de dados dispostos de acordo com um carter varivel, residindo a qualidade serial
na disposio desses valores, e no em uma disposio temporal ou espacial de
indivduos.
Tabela um quadro que resume um conjunto de observaes.
Uma tabela compe-se de:
Corpo conjunto de linhas e colunas que contm informaes sobre a varivel
em estudo;
Cabealho parte superior da tabela que especifica o contedo das colunas;
Coluna indicadora parte da tabela que especifica o contedo das linhas;
Linhas retas imaginrias que facilitam a leitura, no sentido horizontal, de da-
dos que se inscrevem nos seus cruzamentos com as colunas;
Casa ou clula espao destinado a um s nmero;
Ttulo conjunto de informaes, as mais completas possveis, respondendo s
perguntas: O qu?- Quando?- Onde?- localizado no topo da tabela.
Fonte referncia de onde se obteve os dados, colocado, de preferncia, no ro-
dap.
As tabelas servem para apresentar sries estatsticas. Conforme varie um dos ele-
mentos da srie, podemos classific-la em:
Cronolgicas - Tempo (fator temporal ou cronolgico) a que poca refere-se o
fenmeno analisado;
Geogrficas - Local (fator espacial ou geogrfico) onde o fenmeno acontece;
Especficas - Fenmeno (espcie do fato ou fator especificativo) o que des-
crito.
As sries tambm so divididas em:
Sries Homgradas - aquelas em que a varivel descrita apresenta variao dis-
creta ou descontnua. So sries homgradas a srie temporal, a srie geogrfi-
ca e a srie especfica;
PUC Minas Virtual 16 Probabilidade e Estatstica
Sries Hetergradas - aquelas nas quais o fenmeno ou o fato apresenta gradu-
aes ou subdivises. Embora fixo, o fenmeno varia em intensidade. A Distribu-
io de freqncias ou seriao uma srie hetergrada.
Os dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao
seno a contagem ou medida, o chamados dados absolutos. Dados Relativos so o
resultado de comparaes por quociente (razes) que se estabelecem entre dados
absolutos e tm por finalidade realar ou facilitar as comparaes entre quantida-
des.
1.5.1. Tipos de Sries Estatsticas Simples (ou de uma entrada)
As sries estatsticas diferenciam-se de acordo com a variao de um dos trs ele-
mentos: tempo, local e fenmeno.
PUC Minas Virtual 17 Probabilidade e Estatstica
Srie Cronolgica
Tambm chamada de srie temporal, srie histrica, srie evolutiva ou marcha,
identifica-se pelo carter varivel do fator cronolgico. Assim, deve-se ter:
Elemento varivel: poca
Elementos Fixos: Local e Fenmeno
Exemplo:
Tabela 1.1 - Operadora WKX Venda de bilhetes areos
Mercado Interno 1995
Meses Vendas (em milhares
de reais)
Janeiro 2300
Fevereiro 1800
Maro 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
Fonte: Departamento de Anlise de Mercado
PUC Minas Virtual 18 Probabilidade e Estatstica
Srie Geogrfica
Tambm chamada de srie territorial, srie espacial ou srie de localizao, identifi-
ca-se pelo carter varivel do fator geogrfico. Assim, deve-se ter:
Elemento varivel: Local
Elementos Fixos: poca e Fenmeno Exemplo:
Tabela 1.2 Operadora WKX - Vendas por Unidade da Federao 1995
Unidades da Federao Vendas (em milhares de reais)
Minas Gerais 4000
Paran 2230
Rio Grande do Sul 6470
Rio de Janeiro 8300
So Paulo 10090
Outros 420
TOTAL BRASIL 31510
Fonte: Departamento de Anlise de Mercado
PUC Minas Virtual 19 Probabilidade e Estatstica
Srie Especfica
Tambm chamada de srie categrica ou srie por categoria, identifica-se pelo ca-
rter varivel de fator especificativo. Assim, deve-se ter:
Elemento varivel: Fenmeno
Elementos Fixos: Local e poca
Exemplos:
Tabela 1.3. Operadora WKX -
Venda de bilhetes areos por Linha 1995
Linha do Produto Vendas (em milhares de reais)
Linha A 6450
Linha B 9310
Linha C 15750
TODAS AS LINHAS 31510
Fonte: Departamento de Anlise de Mercado
Tabela 1.4. Nmero de empregados das vrias classes
de salrios no estado de So Paulo 1998
Classes de Salrios (R$) Nmero de Empregados
At 80 41 326
De 80 a 119 123 236
De 120 a 159 428 904
De 160 a 199 324 437
De 200 a 399 787 304
De 400 a 599 266 002
De 600 a 799 102 375
De 800 a 999 56 170
1000 e mais 103 788
TOTAL 2 233 542
Fonte: Servio de Estatstica da Previdncia e Trabalho
(Dados alterados para melhor compreenso)
PUC Minas Virtual 20 Probabilidade e Estatstica
1.5.2. Tabelas Compostas (ou de dupla entrada)
As tabelas apresentadas anteriormente so tabelas estatsticas simples, onde ape-
nas uma srie est representada. comum, todavia, haver necessidade de apre-
sentar, em uma nica tabela, mais do que uma srie. Quando as sries aparecem
conjugadas, tem-se uma tabela de dupla entrada. Em uma tabela desse tipo so
criadas duas ordens de classificao: uma horizontal (linha) e uma vertical (colu-
na).
Exemplos:
A) Srie especfico-temporal
B) Srie geogrfico-temporal
A) Tabela 1.5 Populao economicamente ativa
por setor de atividades Brasil
Populao (1 000 Hab.) Setor
1940 1950 1960
Primrio 8 968 10 255 12 163
Secundrio 1 414 2 347 2 962
Tercirio 3 620 4 516 7 525
Fonte: IPEA
B) Tabela 1.6 Populao Indgena Brasileira
Produo Unidade de
Produo 1937 1938 1939
Acre 5 007 4 765 4 727
Amazonas 6 858 5 998 5 631
Par 4 945 4 223 4 500
Mato Grosso 1 327 1 285 1 235
Outros Estados 333 539 337
Fonte: Anurio Estatstico do Brasil IBGE - (Dados alterados para melhor compreenso)
PUC Minas Virtual 21 Probabilidade e Estatstica
Podem existir, se bem que mais raramente, pela dificuldade de representao, s-
ries compostas de trs ou mais entradas.
Observao:
Nem sempre uma tabela representa uma srie estatstica. Por vezes, os dados
reunidos no revelam uniformidade, sendo meramente um aglomerado de in-
formaes gerais sobre determinado assunto, as quais, embora teis, no apre-
sentam a consistncia necessria para se configurar uma srie estatstica.
Exemplo: Tabela com resumos de dados, mas que no representa uma
srie estatstica.
Tabela 1.8 Situao dos espetculos cinematogrficos no Brasil 1967
Especificao Dados Numricos
Nmero de cinemas 2 488
Lotao dos cinemas 1 722 348
Sesses por dia 3 933
Filmes de longa metragem 131 330 488
Meia-entrada 89 581 234
Fonte: Anurio Estatstico do Brasil IBGE
1.6. Apresentao de dados - Tabelas e Grficos:
Construo e Interpretao
A representao grfica das sries estatsticas tem por finalidade representar os
resultados obtidos, permitindo que se chegue a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores da srie. A escolha do grfico
mais apropriado ficar a critrio do analista. Contudo, os elementos simplicidade,
clareza e veracidade devem ser considerados, quando da elaborao de um grfico.
Simplicidade o grfico deve ser destitudo de detalhes de importncia secund-
ria, assim como de traos desnecessrios que possam levar o observador a uma
anlise morosa ou sujeita a erros.
Clareza o grfico deve possibilitar uma correta interpretao dos valores re-
presentativos do fenmeno em estudo.
Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.
PUC Minas Virtual 22 Probabilidade e Estatstica
Diretrizes para a construo de um grfico:
O ttulo do grfico deve ser o mais claro e completo possvel. Quando necessrio,
deve-se acrescentar subttulos;
A orientao geral dos grficos deve ser da esquerda para a direita;
As quantidades devem ser representadas por grandezas lineares;
Sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a
linha 0 (zero);
S devem ser includas no desenho as coordenadas indispensveis para guiar o
olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame
do grfico;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;
Os ttulos e marcaes do grfico devem ser dispostos de maneira que sejam
facilmente lidos, partindo da margem horizontal inferior ou da margem esquer-
da.
Leitura e interpretao de um grfico:
Declarar qual o fenmeno ou fenmenos representados, a regio considerada, o
perodo de tempo, a fonte dos dados, etc;
Examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a
sua execuo, no conjunto e nos detalhes;
Analisar cada fenmeno separadamente, fazendo notar os pontos mais em evi-
dncia, o mximo e o mnimo, assim como as mudanas mais bruscas;
Investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o
fato exposto estacionrio;
Procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo a-
proximado, etc.
PUC Minas Virtual 23 Probabilidade e Estatstica
Eis os tipos mais comuns de grficos:
Grfico em Linhas
Constitui uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas
Exemplo: Vendas em Cr$ 1000,00 nos anos de 1971 a 1977 de determinado produ-
to da empresa x.
Vendas em Cr$ 1000,00
0
100
200
300
400
500
1971 1972 1973 1974 1975 1976 1977
anos
vend
as
Fonte: Dados Fictcios.
Grfico em Colunas
a representao de uma srie por meio de retngulos, dispostos verticalmente.
Exemplo:Populao Brasileira nas dcadas de 40 a 70.
0
20
40
60
80
100
1940 1950 1960 1970
Populao
Populao
Fonte: Dados Fictcios
PUC Minas Virtual 24 Probabilidade e Estatstica
Grfico em Barras
semelhante ao grfico em colunas, porm, os retngulos so dispostos horizon-
talmente.
Exemplo:Populao Brasileira nas dcadas de 40 a 70
0 20 40 60 80 100
1940
1950
1960
1970
Populao do Brasil
Populao doBrasil
Fonte: Dados Fictcios
Grfico em Setores
a representao grfica de uma srie estatstica em crculo, por meio de setores.
utilizado principalmente quando se pretende comparar cada valor da srie com o
total.
Exemplo:
Receita (em R$ 1.000.000,00) do Municpio X de 1975-77
Anos Receita (em R$ 1.000.000,00)
1975 90
1976 120
1977
Total
Fonte: Departamento da Fazenda, Municpio X.
O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais
aos dados da srie.
PUC Minas Virtual 25 Probabilidade e Estatstica
Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando
que o total da srie corresponde a 360.
Total __________360
Parte___________ x
Para 1975: 360 - 360 Para 1976: 360 - 360 Para 1977: 360 - 360
90 - x 120 - x 150 - x
x = 90 x = 120 x = 150
Receita do Municipio X
197519761977
Fonte: Departamento da Fazenda, Municpio X
Grfico Polar
o grfico ideal para representar sries temporais cclicas, isto , sries que apre-
sentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a
variao da precipitao pluviomtrica ao longo do ano, ou da temperatura ao lon-
go do dia, o consumo de energia eltrica durante o ms ou o ano, etc.
PUC Minas Virtual 26 Probabilidade e Estatstica
Exemplo:
Movimento Mensal de Compras de uma agencia em 1972
Meses Valores (R$1.000,00)
Janeiro 12
Fevereiro 13
Maro 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Fonte: Departamento financeiro da Agncia (dados Fictcios)
Movimento Mensal de Compras de uma agencia em 1972
05
101520
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez
Fonte: Departamento financeiro da Agncia (dados Fictcios)
PUC Minas Virtual 27 Probabilidade e Estatstica
UNIDADE 2
Amostragem
2.1. Importncia da Amostragem 2.2. Conceitos Fundamentais 2.3. Amostragem Aleatria Simples 2.4. Amostragem Aleatria Estratificada 2.5. Amostragem por Conglomerado 2.6. Amostragem Sistemtica
Nesta unidade, veremos quais as tcnicas que podemos utilizar para
compor uma amostra. So objetivos especficos desta unidade:
Familiarizar o leitor com a terminologia empregada na pesquisa de
um fenmeno;
Identificar os fatores que afetam a quantidade de informaes de um
fenmeno;
Explicar como utilizar a Tabelas de Nmeros Aleatrios (TNA) para
selecionar amostras aleatrias.
2.1. Importncia da Amostragem
Na realizao de qualquer estudo, quase nunca possvel examinar todos os ele-
mentos da populao de interesse. Temos usualmente que trabalhar com uma
amostra da populao. A inferncia estatstica nos d elementos para generalizar,
de maneira segura, as concluses obtidas da amostra para a populao. Mas, para
as inferncias serem corretas, necessrio garantir que a amostra seja
representativa da populao, isto , a amostra deve possuir as mesmas
caractersticas bsicas da populao no que diz respeito ao fenmeno pesquisado.
errneo pensar que, caso tivssemos acesso a todos os elementos da populao,
seramos mais precisos. Os erros de coleta e manuseio de um grande nmero de
dados so maiores do que as imprecises a que estamos sujeitos quando generali-
zamos, via inferncia, as concluses de uma amostra bem selecionada.
PUC Minas Virtual 28 Probabilidade e Estatstica
Em se tratando de amostra, a preocupao central que ela seja representativa.
preciso que a amostra, ou as amostras que vo ser usadas sejam obtidas por pro-
cessos adequados.
Assim que decidimos obter informaes atravs de um levantamento amostral, te-
mos imediatamente dois problemas:
Definir cuidadosamente a populao de interesse;
Selecionar a caracterstica que iremos pesquisar.
Dados coletados de forma descuidada podem ser to inteis que nenhum proces-
samento estatstico consegue salv-los.
2.2. Conceitos Fundamentais
O conceito de populao intuitivo; trata-se do conjunto de indivduos ou objetos
que apresentam em comum determinadas caractersticas definidas para o estudo.
Amostra - um subconjunto da populao.
Amostragem - so procedimentos para extrao de amostras que repre-
sentem bem a populao.
Riscos - a margem de erro motivado pelo fato de investigarmos parcial-
mente (amostras) o universo (populao).
Populao-alvo - a populao sobre a qual vamos fazer inferncias ba-
seadas na amostra.
Para que possamos fazer inferncias vlidas sobre a populao a partir de uma a-
mostra, preciso que essa seja representativa. Uma das formas de se conseguir
representatividade fazer com que o processo de escolha da amostra seja, de al-
guma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de estimativas
dos erros envolvidos no processo de inferncia.
Quanto extrao dos elementos, as amostras podem ser:
Com reposio - quando um elemento sorteado puder ser sorteado novamente;
Sem reposio - quando o elemento sorteado s puder figurar uma nica vez na
amostra.
Basicamente, existem dois mtodos para composio da amostra: probabilstico e
no probabilstico (intencional).
PUC Minas Virtual 29 Probabilidade e Estatstica
O mtodo de amostragem probabilstica exige que cada elemento da populao
possua determinada probabilidade de ser selecionado. Normalmente, possuem a
mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade
de cada elemento ser 1/N. Somente com base em amostragens probabilsticas
pode-se realizar inferncias sobre a populao, a partir dos parmetros estuda-
dos na amostra. So elas:
Amostragem Aleatria Simples;
Amostragem Aleatria Estratificada;
Amostragem Sistemtica;
Amostragem por Conglomerado.
Por serem as principais tcnicas estudas, sero mais detalhadamente exploradas no
item 2.3.
Os mtodos no probabilsticos so amostragens em que h uma escolha delibe-
rada dos elementos que compem a amostra. No se pode generalizar os resul-
tados das pesquisas para a populao, uma vez que as amostras no probabils-
ticas no garantem a representatividade da populao. So elas:
Amostragem Acidental;
Amostragem Intencional;
Amostragem por Quotas.
Amostragem Acidental - formada por elementos que vo aparecendo, que so
possveis de se obter at completar o nmero de elementos da amostra.
Ex: Pesquisa de opinio, em que os entrevistados so acidentalmente escolhidos.
Amostragem Intencional - formada por elementos escolhidos por determinado
critrio, ou seja, escolhe-se intencionalmente um grupo de elementos que iro
compor a amostra.
Amostragem por Cotas - Classificao da populao em termos de propriedades
que se sabe serem relevantes para a caracterstica a ser estudada. Determinao
da proporo da populao para cada caracterstica com base na constituio co-
nhecida, ou estimada, da populao. Fixao de quotas para cada observador, ou
entrevistador, a quem tocar a responsabilidade de selecionar interlocutores ou
entrevistados, de modo que a amostra total observada, ou entrevistada, contenha a
proporo de cada classe.
PUC Minas Virtual 30 Probabilidade e Estatstica
2.3. Amostragem Aleatria Simples
A amostragem aleatria simples um processo para selecionar amostras de tama-
nho n dentre as N unidades em que foi dividida a populao. Sendo a amostra-
gem realizada sem reposio, que o caso mais comum, existem (N,n) possveis
amostras, todas igualmente provveis. As amostras aleatrias podem ser escolhi-
das por diversos mtodos, inclusive por tabelas de nmeros aleatrios (TNA) e de
computadores para gerar nmeros aleatrios Na prtica, a amostra aleatria sim-
ples escolhida unidade por unidade. As unidades da populao so numeradas de
1 a N. Em seguida, escolhe-se, na tabela de nmeros aleatrios (TNA), (ou por
computador) n nmeros compreendidos entre 1 e N. Esse processo equivalente a
um sorteio no qual se colocam todos os nmeros misturados dentro de uma urna.
As unidades correspondentes aos nmeros escolhidos formaro a amostra.
Observao:
1. Um exemplo de TNA encontra-se no final da unidade 2.
2. A TNA (Tabela de Nmeros Aleatrios) consiste em tabelas que apresen-
tam seqncias dos dgitos de 0 a 9 distribudos aleatoriamente nas li-
nhas(horizontais) e colunas (verticais). Para obtermos os elementos da
amostra usando a TNA, sorteamos uma linha e uma coluna qualquer para
comearmos a leitura. Por exemplo: escolho 3 linha 15 coluna o digito
encontrado 5. A leitura da tabela pode ser feita horizontalmente (da direi-
ta para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vi-
ce-versa), diagonalmente (no sentido ascendente ou descendente). A op-
o, porm, deve ser feita antes de iniciado o processo.
Assim, em nossos exerccios, avaliaes e trabalhos, utilizaremos sempre a TNA
lendo na vertical, de cima para baixo, considerando sempre as colunas da
esquerda para a direita.
Exemplo de utilizao da TNA
Procure os 10 primeiros nmeros na TNA comeando a leitura na 9 li-
nha e na 5 coluna (lembre-se que cada dgito representa uma coluna.
(Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3)
3. Para retirar amostras em populaes com mais de 10 itens, necessitaremos ler
as colunas quantos dgitos comporem o nmero total de itens da populao. E-
xemplo: para retirarmos 5 amostras de uma populao com 300 itens, temos
PUC Minas Virtual 31 Probabilidade e Estatstica
que ler trs colunas para conseguirmos valores entre 001 e 300. Se o nmero
sorteado superar o nmero de elementos rotulados, abandona-se o nmero sor-
teado, prosseguindo-se o processo. Considerando 9 linha e 5 coluna temos
como resposta : 124,056,094,143,014.
Outras tcnicas de amostragem so preferveis aleatria simples, pois levam
em considerao a composio da populao, facilitando o trabalho de seleo
de amostras e aumentando a preciso.
Exemplo:
Vamos obter uma amostra representativa de 8 itens para a pesquisa da
estatura de noventa alunos de uma escola. Utilize a TNA (3 linha e 8
Coluna).
Resoluo:
Numeramos os alunos de 01 a 90;
Iniciamos o processo de sorteio dos itens da amostra na TNA conside-
rando as colunas 8 e 9, pois 90 so dois dgitos;
A amostra ser os alunos correspondentes aos nmeros: 46, 58, 16,
51, 88, 09, 89, 14.
2.4. Amostragem Aleatria Estratificada
Uma amostra estratificada obtida separando-se as unidades da populao em
grupos no superpostos chamados estratos, e selecionando-se independentemente
uma amostra aleatria simples de cada estrato. Existem dois tipos de amostragem
estratificada:
De igual tamanho;
Proporcional.
No primeiro tipo, sorteia-se igual nmero de elementos em cada estrato. Esse pro-
cesso utilizado quando o nmero de elementos por estrato for aproximadamente
o mesmo.
PUC Minas Virtual 32 Probabilidade e Estatstica
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de
calcular o nmero de amostras por estrato :
N N de unidades da populaon N de unidades das amostrasNa N de unidades do estrato Ana N de amostras de A
aaaa N
Nnn
nn
NN .==
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam me-
ninos e 36 sejam meninas, vamos obter uma amostra proporcional es-
tratificada de 10%.
Resoluo:
So, portanto, dois estratos (sexo masculino e feminino) e queremos
uma amostra de 10% da populao;
Calcula-se o nmero de amostras de cada estrato.
Sexo Populao 10% Nmero de amostras
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspon-
dem meninos e de 55 a 90, meninas. O prximo passo o mesmo do
exemplo anterior.
PUC Minas Virtual 33 Probabilidade e Estatstica
2.5. Amostragem por Conglomerado
Uma amostra por conglomerado uma amostra aleatria simples na qual cada uni-
dade de amostragem um grupo, ou um conglomerado de elementos.
O primeiro passo na amostragem por conglomerado especificar conglomerados
apropriados. Os elementos em um conglomerado tendem a ter caractersticas simi-
lares, portanto, o fato de novas medidas serem tomadas num conglomerado no
implica necessariamente aumento de informao sobre o parmetro populacional.
Como regra geral, o nmero de elementos num conglomerado dever ser pequeno
em relao ao tamanho da populao e o nmero de conglomerados dever ser
razoavelmente grande.
Na amostragem por conglomerado a populao dividida em grupos. E selecionam-
se amostras aleatrias simples de grupos e, ento, todos os itens dos grupos (con-
glomerados) selecionados faro parte da amostra.
Exemplo:
Em um levantamento da populao de uma cidade, podemos dispor do
mapa indicando cada quarteiro e no dispor de uma relao atualizada
dos seus moradores. Pode-se, ento, colher uma amostra dos quartei-
res e fazer a contagem completa de todos os que residem naqueles
quarteires sorteados.
2.6. Amostragem Sistemtica
Quando os elementos da populao j se encontram ordenados, no h necessida-
de de se construir o sistema de referncia. Nesses casos, a seleo dos elementos
que constituiro a amostra pode ser por um sistema imposto pelo pesquisador.
Em geral, para se obter uma amostra sistemtica de n elementos de uma popula-
o de tamanho N, K deve ser menor ou igual a N/n. No possvel determinar K,
precisamente, quando o tamanho da populao desconhecido, mas pode-se supor
um valor de k de tal modo que seja possvel obter uma amostra de tamanho n. Em
vez da amostragem aleatria simples, pode-se empregar a amostragem sistemtica
pelas seguintes razes:
a amostragem sistemtica mais fcil de se executar e, por isso, est menos
sujeita a erros do entrevistador do que aqueles que acontecem na aleatria sim-
ples;
PUC Minas Virtual 34 Probabilidade e Estatstica
a amostragem sistemtica freqentemente proporciona mais informaes por
custo unitrio do que a aleatria simples.
Diretrizes para calcular as amostras:
1 - Estabelecer o intervalo de amostragem K:
nNK =
OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.
2 - Iniciar aleatoriamente a composio da amostra.
b inicio (n de ordem inicial sorteado na TNA).
Kb
Tabela de Nmeros Aleatrios
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA 01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522 04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397 14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569 15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995 16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952 17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870 18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768 19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486 23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136 25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333 27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907 28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054 29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063 30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666 31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801 32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253 33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488 34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157 35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703 36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057 37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181 38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098 39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293 40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
PUC Minas Virtual 36 Probabilidade e Estatstica
UNIDADE 3
Distribuio de Freqncia
3.1. Conceitos 3.2. Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto mdio da classe, freqncia absoluta, relativa e acumulada
3.3. Regras Gerais para a elaborao de uma distribuio de freqncia
3.4. Grficos representativos de uma distribuio de freqncia: histograma, polgono de freqncia e ogiva
Vamos considerar, nesta unidade, o estudo detalhado da distribuio de
freqncia, que a forma pela qual podemos descrever os dados esta-
tsticos resultantes de variveis quantitativas. So objetivos desta uni-
dade:
Compor uma distribuio de freqncia com ou sem intervalos de
classe;
Determinar o quadro de freqncias, eles so teis para condensar
grandes conjuntos de dados, facilitando o sua utilizao;
Representar uma distribuio de freqncia atravs de histograma, polgono e ogiva.
3.1. Conceitos
Ao analisarmos um conjunto de dados, devemos determinar se temos uma amos-
tra ou uma populao. Essa determinao afetar no somente os mtodos utiliza-
dos, mas tambm as concluses, pois se estamos trabalhando com uma amostra os
resultados encontrados so estimativas da populao.
Nem sempre possvel compreender o significado contido numa amostragem por
simples inspeo visual dos dados numricos coletados. Entretanto, entendemos
que o sucesso de uma deciso depender da nossa habilidade em compreender as
informaes contidas nesses dados. O objetivo deste estudo mostrar a organiza-
o, apresentao e anlise grfica de uma srie de dados, matria prima das dis-
tribuies de freqncias e dos histogramas. Freqncia de uma observao o
PUC Minas Virtual 37 Probabilidade e Estatstica
nmero de repeties dessa observao, ou seja, quantas vezes determinado fe-
nmeno acontece.
Os dados podem ser classificados como:
Dados brutos so os dados originais, que ainda no se encontram prontos para anlise, por no estarem numericamente organizados. (Tambm so co-
nhecidos como Tabela Primitiva).
Exemplo: Nmero mensal de aparelhos defeituosos na Empresa X.
J F M A M J J A S O N D
1995 6 2 5 1 0 3 2 1 3 5 5 3
1996 5 4 2 1 3 4 1 4 5 4 0 1
1997 3 1 2 4 3 1 4 1 0 3 0 2
1998 2 2 0 3 1 4 2 0 1 1 5 2
Rol so os dados brutos, organizados em ordem crescente ou decrescente.
Exemplo: Considerando o exemplo anterior temos:
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
PUC Minas Virtual 38 Probabilidade e Estatstica
Dados discretos a varivel discreta quando assume valores em pontos da reta real.
Exemplo: nmero de erros em um livro: 0,1,2,3,4,....
nmero de filhos de vrios casais: 1,2,3,4,.....
quantidade de acidentes em determinada rodovia: 4,10,12,15,....
Dados contnuos a varivel pode assumir, teoricamente, qualquer valor em certo intervalo da reta real.
Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distncia entre cidades: 35,5 km; 48,6 km; 100,10 km; ....
Dados Tabelados no agrupados em classes os valores da varivel apare-cem individualmente.
Exemplo, considerando os dados da tabela anterior:
N de aparelhos
com defeitos N de meses
0 06
1 11
2 09
3 08
4 08
5 05
6 01
Total 48
PUC Minas Virtual 39 Probabilidade e Estatstica
Dados Tabelados agrupados em classes - os valores da varivel no apare-cem individualmente, mas agrupados em classes.
Notas N de alunos
0 |--- 20 020
20 |--- 40 065
40 |--- 60 230
60 |--- 80 160
80 |--- 100 025
Total 580
3.2. Elementos de uma distribuio de freqncia:
amplitude total, limites de classe, amplitude do intervalo de classe,
ponto mdio da classe, freqncia absoluta, relativa e acumulada
3.2.1. Amplitude total (A) - a diferena entre o maior e o menor nmero
do rol.
Exemplo: Estatura de 40 alunos do Colgio A em cm. (Dados ordenados
em ordem crescente, por colunas)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A = 173 150 = 23
PUC Minas Virtual 40 Probabilidade e Estatstica
3.2.2. Nmero de classes (K) e Classe (i) no existe regra fixa para se
determinar o nmero de classes. Podemos utilizar:
A Regra de Sturges, que nos d o nmero de classes em funo do nmero de valores da varivel:
nK log.3,31+= , onde n o nmero de itens que compe a amostra;
Ou
25.n para k e 25 n para 5K >= ,n
Exemplo: considerando o exemplo anterior n=40
Pela formula de Sturges: K= 1+3,3log40 = 6,28 K=6
Adotando nK = , temos 40=k =6,3 K=6
3.2.3. Amplitude de um intervalo de classe (h) ou simplesmente inter-
valo de classe a medida do intervalo que define a classe.
h = A / K
Exemplo, considerando o exemplo anterior:
H = 23/ 6 = 3,83 h = 4
3.2.4. Limites de Classe denominamos limites de classe os extremos de
cada classe. Assim temos:
limite inferior (linf) e
limite superior (Lsup)
Observao: Vamos trabalhar com intervalos fechados esquerda e abertos
direita; isso significa que valores iguais ou superiores ao limite inferior so conside-
rados nessa classe e valores iguais e/ou superiores ao limite superior so conside-
rados na classe abaixo.
PUC Minas Virtual 41 Probabilidade e Estatstica
Exemplo: Do exemplo anterior, temos:
i Classes n
1 150 | 154 4
2 154 | 158 9
3 158 | 162 11
4 162 | 166 8
5 166 | 170 5
6 170 | 174 3
40
Na segunda classe, temos:
L2=158
l2 = 154
3.2.5. Ponto Mdio da Classe - (xi) , como o prprio nome indica, o
ponto que divide o intervalo de classe em duas partes iguais. Para
obtermos o ponto mdio de uma classe, calculamos:
2supinf Llxi
+=
Exemplo: considerando a segunda classe do exemplo anterior, temos:
1561562
15815422 ==
+= xx
3.2.6. Freqncias
Freqncias simples ou absoluta da classe i (ni) - so os valores que real-mente representam o nmero de dados de cada classe. A soma das freqncias
simples igual ao nmero total dos dados.
Exemplo: considerando a segunda classe do exemplo anterior, temos:
n2 = 9 .
PUC Minas Virtual 42 Probabilidade e Estatstica
Freqncias relativas (fi) so os valores das razes entre as freqncias simples e o nmero total de dados.
nnf ii =
Exemplo: considerando a segunda classe do exemplo anterior, temos:
f2 = 9/40=0,225 .
Obs: as freqncias relativas permitem a anlise ou facilitam as
comparaes.
Freqncia acumulada (Ni) o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma dada classe:
Exemplo: Considerando a freqncia acumulada da quarta classe (N4),
temos:
N4= n1+n2+n3+n4= 4+9+11+8 = 32
Freqncia acumulada relativa (Fi) a freqncia acumulada da classe, dividida pela freqncia total da distribuio.
nN
F ii =
Exemplo: para o exemplo anterior, F4 = 0,8 .
NOTA Usualmente, denominamos:
Freqncia relativa acumulada crescente da classe i Fi.
Obs: Fi pode ser entendido como sendo a percentagem de observaes abaixo
do limite superior da classe i.
Freqncia relativa acumulada decrescente da classe i Fi.
Obs: Fi e a porcentagem de observaes acima do limite inferior da classe i.
PUC Minas Virtual 43 Probabilidade e Estatstica
3.3. Regras Gerais para a elaborao de uma distribuio de freqncia
Os principais estgios na construo de uma distribuio de freqncia para dados
amostrais so:
1. Encontrar a amplitude total do conjunto de valores observados;
2. Escolher o nmero de classes;
nnK =+= k ou log,3313. Determinar a amplitude do intervalo de classe;
kAh =
4. Determinar os limites de classe;
5. Construir a tabela de freqncias.
Exemplo:
Calcule as freqncias e o ponto mdio dos dados abaixo:
Alturas de 50 estudantes do sexo masculino da Univesidade XYZ
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
Soluo: Amplitude : A = 97-33 = 64
Nmero de Classes : 750 =K
Intervalo de classe : h =64/7 10
PUC Minas Virtual 44 Probabilidade e Estatstica
i Classes n Ni fi Fi xj
1 30 | 40 4 4 0,08 0,08 35
2 40 | 50 6 10 0,12 0,20 45
3 50 | 60 8 18 0,16 0,36 55
4 60 | 70 13 31 0,26 0,62 65
5 70 | 80 9 40 0,18 0,80 75
6 80 | 90 7 47 0,14 0,94 85
7 90 |100 3 50 0,06 1,0 95
50 1
3.4. Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva
Uma distribuio de freqncia pode ser representativa graficamente pelo histo-
grama, pelo polgono de freqncia e pelo polgono de freqncia acumulada (Ogiva
de Galton).
Histograma formado por um conjunto de retngulos justapostos, cujas bases
se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coinci-
dem com os pontos mdios dos intervalos de classe.
As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.
As alturas dos retngulos devem ser proporcionais s freqncias das classes, sendo igual a amplitude dos intervalos.
Histograma ni
12
8
4
30 40 50 60 70 80 90 100
PUC Minas Virtual 45 Probabilidade e Estatstica
Polgono de freqncia um grfico em linha, sendo as freqncias marcadas
sobre perpendiculares ao eixo horizontal, levantada pelos pontos mdios dos inter-
valos de classe.
Para realmente obtermos um polgono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira
e da posterior ltima, da distribuio.
Polgono de Freqncia ni
12
8
4
35 45 55 65 75 85 95 Ponto mdio
Polgono de freqncia acumulada traado marcando-se as freqncias a-
cumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos corres-
pondentes aos limites superiores dos intervalos de classe.
Polgono de Freqncia Acumulada
30 40 50 60 70 80 90 100
F
50
47
40
31
18
10
4
classes
PUC Minas Virtual 46 Probabilidade e Estatstica
Observao: Uma distribuio de freqncia sem intervalos de classe
representada graficamente por um diagrama onde cada valor da varivel
representado por um segmento de reta vertical e de comprimento proporcional
respectiva freqncia.
ni
xi 1 2 3 4 5 6
4
8
12
PUC Minas Virtual 47 Probabilidade e Estatstica
UNIDADE 4
Medidas de Posio
4.1. Introduo 4.2. Mdia aritmtica simples e ponderada e suas propriedades 4.3. Moda: Dados agrupados e no agrupados em classes 4.4. Mediana: Dados agrupados e no agrupados em classes 4.5. Mdia Geomtrica: Dados agrupados
e no agrupados em classes 4.6. Mdia Harmnica: Dados agrupados
e no agrupados em classes 4.7. Separatrizes: Quartis, Decis e Percentis
Nesta unidade, veremos as tendncias caractersticas de cada distribui-
o, destacando as medidas de posio central, que recebem tal deno-
minao pelo fato de os dados observados tenderem, em geral, a se a-
grupar em torno dos valores centrais. So objetivos desta unidade:
Calcular as medidas de posio central;
Diferenciar as medidas - moda, mdia e mediana;
Utilizar as separatrizes para melhor interpretar os resultados.
4.1. Introduo
Nas sees anteriores, vimos a sintetizao dos dados sob a forma de tabelas, gr-
ficos e distribuies de freqncias. Agora, vamos destacar o clculo das medidas
que possibilitam localizar a maior concentrao de valores de uma dada distribui-
o, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma
distribuio por igual. Tais medidas possibilitam comparaes de sries de dados
entre si pelo confronto desses nmeros.
No entanto, para ressaltar as tendncias caractersticas de cada distribuio, isola-
damente, ou em confronto com outras, necessitamos introduzir os elementos tpi-
cos da distribuio, que so:
Medidas de posio;
Medidas de variabilidade ou disperso;
Medidas de assimetria;
Medidas de curtose.
PUC Minas Virtual 48 Probabilidade e Estatstica
As medidas de posio mais importantes so as medidas de tendncia central, que
destacamos:
A mdia aritmtica;
A mediana;
A moda.
As outras medidas de posio so as separatrizes, que englobam:
A mediana;
Os quartis;
Os decis;
Os percentis.
Primeiramente, vamos estudar as principais medidas de tendncia central, depois
veremos as separatrizes e, na prxima unidade, as medidas de Disperso, Assime-
tria e Curtose.
4.2. Mdia aritmtica simples e ponderada e suas propriedades
o quociente da diviso da soma dos valores da varivel pelo nmero deles. A m-dia (aritmtica) , de modo geral, a mais importante de todas as medidas descriti-
vas.
Dados no tabelados
xi : valor observado n : nmero total de observaes
n
xx
n
ii
== 1
Exemplo: Suponha que o tempo de vida til de 10 aparelhos de telefone so:
10 29 26 28 15 23 17 25 0 20. Qual a mdia de vida til
destes aparelhos?
Soluo: =+++++++++= 1932002517231528262910X
3,1910193
=== n
xx ,
portanto mdia de vida til dos aparelhos so 19,3 anos.
PUC Minas Virtual 49 Probabilidade e Estatstica
Dados Tabelados
Sem intervalo de Classe
n
nxx
i
n
ii
=
=1
Com intervalo de Classe
n
nxX
i
n
ii
==1
s vezes, a mdia pode ser um n
que ela representa.
4.3. Moda (Mo): Dados agrupados
o valor que ocorre com maior freq
nominado valor modal. Baseado nesse
sentar mais de uma moda. Nesse ca
quando no existe um valor predomin
Dados no tabelados: o valor moda
Exemplo: Nos valores abaix
3 4 4 5 6 7
Soluo: Mo= 9
Dados tabelados
Sem intervalo de Classe: O valocia.
Exemplo:
Classes 0 1 2
PUC Minas Virtual
Xi : valor observado ni : n de observaes por classe n : n de observaes totais
mero diferente de todos os da srie de dados
e no agrupados em classes
ncia em um conjunto de dados, e que de-
contexto, um conjunto de dados pode apre-
so, dizemos ser multimodais; caso contrrio,
ante, dizemos que amodal.
l o predominante na distribuio.
o, qual o valor modal?
8 9 9 9 10 11 12 13
r modal o valor que possuir maior freqn-
3 4 5 6
ix : ponto mdio da classe ni : n de observaes
50 Probabilidade e Estatstica
N 06 11 09 08 08 05 01 48
Soluo: o valor predominante o nmero 1, que ocorreu 11 vezes.
Temos, portanto, Mo=1.
Com intervalo de classe: tratando-se de dados agrupados em classe, a moda no percebida to facilmente como nos casos anteriores. Para calcular o va-
lor modal nesses casos, podemos utilizar os seguintes processos:
1 Processo: Frmula de Czuber
)()(inf postmoantmoantmo
Mo nnnnnnhlMo
+
+=
onde constatamos:
Classe Modal: Classe de maior freqncia
n mo: freqncia simples da classe modal
nant : freqncia simples anterior classe modal
npost : freqncia simples posterior classe modal
linf: limite inferior da classe modal
hMo: intervalo de classe modal
2 Processo: Frmula de Pearson
XMdM o 23 =
onde constatamos:
Md = Mediana
X = Mdia
PUC Minas Virtual 51 Probabilidade e Estatstica
Exemplo - Determinar a moda para a distribuio:
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5
ni 3 10 17 8 5 43
Soluo: Utilizando a frmula de Czuber
a classe modal a classe 2|----3
linf = 2
hMo = 1
nMo = 17
nant = 10
npost =8
Substituindo esses valores na frmula, encontramos: Mo= 2,44
4.4. Mediana (Md): Dados agrupados e no agrupados em classes
A mediana uma medida de posio. , tambm, uma separatriz, pois divide o
conjunto em duas partes iguais, com o mesmo nmero de elementos. O valor da
mediana encontra-se no centro da srie estatstica organizada, de tal forma que o
nmero de elementos situados antes desse valor (mediana) igual ao nmero de
elementos que se encontram aps esse mesmo valor (mediana).
Dados no tabelados
Para uma srie com nmero mpar de itens: a mediana corresponde ao valor central.
EMd - elemento mediano: indica a posio da mediana.
n mpar EMd = (n+1)/2
)(EMd
XMd =
A mediana ser o termo de ordem (n+1)/2.
PUC Minas Virtual 52 Probabilidade e Estatstica
Para uma srie com nmero par de itens: no h termo central nico, mas, sim, dois termos centrais. A mediana ser dada por:
n par EMd = n/2 2
XXMd 1)(E)(E MdMd +
+=
A mediana ser a mdia aritmtica entre os termos centrais.
Dados tabelados:
Neste caso, o problema consiste em determinar o ponto do intervalo em que est
compreendida a mediana.
Sem intervalo de classe: devemos, primeiro, obter a localizao da mediana na srie atravs do termo de ordem:
2nEMD =
Uma vez localizada a posio da mediana, devemos verificar o valor numrico da
varivel correspondente a essa posio.
Com intervalo de classe: localizada a classe mediana, calculamos o valor da mediana pela frmula:
Md
ant
n
N2n
Md
+=
Mdhlinf
onde temos:
linf: limite inferior da classe mediana.
hMo: intervalo de classe mediana.
nMd : freqncia simples absoluta na classe mediana.
Nant : freqncia acumulada absoluta anterior classe mediana.
Classe Mediana: classe onde est o elemento mediano.
PUC Minas Virtual 53 Probabilidade e Estatstica
4.5. Mdia Geomtrica (MG): Dados agrupados e no agrupados em classes
Dados no tabelados
A mdia geomtrica de um conjunto de N nmeros x1, x2,x3,......xn a raiz de or-
dem N do produto desses nmeros:
NnG xxxxM ....... 321=
Dados agrupados
Sem intervalo de classe
N nn
nnnG
nxxxxM ....321 321=
Com intervalo de classe
nG xxxxM ....321 N nnnn n321=
4.6. Mdia Harmnica (Mh): Dados agrupad
Sejam x1, x2, x3,......xn, valores de x, associad
n3,......nn, respectivamente.
A mdia harmnica de X definida por:
+++=
xn
xn
xn
nMh
3
3
2
2
1
1 .......
Para dados no agrupados n = 1.
Para dados agrupados sem intervalo de clas
Para dados agrupados com intervalo de clas
PUC Minas Virtual 54 P
Xi : valor observado ni : n de observaes da classe
ix : ponto mdio
ni : n de observaes
os e no agrupados em classes
os s freqncias absolutas n1, n2,
=
=+
n
i i
i
n
n
xn
n
xn
1
.
se xi o valor da varivel.
se xi o ponto mdio da classe.
robabilidade e Estatstica
4.7. Separatrizes: Quartis, Decis e Percentis
So valores que ocupam determinados lugares de uma distribuio de freqncia.
Podemos classific-las em:
Quartis: dividem a distribuio em 4 partes iguais
Qi = quartil i=1,2,3
Q1 = 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)
dos dados menor que ele e as trs quartas partes restantes (75%) so maio-
res.
Q2 = 2 quartil, evidentemente, coincide com a Mediana (Q2 = Md).
Q3 = 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos
termos so menores que ele e uma quarta parte 25 % maior.
hn
Nn
lQQ
ant
Q .4
1
11
+= hn
Nn
lQQ
ant
Q .4
3
3
33
+=
Onde temos:
linf : limite inferior da classe do quartil considerado
hQ: intervalo de classe do quartil considerado
nQ : freqncia simples absoluta do quartil considerado
Nant : freqncia acumulada anterior classe do quartil considerado
Decis: dividem a distribuio em 10 partes iguais
Di = decil i=1,2,3, , 9
1 Passo: Calcula-se em que K = 1,2,3,......,9;
2 Passo: Identifica-se a classe DK , pela Nac ;
3 Passo: Aplica-se a frmula:
lDK: limite inferior da Classe Dk N : tamanho da amostra h : amplitude da classe nDK: freqncia da classe N(ant): freqncia acumulada da classe
hn
NKN
lDK
KD
ant
DK
+=)(10
PUC Minas Virtual 55 Probabilidade e Estatstica
Percentis:: dividem a distribuio em 100 partes iguais.
Pi = centil i=1,2,3, , 99
1 Passo: Calcula-se em que K = 1,2,3,4,............98,99
2 Passo: Pela Nac identifica-se a classe Pi
3 Passo: Aplica-se a frmula
lPK: limite inferior da classe em que, K = 1,2,3,...,98,99. N : tamanho da amostra N(ant): freqncia acumulada anterior classe h : amplitude da classe nPK: freqncia da classe
hn
NKN
lPK
KP
ant
PK
+=)(100
Exemplo:
1- Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
frequencia 6 12 16 13 7
Calcule:
a) O 1 Quartil (Q1);
b) o 4 Decil (D4);
Soluo:
Primeiro vamos estruturar a tabela de distribuio de Freqncias, como esta-
mos trabalhando com intervalos de classe , temos que calcular os pontos m-
dios de cada classe. Depois iremos utilizar as frmulas para cada item que que-
remos calcular.
PUC Minas Virtual 56 Probabilidade e Estatstica
i Estaturas (cm) n N Xi (Ponto mdio)
1 120|--- 128 6 6 124
2 128 |--- 136 12 18 132
3 136 |--- 144 16 34 138
4 144 |--- 152 13 47 148
5 152 |--- 160 7 54 156
Total 54
a) Calculo de Q1,
Para calcular Q1, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :
5,134
544
==N
, que vamos neste momento arredondar para 14, pela frequencia
acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe
com limites de 128 |--- 136.
Agora usamos a formula para calcular Q1
hn
Nn
lQQ
ant
Q .4
1
11
+=
Onde:
linf : limite inferior da classe do quartil considerado = 128
hQ: intervalo de classe do quartil considerado = 8
nQ : freqncia simples absoluta do quartil considerado = 12
Nant : freqncia acumulada anterior classe do quartil considerado =6
Substituindo estes valores na expresso acima temos
( ) 1338*12
65,131281 =
+=Q
PUC Minas Virtual 57 Probabilidade e Estatstica
b) Calculo de D4
Primeiro identificamos a classe que esta o valor;
276,2110
54410
===xKN
, atravs da freqncia acumulada identificamos a clas-
se que encontra o 27 , que a 3 classe com limites de 136 |--- 144
Agora usamos a frmula
hn
NKN
lDK
KD
ant
DK
+=)(10
onde:
8
S
lDK: limite inferior da Classe Dk = 136 N : tamanho da amostra = 54 h : amplitude da classe = 8 nDK: freqncia da classe = 16 N(ant): freqncia acumulada da classe anterior = 1
ubstituindo estes valores na expresso acima temos:
( ) 8,1378*16
186,211364 =
+=D
PUC Minas Virtual 58 Probabilidade e Estatstica
UNIDADE 5
Medidas de Disperso
5.1. Disperso 5.2. Assimetria 5.3. Curtose
A interpretao de dados estatsticos exige que se realize um nmero
maior de estudos, alm das medidas de posio. Nesta unidade, vere-
mos que as medidas de disperso servem para verificar a representati-
vidade das medidas de posio, que o nosso principal objetivo.
5.1. Disperso
So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disper-
so, dos valores em torno da mdia. Servem para medir a representatividade da
mdia.
Absoluta
Amplitude (A)
Varincia (S2)
Desvio padro (S)
Relativa
Coeficiente de Variao (CV)
PUC Minas Virtual 59 Probabilidade e Estatstica
Amplitude Total (A)
a diferena entre o maior e o menor dos valores da srie. A utilizao da amplitu-
de total como medida de disperso muito limitada, pois sendo uma medida que
depende apenas dos valores externos, instvel, no sendo afetada pela disperso
dos valores internos.
Varincia (S2)
A varincia leva em considerao os valores extremos e os valores intermedirios,
isto , expressa melhor os resultados obtidos. A varincia relaciona os desvios em
torno da mdia, ou, mais especificamente, a mdia aritmtica dos quadrados dos
desvios.
Dados Brutos Dados Agrupados
222
11
= n
nxn
nxS iiii
1
)( 2_
12
= =
n
xxS
i
n
i
Onde temos que:
Para dados agrupados sem intervalo de classe, xi o valor da varivel.
Para dados agrupados com intervalo de classe, xi o ponto mdio da classe.
Para dados amostrais, o denominador n-1; para dadospopulacionais, usamos no denominador o valor de n.
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de
vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica des-
critiva, mas extremamente importante na inferncia estatstica e em combinaes
de amostras.
PUC Minas Virtual 60 Probabilidade e Estatstica
Desvio Padro (S)
O desvio-padro a medida mais usada na comparao de diferenas entre conjuntos de
dados, por ter grande preciso. O desvio padro determina a disperso dos valores em rela-
o mdia e calculado por meio da raiz quadrada da varincia.
2SS =
Coeficiente de Variao (CV)
Trata-se de uma medida relativa de disperso til para a comparao em termos
relativos do grau de concentrao. O coeficiente de variao a relao entre o
desvio padro (S) e a mdia x . da mdia de sries distintas.
xSCV =
Diz- se que uma distribuio tem:
Baixa disperso: CV 15%
Mdia disperso: 15%< CV
Simetria
MdMoX ==
Toda distribuio deformada sempre assimtrica. Entretanto, a assimetria pode
dar-se na cauda esquerda ou na direita da curva de freqncias.
Em uma distribuio assimtrica positiva, ou assimetria direita, tem-se:
Assimetria direita (ou positiva)
XMdMo
Existem vrias frmulas para o clculo do coeficiente de assimetria. As mais utiliza-
das so:
1 Coeficiente de Pearson
SMoxAS =
2 coeficiente de Pearson
13
31 2QQMdQQAS
+
=
Quando
5.3. Curtose
Curtose o grau de
uma distribuio padr
camos trs tipos de c
Mesocrtica: um
AS = 0, diz-se que a distribuio simtrica.
AS > 0, diz-se que a distribuio assimtrica positiva ( direita)AS > 0, diz-se que a distribuio assimtrica positiva ( direita)achatamento
o (chamada
urvas de freq
a curva bsic
PUC Minas Virtu
Mo: valor modal (moda)S : Desvio padro X : Mdia
Q1 : valor do 1 Quartil Q3 : valor do 3 QuartilMd : valor da Mediana
(ou afilamento) de uma distribuio em comparao com
curva normal). De acordo com o grau de curtose, classifi-
ncia:
a de referncia chamada curva padro ou curva normal;
al 63 Probabilidade e Estatstica
Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;
Leptocrtica: uma curva mais afilada que a curva normal;
Para medir o grau de curtose utiliza-se o coeficiente:
Q1 : valor do 1 Quartil Q3 : valor do 3 Quartil P10 : valor do percentil 10 P90 : valor do percentil 90
)( 109013
2 PPQQK
=
Se K= 0,263, diz-se que a curva correspondente distribuio de freqncia
mesocrtica.
Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.
Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia leptocrtica.
PUC Minas Virtual 64 Probabilidade e Estatstica
UNIDADE 6
Probabilidade
6.1. Experimento aleatrio, espao amostral e eventos 6.2. Probabilidade: Definio clssica; Probabilidade e
freqncia relativa 6.3. Tipos de eventos 6.4. Axiomas de Probabilidade 6.5. Probabilidade condicional e independncia de eventos
Nesta unidade, vamos ver que a probabilidade expressa por meio de va-
lores numricos as possibilidades da ocorrncia dos resultados de um
fenmeno. So objetivos desta unidade:
Definir e determinar os possveis espaos amostrais de determinados
fenmenos;
Determinar a probabilidade de ocorrncia de um determinado fen-
meno.
Formar um conhecimento slido dos valores probabilsticos que sero
utilizados nas prximas unidades.
6.1. Experimento aleatrio, espao amostral e eventos
Introduo
Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o
prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que
melhor o explique.
Os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em
condies normais de experimentao, varia de uma observao para outra, dificul-
tando dessa maneira a previso de um resultado.
A observao de um fenmeno casual recurso poderoso para se entender a varia-
bilidade do mesmo. Entretanto, com suposies adequadas e sem observar direta-
mente o fenmeno, podemos criar um modelo terico que reproduza de forma bas-
PUC M
Top Related