Faetec-Apostila-Estatistica.pdf

48
GOVERNO DO ESTADO DO RIO DE JANEIRO SECRETARIA DE ESTADO DE CIÊNCIA, TECNOLOGIA E INOVAÇÃO FUNDAÇÃO DE APOIO À ESCOLA TÉCNICA ESCOLA TÉCNICA ESTADUAL REPÚBLICA Curso: Informática Disciplina: Estatística A A p p o o s s t t i i l l a a d d e e E E s s t t a a t t í í s s t t i i c c a a Prof. Cosme Marcelo Furtado Passos da Silva E.T.E. República

Transcript of Faetec-Apostila-Estatistica.pdf

Page 1: Faetec-Apostila-Estatistica.pdf

GOVERNO DO ESTADO DO RIO DE JANEIRO

SECRETARIA DE ESTADO DE CIÊNCIA, TECNOLOGIA E INOVAÇÃO

FUNDAÇÃO DE APOIO À ESCOLA TÉCNICA

ESCOLA TÉCNICA ESTADUAL REPÚBLICA

Curso: Informática

Disciplina: Estatística

AAppoossttii llaa ddee EEssttaattííssttiiccaa

Prof. Cosme Marcelo Furtado Passos da Silva

E.T.E. República

Page 2: Faetec-Apostila-Estatistica.pdf

1 UNIDADE 1 – A NATUREZA DA ESTATÍSTICA PANORAMA HISTÓRICO

A Estatística, tal como a Matemática, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário e empírico.

Vários povos já registravam o número de habitantes, de nascimentos, de óbitos desde a Antigüidade. Faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, cobravam impostos e realizavam inquéritos (pesquisas). As informações com finalidades tributárias ou bélicas já eram colhidas na Idade Média.

As primeiras análises sistemáticas de fatos sociais, como batizados, casamentos e funerais começaram a surgir a partir do século XVI.

No século XVIII o estudo de tais fatos foi adquirindo um caráter mais científico. As tabelas tornaram-se mais completas, surgiram os gráficos e o cálculo das probabilidades,

e a Estatística deixou de ser uma simples contagem de dados coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de parte desse todo (amostras). MÉTODO ESTATÍSTICO

Método é um conjunto de meios que se dispõe de forma a se chegar a um objetivo que se deseja.

O método científico é o desenvolvimento de processos científicos visado o estudo e a aquisição de conhecimentos. Entre os métodos científicos destacam-se: o método experimental e o método estatístico. No método experimental todos os fatores são mantidos constantes, exceto um deles, e variamos este fator de forma que o pesquisador possa descobrir os efeitos dessa variação, caso eles existam. Esse método é o utilizado na Química, na Física e etc. Como exemplo, imagine uma experiência onde todos os fatores (pressão, temperatura e componentes químicos) estão constantes, exceto um deles, então, observa-se o que resultará a partir da alteração desse fator que não está constante. Quando os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar um deles que, naquele momento, nos interessa utilizamos outro método, embora mais difícil e menos preciso, denominado método estatístico.

Como exemplo, imagine os fatores que influenciam o preço de uma mercadoria. Para variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço não temos como controlar os outros fatores que estão diretamente relacionados como os salários, o gosto dos consumidores, o nível geral dos preços das outras necessidades etc. Assim, no método estatístico admiti-se todos os fatores presentes variando, registrando essas variações e procurando determinar, que influencias cada um deles tem. A ESTATÍSTICA

A Estatística, ou métodos estatísticos, como é denominada algumas vezes, desempenha papel crescente e importante em quase todas as fases da pesquisa humana. É a ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Sua utilização é cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos seus mais diversificados ramos de atuação, as pessoas estão freqüentemente expostas à Estatística,

Page 3: Faetec-Apostila-Estatistica.pdf

2 utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método estatístico proporciona àqueles de que dele necessitam. Estatística Descritiva e Estatística Inferencial A ciência Estatística é, basicamente, dividida em duas partes: a Estatística Descritiva e a Estatística Inferencial ou Indutiva. A Estatística Descritiva se preocupa com a organização e descrição dos dados experimentais. Em um sentido mais amplo, a Estatística Descritiva pode ser interpretada como uma função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados referentes a esses fenômenos, a organização e a classificação desses dados observados e a sua apresentação através de gráficos e tabelas, além do cálculo de coeficientes (estatísticas) que permitem descrever resumidamente os fenômenos. A Estatística Inferencial cuida da análise e interpretação. Refere-se a um processo de generalização, a partir de resultados particulares. Consiste em obter e generalizar conclusões, ou seja, inferir propriedades para o todo com base na parte, no particular. A inferência estatística implica, em um raciocínio muito mais complexo do que o que preside a Estatística Descritiva. Porém, se bem compreendida e utilizada, pode converter-se em instrumento muito importante para o desenvolvimento de uma disciplina científica. FASES DO MÉTODO ESTATÍSTICO Testar sistematicamente algo requer muitas vezes uma pesquisa cuidadosamente planejada e executada. Sendo assim, distingui-se no método estatístico as seguintes fases:

a) Redução do problema a ser estudado a uma hipótese testável, ou seja, elaboração do objetivo que o levantamento pretende alcançar, que pergunta(s) ele pretende responder.

b) Elaboração de instrumentos adequados para a coleta de dados.

c) Coleta de dados. O pesquisador pode ir a campo e fazer uma contagem ou um inquérito

(coleta direta - dados primários), ou então utilizar dados já coletados por outros (coleta indireta - dados secundários). A coleta direta pode ser: contínua, periódica ou ocasional.

• Contínua: quando é feita de forma contínua, como os registros de nascimentos e óbitos.

• Periódica: quando é feita em intervalos constantes de tempo, como o Censo Demográfico do IBGE.

• Ocasional: quando é feita esporadicamente para atender a uma conjuntura ou a uma emergência como, por exemplo, uma epidemia.

d) Crítica dos dados. Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de

possíveis falhas e imperfeições, a fim de evitar erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crítica dos dados pode ser externa ou interna.

• Externa: quando procura por erros por parte do informante devido principalmente à má interpretação das perguntas.

• Interna: quando observa os dados coletados a procura de erros devidos, principalmente, à digitação.

Page 4: Faetec-Apostila-Estatistica.pdf

3

e) Apuração dos dados. É a soma e o processamento dos dados obtidos e a sua disposição mediante critérios de classificação.

f) Exposição ou apresentação dos dados. Nesta fase os dados devem ser apresentados através

de gráficos, tabelas e coeficientes que permitam descrever resumidamente os fenômenos observados tornando mais fácil o exame daquilo que é o objeto da pesquisa.

g) Análise e interpretação dos resultados. O objetivo da pesquisa estatística é tirar conclusões

sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, após a realização das fases anteriores (Estatística Descritiva), faz-se uma análise dos resultados obtidos, de onde são extraídas as conclusões e previsões para o todo.

A ESTATÍSTICA NAS EMPRESAS Nas empresas a Estatística auxilia o administrador na organização, direção e controle visando à tomada de decisões.

A Estatística auxiliará também na seleção e organização da estratégia a ser adotada na empresa e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade de seus produtos e/ou serviços e mesmo dos possíveis lucros e/ou perdas.

Page 5: Faetec-Apostila-Estatistica.pdf

4 UNIDADE 2 – POPULAÇÃO E AMOSTRA VARIÁVEIS Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Tipos de Variáveis

Contínua

Discreta vaQuantitati

Ordinal

Nominal aQualitativ

Variável

Variáveis Qualitativas São variáveis que apresentam como possíveis realizações uma qualidade (ou atributo) do que se está investigando. Ex.: População: Moradores de uma cidade. Variáveis: Sexo, grau de instrução, estado civil, classe social. Variável Qualitativa Nominal Variável para a qual não existe nenhuma ordenação nas prováveis realizações. Ex.: População: Moradores de uma cidade. Variáveis: Sexo e estado civil. Variável Qualitativa Ordinal Variável para a qual existe uma certa ordem nos possíveis resultados. Ex.: População: Moradores de uma cidade. Variáveis: Grau de instrução e classe social. Variáveis Quantitativas São variáveis que têm seus valores expressos em números. Ex.: População: Moradores de uma cidade. Variáveis: Número de filhos, idade, peso, altura. Variável Quantitativa Discreta São aquelas cujos possíveis valores formam um conjunto finito ou enumerável de números e que resultam, freqüentemente, de uma contagem. Ex.: População: Moradores de uma cidade. Variáveis: Número de filhos.

Page 6: Faetec-Apostila-Estatistica.pdf

5 Variável Quantitativa Contínua São aquelas cujos possíveis valores formam um intervalo de números reais e que resultam, normalmente, de uma mensuração (medida). Ex.: População: Moradores de uma cidade. Variáveis: Idade, peso e altura. POPULAÇÃO E AMOSTRA Por definição população é o conjunto de indivíduos (ou objetos), que tem pelo menos uma característica em comum.

Amostra é qualquer subconjunto da população. As medidas estatísticas utilizadas para descrever uma característica da população são chamadas de parâmetros. As medidas estatísticas utilizadas para descrever uma característica da amostra são chamadas de estatísticas. TÉCNICAS DE AMOSTRAGEM Para que possamos inferir sobre as características de uma população é necessário que a amostra seja representativa da mesma. Através das Técnicas de Amostragem podemos obter amostras representativas da população. Amostragem Casual ou Aleatória Simples Neste tipo de amostragem os elementos são retirados ao acaso da população. Assim, cada elemento da população tem a mesma probabilidade de fazer parte da amostra. Para a sua realização, numera-se a população de 1 até n e a partir de um dispositivo aleatório (como uma tabela de números aleatórios) são sorteados os k elementos que farão parte da amostra. Exemplo: De uma população de 90 alunos sortear uma amostra de 10% deles (9 alunos). Primeiramente, numeramos os alunos de 01 até 90. Com o auxílio de uma Tabela de Números Aleatórios (Apêndice A) e definindo o critério de utilização desta tabela, sorteamos os elementos que irão fazer parte da amostra.

Se definirmos que o critério de utilização da tabela será da esquerda para a direita, começando pela primeira linha, teremos que selecionar de dois em dois algarismos, uma vez que o total da população em estudo tem dois algarismos (90). Assim, os elementos selecionados são:

72 16 59 83 00 04 85 15 91 15 51 42 50 Os números 00 e 91 foram desprezados por não fazerem parte da população, assim como o segundo número 15. Logo, os alunos que farão parte da amostra são:

72 16 59 83 04 85 15 51 42

Page 7: Faetec-Apostila-Estatistica.pdf

6 Amostragem Proporcional Estratificada A amostragem estratificada é utilizada quando a população se divide em subpopulações (estratos). A variável de estudo pode apresentar um comportamento homogêneo dentro de cada estrato e heterogêneo entre os estratos, assim, torna-se necessário que a composição da amostra leve em consideração os estratos. Exemplo: Se no exemplo anterior a população de 90 alunos fosse dividida em 54 meninos e 36 meninas e desejássemos obter uma amostra proporcional estratificada de 10% deles teríamos então dois estratos (um do sexo masculino e outro do sexo feminino).

Sexo População 10% Tamanho da Amostra Masculino 54

4,5100

54x10 = 5

Feminino 36 6,3

100

36x10 = 4

Total 90 0,9

100

90x10 = 9

Primeiramente, numeramos os alunos de 01 até 90, sendo que de 01 até 54 são os meninos e de 55 até 90 são as meninas. Com o auxílio da Tabela de Números Aleatórios (Apêndice A) e definindo o critério de utilização desta tabela, sorteamos os elementos que irão fazer parte da amostra.

Se definirmos que o critério de utilização da tabela será a primeira coluna e a segunda coluna da esquerda, de cima para baixo. Assim, os elementos selecionados são:

72 25 72 00 64 63 05 99 06

75 06 58 10 70 81 44 60 43 Meninos: 25 05 06 10 44 Meninas: 72 64 63 75 Amostragem Sistemática A amostragem sistemática é utilizada quando os elementos da população já se encontram ordenados. São exemplos os prontuários dos pacientes de um médico, os prédios de uma rua, os elementos de uma linha de produção, etc. Assim, a seleção dos elementos que irão compor a amostra pode ser feita através de um sistema definido pelo pesquisador. Exemplo: Suponha um consultório médico com 900 pacientes que se deseja obter uma amostra de 50 pacientes.

Primeiramente, calculamos a seguinte razão: 1850

900

amostradaTamanho

populaçãodaTamanho == ,

escolhemos por sorteio aleatório um número entre 1 e 18 (inclusive), e a partir daí retira-se periodicamente de 18 em 18.

Se o número sorteado fosse o 4, selecionaríamos na amostra o 4º prontuário, o 22º prontuário (4 + 18), o 40º prontuário (22 + 18), o 58º prontuário (40 + 18), etc.

Page 8: Faetec-Apostila-Estatistica.pdf

7 UNIDADE 3 – SÉRIES ESTATÍSTICAS SÉRIES ESTATÍSTICAS Uma série estatística é definida como toda e qualquer coleção de dados estatísticos. Em uma série estatística observa-se a existência de três elementos (ou fatores):

a) a época (fator temporal ou cronológico) a que se refere o fenômeno analisado; b) o local (fator espacial ou geográfico) onde o fenômeno acontece; c) o fenômeno (espécie do fato ou fator especificativo) que é descrito.

Conforme varie um dos elementos da série, pode-se classificá-la em histórica, geográfica ou

específica.

Séries Históricas, Cronológicas, Temporais ou Marchas São séries que descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Assim, o elemento variável é a época enquanto o local e o fenômeno são fixos. Exemplo:

Distribuição do Número de Internações Hospitalares no Brasil Segundo Mês de Competência. 2000.

Mês de Competência Nº

Internações Janeiro 993.204 Fevereiro 1.006.409 Março 1.013.642 Abril 1.028.015 Maio 1.025.876 Junho 991.928 Julho 996.413 Agosto 1.010.099 Setembro 970.688 Outubro 978.005 Novembro 977.334 Dezembro 945.710 TOTAL 11.937.323 Fonte: SIH/SUS

Séries Geográficas, Espaciais, Territoriais ou de Localização São séries que descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Assim, o elemento variável é o local (fator geográfico) enquanto a época e o fenômeno são fixos.

Page 9: Faetec-Apostila-Estatistica.pdf

8 Exemplo:

Distribuição do Número de Internações Hospitalares Segundo Regiões do Brasil. 2000.

Região Nº

Internações Região Norte 914.104 Região Nordeste 3.601.780 Região Sudeste 4.536.395 Região Sul 1.983.313 Região Centro-Oeste 901.731 TOTAL 11.937.323 Fonte: SIH/SUS

Séries Específicas São séries que descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Assim, o elemento variável é o fenômeno (fator especificativo) enquanto a época e o local são fixos. Exemplo:

Distribuição do Número de Internações Hospitalares no Brasil Segundo Capítulos da CID. 2000.

Capítulos da CID Nº Internações I. Algumas doenças infecciosas e parasitárias 888.613 II. Neoplasias (tumores) 388.064 III. Doenças sangue órgãos hemat e transt imunitár 71.068 IV. Doenças endócrinas nutricionais e metabólicas 302.888 V. Transtornos mentais e comportamentais 422.836 VI. Doenças do sistema nervoso 212.364 VII. Doenças do olho e anexos 85.400 VIII.Doenças do ouvido e da apófise mastóide 21.228 IX. Doenças do aparelho circulatório 1.134.385 X. Doenças do aparelho respiratório 1.936.444 XI. Doenças do aparelho digestivo 1.013.732 XII. Doenças da pele e do tecido subcutâneo 135.848 XIII.Doenças sist osteomuscular e tec conjuntivo 243.735 XIV. Doenças do aparelho geniturinário 837.978 XV. Gravidez parto e puerpério 2.913.953 XVI. Algumas afec originadas no período perinatal 258.770 XVII.Malf cong deformid e anomalias cromossômicas 84.040 XVIII.Sint sinais e achad anorm ex clín e laborat 146.904 XIX. Lesões enven e alg out conseq causas externas 629.829 XX. Causas externas de morbidade e mortalidade 64.132 XXI. Contatos com serviços de saúde 145.086 CID 10ª Revisão não disponível ou não preenchido 26 TOTAL 11.937.323 Fonte: SIH/SUS

Page 10: Faetec-Apostila-Estatistica.pdf

9 REPRESENTAÇÃO TABULAR Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que se tenha uma visão global da variação dessa ou dessas variáveis. Esse objetivo é inicialmente alcançado através da construção de tabelas e gráficos. A tabela é utilizada para resumir um conjunto de observações. Uma tabela é composta de:

a) corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo; b) cabeçalho: parte superior da tabela que especifica o conteúdo das colunas; c) coluna indicadora: parte da tabela que especifica o conteúdo das linhas; d) título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O

quê?, Quando?, Onde?, localizado no topo da tabela; e) fonte: origem dos dados. A fonte é localizada no rodapé da tabela.

Distribuição do Número de Internações Hospitalares Segundo Regiões do Brasil. 2000.

Região

Nº Internações

Região Norte 914.104 Região Nordeste 3.601.780 Região Sudeste 4.536.395 Região Sul 1.983.313 Região Centro-Oeste 901.731 TOTAL 11.937.323 Fonte: SIH/SUS

TABELA DE DUPLA ENTRADA (SÉRIES CONJUGADAS) Pode-se apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, a conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtém-se uma tabela de dupla entrada. Nesse tipo de tabela ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo:

Distribuição do Número de Internações Hospitalares Segundo Regiões do Brasil e Ano de Competência. 1998-2000.

Região 1998 1999 2000 Total Região Norte 849.145 923.542 914.104 2.686.791 Região Nordeste 3.508.468 3.582.825 3.601.780 10.693.073 Região Sudeste 4.550.048 4.573.841 4.536.395 13.660.284 Região Sul 1.958.122 1.990.983 1.983.313 5.932.418 Região Centro-Oeste 848.973 879.606 901.731 2.630.310 TOTAL 11.714.756 11.950.797 11.937.323 35.602.876 Fonte: SIH/SUS

Título

Cabeçalho Cabeçalho

Coluna

indicadora

Corpo

Rodapé

Page 11: Faetec-Apostila-Estatistica.pdf

10 No exemplo apresentado houve a conjugação de uma série geográfica com uma série histórica, originando uma série geográfica-histórica ou histórica-geográfica. DISTRIBUIÇÃO DE FREQÜÊNCIAS Freqüência de um dado valor de uma variável (qualitativa ou quantitativa) é o número de vezes que esse valor foi observado. Exemplo: Distribuição por sexo dos adolescentes das Classes Sociais A e B.

Sexo Nº de adolescentes Masculino 289 Feminino 155 Total 444 Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro. CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999. DADOS ABSOLUTOS E DADOS RELATIVOS Dados absolutos são os dados estatísticos resultantes da coleta direta da fonte sem qualquer tratamento além da contagem ou medida. Os dados relativos representam o resultado de comparações por quocientes (razões) entre dados absolutos, que tem por finalidade facilitar as comparações entre quantidades. As percentagens, os índices, os coeficientes e as taxas são tipos de dados relativos. As Percentagens

Considere a tabela a seguir: Distribuição por sexo dos adolescentes das Classes Sociais A e B.

Sexo Nº de adolescentes Masculino 289 Feminino 155 Total 444 Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro. CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999. Calculando as percentagens dos adolescentes de cada sexo, temos:

Masculino → 1,6509,65444

100x289 ==

Feminino → 9,3491,34444

100x155 ==

Page 12: Faetec-Apostila-Estatistica.pdf

11 Com a inclusão de uma nova coluna na série, temos: Distribuição por sexo dos adolescentes das Classes Sociais A e B.

Sexo Nº de adolescentes % Masculino 289 65,1 Feminino 155 34,9 Total 444 100,0 Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro. CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999. Assim, os valores dessa nova coluna nos revelam que de cada 100 adolescentes entrevistados nas Classes Sociais A e B, aproximadamente, 65 são do sexo masculino e 35 são do sexo feminino. A percentagem é muito usada quando desejamos verificar a participação da parte no todo. Considere a tabela a seguir: Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).

Nº de adolescentes das Classes Sociais Sexo A e B C, D e E

Masculino 289 242 Feminino 155 228 Total 444 470 Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro. CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999. Qual dos grupos de Classes Sociais tem, comparativamente, maior número de adolescentes em cada sexo? Como o número total de adolescentes não é o mesmo nos dois grupos, não podemos fazer a comparação pelo valor absoluto. Assim, devemos usar a percentagem para fazer essa comparação. Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).

Classes Sociais A e B Classes Sociais C, D e E Sexo Nº de adolescentes % Nº de adolescentes %

Masculino 289 65,1 242 51,5 Feminino 155 34,9 228 48,5 Total 444 100,0 470 100,0 Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro. CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999. Observa-se que as Classes Sociais A e B, contam com mais adolescentes do sexo masculino (65 em cada 100 adolescentes são do sexo masculino nessas Classes Sociais), enquanto nas Classes Sociais C, D e E essa relação é de, aproximadamente, 52 adolescentes do sexo masculino para cada 100 adolescentes.

Page 13: Faetec-Apostila-Estatistica.pdf

12 Os Índices Os índices representam razões entre duas grandezas, sendo que uma não inclui a outra. Exemplos:

a) Índice de massa corporal (IMC): 2altura

peso

b) Densidade demográfica: erfíciesup

população

c) Produção per capita: população

produçãodatotal

d) Consumo per capita: população

bemdoconsumo

e) Renda per capita: população

renda

f) Receita per capita: população

receita

Produção per capita, Consumo per capita, Renda per capita e Receita per capita são índices econômicos. Os Coeficientes Os coeficientes representam razões entre o número de ocorrências e o número total. Onde o número total é o número de ocorrências somado ao número de não ocorrências. Exemplos:

a) Coeficiente de natalidade: totalpopulação

snascimento de número

b) Coeficiente de mortalidade: totalpopulação

óbitos de número

c) Coeficiente de evasão escolar: matrículas de inicial número

evadidos alunos de número

d) Coeficiente de aproveitamento escolar: matrículas de final número

aprovados alunos de número

Page 14: Faetec-Apostila-Estatistica.pdf

13

e) Coeficiente de recuperação escolar: orecuperaçã em alunos de número

srecuperado alunos de número

Coeficiente de evasão escolar, Coeficiente de aproveitamento escolar e Coeficiente de recuperação escolar são coeficientes educacionais. As Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc). Exemplos:

a) Taxa de natalidade: Coeficiente de natalidade x 1.000

b) Taxa de mortalidade: Coeficiente de mortalidade x 1.000

c) Taxa de evasão escolar: Coeficiente de evasão escolar x 100

d) Taxa de aproveitamento escolar: Coeficiente de aproveitamento escolar x 100

e) Taxa de recuperação escolar: Coeficiente de recuperação escolar x 100 Exercícios: Com base nos dados abaixo, divulgados pelo IBGE, para o Município do Rio de Janeiro, em 2001, calcule:

a) Densidade demográfica; b) Coeficiente de natalidade; c) Coeficiente de mortalidade; d) Taxa de natalidade; e) Taxa de mortalidade.

Nascidos vivos: 84.865 nascimentos Óbitos: 53.409 óbitos População: 5.897.485 habitantes Área do Município do Rio de Janeiro: 1.182,296 km2

Page 15: Faetec-Apostila-Estatistica.pdf

14 UNIDADE 4 – GRÁFICOS ESTATÍSTICOS GRÁFICO ESTATÍSTICO O gráfico estatístico é uma forma de apresentação dos resultados que tem a função de facilitar a compreensão através de seu efeito visual imediato. Essa característica é uma vantagem que os gráficos têm em relação às tabelas, uma vez que a impressão que eles produzem é mais rápida. Os gráficos devem apresentar:

a) Simplicidade: O gráfico não deve conter elementos desnecessários à sua construção que possam levar a uma análise mais demorada ou até mesmo errônea;

b) Clareza: o gráfico deve apresentar de forma clara os valores observados no fenômeno em estudo, possibilitando a sua correta interpretação;

c) Veracidade: o gráfico deve representar a verdade sobre o fenômeno em estudo. DIAGRAMAS Os diagramas são gráficos geométricos. Entre os diagramas destacam-se:

a) O gráfico em linha ou em curva; b) O gráfico em colunas ou em barras; c) O gráfico em colunas ou em barras múltiplas; d) O gráfico em setores.

O Gráfico em Linha ou em Curva O gráfico de linha é uma representação em um sistema de coordenadas cartesianas. O sistema é formado por duas retas perpendiculares que são os eixos das abscissas (eixo dos valores de x – horizontal) e das ordenadas (eixo dos valores de y – vertical). O ponto de interseção dos eixos é chamado de origem. Após a determinação de todos os pares ordenados (x,y) da série, estes são unidos por segmentos de reta, o que formará o gráfico em linha da série em estudo. Exemplo:

Produção Brasileira de Trigo 1991-2001

Anos Quantidade

(em toneladas) 1991 2.916.8231992 2.795.5981993 2.197.3541994 2.096.2591995 1.533.8711996 3.292.7591997 2.489.0701998 2.269.8471999 2.461.8562000 1.725.7922001 3.366.599

Fonte: IBGE - Produção Agrícola Municipal

Page 16: Faetec-Apostila-Estatistica.pdf

15

Produção Brasileira de Trigo1991-2001

0

1.000.000

2.000.000

3.000.000

4.000.000

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

Ano

Ton

elad

as

Fonte: IBGE - Produção Agrícola Municipal

O Gráfico em Colunas ou em Barras Estes gráficos representam a série em estudo através de retângulos verticais (gráficos em colunas) ou horizontais (gráficos em barras). No gráfico em colunas os retângulos que o formam têm a mesma base enquanto suas alturas são proporcionais aos dados apresentados. No gráfico em barras os retângulos que o formam têm a mesma altura enquanto seus comprimentos são proporcionais aos dados apresentados. Exemplo:

a) Gráfico em colunas

Produção Brasileira de Carvão Vegetal 1991-2001

Anos Quantidade

(em toneladas) 1991 2.088.8221992 1.920.0771993 2.051.9621994 2.382.6951995 2.481.8391996 2.602.5401997 3.784.0641998 3.042.7891999 2.536.8472000 2.385.5162001 2.092.309

Fonte: IBGE - Silvicultura

Page 17: Faetec-Apostila-Estatistica.pdf

16

Produção Brasileira de Carvão Vegetal1991-2001

0

1.000.000

2.000.000

3.000.000

4.000.000

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

Ano

Ton

elad

as

Fonte: IBGE - Silvicultura

b) Gráfico em barras

Número de Nascidos Vivos Segundo Unidades da Federação da Região Sudeste

2001 Unidades da Federação

Número de Nascidos Vivos

Minas Gerais 275.502Espírito Santo 71.026Rio de Janeiro 210.090São Paulo 627.678Fonte: IBGE - Estatísticas do Registro Civil

Número de Nascidos Vivos Segundo Unidades da Federação da Região Sudeste

2001

0 100.000 200.000 300.000 400.000 500.000 600.000 700.000

Minas Gerais

Espírito Santo

Rio de Janeiro

São Paulo

Fonte: IBGE - Estatísticas do Registro Civil

Page 18: Faetec-Apostila-Estatistica.pdf

17 O Gráfico em Colunas ou em Barras Múltiplas Este gráfico é geralmente utilizado quando se deseja representar dois ou mais fenômenos comparando-os. Exemplo:

Número de Processos de Divórcio no Brasil Encerrados em 1ª Instância Segundo Tipo de Processo

1991-2001 Tipo de Processo

Anos Consensual Não Consensual

1991 59.028 23.4641992 64.264 24.2201993 68.094 26.6741994 68.651 27.1631995 70.535 29.2071996 69.789 26.5371997 76.892 28.6801998 75.292 29.6511999 88.330 35.9532000 87.489 37.1162001 88.031 36.800

Fonte: IBGE - Estatísticas do Registro Civil

Número de Processos de Divórcio no Brasil Encerrados em 1ª Instância Segundo Tipo de

Processo 1991-2001

0

30.000

60.000

90.000

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001Ano

Consensual Não consensual

Fonte: IBGE - Estatísticas do Registro Civil

O Gráfico em Setores O gráfico em setores é construído usando como base um círculo. Os setores representam a participação de cada uma das categorias observadas no total. Para calcular cada um dos setores emprega-se uma regra de três simples e direta, onde a medida total da circunferência (360º) corresponde ao total da série.

Page 19: Faetec-Apostila-Estatistica.pdf

18 Exemplo:

Produção de Leite Segundo Unidades da Federação da Região Sul

2001 Unidades da Federação

Produção de leite (em milhares de litros)

Paraná 1.889.627Santa Catarina 1.076.084Rio Grande do Sul 2.222.054Total 5.187.765Fonte: IBGE - Pesquisa Pecuária Municipal

Para calcular o setor que irá representar o Paraná:

627.889.1______X

765.187.5______360o o

o1,131

5.187.765

360 x 1.889.627X ==

Para calcular o setor que irá representar Santa Catarina:

084.076.1______X

765.187.5______360o o

o7,74

5.187.765

360 x 1.076.084X ==

Para calcular o setor que irá representar o Rio Grande do Sul:

054.222.2______X

765.187.5______360o o

o2,154

5.187.765

360 x 2.222.054X ==

Produção de Leite Segundo Unidades da Federação da Região Sul

2001

Paraná

Santa Catarina

Rio Grande do Sul

Fonte: IBGE - Pesquisa Pecuária Municipal

Page 20: Faetec-Apostila-Estatistica.pdf

19 UNIDADE 5 – DISTRIBUIÇÃO DE FREQÜÊNCIA TABELA PRIMITIVA E ROL Chama-se tabela primitiva ao conjunto de valores observados e não organizados numericamente. Rol é a tabela que se obtém após a ordenação (crescente ou decrescente) dos dados observados. Exemplos: Considere uma coleta de dados relativos aos pesos de 40 alunos, que compõem uma amostra de alunos de um colégio. Tabela Primitiva:

66 59 47 62 60 62 61 54 64 53 58 56 52 58 68 50 57 57 68 53 60 56 62 52 60 54 61 63 69 62 46 57 63 59 61 61 49 63 64 56

Rol:

46 47 49 50 52 52 53 53 54 54 56 56 56 57 57 57 58 58 59 59 60 60 60 61 61 61 61 62 62 62 62 63 63 63 64 64 66 68 68 69

DISTRIBUIÇÃO DE FREQÜÊNCIA Freqüência de um dado valor de uma variável (qualitativa ou quantitativa) é o número de vezes que esse valor foi observado. A tabela onde são apresentadas as respostas da variável e suas respectivas freqüências recebe o nome de distribuição de freqüências.

Page 21: Faetec-Apostila-Estatistica.pdf

20 Exemplo:

Pesos de 40 alunos de um colégio

Peso (em kg) Freqüência 46 1 47 1 49 1 50 1 52 2 53 2 54 2 56 3 57 3 58 2 59 2 60 3 61 4 62 4 63 3 64 2 66 1 68 2 69 1

Total 40 Em algumas situações a construção da distribuição de freqüências para uma certa variável não resumirá a sua forma de apresentação, pois podem não existir muitas observações semelhantes nesta variável. A solução é agrupar os dados por faixas (intervalos de classe). Assim, agrupando os resultados em intervalos, como por exemplo, 46 ├ 50, diremos que existem 3 alunos com pesos entre 46, inclusive, e 50 kg, ao invés de dizermos que existe 1 aluno com 46 kg, 1 aluno com 47 kg e 1 aluno com 49 kg.

O símbolo ├ que aparece entre os valores do intervalo indica que o intervalo é fechado à esquerda e aberto à direita, ou seja, que o valor da esquerda faz parte do intervalo enquanto o valor da direita não faz parte do intervalo. Assim, em 46 ├ 50, temos que 46 ≤ x < 50. Exemplo:

Pesos de 40 alunos de um colégio

Peso (em kg) Freqüência 46 ├ 50 3 50 ├ 54 5 54 ├ 58 8 58 ├ 62 11 62 ├ 66 9 66 ├ 70 4 Total 40

Page 22: Faetec-Apostila-Estatistica.pdf

21

A construção dos intervalos de classes tem suas vantagens e desvantagens. A principal vantagem é que conseguimos uma redução na apresentação da distribuição de freqüências, que neste caso é uma distribuição de freqüência com intervalos de classe. A principal desvantagem está na perda do valor original, assim tomando como base o intervalo de classe 50 ├ 54, podemos afirmar que 5 alunos possuem peso entre 50 (inclusive) e 54 kg, porém não podemos precisar quantos alunos têm 50 kg, quantos têm 51 kg, quantos têm 52 kg e quantos têm 53 kg. A construção de intervalos de classes é mais recomendada quando a variável é quantitativa contínua uma vez que a variação das respostas desse tipo de variável costuma ser maior que a variação das respostas de uma variável quantitativa discreta. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA Os elementos que compõem uma distribuição de freqüências são:

a) Classe; b) Limites de classe; c) Amplitude de um intervalo de classe; d) Amplitude total da distribuição; e) Amplitude amostral; f) Ponto médio de uma classe; g) Freqüência simples ou absoluta.

a) Classe Os intervalos de variação da variável são chamados de classes de freqüências ou classes. Representamos as classes pela letra “i”, de tal forma que i=1, 2, 3, ..., k, onde k é o número total de classes da distribuição. No nosso exemplo, a distribuição possui seis classes (k = 6). O intervalo 58 ├ 62 define a quarta classe (i = 4). b) Limites de classe Limites de classes são os valores que definem cada um dos intervalos de classe. O menor valor do intervalo de classe i é o limite inferior da classe (li) e o maior valor do intervalo de classe i é o limite superior da classe (Li). Na quarta classe (58 ├ 62) do nosso exemplo temos:

l4 = 58 e L4 = 62

Page 23: Faetec-Apostila-Estatistica.pdf

22 c) Amplitude de um intervalo de classe A amplitude de um intervalo de classe (hi) é a distância entre o limite superior da classe e o limite inferior da classe, ou seja, é a diferença entre o limite superior da classe e o limite inferior da classe.

iii lLh −= Na quarta classe (58 ├ 62) do nosso exemplo temos:

45862lLh 444 =−=−= ⇒ kg4h4 = d) Amplitude total da distribuição A amplitude total da distribuição (AT) é a distância entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo), ou seja, é a diferença entre o limite superior máximo e o limite inferior mínimo.

.)mín(l.)máx(LAT −= No nosso exemplo temos:

244670AT =−= ⇒ kg24AT = Obs.: Se todas as classes possuem a mesma amplitude, como no nosso exemplo, verifica-se a relação:

kh

AT

i=

No nosso exemplo temos:

64

24 =

e) Amplitude amostral A amplitude amostral (AA) é a diferença entre o maior valor e o menor valor observado na amostra.

.)mín(x.)máx(xAA −= No nosso exemplo temos:

234669AA =−= ⇒ kg23AA =

Page 24: Faetec-Apostila-Estatistica.pdf

23 f) Ponto médio de uma classe O ponto que divide o intervalo de classes em duas partes iguais é chamado de ponto médio de uma classe, e é representado por xi. O ponto médio de uma classe é o valor que a representa. O ponto médio de uma classe é obtido somando-se o limite inferior da classe com o limite superior da classe e dividindo o resultado dessa soma por 2, ou seja através da média aritmética dos limites da classe.

2

Llx ii

i+

=

Na quarta classe (58 ├ 62) do nosso exemplo temos:

602

120

2

6258

2

Llx 44

4 ==+=+

= ⇒ kg60x4 =

g) Freqüência simples ou absoluta

Freqüência simples ou freqüência absoluta ou, simplesmente, freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor, ou seja, é o número de vezes que essa classe ou esse valor foi observado. Representamos a freqüência absoluta por fi (freqüência da i-ésima classe). No nosso exemplo temos:

f1 = 3, f2 = 5, f3 = 8, f4 = 11, f5 = 9 e f6 = 4 A soma de todas as freqüências absolutas é o número total de elementos observados.

∑=

=k

1ii nf .

No nosso exemplo temos:

∑=

=k

1ii 40f ou simplesmente ∑ = 40f i

Pesos de 40 alunos

de um colégio i Peso (em kg) fi 1 46 ├ 50 3 2 50 ├ 54 5 3 54 ├ 58 8 4 58 ├ 62 11 5 62 ├ 66 9 6 66 ├ 70 4

Total ∑ = 40f i

Page 25: Faetec-Apostila-Estatistica.pdf

24 NÚMERO DE CLASSES DOS INTERVALOS DE CLASSE A determinação do número de classes, das amplitudes das classes e dos limites dos intervalos de classe é uma preocupação que o pesquisador deve ter na construção da distribuição de freqüências. Usualmente, utilizamos a Regra de Sturges que fornece o número de classes em função do número de observações da variável e é dada por:

nlog3,31k +≅ onde: k é o número de classes n é o número total de observações Com base na Regra de Sturges tem-se a seguinte tabela:

Número de classes das distribuições de freqüências aplicando a

Regra de Sturges n k

3 a 5 3 6 a 11 4

12 a 23 5 24 a 46 6 47 a 93 7 94 a 187 8

188 a 376 9 377 a 756 10 757 a 1519 11

1520 a 3053 12 ... ...

Além da Regra de Sturges existem outras fórmulas usadas para a determinação do número de classes que deve ter a distribuição de freqüências, como por exemplo, nk ≅ , porém o número de classes depende mais de um julgamento pessoal por parte do pesquisador que deve considerar a natureza dos dados, sua unidade e o objetivo da pesquisa, evitando classes com freqüência zero e, também, uma grande concentração de dados em uma única classe. Para se determinar a amplitude dos intervalos de classe, dividimos a amplitude amostral pelo número de classes:

k

AAh =

Quando o resultado não é exato devemos arrendondá-lo para mais. Para a escolha dos limites dos intervalos devemos ter em mente que os mesmos devem fornecer como pontos médios, números que facilitem os cálculos. No nosso exemplo, como n = 40, pela tabela da Regra de Sturges, k = 6. Assim,

48,36

23

6

4669

k

AAh ≅==−==

Page 26: Faetec-Apostila-Estatistica.pdf

25 Logo, a amplitude de cada um dos intervalos de classe é 4. TIPOS DE FREQÜÊNCIAS Freqüências simples ou absolutas (fi) As freqüências simples ou absolutas (fi) são os valores que representam o número de observações de cada classe.

A soma das freqüências absolutas é o número total de observações.

∑ = nf i Freqüências relativas (fri)

As freqüências relativas são as razões entre as freqüências absolutas e a freqüência total.

n

f

f

ffr i

i

ii ==

Logo, a freqüência relativa da segunda classe do nosso exemplo é:

∑=

i

33 f

ffr ⇒ 200,0

40

8fr3 == ⇒ 200,0fr3 =

A soma de todas as freqüências relativas de uma distribuição de freqüências é igual a 1 ou 100%.

1fri =∑ Freqüência acumulada (Fi)

A freqüência acumulada é o total de observações até o limite superior do intervalo de uma dada classe. Serve para indicar quantos elementos estão até um certo limite.

k21i fffF +++= L ou ( )k,,2,1i,fF ii L== ∑ A freqüência acumulada até a quarta classe do nosso exemplo é:

4321

4

1ii4 fffffF +++== ∑

= ⇒ 11853F4 +++= ⇒ 27F4 =

Esse resultado indica que 27 alunos têm peso inferior a 62 kg (limite superior do intervalo da quarta classe).

Page 27: Faetec-Apostila-Estatistica.pdf

26 Freqüência acumulada relativa (Fri)

A freqüência acumulada relativa de uma classe é a freqüência acumulada da classe dividida pelo número total de observações (freqüência total). Serve para indicar que proporção dos elementos está até um certo limite.

∑=

i

ii f

FFr

A freqüência acumulada relativa até a quarta classe do nosso exemplo é:

∑=

i

44 f

FFr ⇒ 675,0

40

27Fr4 == ⇒ 675,0Fr4 =

Com as freqüências estudadas podemos montar a seguinte tabela para o nosso exemplo:

Pesos de 40 alunos de um colégio i Peso (em kg) f i xi fr i Fi Fr i 1 46 ├ 50 3 48 0,075 3 0,075 2 50 ├ 54 5 52 0,125 8 0,200 3 54 ├ 58 8 56 0,200 16 0,400 4 58 ├ 62 11 60 0,275 27 0,675 5 62 ├ 66 9 64 0,225 36 0,900 6 66 ├ 70 4 68 0,100 40 1,000 ∑= 40 ∑= 1,000

DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE Distribuição de freqüência sem intervalos de classe é a distribuição de freqüência usada para representar a variável quantitativa discreta, uma vez que esse tipo de variável, geralmente, apresenta pouca variação nos seus valores observados. Exemplo: Seja x a variável “número de livros lidos por 20 alunos, de um colégio, no período de um ano”.

Número de livros lidos por 20 alunos, de um colégio, no período de um ano

i xi fi 1 2 1 2 3 2 3 4 4 4 5 4 5 6 6 6 7 3 ∑= 02

Page 28: Faetec-Apostila-Estatistica.pdf

27 Calculando os vários tipos de freqüências, temos:

Número de livros lidos por 20 alunos, de um colégio, no período de um ano

i xi fi fr i Fi Fr i 1 2 1 0,050 1 0,050 2 3 2 0,100 3 0,150 3 4 4 0,200 7 0,350 4 5 4 0,200 11 0,550 5 6 6 0,300 17 0,850 6 7 3 0,150 20 1,000 ∑= 02 ∑= 1,000

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Uma distribuição de freqüência pode ser representada graficamente pelo histograma, pelo polígono de freqüências e pelo polígono de freqüências acumuladas, que são os gráficos utilizados para a representação de uma variável quantitativa contínua. A construção desses gráficos baseia-se no sistema de coordenadas cartesianas. No eixo das abscissas (horizontal) são colocados os valores da variável e no eixo das ordenadas (vertical) são colocadas as freqüências. Histograma O histograma é um gráfico formado por um conjunto de retângulos justapostos que tem as bases sobre o eixo das abscissas (eixo dos x), com centro no ponto médio e as larguras iguais as amplitudes dos intervalos das classes. As áreas de cada um dos retângulos do histograma são proporcionais as freqüências das classes. Quando todos os intervalos de classes têm a mesma amplitude, as alturas dos retângulos são proporcionais às freqüências das classes. Se as amplitudes de todos os intervalos de classes não forem iguais, as alturas de cada uma das barras do histograma deverão sofrer ajustes de tal forma que as áreas continuem proporcionais as freqüências das classes.

Page 29: Faetec-Apostila-Estatistica.pdf

28

Pesos de 40 alunos de um colégio

0

3

6

9

12

44 48 52 56 60 64 68 72

X

f

Polígono de freqüências O polígono de freqüências é um gráfico em linha obtido através da união dos pontos médios dos patamares do histograma. Para completar a figura consideram-se duas classes laterais, uma imediatamente anterior a primeira e outra imediatamente posterior a ultima, ambas com freqüências nulas.

Pesos de 40 alunos de um colégio

0

3

6

9

12

44 48 52 56 60 64 68 72

X

f

Page 30: Faetec-Apostila-Estatistica.pdf

29 Polígono de freqüências acumuladas O polígono de freqüências acumuladas é traçado verificando-se as freqüências acumuladas ao final de cada uma das classes.

Pesos de 40 alunos de um colégio

0

10

20

30

40

46 50 54 58 62 66 70

X

F

Exercícios: Os dados abaixo são relativos às idades de 20 alunos de um colégio.

10 17 9 15 13 11 9 12 14 14 15 12 11 13 9 8 6 11 19 5

Com base nessas informações, construa uma distribuição de freqüências para essa variável e calcule:

a) a freqüência relativa; b) a freqüência acumulada; c) a freqüência acumulada relativa; d) a amplitude dos intervalos de classes; e) os pontos médios das classes; f) a amplitude total da distribuição.

Faça um esboço do histograma, do polígono de freqüências e do polígono de freqüências acumuladas.

Page 31: Faetec-Apostila-Estatistica.pdf

30 UNIDADE 6 – MEDIDAS DE POSIÇÃO INTRODUÇÃO As medidas de posição são usadas para resumir os dados apresentando um ou alguns valores para representar a série toda.

Entre as medidas de posição destacam-se: a média aritmética, a moda e a mediana, que também são chamadas de medidas de tendência central uma vez que os dados observados, geralmente, se agrupam em torno de valores centrais. MÉDIA ARITMÉTICA ( )X A média aritmética de um conjunto de “n” números x1, x2, ..., xn, é representada por X (leia-se “X barra”) e definida pela soma das observações dividida pelo número total delas, ou seja, é o quociente da divisão da soma de todos os valores da variável pelo número deles.

n

x

n

x...xxX in21 ∑=

+++=

onde: X = a média aritmética;

ix = os valores da variável; n = o número de observações. Média aritmética para dados não-agrupados Exemplo: A média aritmética dos números 2, 8, 3, 6, 11 é:

65

30

5

116382X ==++++=

Média aritmética para dados agrupados a) Sem intervalos de classe Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem com as freqüências f1, f2, ..., fk) a média aritmética será definida por:

n

xf

f

xf

f...ff

xf...xfxfX ii

i

ii

k21

kk2211 ∑∑∑ ==

++++++

=

Page 32: Faetec-Apostila-Estatistica.pdf

31 Exemplo: Calcule a média aritmética para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um ano

xi fi fixi 0 3 0 1 4 4 2 7 14 3 6 18 ∑= 02 ∑= 36

8,120

36

n

xfX ii === ∑ ⇒ viagens8,1X =

b) Com intervalos de classe Quando os dados são apresentados em uma distribuição de freqüências com intervalos de classe, todos os valores incluídos em um certo intervalo de classes são considerados coincidentes com o ponto médio do intervalo (xi) e a média aritmética é dada por:

n

xfX ii∑=

Exemplo: Calcule a média aritmética para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio i Peso (em kg) f i xi fixi 1 46 ├ 50 3 48 144 2 50 ├ 54 5 52 260 3 54 ├ 58 8 56 448 4 58 ├ 62 11 60 660 5 62 ├ 66 9 64 576 6 66 ├ 70 4 68 272 ∑= 40 2360∑=

5940

2360

n

xfX ii === ∑ ⇒ kg59X =

Page 33: Faetec-Apostila-Estatistica.pdf

32 MODA (Mo) A moda de um conjunto de números é o valor que ocorre com maior freqüência, isto é, é o valor mais comum. A moda pode não existir, e mesmo que ela exista, pode não ser única. Moda para dados não-agrupados Quando os valores não estão agrupados, para se calcular a moda basta procurar o valor que aparece o maior número de vezes. Exemplos: a) O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18, tem moda 9. b) O conjunto 3, 5, 8, 10, 12, 15, 16, não tem moda e é chamado de amodal. c) O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9, tem duas modas, 4 e 7, e é chamado de bimodal. Moda para dados agrupados a) Sem intervalos de classe Quando os valores estão agrupados sem intervalos de classe, a moda é o valor que apresentar a maior freqüência. Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um ano

xi fi 0 3 1 4 2 7 3 6 ∑= 02

Assim, Mo = 2 viagens.

Page 34: Faetec-Apostila-Estatistica.pdf

33 b) Com intervalos de classe Quando os valores estão agrupados em uma distribuição de freqüências com intervalos de classe, a classe que apresenta a maior freqüência é chamada de classe modal e para se calcular a moda utiliza-se a fórmula de Czuber que é dada por:

*hDD

D*lMo

21

1 ×

++=

onde: Mo = moda; l* = limite inferior da classe modal; D1 = diferença entre a freqüência da classe modal e a da classe imediatamente anterior; D2 = diferença entre a freqüência da classe modal e a da classe imediatamente posterior; h* = amplitude do intervalo de classe modal. Exemplo: Calcule a moda para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio i Peso (em kg) f i 1 46 ├ 50 3 2 50 ├ 54 5 3 54 ├ 58 8 4 58 ├ 62 11 ⇐ Classe modal 5 62 ├ 66 9 6 66 ├ 70 4 ∑= 40

3811D1 =−=

2911D2 =−=

4,604,2585

12584

5

3584

23

358*h

DD

D*lMo

21

1 =+=+=×+=×

++=×

++=

kg4,60Mo =

Page 35: Faetec-Apostila-Estatistica.pdf

34 MEDIANA (Md) A mediana de um conjunto de números, ordenados segundo suas grandezas, é o valor que ocupa a posição central da série de observações ou a média aritmética dos dois valores centrais, ou seja: • Para um número ímpar de observações:

Md x n= +

1

2

• Para um número par de observações:

2

xx

Md1

2

n

2

n

+

+

=

Exemplos: a) O conjunto dos números 4, 3, 10, 4, 5, 8, 8, 6, 8. Ordenando o conjunto, temos: 3, 4, 4, 5, 6, 8, 8, 8, 10.

Como o número de observações é ímpar, a mediana é o valor que está na posição central da série.

6xxxxMd 5

2

10

2

19

2

1n =====

+

+

b) O conjunto dos números 5, 18, 7, 5, 9, 15, 11, 12. Ordenando o conjunto, temos: 5, 5, 7, 9, 11, 12, 15, 18.

Como o número de observações é par, a mediana é dada pela média dos valores centrais da série.

( ) ( )10

2

20

2

119

2

xx

2

xx

2

xx

2

xx

Md 541441

2

8

2

81

2

n

2

n

==+=+

=+

=

+

=

+

= +

+

+

Mediana para dados agrupados a) Sem intervalos de classe Quando os valores estão agrupados sem intervalos de classe, o cálculo da mediana se processa de forma semelhante àquela para dados não agrupados, necessitando, porém, que se calcule primeiramente as freqüências acumuladas.

Page 36: Faetec-Apostila-Estatistica.pdf

35 Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um ano

xi fi Fi 0 3 3 1 4 7 2 7 14 3 6 20 ∑= 02

Como o número de observações é par, a mediana é dada pela média dos valores centrais da

série.

( ) ( )2

2

4

2

22

2

xx

2

xx

2

xx

2

xx

Md 1110110101

2

20

2

201

2

n

2

n

==+=+

=+

=

+

=

+

= +

+

+

viagens2Md =

b) Com intervalos de classe Quando os valores estão agrupados em uma distribuição de freqüências com intervalos de classe, primeiramente, devemos determinar em que intervalo de classe se localiza a mediana. O intervalo de classe que contém a mediana será aquele cuja freqüência acumulada seja

imediatamente superior à 2

f i∑.

Identificado o intervalo de classe que contém a mediana, para o seu cálculo, aplica-se a seguinte fórmula:

( )

*f

*hF2

f

*lMdant

i ×

−+=

onde: Md = mediana; l* = limite inferior da classe da mediana; ∑ if = soma das freqüências (freqüência total);

( )antF = freqüência acumulada até a classe anterior a que contém a mediana;

f* = freqüência da classe da mediana; h* = amplitude do intervalo de classe da mediana.

Page 37: Faetec-Apostila-Estatistica.pdf

36 Exemplo: Calcule a mediana para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio i Peso (em kg) f i Fi 1 46 ├ 50 3 3 2 50 ├ 54 5 8 3 54 ├ 58 8 16 4 58 ├ 62 11 27 ⇐ Classe da mediana 5 62 ├ 66 9 36 6 66 ├ 70 4 40 ∑= 40

202

40

2

f i ==∑ ⇒ Classe da mediana (i = 4).

( ) ( )

455,59455,158

11

1658

11

4458

11

4162058

11

4162

40

58*f

*hF2

f

*lMdant

i

=+=

=+=×+=×−+=×

−+=

×

−+=

kg5,59Md =

POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA Nas distribuições simétricas os valores da média, mediana e moda são iguais. Nas distribuições assimétricas essas medidas de posição são diferentes e quanto maior for a assimetria maior será a diferença.

Se a curva for simétrica as três medidas são iguais, ou seja, X Md Mo= =

Se a curva for assimétrica à direita (Assimetria Positiva): Mo Md X< <

Se a curva for assimétrica à esquerda (Assimetria Negativa): X Md Mo< <

Page 38: Faetec-Apostila-Estatistica.pdf

37 Exercícios: Para cada um dos conjuntos, abaixo relacionados, calcule: a) a média aritmética; b) a moda; c) a mediana. O que se pode dizer sobre a assimetria do conjunto de dados? Conjunto a) 19; 17; 15; 15; 14; 16. Conjunto b)

X i fi 62 1 63 4 64 3 65 2

Total 10 Conjunto c)

Classes fi 46,7 ├ 51,7 5 51,7 ├ 56,7 1 56,7 ├ 61,7 9 61,7 ├ 66,7 3 66,7 ├ 71,7 2

Total 20

Page 39: Faetec-Apostila-Estatistica.pdf

38 UNIDADE 7 – MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE INTRODUÇÃO

As medidas de posição servem para sintetizar um conjunto de valores em poucos valores representativos. Contudo, essas medidas não são suficientes para caracterizar a homogeneidade ou heterogeneidade entre os valores que compõem o conjunto de dados.

Considere os seguintes conjuntos de valores das variáveis X, Y e Z: X: 35, 35, 35, 35, 35, 35. Y: 32, 33, 35, 36, 37, 37. Z: 8, 19, 21, 35, 54, 73.

Calculando a média aritmética para cada uma das variáveis, temos:

n

xX i∑= ⇒ 35

6

210X ==

n

yY i∑= ⇒ 35

6

210Y ==

n

zZ i∑= ⇒ 35

6

210Z ==

Os conjuntos X, Y e Z apresentam a mesma média aritmética, 35. Contudo, observa-se que o

conjunto X é o mais homogêneo pois todos os seus valores são iguais a média aritmética. O conjunto Y é mais homogêneo que o conjunto Z, pois os seus valores estão mais próximos da média aritmética que os valores observados em Z.

Assim, podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. Para medir os graus ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio utilizam-se as medidas de dispersão ou de variabilidade. Existem várias medidas de dispersão ou de variabilidade, sendo as mais comuns a amplitude total, a variância, o desvio padrão e o coeficiente de variação. AMPLITUDE TOTAL Amplitude total para dados não-agrupados A amplitude total de um conjunto é a diferença entre o maior e o menor valor observado.

.)mín(x.)máx(xAT −=

Exemplo: A amplitude total do conjunto 2, 3, 3, 5, 5, 5, 8, 10, 12 é

10212AT =−= Quanto maior for a amplitude total dos valores menor será o grau de concentração dos mesmos. Assim, considerando, novamente, as variáveis X, Y e Z, temos:

X: 35, 35, 35, 35, 35, 35. Y: 32, 33, 35, 36, 37, 37. Z: 8, 19, 21, 35, 54, 73.

Page 40: Faetec-Apostila-Estatistica.pdf

39 Calculando a amplitude total para cada uma das variáveis, temos:

03535ATX =−= (dispersão nula)

53237ATY =−=

65873ATZ =−= Amplitude total para dados agrupados a) Sem intervalos de classe Quando os valores estão agrupados sem intervalos de classe, a amplitude total também será a diferença entre o maior e o menor valor observado.

.)mín(x.)máx(xAT −= Exemplo: Calcule a amplitude total para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um ano

xi fi 0 3 1 4 2 7 3 6 ∑= 02

303AT =−= .

b) Com intervalos de classe Quando os valores estão agrupados em uma distribuição de freqüências com intervalos de classe, a amplitude total é a diferença entre o limite superior do último intervalo de classe e o limite inferior do primeiro intervalo de classe.

.)mín(l.)máx(LAT −=

Page 41: Faetec-Apostila-Estatistica.pdf

40 Exemplo: Calcule a amplitude total para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio i Peso (em kg) f i 1 46 ├ 50 3 2 50 ├ 54 5 3 54 ├ 58 8 4 58 ├ 62 11 5 62 ├ 66 9 6 66 ├ 70 4 ∑= 40

244670AT =−=

DESVIO PADRÃO É a raiz média quadrática dos desvios absolutos das observações em relação a média aritmética. O desvio padrão de um conjunto de n números x1, x2, ..., xn é representado por “s” e definido por:

( )n

Xxs

2i∑ −

=

onde: s = desvio padrão;

ix = os valores da variável;

X = a média aritmética; n = o número de observações.

Page 42: Faetec-Apostila-Estatistica.pdf

41 Desvio padrão para dados não-agrupados Exemplo: Calcular o desvio padrão dos números 2, 8, 3, 6, 11.

Primeiramente, calcula-se a média aritmética: 65

30

5

116382X ==++++=

Aplicando a fórmula:

ix Xx i −−−− (((( ))))2i Xx −−−− 2 -4 16 8 2 4 3 -3 9 6 0 0 11 5 25 ∑= 45

( )286,38,10

5

54

n

Xxs

2i ===

−= ∑

Desvio padrão para dados agrupados a) Sem intervalos de classe Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem com as freqüências f1, f2, ..., fk) o desvio padrão será definido por:

( )n

Xxfs

2ii∑ −

=

Exemplo: Calcule o desvio padrão para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um a

xi fi fixi Xx i −−−− (((( ))))2i Xx −−−− (((( ))))2ii Xxf −−−−

0 3 0 -1,8 3,24 9,72 1 4 4 -0,8 0,64 2,56 2 7 14 0,2 0,04 0,28 3 6 18 1,2 1,44 8,64 ∑= 02 ∑= 36 ∑= 2,12

8,120

36

n

xfX ii === ∑

( )0296,106,1

20

2,21

n

Xxfs

2ii ===

−= ∑

Page 43: Faetec-Apostila-Estatistica.pdf

42 b) Com intervalos de classe Quando os dados são apresentados em uma distribuição de freqüências com intervalos de classe, todos os valores incluídos em um certo intervalo de classes são considerados coincidentes com o ponto médio do intervalo (xi) e o desvio padrão é dado por:

( )n

Xxfs

2ii∑ −

=

Exemplo: Calcule o desvio padrão para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio

i Peso (em kg) fi xi fixi Xx i −−−− (((( ))))2i Xx −−−− (((( ))))2ii Xxf −−−−

1 46 ├ 50 3 48 144 -11 121 363 2 50 ├ 54 5 52 260 -7 49 245 3 54 ├ 58 8 56 448 -3 9 72 4 58 ├ 62 11 60 660 1 1 11 5 62 ├ 66 9 64 576 5 25 225 6 66 ├ 70 4 68 272 9 81 324 ∑= 40 2360∑= 1240∑=

kg5940

2360

n

xfX ii === ∑

( )kg5678,531

40

1240

n

Xxfs

2ii ===

−= ∑

Obs.: Em algumas ocasiões utiliza-se “n - 1” no denominador para o cálculo do desvio padrão, ao invés de “n”, porque o valor que disso resulta representa uma estimativa melhor do desvio padrão da população da qual a amostra foi extraída.

Page 44: Faetec-Apostila-Estatistica.pdf

43 VARIÂNCIA É a média quadrática dos desvios absolutos das observações em relação a média aritmética. A variância de um conjunto de dados é definida como o quadrado do desvio padrão e é representada por “s2”.

( )n

Xxs

2i2 ∑ −

=

onde:

2s = variância;

ix = os valores da variável;

X = a média aritmética; n = o número de observações. Variância para dados não-agrupados Exemplo: Calcular a variância dos números 2, 8, 3, 6, 11.

Primeiramente, calcula-se a média aritmética: 65

30

5

116382X ==++++=

Aplicando a fórmula:

ix Xx i −−−− (((( ))))2i Xx −−−− 2 -4 16 8 2 4 3 -3 9 6 0 0 11 5 25 ∑= 45

( )8,10

5

54

n

Xxs

2i2 ==

−= ∑

Variância para dados agrupados a) Sem intervalos de classe Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem com as freqüências f1, f2, ..., fk) a variância será definida por:

( )n

Xxfs

2ii2 ∑ −

=

Page 45: Faetec-Apostila-Estatistica.pdf

44 Exemplo: Calcule a variância para a distribuição do número de viagens realizadas por 20 famílias no período de um ano.

Número de viagens realizadas por 20 famílias no período de um a

xi fi fixi Xx i −−−− (((( ))))2i Xx −−−− (((( ))))2ii Xxf −−−−

0 3 0 -1,8 3,24 9,72 1 4 4 -0,8 0,64 2,56 2 7 14 0,2 0,04 0,28 3 6 18 1,2 1,44 8,64 ∑= 02 ∑= 36 ∑= 2,12

8,120

36

n

xfX ii === ∑

( )06,1

20

2,21

n

Xxfs

2ii2 ==

−= ∑

b) Com intervalos de classe Quando os dados são apresentados em uma distribuição de freqüências com intervalos de classe, todos os valores incluídos em um certo intervalo de classes são considerados coincidentes com o ponto médio do intervalo (xi) e a variância é dada por:

( )n

Xxfs

2ii2 ∑ −

=

Exemplo: Calcule a variância para a distribuição dos pesos de 40 alunos de um colégio.

Pesos de 40 alunos de um colégio

i Peso (em kg) fi xi fixi Xx i −−−− (((( ))))2i Xx −−−− (((( ))))2ii Xxf −−−−

1 46 ├ 50 3 48 144 -11 121 363 2 50 ├ 54 5 52 260 -7 49 245 3 54 ├ 58 8 56 448 -3 9 72 4 58 ├ 62 11 60 660 1 1 11 5 62 ├ 66 9 64 576 5 25 225 6 66 ├ 70 4 68 272 9 81 324 ∑= 40 2360∑= 1240∑=

kg5940

2360

n

xfX ii === ∑

( ) 22

ii2 kg3140

1240

n

Xxfs ==

−= ∑

Page 46: Faetec-Apostila-Estatistica.pdf

45 Obs.: Sendo a variância uma medida que expressa um desvio quadrático médio, ela pode causar alguns problemas de interpretação. Para evitar isto, costuma-se usar o desvio padrão que é uma medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados. COEFICIENTE DE VARIAÇÃO (CV) O coeficiente de variação é definido como o quociente entre o desvio padrão e a média aritmética. É freqüentemente expresso em porcentagem.

X

sCV =

Esta medida serve para caracterizar a dispersão dos dados em termos relativos a seu valor médio. Exemplo: Calcule o coeficiente de variação para a distribuição dos pesos de 40 alunos de um colégio.

kg59X = e kg5678,5s =

%4,9094,059

5678,5

X

sCV ====

Quando se deseja comparar a dispersão de dois ou mais conjuntos de dados, expressos em unidades diferentes, utiliza-se o coeficiente de variação. Exemplo: Os dados a seguir representam o peso e a altura de um grupo de alunos de um colégio. Em relação à que variável há uma maior dispersão dos dados?

X s Peso 65 kg 7 kg

Altura 168 cm 12 cm

%8,10108,065

7CVPeso ===

%1,7071,0168

12CVAltura ===

Observa-se que nesse grupo os pesos apresentam um maior grau de dispersão que as alturas.

Page 47: Faetec-Apostila-Estatistica.pdf

46 Exercícios: Para cada um dos conjuntos vistos no exercício da unidade 6, abaixo relacionados, calcule: a) a amplitude total; b) a variância; c) o desvio padrão; d) o coeficiente de variação. Conjunto a) 19; 17; 15; 15; 14; 16. Conjunto b)

X i fi 62 1 63 4 64 3 65 2

Total 10 Conjunto c)

Classes fi 46,7 ├ 51,7 5 51,7 ├ 56,7 1 56,7 ├ 61,7 9 61,7 ├ 66,7 3 66,7 ├ 71,7 2

Total 20

Page 48: Faetec-Apostila-Estatistica.pdf

47

APÊNDICE A – Tabela de Números Aleatórios

7 2 1 6 5 9 8 3 0 0 0 4 8 5 1 5 9 1 1 5 5 1 4 2 5 0 5 3 8 9 2 2 3 9 3 0 4 2 2 6 2 6 9 2 5 0 4 3 5 4 5 3 8 1 7 5 6 0 4 6 5 5 2 8 4 8 5 2 3 7 9 3 4 5 9 8 3 5 6 3 9 4 3 0 7 5 7 2 0 4 3 7 7 4 9 1 6 0 0 1 7 5 8 2 8 3 7 0 3 0 3 3 2 0 3 3 9 8 8 5 4 5 8 3 3 8 1 5 5 0 0 9 0 3 3 3 4 9 3 3 0 2 7 9 3 4 2 5 8 8 9 9 3 6 4 2 5 1 3 9 0 4 4 3 2 5 0 7 8 3 8 7 6 4 0 0 7 7 9 4 3 7 2 9 2 8 2 6 9 8 6 2 6 6 7 9 5 1 0 9 8 7 2 8 2 3 2 1 9 7 8 2 0 4 0 6 3 4 5 7 6 4 5 5 5 5 5 9 1 2 3 8 4 0 1 1 3 2 3 5 8 1 1 1 2 6 7 9 1 8 3 2 8 0 8 7 5 7 0 5 1 7 2 8 4 2 7 6 6 9 1 9 0 2 2 1 3 5 7 3 1 1 5 2 0 4 6 0 9 7 4 5 3 3 9 2 2 3 2 6 3 9 9 2 6 6 9 6 2 2 7 2 4 8 9 4 7 8 9 9 7 5 3 9 4 4 4 0 5 2 0 2 3 1 4 9 7 2 5 0 8 6 9 7 0 6 8 5 7 6 2 9 1 9 4 2 4 1 3 9 9 9 2 6 6 0 7 6 1 5 9 6 1 4 8 8 5 8 8 6 0 0 5 0 8 1 3 7 5 2 9 4 6 1 8 3 1 4 4 3 9 7 9 4 7 4 5 7 0 7 7 7 6 5 0 0 4 0 9 2 1 5 7 6 6 8 7 6 9 1 0 6 4 3 3 0 5 5 7 1 4 8 8 7 9 4 7 0 9 9 7 0 9 7 2 2 6 2 3 8 3 1 5 4 6 4 1 5 6 2 1 0 7 5 8 9 3 1 6 2 3 1 2 4 4 2 4 4 0 8 3 7 6 8 1 5 4 5 5 1 9 8 5 0 5 8 6 4 8 4 2 7 7 6 6 4 1 0 8 1 6 5 5 5 9 0 7 8 9 0 6 1 5 8 7 7 4 1 0 5 8 4 2 9 9 5 9 9 0 3 0 2 2 2 0 4 2 6 6 7 0 8 6 2 4 6 0 4 4 4 1 2 6 5 3 4 2 5 7 5 1 8 8 6 4 5 1 3 5 0 6 2 1 6 3 4 5 4 9 3 5 3 8 1 6 0 7 8 9 8 6 8 4 3 7 6 7 6 5 6 5 8 0 8 9 8 6 4 4 0 9 1 3 7 3 2 6 0 6 4 5 4 8 8 9 4 4 0 3 7 7 0 8 7 7 3 4 1 5 8 4 5 2 0 7 8 0 9 1 4 1 9 8 6 0 6 8 1 2 9 4 1 4 0 1 7 7 2 6 0 0 0 7 2 9 2 5 5 2 3 3 1 9 8 1 0 6 9 5 7 2 4 6 9 5 0 9 1 9 5 3 2 1 2 7 8 1 8 8 4 8 4 3 6 1 0 0 2 6 8 9 3 6 2 4 1 2 2 1 3 1 2 7 0 0 2 2 0 4 9 1 8 4 4 8 4 4 2 7 9 9 7 0 8 6 0 4 6 1 5 5 4 3 4 7 9 1 7 3 4 9 8 0 2 3 1 7 0 9 7 5 1 7 6 0 7 6 2 8 7 4 4 2 0 1 8 6 8 7 5 9 5 0 3 2 6 5 2 7 1 4 9 9 6 6 7 8 1 7 1 5 1 2 6 0 9 5 6 6 9 9 7 4 9 3 8 8 4 2 7 8 6 5 2 7 1 5 7 8 4 6 9 6 8 0 0 5 8 0 7 1 3 0 5 6 1 7 5 5 8 7 0 4 0 1 1 8 3 7 1 2 0 8 8 3 0 9 8 9 5 9 5 1 2 2 5 0 1 1 3 8 7 8 8 7 7 0 0 9 4 5 7 8 4 4 7 6 5 2 9 4 0 9 2 8 2 5 4 3 2 3 5 4 5 2 3 2 5 3 9 9 0 8 9 2 6 5 0 2 3 6 2 4 0 1 1 1 9 0 8 6 4 8 8 0 5 0 3 6 3 4 4 7 9 6 4 3 9 2 5 4 7 3 7 5 7 5 0 8 4 2 0 3 3 0 1 3 5 2 0 6 2 8 8 8 3 5 8 0 4 6 4 1 5 2 2 0 6 1 2 1 8 7 7 9 5 9 9 9 2 1 1 0 0 3 1 4 2 4 6 1 5 4 8 6 5 4 4 3 4 9 6 4 6 5 3 7 0 0 2 0 3 2 3 1 6 2 9 0 1 8 8 1 2 5 3 8 7 5 7 8 1 5 7 5 2 5 8 7 6 0 8 4 1 9 5 7 9 6 6 4 8 6 5 5 9 0 6 1 0 2 7 1 4 6 1 0 8 9 1 8 4 0 2 8 2 8 7 0 9 8 3 0 2 7 9 1 6 1 0 3 3 9 8 0 1 2 9 4 1 9 7 5 9 7 8 4 3 1 2 1 9 0 4 4 4 8 1 4 7 1 8 2 8 0 9 6 8 8 7 5 5 7 1 5 4 6 1 4 6 1 7 4 0 3 5 7 8 3 1 1 4 9 5 8 2 8 7 4 8 7 3 3 3 0 0 4 3 3 5 6 0 1 4 0 1 1 6 8 5 9 5 8 0 9 1 2 5 9 9 7 8 4 8 7 1 0 4 9 1 5 5 8 5 3 9 6 2 8 5 9 4 2 9 4 3 1 1 0 7 2 3 9 4 2 9 6 0 5 6 6 0 1 0 1 8 5 8 6 5 7 5 8 1 4 7 3 3 2 6 3 8 7 8 6 4 0 7 9 7 3 1 8 3 0 3 9 0 6 3 4 6 1 2 1 1 0 1 5 8 5 6 1 3 5 9 8 1 9 3 0 5 4 5 2 9 9 6 9 9 0 8 3 5 1 3 5 5 2 0 7 1 5 5 8 4 7 9 1 2 1 2 0 3 6 5 0 0 7 9 0 7 9 2 1 7 8 7 1 4 0 7 9 7 4 1 5 6 5 8 5 5 3 0 8 4 5 1 0 3 8 7 3 4 8 7 5 6 4 0 3 7 2 8 1 2 1 6 0 8 3 1 6 7 2 0 2 6 1 5 3 3 7 9 0 4 2 8 2 4 2 7 0 8 6 8 8 3 4 4 4 2 4 6 8 9 1 4 9 7 4 7 5 9 5 8 1 4 5 9 6 8 6 8 4 3 9 2 0 4 7 1 6 6 9 9 7 8 1 9 7 1 6 0 8 3 7 2 7 2 6 6 4 0 8 4 0 4 1 9 4 0 8 7 3 5 9 2 5 5 9 4 0 4 9 6 7 6 3 9 6 4 4 0 7 4 9 0 3 1 6 3 8 6 0 3 9 3 3 6 4 0 8 9 2 4 0 3 6 8 8 3 2 8 1 8 8 2 1 9 5 7 7 5 1 0 0 4 0 7 8 3 7 3 5 9 2 1 0 0 6 4 2 3 3 0 9 5 4 2 0 8 8 7 2 8 6 7 4 7 2 1 2 2 0 9 1 8 2 7 7 5 1 3 3 1 9 6 3 4 9 5 7 8 5 9 9 8 5 7 1 2 1 9 4 9 7 9 6 8 8 8 0 6 2 9 9 5 8 3 9 3 7 6 4 4 0 2 5 6 5 2 6 7 7 2 3 7 0 9 3 9 2 8 1 1 8 9 4 5 5 4 8 6 6 0 8 6 4 7 1 4 0 1 7 4 2 4 5 0 8 9 9 8 5 1 5 5 2 0 1 2 4 4 5 2 7 5 4 5 6 3 7