apostila de estatística 2012

24
 1 Alguns Conceitos Necessários ao Estudo da Estatística Razão, Proporção e Porcentagem a) Razão e proporção Ex. Vamos supor que foram entrevistados 150 pessoas de uma região e foram obtidos os seguintes resultados, sobre a preferência por três programas de jornal: Programa de Jornal No. de pessoas que assistem A 90 B 40 C 20 Total 150 A razão 150 90 indica que a cada 150 entrevistados, 90 preferem o jornal A, ou seja, por uma simplificação da fração, a cada 5 entrevistados, 3 preferem o jornal A. Esta fração expressa assim, uma comparação entre o número de pessoas que preferem o  jornal A e o número total de entrevistados.  Proporção é a igualdade entre duas razões. 150 90 = 5 3 15 9  Mantida esta proporção, em 300 entrevistados, quantos dirão que preferem o  jornal A? Obs: Não esquecer de verificar se as grandezas são diretamente proporcionais ou inversamente proporcionais. b) Porcentagem: quando uma razão é expressa por uma fração centesimal (denominador igual a 100) Ex.: Um cartaz diz: “Liquidação! Descontos de 40%”, isso significa que em cada R$ 100,00 do preço houve redução de R$ 40,00. A razão estabelecida é 40/100. Índice, Coeficiente e Taxa Para a comparação entre duas grandezas, podemos estabelecer uma razão entre elas. Algumas dessas razões têm uso bastante significativo na Estatística.  Índice: usado para medir quantitativamente variações ocorridas ao longo do tempo. É usada por vários profissionais para comparar grupos de variáveis relacionadas entre si e obter um quadro simples e resumido das mudanças significativas em áreas relacionadas, como preços de matérias-primas, preços de produtos acabados, volume físico de produto etc. Mediante o emprego de índices, é possível estabelecer comparações entre lugares; diferenças entre categorias semelhantes, tais como produtos, pessoas, organizações etc. Ex.: QI = idade mental / idade cronológica

Transcript of apostila de estatística 2012

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 1/24

 

 

1

Alguns Conceitos Necessários ao Estudo da Estatística

Razão, Proporção e Porcentagem

a)  Razão e proporção

Ex. Vamos supor que foram entrevistados 150 pessoas de uma região e foram obtidos osseguintes resultados, sobre a preferência por três programas de jornal:

Programa de Jornal No. de pessoas que assistemA 90B 40C 20

Total 150

A razão 150

90

indica que a cada 150 entrevistados, 90 preferem o jornal A, ouseja, por uma simplificação da fração, a cada 5 entrevistados, 3 preferem o jornal A.Esta fração expressa assim, uma comparação entre o número de pessoas que preferem o

 jornal A e o número total de entrevistados.

 Proporção é a igualdade entre duas razões.

150

90=

5

3

15

9  

Mantida esta proporção, em 300 entrevistados, quantos dirão que preferem o jornal A?

Obs: Não esquecer de verificar se as grandezas são diretamente proporcionais ouinversamente proporcionais.

b)  Porcentagem: quando uma razão é expressa por uma fração centesimal(denominador igual a 100)

Ex.: Um cartaz diz: “Liquidação! Descontos de 40%”, isso significa que em cada R$100,00 do preço houve redução de R$ 40,00. A razão estabelecida é 40/100.

Índice, Coeficiente e TaxaPara a comparação entre duas grandezas, podemos estabelecer uma razão entre

elas. Algumas dessas razões têm uso bastante significativo na Estatística.

  Índice: usado para medir quantitativamente variações ocorridas ao longo dotempo. É usada por vários profissionais para comparar grupos de variáveisrelacionadas entre si e obter um quadro simples e resumido das mudançassignificativas em áreas relacionadas, como preços de matérias-primas, preços deprodutos acabados, volume físico de produto etc. Mediante o emprego deíndices, é possível estabelecer comparações entre lugares; diferenças entre

categorias semelhantes, tais como produtos, pessoas, organizações etc.Ex.: QI = idade mental / idade cronológica

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 2/24

 

 

2

Densidade Demográfica = população total / superfície total

  Coeficiente: medida obtida pela comparação entre duas quantidades queexpressam uma mesma grandeza (relação parte/todo). Por exemplo, umcoeficiente determinado pela razão entre o número de observações de um

determinado fato estatístico e o número total considerado para as possibilidadesde ocorrências desse fato.

Ex.: Coeficiente de mortalidade = números de óbitos / população totalCoeficiente de aproveitamento escolar = número de aprovados / total de alunos

  Taxa: um tipo de razão que é expressa em frações cujo denominador é umapotência de 10, como, por exemplo, uma porcentagem.

Ex. número de óbitos = 80.080População total = 520.000

Taxa de mortalidade =

ExercíciosTabela 1 Dados relativos às cidades de Sorocaba, São Paulo e Porto Feliz

Cidade População ÁreaSorocaba 578068 hab. 456 km2 São Paulo 10434252 hab. 1525 km2 Porto Feliz 45515 hab. 558 km2 

Considere os dados da tabela acima e responda:a)  O que é densidade demográfica?b)  Qual é a densidade demográfica dessas cidades? Comente.c)  Esses números representam uma taxa, um índice ou um coeficiente?d)  Qual é a taxa de desempenho turístico de Sorocaba, sabendo-se que a cidade tem

2500 leitos?

2. Considerando que em uma região: População = 1 784 327 habitantes; Superfície =137 420 km2; Nascimento em 1 ano = 42 327 nascidos vivos; Mortes em 1 ano = 16 230óbitos.Calcular:

a)  Coeficiente de natalidade e taxa de natalidade (por mil habitantes)b)  Coeficiente de mortalidade e taxa de mortalidade (por dez mil habitantes)c)  Índice da densidade demográfica.

Critérios de Arredondamento

  Se o primeiro algarismo a ser abandonado for menor ou igual a 4, o último apermanecer fica inalterado.

  Se o primeiro algarismo a ser abandonado for maior ou igual a 5, o último apermanecer é acrescido de uma unidade.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 3/24

 

 

3

Somatório

Para indicar a soma de todos os valores atribuídos a uma variável em estudo, écomum utilizar a letra grega sigma maiúscula , que significa soma. Por exemplo, sequisermos representar a soma do quadrado de três termos de uma seqüência, podemos

escrever:

3

1

2

3

2

2

2

1

2

i

i x x x x  

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 4/24

 

 

4

COMO AS IDÉIAS ESTATÍSTICAS PODEM SER ABORDADAS

Ao longo da história da civilização, por interesse político, militar, econômico ou

social, encontramos muitos exemplos da utilização de idéias de caráter estatístico,

como, por exemplo, os recenseamentos ordenados na antiguidade romana.

Atualmente, são muitas as empresas que estão investindo em capacitação como

meio de se manter competitivas no mercado. Uma saída para elas é criar um

departamento de projetos. Nesse departamento, além dos conhecimentos específicos da

atividade-fim e da criatividade, têm grande importância informações capturadas em

pesquisas de mercado, nas quais a Estatística é o ponto de partida de muitas ações.

Com o desenvolvimento de ferramentas mais adequadas de análise de dados, nos

dias de hoje, torna-se cada vez mais relevante o papel da Estatística em praticamente

todas as áreas do conhecimento. Ela é ferramenta fundamental na interpretação e análise

de dados, fornece elementos de controle, gestão e melhoria constante de processos e

serviços.

Iniciamos por um breve levantamento sobre a definição de Estatística encontrada

em alguns livros.

Começamos por Magalhães e Lima (2004, p. 1), que traduzem a Estatística

como  “um conjunto de técnicas que permite, de forma sistemática, organizar,

  descrever, analisar e interpretar dados oriundos de estudos ou experimentos,

realizados em qualquer área do conhecimento” .

De forma simples, Martins e Donaire (1990, p. 17) sugerem a definição de Dugé

de Bernonville: “Estatística é um conjunto de métodos e processos quantitativos que

 serve para estudar e medir os fenômenos coletivos”  . 

Porém Novaes e Coutinho (2009) apresentam uma definição que se aproxima da

forma como a Estatística deve ser empregada pelos diversos profissionais, que é adefinição dada por Barnett: “Estatística é o estudo de como a infor  mação deveria ser

empregada para reflexão e ação em uma situação prática envolvendo incerteza”  , isto

é, as autoras consideram a Estatística como sendo a ciência que abarca o número em

contexto, que é de fundamental importância para analisar o resultado de um problema.

Para muitas pessoas, a Estatística traz à lembrança a idéia de números e censo. A

Estatística trata, indubitavelmente, de contagem e de medições, mas Estatística não é

apenas um “monte” de números; é sim um conjunto de técnicas e métodos de pesquisaque entre outros tópicos envolve o planejamento do experimento a ser realizado, a

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 5/24

 

 

5

coleta qualificada dos dados, a descrição, o processamento e análise das informações e

serve de base de apoio para decisões nas mais variadas áreas.

A IMPORTÂNCIA DA ESTATÍSTICA PARA AS DIVERSAS ÁREAS

  O número de defeitos ou porcentagem de peças defeituosas.

  O custo médio de produção.

  A freqüência média de acidentes de trabalho;

  A expectativa de duração dos equipamentos;

  Conhecer o perfil e hábitos dos clientes;

  Possíveis sazonalidades no consumo do produto;

  Pesquisa de demanda;

  Identificar carências e potencialidades de uma região;

  Média de venda.

A Estatística se divide em Descritiva e Inferencial, passando pela Teoria de

Probabilidades como elemento de ligação entre as duas.

 Descritiva: é aquela na qual se faz, desde o planejamento da pesquisa, a

execução da coleta dos dados, a organização dos mesmos em representações diversas,

tais como: tabelas, gráficos, medidas-resumo.

 Inferencial : quando se quer inferir fatos acerca da população, a partir do estudo

de uma parte significativa dessa população (amostra).

 Etapas da Pesquisa:

  Definição do Objetivo e Questão de pesquisa;

  Definição da variável;

Um conceito importante é o de variável estatística, que é a característica que se

quer observar dos elementos de um conjunto (população / amostra), ou melhor, é uma

função que associa a cada resultado do meu fenômeno um valor, portanto essa função

que é variável.

Uma variável pode representar características de diversos tipos, depende do que

queremos observar. Coutinho (2009) exemplifica: “num grupo de turistas que

escolheram o dito pacote aéreo, podemos querer observar não apenas o estado civil, mas

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 6/24

 

 

6

também o grau de escolaridade, a idade, o número de pessoas que moram na mesma

residência etc”. Perceber essas diferenças existentes entre essas categorias de variáveis

são importantes, pois auxiliarão na definição das formas com as quais os dados

estatísticos relativos a essas variáveis serão tratados.

A variável Qualitativa revela certo tipo de característica relacionada ao grupo

pesquisado, que não pode ser mensurada numericamente, como, por exemplo, gênero

(masculino ou feminino), alimentos arrecadados na campanha solidária, grau de

satisfação, etc. Estas variáveis podem ainda ser identificadas em subcategorias: nominal  

ou ordinal .

Segue a definição dada por Coutinho (2009, p. 24):

Uma variável qualitativa se diz nominal quando não se pode

estabelecer uma relação de ordem ou de hierarquia entre os possíveis valoresa serem assumidos pela variável. Exemplo: cor dos olhos. O mesmo nãoocorre com a variável qualitativa ordinal, que permite que se estabeleça umahierarquia coerente ou uma relação de ordem entre os valores assumidos.Exemplos: os níveis de escolaridade, o grau de satisfação dos clientes de umrestaurante, o grau de aceitação expresso em uma escala (concordoplenamente, concordo, discordo, discordo plenamente, etc).

Já as variáveis quantitativas podem ser mensuradas numericamente, tal como a

idade, o número de pessoas que moram em uma mesma residência etc. Ela pode ser

 discreta ou contínua. Segue as definições dada por Coutinho (2009):

  As variáveis quantitativas discretas são aquelas que o conjunto devalores que ela assume admite unidade mínima, indivisível (notas dealunos (0,01 ou 0,1)) ou é oriundo de uma contagem, ou seja, entre doisvalores consecutivos da variável não podemos inserir nenhum outrovalor. Exemplo: número de alunos da classe X, número de pessoas nasfamílias de uma determinada cidade, quantidade de livros da bibliotecada escola, salários (contagem em números de salários mínimos oumesmo contagem de R$ 0,01 em R$ 0,01  –  o centavo é a unidademínima do Real, pois entre R$ 0,01 e R$ 0,02 não podemos inserirnenhum outro valor, oficialmente).

  As variáveis quantitativas contínuas assumem valores em intervalos dosnúmeros reais e, geralmente, não é possível enumerar todos os valores.

Em outras palavras, entre dois valores consecutivos, sempre podemosinserir um novo valor. Exemplo: o peso e a altura dos alunos da classe,lucro das empresas e a idade (medida de tempo que não tem unidademínima).

Existem algumas dificuldades para se distinguir entre uma grandeza discreta e

uma contínua, por exemplo, o tempo é considerado uma variável quantitativa contínua,

porém podemos dar a esta um tratamento de discreta de acordo com a mensuração.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 7/24

 

 

7

Exercício

Classifique, justificando, as variáveis envolvidas em cada uma das questões propostasna pesquisa abaixo, que contém parte do questionário sobre a análise da atuação doprofissional de turismo, realizada com profissionais que trabalhavam em agências

ligadas ao ecoturismo de São Paulo.

1. Gênero:( ) Feminino( ) MasculinoResp.:

2. Qual a sua faixa etária?( ) [18;24[( ) [24;30[

( ) [30;36[( ) [36;42[( ) 42 ou maisResp.:

3. Responda com base na seguinte escala:I - muito importanteII – importanteIII – pouco importanteIV – Não é importante( ) grau de importância do turismo no Brasil( ) a importância do bacharel em turismo no BrasilResp.:

4. O turismo é uma atividade: (assinale apenas uma alternativa)( ) Social( ) Cultural( ) De lazer( ) EconômicaResp.:

5. Assinale a alternativa que corresponde ao número aproximado de horas que vocêtrabalha por dia:( ) até 4 horas( ) 6 horas( ) 8 horas( ) Mais de 8 horasResp.:

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 8/24

 

 

8

  Definição da amostra ou população;

Analisaremos a diferença entre população e amostra.

Para Magalhães e Lima (2004), população é um conjunto de dados que contém a

característica que temos interesse. População refere-se não somente a uma coleção de

indivíduos, mas também ao alvo sobre o qual reside nosso interesse. Por exemplo, uma

empresa deseja controlar sua produção, e para isso faz um levantamento do total

de peças produzidas durante o período de 12 meses consecutivos, quanto ao total

produzido por cada um dos seus setores. Nesse caso, a população é formada pelo

conjunto a ser observado, ou seja, o conjunto de setores da empresa. Caso o

objetivo fosse observar a presença ou não de defeitos nas peças, a população seria o

conjunto formado por todas as peças produzidas nessa empresa.

Tendo-se em vista as dificuldades de várias naturezas (custo, tempo etc) para se

observar todos os elementos da população, toma-se alguns deles para formar um grupo

a ser estudado. Este subconjunto da população, com dimensão sensivelmente menor e

finita, é denominado amostra.

Exemplo: Nos ensaios destrutivos, como no caso da indústria automobilística,

que deseja medir a capacidade de impacto que o para-choque pode suportar, não irá

testar todos os carros ali produzidos. Faz-se necessário limitar as observações a uma

parte da população, ou seja, uma amostra.

   Amostragem

Amostragem é o processo de fixar critérios para a composição de uma amostra

que tenha representatividade necessária no estudo em questão. O critério escolhido deve

garantir que todos os elementos da população tenham a mesma probabilidade de serem

sorteados.Tipos de amostragem:

  Aleatória simples; 

  Estratificada. 

Aleatória simples: quando todos os elementos da população têm a mesma

probabilidade igual a 1/N de ser escolhidos.

Exemplo: Suponha que o litoral norte de São Paulo possua 120 hotéis cinco estrelas.

Selecione uma amostra de 10% desses hotéis para conhecer os preços das diáriaspraticadas nos mesmos.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 9/24

 

 

9

* No excel digitar =aleatório()*120 (trará 12 possibilidades de visitas)

Amostra Estratificada: dividimos a população de N indivíduos em K subpopulações

ou estratos, atendendo a critérios que podem ser importantes para o estudo, por

exemplo, homens e mulheres, classe social, anos de escolaridade, renda mensal etc.

Dentro de cada estrato, fazemos amostras aleatórias simples.

Exemplo 2: Supondo agora que desses 120 hotéis, 16 estão em Caraguatatuba, 34 em

São Sebastião e 70 em Ubatuba.

Fazer...

Começa-se por determinar a proporção necessária.

São muitas as situações em que separar a população em estratos aumenta a

representatividade da amostra, pois a variável em estudo pode apresentar um

comportamento diferente de um estrato para o outro.

Amostra sistemática: quando os elementos da população estão ordenados em uma

lista. Saltando elementos de k em k, a partir de m, considerando que ela é circular.

Amostra por conglomerado: quando fazemos um estudo sobre os habitantes de uma

cidade, a amostra aleatória pode ter um custo muito alto, já que estudar uma amostra de

tamanho n implica enviar os entrevistadores a n pontos da cidade, de forma que em cada

ponto só se realiza uma entrevista. Neste caso é mais econômico fazer a denominada

“amostra por conglomerado”, que consiste em eleger aleatoriamente certos bairros da

cidade, para depois eleger aleatoriamente, ruas e edifícios. Uma vez escolhido umedifício, faz-se entrevista com todos os vizinhos.

O tamanho da amostra (número de pessoas que devem ser consultadas) e a

técnica de amostragem utilizada dependem muito mais de dois parâmetros estatísticos

do que do tamanho da população: a margem de erro e o nível de confiança.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 10/24

 

 

10

Cálculo do tamanho da amostra:

Existem numerosos procedimentos estatísticos, algoritmos e softwares (Sample

Size Calculator) para o cálculo do tamanho da amostra. Quando o problema a ser

estudado na pesquisa se refere a uma proporção (maioria das situações de pesquisa de

opinião), existe uma fórmula que permite calcular o tamanho n da amostra em função da

margem de erro e com um nível de confiança de 95%:

(I) 

2

96,1

1

 

  

 

e

 p pn  

  O valor 1,96 é obtido na tabela da curva normal, para um nível de confiança de

95%.

  p é a proporção de indivíduos da população que apresentam a característica que

está sendo medida.

Quando não se conhece p, damos a ele o valor estimado 0,5, e a fórmula se reduz a:

(II) 2

96,1

25,0

 

  

 

en  

Valores obtidos na tabela da curva normal de acordo com o nível de confiança:

NÍVEL DE CONFIANÇA VALORES NA TABELA DA CURVA

NORMAL

90 1,64

95 1,96

99 2,58

Exemplo: Em uma pesquisa eleitoral para presidente, a disputa entre os candidatosestá acirrada e difícil. Queremos trabalhar com um erro máximo de 1 ponto (1%) a um

nível de confiança de 95%. Quantas pessoas devem ser entrevistadas?

Não conhecemos p. Usando (II), temos:

 

  

 

2

96,1

01,0

25,0n

200051,0

25,0n =

00002601,0

25,0n 9.611 pessoas

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 11/24

 

 

11

Exercícios:

1)  Repitam os cálculos dos tamanhos das amostras na situação do exemplo anterior

com margens de erro de 0,5%, 2% e de 3%.

2)  Determine a margem de erro de uma pesquisa com uma amostra de tamanho

150.

3)  Em uma pesquisa eleitoral, queremos trabalhar com um erro máximo de 1 ponto

(1%). Quantas pessoas devem ser entrevistadas se considerarmos o nível de

confiança igual a:

a.  90%

b.  99%

4)  Em uma localidade no Marrocos, aproximadamente 30% das crianças sofriam de

má nutrição crônica. Esse percentual é resultado das estatísticas nacionais sobrea desnutrição no meio rural do Marrocos. Para realizar uma pesquisa com a

população de crianças mal nutridas, qual deve ser o tamanho da amostra para um

nível de confiança de 95% e margem de erro de 5%?

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 12/24

 

 

12

 Formas de coleta de dados:

  Observação direta

  Entrevista

  Auto-entrevista

Organização dos dados

O conjunto de valores assumidos por uma variável estatística pode ser

representado por uma listagem simples, que respeite apenas a ordem de coleta. É o que

chamamos de “conjunto de Dados Brutos”. Se alguma ordenação é feita (variáveis

ordinais ou quantitativas), o conjunto aí representado chama-se Rol ou série de Rol.

Outra forma possível de organização dos dados se faz por uma “Distribuição de

freqüências”. 

Uma distribuição de freqüências é uma função empírica que associa, a cada

valor assumido pela variável, o número de vezes que esse valor é observado, ou seja, a

freqüência absoluta desses valores. Ela é usualmente representada por uma tabela ou por

um gráfico, sendo que cada tipo de variável e o objetivo da análise dos dados podem

determinar a melhor representação. As freqüências também podem ser expressas em

  porcentagens, ao que chamamos “freqüência relativa”, que indica as porcentagens

observadas no conjunto de dados estudado.

Para representar uma distribuição de freqüência por meio de uma tabela, existem

normas pelas quais deve constar o título (que descreva o que a tabela representa), o

cabeçalho, o corpo, rodapé e fonte, conforme o exemplo a seguir:

Questionário Questão aberta Questão fechada

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 13/24

 

 

13

Tabela X: Distribuição dos 120 alunos da Escola Z segundo as matériaspreferidas, 2009.

Matérias preferidasNúmero de alunos

(fi) (%)

Português 15 12,50

Matemática 12 10,00

Ciências 13 10,83

Inglês 10 8,33

Educação Física 29 24,17Artes 13 10,83

História 11 9,17

Geografia 17 14,17

TOTAL 120 100

Fonte: Dados fictícios

Esquema 1: Ilustração dos elementos de uma Tabela de Distribuição de

Freqüências

Ainda segundo as normas vigentes da ABNT, uma tabela deve possuir traços

horizontais separando o cabeçalho, sem linhas de separação de dados e podem possuir

traços verticais separando as colunas de dados, sem fechamento lateral.

Além da organização dos dados em forma de tabelas, como foi investigado

anteriormente, podemos apresentar informações por meio de gráficos.

Título da tabela: numerado seqüencialmente. Deve indicar aoleitor o que a tabela representa: o quê, onde e quando.

Cabeçalho: descreve o conteúdo do corpo da tabela. Geralmente, naprimeira coluna encontramos a variável observada e nas colunasseguintes as freqüências associadas a cada valor da variável (fi indicao número de vezes que tal valor foi observado e % indica esse númerore resentado em orcenta em .

Corpo da Tabela: descreve cada valor assumido pela variável, assimcomo as respectivas freqüências (absolutas e ou relativas oupercentuais).

Rodapé: devemos colocar legenda e fonte.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 14/24

 

 

14

DISTRIBUIÇÃO DE FREQUENCIAS

É uma série estatística específica, onde os dados encontram-se dispostos emclasses ou categorias juntamente com as freqüências correspondentes.

- Variável Discreta: pode-se enumerar todos os possíveis valores.

Exemplo: X= número de erros por página observados em um livro de matemática  –  2009

No. de erros (Xi) No. de páginas (Fi)0 351 202 133 64 4

5 280

Xi = identifica as categorias em que o fato se subdivide.Fi = Corresponde a freqüência absoluta, isto é, o número de vezes que cada uma dascategorias ocorre.N = soma dos Fi = total de elementos observados na população.n = soma dos Fi = total de elementos observados na amostra.

- Variável Contínua: a variável assume valores em intervalos da reta real, não é possívelenumerar todos os valores.

Exercício: As notas de 32 estudantes de uma classe estão descritos abaixo:

6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,08,0 7,0 8,5 6,0 4,5 0,0 6,5 6,02,0 5,0 5,5 5,0 7,0 1,5 5,0 5,04,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5

Então a distribuição de freqüência será expressa pela tabela:

Notas Fi[0;2[[2;4[[4;6[[6;8[[8;10[

32

Para explicar a colocação das notas dos alunos necessitaremos de algumasdefinições:

Dados Brutos: Aqueles que não foram numericamente organizados.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 15/24

 

 

15

Rol: é o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.Portanto, teríamos:

Limites de classe: São os números extremos de cada classe; sendo assim, temos umlimite inferior e um superior.Ex.:

Intervalo de classe:

Amplitude Total: É a diferença entre o maior valor e o menor dado. Em nosso caso, anota maior é e a menor é ; logo, nossa amplitude total é

Ponto Médio das Classes (Xi): média aritmética entre os limites inferior e superior daclasse i.

  Número de classes (K): quantas classes serão necessárias para representar ofato? Existem vários critérios que podem ser utilizados a fim de possuirmos umaidéia do melhor número de classes, porém tais critérios servirão apenas como

indicação e nunca como regra fixa, pois caberá sempre ao pesquisadorestabelecer o melhor número, levando-se em conta o intervalo de classe e afacilidade para os posteriores cálculos numéricos.

Assim, podemos citar o critério que leva em consideração:

No. de elementosobservados

Número de classes (k)Mínimo máximo

Até 50 5 1051 a 100 8 16101 a 200 10 20

201 a 300 12 24301 a 500 15 30Mais de 500 20 40

  Fórmula de Sturges: K = no. de classes = 1 + 3,3.logN, onde N é o número deelementos observados.

Voltando ao exemplo acima, teríamos:

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 16/24

 

 

16

Para verificar o Intervalo de classe devemos calcular:classesno

amplitudeh

.  

Freqüência absoluta (Fi): quantidade de elementos que pertencem à classe i.

Freqüência Relativa da Classe (fi):n

Fi fi  

Observe: 100.fi = %Freqüência Acumulada: corresponde à soma de freqüências de determinada classe comas anteriores

Exercício: As notas de 32 estudantes de uma classe estão descritos abaixo:

6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,08,0 7,0 8,5 6,0 4,5 0,0 6,5 6,0

2,0 5,0 5,5 5,0 7,0 1,5 5,0 5,04,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5Com referência a esses dados, determinar:

a)  O rol.b)  A distribuição de freqüência (calcular o intervalo de classes)c)  A maior e a menor nota.d)  A amplitude total.e)  Qual a porcentagem dos alunos que tiraram nota menor do que 4.f)  Qual o limite superior da 2ª. classe.g)  Qual o ponto médio da 3ª. classe.h)  Colocar a freqüência acumulada.

i)  Construir um histograma de freqüências simples. j)  Construir a curva de freqüência acumulada crescente.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 17/24

 

 

17

Tabela 1.1 Valor das diárias, idade, intenção de retorno e grau desatisfação de 40 turistas que visitaram uma determinada região

identificaçãovalor da Diária

(R$)Idade(anos) Retorno

Grau desatisfação

1 80 53 sim 42 80 23 sim 43 96 30 sim 34 80 48 sim 45 210 42 sim 46 96 40 não 37 96 14 sim 28 80 32 sim 39 80 52 sim 410 80 17 sim 311 210 51 não 312 145 48 sim 413 210 45 não 414 96 49 sim 215 96 38 sim 216 210 62 sim 317 145 41 sim 418 80 47 não 419 80 50 não 420 96 52 não 421 210 55 não 3

22 80 63 não 323 145 66 sim 324 96 54 sim 425 80 62 sim 326 80 60 sim 427 96 27 sim 428 80 42 sim 229 145 51 não 330 80 37 não 431 80 43 não 432 80 15 sim 4

33 96 42 sim 334 145 28 sim 335 80 48 não 336 96 49 sim 237 80 40 sim 338 210 39 sim 439 210 48 sim 440 80 62 sim 4

Identifique uma distribuição de freqüência para cada uma das variáveis que podem ser

observadas na Tabela acima. Para cada uma delas, classifique-as e calcule as respectivas

freqüências relativas.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 18/24

 

 

18

Representação gráfica (arquivo anexo)

Atividade sobre distribuição de freqüências e sua representação gráfica.

1)  Uma pesquisa com usuários de transporte coletivo na cidade de São Pauloindagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentreônibus, metro e trem, o número de diferentes meios de transporte utilizados foi oseguinte: 2, 3, 2, 1, 2, 1, 2,1,2, 3, 1,1,1,2,2,3,1,1,1,1,2,1,1,2,2,1,2,1,2,3.

a.  Organize uma tabela de freqüência.b.  Faça uma representação gráfica.c.  Admitindo que essa amostra represente bem o comportamento do usuário

paulistano, você acha que a porcentagem dos usuários que utilizam maisde um tipo de transporte é grande.

2)  Um questionário foi aplicado aos dez funcionários do setor de contabilidade deuma empresa fornecendo os dados apresentados no quadro.

Funcionário Curso (completo) Idade Salário (R$) Anos de Empresa1 Superior 34 1100,00 52 Superior 43 1450,00 83 médio 31 960,00 64 médio 37 960,00 85 Médio 24 600,00 36 Médio 25 600,00 27 médio 27 600,00 58 médio 22 450,00 29 Fundamental 21 450,00 3

10 Fundamental 26 450,00 3a)  Classifique cada uma das variáveis.b)  Faça uma representação gráfica para a variável Curso.c)  Discuta a melhor forma de construir a tabela de freqüência para a variável

Idade. Construa uma representação gráfica.d)  Repita o item (c) para a variável Salário.e)  Considerando apenas os funcionários os funcionários com mais de três anos

de casa, descreva o comportamento da variável salário.

3)  Dados do IBGE mostram que, em 1940, havia 4% da população brasileira com

mais de 60 anos. As estatísticas apontam para um aumento na expectativa devida da população. Complete a tabela abaixo e construa um histograma.Idade (em anos) No. de pessoas Freq. acumulada Freq. relativa

[0,10[ 03[10,20[ 15[20,30[ 32[30,40[ 15[40,50[ 42[50,60[ 58[60,70[ 29[70,80[ 08

[80,90[ 03Total 205

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 19/24

 

 

19

A observação do gráfico que representa a distribuição da riqueza em nosso país mostra,por exemplo, que os 10% mais pobres detêm apenas 1% da renda nacional. Supondo apopulação brasileira igual a 200 milhões de habitantes, e o PIB brasileiro igual a 2,4trilhões de reais, responda, com base no gráfico:

a)  Qual é o percentual de renda destinada aos 40% mais pobres da populaçãobrasileira?

b)  Qual é, em reais, a parte da riqueza destinada aos 20% mais pobres dapopulação?

c)  Construa a tabela com o total da população brasileira por faixa de concentraçãode riqueza e com a renda per capita em cada faixa

1,0%2,5% 3,0% 3,4% 4,5% 5,7%

7,3%10,0%

15,7%

46,9%

0,0%

5,0%

10,0%

15,0%

20,0%

25,0%

30,0%

35,0%

40,0%

45,0%

50,0%

10% 20% 30% 40% 50% 60% 70% 80% 90%

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 20/24

 

 

20

Medidas-ResumoIntrodução

Quando trabalhamos com pesquisas que envolvem a coleta e análise de dados,como as pesquisas de opinião, as eleitorais, o estudo de uma ou mais características deuma população (não necessariamente de pessoas), temos uma tarefa logo após a coleta

dos dados: elaborar uma análise descritiva dos mesmos, para conhecer melhor apopulação em estudo.Por exemplo, se estamos estudando a estatura de pessoas adultas segundo o

gênero (homem, mulher) e segundo a faixa etária, queremos conhecer o número depessoas em cada categoria em relação ao total da população, e isso se obtém com asporcentagens, expressas em uma tabela de freqüências.

Diante dos dados, pergunto:  Os dados se agrupam ao redor de que valor?  Supondo que se agrupam em torno de um número, como se comportam?

Muito concentrados em torno desse número? Muito dispersos?

Vamos pensar nos dados de uma amostra e estudar dois tipos de medidasassociadas a eles.

  Medidas de tendência central  Medidas de dispersão

Com essas medidas, é possível, por exemplo, comprar uma roupa para alguém,com pouca margem de erro. Podemos assim dizer que a análise das medidas detendência central permite a construção de um “retrato” dos dados tratados,complementando as representações tabulares e gráficas.

Medidas de tendência centralElas respondem à primeira das questões propostas no parágrafo anterior: Os

dados se agrupam ao redor de que valor? A medida mais evidente que podemos calcularpara descrever um conjunto de dados observados é o seu valor médio.

Existem vários tipos de média, como: a média aritmética, média geométrica oumédia harmônica. Abordaremos somente o procedimento de cálculo da médiaaritmética, por ser o mais utilizado nesse nível de estudo.

A média nada mais é do que a soma de todos os valores observados divididapelo número total de observações.

Em linguagem matemática: usamos a letra grega   (pronuncia-se mi) para

representar dados da população e no caso da média amostral usa-se a notação  X  .

 N 

 xi N 

i

1

  , onde xi representa cada um dos valores observados e N é o número

de elementos da população. No caso de dados amostrais, teremos X=n

 xi

n

i

1  

Exemplo: Considere as idades, em anos, de uma amostra de 10 pessoas: 21, 32,15, 59, 60, 61, 64, 60, 71, 80.

A idade média dessas pessoas é

__

 X   

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 21/24

 

 

21

Para dados agrupados o algoritmo fica da seguinte forma: N 

 x f  N 

i

ii 1

.

  .

Exemplo: A produção diária de um componente para televisor de uma indústriafoi submetida ao controle de qualidade que recolheu uma amostra de cada lote. Oresponsável pelo controle de qualidade da indústria verificou o seguinte número decomponentes com defeito em cada lote:

No. de defeitos No. de lotes0 152 103 45 97 2

Total 40

a.  Calcule a média, a amplitude total, a mediana e a moda do número decomponentes com defeito por dia nessa indústria.

b.  Determine e interprete o intervalo compreendido entre o primeiro e oterceiro quartil.

c.  Represente os dados por um diagrama de pontos (Box-plot), localizandoo valor de cada uma das medidas calculadas no item (a).

d.  Com base nos resultados obtidos e no gráfico, responda: qual ou quaismedidas representam melhor a distribuição do número de defeitos?Justifique.

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 22/24

 

 

22

Média aritmética para dados agrupados em intervalos

O algoritmo para esse cálculo é o mesmo do item anterior. No entanto, para osvalores tomaremos os pontos médios de cada uma das classes que compõem adistribuição de frequências estudada.

Tabela 1: Idade de 58 pessoas pesquisadasClasses Fi Colunas auxiliares

Pontomédio( 

(   

[35, 45[ 5[45, 55[ 12[55, 65[ 18[65, 75[ 14[75, 85[ 6[85, 95[ 3

58

SEPARATRIZESEssas medidas fornecem uma rápida visualização da forma em que os dados

estão distribuídos, onde existe uma maior concentração ou dispersão.É possível dividir uma distribuição, ao interesse da pesquisa, em quantas partes

desejar.  Mediana: divide a distribuição em duas partes com o mesmo número de

elementos.  Quartis: dividem a distribuição em quatro partes com o mesmo número

de elementos.  Decis: dividem a distribuição em dez partes com o mesmo número de

elementos.  Percentis: dividem a distribuição em 100 partes com o mesmo número de

elementos.

QUARTISExistem três quartis em um conjunto de dados:O primeiro quartil (Q1) é o valor tal que 25% dos valores observados sejam

menores ou iguais a ele. O segundo quartil (Q2) é o valor tal que 50% dos valores

observados sejam menores ou iguais a ele (também recebe o nome de mediana Md). Oterceiro Quartil (Q3) é o valor tal que 75% dos valores observados sejam menores ouiguais a ele.

Assim:

Exemplo1: Considere a seguinte distribuição das notas de 15 alunos em

Estatística: 2; 2; 7; 7; 7; 8; 3; 4; 4; 6; 9; 9; 4; 4; 7.* Precisamos lembrar da Aplitude Total e dos valores máximo e mínimo.

25% 25% 25% 25%

Mín Q1 Q2=Md  MáxQ2

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 23/24

 

 

23

At = Xmáximo – Xmínimo

Qual é a nota que divide o conjunto dos 15 valores apresentados em duas partescom exatamente o mesmo número de elementos em cada uma delas? Qual a posiçãodessa nota na série de Rol?

Inicialmente, colocamos a distribuição das notas em ordem crescente, com asrespectivas posições ocupadas na série de Rol.

2 2 3 4 4 4 4 6 7 7 7 7 8 9 91ª. 2ª. 3ª. 4ª. 5ª. 6ª. 7ª. 8ª. 9ª. 10ª. 11ª. 12ª. 13ª. 14ª. 15ª.

Observe que quando a distribuição está ordenada, a nota 6, que ocupa a oitavaposição no Rol, divide a distribuição em duas partes, tais que sete notas são menores esete notas são maiores. A nota 6 recebe o nome de Mediana (Md) ou segundo quartil(Q2).

Agora dividiremos cada conjunto obtido no processo descrito acima novamenteem duas partes de mesmo número de elementos. Ou seja, a distribuição ficará divididaem quatro partes com o mesmo número de elementos:

2 2 3 4 4 4 4 6 7 7 7 7 8 9 91ª. 2ª. 3ª. 4ª. 5ª. 6ª. 7ª. 8ª. 9ª. 10ª. 11ª. 12ª. 13ª. 14ª. 15ª.

As notas 4; 6 e 7 ocupam as posições procuradas, ou seja, as posições quedividem a distribuição

Outra medida de tendência central, usada habitualmente, é a mediana: trata-seda observação que fica eqüidistante dos extremos, a observação que deixa metade dasobservações a sua esquerda e a outra metade a sua direita. Para determinar a mediana deum conjunto de dados, devemos ordená-los. No exemplo anterior, da idade de 10pessoas, as observações ordenadas são: 15, 21, 32, 59, 60, 60, 61, 64, 71, 80.

Como o número de observações é par (10), os valores que se encontram no meiodos dados são 60 e 60. Calculamos a média aritmética entre eles, que é 60, e esse valor éa mediana do conjunto.

Calcule a média e a mediana da amostra abaixo e posteriormente construa o

histograma:3, 15, 48, 61, 64, 65, 65, 68, 70, 71.

Vamos determinar a mediana para o caso de variável contínua.

1º.  Passo: Calcula-se a ordem2

2º.  Pela Fac identifica-se a classe que contém a mediana (classe Md)

3º.  Utiliza-se a fórmula: MD

 MDF 

h f n

l x

.2

 

  

 

 

Onde: lmd = limite inferior da classe Md

5/14/2018 apostila de estatística 2012 - slidepdf.com

http://slidepdf.com/reader/full/apostila-de-estatistica-2012 24/24

 

 

24

n = tamanho da amostra

f  =soma das freqüências anteriores à classe Md

h = amplitude da classe MdFMD = freqüência da classe Md

Exemplo:Classes Fi Fac[35, 45[ 5 5[45, 55[ 12 17[55, 65[ 18 35[65, 75[ 14 49[75, 85[ 6 55[85, 95[ 3 58

58

Outra medida de tendência central é a moda que é o valor que mais se repete nadistribuição, tanto para variáveis quantitativas como para variáveis qualitativas.

Então de acordo com o primeiro exemplo a moda das idades é 60 anos, pois é ovalor que mais se repete.

Obs.: Uma distribuição pode ser:  Amodal

Ter mais de uma moda.

Fórmula de Czuber para dados agrupados em intervalos (aplicar a fórmula apósidentificação da classe modal)

21

1.

h

lmo  

Onde:l =limite inferior da classe modal;h amplitude da classe modal;1 diferença entre freqüência da classe modal e a da classe imediatamente anterior;

2 diferença entre freqüência da classe modal e a da classe imediatamente posterior;

Preciso finalizar este tema e incluir medidas de dispersão