apostila estatisticaadm2007

55
FACULDADES INTEGRADAS JACAREPAGUÁ APOSTILA DE ESTATÍSTICA Curso: Administração Prof. Rodney Dieguez

Transcript of apostila estatisticaadm2007

Page 1: apostila estatisticaadm2007

FACULDADES INTEGRADAS

JACAREPAGUÁ

APOSTILA DE ESTATÍSTICA

Curso: Administração

Prof. Rodney Dieguez

Page 2: apostila estatisticaadm2007

Apostila de Estatística 2

SUMÁRIO

1. Estatística 041.1 Definição de Estatística 041.2 Definição de Estatística 041.3 Fase do Método Estatístico 05

1.3.1 Coleta de Dados 051.3.2 Crítica dos Dados 061.3.3 Apresentação dos Dados 061.3.4 Análise dos Resultados 06

2. Amostragem 072.1 Tipos de Variáveis 072.2 População 082.3 Amostra 082.4 Técnicas de Amostragem 09

2.4.1. Amostragem Probabilística 092.4.2. Amostragem Não Probabilística 10

3. Estatística Descritiva: Gráficos Estatísticos 113.1 Gráficos Estatísticos 113.2 Dicas para a Apresentação dos Dados 13

4. Estatística Descritiva: Distribuição de Freqüências 144.1 Freqüência Absoluta 144.2 Freqüência Acumulada 144.3 Freqüência Relativa 144.4 Freqüência Acumulada Relativa 154.5 Distribuição de Freqüências e Histograma para Dados sem Intervalos de Classe 15

4.5.1 Histograma 154.5.2 Ogiva 16

4.6 Distribuição de Freqüências e Histograma para Dados com Intervalos de Classe 164.6.1 Histograma 194.6.2 Polígono de Freqüência 19

5. Estatística Descritiva: Medidas de Tendência Central 205.1 Média 20

5.1.1 Dados Brutos ou Rol 205.1.2 Dados Agrupados sem Intervalos de Classe 205.1.3 Dados Agrupados com Intervalos de Classe 21

5.2 Mediana 225.2.1 Dados Brutos ou Rol 225.2.2 Dados Agrupados sem Intervalos de Classe 235.2.3 Dados Agrupados com Intervalos de Classe 24

5.3 Moda 255.3.1 Dados Brutos ou Rol 255.3.2 Dados Agrupados sem Intervalos de Classe 265.3.3 Dados Agrupados com Intervalos de Classe 26

5.4 Utilização das Medidas de Tendência Central 27

6. Estatística Descritiva: Medidas de Dispersão 286.1 Variância e Desvio Padrão 28

6.1.1 Dados Brutos ou Rol 286.1.2 Dados Agrupados sem Intervalos de Classe 29

Prof. Rodney Dieguez

Page 3: apostila estatisticaadm2007

Apostila de Estatística 3

6.1.3 Dados Agrupados com Intervalos de Classe 306.2 Coeficiente de Variação 31

7. Exercícios 327.1 Capítulo 3 327.2 Capítulo 4 337.3 Capítulo 5 357.4 Capítulo 6 36

8. Referências Bibliográficas 38

Prof. Rodney Dieguez

Page 4: apostila estatisticaadm2007

Apostila de Estatística 4

1. Estatística

1.1. Introdução

Os métodos estatísticos são usados hoje em quase todos os campos de

investigação científica, já que eles capacitam-nos a responder a um vasto número de

questões, tais como as listadas abaixo:

1) Como os cientistas avaliam a validade de novas teorias?

2) Como os pesquisadores médicos testam a eficiência de novas drogas?

3) Como os demógrafos prevêem o tamanho da população do mundo em qualquer

tempo futuro?

4) Como pode um economista verificar se a mudança atual no Índice de Preços ao

Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio

aleatório?

5) Como é possível para alguém predizer o resultado de uma eleição entrevistando

apenas algumas centenas de eleitores?

Estes são poucos exemplos nos quais a aplicação da estatística é necessária.

Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de

profissionais que entram em contato com dados quantitativos ou tiram conclusões a

partir destes.

1.2. Definição de Estatística

“Estatística” é uma parte da Matemática Aplicada que fornece métodos para a

coleta, organização, descrição, análise e interpretação de dados. Ela é dividida em:

Estatística Descritiva: parte da Estatística que apenas coleta, descreve, organiza

e apresenta os dados. Nela não são tiradas conclusões.

Prof. Rodney Dieguez

Page 5: apostila estatisticaadm2007

Apostila de Estatística 5

Estatística Indutiva ou Inferência: analisa os dados e obtêm-se as conclusões.

1.3. Fases do Método Estatístico

1.3.1. Coleta de Dados

Após a definição do problema a ser estudado e o estabelecimento do

planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das

atividades, custos envolvidos; exame das informações disponíveis; delineamento da

amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou

compilação dos dados das variáveis, componentes do fenômeno a ser estudado.

A coleta de dados pode ser direta ou indireta.

- coleta direta: quando os dados são obtidos na fonte originária. Os valores

assim compilados são chamados de dados primários, como, por exemplo,

nascimentos, casamentos e óbitos, registrados no Cartório de Registro Civil;

opiniões obtidas em pesquisas de opinião pública; ou ainda, quando os dados

são coletados pelo próprio pesquisador.

A coleta direta pode ser classificada relativamente ao fator tempo em:

contínua – quando feita continuamente, como por exemplo, nascimentos

e óbitos, freqüência dos alunos às aulas;

periódica – quando feita em intervalos constantes de tempo, como os

censos (de 10 em 10 anos);

ocasional – quando feita sem época preestabelecida.

- coleta indireta: quando os dados obtidos provêm da coleta direta. Os valores

assim compilados são denominados de dados secundários, como, por

exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas

demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e

Estatística, se constitui em uma coleta indireta.

Prof. Rodney Dieguez

Coleta de dados

Crítica dos dados

Apresentação dos dados

Tabelas

Gráficos

Análises

Page 6: apostila estatisticaadm2007

Apostila de Estatística 6

1.3.2. Crítica dos Dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de

possíveis falhas e imperfeições, eliminando os erros capazes de provocar futuros

enganos de apresentação e análise.

1.3.3. Apresentação dos Dados

Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas

ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado.

1.3.4. Análise dos Resultados

Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos,

através dos métodos da Estatística Indutiva ou Inferência, e tiram-se as conclusões e

previsões.

Prof. Rodney Dieguez

Page 7: apostila estatisticaadm2007

Apostila de Estatística 7

2. Amostragem

2.1. Tipos de Variáveis

Variável é o conjunto de resultados possíveis de um fenômeno. Por exemplo:

- Para o fenômeno “sexo” são dois os resultados possíveis: sexo

masculino e sexo feminino;

- Para o fenômeno “número de filhos” há um número de resultados

possíveis expressos através dos números naturais: 0, 1, 2, 3, ... n;

- Para o fenômeno “estatura” temos uma situação diferente, pois os

resultados podem tomar um número infinito de valores numéricos dentro de

um determinado intervalo.

As variáveis podem ser:

Variáveis quantitativas - refere-se a quantidades e pode ser medidas em uma escala

numérica. Exemplos: idade de pessoas, preço de produtos, peso de recém nascidos.

Elas subdividem-se em dois grupos:

- Variáveis quantitativas discretas: são aquelas que assumem apenas valores

inteiros. Normalmente refere-se a contagens. Por exemplo: número de vendas

diárias em uma empresa, número de pessoas por família, quantidade de

doentes por hospital.

- Variáveis quantitativas contínuas: são aquelas que assumem valores dentro

de um intervalo real. Normalmente refere-se a medidas. Exemplos dessas

variáveis são: o “peso” das pessoas, a renda familiar, o consumo mensal de

energia elétrica, o preço de um produto agrícola.

Variáveis Qualitativas - refere-se a dados não numéricos. Exemplos dessas variáveis

são o sexo das pessoas, a cor, o grau de instrução. Elas subdividem-se também em

dois grupos:

Prof. Rodney Dieguez

Page 8: apostila estatisticaadm2007

Apostila de Estatística 8

- Variáveis qualitativas ordinais: são aquelas que definem um

ordenamento ou uma hierarquia. Exemplos são o grau de instrução, a

classificação de um estudante no curso de estatística, as posições das 100

empresas mais lucrativas, etc.

- Variáveis qualitativas nominais: por sua vez não definem qualquer

ordenamento ou hierarquia. São exemplos destas a cor, o sexo, o local de

nascimento, etc.

Exercício: Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas

(contínuas ou discretas):

a) Universo: alunos de uma escola

Variável: cor dos cabelos Classificação: ________________________

b) Universo: casais residentes em uma cidade

Variável: número de filhos Classificação: ________________________

c) Universo: as jogadas de um dado

Variável: o ponto obtido em cada jogada Classificação: ___________________

d) Universo: peças produzidas por uma máquina

Variável: nº de peças produzidas/hora Classificação: ___________________

e) Universo: peças produzidas por uma máquina

Variável: diâmetro externo Classificação: ___________________

f) Universo: funcionários de uma empresa

Variável: grau de instrução Classificação: ________________________

2.2. População

É um conjunto de indivíduos ou de objetos que tem pelo menos uma

característica comum. A população pode ser finita ou infinita. Na prática, quando uma

população é finita, com um número grande de elementos, considera-se como

população infinita. Exemplo: alunos de uma escola.

Prof. Rodney Dieguez

Page 9: apostila estatisticaadm2007

Apostila de Estatística 9

2.3. Amostra

É uma pequena parte selecionada de uma população que se pretende estudar.

Fazemos uma amostragem quando:

- O número de elementos da população é muito grande;

- Quando queremos economizar tempo e dinheiro.

A amostra é escolhida através de técnicas adequadas que garantam o acaso na escolha.

2.4. Técnicas de Amostragem

Amostragem é o processo de obtenção de amostras de uma população. Existem

dois tipos de amostragem: probabilística e não probabilística.

2.4.1. Amostragem Probabilística: É uma amostra selecionada de tal forma que cada

item ou pessoa na população estudada têm uma probabilidade (não nula) conhecida de

ser incluída na amostra. Pode-se destacar três:

Amostragem Casual Simples ou Aleatória

Definição: É aquela em que todo elemento da população tem igual probabilidade de

pertencer à amostra e todas as amostras possíveis têm igual probabilidade de ocorrer.

Exemplo: Os elementos da amostra são sorteados entre todos os elementos da

população por algum dispositivo adequado (Tabela de números aleatórios).

Amostragem Sistemática

Definição: É aquela em que os elementos da população se apresentam ordenados e a

retirada é realizada através de um sistema preestabelecido.

Exemplo: Numa lista telefônica, sorteia-se um entre os 100 primeiros assinantes e a

partir deste retira-se outro a cada 100.

Prof. Rodney Dieguez

Page 10: apostila estatisticaadm2007

Apostila de Estatística 10

Amostragem Estratificada

Definição: É um processo de amostragem usado quando as populações são

heterogêneas. Divide-se a população em sub-populações denominados estratos. Após

a determinação dos estratos, seleciona-se uma amostra aleatória de cada um dos

estratos. Tipos de variáveis que podem ser usadas em estratificação: idade, classes

sociais, sexo, profissão, salário, procedência, etc.

Exemplo: Numa pesquisa de renda média familiar podemos dividir uma cidade nos

seguintes estratos: bairros de classe A, bairros de classe B, bairros de classe C, etc. e

em seguida retirar um número proporcional de elementos de cada estrato para formar a

amostra estratificada.

2.4.2. Amostragem não-probabilística: É uma amostra selecionada onde cada item

ou pessoa na população estudada tem probabilidade desconhecida de pertencer à

amostra.

Amostragem com inacessibilidade a toda a população.

Definição: É aquela na qual a população não se encontra toda disponível para formar

a amostragem.

Exemplo: A população de peças fabricadas por uma máquina. Uma parte das peças

dessa população, ainda não foram fabricadas, portanto, não estão disponíveis para

serem retiradas no processo de amostragem.

Amostragem a esmo ou sem norma

Definição: É aquela na qual o pesquisador, para simplificar o processo, procura ser

aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo

aleatório confiável.

Exemplo: A extração de uma amostra de 100 parafusos de uma caixa contendo10000,

evidentemente não se faz através de sorteio por ser extremamente trabalhoso, faz-se

então através de retiradas a esmo.

Prof. Rodney Dieguez

Page 11: apostila estatisticaadm2007

Apostila de Estatística 11

Amostragem intencional

Definição: É aquela em que o pesquisador deliberadamente escolhe certos elementos

para pertencer à amostra, por julgar tais elementos bem representativos da população.

Exemplo: Muitas amostragens de pesquisa de opinião são obtidas dessa maneira, por

motivo de tempo e custo.

3. Estatística Descritiva: Gráficos Estatísticos

3.1. Gráficos Estatísticos

A representação gráfica das séries estatísticas tem por finalidade dar uma idéia,

a mais imediata possível, dos resultados obtidos, permitindo chegar a conclusões sobre

a evolução do fenômeno ou sobre como se relacionam os valores da série. A escolha

do gráfico mais apropriado ficará a critério do analista.

Contudo, os elementos simplicidade, clareza e veracidade devem ser

considerados quando da elaboração de um gráfico.

Os principais tipos de gráficos.

a) Gráfico em Colunas ou em Barras: esses dois tipos de gráficos são

geralmente utilizados para comparar diferentes valores da mesma variável.

Prof. Rodney Dieguez

Page 12: apostila estatisticaadm2007

Apostila de Estatística 12

b) Gráficos em Setores: É a representação gráfica de uma série estatística, em

um círculo, por meio de setores. É utilizado principalmente quando se pretende

comparar cada valor da série com o total. Para construí-lo, divide-se o círculo

em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão

poderá ser obtida pela solução da regra de três.

Prof. Rodney Dieguez

Total _____ 360 o

Parte _____ x o

Page 13: apostila estatisticaadm2007

Apostila de Estatística 13

c) Gráfico em Curvas ou Linear: é utilizado para representar o crescimento ou o

decrescimento da variável. Exemplo:

3.2. Dicas para a Apresentação dos Dados

Prof. Rodney Dieguez

Dados

DadosQualitativos

DadosQuantitativos

MétodosTabulares

MétodosGráficos

MétodosTabulares

MétodosGráficos

Distribuições de freqüências

Gráficos de barras e pizza

Distribuições de freqüências

Histograma

Page 14: apostila estatisticaadm2007

Apostila de Estatística 14

4. Estatística Descritiva: Distribuição de Freqüências

Um estudo completo das distribuições de freqüências é imprescindível devido que

este é o tipo de tabela mais importante para a Estatística Descritiva. A seguir são

descritos os procedimentos usuais na construção dessas tabelas. Primeiramente

vamos ver alguns conceitos fundamentais.

a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos

valores coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22,

28, 35, 21, 23, 33.

b) Rol: É o arranjo dos dados brutos em ordem de freqüência crescente ou

decrescente. Os dados brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33,

35.

c) Amplitude Total ou "range" (R). É a diferença entre o maior e o menor

valor observado. No exemplo, R = 35 - 21 = 14.

4.1 Freqüência Absoluta (fi)

É o número de vezes que o elemento aparece na amostra, ou o número de

elementos pertencentes a uma classe.

4.2Freqüência Acumulada (fac)

É a soma da freqüência absoluta da classe com a freqüência absoluta das classes

anteriores.

4.3Freqüência Relativa (fr)

Prof. Rodney Dieguez

Page 15: apostila estatisticaadm2007

Apostila de Estatística 15

A freqüência relativa é o valor da freqüência absoluta dividido pelo número total de

observações: .

4.4Freqüência Acumulada Relativa (far)

A freqüência acumulada relativa é o valor da freqüência acumulada dividido pelo

número total de observações: .

4.5Distribuição de Freqüências e Histograma para Dados sem Intervalo de Classe

Utilizamos esse tipo de distribuição quando o número de elementos distintos da

amostra for pequeno.

Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24,

25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as freqüências.

X fi fac fr far

21

22

23

24

25

26

28

30

4.5.1 Histograma

Histograma é uma representação gráfica de uma tabela de distribuição de

freqüências. Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas)

colocamos os valores da variável em estudo e no eixo vertical (ordenadas) colocamos

os valores das freqüências. O histograma tanto pode ser representado para as

freqüências absolutas como para as freqüências relativas.

Prof. Rodney Dieguez

Page 16: apostila estatisticaadm2007

Apostila de Estatística 16

4.5.2. Ogiva

Ogiva é uma representação gráfica de uma tabela de distribuição de freqüências

acumuladas.

4.6. Distribuição de Freqüência e Histograma para Dados com Intervalo de Classe

Quando o número de elementos distintos da amostra for grande, os dados

devem ser tabulados em intervalos de classes. Exemplo: Dado o conjunto de dados

abaixo, construa sua distribuição de freqüências.

47 43 50 50 50 46 45 48

51 48 48 44 41 45 44 46

43 43 45 47 43 42 45 44

48 45 45 57 47 45 46 43

51 40 52 47 52 46 53 49

Alguns passos devem ser seguidos para a tabulação de freqüências de dados.

1. Definir o número de classes. O número de classes não deve ser muito baixo nem

muito alto. Um número de classes pequeno gera amplitudes de classes grandes o

que pode causar distorções na visualização do histograma. Um número de classes

grande gera amplitude de classes muito reduzidas. Foram definidas regras práticas

para a determinação do número de classes, sendo que este deve variar entre 5 e 20

(5 para um número muito reduzido de observações e 20 para um número muito

elevado). Se n representa o número de observações (na amostra ou na população,

conforme for o caso) o número aproximado de classes pode ser calculado por

Número de Classes(k), k = n arredondando os resultados. No caso do nosso

exemplo temos n = 40 e k= então o número de classes será 6.

Prof. Rodney Dieguez

Page 17: apostila estatisticaadm2007

Apostila de Estatística 17

2. Calcular a amplitude das classes(h). A amplitude será obtida conhecendo-se o

número de classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados é

o resultado da subtração valor máximo - valor mínimo da série de dados. A

amplitude de classe será:

Em geral, o valor do resultado é também arredondado para um número inteiro

mais adequado. No nosso exemplo temos:

3. Preparar a tabela com os limites de cada classe. Na tabela abaixo apresentamos

para os dados do nosso exemplo os limites inferior(L inf) e superior (Lsup) de cada uma

das 6 classes de freqüência.

Classe Limite inferior Limite Superior

1

2

3

4

5

6

Para a construção da distribuição de freqüências usamos a simbologia de intervalos

abertos e fechados. Exemplo: 40 |------ 43 significa que pertencem ao intervalo todos os

valores de 40 a 42.

Prof. Rodney Dieguez

Page 18: apostila estatisticaadm2007

Apostila de Estatística 18

4. Tabular os dados por classe de freqüência. De acordo com nosso exemplo,

teremos:

Classe fi fac fr far40 |--- 43

43 |--- 46

46 |--- 49

49 |--- 52

52 |--- 55

55 |--- 58

Total

4.6.1 Histograma

4.6.2. Polígono de Freqüência

Prof. Rodney Dieguez

Page 19: apostila estatisticaadm2007

Apostila de Estatística 19

5. Estatística Descritiva: Medidas de Tendência Central (ou de Posição)

No estudo de uma série estatística é conveniente o cálculo de algumas medidas

que a caracterizem. Essas medidas, quando bem interpretadas, podem fornecer

informações muito valiosas com respeito a séries estatísticas. Elas são chamadas de

medidas de tendência central e são usadas para indicar um valor que tende a

representar melhor um conjunto de dados. Geralmente localiza-se no centro ou em

torno do centro de uma série, onde maior parte dos dados tende a se concentrar.

Quando o cálculo dessas medidas é feito a partir de uma amostra, elas recebem o

nome de estimativas e quando é feito a partir de uma população, recebem o nome de

parâmetros. As principais medidas de tendência central são: média, mediana e moda.

5.1. Média:

5.1.1. Dados Brutos ou Rol

A média é definida como a soma das observações dividida pelo número de

observações. Ela é dada por:

para amostra para população

Para facilitar, usaremos

Exemplo: Calcule a média da variável x: 2,4,6,8.

5

Prof. Rodney Dieguez

Page 20: apostila estatisticaadm2007

Apostila de Estatística 20

5.1.2. Dados Agrupados sem Intervalos de Classe

A média para dados agrupados sem intervalo de classe é obtida por:

para amostra para população

onde ou N

Exemplo: Determinar a média da distribuição:

xi fi xifi

2 1 2

5 4 20

6 3 18

8 2 16

10 56

Então:

5.1.3. Dados Agrupados com Intervalos de Classe

Para o cálculo da média para dados agrupados com intervalos de classe, é

necessário calcular o ponto médio de cada classe. A média é obtida por:

para amostra para população

onde: Pm é o ponto médio de cada classe.

Prof. Rodney Dieguez

Page 21: apostila estatisticaadm2007

Apostila de Estatística 21

O ponto médio de cada classe é definido por:

Exemplo: Calcular a média da distribuição:

classes fi Pm Pmfi

0 |------ 2 1 1 1

2 |------ 4 10 3 10

4 |------ 6 8 5 40

6 |------ 8 1 7 7

20 58

Então:

5.2. Mediana (Md):

A mediana é um valor real que separa o rol em duas partes deixando à sua

esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um

valor que ocupa a posição central em uma série. Ela é denotada por: Md.

5.2.1 Dados Brutos ou Rol

Inicialmente devemos ordenar os elementos, em seguida determinarmos o

número n de elementos.

Se n é ímpar: a mediana é o termo central, ou seja, o termo que ocupa a posição

.

Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.

Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.

Como n=7 (ímpar), então a posição do termo central é .

Portanto, a mediana é o quarto elemento do Rol: Md = 12 .

Prof. Rodney Dieguez

Page 22: apostila estatisticaadm2007

Apostila de Estatística 22

Se n é par: a mediana será a média aritmética dos dois termos centrais, ou seja, os

termos que ocupam as posições e

Exemplo: Determinar a mediana da série: x: 7, 21, 13, 15, 10, 8, 9, 13.

Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.

Como n=8 (par), então a posição dos dois termos centrais são e

Então, a mediana será a média do terceiro e quarto elemento do Rol.

A mediana será: Md = 11,5

5.2.2. Dados Agrupados sem Intervalos de Classe

Basta verificar se o número de elementos é par ou ímpar e aplicar o mesmo

raciocínio do caso anterior. Para facilitar a localização dos termos centrais calcula-se a

freqüência acumulada da série.

Exemplo: Determinar a mediana da distribuição:

xi fi

2 1

5 4

6 3

8 1

Solução: O número de elementos é: n=fi=9 (ímpar). Então, o termo central será

aquele que ocupará a posição = = 5º. Para encontrar o quinto elemento

da distribuição, construímos uma nova coluna na tabela e determinamos as freqüências

acumuladas.

xi fi fac

2 1 1

5 4 5

Prof. Rodney Dieguez

Page 23: apostila estatisticaadm2007

Apostila de Estatística 23

6 3 8

8 1 9

9

Observando a freqüência acumulada, nós temos o nº 2 que ocupa a 1ª posição,

o nº 5 que ocupa as posições 2ª, 3ª, 4ª e 5ª. Então, a mediana será: Md =

5.2.3. Dados Agrupados com Intervalos de classe

Neste caso, o cálculo da mediana é feito através da fórmula:

onde: lmd = limite inferior da classe mediana. A classe mediana é obtida através de n/2;

fant = freqüência acumulada da classe anterior a classe mediana;

fmd = freqüência absoluta da classe mediana;

h = amplitude da classe (h=Lsup – linf)

Exemplo: Determinar a mediana da distribuição:

classes fi

2 |------ 4 2

4 |------ 6 9

6 |------ 8 8

8 |------ 10 1

Solução: O número de elementos é 20, então a classe mediana será: n/2 = 20/2=10º.

Identifica-se a classe mediana através da freqüência acumulada, ou seja, qual classe

está o 10º elemento. Observando a freqüência acumulada, temos o 10º elemento na 2ª

classe.

classes fi fac

2 |------ 4 2 2

4 |------ 6 9 11

6 |------ 8 8 19

Prof. Rodney Dieguez

Page 24: apostila estatisticaadm2007

Apostila de Estatística 24

8 |------ 10 1 20

20

lmd = 4 fant= 2 fmd = 9 h= 2

Aplicando a fórmula, temos:

5,78

5.3. Moda (Mo)

É o valor de maior freqüência em um conjunto de dados. Ela é denotada por Mo.

5.3.1. Dados Brutos ou Rol

Verifica-se qual o elemento que tem maior freqüência.

Exemplos: Determinar a moda dos conjuntos de dados:

a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.

O elemento de maior freqüência é 5. Portanto, Mo = . É uma seqüência

unimodal, pois só temos uma moda.

b) X: 6, 10, 5, 6, 10, 2.

Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior

freqüência. Portanto, Mo = e Mo = . Por isso é chamada de bimodal.

Quando não houver elementos que se destaque pela maior freqüência, dizemos

que a série é amodal.

Exemplo: x: 3, 3, 3, 4, 4, 4.

Não há moda, pois os elementos têm a mesma freqüência.

5.3.2. Dados Agrupados sem intervalos de classe

Neste caso, verificamos o elemento de maior freqüência absoluta. Exemplo:

Determinar a moda da distribuição abaixo:

xi fi

Prof. Rodney Dieguez

Page 25: apostila estatisticaadm2007

Apostila de Estatística 25

2 1

5 4

6 3

8 1

9

Observamos que a maior freqüência absoluta é o número 4, que corresponde ao

elemento 5 da distribuição. Portanto, a moda é Mo = 5

5.3.3. Dados Agrupados com intervalos de classe

Neste caso, verificamos a classe que tem maior freqüência absoluta e aplicamos

a fórmula.

onde: lmo = limite inferior da classe modal

1 = diferença entre a freqüência absoluta da classe modal e a da classe anterior

2 = diferença entre a freqüência absoluta da classe modal e a da classe

posterior

h = amplitude da classe

Exemplo: Determinar a moda da distribuição abaixo:

classes fi

0 |------ 2 2

2 |------ 4 2

4 |------ 6 4

6 |------ 8 2

10

Solução: A classe modal é aquela que tem maior freqüência absoluta, então a classe

modal é a 3ª classe. Encontrando os valores, temos:

lmo = 4 1 = 4 – 2= 2 2 = 4 – 2 = 2 h = 2

Aplicando a fórmula, temos:

Prof. Rodney Dieguez

Page 26: apostila estatisticaadm2007

Apostila de Estatística 26

5

5.4. Utilização das Medidas de Tendência Central

Na maioria das situações, não necessitamos calcular as três medidas de

tendência central. Normalmente precisamos de apenas uma das medidas para

caracterizar o centro da série.

A medida ideal em cada caso é aquela que melhor representa a maioria dos

dados da série.

Quando houver forte concentração de dados na área central da série, devemos

optar pela Média.

Quando houver forte concentração de dados no início e no final da série,

devemos optar pela Mediana.

A Moda deve ser a opção como medida de tendência central apenas em séries

que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à

freqüência dos outros elementos da série.

Prof. Rodney Dieguez

Page 27: apostila estatisticaadm2007

Apostila de Estatística 27

6. Estatística Descritiva: Medidas de Dispersão

As medidas de dispersão são medidas que mostram o grau de dispersão ou de

concentração em torno da média. As medidas de dispersão mais utilizadas são:

variância, desvio padrão e coeficiente de variação.

6.1 Variância e Desvio Padrão

A variância é uma média aritmética calculada a partir dos quadrados dos desvios

obtidos entre os elementos da série e a sua média.

Quando o conjunto de dados representa uma população a variância é denotada

por 2(x) e o desvio padrão correspondente por (x).

Quando o conjunto de dados representa uma amostra a variância é denotada

por s2(x) e o desvio padrão correspondente por s(x).

6.1.1 Dados Brutos ou Rol

A variância é dada por:

O desvio padrão é a raiz quadrada positiva da variância.

Exemplo: Determine a variância e o desvio padrão da série: X: 2, 4, 6, 8, representativa

de uma amostra.

Solução: Primeiro, calculamos a média: =

Prof. Rodney Dieguez

Page 28: apostila estatisticaadm2007

Apostila de Estatística 28

xi fi xifi (xi - )2 fi(xi - )2

2 1 2 9 9

4 1 4 1 1

6 1 6 1 1

8 1 8 9 9

4 20 20

6.1.2. Dados Agrupados sem Intervalos de Classe

Neste caso, a variância é dada por:

O desvio padrão é a raiz quadrada positiva da variância.

Prof. Rodney Dieguez

Page 29: apostila estatisticaadm2007

Apostila de Estatística 29

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa

de uma população.

xi fi xifi (xi - )2 fi(xi - )2

2 3

3 5

4 8

5 4

20

Primeiro, calculamos a média:

Como estamos trabalhando com uma população a variância é dada por:

O desvio padrão será:

6.1.3. Dados Agrupados com Intervalos de Classe

A variância para dados agrupados com intervalos de classe é dada por:

O desvio padrão é dado por:

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa

de uma população:

Prof. Rodney Dieguez

Page 30: apostila estatisticaadm2007

Apostila de Estatística 30

classes fi Pm Pmfi

0 |------ 2 1

2 |------ 4 10

4 |------ 6 8

6 |------ 8 1

20

Primeiramente calculamos o ponto médio de cada classe e em seguida a média:

Como estamos trabalhando com uma população a variância é dada por:

O desvio padrão será:

6.2. Coeficiente de Variação (CV)

É uma medida relativa de dispersão, útil para a comparação em termos relativos

do grau de concentração em torno da média. Ele é expresso em porcentagem.

Se: CV 15% Baixa dispersão – Homogênea, estável, regular.

15% CV 30% Média dispersão.

CV 30% Alta dispersão – Heterogênea.

7. Exercícios:

7.1. Capítulo 3

Prof. Rodney Dieguez

Page 31: apostila estatisticaadm2007

Apostila de Estatística 31

1. Um estudo sobre o problema do desemprego na Grande São Paulo, no período

1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre a

taxa de desemprego:

P

ela análise do gráfico, é correto afirmar que, no período considerado:

a) a maior taxa de desemprego foi de 14%;

b) a taxa de desemprego no ano de 1995 foi a menor do período;

c) a partir de 1992, a taxa de desemprego foi decrescente;

d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%.

2. Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de

alguns canais de televisão, entre 20h e 21h, durante determinada noite. Os

resultados obtidos estão representados no gráfico de barras a seguir:

Prof. Rodney Dieguez

Page 32: apostila estatisticaadm2007

Apostila de Estatística 32

I. O número de residências pesquisadas foi, aproximadamente de:

a) 100 b) 135 c) 200 d) 220

II. O número de entrevistados que declararam estar assistindo a TvB é

aproximadamente igual a:

a) 30 pessoas b) 20 pessoas d) 18 pessoas d) 22 pessoas

7.2. Capítulo 4

1. Considere os resultados finais, numa determinada disciplina, obtidos por 20

estudantes de uma dada Universidade: 9, 14, 12, 8, 14, 12, 16, 16, 8, 14,11, 12, 14,

11, 11, 18, 14, 18, 15, 15. Construa uma distribuição de freqüências para esses

dados.

2. Admita que foi realizado um inquérito a um grupo de compradores de 30 carros

novos para determinar quantas reparações ou substituições de peças foram feitas

durante o primeiro ano de utilização dos carros, tendo-se obtido os seguintes

resultados: 1, 4, 1, 2, 2, 3, 3, 2, 1, 2, 3, 2, 3, 1, 0, 1, 2, 0, 4, 3, 2, 1, 2, 4, 2, 1, 3, 1, 0,

1. Apresente os dados numa tabela de distribuição de freqüências.

3. Os seguintes dados representam as contribuições fiscais, durante um ano, de 40

pessoas escolhidas aleatoriamente:

Prof. Rodney Dieguez

Page 33: apostila estatisticaadm2007

Apostila de Estatística 33

Agrupe os dados numa distribuição de freqüências.

4. A listagem seguinte refere-se aos montantes de 40 empréstimos pessoais de

uma companhia financeira, em milhares de reais.

900 1000 300 2000500 550 1100 1000450 950 300 20001900 600 1600 4501200 750 1500 7501250 1300 1000 8502500 850 1800 600550 350 900 30001650 1400 500 3501200 700 650 1500

Construa a distribuição de freqüências para os dados da tabela começando a primeira

classe no limite inferior de 300 mil reais e usando a amplitude de 400 mil reais para os

intervalos de classe.

5. A distribuição abaixo se refere a uma amostra da taxa de juros praticadas em 25

países:

Taxa de juros (%) Nº de países

1,0 |----- 2,4 4

2,4 |----- 3,8 3

3,8 |----- 5,2 6

5,2 |----- 6,6 10

6,6 |----- 8,0 2

Pede-se:

a) Determine as freqüências acumuladas, relativas (em %) e acumuladas relativas

(em %);

b) Complete as seguintes frases:

b1) O limite inferior da classe 2 é _________;

b2) O limite superior da classe 5 é ________;

Prof. Rodney Dieguez

Page 34: apostila estatisticaadm2007

Apostila de Estatística 34

b3) O ponto médio da classe 3 é __________;

b4) O ponto médio da classe 4 é __________;

b5) Em 92% dos países a taxa de juros é inferior a _________.

b6) Em _______% dos países a taxa de juros é superior ou igual a 3,8%.

b7) Em _______% dos paises a taxa de juros é 5,2% e 6,6%.

b8) O número de países que possuem taxa juros 6,6% e 8,0% são _____.

7.3. Capítulo 5

1. O Serviço de Recursos Humanos da Roth Young fez uma pesquisa sobre os salários anuais

para gerentes assistentes de lojas de departamentos Os dados são mostrados na tabela abaixo

(dados em mil dólares): (amostra)

Salário (US$) fi

1000 | 1200 2

1200 | 1400 6

1400 | 1600 10

1600 | 1800 5

1800 | 2000 2

Pede-se:

a) Calcule as freqüências acumuladas, relativas e as acumuladas relativas;

b) O limite superior da classe1?(R: 1200)

c) O limite inferior da classe 3? (R:1400)

d) O ponto médio da classe 2/(R:1300)

e) Qual a porcentagem de salários anuais menor que US$ 1200? (R: 8%)

f) Qual a porcentagem de salários anuais maior que US$ 1600? (R: 28%)

g) Qual o salário anual médio? (R: US$ 1492)

h) Qual o salário mediano? (R: US$ 1490)

i) Qual o salário modal? (R: US$ 1488,89)

2. A tabela abaixo representa o número de faltas anuais dos funcionários de uma empresa:

(população)

Nº faltas 0 1 2 3 4 5 6 7 8

Nº empregados 20 42 53 125 84 40 14 3 2

Prof. Rodney Dieguez

Page 35: apostila estatisticaadm2007

Apostila de Estatística 35

Determine:

a) a distribuição de freqüências;

b) a porcentagem de empregados que tiveram um número de faltas anuais 2?

(R: 30%)

c) a porcentagem de empregados que tiveram um número de faltas anuais 3?(R:

62,5%)

d) a porcentagem de empregados que tiveram um número de faltas anuais 5?

(R: 15%)

e) a porcentagem de empregados que tiveram um número de faltas anuais 4?

(R: 37,3%)

f) a média (R: 3,1)

g) a mediana e a moda (R: Md= 3; Mo= 3)

3. Uma companhia afirma que o índice médio de nicotina dos cigarros que fabrica está

dentro do limite estabelecido pelas organizações mundiais de combate ao câncer.

Um laboratório que estuda os males do cigarro à saúde realiza uma análise,

utilizando uma amostra de 7 cigarros dessa companhia e obtém as seguintes

quantidades de nicotina (em mg):

25 24 23 22 29 23 23

Sabendo que o índice médio de nicotina recomendado por essas organizações deve

variar entre 21mg/cigarro e 22mg/cigarro, responda:

a) Qual é o índice médio de nicotina encontrado na amostra; (R: 24 mg/cig)

b) Qual é o índice modal de nicotina encontrado na amostra; (R: Mo=23mg/cig)

c) Qual é o índice mediano de nicotina encontrado na amostra; (R: Md=23 mg/cig)

d) Na sua opinião, o fabricante está obedecendo ao índice médio de nicotina

recomendado pelas organizações internacionais? Justifique a sua resposta!

7.4. Capítulo 6

1. Amostras de solo resultaram na seguinte distribuição para os valores de pH de um solo latossol vermelho-amarelo.

Prof. Rodney Dieguez

Page 36: apostila estatisticaadm2007

Apostila de Estatística 36

Classe de pH Freqüência4,5 |------ 5,5 65,5 |------ 6,5 36,5 |------ 7,5 47,5 |------ 8,5 78,5 |------ 9,5 4

Pede-se:

a) O pH médio; (R.7)

b) O pH mediano; (7,25)

c) O pH modal; (R. 8)

d) A variância, o desvio padrão e o coeficiente de variação.

2. O transporte público e o automóvel são dois meios de transportes que uma pessoa

pode usar para ir ao trabalho diariamente. Amostras de tempo para cada meio de

transporte estão registradas a seguir. Os tempos estão em minutos.

Transporte público 28 29 32 37 33 25 29 32 41 34

Automóvel 29 31 33 32 34 30 31 32 35 33

Qual o meio de transporte deve ser o preferido pelas pessoas? Justifique. (R: o

automóvel, pois tem a menor variabilidade)

3. Abaixo se tem o peso (kg) e altura (cm) de uma amostra de 6 pessoas.

Peso (kg) 79 83 57 58 67 70Altura (cm) 170 179 165 156 165 179

Pede-se:

a) Calcule o peso médio e a altura média; (69kg; 169 cm)

b) Quem é mais variável, o peso ou a altura? Justifique sua resposta.( o peso,

pois seu CV é maior)

Prof. Rodney Dieguez

Page 37: apostila estatisticaadm2007

Apostila de Estatística 37

8. Referências Bibliográficas

ANDERSON, D. R., SWEENEY, D. J., WILLIAMS, T. A. Estatística Aplicada à

Administração e Economia. 1. ed. São Paulo: Thomson Learning, 2002.

LARSON, R; FARBER, B. Estatística Aplicada. 2 ed. São Paulo: Prentice Hall, 2004.

SILVA, E. M. et al. Estatística para os cursos de Economia, Administração e Ciências Contábeis. v. 1e 2; 3. ed. São Paulo: Atlas, 1999.

VIEIRA, S. Princípios de Estatística. São Paulo: Thomson Learning, 2000.

Prof. Rodney Dieguez