apostila estatisticaadm2007
-
Upload
api-3858103 -
Category
Documents
-
view
655 -
download
1
Transcript of apostila estatisticaadm2007
FACULDADES INTEGRADAS
JACAREPAGUÁ
APOSTILA DE ESTATÍSTICA
Curso: Administração
Prof. Rodney Dieguez
Apostila de Estatística 2
SUMÁRIO
1. Estatística 041.1 Definição de Estatística 041.2 Definição de Estatística 041.3 Fase do Método Estatístico 05
1.3.1 Coleta de Dados 051.3.2 Crítica dos Dados 061.3.3 Apresentação dos Dados 061.3.4 Análise dos Resultados 06
2. Amostragem 072.1 Tipos de Variáveis 072.2 População 082.3 Amostra 082.4 Técnicas de Amostragem 09
2.4.1. Amostragem Probabilística 092.4.2. Amostragem Não Probabilística 10
3. Estatística Descritiva: Gráficos Estatísticos 113.1 Gráficos Estatísticos 113.2 Dicas para a Apresentação dos Dados 13
4. Estatística Descritiva: Distribuição de Freqüências 144.1 Freqüência Absoluta 144.2 Freqüência Acumulada 144.3 Freqüência Relativa 144.4 Freqüência Acumulada Relativa 154.5 Distribuição de Freqüências e Histograma para Dados sem Intervalos de Classe 15
4.5.1 Histograma 154.5.2 Ogiva 16
4.6 Distribuição de Freqüências e Histograma para Dados com Intervalos de Classe 164.6.1 Histograma 194.6.2 Polígono de Freqüência 19
5. Estatística Descritiva: Medidas de Tendência Central 205.1 Média 20
5.1.1 Dados Brutos ou Rol 205.1.2 Dados Agrupados sem Intervalos de Classe 205.1.3 Dados Agrupados com Intervalos de Classe 21
5.2 Mediana 225.2.1 Dados Brutos ou Rol 225.2.2 Dados Agrupados sem Intervalos de Classe 235.2.3 Dados Agrupados com Intervalos de Classe 24
5.3 Moda 255.3.1 Dados Brutos ou Rol 255.3.2 Dados Agrupados sem Intervalos de Classe 265.3.3 Dados Agrupados com Intervalos de Classe 26
5.4 Utilização das Medidas de Tendência Central 27
6. Estatística Descritiva: Medidas de Dispersão 286.1 Variância e Desvio Padrão 28
6.1.1 Dados Brutos ou Rol 286.1.2 Dados Agrupados sem Intervalos de Classe 29
Prof. Rodney Dieguez
Apostila de Estatística 3
6.1.3 Dados Agrupados com Intervalos de Classe 306.2 Coeficiente de Variação 31
7. Exercícios 327.1 Capítulo 3 327.2 Capítulo 4 337.3 Capítulo 5 357.4 Capítulo 6 36
8. Referências Bibliográficas 38
Prof. Rodney Dieguez
Apostila de Estatística 4
1. Estatística
1.1. Introdução
Os métodos estatísticos são usados hoje em quase todos os campos de
investigação científica, já que eles capacitam-nos a responder a um vasto número de
questões, tais como as listadas abaixo:
1) Como os cientistas avaliam a validade de novas teorias?
2) Como os pesquisadores médicos testam a eficiência de novas drogas?
3) Como os demógrafos prevêem o tamanho da população do mundo em qualquer
tempo futuro?
4) Como pode um economista verificar se a mudança atual no Índice de Preços ao
Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio
aleatório?
5) Como é possível para alguém predizer o resultado de uma eleição entrevistando
apenas algumas centenas de eleitores?
Estes são poucos exemplos nos quais a aplicação da estatística é necessária.
Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de
profissionais que entram em contato com dados quantitativos ou tiram conclusões a
partir destes.
1.2. Definição de Estatística
“Estatística” é uma parte da Matemática Aplicada que fornece métodos para a
coleta, organização, descrição, análise e interpretação de dados. Ela é dividida em:
Estatística Descritiva: parte da Estatística que apenas coleta, descreve, organiza
e apresenta os dados. Nela não são tiradas conclusões.
Prof. Rodney Dieguez
Apostila de Estatística 5
Estatística Indutiva ou Inferência: analisa os dados e obtêm-se as conclusões.
1.3. Fases do Método Estatístico
1.3.1. Coleta de Dados
Após a definição do problema a ser estudado e o estabelecimento do
planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das
atividades, custos envolvidos; exame das informações disponíveis; delineamento da
amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou
compilação dos dados das variáveis, componentes do fenômeno a ser estudado.
A coleta de dados pode ser direta ou indireta.
- coleta direta: quando os dados são obtidos na fonte originária. Os valores
assim compilados são chamados de dados primários, como, por exemplo,
nascimentos, casamentos e óbitos, registrados no Cartório de Registro Civil;
opiniões obtidas em pesquisas de opinião pública; ou ainda, quando os dados
são coletados pelo próprio pesquisador.
A coleta direta pode ser classificada relativamente ao fator tempo em:
contínua – quando feita continuamente, como por exemplo, nascimentos
e óbitos, freqüência dos alunos às aulas;
periódica – quando feita em intervalos constantes de tempo, como os
censos (de 10 em 10 anos);
ocasional – quando feita sem época preestabelecida.
- coleta indireta: quando os dados obtidos provêm da coleta direta. Os valores
assim compilados são denominados de dados secundários, como, por
exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas
demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e
Estatística, se constitui em uma coleta indireta.
Prof. Rodney Dieguez
Coleta de dados
Crítica dos dados
Apresentação dos dados
Tabelas
Gráficos
Análises
Apostila de Estatística 6
1.3.2. Crítica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de
possíveis falhas e imperfeições, eliminando os erros capazes de provocar futuros
enganos de apresentação e análise.
1.3.3. Apresentação dos Dados
Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas
ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado.
1.3.4. Análise dos Resultados
Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos,
através dos métodos da Estatística Indutiva ou Inferência, e tiram-se as conclusões e
previsões.
Prof. Rodney Dieguez
Apostila de Estatística 7
2. Amostragem
2.1. Tipos de Variáveis
Variável é o conjunto de resultados possíveis de um fenômeno. Por exemplo:
- Para o fenômeno “sexo” são dois os resultados possíveis: sexo
masculino e sexo feminino;
- Para o fenômeno “número de filhos” há um número de resultados
possíveis expressos através dos números naturais: 0, 1, 2, 3, ... n;
- Para o fenômeno “estatura” temos uma situação diferente, pois os
resultados podem tomar um número infinito de valores numéricos dentro de
um determinado intervalo.
As variáveis podem ser:
Variáveis quantitativas - refere-se a quantidades e pode ser medidas em uma escala
numérica. Exemplos: idade de pessoas, preço de produtos, peso de recém nascidos.
Elas subdividem-se em dois grupos:
- Variáveis quantitativas discretas: são aquelas que assumem apenas valores
inteiros. Normalmente refere-se a contagens. Por exemplo: número de vendas
diárias em uma empresa, número de pessoas por família, quantidade de
doentes por hospital.
- Variáveis quantitativas contínuas: são aquelas que assumem valores dentro
de um intervalo real. Normalmente refere-se a medidas. Exemplos dessas
variáveis são: o “peso” das pessoas, a renda familiar, o consumo mensal de
energia elétrica, o preço de um produto agrícola.
Variáveis Qualitativas - refere-se a dados não numéricos. Exemplos dessas variáveis
são o sexo das pessoas, a cor, o grau de instrução. Elas subdividem-se também em
dois grupos:
Prof. Rodney Dieguez
Apostila de Estatística 8
- Variáveis qualitativas ordinais: são aquelas que definem um
ordenamento ou uma hierarquia. Exemplos são o grau de instrução, a
classificação de um estudante no curso de estatística, as posições das 100
empresas mais lucrativas, etc.
- Variáveis qualitativas nominais: por sua vez não definem qualquer
ordenamento ou hierarquia. São exemplos destas a cor, o sexo, o local de
nascimento, etc.
Exercício: Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas
(contínuas ou discretas):
a) Universo: alunos de uma escola
Variável: cor dos cabelos Classificação: ________________________
b) Universo: casais residentes em uma cidade
Variável: número de filhos Classificação: ________________________
c) Universo: as jogadas de um dado
Variável: o ponto obtido em cada jogada Classificação: ___________________
d) Universo: peças produzidas por uma máquina
Variável: nº de peças produzidas/hora Classificação: ___________________
e) Universo: peças produzidas por uma máquina
Variável: diâmetro externo Classificação: ___________________
f) Universo: funcionários de uma empresa
Variável: grau de instrução Classificação: ________________________
2.2. População
É um conjunto de indivíduos ou de objetos que tem pelo menos uma
característica comum. A população pode ser finita ou infinita. Na prática, quando uma
população é finita, com um número grande de elementos, considera-se como
população infinita. Exemplo: alunos de uma escola.
Prof. Rodney Dieguez
Apostila de Estatística 9
2.3. Amostra
É uma pequena parte selecionada de uma população que se pretende estudar.
Fazemos uma amostragem quando:
- O número de elementos da população é muito grande;
- Quando queremos economizar tempo e dinheiro.
A amostra é escolhida através de técnicas adequadas que garantam o acaso na escolha.
2.4. Técnicas de Amostragem
Amostragem é o processo de obtenção de amostras de uma população. Existem
dois tipos de amostragem: probabilística e não probabilística.
2.4.1. Amostragem Probabilística: É uma amostra selecionada de tal forma que cada
item ou pessoa na população estudada têm uma probabilidade (não nula) conhecida de
ser incluída na amostra. Pode-se destacar três:
Amostragem Casual Simples ou Aleatória
Definição: É aquela em que todo elemento da população tem igual probabilidade de
pertencer à amostra e todas as amostras possíveis têm igual probabilidade de ocorrer.
Exemplo: Os elementos da amostra são sorteados entre todos os elementos da
população por algum dispositivo adequado (Tabela de números aleatórios).
Amostragem Sistemática
Definição: É aquela em que os elementos da população se apresentam ordenados e a
retirada é realizada através de um sistema preestabelecido.
Exemplo: Numa lista telefônica, sorteia-se um entre os 100 primeiros assinantes e a
partir deste retira-se outro a cada 100.
Prof. Rodney Dieguez
Apostila de Estatística 10
Amostragem Estratificada
Definição: É um processo de amostragem usado quando as populações são
heterogêneas. Divide-se a população em sub-populações denominados estratos. Após
a determinação dos estratos, seleciona-se uma amostra aleatória de cada um dos
estratos. Tipos de variáveis que podem ser usadas em estratificação: idade, classes
sociais, sexo, profissão, salário, procedência, etc.
Exemplo: Numa pesquisa de renda média familiar podemos dividir uma cidade nos
seguintes estratos: bairros de classe A, bairros de classe B, bairros de classe C, etc. e
em seguida retirar um número proporcional de elementos de cada estrato para formar a
amostra estratificada.
2.4.2. Amostragem não-probabilística: É uma amostra selecionada onde cada item
ou pessoa na população estudada tem probabilidade desconhecida de pertencer à
amostra.
Amostragem com inacessibilidade a toda a população.
Definição: É aquela na qual a população não se encontra toda disponível para formar
a amostragem.
Exemplo: A população de peças fabricadas por uma máquina. Uma parte das peças
dessa população, ainda não foram fabricadas, portanto, não estão disponíveis para
serem retiradas no processo de amostragem.
Amostragem a esmo ou sem norma
Definição: É aquela na qual o pesquisador, para simplificar o processo, procura ser
aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo
aleatório confiável.
Exemplo: A extração de uma amostra de 100 parafusos de uma caixa contendo10000,
evidentemente não se faz através de sorteio por ser extremamente trabalhoso, faz-se
então através de retiradas a esmo.
Prof. Rodney Dieguez
Apostila de Estatística 11
Amostragem intencional
Definição: É aquela em que o pesquisador deliberadamente escolhe certos elementos
para pertencer à amostra, por julgar tais elementos bem representativos da população.
Exemplo: Muitas amostragens de pesquisa de opinião são obtidas dessa maneira, por
motivo de tempo e custo.
3. Estatística Descritiva: Gráficos Estatísticos
3.1. Gráficos Estatísticos
A representação gráfica das séries estatísticas tem por finalidade dar uma idéia,
a mais imediata possível, dos resultados obtidos, permitindo chegar a conclusões sobre
a evolução do fenômeno ou sobre como se relacionam os valores da série. A escolha
do gráfico mais apropriado ficará a critério do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaboração de um gráfico.
Os principais tipos de gráficos.
a) Gráfico em Colunas ou em Barras: esses dois tipos de gráficos são
geralmente utilizados para comparar diferentes valores da mesma variável.
Prof. Rodney Dieguez
Apostila de Estatística 12
b) Gráficos em Setores: É a representação gráfica de uma série estatística, em
um círculo, por meio de setores. É utilizado principalmente quando se pretende
comparar cada valor da série com o total. Para construí-lo, divide-se o círculo
em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão
poderá ser obtida pela solução da regra de três.
Prof. Rodney Dieguez
Total _____ 360 o
Parte _____ x o
Apostila de Estatística 13
c) Gráfico em Curvas ou Linear: é utilizado para representar o crescimento ou o
decrescimento da variável. Exemplo:
3.2. Dicas para a Apresentação dos Dados
Prof. Rodney Dieguez
Dados
DadosQualitativos
DadosQuantitativos
MétodosTabulares
MétodosGráficos
MétodosTabulares
MétodosGráficos
Distribuições de freqüências
Gráficos de barras e pizza
Distribuições de freqüências
Histograma
Apostila de Estatística 14
4. Estatística Descritiva: Distribuição de Freqüências
Um estudo completo das distribuições de freqüências é imprescindível devido que
este é o tipo de tabela mais importante para a Estatística Descritiva. A seguir são
descritos os procedimentos usuais na construção dessas tabelas. Primeiramente
vamos ver alguns conceitos fundamentais.
a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos
valores coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22,
28, 35, 21, 23, 33.
b) Rol: É o arranjo dos dados brutos em ordem de freqüência crescente ou
decrescente. Os dados brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33,
35.
c) Amplitude Total ou "range" (R). É a diferença entre o maior e o menor
valor observado. No exemplo, R = 35 - 21 = 14.
4.1 Freqüência Absoluta (fi)
É o número de vezes que o elemento aparece na amostra, ou o número de
elementos pertencentes a uma classe.
4.2Freqüência Acumulada (fac)
É a soma da freqüência absoluta da classe com a freqüência absoluta das classes
anteriores.
4.3Freqüência Relativa (fr)
Prof. Rodney Dieguez
Apostila de Estatística 15
A freqüência relativa é o valor da freqüência absoluta dividido pelo número total de
observações: .
4.4Freqüência Acumulada Relativa (far)
A freqüência acumulada relativa é o valor da freqüência acumulada dividido pelo
número total de observações: .
4.5Distribuição de Freqüências e Histograma para Dados sem Intervalo de Classe
Utilizamos esse tipo de distribuição quando o número de elementos distintos da
amostra for pequeno.
Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24,
25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as freqüências.
X fi fac fr far
21
22
23
24
25
26
28
30
4.5.1 Histograma
Histograma é uma representação gráfica de uma tabela de distribuição de
freqüências. Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas)
colocamos os valores da variável em estudo e no eixo vertical (ordenadas) colocamos
os valores das freqüências. O histograma tanto pode ser representado para as
freqüências absolutas como para as freqüências relativas.
Prof. Rodney Dieguez
Apostila de Estatística 16
4.5.2. Ogiva
Ogiva é uma representação gráfica de uma tabela de distribuição de freqüências
acumuladas.
4.6. Distribuição de Freqüência e Histograma para Dados com Intervalo de Classe
Quando o número de elementos distintos da amostra for grande, os dados
devem ser tabulados em intervalos de classes. Exemplo: Dado o conjunto de dados
abaixo, construa sua distribuição de freqüências.
47 43 50 50 50 46 45 48
51 48 48 44 41 45 44 46
43 43 45 47 43 42 45 44
48 45 45 57 47 45 46 43
51 40 52 47 52 46 53 49
Alguns passos devem ser seguidos para a tabulação de freqüências de dados.
1. Definir o número de classes. O número de classes não deve ser muito baixo nem
muito alto. Um número de classes pequeno gera amplitudes de classes grandes o
que pode causar distorções na visualização do histograma. Um número de classes
grande gera amplitude de classes muito reduzidas. Foram definidas regras práticas
para a determinação do número de classes, sendo que este deve variar entre 5 e 20
(5 para um número muito reduzido de observações e 20 para um número muito
elevado). Se n representa o número de observações (na amostra ou na população,
conforme for o caso) o número aproximado de classes pode ser calculado por
Número de Classes(k), k = n arredondando os resultados. No caso do nosso
exemplo temos n = 40 e k= então o número de classes será 6.
Prof. Rodney Dieguez
Apostila de Estatística 17
2. Calcular a amplitude das classes(h). A amplitude será obtida conhecendo-se o
número de classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados é
o resultado da subtração valor máximo - valor mínimo da série de dados. A
amplitude de classe será:
Em geral, o valor do resultado é também arredondado para um número inteiro
mais adequado. No nosso exemplo temos:
3. Preparar a tabela com os limites de cada classe. Na tabela abaixo apresentamos
para os dados do nosso exemplo os limites inferior(L inf) e superior (Lsup) de cada uma
das 6 classes de freqüência.
Classe Limite inferior Limite Superior
1
2
3
4
5
6
Para a construção da distribuição de freqüências usamos a simbologia de intervalos
abertos e fechados. Exemplo: 40 |------ 43 significa que pertencem ao intervalo todos os
valores de 40 a 42.
Prof. Rodney Dieguez
Apostila de Estatística 18
4. Tabular os dados por classe de freqüência. De acordo com nosso exemplo,
teremos:
Classe fi fac fr far40 |--- 43
43 |--- 46
46 |--- 49
49 |--- 52
52 |--- 55
55 |--- 58
Total
4.6.1 Histograma
4.6.2. Polígono de Freqüência
Prof. Rodney Dieguez
Apostila de Estatística 19
5. Estatística Descritiva: Medidas de Tendência Central (ou de Posição)
No estudo de uma série estatística é conveniente o cálculo de algumas medidas
que a caracterizem. Essas medidas, quando bem interpretadas, podem fornecer
informações muito valiosas com respeito a séries estatísticas. Elas são chamadas de
medidas de tendência central e são usadas para indicar um valor que tende a
representar melhor um conjunto de dados. Geralmente localiza-se no centro ou em
torno do centro de uma série, onde maior parte dos dados tende a se concentrar.
Quando o cálculo dessas medidas é feito a partir de uma amostra, elas recebem o
nome de estimativas e quando é feito a partir de uma população, recebem o nome de
parâmetros. As principais medidas de tendência central são: média, mediana e moda.
5.1. Média:
5.1.1. Dados Brutos ou Rol
A média é definida como a soma das observações dividida pelo número de
observações. Ela é dada por:
para amostra para população
Para facilitar, usaremos
Exemplo: Calcule a média da variável x: 2,4,6,8.
5
Prof. Rodney Dieguez
Apostila de Estatística 20
5.1.2. Dados Agrupados sem Intervalos de Classe
A média para dados agrupados sem intervalo de classe é obtida por:
para amostra para população
onde ou N
Exemplo: Determinar a média da distribuição:
xi fi xifi
2 1 2
5 4 20
6 3 18
8 2 16
10 56
Então:
5.1.3. Dados Agrupados com Intervalos de Classe
Para o cálculo da média para dados agrupados com intervalos de classe, é
necessário calcular o ponto médio de cada classe. A média é obtida por:
para amostra para população
onde: Pm é o ponto médio de cada classe.
Prof. Rodney Dieguez
Apostila de Estatística 21
O ponto médio de cada classe é definido por:
Exemplo: Calcular a média da distribuição:
classes fi Pm Pmfi
0 |------ 2 1 1 1
2 |------ 4 10 3 10
4 |------ 6 8 5 40
6 |------ 8 1 7 7
20 58
Então:
5.2. Mediana (Md):
A mediana é um valor real que separa o rol em duas partes deixando à sua
esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um
valor que ocupa a posição central em uma série. Ela é denotada por: Md.
5.2.1 Dados Brutos ou Rol
Inicialmente devemos ordenar os elementos, em seguida determinarmos o
número n de elementos.
Se n é ímpar: a mediana é o termo central, ou seja, o termo que ocupa a posição
.
Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.
Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.
Como n=7 (ímpar), então a posição do termo central é .
Portanto, a mediana é o quarto elemento do Rol: Md = 12 .
Prof. Rodney Dieguez
Apostila de Estatística 22
Se n é par: a mediana será a média aritmética dos dois termos centrais, ou seja, os
termos que ocupam as posições e
Exemplo: Determinar a mediana da série: x: 7, 21, 13, 15, 10, 8, 9, 13.
Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.
Como n=8 (par), então a posição dos dois termos centrais são e
Então, a mediana será a média do terceiro e quarto elemento do Rol.
A mediana será: Md = 11,5
5.2.2. Dados Agrupados sem Intervalos de Classe
Basta verificar se o número de elementos é par ou ímpar e aplicar o mesmo
raciocínio do caso anterior. Para facilitar a localização dos termos centrais calcula-se a
freqüência acumulada da série.
Exemplo: Determinar a mediana da distribuição:
xi fi
2 1
5 4
6 3
8 1
Solução: O número de elementos é: n=fi=9 (ímpar). Então, o termo central será
aquele que ocupará a posição = = 5º. Para encontrar o quinto elemento
da distribuição, construímos uma nova coluna na tabela e determinamos as freqüências
acumuladas.
xi fi fac
2 1 1
5 4 5
Prof. Rodney Dieguez
Apostila de Estatística 23
6 3 8
8 1 9
9
Observando a freqüência acumulada, nós temos o nº 2 que ocupa a 1ª posição,
o nº 5 que ocupa as posições 2ª, 3ª, 4ª e 5ª. Então, a mediana será: Md =
5.2.3. Dados Agrupados com Intervalos de classe
Neste caso, o cálculo da mediana é feito através da fórmula:
onde: lmd = limite inferior da classe mediana. A classe mediana é obtida através de n/2;
fant = freqüência acumulada da classe anterior a classe mediana;
fmd = freqüência absoluta da classe mediana;
h = amplitude da classe (h=Lsup – linf)
Exemplo: Determinar a mediana da distribuição:
classes fi
2 |------ 4 2
4 |------ 6 9
6 |------ 8 8
8 |------ 10 1
Solução: O número de elementos é 20, então a classe mediana será: n/2 = 20/2=10º.
Identifica-se a classe mediana através da freqüência acumulada, ou seja, qual classe
está o 10º elemento. Observando a freqüência acumulada, temos o 10º elemento na 2ª
classe.
classes fi fac
2 |------ 4 2 2
4 |------ 6 9 11
6 |------ 8 8 19
Prof. Rodney Dieguez
Apostila de Estatística 24
8 |------ 10 1 20
20
lmd = 4 fant= 2 fmd = 9 h= 2
Aplicando a fórmula, temos:
5,78
5.3. Moda (Mo)
É o valor de maior freqüência em um conjunto de dados. Ela é denotada por Mo.
5.3.1. Dados Brutos ou Rol
Verifica-se qual o elemento que tem maior freqüência.
Exemplos: Determinar a moda dos conjuntos de dados:
a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.
O elemento de maior freqüência é 5. Portanto, Mo = . É uma seqüência
unimodal, pois só temos uma moda.
b) X: 6, 10, 5, 6, 10, 2.
Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior
freqüência. Portanto, Mo = e Mo = . Por isso é chamada de bimodal.
Quando não houver elementos que se destaque pela maior freqüência, dizemos
que a série é amodal.
Exemplo: x: 3, 3, 3, 4, 4, 4.
Não há moda, pois os elementos têm a mesma freqüência.
5.3.2. Dados Agrupados sem intervalos de classe
Neste caso, verificamos o elemento de maior freqüência absoluta. Exemplo:
Determinar a moda da distribuição abaixo:
xi fi
Prof. Rodney Dieguez
Apostila de Estatística 25
2 1
5 4
6 3
8 1
9
Observamos que a maior freqüência absoluta é o número 4, que corresponde ao
elemento 5 da distribuição. Portanto, a moda é Mo = 5
5.3.3. Dados Agrupados com intervalos de classe
Neste caso, verificamos a classe que tem maior freqüência absoluta e aplicamos
a fórmula.
onde: lmo = limite inferior da classe modal
1 = diferença entre a freqüência absoluta da classe modal e a da classe anterior
2 = diferença entre a freqüência absoluta da classe modal e a da classe
posterior
h = amplitude da classe
Exemplo: Determinar a moda da distribuição abaixo:
classes fi
0 |------ 2 2
2 |------ 4 2
4 |------ 6 4
6 |------ 8 2
10
Solução: A classe modal é aquela que tem maior freqüência absoluta, então a classe
modal é a 3ª classe. Encontrando os valores, temos:
lmo = 4 1 = 4 – 2= 2 2 = 4 – 2 = 2 h = 2
Aplicando a fórmula, temos:
Prof. Rodney Dieguez
Apostila de Estatística 26
5
5.4. Utilização das Medidas de Tendência Central
Na maioria das situações, não necessitamos calcular as três medidas de
tendência central. Normalmente precisamos de apenas uma das medidas para
caracterizar o centro da série.
A medida ideal em cada caso é aquela que melhor representa a maioria dos
dados da série.
Quando houver forte concentração de dados na área central da série, devemos
optar pela Média.
Quando houver forte concentração de dados no início e no final da série,
devemos optar pela Mediana.
A Moda deve ser a opção como medida de tendência central apenas em séries
que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à
freqüência dos outros elementos da série.
Prof. Rodney Dieguez
Apostila de Estatística 27
6. Estatística Descritiva: Medidas de Dispersão
As medidas de dispersão são medidas que mostram o grau de dispersão ou de
concentração em torno da média. As medidas de dispersão mais utilizadas são:
variância, desvio padrão e coeficiente de variação.
6.1 Variância e Desvio Padrão
A variância é uma média aritmética calculada a partir dos quadrados dos desvios
obtidos entre os elementos da série e a sua média.
Quando o conjunto de dados representa uma população a variância é denotada
por 2(x) e o desvio padrão correspondente por (x).
Quando o conjunto de dados representa uma amostra a variância é denotada
por s2(x) e o desvio padrão correspondente por s(x).
6.1.1 Dados Brutos ou Rol
A variância é dada por:
O desvio padrão é a raiz quadrada positiva da variância.
Exemplo: Determine a variância e o desvio padrão da série: X: 2, 4, 6, 8, representativa
de uma amostra.
Solução: Primeiro, calculamos a média: =
Prof. Rodney Dieguez
Apostila de Estatística 28
xi fi xifi (xi - )2 fi(xi - )2
2 1 2 9 9
4 1 4 1 1
6 1 6 1 1
8 1 8 9 9
4 20 20
6.1.2. Dados Agrupados sem Intervalos de Classe
Neste caso, a variância é dada por:
O desvio padrão é a raiz quadrada positiva da variância.
Prof. Rodney Dieguez
Apostila de Estatística 29
Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa
de uma população.
xi fi xifi (xi - )2 fi(xi - )2
2 3
3 5
4 8
5 4
20
Primeiro, calculamos a média:
Como estamos trabalhando com uma população a variância é dada por:
O desvio padrão será:
6.1.3. Dados Agrupados com Intervalos de Classe
A variância para dados agrupados com intervalos de classe é dada por:
O desvio padrão é dado por:
Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa
de uma população:
Prof. Rodney Dieguez
Apostila de Estatística 30
classes fi Pm Pmfi
0 |------ 2 1
2 |------ 4 10
4 |------ 6 8
6 |------ 8 1
20
Primeiramente calculamos o ponto médio de cada classe e em seguida a média:
Como estamos trabalhando com uma população a variância é dada por:
O desvio padrão será:
6.2. Coeficiente de Variação (CV)
É uma medida relativa de dispersão, útil para a comparação em termos relativos
do grau de concentração em torno da média. Ele é expresso em porcentagem.
Se: CV 15% Baixa dispersão – Homogênea, estável, regular.
15% CV 30% Média dispersão.
CV 30% Alta dispersão – Heterogênea.
7. Exercícios:
7.1. Capítulo 3
Prof. Rodney Dieguez
Apostila de Estatística 31
1. Um estudo sobre o problema do desemprego na Grande São Paulo, no período
1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre a
taxa de desemprego:
P
ela análise do gráfico, é correto afirmar que, no período considerado:
a) a maior taxa de desemprego foi de 14%;
b) a taxa de desemprego no ano de 1995 foi a menor do período;
c) a partir de 1992, a taxa de desemprego foi decrescente;
d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%.
2. Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de
alguns canais de televisão, entre 20h e 21h, durante determinada noite. Os
resultados obtidos estão representados no gráfico de barras a seguir:
Prof. Rodney Dieguez
Apostila de Estatística 32
I. O número de residências pesquisadas foi, aproximadamente de:
a) 100 b) 135 c) 200 d) 220
II. O número de entrevistados que declararam estar assistindo a TvB é
aproximadamente igual a:
a) 30 pessoas b) 20 pessoas d) 18 pessoas d) 22 pessoas
7.2. Capítulo 4
1. Considere os resultados finais, numa determinada disciplina, obtidos por 20
estudantes de uma dada Universidade: 9, 14, 12, 8, 14, 12, 16, 16, 8, 14,11, 12, 14,
11, 11, 18, 14, 18, 15, 15. Construa uma distribuição de freqüências para esses
dados.
2. Admita que foi realizado um inquérito a um grupo de compradores de 30 carros
novos para determinar quantas reparações ou substituições de peças foram feitas
durante o primeiro ano de utilização dos carros, tendo-se obtido os seguintes
resultados: 1, 4, 1, 2, 2, 3, 3, 2, 1, 2, 3, 2, 3, 1, 0, 1, 2, 0, 4, 3, 2, 1, 2, 4, 2, 1, 3, 1, 0,
1. Apresente os dados numa tabela de distribuição de freqüências.
3. Os seguintes dados representam as contribuições fiscais, durante um ano, de 40
pessoas escolhidas aleatoriamente:
Prof. Rodney Dieguez
Apostila de Estatística 33
Agrupe os dados numa distribuição de freqüências.
4. A listagem seguinte refere-se aos montantes de 40 empréstimos pessoais de
uma companhia financeira, em milhares de reais.
900 1000 300 2000500 550 1100 1000450 950 300 20001900 600 1600 4501200 750 1500 7501250 1300 1000 8502500 850 1800 600550 350 900 30001650 1400 500 3501200 700 650 1500
Construa a distribuição de freqüências para os dados da tabela começando a primeira
classe no limite inferior de 300 mil reais e usando a amplitude de 400 mil reais para os
intervalos de classe.
5. A distribuição abaixo se refere a uma amostra da taxa de juros praticadas em 25
países:
Taxa de juros (%) Nº de países
1,0 |----- 2,4 4
2,4 |----- 3,8 3
3,8 |----- 5,2 6
5,2 |----- 6,6 10
6,6 |----- 8,0 2
Pede-se:
a) Determine as freqüências acumuladas, relativas (em %) e acumuladas relativas
(em %);
b) Complete as seguintes frases:
b1) O limite inferior da classe 2 é _________;
b2) O limite superior da classe 5 é ________;
Prof. Rodney Dieguez
Apostila de Estatística 34
b3) O ponto médio da classe 3 é __________;
b4) O ponto médio da classe 4 é __________;
b5) Em 92% dos países a taxa de juros é inferior a _________.
b6) Em _______% dos países a taxa de juros é superior ou igual a 3,8%.
b7) Em _______% dos paises a taxa de juros é 5,2% e 6,6%.
b8) O número de países que possuem taxa juros 6,6% e 8,0% são _____.
7.3. Capítulo 5
1. O Serviço de Recursos Humanos da Roth Young fez uma pesquisa sobre os salários anuais
para gerentes assistentes de lojas de departamentos Os dados são mostrados na tabela abaixo
(dados em mil dólares): (amostra)
Salário (US$) fi
1000 | 1200 2
1200 | 1400 6
1400 | 1600 10
1600 | 1800 5
1800 | 2000 2
Pede-se:
a) Calcule as freqüências acumuladas, relativas e as acumuladas relativas;
b) O limite superior da classe1?(R: 1200)
c) O limite inferior da classe 3? (R:1400)
d) O ponto médio da classe 2/(R:1300)
e) Qual a porcentagem de salários anuais menor que US$ 1200? (R: 8%)
f) Qual a porcentagem de salários anuais maior que US$ 1600? (R: 28%)
g) Qual o salário anual médio? (R: US$ 1492)
h) Qual o salário mediano? (R: US$ 1490)
i) Qual o salário modal? (R: US$ 1488,89)
2. A tabela abaixo representa o número de faltas anuais dos funcionários de uma empresa:
(população)
Nº faltas 0 1 2 3 4 5 6 7 8
Nº empregados 20 42 53 125 84 40 14 3 2
Prof. Rodney Dieguez
Apostila de Estatística 35
Determine:
a) a distribuição de freqüências;
b) a porcentagem de empregados que tiveram um número de faltas anuais 2?
(R: 30%)
c) a porcentagem de empregados que tiveram um número de faltas anuais 3?(R:
62,5%)
d) a porcentagem de empregados que tiveram um número de faltas anuais 5?
(R: 15%)
e) a porcentagem de empregados que tiveram um número de faltas anuais 4?
(R: 37,3%)
f) a média (R: 3,1)
g) a mediana e a moda (R: Md= 3; Mo= 3)
3. Uma companhia afirma que o índice médio de nicotina dos cigarros que fabrica está
dentro do limite estabelecido pelas organizações mundiais de combate ao câncer.
Um laboratório que estuda os males do cigarro à saúde realiza uma análise,
utilizando uma amostra de 7 cigarros dessa companhia e obtém as seguintes
quantidades de nicotina (em mg):
25 24 23 22 29 23 23
Sabendo que o índice médio de nicotina recomendado por essas organizações deve
variar entre 21mg/cigarro e 22mg/cigarro, responda:
a) Qual é o índice médio de nicotina encontrado na amostra; (R: 24 mg/cig)
b) Qual é o índice modal de nicotina encontrado na amostra; (R: Mo=23mg/cig)
c) Qual é o índice mediano de nicotina encontrado na amostra; (R: Md=23 mg/cig)
d) Na sua opinião, o fabricante está obedecendo ao índice médio de nicotina
recomendado pelas organizações internacionais? Justifique a sua resposta!
7.4. Capítulo 6
1. Amostras de solo resultaram na seguinte distribuição para os valores de pH de um solo latossol vermelho-amarelo.
Prof. Rodney Dieguez
Apostila de Estatística 36
Classe de pH Freqüência4,5 |------ 5,5 65,5 |------ 6,5 36,5 |------ 7,5 47,5 |------ 8,5 78,5 |------ 9,5 4
Pede-se:
a) O pH médio; (R.7)
b) O pH mediano; (7,25)
c) O pH modal; (R. 8)
d) A variância, o desvio padrão e o coeficiente de variação.
2. O transporte público e o automóvel são dois meios de transportes que uma pessoa
pode usar para ir ao trabalho diariamente. Amostras de tempo para cada meio de
transporte estão registradas a seguir. Os tempos estão em minutos.
Transporte público 28 29 32 37 33 25 29 32 41 34
Automóvel 29 31 33 32 34 30 31 32 35 33
Qual o meio de transporte deve ser o preferido pelas pessoas? Justifique. (R: o
automóvel, pois tem a menor variabilidade)
3. Abaixo se tem o peso (kg) e altura (cm) de uma amostra de 6 pessoas.
Peso (kg) 79 83 57 58 67 70Altura (cm) 170 179 165 156 165 179
Pede-se:
a) Calcule o peso médio e a altura média; (69kg; 169 cm)
b) Quem é mais variável, o peso ou a altura? Justifique sua resposta.( o peso,
pois seu CV é maior)
Prof. Rodney Dieguez
Apostila de Estatística 37
8. Referências Bibliográficas
ANDERSON, D. R., SWEENEY, D. J., WILLIAMS, T. A. Estatística Aplicada à
Administração e Economia. 1. ed. São Paulo: Thomson Learning, 2002.
LARSON, R; FARBER, B. Estatística Aplicada. 2 ed. São Paulo: Prentice Hall, 2004.
SILVA, E. M. et al. Estatística para os cursos de Economia, Administração e Ciências Contábeis. v. 1e 2; 3. ed. São Paulo: Atlas, 1999.
VIEIRA, S. Princípios de Estatística. São Paulo: Thomson Learning, 2000.
Prof. Rodney Dieguez