apostila_estatistica
Transcript of apostila_estatistica
ESTATÍSTICA
DESCRITIVA
APRESENTAÇÃO
O objetivo deste material é servir de apoio à disciplina de estatística. Ele foi estruturado demodo a cobrir todo o programa do curso, servido de suporte teórico e prático para o aluno.Esperamos que este material seja de total aproveitamento pelo aluno, servido aos propósitos desua elaboração.
3
SUMÁRIO
CAPÍTULO 1 - INTRODUÇÂO ............................................................................................................. 51.1 . Definições .......................................................................................................................................................................51.2 . Ramos Básicos da Estatística ..........................................................................................................................................51.3 . Tipos de Variáveis ..........................................................................................................................................................5
CAPÍTULO 2 – APRESENTAÇÃO DOS DADOS ............................................................................... 62.1 . Dados brutos ...................................................................................................................................................................62.2 . Rol...................................................................................................................................................................................62.3 . Distribuição de Freqüência Simples (variável discreta).................................................................................................72.4 . Distribuição de freqüência para dados agrupados em classes (variável contínua) .........................................................8
2.4.1 . Elementos de uma distribuição de freqüência para dados agrupados em classes....................................................82.4.1.1 . Freqüência Simples Absoluta ............................................................................................................................82.4.1.2 . Amplitude Total................................................................................................................................................82.4.1.3 . Limites de Classe ..............................................................................................................................................92.4.1.4 . Amplitude do Intervalo de Classe......................................................................................................................92.4.1.5 . Ponto Médio.......................................................................................................................................................9
2.4.2 . –Elaboração da tabela de freqüência para dados agrupados em classes :................................................................92.5 . –Tipos de Freqüência ....................................................................................................................................................11
2.5.1 . Freqüência Simples Absoluta................................................................................................................................12
2.5.2 . Freqüência Simples Relativa ii
ffrN
⎛ ⎞=⎜ ⎟⎝ ⎠
..........................................................................................................12
2.5.3 . Freqüência Acumulada..........................................................................................................................................122.5.4 . Freqüência Acumulada Relativa ..........................................................................................................................13
2.6 . Representação Gráfica ..................................................................................................................................................132.6.1 . Histograma ............................................................................................................................................................14
2.7 . Exercícios......................................................................................................................................................................142.8- Resposta dos exercícios 4 a 13 ......................................................................................................................................22
CAPÍTULO 3 - MEDIDAS TENDÊNCIA CENTRAL....................................................................... 233.1 . A Média Aritmética ......................................................................................................................................................23
3.1.1 – Média Aritmética Simples....................................................................................................................................233.1.2 . Média Aritmética Ponderada................................................................................................................................24
Exercício 1 ............................................................................................................................................................................253.2 . Média Aritmética para dados agrupados em classes .....................................................................................................263.3 . Propriedades da Média Aritmética................................................................................................................................28Exercício 2 ............................................................................................................................................................................293.4 . MEDIANA....................................................................................................................................................................31
3.4.1 . Mediana para dados brutos ou rol .........................................................................................................................313.4.2 . Mediana para dados agrupados em freqüência simples.........................................................................................333.4.3 . Mediana para dados agrupados em classes ...........................................................................................................34
Exercício 3 ............................................................................................................................................................................383.5 . MODA ..........................................................................................................................................................................39
3.5.1 . Moda para dados brutos ou rol ..............................................................................................................................393.5.2 . Moda para dados agrupados em freqüência ..........................................................................................................393.5.3 . Moda para dados agrupados em classe..................................................................................................................40
3.5.3.1 . Moda de Pearson..............................................................................................................................................403.5.3.2 . Moda de King ..................................................................................................................................................413.5.3.3 . Moda de Czuber...............................................................................................................................................41
Exercício 4 ............................................................................................................................................................................463.6 . Resposta dos exercícios do capítulo..............................................................................................................................47Exercício 1: ...........................................................................................................................................................................47Exercício 2: ...........................................................................................................................................................................47Exercício 3: ...........................................................................................................................................................................47Exercício 4: ...........................................................................................................................................................................48
APÊNDICE.............................................................................................................................................. 49
4
Cálculo das médias Geométrica e Harmônica.......................................................................................................................49Média Geométrica.................................................................................................................................................................49
Média Geométrica Simples ..............................................................................................................................................49Média Geométrica ponderada ..........................................................................................................................................49
Média Harmônica..................................................................................................................................................................50Média Harmônica Simples ...............................................................................................................................................50Média Harmônica Ponderada...........................................................................................................................................51
Exercícios..............................................................................................................................................................................51Resposta dos exercícios do apêndice ....................................................................................................................................52
CAPÍTULO 4 - SEPARATRIZES......................................................................................................... 534.1 . Introdução .....................................................................................................................................................................534.2 . Quartil ...........................................................................................................................................................................534.3 . Decil..............................................................................................................................................................................534.4 . Percentil ........................................................................................................................................................................544.5 . Cálculo de Separatrizes.................................................................................................................................................54
4.5.1 . Dados brutos ou Rol..............................................................................................................................................544.5.2 . Dados agrupados em freqüência simples ..............................................................................................................554.5.3 . Dados agrupados em classe...................................................................................................................................56
Exercícios..............................................................................................................................................................................584.6 . Resposta dos exercícios ................................................................................................................................................59
CAPÍTULO 5 – MEDIDAS DE DISPERSÃO ..................................................................................... 605.1 . Introdução .....................................................................................................................................................................605.2 . Amplitude Total ............................................................................................................................................................60
5.2.1 . Dados brutos ou rol ...............................................................................................................................................615.2.2 . Dados agrupados em freqüência simples ..............................................................................................................615.2.3 . Dados agrupados em classes .................................................................................................................................61
5.3 . Desvio Médio Simples ( )DMS ..................................................................................................................................625.3.1 . Dados brutos ou rol ...............................................................................................................................................625.3.2 . Dados agrupados em freqüência simples ..............................................................................................................635.3.3 . Dados agrupados em classes .................................................................................................................................64
5.4 . Variância e Desvio Padrão............................................................................................................................................655.4.1 . Dados brutos ou rol ...............................................................................................................................................655.4.2 . Dados agrupados em freqüência simples ..............................................................................................................665.4.3 . Dados agrupados em classes .................................................................................................................................67
5.5 . Interpretação do Desvio Padrão ....................................................................................................................................69Exercício 1 ............................................................................................................................................................................715.6 . Coeficiente de Variação ................................................................................................................................................72Exercício 2 ............................................................................................................................................................................725.7 . Resposta dos exercícios ................................................................................................................................................75Exercício 1 ............................................................................................................................................................................75Exercício 2 ............................................................................................................................................................................75
5
CAPÍTULO 1 - INTRODUÇÂO
1.1 . Definições
Estatística: É a ciência que cuida da coleta, da organização, da apresentação e da análise de dados.
Os dados consistem em informações provenientes de observações, contagens, medições ou respostas.
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, namedida em que não nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatísticaextrair informação dos dados para obter uma melhor compreensão das situações que representam.
A estatística é considerada Ciência no sentido do estudo de uma população. É considerada como método quandoutilizada como instrumento por outra ciência.
Existem dois tipos de conjuntos de dados usados na estatística. Tais conjuntos são chamados de população eamostra.
População: É a totalidade do conjunto que se deseja estudar.
Exemplo:População dos alunos matriculados na Universidade.População dos residentes no estado do Rio de Janeiro.
Amostra: É um subconjunto, não vazio, do conjunto que se pretende estudar (população). A amostra representativaé um retrato fidedigno da população. Ela preserva as características da população.
Amostragem: É o processo de formação de amostras. Existem vários processos de amostragem. O processo deamostragem pode ser feito com ou sem reposição de elementos.
Parâmetro: é uma característica numérica estabelecida para toda uma população.
Estimador: é uma característica numérica estabelecida para uma amostra.
1.2 . Ramos Básicos da Estatística
Descritiva (ou dedutiva): Cuida basicamente da descrição de dados observados, sem estabelecimento de testes dehipóteses sobre o conjunto estudado.
Inferência (ou indutiva): É o ramo da estatística no qual, através do estudo de informações da amostra, sãodefinidas e testadas hipóteses acerca da população estudada, através do cálculo de probabilidades.
1.3 . Tipos de Variáveis
Discreta: variável quantitativa cujos possíveis valores formam um conjunto finito ou enumerável de números e quegeralmente resultam de uma contagem, como por exemplo o número de filhos.
Contínua: variável cujos possíveis valores formam um intervalo de números reais e que resultam, normalmente, deuma mensuração, como por exemplo peso, altura e pressão arterial.
6
CAPÍTULO 2 – APRESENTAÇÃO DOS DADOS
2.1 . Dados brutos
Normalmente, na prática, os dados originais de uma série estatística não se encontram prontos para análise, por
estarem desorganizados. Por essa razão, costuma-se chamá-los de dados brutos. Tomemos como exemplo o quadro
1 abaixo, que contém as notas obtidas em uma prova de estatística por 60 alunos de uma sala de aula de uma certa
faculdade.
Quadro 1:
7 3 4 5 4 4 4 5 4 4 5 8
5 6 9 5 3 6 6 8 4 4 4 4
4 5 7 6 3 6 7 8 6 4 5 5
6 6 8 4 3 7 3 5 5 5 8 8
5 6 2 9 7 6 6 6 4 6 4 8
Como podemos observar, as notas estão dispostas de forma desordenada. Em razão disso, pouca informação se
consegue obter, até mesmo uma simples nota mínima e máxima requer um certo exame de todos os dados.
Assim, dado bruto é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de
um fenômeno coletivo.
2.2 . Rol
É uma lista ordenada dos dados brutos de uma série estatística. Essa ordenação pode ser crescente ou decrescente.
Utilizando o exemplo das notas de estatística. e ordenando as notas, vem:
Quadro 2:
2 3 3 3 3 3 4 4 4 4 4 4
4 4 4 4 4 4 4 4 4 5 5 5
5 5 5 5 5 5 5 5 5 6 6 6
6 6 6 6 6 6 6 6 6 6 7 7
7 7 7 8 8 8 8 8 8 8 9 9
7
2.3 . Distribuição de Freqüência Simples (variável discreta)
Em geral, o trabalho estatístico envolve uma grande massa de dados. Desta forma, a estatística descritiva opera de
modo a reduzir a quantidade de dados com os quais se vai trabalhar diretamente. Isto se torna possível modificando-
se a forma de apresentação dos dados.
Tomemos como exemplo as notas de estatística do quadro 2. Se entendermos como freqüência simples ( )if de
um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente
o número de elementos com os quais se vai trabalhar.
O resultado desta reorganização dos dados é chamado de Distribuição de Freqüência, e esta apresentado na tabela
1 abaixo.
Assim, uma distribuição de freqüência é uma representação tabular de um conjunto de valores em que colocamos na
1ª. coluna, em ordem crescente, apenas os valores distintos da série e na 2ª. coluna os valores das freqüências
simples correspondentes.
TABELA AUXILIAR TABELA 1
Grausobtidos
Contagem outabulação
Númerode
alunos1 0 0
2 1 0
3 2 1
4 3 5
5 4 15
6 5 12
7 6 13
8 7 5
9 8 7
10 9 2
11 10 0
total 60
Este tipo de apresentação é mais empregada quando o número de elementos distintos da série for pequeno.
Graus Obtidos Número dealunos
0 0
1 0
2 1
3 5
4 15
5 12
6 13
7 5
8 7
9 2
10 0
total 60
8
2.4 . Distribuição de freqüência para dados agrupados em classes (variável contínua)
Quando o número de elementos distintos de uma série for grande, devemos optar por agruparmos os dados emintervalos de classes. A tabela 2 abaixo apresenta um exemplo de dados agrupados em classes e suas respectivasfreqüências simples.
TABELA 2
Classe de Idades Freqüência ( )if
0 |⎯⎯ 10 5
210 |⎯⎯ 0 15
320 |⎯⎯ 0 20
430 |⎯⎯ 0 45
540 |⎯⎯ 0 100
Total 185
OBS.: O símbolo ( )|⎯⎯ significa fechado à esquerda (contém o valor) e aberto à direita (não contém o valor).
Cada uma das classes de idades apresentadas na tabela 2 ( ) , 1 2 , etc.0 |⎯⎯ 10 0 |⎯⎯ 0 é denominada de
Intervalo de Classe.
2.4.1 . Elementos de uma distribuição de freqüência para dados agrupados em classes
2.4.1.1 . Freqüência Simples AbsolutaA freqüência simples ( )if de uma classe ou de um valor é o número de observações correspondentes a essa classe
ou a esse valor. Na tabela 2:
1 2 3 4 55; 15; 20; 45 e 100 f f f f f= = = = =
2.4.1.2 . Amplitude TotalA amplitude total ( )At é a diferença entre o maior e o menor valor observado da variável. Sendo máxX o maior
elemento da seqüência e mínX o menor, temos: máx mínAt X X= − . Nos dados das notas da tabela 1 temos:
9 2 7At = − = , onde 9 é o maior valor observado e 2 o menor. Para as 185 pessoas agrupadas na tabela 2, se
tivéssemos uma idade mínima de 2 anos e uma idade máxima de 48 anos, a amplitude total dos dados seria:
48 2 46 At anos= − =
9
Entretanto, ao trabalharmos com uma massa muito grande de informações agrupadas em intervalos de classes,
calculamos a amplitude total como a diferença entre o ponto médio (veja definição a seguir) da última e da primeira
classes.
2.4.1.3 . Limites de Classe São os valores extremos de cada intervalo de classe. O menor valor da classe é denominado limite inferior ( )il e o
maior valor de limite superior ( )iL . Na tabela 2 temos:
4l é 30. (limite inferior da 4a. classe)
4L é 40. (limite superior da 4a. classe)
2.4.1.4 . Amplitude do Intervalo de ClasseA amplitude do intervalo de classe ( )ih é a diferença entre os limites superior e inferior da classe: i i ih L l= − .
Na tabela 2, a amplitude do intervalo de classe é constante e igual a 10.
10 - 0 = 20 - 10 = 30 - 20 = 40 - 30 = 50 - 40 = 10As classes não precisam necessariamente ter a mesma amplitude conforme nosso exemplo. Porém, sempre que
possível devemos trabalhar com classes de mesma amplitude. Isto facilita os cálculos posteriores.
2.4.1.5 . Ponto MédioO ponto médio ( )ix de uma classe é o valor representativo da classe. Para obter o ponto médio de uma classe,
basta somar os limites superior e inferior da classe e dividir por 2:
2i i
il Lx +
=
Na tabela 2 temos: 10 10 5
2x +
= = 210 20 15
2x +
= = 320 30 25
2x +
= =
430 40 35
2x +
= = 540 50 45
2x +
= =
2.4.2 . –Elaboração da tabela de freqüência para dados agrupados em classes :
O número de classes a ser utilizado em uma distribuição de freqüência depende muito da experiência do pesquisador
e das questões que ele pretende responder com a variável contínua. De modo geral, utiliza-se um mínimo de cinco e
um máximo de 20 classes. Um dos métodos para se determinar o número de classes de uma distribuição é o critério
da raiz, o qual será descrito a seguir:
Se a seqüência estatística estudada contém n elementos e se indicarmos por K o número de classes a ser utilizado
então, pelo critério de raiz: K n= .
10
Como K deve ser necessariamente um número inteiro e como dificilmente n é um número inteiro, utilizamos
para o valor de K o inteiro mais próximo de 1n ± .
A amplitude do intervalo de classe ( )h é determinada da seguinte forma: AthK
= .
Outra forma de determinarmos o número K é empregando a fórmula de Sturges: 1 3,3logK n= + .
Para valores de n muito grandes, esta fórmula apresenta mais vantagens que o critério da raiz, embora apresente o
mesmo problema de aproximação do valor de K .
Exemplo. Abaixo apresentamos a seqüência de valores referentes ao resultado de um teste de QI aplicado em
determinada classe de alunos de uma faculdade.
111 90 121 105 122 61 128 112 128 93
108 138 88 110 112 112 97 128 102 125
87 119 104 116 96 114 107 113 80 113
123 95 115 70 115 101 114 127 92 103
78 118 100 115 116 98 119 72 125 109
79 139 75 109 123 124 108 125 116 83
94 106 117 82 122 99 124 84 91 130
Inicialmente, verificamos que a série possui 70 elementos. Pelo critério da raiz K n= . No nosso exemplo,
70 8,37K = = . O valor inteiro mais próximo é 8. Portanto, temos opção para construir a variável contínua
com 7, 8 ou 9 classes.
O maior valor da seqüência é 139máxX = e o menor valor da seqüência é 61mínX = . Assim, a amplitude total
da seqüência é 139 61 78At = − = .
No entanto, sabemos que pelo fato de o critério adotado do intervalo de classe ser semi-aberto à direita, devemos
ajustar o valor máxX . Se o ajustássemos para 140, a amplitude ajustada passaria a ser 140 61 79At = − = . Este
valor não é divisível, de forma inteira, por 7, 8 ou 9, que são as opções de classes.
Nesta situação devemos ajustar máxX para 141 obtendo a 141 61 80At = − = que é divisível exatamente por 8,
obtendo-se uma amplitude de intervalo de classe h dada por: 80 108
AthK
= = = .
Observe que o ajuste do valor de máxX foi de duas unidades, passando de 139 para 141.
A experiência do pesquisador, nesta situação, o levaria a distribuir este erro de duas unidades, iniciando a
representação da série em 60 e terminando em 140. A amplitude total ajustada para a série é de
140 60 80At = − = .
11
A amplitude do intervalo de classe é 10h = e o número de classes é 8K = .
Computando as freqüências simples de cada classe, construímos a variável contínua representativa desta série.
Classe Intervalo de Classe if
1 760 |⎯⎯ 0 1
2 870 |⎯⎯ 0 5
3 980 |⎯⎯ 0 6
4 1090 |⎯⎯ 0 10
5 11100 |⎯⎯ 0 12
6 12110 |⎯⎯ 0 19
7 13120 |⎯⎯ 0 14
8 14130 |⎯⎯ 0 3
Total 70
Pela fórmula de Sturges 1 3,3log 70 7,088K = + =
2.5 . –Tipos de Freqüência
Uma vez que os dados sendo estudados já tenham sido colocados na forma de uma distribuição de freqüência,
algumas informações adicionais e úteis podem ser facilmente obtidas. Além da freqüência simples absoluta, já
citada anteriormente, outros tipos de freqüência podem ser extraídos da distribuição, conforme apresentado no
esquema abaixo:
( )( )
Absoluta Freqüência Simples
Relativa i
i
f
fr
⎧⎪⎨⎪⎩
( )( )
( )( )
Absoluta Abaixo de
Relativa
(crescente)Freqüência Acumulada
Absoluta Acima de
Relativa
(decrescente)
i
i
i
i
F
Fr
F
Fr
⎧ ⎧⎪⎪ ⎨⎪ ⎪⎩⎪⎪⎪⎨⎪ ⎧⎪⎪ ⎨⎪ ⎪⎩⎪⎪⎩
12
2.5.1 . Freqüência Simples Absoluta
Conforme visto anteriormente, é o número de observações correspondentes a uma classe ou a um valor.
A soma das freqüências simples absolutas é chamada de freqüência total, simbolizada por if N=∑ .
A partir daqui, toda vez que nos referirmos a freqüência de uma classe, estamos tratando da freqüência simples
absoluta.
2.5.2 . Freqüência Simples Relativa ii
ffrN
⎛ ⎞=⎜ ⎟⎝ ⎠
É o quociente entre a freqüência de determinada classe (ou valor) e a freqüência total.
ii
ffrN
⎛ ⎞=⎜ ⎟⎝ ⎠
ou ii
i
ffrf
⎛ ⎞=⎜ ⎟⎜ ⎟
⎝ ⎠∑
Desejando-se expressar o resultado em termos percentuais, multiplica-se o quociente obtido por 100.
( )% 100ii
ffrN
= ⋅
A soma das freqüências relativas é sempre igual a 1 ou 100%.
Exemplo:
Idades if ifr
0 |⎯⎯ 10 5 5 0,0270 ou 2,70%185 =
210 |⎯⎯ 0 15 15 0,0811 ou 8,11%185 =
320 |⎯⎯ 0 20 20 0,1081 ou 10,81%185 =
430 |⎯⎯ 0 45 45 0,2432 ou 24,32%185 =
540 |⎯⎯ 0 100 100 0,5406 ou 54,06%185 =
Total 185 1 ou 100%
2.5.3 . Freqüência Acumulada
Existem 2 tipos de freqüência acumulada, Abaixo de (ab) e Acima de (ac).
A freqüência acumulada Abaixo de uma classe ou de um valor é a soma das freqüências anteriores até a classe ou
valor, inclusive.
A freqüência acumulada Acima de uma classe ou de um valor é a soma das freqüências posteriores, além da classe
ou valor, inclusive.
Exemplo:
13
Idades if ( )iF ab ( )iF ac
0 |⎯⎯ 10 5 5 185
210 |⎯⎯ 0 15 20 180
320 |⎯⎯ 0 20 40 165
430 |⎯⎯ 0 45 85 145
540 |⎯⎯ 0 100 185 100
Total 185 - -
2.5.4 . Freqüência Acumulada Relativa
Da mesma forma que a acumulada absoluta, a acumulada relativa pode ser Abaixo de ou Acima de. Porém, ao
invés de acumular a freqüência absoluta, acumula-se a freqüência relativa, ou simplesmente divide-se cada valor
acumulado pela freqüência total.
Exemplo:
Idades if ( )iF ab ( ) %
iFr ab ( )iF ac ( ) %
iFr ac
0 |⎯⎯ 10 5 5 2,70 185 100
210 |⎯⎯ 0 15 20 10,81 180 97,30
320 |⎯⎯ 0 20 40 21,62 165 89,19
430 |⎯⎯ 0 45 85 45,94 145 78,38
540 |⎯⎯ 0 100 185 100 100 54,06
Total 185 - - - -
2.6 . Representação Gráfica
Existem muitas formas de se representar graficamente uma série estatística. No entanto, a maioria são gráficos de
apresentação. Nosso interesse está voltado para os gráficos de análise de séries estatísticas que são o Histograma e o
Polígono de Freqüência. Estes gráficos, por vezes, facilitam a identificação de padrões em um conjunto de dados
analisado.
14
2.6.1 . Histograma
O histograma é um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Este
gráfico é elaborado em um sistema de coordenadas cartesianas onde, no eixo das abscissas (horizontal) são
colocados os valores dos dados (ou suas classes), e no eixo das ordenadas (vertical) as respectivas freqüências.
Exemplo: Seja a seguinte série de dados e seu respectivo histograma:
Para uma distribuição de freqüência em classes, o histograma seria:
Faltas if
0 |⎯⎯ 2 3
42 |⎯⎯ 6
64 |⎯⎯ 8
86 |⎯⎯ 5
108 |⎯⎯ 2
2.7 . Exercícios
ix if
2 1
3 4
5 8
6 6
7 2
15
1) O Instituto Z realizou, em uma determinada Escola Municipal, pesquisas relacionadas ao desenvolvimento da
estatura de crianças e o meio sócio-econômico em que habitam.
A pesquisa foi feita com 80 crianças, numa faixa etária de 6 a 8 anos, sendo catalogadas, para estudo estatístico,
as seguintes estaturas apresentadas na tabela abaixo. Complete as colunas vazias com as informações
aprendidas.
Estatura
(cm) if %ifr ( )iF ab ( ) %
iFr ab ( )iF ac ( ) %
iFr ac
125 |⎯⎯ 130 10
135130 |⎯⎯ 15
14135 |⎯⎯ 0 25
145140 |⎯⎯ 10
15145 |⎯⎯ 0 15
155150 |⎯⎯ 5
Total 80 - - -
2) Abaixo encontra-se a distribuição de classes dos pesos dos alunos de educação física de uma escola do 2° grau,
que irão participar de um torneio olímpico. Complete a tabela.
Pesos
(Kg) if %ifr ( )iF ab ( ) %
iFr ab ( )iF ac ( ) %
iFr ac
45 |⎯⎯ 50 5
5550 |⎯⎯ 6
655 |⎯⎯ 0 11
6560 |⎯⎯ 13
765 |⎯⎯ 0 7
7570 |⎯⎯ 8
Total 50 - - -
16
3) Através das médias finais de estatística de 90 alunos, construiu-se uma tabela de distribuição de freqüências.
Complete as colunas faltantes.
Notas if %ifr ( )iF ab ( ) %
iFr ab ( )iF ac ( ) %
iFr ac
51 |⎯⎯ 58 2
6558 |⎯⎯ 6
7265 |⎯⎯ 14
7972 |⎯⎯ 29
8679 |⎯⎯ 23
9386 |⎯⎯ 11
10093 |⎯⎯ 5
Total 90 - - -
4) Uma indústria, interessada em verificar o total de horas-extras trabalhadas pelos seus técnicos na área de
produção, fez um levantamento dos dados, encontrando a seguinte distribuição:
Horas if %ifr iF %iFr
10 |⎯⎯ 17 18
2417 |⎯⎯ 16
3124 |⎯⎯ 24
3831 |⎯⎯ 31
4538 |⎯⎯ 26
5245 |⎯⎯ 28
17
Total 143 - -
Complete a tabela e responda:
a) Quantos técnicos fizeram horas-extras abaixo de 24 horas no mês anterior?
b) Qual a percentagem de técnicos que fizeram horas-extras no mês anterior igual ou superior a 38 horas?
c) Qual a porcentagem de técnicos que fizeram horas-extras no mês anterior entre 31 e 38 horas?
d) Quantos técnicos fizeram horas-extras no mês anterior entre 17 horas e 45 horas?
5) Uma fábrica, com um total de 150 operários, verificou um alto índice de faltas nos últimos 6 meses. O gerente,
preocupado com esta situação, fez um levantamento verificando a seguinte distribuição:
Faltas if %ifr iF %iFr
0 |⎯⎯ 2 60
42 |⎯⎯ 30
64 |⎯⎯ 30
86 |⎯⎯ 15
108 |⎯⎯ 15
Total 150 - -
Complete a tabela e responda:
a) Quantos operários tiveram nos últimos 6 meses menos de 6 faltas?
b) Qual a porcentagem de operários com número de faltas igual ou superior a 6?
c) Qual a porcentagem de operários que tiveram entre 6 e 8 faltas?
d) Qual a porcentagem de operários que tiveram entre 2 e 8 faltas?
6) Uma indústria de autopeças estava interessada em estabelecer uma gratificação aos operários que mais se
destacassem no setor da produção. Para isto, fez um levantamento sobre a produção homem/hora, encontrando
os seguintes dados:
Peças if %ifr iF %iFr
1260 |⎯⎯ 1292 12
13241292 |⎯⎯ 7
13561324 |⎯⎯ 14
13881356 |⎯⎯ 7
18
14201388 |⎯⎯ 18
14521420 |⎯⎯ 42
Total 100 - -
Complete a tabela e responda:
a) Quantos operários produziram abaixo de 1356 peças?
b) Qual a porcentagem de operários cuja produção ficou entre 1324 e 1356 peças?
c) Qual a porcentagem de operários cuja produção foi igual ou superior a 1356 peças?
d) Quantos operários tiveram produção entre 1292 e 1420 peças?
7) Interessado em fazer uma reavaliação dos vencimentos de seus funcionários, o dono de uma empresa listou todos
os salários, encontrando os seguintes dados:
Sal. mínimo if %ifr iF %iFr
0 |⎯⎯ 2 37
42 |⎯⎯ 22
64 |⎯⎯ 10
86 |⎯⎯ 6
108 |⎯⎯ 5
Total 80 - -
Complete a tabela e responda:
a) Quantos funcionários ganham abaixo de 6 S. M?
b) Qual a proporção de funcionários com salários iguais ou acima de 4 S. M?
c) Qual a porcentagem de funcionários com salários entre 2 e 8 S. M?
d) Qual a porcentagem de funcionários com salários abaixo de 8 S. M?
e) Quantos funcionários ganham entre 6 e 10 S. M?
8) O Setor de controle de Qualidade de uma indústria de peças de televisão estava interessado em verificar o tempode duração de seu produto. Para isto, selecionou uma amostra de 100 peças, e testou a duração em número dehoras, encontrando a seguinte distribuição em centenas de horas:
Centenas de horas if %ifr iF %iFr
360 |⎯⎯ 452 8
544452 |⎯⎯ 6
19
636544 |⎯⎯ 9
728636 |⎯⎯ 17
820728 |⎯⎯ 23
912820 |⎯⎯ 17
1004912 |⎯⎯ 20
Total 100 - -
Complete a tabela e responda:
a) Quantas peças tiveram duração abaixo de 636 centenas de horas?
b) Qual a proporção de peças que tiveram duração igual ou superior a 728 centenas de horas?
c) Qual a porcentagem de peças que tiveram duração entre 636 e 728 centenas de horas?
d) Quantas peças tiveram duração entre 544 e 820 centenas de horas?
9) Um certo fabricante de cabos de aço estava interessado em verificar a carga máxima suportada pelos cabos
produzidos pela sua fábrica. Para tal, selecionou uma amostra de 50 cabos de aço, encontrando a seguinte
distribuição dos pesos em toneladas:
Toneladas if %ifr iF %iFr
9,3 |⎯⎯ 9,9 4
10,59,9 |⎯⎯ 8
11,110,5 |⎯⎯ 18
11,711,1 |⎯⎯ 12
12,311,7 |⎯⎯ 8
Total 50 - -
Complete a tabela e responda:
a) Quantos cabos de aço suportaram pesos de 10,5 toneladas?
b) Qual a porcentagem de cabos de aço que suportaram pesos iguais ou superiores a 11,1 toneladas?
c) Qual a porcentagem de cabos de aço que suportaram pesos entre 10,5 e 11,1 toneladas?
d) Quantos cabos de aço suportaram pesos entre 9,9 e 11,7 toneladas?
10) Interessado em incrementar o seu quadro de vendas, o diretor de uma indústria de eletrodomésticos apurou o
total de unidades vendidas no último mês, para cada vendedor, encontrando os seguintes resultados:
20
Unidades vendidas if %ifr iF %iFr
18 |⎯⎯ 24 5
3024 |⎯⎯ 6
3630 |⎯⎯ 8
4236 |⎯⎯ 14
4842 |⎯⎯ 6
5448 |⎯⎯ 8
6054 |⎯⎯ 3
Total 50 - -
Complete a tabela e responda:
a) Quantos vendedores tiveram no último mês, vendas abaixo de 42 unidades?
b) Qual a porcentagem de vendedores que no último mês venderam 36 unidades ou mais?
c) Qual a porcentagem de vendedores que no último mês venderam entre 36 e 42 unidades?
d) Quantos vendedores tiveram no último mês, vendas entre 30 e 54 unidades?
11) Um escritório de contabilidade, com um cadastro de 50 empresas do ramo imobiliário, resolveu fazer um
levantamento sobre o Capital Imobilizado nas empresas, encontrando a seguinte distribuição em centenas de
reais:
Centenas R$ if %ifr iF %iFr
400 |⎯⎯ 500 6
600500 |⎯⎯ 4
700600 |⎯⎯ 12
800700 |⎯⎯ 8
21
900800 |⎯⎯ 7
1000900 |⎯⎯ 13
Total 50 - -
Complete a tabela e responda:
a) Quantas empresas tem capital imobilizado abaixo de R$ 70.000,00?
b) Qual a porcentagem de empresas cujo capital imobilizado está entre R$ 60.000,00 e R$ 70.000,00?
c) Qual a porcentagem de empresas com capital imobilizado igual ou superior a R$ 70.000,00?
d) Qual a porcentagem de empresas com capital imobilizado entre R$ 50.000,00 e R$ 90.000,00?
12) O escritório de contabilidade mencionado anteriormente, verificando as despesas operacionais dessas 50
empresas no exercício do ano anterior, encontrou a seguinte distribuição (em centenas de reais)
Centenas R$ if %ifr iF %iFr
40 |⎯⎯ 43 7
4643 |⎯⎯ 9
4946 |⎯⎯ 8
5249 |⎯⎯ 7
5552 |⎯⎯ 9
5855 |⎯⎯ 10
Total 50 - -
Complete a tabela e responda:
a) Quantas empresas tiveram despesas operacionais abaixo de R$ 4.900,00?
b) Qual a porcentagem de empresas com despesas operacionais entre R$ 4.600,00 e R$ 4.900,00?
c) Qual a porcentagem de empresas com despesas operacionais iguais ou superiores a R$ 4.600,00?
d) Qual a porcentagem de empresas com despesas operacionais entre R$ 4.300,00 e R$ 5.500,00?
13) Um empresário, com 60 filiais de sua empresa distribuídas por todo país, chamou o seu Contador para que lhe
desse a situação do ativo imobilizado das filiais em 31 de dezembro do ano anterior. Através de contatos com os
gerentes, encontrou-se a seguinte distribuição:
Centenas R$ if %ifr iF %iFr
200 |⎯⎯ 260 14
22
320260 |⎯⎯ 12
380320 |⎯⎯ 14
440380 |⎯⎯ 9
500440 |⎯⎯ 11
Total 60 - -
Complete a tabela e responda:
a) Quantas filiais tiveram a posição do seu ativo imobilizado igual ou superior a R$ 32.000,00 na data?
b) Qual a proporção de filiais com ativo imobilizado inferior a R$ 44.000,00?
c) Qual a porcentagem de filiais com ativo imobilizado entre R$ 32.000,00 e R$ 38.000,00?
d) Qual a porcentagem de filiais com ativo imobilizado entre R$ 26.000,00 e R$ 44.000,00?
2.8- Resposta dos exercícios 4 a 13
a b c d e4 34 técnicos 37,7622% 21,6784% 97 técnicos5 120 operários 20% 10% 50%6 33 operários 14% 67% 46 operários7 69 funcionários 26,25% 47,5% 93,75% 11 funcionários8 23 peças 60% 17% 49 peças9 38 cabos 40% 36% 38 cabos
10 33 vendedores 62% 28% 36vendedores
11 22 empresas 24% 56% 62%12 24 empresas 16% 68% 66%13 34 filiais 81,6667% 23,3333% 58,3333%
23
CAPÍTULO 3 - MEDIDAS TENDÊNCIA CENTRAL
No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizam.
Estas medidas, quando bem interpretadas, podem fornecer informações muito valiosas com respeito a série
estatística.
Em resumo, podemos reduzi-la a alguns valores, cuja interpretação fornece uma compreensão bastante precisa da
série.
As medidas de tendência central são alguns destes valores, as quais estão compreendidas entre o menor e o maior
valor da série. Uma medida de tendência central é também um valor em torno do qual os elementos da série estão
distribuídos e a posiciona em relação ao eixo horizontal.
Em suma, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série
se concentra.
As principais medidas de tendência central são: média, mediana e moda.
Do ponto de vista teórico, vários tipos de médias podem ser calculados para uma massa de dados. Em nosso estudo
focalizaremos a principal delas, a média aritmética. Ao final do capítulo falaremos sobre as médias geométrica e
harmônica.
3.1 . A Média Aritmética
A média aritmética é o ponto de equilíbrio de uma distribuição de dados, ou seja, é o ponto que representa todos os
dados da distribuição.
Apesar de a média aritmética ser uma medida muito utilizada na prática, deve-se tomar cuidado na sua aplicação,
uma vez que ela é bastante afetada pelos valores extremos da distribuição.
A média aritmética é representada por µ , quando se tratar de uma população, e x , quando se tratar de uma
amostra.
Conforme vimos no capítulo anterior, os dados representativos de uma série estatística podem ser apresentados sem
nenhuma ordenação (dados brutos), ordenados de forma crescente ou decrescente (rol), em uma distribuição de
freqüência simples (valor a valor), ou agrupados em classes. Independente da forma de apresentação, podemos
calcular a média dos dados segundo as formas a seguir
3.1.1 – Média Aritmética Simples
A média aritmética, ou média, de um conjunto de N números 1 2, , , nx x x é definido por:
1 2 in xx x xxN N
µ + + += = = ∑
24
A fórmula acima é utilizada quando temos dados brutos ou rol.
Exemplo
1) Determinar a média aritmética para as séries abaixo, obtidas de uma amostra:
a) { }1, 1, 3, 4, 4
1 1 3 4 4 13 2,65 5
x + + + += = =
b) { }0,2; 3,4; 4,1
0,2 3,4 4,1 7,7 2,56673 3
x + += = =
c) { }1 2 2 4, , , 2 3 5 5
1 2 2 415 20 12 242 3 5 5 0,5917
4 120x
+ + + + + += = =
2) A média mínima de aprovação em estatística é 5.0. Um estudante obtém as notas 8,5; 8,5; 9,0; 4,0; 4,0; 4,0; 0;
2,5 nos trabalhos mensais da disciplina. Determine se ele foi aprovado ou não.
8,5 8,5 9,0 4,0 4,0 4,0 0 2,5 40,5 5,068 8
µ + + + + + + += = =
Como a média do estudante foi 5,06, que é superior a média de aprovação (5,0), ele foi aprovado.
3.1.2 . Média Aritmética Ponderada
Se os valores 1 2, , , nx x x de uma distribuição são afetados por pesos (ou freqüências) 1 2, , , nf f f , então:
1 1 2 2
1 2
i in n
n i
x fx f x f x fxf f f f
µ + + += = =
+ + +∑∑
Empregamos esta fórmula no cálculo da média em dados apresentados sob a forma de distribuição de freqüência,
sendo os pesos de cada atributo suas freqüências. No caso dos dados agrupados em classes, as freqüências
empregadas no cálculo da média são os pontos médios de cada classe, conforme veremos a seguir.
25
Exemplo:
1) Em um exame de matemática, português e inglês, com pesos 3, 2 e 1 respectivamente, uma estudante obteve as
seguintes notas nas provas 60, 70 e 80 . Seu grau médio é:
3 60 2 70 1 80 180 140 80 400 66,676 6 6
µ ⋅ + ⋅ + ⋅ + += = = =
2) Determine a média final de um aluno que tirou 4 em português, 5 em matemática, 7 em geografia e 8 em história,
sabendo que os pesos das respectivas disciplinas são 2, 3, 1 e 1, respectivamente.
4 2 5 3 7 1 8 1 8 15 7 8 5,437 7
µ ⋅ + ⋅ + ⋅ + ⋅ + + += = =
3) Através de uma amostra realizou-se um levantamento das idades de 20 alunos, relacionados na tabela abaixo.
Determine a idade média.
18 2 20 7 22 5 25 6 36 140 110 150 436 21,8 22 anos20 20 20
x ⋅ + ⋅ + ⋅ + ⋅ + + += = = = ≈
Exercício 1
1) Calcular a média aritmética das séries abaixo:
a) 2, 3, 5, 6, 8
b) 10, 12, 15, 17, 22
c) 5, 8, 9, 10, 4, 3, 2
d) 4, 5, 7, 8, 10, 12, 14
ix (anos) if
18 2
20 7
22 5
25 6
Total 20
26
2) Calcular a média aritmética das séries abaixo:
a) 3, 2, 3, 2, 4, 4, 4, 5, 5, 5, 6
b) 1, 1, 1, 2, 2, 10, 10, 10
3) Calcule a média aritmética das distribuições abaixo:
a) b)
3.2 . Média Aritmética para dados agrupados em classes
Para dados agrupados em classes, utilizaremos a fórmula da média aritmética ponderada, considerando as
freqüências simples das classes como sendo as ponderações dos pontos médios destas classes. Assim, teremos:
i i
i
x fx
fµ = = ∑
∑
Exemplo:
1) Determinar a média aritmética da distribuição mostrada abaixo:
Estatura
(cm) if ix i ix f
125 |⎯⎯ 130 10 127,5 1.275,0
135130 |⎯⎯ 15 132,5 1.987,5
14135 |⎯⎯ 0 25 137,5 3.437,5
145140 |⎯⎯ 10 142,5 1.425,0
15145 |⎯⎯ 0 15 147,5 2.212,5
155150 |⎯⎯ 5 152,5 762,5
Total 80 - 11.100
ix if
1 7
3 3
4 2
Total 12
ix if
2 4
4 2
5 1
Total 7
27
Altura média: 11.100 138,75
80i i
i
x fx cm
f= = =∑
∑Quando agrupamos os dados na disposição de uma variável contínua, passamos a trabalhar com os dados sem
conhecimento de seus valores individuais.
Note no exemplo acima, que o máximo que podemos afirmar com respeito ao menor valor desta série é que ele é um
valor maior ou igual a 125 e menor que 130. Mas não conhecemos seu valor individualizado.
O mesmo ocorre com todos os outro valores da série.
Este fato é que nos leva a substituir as classes pelos seus pontos médios ao calcular a média da série.
2) Determinee o peso médio referente aos dados da tabela abaixo:
Pesos
(Kg) if ix i ix f
45 |⎯⎯ 50 5 47,5 237,5
5550 |⎯⎯ 6 52,5 315,0
655 |⎯⎯ 0 11 57,5 632,5
6560 |⎯⎯ 13 62,5 812,5
765 |⎯⎯ 0 7 67,5 472,5
7570 |⎯⎯ 8 72,5 580,0
Total 50 - 3.050
Peso médio: 3.050 61
50i i
i
x fx Kg
f= = =∑
∑
28
3) Determine a média aritmética da tabela de freqüência abaixo:
Notas if ix i ix f
51 |⎯⎯ 58 2 54,5 109,0
6558 |⎯⎯ 6 61,5 369,0
7265 |⎯⎯ 14 68,5 959,0
7972 |⎯⎯ 29 75,5 2.189,5
8679 |⎯⎯ 23 82,5 1.897,5
9386 |⎯⎯ 11 89,5 984,5
10093 |⎯⎯ 5 96,5 482,5
Total 90 - 6.991
Nota média: 6.991 77,67
90x = =
3.3 . Propriedades da Média Aritmética
a) A soma dos desvios de um conjunto de números em relação a média aritmética é zero.
( )1
0N
ii
x x=
− =∑ ou ( )1
0N
i ii
x x f=
− =∑
b) A soma dos quadrados dos desvios de um conjunto de números em relação a média é mínimo.
( ) ( )2 2
01 1
N N
i ii i
x x x x= =
− ⟨ −∑ ∑ ou ( ) ( )2 2
01 1
N N
i i i ii i
x x f x x f= =
− ⟨ −∑ ∑
onde 0x é um valor arbitrário qualquer, 0x x≠ .
c) Se 1n números tem média 1x , 2n números tem média 2x , ..., kn números tem média kx , a média do conjunto
formado por todos os números é dada pela expressão:
1 1 2 2 1
1 2
1
k
i ik k i
kk
ii
n xn x n x n xx
n n n n
=
=
+ + += =
+ + +
∑
∑
d) Se somarmos ou subtrairmos uma constante k a cada um dos elementos 1 2, , , nx x x de um conjunto, a
média ficará somada ou subtraída pela constante k .
29
e) Se multiplicarmos ou dividirmos cada elemento 1 2, , , nx x x de um conjunto por uma constante k , a média
ficará multiplicada ou dividida por esta constante.
Exercício 2
1) A média mínima de aprovação em Estatística é 5,0. Se um estudante obtém as notas 8,5; 9,0; 4,0; 4,0; 0 e 2,5 nos
trabalhos mensais da disciplina, ele foi aprovado ou reprovado? Caso o professor dê 1 ponto em cada nota, qual
seria a nova nota média?
2) As provas de Estatística tem os seguintes pesos 3, 2 e 1 respectivamente para a 1a, 2a e 3a. provas. Se um aluno
obteve 8 na 1a. prova, 6,5 na segunda e 0 na 3a. prova, e, sabendo-se que a média de aprovação é 5, verificar se este
aluno foi aprovado. Explique:
3) O salário médio de uma empresa é R$ 300,00. Se o dono da empresa der de gratificação natalina um abono de
R$ 50,00 no mês de dezembro, qual será o novo salário médio neste mês?
4) Uma determinada indústria, verificando que a sua produção triplicou devido ao esforço de seus operários,
resolveu duplicar os salários. Sabendo-se que o salário médio pago por essa indústria era de R$500,00, qual será o
novo salário médio?
5) Um determinado órgão público pagava, em média, a seus funcionários, a quantia de R$ 1.000,00 por mês. O
governo resolveu aumentar a alíquota de contribuição para a previdência de 10% para 15%. Qual será o novo
salário médio pago por esse órgão?
6) Calcule a média de horas-extras trabalhadas pelos técnicos no mês anterior, registradas na tabela do exercício 4
do capítulo 2, reproduzida abaixo.
Horas if ix i ix f
10 |⎯⎯ 17 18
2417 |⎯⎯ 16
3124 |⎯⎯ 24
3831 |⎯⎯ 31
4538 |⎯⎯ 26
5245 |⎯⎯ 28
Total 143 -
30
7) Calcule o número médio de faltas de 150 operários nos últimos 6 meses, registradas na tabela do exercício 5 do
capítulo 2, reproduzida abaixo.
Faltas if ix i ix f
0 |⎯⎯ 2 60
42 |⎯⎯ 30
64 |⎯⎯ 30
86 |⎯⎯ 15
108 |⎯⎯ 15
Total 150 -
8) Determine o número médio de peças produzidas por 100 operários no Setor de produção de uma fábrica,
registradas na Tabela do exercício 6 do capítulo 2, reproduzida abaixo.
Peças if ix i ix f
1260 |⎯⎯ 1292 12
13241292 |⎯⎯ 7
13561324 |⎯⎯ 14
13881356 |⎯⎯ 7
14201388 |⎯⎯ 18
14521420 |⎯⎯ 42
Total 100 -
9) Determine o salário médio de 80 funcionários de uma empresa, registradas na Tabela do exercício 7 do capítulo
2, reproduzida abaixo.
Sal. mínimo if ix i ix f
0 |⎯⎯ 2 37
42 |⎯⎯ 22
64 |⎯⎯ 10
86 |⎯⎯ 6
108 |⎯⎯ 5
Total 80 -
31
10) Calcule o tempo de duração médio de 100 peças de televisão produzidas por uma indústria, registradas na
Tabela do exercício 8 do capítulo 2, reproduzida abaixo.
Centenas de horas if ix i ix f
360 |⎯⎯ 452 8
544452 |⎯⎯ 6
636544 |⎯⎯ 9
728636 |⎯⎯ 17
820728 |⎯⎯ 23
912820 |⎯⎯ 17
1004912 |⎯⎯ 20
Total 100 -
11) Determine a carga média máxima suportada por cabos de aço produzidos por uma fábrica, cujos pesos estão
registradas na Tabela do exercício 9 do capítulo 2, reproduzida abaixo.
Toneladas if ix i ix f
9,3 |⎯⎯ 9,9 4
10,59,9 |⎯⎯ 8
11,110,5 |⎯⎯ 18
11,711,1 |⎯⎯ 12
12,311,7 |⎯⎯ 8
Total 50 -
3.4 . MEDIANA
A mediana ( )Md é um valor que separa uma distribuição em duas partes, deixando à sua esquerda o mesmo
número de elementos que à sua direita.
3.4.1 . Mediana para dados brutos ou rol
Para o cálculo da mediana deve-se, inicialmente, ordena os dados.
32
Quando a série de dados é constituída de um número ( )n ímpar de elementos, a mediana ocupa a posição
12
on +⎛ ⎞⎜ ⎟⎝ ⎠
.
Exemplo: O conjunto de números 1, 2, 3, 4, 4, 5, 6, 8, 9 tem como mediana:
9 1 5 (quinto elemento)2MdP +
= =
4Md =
Quando a série de dados é constituída de um número ( )n par de elementos tem-se 2 elementos centrais, que
ocupam as posições 2
on⎛ ⎞⎜ ⎟⎝ ⎠
e 12
on⎛ ⎞+⎜ ⎟⎝ ⎠
. A mediana é convencionada como sendo a média dos valores que ocupam
estas posições centrais. Cabe ressaltar que o valor da mediana pode não coincidir com os valores observados.
Exemplo: O conjunto de números 0, 1, 1, 3, 4, 5, 6, 7, 9, 9 tem mediana :
9 1 5 (quinto elemento) e2
10 1 6 (sexto elemento)2
MdP += =
= + =
4 5 4,52
Md += =
Observação: Para calcular a posição da mediana, independente do número de elementos da série (par ou ímpar),
calcula-se este como sendo 1
2MdnP +
= . Sendo n ímpar, obteremos diretamente em que posição na série se
encontra ao valor da mediana. Sendo n par, o valor da mediana será a média entre os elementos vizinhos aquele
apontado.
Exemplo: Sejam as séries de valores: : 2, 8, 12, 12, 20, 20, 23A e : 7, 8, 9, 10, 13, 13, 15, 21B .
Na série A temos 7n = elementos. A mediana ocupa a posição 1 7 1 4
2 2MdnP + +
= = = . Ou seja, a mediana é
o quarto elemento da série. Logo, 12Md = .
Ns série B temos 8n = elementos. A mediana ocupa a posição 1 8 1 4,5
2 2MdnP + +
= = = . Ou seja, a mediana
ocupa a posição 4,5, isto é, está situada entre o quarto e o quinto elemento da série. Logo,
10 13 23 11,52 2
Md += = = .
33
3.4.2 . Mediana para dados agrupados em freqüência simples
Para o cálculo da mediana de dados agrupados em freqüência (variável discreta), basta verificar se o número de
elementos da série é par ou ímpar e aplicar o mesmo raciocínio do caso anterior. De modo a facilitar a localização
dos termos centrais, devemos construir a freqüência acumulada da série.
Exemplo:
1)
115 82Md
nn P += ⇒ = =
Construindo a freqüência acumulada podemos localizar com facilidade o oitavo elemento da série.
Note que o elemento que ocupa a 1ª. posição na série é 20. Em seguida aparecem 5 elementos iguais a 22. Estes
elementos ocupam as posições de 2º a 6º elementos na série. Depois aparecem mais 9 elementos iguais a 25 que
ocupam na série as pocições de 7º a 15º elementos.
Conseqüentemente, o elemento que ocupa a 8ª posição vale 25, e podemos afirmar que a mediana é 25.
2)
1 1312 6,52 2Md
nn P += ⇒ = = =
A mediana está situada entre o 6º e o 7º elemento, e será a média aritmética destes dois valores.
1.000 1.000 1.0002
Md += =
ix
(anos)
if
(alunos)
iF
20 1 1
22 5 6
25 9 15
Total 15 -
ix
(salários)
if
(empregados)
iF
1.000,00 8 8
2.000,00 2 10
5.000,00 2 12
Total 12 -
34
3)
10 110 5,52Mdn P +
= ⇒ = =
A mediana está situada entre o 5º e o 6º elemento da série.
180 185 182,5 cm2
Md += =
3.4.3 . Mediana para dados agrupados em classes
Para o cálculo da mediana de dados agrupados em classes (variável contínua), o raciocínio anterior não pode ser
utilizado, uma vez que mesmo identificando a posição da mediana na série, o valor do elemento da série que ocupa
esta posição não é identificável. Utilizaremos um exemplo para generalizar a fórmula de cálculo da mediana.
Considere a seguinte distribuição de freqüência:
Classes if iF
3 |⎯⎯ 6 2 2
96 |⎯⎯ 5 7
129 |⎯⎯ 8 15
1512 |⎯⎯ 3 18
1815 |⎯⎯ 1 19
Total 19 -
O número de elementos da série é 19in f= =∑ .
A mediana, por definição, separa o número de elementos da série em dois grupos, contendo cada um deles 50% dos
elementos.
ix
(alturas)
if
(alunos)
iF
150 3 3
180 2 5
185 5 10
Total 10 -
35
Portanto, a posição da mediana na série é 2n
. No exemplo 19 9,52
oo⎛ ⎞ =⎜ ⎟
⎝ ⎠.
O valor decimal 9,5 indica que a mediana é um elemento posicionado entre o nono e o décimo elemento da série.
Observando a freqüência acumulada para identificar em qual classe estão situados o nono e o décimo elemento da
série, notamos que estes estão posicionados na terceira classe, o que indica que a median é um valor compreendido
entre 9 e 12. A classe que contém a mediana será identificada como classe mediana.
Este intervalo de três unidades contém 8 elementos. Supondo que eles estão uniformemente distribuídos neste
intervalo, então poderemeos dividir este intrevalo de modo proporcional à posição da mediana na série.
7ª 9,5a 15ª
|--------------------|--------------------|
9 x Md 12
Ou seja: 15 7 9,5 7
3 x− −
= . Simplificando: 8 9,5 7 9,5 7 33 8
xx− −
= ⇒ = ⋅
Portanto:
9Md x= +
9,5 79 38
Md −= + ⋅ 9,9375Md =
Observando na fórmula em destaque acima que:
• 9 é o limite inferior da classe mediana;
• 9,5 é a metade dos elementos da série, isto é, 2n ;
• 7 é a freqüência acumulada da classe anterior à classe mediana;
• 8 é a freqüência simples da classe mediana;
• 3 é a amplitude do intervalo de classe.
Podemos generalizar a fórmula de cálculo da mediana para variável contínua como:
2 i
ii
n F antMd l h
f md
−= + ⋅
36
Onde:
il = limite inferior da classe mediana
n = número de elementos da série
iF ant = freqüência acumulada da classe anterior à classe mediana
if md = freqüência simples da classe mediana
h = amplitude do intervalo de classe.
Observação: Devido às condições impostas na obtenção da fórmula da mediana, fica evidente que o valor obtido
por esta é um valor aproximado do verdadeiro valor da mediana da série.
De modo geral, todas as medidas calculadas para uma variável contínua serão valores aproximados para estas
medidas, uma vez que ao agruparmos os dados segundo uma variável contínua, há perda de informações quanto a
identidade dos dados.
Exemplo:
1) Determinar a mediana para as seguintes distribuições abaixo:
a)
Estatura
(cm) if iF
125 |⎯⎯ 130 10 10
135130 |⎯⎯ 15 25
14135 |⎯⎯ 0 25 50
145140 |⎯⎯ 10 60
15145 |⎯⎯ 0 15 75
155150 |⎯⎯ 5 80
Total 80 -
80 402 2
oMd
nP = = =
Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a terceira. Aplicando a
fórmula, a mediana é:
40 25 15135 5 135 5 135 3 13825 25
Md cm−= + ⋅ = + ⋅ = + =
37
b)
Pesos
(Kg) if iF
45 |⎯⎯ 50 5 5
5550 |⎯⎯ 6 11
655 |⎯⎯ 0 11 22
6560 |⎯⎯ 13 35
765 |⎯⎯ 0 7 42
7570 |⎯⎯ 8 50
Total 50 -
50 252 2
oMd
nP = = =
Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a quarta. Aplicando a
fórmula, a mediana é:
25 22 360 5 60 5 60 1,15 61,1513 13
Md Kg−= + ⋅ = + ⋅ = + =
c)
Notas if iF
51 |⎯⎯ 58 2 2
6558 |⎯⎯ 6 8
7265 |⎯⎯ 14 22
7972 |⎯⎯ 29 51
8679 |⎯⎯ 23 74
9386 |⎯⎯ 11 85
10093 |⎯⎯ 5 90
Total 90 -
90 452 2
oMd
nP = = =
Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a quarta. Aplicando a
fórmula, a mediana é:
38
45 22 2372 7 72 7 72 5,55 77,5529 29
Md −= + ⋅ = + ⋅ = + =
Exercício 3
1) Uma empresa possui três filiais, representadas pelas letras A, B, C. Através de um levantamento sobre as faltas
do último ano, verificou-se as seguintes distribuições:
A: 7, 5, 6, 1, 3, 8, 10
B: 10, 9, 1, 3, 0, 4, 6, 8
C: 0, 10, 1, 3, 9, 7, 6, 5, 8, 6
Determine o número de faltas considerada mediana para cada filial.
2) Determinar a mediana para as séries representadas nas tabelas abaixo:
a) b)
c)
3) Determinar o valor da mediana das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.
Alturas
(cm) if
160 5
175 2
180 3
Total 10
Idade if
20 7
25 2
28 6
Total 15
Reais if
150,00 3
180,00 10
285,00 5
Total 18
39
3.5 . MODA
A moda ( )Mo é o valor de maior freqüência em um conjunto de dados.
3.5.1 . Moda para dados brutos ou rol
Vamos identificar a moda para um rol, através dos seguintes exemplos:
1) X = 4, 5, 5, 6,6 6, 7, 7, 8, 8
O valor mais freqüente é 6. Portanto, 6Mo = . Esta é uma seqüência unimodal.
2) Y = 2, 3, 4, 5, 6
Como todos os elementos da série têm a mesma freqüência, não há um que se destaque pela maior freqüência.
Assim, diremos que a série é amodal, ou seja, não tem moda.
3) Z = 2, 4, 4, 4, 6, 7, 8, 8, 8, 9
Esta seqüência apresenta os elementos 4 e 8 como elementos de maior freqüência. Portanto, 4Mo = e 8Mo = .
Esta é uma seqüência bimodal.
3.5.2 . Moda para dados agrupados em freqüência
Nesta situação, como as freqüências já estão computadas na segunda coluna, a moda será o valor da variável
correspondente a maior freqüência da tabela.
Exemplo:
1)
Maior freqüência = 8 25 anosMo⇒ = ⇒ Unimodal
Idade if
20 2
22 4
25 8
Total 14
40
2)
Maior freqüência = 8 R$1.000,00 e R$5.000,00Mo⇒ = ⇒ Bimodal
3)
Maior freqüência = não há ⇒ Amodal
3.5.3 . Moda para dados agrupados em classe
Para determinar a moda de uma série de dados agrupados em classes, podemos optar por vários processos. Daremos
destaque para a moda de Pearson, a moda de King e a moda de Czuber.
3.5.3.1 . Moda de Pearson
A moda de uma variável contínua pode ser obtida através do valor da média e da mediana.
3 2Mo Md x= −Exemplo:
Classes if ix i ix f
0 |⎯⎯ 10 1 5 5
2010 |⎯⎯ 3 15 45
3020 |⎯⎯ 6 25 150
4030 |⎯⎯ 2 35 70
Total 12 - 270
Reais if
1.000,00 8
2.000,00 2
5.000,00 8
Total 18
Alturas
(cm) if
150 3
180 3
185 3
Total 9
41
270 22,512
i i
i
x fx
f= = =∑
∑
6 42 20 10 23,336
i
ii
n F antMd l h
f md
− −= + ⋅ = + ⋅ =
( ) ( )3 2 3 23,33 2 22,5 25Mo Md x= − = − =
Note que a moda está situada na terceira classe que é a classe de maior freqüência da série. Esta é chamada de
classe modal.
3.5.3.2 . Moda de King
Esta fórmula leva em consideração a freqüência simples da classe anterior e a freqüência simples da classe posterior
à classe modal.
ii
i i
f postMo l hf ant f post
= + ⋅+
Onde:
il = limite inferior da classe modal
if post = freqüência simples da classe posterior à classe modal.
if ant = freqüência simples da classe anterior à classe modal.
h = amplitude do intervalo de classe.
Exemplo: Aplicando a fórmula de King aos dados do exercício anterior, temos:
A classe modal é a de maior freqüência, portanto é a terceira, e a moda vale:
220 10 243 2
Mo = + ⋅ =+
3.5.3.3 . Moda de Czuber
Nesta formulação, levou-se em consideração a freqüência simples da classe anterior, a freqüência simples da classe
posterior, além da freqüência simples da classe modal. É portanto, uma fórmula mais completa que a fórmula de
King.
( )2i i
ii i i
f mo f antMo l hf mo f ant f post
−= + ⋅
− +
42
Onde:
il = limite inferior da classe modal
if mo = freqüência simples da classe modal.
if ant = freqüência simples da classe anterior à classe modal.
if post = freqüência simples da classe posterior à classe modal.
h = amplitude do intervalo de classe.
Exemplo: Aplicando a fórmula de Czuber aos dados do exercício anterior, temos:
A classe modal é a de maior freqüência, portanto é a terceira, e a moda vale:
( ) ( )6 320 10 24, 29
2 6 3 2Mo −
= + ⋅ =− +
Observação: A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana
na distribuição, a fórmula de Pearson é a mais trabalhosa. Esta fórmula é mais adequada para distribuições
simétricas.
A fórmula de King é a mais simples delas, mas não a mais precisa.
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da
classe modal. Nos exemplos anteriores, o cálculo da moda pelos três processos determinou três valores diferentes.
É claro que os três valores obtidos são valores aproximados do verdadeiro valor da moda. Normalmente o mais
confiável é o valor da moda de Czuber.
Exemplos
1) Determine a moda da tabela de freqüência do exercício 1 do capítulo 2.
Estatura
(cm) if
125 |⎯⎯ 130 10
135130 |⎯⎯ 15
14135 |⎯⎯ 0 25
145140 |⎯⎯ 10
15145 |⎯⎯ 0 15
155150 |⎯⎯ 5
Total 80
43
Moda de Pearson: ( ) ( )3 2 3 138 2 138,75 136,5Mo Md x= − = − =
Moda de King: 10135 5 135 2 137
15 10i
ii i
f postMo l hf ant f post
= + ⋅ = + ⋅ = + =+ +
Moda de Czuber: ( ) ( )
25 15135 5 135 2 1372 2 25 15 10
i ii
i i i
f mo f antMo l hf mo f ant f post
− −= + ⋅ = + ⋅ = + =
− + ⋅ − +
2) Determine a moda da tabela de freqüência do exercício 2 do capítulo 2.
Pesos
(Kg) if
45 |⎯⎯ 50 5
5550 |⎯⎯ 6
655 |⎯⎯ 0 11
6560 |⎯⎯ 13
765 |⎯⎯ 0 7
7570 |⎯⎯ 8
Total 50
Moda de Pearson: ( ) ( )3 2 3 61,15 2 61 61, 45Mo Md x= − = − =
Moda de King: 760 5 60 1,94 61,94
11 7i
ii i
f postMo l hf ant f post
= + ⋅ = + ⋅ = + =+ +
Moda de Czuber: ( ) ( )
13 1160 5 60 1, 25 61, 252 2 13 11 7
i ii
i i i
f mo f antMo l hf mo f ant f post
− −= + ⋅ = + ⋅ = + =
− + ⋅ − +
44
3) Determine a moda da tabela de freqüência do exercício 3 do capítulo 2.
Notas if
51 |⎯⎯ 58 2
6558 |⎯⎯ 6
7265 |⎯⎯ 14
7972 |⎯⎯ 29
8679 |⎯⎯ 23
9386 |⎯⎯ 11
10093 |⎯⎯ 5
Total 90
Moda de Pearson: ( ) ( )3 2 3 77,55 2 77,67 77,31Mo Md x= − = − =
Moda de King: 2372 7 72 4,35 76,35
14 23i
ii i
f postMo l hf ant f post
= + ⋅ = + ⋅ = + =+ +
Moda de Czuber: ( ) ( )
29 1472 7 72 5 772 2 29 14 23
i ii
i i i
f mo f antMo l hf mo f ant f post
− −= + ⋅ = + ⋅ = + =
− + ⋅ − +
4) Determine a média , a mediana e a moda de Czuber para os dados da tabela a seguir.
Notas if iF ix i ix f
0 |⎯⎯ 10 5 5 5 25
2010 |⎯⎯ 15 20 15 225
3020 |⎯⎯ 20 40 25 500
4030 |⎯⎯ 45 85 35 1.575
5040 |⎯⎯ 100 185 45 4.500
6050 |⎯⎯ 130 315 55 7.150
7060 |⎯⎯ 100 415 65 6.500
8070 |⎯⎯ 60 475 75 4.500
9080 |⎯⎯ 15 490 85 1.275
10090 |⎯⎯ 10 500 95 950
Total 500 - - 27.200
45
27.200 54, 4500
i i
i
x fx
f= = =∑
∑
250 1852 50 10 55130
i
ii
n F antMd l h
f md
− −= + ⋅ = + ⋅ =
( ) ( )130 10050 10 50 5 55
2 2 130 100 100i i
ii i i
f mo f antMo l hf mo f ant f post
− −= + ⋅ = + ⋅ = + =
− + ⋅ − +
Nota: Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente
precisamos de apenas uma das medidas para caracterizar o centro da série. Surge então a questão: qual medida
deve ser usada?
A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série.
Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor
e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática.
Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem,
apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da
média não serão bem representados por ela.
Dessa forma, se uma série apresenta forte concentração de dados em sua área central, a média , a mediana e a moda
ficam também situadas em sua área central representando bem a série, como na figura abaixo. Como a mais
conhecida é a média, optamos por esta medida de tendência central. Concluindo, devemos optar pela média,
quando houver forte concentração de dados na área central da série.
Se uma série apresenta forte concentração de dados em seu início (assimetria positiva), a mediana e a moda estarão
posicionadas mais no início da série, representando bem esta concentração. A média que é fortemente afetada por
alguns valores posicionados no final da série se deslocará para a direita desta concentração, não a representando
bem.
Como a mais conhecida entre mediana e moda é a mediana, esta será a medida indicada neste caso.
A mesma situação ocorre se a série apresenta forte concentração de dados em seu final (assimetria negativa).
Concluindo, devemos optar pela mediana, quando houver forte concentração de dados no início ou no final
da série.
x
46
A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento
típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outro elementos da série.
Exercício 4
1) Determine a moda para os conjuntos abaixo:
a) 0, 0, 0, 1, 1, 3
b) 1, 1, 2, 2, 3, 3, 5, 5
c) 1 2 2 6, , , 2 3 10 9
2) A tabela abaixo representa o número de acertos em cada questão de uma prova de sete questões aplicada em
determinada turma. Determine a questão considerada mais fácil.
Questão if
1 2
2 6
3 14
4 29
5 23
6 11
7 35
Total 120
3) Determinar o valor da moda de Czuber das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.
Mo Md x MoMdx
47
3.6 . Resposta dos exercícios do capítulo
Exercício 1:
1 ) a) 4,8 b) 15,2 c) 5,8571 d) 8,5714
2) a) 3,9091 b) 4,625
3) a) 2 b) 3
Exercício 2:
1) µ = 4,67. Não foi aprovado devido a nota média ter sido inferior a 5. Ao conceder 1 ponto em cada nota, a média
do estudante passa a ser 5,67.
2) µ = 6,17. Foi aprovado devido a nota média ter sido superior a 5.
3) R$350,00
4) R$1.000,00
5) R$ 1.050,00
6) 33,13 horas
7) 3,6 faltas
8) 1.384,16 peças
9) 3 salários mínimos
10) 748,24 centenas de horas ou 74.824 horas
11) 10,94 toneladas
Exercício 3:
1) a) 6Md = b) 5Md = c) 6Md =
2) a) 167,5Md cm= b) 25Md anos= c) $180,00Md R=
3) 34,05 Md horas=
3 faltasMd =
1.405,78 peçasMd =
2, 27 SMMd =
768 centenas de horasMd =
10,93 toneladasMd =
48
Exercício 4:
1) a) 0 b) não há moda c) 23
2) sétima questão
3) 35,08 horasMo =
1,33 faltasMo =
1.431,64 peçashorasMo =
1, 42 S.M.Mo =
774 centenas de horasMo =
10,88 toneladasMo =
49
APÊNDICE
Cálculo das médias Geométrica e Harmônica
Média Geométrica A média geométrica ( )gx é uma média usualmente empregada para avaliar taxas de variação e de crescimento.
Esta média, diferentemente da aritmética, não é influenciada por valores extremos.
Média Geométrica Simples
A média geométrica de N valores ( )1 2, , , nx x x é definida como a raiz n-ésima do produto de desses valores.
1 21
NN Ng n i
i
x x x x x=
= ⋅ ⋅ ⋅ = ∏Exemplo: Calcular a média geométrica dos valores: 2, 4, 6, 9.
4 42 4 6 9 432 4,5590gx = ⋅ ⋅ ⋅ = =
Média Geométrica ponderada
Para uma seqüência numérica 1 2, , , nx x x afetada de pesos 1 2, , , np p p , respectivamente, a média
geométrica ponderada ( )gx é definida por: 1 211 2
N
ini
ppp p
g nx x x x=∑
= ⋅ ⋅ ⋅
Exemplo: Sejam os valores 1, 2, 5 com pesos 3, 3, 1, respectivamente. Então, a média geométrica ponderada será:
7 3 3 1 7 71 2 5 1 8 5 40 1,6938gx = ⋅ ⋅ = ⋅ ⋅ = =
Na prática gx é calculada por meio de logaritmo.
( ) ( )1 2 1 21log log log log logN
g n nx x x x x x xN
= ⋅ ⋅ ⋅ = ⋅ + + +
Exemplos: Determinar a média geométrica das séries abaixo:
a) : 3, 27X 3 27 81 9gx = ⋅ = =
b) : 1, 4, 16X 3 31 4 16 64 4gx = ⋅ ⋅ = =
c) : 7, 7, 7, 7X 4 47 7 7 7 2401 7gx = ⋅ ⋅ ⋅ = =
d) X: 37, 6 37 6 222 14,8997gx = ⋅ = =
50
Observação: O produto dos quocientes de cada valor de um conjunto de números pela média geométrica do
conjunto é igual a 1.
1 2 1n
g g g
xx xx x x
⋅ ⋅ ⋅ =
Exemplo:
37 6 114,8997 14,8997
⋅ =
Média Harmônica
A média harmônica ( )hx de um conjunto de N números ( )1 2, , , nx x x é o inverso da média aritmética do
inverso dos valores. Esta média é particularmente utilizada para a série de valores que são inversamente
proporcionais, como para o cálculo da velocidade média.
Média Harmônica Simples
A média harmônica de um conjunto é dada por:
1 2
1 1 1 1h
n i
N Nx
x x x x
= =+ + + ∑
Exemplo: Calcular a média harmônica das séries abaixo:
a) : 1, 2, 4X 3 3 1,71431 1 1 71 2 4 4
hx = = =+ +
b) : 3, 6, 6X 3 3 4,51 1 1 43 6 6 6
hx = = =+ +
c) : 1, 2, 4, 3X 4 4 1,921 1 1 1 251 2 4 3 12
hx = = =+ + +
d) : 7, 7, 7, 7X 4 4 71 1 1 1 47 7 7 7 7
hx = = =+ + +
e) Um caminhão desenvolve uma velocidade média de 30Km/h para ir da cidade A par a cidade B, e 20Km/h para
fazer a viagem de volta. Qual a velocidade média de percurso ida e volta?
51
2 2 24 /1 1 530 20 60
hx Km h= = =+
Média Harmônica Ponderada
Sejam 1 2, , , nx x x um conjunto afetado com as freqüências 1 2, , , nf f f , respectivamente. A média
harmônica desse conjunto de números é definida por:
1 2
1 2
i ih
n i
n i
f fx f ff f
x x x x
= =+ + +
∑ ∑∑
Exemplo:
Sejam os valores 2, 4, 12 com pesos 3, 2, 2 respectivamente. A média harmônica é:
7 7 3,23083 2 2 18 6 22 4 12 12
hx = = =+ +
+ +
Exercícios
1) Calcule a média geométrica simples para os conjuntos de dados abaixo:
a) 3, 27
b) 2, 8
c) 1, 4, 16
d) 1, 1, 2, 3, 3
2) Calcule a média harmônica simples para os conjuntos de dados abaixo:
a) 3, 6, 8
b) 2, 2, 3, 5
c) 5, 5, 5, 5, 5
3) Um automóvel desenvolve 70 Km/h para ir da cidade A para a B, e volta da cidade B para a A com a velocidade
de 60 Km/h. Qual a velocidade média?
52
4) Calcule as médias geométrica e harmônica para os conjuntos abaixo:
a) b)
Resposta dos exercícios do apêndice
1) a) 9 b) 4 c) 4 d) 5 18 1,7826=
2) a) 72 4,815
= b) 120 2,608746
= c) 5
3) 64,6 /Km h
4) a) 12 12432 1,6581 1,41188,5g hx x= = = =
b) 7 1401280 2,779 2,592654g hx x= = = =
ix if
1 7
3 3
4 2
Total 12
ix if
2 4
4 2
5 1
Total 7
53
CAPÍTULO 4 - SEPARATRIZES
4.1 . Introdução
As separatrizes são números reais que dividem a seqüência ordenada de dados (Rol) em partes que contêm uma
quantidade específica de elementos da série.
Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50% dos valores
da seqüência, é também uma medida separatriz.
Além da mediana, as outras medidas separatrizes que destacamos são: quartis, decis e percentis.
4.2 . Quartil
Ao dividirmos uma série ordenada em quatro partes iguais, cada uma ficará com 25% dos elementos. Os três
elementos que separam estes grupos são chamados de Quartis.
Assim, o primeiro quartil, que indicaremos por 1Q , separa a seqüência ordenada deixando 25% de seus valores à
esquerda e 75% de seus valores à direita.
O segundo quartil, que indicaremos por 2Q , separa a seqüência ordenada deixando 50% de seus valores à esquerda
e 50% de seus valores à direita. O 2Q é a mediana da série.
O terceiro quartil, que indicaremos por 3Q , separa a seqüência ordenada deixando 75% de seus valores à esquerda e
25% de seus valores à direita.
4.3 . Decil
Ao dividirmos uma série ordenada em dez partes iguais, cada uma ficará com 10% dos elementos. Os elementos
que separam estes grupos são chamados de Decis.
Assim, o primeiro decil, que indicaremos por 1D , separa a seqüência ordenada, deixando 10% de seus valores à
esquerda e 90% de seus valores à direita.
Os outros decis são definidos de modo análogo.
1Q 2Q Md= 3Q
25% 25% 25% 25%
54
4.4 . Percentil
Ao dividirmos uma série ordenada em cem partes iguais, cada uma ficará com 1% dos elementos. Os elementos que
separam estes grupos são chamados de percentis.
Assim, o primeiro percentil, que indicaremos por 1P , separa a seqüência ordenada, deixando 1% de seus valores à
esquerda e 99% de seus valores à direita.
Os outros percentis são definidos de modo análogo.
Se observarmos que os quartis e os decis são múltiplos dos percentis, então basta estabelecer a fórmula de cálculo de
percentis. Todas as outras medidas podem ser identificadas como percentis. Desta forma:
1 25
2 50
3 75
Q PQ PQ P
=
=
=
1 10
2 20
3 30
4 40
5 50
6 60
7 70
8 80
9 90
D PD PD PD PD PD PD PD PD P
=
=
=
=
=
=
=
=
=
4.5 . Cálculo de Separatrizes
4.5.1 . Dados brutos ou Rol
Para identificar uma determinada separatriz os dados devem estar ordenados. Em seguida relacionamos a medida
que queremos obter com o percentil correspondente, iP .
Encontramos a posição do percentil i , através de 100i n⋅
. Em seguida, identificamos o elemento que ocupa esta
posição. Se 100i n⋅
não for um número inteiro, isto significa que o iP é um elemento intermediário entre os
elementos que ocupam as posições aproximadas por falta e por excesso do valor 100i n⋅
. Neste caso, o iP é definido
como sendo a média dos valores que ocupam estas posições aproximadas.
55
Exemplo:
1) Calcular o 1Q da seqüência 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15.
Identificamos que 1 25Q P=
Calcularmos 25% de 12, que é o número de elementos da série, obtendo: 25 12 3100
⋅=
Este valor indica a posição do 25P no rol, isto é, o 25P é o terceiro elemento no rol. Observando o terceiro
elemento do rol obtém-se 5.
Portanto, 1 25 5Q P= =
Assim, 25% dos valores desta seqüência são valores menores ou iguais a 5 e 75% dos valores desta seqüência são
valores maiores ou iguais a 5.
2) Calcular o 6D do rol 2; 2; 6; 7,5; 8; 9; 10; 12
Identificamos que 6 60D P= .
Calcularmos 60% de 8, que é o número de elementos da série, obtendo: 60 8 4,8100
⋅=
Este valor não é inteiro, indicando que o 60P é um valor situado entre o quarto e o quinto elemento da seqüência.
Observando diretamente no rol, os elementos que ocupam a quarta e quinta posição são: 7,5 e 8. Portanto
6 607,5 8 7,75
2D P +
= = =
Assim, 60% dos valores desta seqüência são valores menores ou iguais a 7,75 e 40% dos valores desta seqüência são
valores maiores ou iguais a 7,75.
4.5.2 . Dados agrupados em freqüência simples
Se os dados estão apresentados na forma de variável discreta, eles já estão naturalmente ordenados.
Devemos identificar a medida que queremos obter com o percentil correspondente iP . Em seguida, localizar a
posição do percentil na série 100i n⋅
. Após, com o auxílio da freqüência acumulada da série, localizamos o elemento
que ocupa esta posição. O valor deste elemento é o iP .
56
Exenplo:
1) Calcular o 4D para a série:
ix if iF
2 3 3
4 5 8
5 8 16
7 6 22
10 2 24
Total 24 -
O número de elementos da série é 24if =∑ .
Identificamos 4 40D P= , e calculamos 40% de 24, ou seja, 40 24 9,6100
⋅=
Esta posição significa que o 40P é um valor compreendido entre o nono e o décimo elemento da série.
Observando na coluna da freqüência acumulada, vemos que o nono e o décimo elemento são iguais a 5. Assim,
4 405 5 5
2D P +
= = =
Dessa forma, 40% dos valores desta seqüência são valores menores ou iguais a 5 e 60% dos valores desta seqüência
são valores maiores ou iguais a 5.
4.5.3 . Dados agrupados em classe
Se os dados estão agrupados na forma de uma variável contínua, eles já estão naturalmente ordenados e o número de
elementos da série é in f= ∑ .
Para se obter uma fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula da mediana:
2 i
ii
n F antMd l h
f md
−= + ⋅
Identificando 50Md P= , podemos obter uma fórmula particular para o 50P . Portanto, identificando o limite
inferior da classe que contém a Mediana ( )il com o limite inferior da classe que contém 50P ( )50l .
57
O termo 2n
pode ser representado na linguagem do 50P como 50100
n⋅.
A freqüência simples da classe mediana ( )if é a mesma freqüência simples da classe que contém o 50P ( )50f .
A freqüência acumulada da classe anterior à classe mediana ( )antF é a freqüência acumulada da classe anterior à
classe que contém o 50P . Este termo não se modifica, assim como h , que é a amplitude do intervalo de classe.
Assim, a fórmula da mediana, adaptada para a linguagem do 50P pode ser escrita:
50100 i
ii
i n F antP l h
f
⋅−
= + ⋅
Substituindo-se 50 pelo índice i , generalizamos a fórmula para o cálculo de qualquer percentil:
100 i
i ii
i n F antP l h
f
⋅−
= + ⋅
Onde:
iP = Percentil ( ) 1, 2, 3, , 99i i =
il = limite inferior da classe que contém o percentil i
n = número de elementos da série
iF ant = freqüência acumulada da classe anterior à classe que contém o percentil i
if = freqüência simples da classe que contém o percentil i
h = amplitude do intervalo de classe.
Exemplo: Calcular o 3Q da série:
Notas if iF
0 |⎯⎯ 10 16 16
2010 |⎯⎯ 18 34
3020 |⎯⎯ 24 58
4030 |⎯⎯ 35 93
5040 |⎯⎯ 12 105
Total 105 -
58
O número de elementos da série é 105. Identificamos 3 75Q P= .
Iniciamos o cálculo do valor 75P lembrando que neste caso 75i = e que 75 105 78,75
100 100i n⋅ ⋅
= = .
Isto nos dá a posição do 75P na série.
Pela freqüência acumulada observamos que o elemento que ocupa a posição 78,75 na série encontra-se na quarta
classe.
Substituindo os valores indicados na fórmula, obtém-se:
7578,75 5830 10 35,93
35P −
= + ⋅ =
Assim, 75% dos valores da série são menores ou iguais a 35,93 e 25% dos valores da série são maiores ou iguais a
35,93.
Exercícios
1) A tabela abaixo representa a distribuição dos salários de 500 empregados da firma X . Calcule:
a) o primeiro quartil
b) o segundo decil
c) o quinquagésimo percentil
d) o octogésimo percentil
Salários if iF
1000 |⎯⎯ 2000 20 20
30002000 |⎯⎯ 20 40
40003000 |⎯⎯ 100 140
50004000 |⎯⎯ 80 220
60005000 |⎯⎯ 70 290
70006000 |⎯⎯ 60 350
80007000 |⎯⎯ 150 500
Total 500 -
59
2) Para a tabela do exercício 4 do capítulo 2 determine:
a) o número de horas extras em que 25% dos técnicos trabalham abaixo e 75% dos técnicos trabalham acima desse
valor.
b) o terceiro quartil.
c) o número de horas em que 30% dos técnicos trabalham acima desse valor.
d) o 37º percentil.
e) o número de horas extras em que 40% dos técnicos trabalham abaixo desse valor.
3) Para a tabela do exercício 5 do capítulo 2 determine:
a) o terceiro quartil.
b) o número de faltas em que 20% dos operários tiveram um total de faltas abaixo deste valor.
c) o número de faltas em que 66 operários tiveram um total de faltas abaixo desse valor
4) Para a tabela do exercício 6 do capítulo 2 determine o oitavo decil.
5) Para a tabela do exercício 7 do capítulo 2 determine:
a) o salário em que 44 funcionários ganham abaixo e 36 funcionários ganham acima.
b) o 85o percentil
6) Para a tabela do exercício 8 do capítulo 2 determine o total de horas em que 75% das peças testadas apresentaram
uma duração superior.
7) Para a tabela do exercício 9 do capítulo 2 determine:
a) a carga máxima em que 30 cabos de aço suportam pesos inferiores.
b) o sétimo decil
c) o 35o percentil
4.6 . Resposta dos exercícios
1) a) R$3.850,00 b) R$ 3.600,00 c) R$5.428,57 d) R$7.333,00
2) a) 24,52 hs b) 42,91 hs c) 40,99 hs d) 29,51 hs e) 30,76 hs
3) a) 5,5 faltas b) 1 falta c) 2,4 faltas
4) 1.436,76 peças
5) a) 2,63 SM b) 5,80 SM
6) 646,82 centenas de horas
7) a) 11,1 ton b) 11,35 ton c) 10,68 ton
60
CAPÍTULO 5 – MEDIDAS DE DISPERSÃO
5.1 . Introdução
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são suficientes para
caracterizar totalmente uma seqüência numérica.
Se observarmos as seqüências:
X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10
Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13
Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13
concluiremos que todas possuem média 13.
No entanto, são seqüências completamente distintas do ponto de vista da variabilidade (dispersão) de dados.
Na seqüência Z não há variabilidade de dados. A média 13 representa bem qualquer valor da série.
Na seqüência Y, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da
média 13.
Na seqüência X existem muitos elementos bastante diferenciados da média 13.
Concluímos que a média 13 representa otimamente a seqüência Z, representa bem a seqüência Y, mas não
representa bem a seqüência X.
O nosso objetivo é construir medidas que avaliem a representatividade da média. Para isso usaremos as medidas de
dispersão.
Observe que na seqüência Z os dados estão totalmente concentrados sobre a média 13.
Não há dispersão de dados. Na seqüência Y há forte concentração dos dados sobre a média 13, mas há fraca
dispersão de dados. Já na série X há fraca concentração de dados em torno da média 13 e forte dispersão de dados
em relação à média 13.
As principais medidas de dispersão que estaremos abordando são: amplitude total, desvio médio simples, variância,
desvio padrão e coeficiente de variação.
5.2 . Amplitude Total
A amplitude total ( )tA é a diferença entre o maior e o menor valor da seqüência.
61
5.2.1 . Dados brutos ou rol
Para o cálculo da amplitude total de um rol basta identificar o maior e o menor valor da seqüência e efetuar a
diferença entre estes valores.
Exemplo: Determinar a amplitude total da seqüência X: 11, 12, 9, 10, 10, 15.
O maior valor desta seqüência é 15 e o menor valor é 9. Portanto 15 9 6 unidadestA = − = .
5.2.2 . Dados agrupados em freqüência simples
Como os valores já se apresentam ordenados, a amplitude total é a diferença enter o último e o primeiro elemento da
série.
Exemplo: Determinar a amplitude total da série
ix if
2 1
3 6
5 10
7 3
Total 20
7 2 5 unidadestA = − =
5.2.3 . Dados agrupados em classes
Nesta situação, por desconhecer o maior e o menor valor da série, devemos fazer um cálculo aproximado da
amplitude total da série.
Consideraremos como maior valor da série o ponto médio da última classe e como menor valor da série o ponto
médio da primeira classe. A amplitude total é a diferença entre estes valores.
Exemplo: Determinar a amplitude total da série
62
Classes if ix
2 |⎯⎯ 4 5 3
64 |⎯⎯ 10 5
86 |⎯⎯ 20 7
108 |⎯⎯ 7 9
1210 |⎯⎯ 2 11
Total 44 -
11 3 8 unidadestA = − =
Nota: Apesar da facilidade de obtenção da amplitude total, esta medida apresenta a inconveniência de depender
apenas de dois valores da série. É possível modificar completamente a dispersão ou a concentração dos elementos
em torno da média, sem alterar a amplitude total da série. É uma medida que tem pouca sensibilidade estatística.
5.3 . Desvio Médio Simples ( )DMS
O conceito estatístico de desvio corresponde ao conceito matemático de distância (módulo).
A dispersão dos dados em relação à média de uma seqüência pode ser avaliada através dos desvios de cada elemento
da seqüência em relação a média da seqüência.
O desvio médio simples é definido como sendo uma média aritmética dos desvios de cada elemento da série para a
média da série.
5.3.1 . Dados brutos ou rol
Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada elemento da
seqüência para sua média. Finalmente, calculamos a média destas distâncias.
Se a seqüência for representada por 1 2: , , , nX x x x , então o DMS admite como fórmula de cálculo:
ix xDMS
n−
= ∑
Exemplo: Calcular o DMS para a seqüência: X: 2, 8, 5, 6
Determinamos inicialmente a média da série:
2 8 5 6 5,254
ixx
n+ + +
= = =∑
63
em seguida, determinamos as distâncias de cada elemento da série para a média da série:
1
2
3
4
2 5, 25 3, 25
8 5, 25 2,75
5 5, 25 0, 25
6 5, 25 0,75
x x
x x
x x
x x
− = − =
− = − =
− = − =
− = − =
O DMS é a média aritmética simples destes valores.
3, 25 2,75 0,25 0,75 7 1,754 4
DMS + + += = =
Ou seja, em média, cada elemento da seqüência está afastado do valor 5,25 por 1,75 unidades.
5.3.2 . Dados agrupados em freqüência simples
No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa
o número de vezes que este valor figura na série. Conseqüentemente, haverá repetições de distâncias iguais de cada
elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é uma média
aritmética ponderada. A fórmula para o cálculo do DMS é:
i i
i
x x fDMS
f−
= ∑∑
Exemplo: Determinar o DMS para a série:
ix if i ix f i ix x f−
1 2 2 1 3 2 4− ⋅ =
3 5 15 3 3 5 0− ⋅ =
4 2 8 4 3 2 2− ⋅ =
5 1 5 5 3 1 2− ⋅ =
Total 10 30 8
A média aritmética da série é: 30 310
i i
i
x fx
f= = =∑
∑
64
O DMS é dado por: 8 0,8 unidades
10i i
i
x x fDMS
f−
= = =∑∑
Ou seja, em média, cada elemento da série está afastado do valor 3 por 0,8 unidades.
5.3.3 . Dados agrupados em classes
Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes
valores pelos pontos médios das classes. Desta forma, o desvio médio simples tem por cálculo a fórmula:
i i
i
x x fDMS
f−
= ∑∑
, onde ix é o ponto médio da classe i .
Exemplo: Determinar o DMS para a série:
Classes if ix i ix f i ix x f−
2 |⎯⎯ 4 5 3 15 3 5,1 5 10,5− ⋅ =
64 |⎯⎯ 10 5 50 5 5,1 10 1− ⋅ =
86 |⎯⎯ 4 7 28 7 5,1 4 7,6− ⋅ =
108 |⎯⎯ 1 9 9 9 5,1 1 3,9− ⋅ =
Total 20 - 102 23
A tabela acima já está toda completa com os dados que necessitamos para calcular o DMS . Porém, os seguintes
passo foram seguidos:
1 – cálculo dos pontos médios ix
2 – cálculo de i ix f para obtermos a média que é: 102 5,120
i i
i
x fx
f= = =∑
∑3 – para obter o DMS acrescentamos a última coluna que apresenta i ix x f− . Assim, o DMS é:
23 1,15 unidades20
i i
i
x x fDMS
f−
= = =∑∑
Ou seja, em média, cada elemento da série está afastado do valor 5,1 por 1,15 unidades.
Nota: O desvio médio simples depende de cada componente da série. Se mudarmos o valor de um único elemento
da série, mudamos também o DMS . Portanto, o desvio médio simples tem perfeita sensibilidade estatística.
65
5.4 . Variância e Desvio Padrão
Observamos no item anterior que a dificuldade em se operar com o DMS se deve à presença do módulo, para que
as diferenças ix x− possam ser interpretadas como distâncias.
Outra forma de se conseguir que as diferenças ix x− se tornem sempre positivas ou nulas é considerar o quadrado
destas diferenças, isto é: ( )2ix x− .
Se substituirmos, nas fórmulas do DMS a expressão ix x− por ( )2ix x− , obteremos nova medida de
dispersão chamada variância.
Portanto, variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos
da série e a sua média.
O desvio padrão é a raiz quadrada positiva da variância.
Em particular, para estas medidas levaremos em consideração o fato de a seqüência de dados representar toda uma
população ou apenas uma amostra de uma população.
Quando a seqüência de dados representa uma população a variância será denotada por ( )2 xσ , 2xσ ou
simplesmente 2σ e o desvio padrão correspondente por ( )xσ , xσ ou simplesmente σ .
Quando a seqüência de dados representar uma amostra, a variância será denotada por ( )2s x , 2xs ou simplesmente
2s e o desvio padrão correspondente por ( )s x , xs ou simplesmente s ., a menos de uma observação.
Assim temos:
População: ( ) ( )22 ix x
xn
σ−
= ∑ ( ) ( )2x xσ σ=
Amostra: ( ) ( )22
1ix x
s xn
−=
−∑ ( ) ( )2s x s x=
5.4.1 . Dados brutos ou rol
Exemplo:
1) Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5, sendo esta representativa de uma população.
Esta seqüência tem 4n = elementos e tem por média:
66
4 5 8 5 22 5,54 4
ixx
n+ + +
= = = =∑
Os quadrados das diferenças ( )2ix x− valem:
( ) ( )
( ) ( )
( ) ( )
( ) ( )
2 21
2 22
2 23
2 24
4 5,5 2,25
5 5,5 0,25
8 5,5 6,25
5 5,5 0,25
x x
x x
x x
x x
− = − =
− = − =
− = − =
− = − =
Somando-se estes valores obtém-se: ( )2 9ix x− =∑ .
Substituindo estes valores na fórmula da variância, teremos: ( ) ( )22 9 2, 25
4ix x
xn
σ−
= = =∑
Como o desvio padrão é a raiz quadrada positiva da variância, temos: ( ) ( )2 2, 25 1,5 unidx xσ σ= = = .
b) Se a seqüência anterior representasse apenas uma amostra, a variância e o desvio padrão seriam:
( ) ( )22 9 3
1 3ix x
s xn
−= = =
−∑ ( ) ( )2 3 1,73s x s x= = =
5.4.2 . Dados agrupados em freqüência simples
Como há repetição de elementos na série, definimos a variância como sendo uma média aritmética ponderada dos
quadrados dos desvios dos elementos da série para a média da série.
Dependendo se a variável em estudo é representativa de uma população ou de uma amostra, as fórmulas da
variância e do desvio padrão ficam:
População: ( ) ( )22 i i
i
x x fx
fσ
−= ∑
∑( ) ( )2x xσ σ=
Amostra: ( ) ( )22
1i i
i
x x fs x
f−
=−
∑∑
( ) ( )2s x s x=
67
Exemplo:
1) Calcule a variância e o desvio padrão da série abaixo, representativa de uma população.
ix if i ix f ( )2i ix x f−
2 3 6 ( )22 3,65 3 8,1675− ⋅ =
3 5 15 ( )23 3,65 5 2,1125− ⋅ =
4 8 32 ( )24 3,65 8 0,9800− ⋅ =
5 4 20 ( )25 3,65 4 7,2900− ⋅ =
Total 20 73 18,55
A média as série é: 73 3,6520
i i
i
x fx
f= = =∑
∑
Variância: ( ) ( )22 18,75 0,9275
20i i
i
x x fx
fσ
−= = =∑
∑
Desvio padrão: ( ) ( )2 0,9275 0,963x xσ σ= = =
2) Se a série anterior fosse representativa de uma amostra, teríamos os seguintes resultados para a variância e o
desvio padrão:
Variância: ( ) ( )22 18,55 0,9763
1 19i i
i
x x fs x
f−
= = =−
∑∑
Desvio padrão: ( ) ( )2 0,9763 0,988s x s x= = =
5.4.3 . Dados agrupados em classes
Novamente, por desconhecer os particulares valores de ix da série, substituiremos nas fórmulas anteriores estes
valores pelos pontos médios das classes.
Exemplo:
1) Calcule a variância e o desvio padrão da série abaixo, representativa de uma população.
68
Classes if ix i ix f ( )2i ix x f−
0 |⎯⎯ 4 1 2 2 ( )22 8,4 1 40,96− ⋅ =
84 |⎯⎯ 3 6 18 ( )26 8,4 3 17,28− ⋅ =
128 |⎯⎯ 5 10 50 ( )210 8,4 5 12,80− ⋅ =
1612 |⎯⎯ 1 14 14 ( )214 8,4 1 31,36− ⋅ =
Total 10 - 84 102,4
A média as série é: 84 8,410
i i
i
x fx
f= = =∑
∑
Variância: ( ) ( )22 102,4 10,24
10i i
i
x x fx
fσ
−= = =∑
∑
Desvio padrão: ( ) ( )2 10, 24 3, 2x xσ σ= = =
2) Se a série anterior fosse representativa de uma amostra, teríamos os seguintes resultados para a variância e o
desvio padrão:
Variância: ( ) ( )22 102, 4 11,38
1 9i i
i
x x fs x
f−
= = =−
∑∑
Desvio padrão: ( ) ( )2 11,38 3,373s x s x= = =
Nota: No cálculo da variância, quando elevamos ao quadrado a diferença ( )ix x− , a unidade de medida da série
fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série.
Se os dados são expressos em metros, a variância é expressa em metros quadrados.
Em algumas situações a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados
são expressos em litros. A variância será expressa em litros quadrados. Portanto, o valor da variância não pode ser
comparado diretamente com os dados da série, ou seja, a variância não tem interpretação.
Exatamente para suprir esta deficiência da variância é que se define o desvio padrão. Como o desvio padrão é a raiz
quadrada da variância, o desvio padrão terá sempre a mesma unidade de medida da série e portando admite
interpretação.
69
5.5 . Interpretação do Desvio Padrão
1) O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.
É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da série.
Quando uma curva de freqüência representativa da série é perfeitamente simétrica como a curva abaixo, podemos
afirmar que o intervalo [ ],x xσ σ− + contém aproximadamente 68% dos valores da série.
O intervalo [ ]2 , 2x xσ σ− + contém aproximadamente 95% dos valores da série.
O intervalo [ ]3 , 3x xσ σ− + contém aproximadamente 99% dos valores da série.
xx σ− x σ+
σ σ
x2x σ− 2x σ+
σ σσ σ
x3x σ− 3x σ+
σ σσ σσ σ
70
Estes percentuais 68%, 95% e 99% que citamos na interpretação podem ser comprovados, com maior precisão, no
estudo da distribuição normal de probabilidades.
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas variações para mais ou
para menos, segundo o caso.
Dessa forma, quando se afirma que uma série apresenta média 100x = e desvio padrão 5σ = , podemos
interpretar estes valores da seguinte forma:
♦ Os valores da série estão concentrados em torno de100.
♦ O intervalo [ ]95, 105 contém aproximadamente, 68% dos valores da série.
♦ O intervalo [ ]90, 110 contém aproximadamente, 95% dos valores da série.
♦ O intervalo [ ]85, 115 contém aproximadamente, 99% dos valores da série.
É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de
elementos contidos no intervalo.
As medidas de dispersão vistas até agora são medidas absolutas e portanto avaliam a dispersão absoluta da série.
Todas elas são diretamente proporcionais à dispersão absoluta.
Assim, se a série X apresenta 20x = e ( ) 3xσ = , e se a série Y apresenta 22y = e ( ) 2yσ = , podemos
afirmar, comparando os desvios, que a série X apresenta maior dispersão absoluta.
2) Para justificar que o denominador da variância amostral deve ser 1n − e não n , usaremos o seguinte argumento:
O modelo matemático que calcula a variância de uma amostra não pode ser ( ) ( )22 ix x
xn
σ−
= ∑ , pois caso
isto fosse verdadeiro, este modelo deveria determinar a variância para qualquer tamanho de amostra.
Suponha uma amostra constituída de um único elemento 1x . O valor médio da amostra também é 1x . Calculando
a variância pelo modelo acima, teremos: ( ) ( ) ( )2 21 12 0
1ix x x x
xn
σ− −
= = =∑ .
Seríamos induzidos a afirmar que a dispersão da população de onde provém a amostra é zero, isto é, a população é
constituída em sua totalidade por elementos idênticos. O que é, em geral, uma afirmação falsa.
Para corrigir o modelo matemático, basta colocar no denominador 1n − . O modelo é escrito então:
( ) ( )22
1ix x
xn
σ−
=−
∑
Observe que agora o modelo é coerente. Mesmo quando a amostra tiver apenas um elemento 1x , o cálculo de
( )2s x leva-nos a uma indeterminação do tipo 00
. O que significa que a variância existe, mas não está
71
determinada. Significa também que amostras de apenas um elemento não nos fornecem informações sobre a
variância da série.
Cabe ressaltar que, para alguns autores, quando o desvio padrão representar uma estatística de uma amostra
considerada pequena ( )30n ≤ , o denominador no desvio padrão deverá ser n -1. A razão disto, é que se obtém
uma melhor estimativa do parâmetro da população. Para grandes valores de n ( )30n ⟩ não há grande diferença
entre a utilização de um ou outro denominador.
Exercício 1
1) Calcule a variância e o desvio padrão das séries abaixo, provenientes de uma amostra.
a) 1, 3, 4, 8
b) 12, 10, 20, 13, 15
c) 9, 9, 9, 9, 9, 9
2) Baseado nas informações das notas dos alunos A, B, C e D, determine qual o melhor aluno e por quê?
A – 7, 7, 10, 10, 1
B – 7, 7, 7, 7, 7
C – 10, 10, 10, 5, 0
D – 10, 1, 7, 7, 10
3) Calcule a variância e o desvio padrão das séries abaixo (amostra):
a)
Sal. min if
1 7
3 3
4 2
Total 12
b)
Notas if
2 4
4 2
5 1
Total 7
72
4) Determinar a variância e o desvio padrão das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.
5.6 . Coeficiente de Variação
Se uma série X apresenta 10x = e ( ) 2xσ = , e uma série Y apresenta 100y = e ( ) 5yσ = , do ponto de
vista da dispersão absoluta, a série Y apresenta maior dispersão que a série X .
No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y que é 5 em relação a 100 é um
valor menos significativo do que o desvio padrão de X que é 2 em relação a 10.
Isto nos leva a definir uma medida de dispersão relativa: o coeficiente de variação.
O coeficiente de variação de uma série X é indicado por ( )xCV e é definido como: ( )( )
xx
CVx
σ= .
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro,
podendo ser expresso em percentual.
Deste modo, se calcularmos o coeficiente de variação das séries X e Y obteremos:
( )2 0,2 ou 20%
10xCV = = ( )5 0,05 ou 5%
100yCV = =
Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa. Como
a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma
medida mais completa que a medida de dispersão absoluta.
Portanto, a medida de dispersão relativa prevalece sobre a medida de dispersão absoluta. Podemos afirmar que a
série que tem a maior dispersão relativa tem, de modo geral, a maior dispersão.
Do exemplo anterior, concluímos que:
A série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa.
Portanto, A série X apresenta maior dispersão.
Exercício 2
1) Uma indústria de componentes elétricos fábrica um tipo de lâmpada cuja duração média é de 15 dias, com um
desvio padrão de 0,26 dias. Um novo tipo de lâmpada foi lançado pela empresa, e constatou-se que a duração média
era de 18 dias com um desvio padrão de 0,9. Determinar qual é a melhor lâmpada e por quê?
73
2) Determinar o coeficiente de variação utilizando os dados das tabelas apresentadas nos exercícios 4 a 9 do capítulo
2.
3) Uma amostra aleatória de 250 residências de famílias, classe média, com dois filhos, revelou a seguinte
distribuição do consumo mensal de energia elétrica.
Consumo mensal
(Kwh) if
0 |⎯⎯ 50 2
10050 |⎯⎯ 15
150100 |⎯⎯ 32
200150 |⎯⎯ 47
250200 |⎯⎯ 50
300250 |⎯⎯ 80
350300 |⎯⎯ 24
Total 250Pede-se:
a) O consumo médio por residência.
b) As freqüências simples e acumulada (absoluta e relativa).
c) A porcentagem de famílias com consumo mensal maior ou igual a 200 e menor que 250 Kwh.
d) A porcentagem de famílias com consumo mensal menor que 200 Kwh.
e) A porcentagem de famílias com consumo maior ou igual a 250 Kwh.
f) O consumo mediano.
g) A moda de Czuber.
h) A amplitude total da série.
i) O desvio médio simples.
j) A variância.
k) O desvio padrão.
l) O coeficiente de variação.
m) 1Q
n) 3Q
o) 10P
p) 6D
q) 80P
74
r) O percentual de famílias classificadas entre 1Q e 80P .
s) O número aproximado de famílias classificadas entre 10P e 3Q .
4) Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta
amostra apresentou a seguinte distribuição.
Valor da nota
(em mil)) if
7 |⎯⎯ 12 2
1712 |⎯⎯ 5
2217 |⎯⎯ 13
2722 |⎯⎯ 10
3227 |⎯⎯ 9
3732 |⎯⎯ 6
4237 |⎯⎯ 5
Total 50Pede-se:
a) O valor médio das notas.
b) As freqüências simples e acumulada (absoluta e relativa).
c) A porcentagem de notas com valor maior ou igual a $17.000 e menor que $22.000.
d) A porcentagem de notas com valor menor que $32.000.
e) A porcentagem de notas com valor maior ou igual a $32.000.
f) O valor mediano das notas.
g) A moda de Czuber.
h) A amplitude total da série.
i) O desvio médio simples.
j) A variância.
k) O desvio padrão.
l) O coeficiente de variação.
m) 1Q
n) 3Q
o) 10P
p) 6D
75
q) 80P
r) O percentual de notas entre 1Q e 80P .
s) O número aproximado de notas entre 10P e 3Q .
5.7 . Resposta dos exercícios
Exercício 1
1) a) 2 8,67 e 2,94s s= = b) 2 14,5 e 3,81s s= = c) 2 0s s= =
2) 3,67 0 4,47 3,67A B C Dσ σ σ σ= = = =
Apesar de terem a mesma média, o aluno B pode ser apontado como melhor aluno por apresentar menor dispersão
das notas.
3) a) 2 1,64 e 1, 28σ σ= = b) 2 1,67 e 1, 29σ σ= =
4) 2 132 e 11,48 horasσ σ= =
2 7, 29 e 2,7 faltasσ σ= =
2 3.326,04 e 57,67 peçasσ σ= =
2 5,87 e 2, 42 SMσ σ= =
2 27.714,05 e 166,48 centenas de horasσ σ= =
2 0, 48 e 0,69 toneladasσ σ= =
Exercício 2
1) 0, 26 0,0215antigaCV = =
0,9 0,0518novaCV = =
Apesar de haver um acréscimo de 3 dias na vida média da lâmpada, o desvio padrão também aumentou em maiores
proporções o que significa que a lâmpada antiga é um melhor produto (mais homogêneo).
2) 0,35CV = 0,75CV = 0,04CV =
0,81CV = 0, 22CV = 0,06CV =
76
3) a) 217,8
b)
Consumo mensal
(Kwh) ififr
(%)iF iFr
0 |⎯⎯ 50 2 0,80 2 0,80
10050 |⎯⎯ 15 6,00 17 6,80
150100 |⎯⎯ 32 12,80 49 19,60
200150 |⎯⎯ 47 18,80 96 38,40
250200 |⎯⎯ 50 20,00 146 58,40
300250 |⎯⎯ 80 32,00 226 90,40
350300 |⎯⎯ 24 9,60 250 100,00
Total 250 100 - -
c) 20% d) 38,4% e) 41,6% f) 229 g) 267,44 h) 300 i) 60,07
j) 5.148,76 k)71,75 l) 32,95% m) 164,36 n) 275,94 o) 112,5
p) 252,5 q) 283,75 r) 55% s) 163
4) a) $ 25.200
b)
Valor da nota
(em mil)) ififr
(%)iF iFr
7 |⎯⎯ 12 2 4 2 4
1712 |⎯⎯ 5 10 7 14
2217 |⎯⎯ 13 26 20 40
2722 |⎯⎯ 10 20 30 60
3227 |⎯⎯ 9 18 39 78
3732 |⎯⎯ 6 12 45 90
4237 |⎯⎯ 5 10 50 100
Total 50 100 - -
c) 26% d) 78% e) 22% f) $24.500 g) $20.636,36 h) $30.000
i) $6.640 j) 65.316.326,53 k) $8.081,85 l) 32% m) $19.115,38
n) $31.166,67 o) $15.000,00 p) $27.000,00 q) $32.833,23 r) 55% s) 33