Estatística Descritiva
-
Upload
alan-franco -
Category
Documents
-
view
2 -
download
0
description
Transcript of Estatística Descritiva
2Prof. Dr. Hercules de Souza
O que é Estatística?
• Poder-se-ia sintetizar como sendo a
ciência dos dados. Historicamente
surgiu a partir de dois fenômenos
distintos: a necessidade de dados
censitários e o desenvolvimento da
teoria do cálculo das probabilidades.
2
3Prof. Dr. Hercules de Souza
ALGUNS CONCEITOS
ESTATÍSTICOS IMPORTANTES
• ESTATÍSTICA DESCRITIVA Sugere a organização, sumarização e descrição de um conjunto de dados. Com a construção de gráficos, tabelas, e com o cálculo de medidas com base em uma coleção de dados numéricos.
3
4Prof. Dr. Hercules de Souza
• por exemplo, com as idades dos
alunos, poderemos melhor
compreender o comportamento da
variável expressa no conjunto de dados
sob análise.
4
5Prof. Dr. Hercules de Souza
ALGUNS CONCEITOS
ESTATÍSTICOS IMPORTANTES
• ESTATÍSTICA INFERENCIAL Pode-
se definir como sendo os métodos que
tornam possível a estimação de
características de uma população
baseadas nos dados amostrais.
5
6Prof. Dr. Hercules de Souza
ALGUNS CONCEITOS
ESTATÍSTICOS IMPORTANTES
• POPULAÇÃO É a totalidade de
itens, objetos ou pessoas sob
consideração.
• AMOSTRA É uma parte da
população que é selecionada para
análise.
6
7Prof. Dr. Hercules de Souza
SUPONHA A SEGUINTE
TABELA
EMPRESA
BOLSA DE
VALORES
SÍMBOLO DO
PAINEL
VENDAS
ANUAIS
(milhões de
reais)
PREÇO DA AÇÃO
(R$)
Petrobrás ON Peb 215,70 11,5
Ford PN Fd 107,5 9,2
Arisco PP Ar 23,7 3,5
Microsoft ON Mft 89,9 9,8
Intel PN Itl 323,8 8,7
Cosipa PP Cpa 157,2 12,7
Açominas ON Mas 79,3 6,6
7
8Prof. Dr. Hercules de Souza
• ELEMENTOS São as entidades
sobre os quais os dados são coletados,
por exemplo, na tabela anterior, cada
empresa é um elemento.
• VARIÁVEL É uma característica de
interesse para os elementos (quatro
variáveis na tabela anterior).
8
9Prof. Dr. Hercules de Souza
• VARIÁVEL QUALITATIVA Bolsa de
valores constitui uma variável
qualitativa. O símbolo do painel
eletrônico também constitui uma
variável qualitativa.
• VARIÁVEL QUANTITATIVA Vendas
anuais denotam uma variável desse
tipo.
9
10Prof. Dr. Hercules de Souza
• DADOS QUANTITATIVOS Indicam
quantidade, ex: 215,70 milhões de
reais.
• DADOS QUALITATIVOS Podem ser
numéricos ou não, por exemplo,
podemos especificar que um significa
uma ação comercializada na Bolsa de
valores de SP.
10
11Prof. Dr. Hercules de Souza
DESCRIÇÃO GRÁFICA DE
VARIÁVEIS QUALITATIVAS
• Coluna, Pizza e Barra são os gráficos
mais comuns para a descrição de
dados oriundos de variáveis
qualitativas.
11
12Prof. Dr. Hercules de Souza
Preço das ações de três
empresas em um determinado
ano (R$)
1° Trim 2°Trim 3° Trim 4° Trim
Petrobrás 20,4 27,4 90,0 20,4
Açominas 30,6 38,6 34,6 31,6
Arisco 45,9 46,9 45,0 43,9
12
16Prof. Dr. Hercules de Souza
• EXEMPLOS DE
APRESENTAÇÕES DE
DADOS
• Exemplo: Características do
eleitor nordestino. (Veja
16/08/2006)
16
18Prof. Dr. Hercules de Souza
Compensação salarial em
relação ao nível de instrução
(Veja 06/09/2006)
18
21Prof. Dr. Hercules de Souza
DESCRIÇÃO GRÁFICA DE
VARIÁVEIS QUANTITATIVAS
TABELA 1
21
7,2 4,9 10,7 10,4 6,4 4,8 4,7 4,6 6,0 5,4
4,8 4,7 8,3 3,9 4,8 8,3 6,4 6,6 4,5 8,0
3,6 2,4 8,5 8,8 7,7 4,9 8,6 12,0 4,9 7,0
11,0 4,9 3,9 4,9 4,4 4,9 4,9 8,0 3,6 7,4
7,9 4,9 5,8 3,9 11,6 10,3 3,4 3,9 5,0 3,9
8,0 3,5 4,9 5,8 4,1 3,9 3,5 4,8 5,9 3,6
22Prof. Dr. Hercules de Souza
• Ao arranjo dos dados numéricos brutos
da tabela anterior em ordem crescente
(poderia ser decrescente) chama-se de
ROL, e denomina-se como
AMPLITUDE TOTAL dos dados como
sendo a diferença entre o maior e o
menor número do ROL.
22
23Prof. Dr. Hercules de Souza
ROL CRESCENTE
da TABELA 1
23
2,4 3,4 3,5 3,5 3,6 3,6 3,6 3,9 3,9 3,9
3,9 3,9 3,9 4,1 4,4 4,5 4,6 4,7 4,7 4,8
4,8 4,8 4,8 4,9 4,9 4,9 4,9 4,9 4,9 4,9
4,9 4,9 5,0 5,4 5,8 5,8 5,9 6,0 6,4 6,4
6,6 7,0 7,2 7,4 7,7 7,9 8,0 8,0 8,0 8,3
8,3 8,5 8,6 8,8 10,3 10,4 10,7 11,0 11,6 12,0
24Prof. Dr. Hercules de Souza
Descrição dos dados inicialmente a partir
da chamada:DISPOSIÇÃO
RAMO-E-FOLHA
2
3
4
5
6
7
8
9
10
11
12
4
969694995956
9876878599994999918
48089
4046
27049
33058600
743
06
0
24
25Prof. Dr. Hercules de Souza
DISTRIBUIÇÃO DE
FREQÜÊNCIA
• É um sumário tabular de dados que
mostra a freqüência de observações em
cada uma das diversas classes não
sobrepostas.
25
26Prof. Dr. Hercules de Souza
DISTRIBUIÇÃO DE
FREQÜÊNCIA
• Freqüência absoluta de cada classe Total de elementos em cada classe.
• Freqüência relativa Para um conjunto de dados com N observações, a freqüência relativa de cada classe é como segue:
• Freqüência relativa = freqüência absoluta da classe/N
• A freqüência percentual de uma classe é a freqüência relativa multiplicada por 100.
26
27Prof. Dr. Hercules de Souza
Exemplo: Empresas
(número de funcionários)
27
Empresa Frequência abs. Frequência rel. Frequência Perc.
Empresa 01 380 0,38 38,00 %
Empresa 02 160 0,16 16,00 %
Empresa 03 100 0,10 10,00 %
Empresa 04 260 0,26 26,00 %
Empresa 05 100 0,10 10,00 %
Total 1000 1,00 100,00 %
29Prof. Dr. Hercules de Souza
Para a construção de uma distribuição de
frequência são necessários alguns cálculos
iniciais:
1. Amplitude total (R) = maior valor da
amostra menos o menor valor da
amostra.
29
30Prof. Dr. Hercules de Souza
2. Número de classes São formadas
especificando-se os intervalos que
serão usados para agrupar as
observações no conjunto de dados.
Número de Classes (Fórmula de
Sturges): k 1+3,33log n (n = número
de elementos que se deseja
representar).
30
31Prof. Dr. Hercules de Souza
3. Tamanho do intervalo de cada classe
(h): (pode ser representado por
intervalo fechado, aberto ou misto)
h R/k
31
32Prof. Dr. Hercules de Souza
Com isso é possível construir um
histograma, que é uma representação
gráfica de frequência por meio de
retângulos justapostos ou um gráfico
denominado polígono.
32
33Prof. Dr. Hercules de Souza
O histograma pode ser de freqüências
absolutas, de freqüências relativas ou
de freqüências percentual ou um
polígono de freqüência que seria a
ligação, através de retas, do ponto
médio de cada retângulo.
33
35
EXEMPLO PARA ELABORAÇÃO
DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
2,1 4,8 5,5 10,4
3,3 3,5 4,8 5,8
5,3 5,5 2,8 3,6
5,9 6,6 7,8 10,5
7,5 6,0 4,5 4,8
Prof. Dr. Hercules de Souza
37
Número de classes:
k = 1+3,33 log20=5,33 ~ 6 classes
Amplitude: R = 10,5 -2,1= 8,4
Largura da classe:
h ~ R/k = 8,4/(1+3,33 log20)= 1,58 ~ 1,6
Prof. Dr. Hercules de Souza
38
OBSERVAÇÃO:
O número de classes e a largura das
mesmas deve ser tal que todos os
elementos da amostra estejam contidos
nessas classes e a última classe deve
conter pelo menos um elemento.
Prof. Dr. Hercules de Souza
42Prof. Dr. Hercules de Souza
Faça uma distribuição de freqüência
absoluta, relativa, percentual e
percentual acumulada e em
seguida construa um histograma
de freqüência absoluta e um
polígono com os dados da
TABELA 1
42
43Prof. Dr. Hercules de Souza
ROL CRESCENTE
da TABELA 1
43
2,4 3,4 3,5 3,5 3,6 3,6 3,6 3,9 3,9 3,9
3,9 3,9 3,9 4,1 4,4 4,5 4,6 4,7 4,7 4,8
4,8 4,8 4,8 4,9 4,9 4,9 4,9 4,9 4,9 4,9
4,9 4,9 5,0 5,4 5,8 5,8 5,9 6,0 6,4 6,4
6,6 7,0 7,2 7,4 7,7 7,9 8,0 8,0 8,0 8,3
8,3 8,5 8,6 8,8 10,3 10,4 10,7 11,0 11,6 12,0
44Prof. Dr. Hercules de Souza
Gráfico de ogiva
Os gráficos chamados de ogivas
correspondem a um polígono de
freqüências acumuladas, nas quais
estas freqüências são localizadas sobre
perpendiculares levantadas nos limites
inferiores ou superiores das classes,
dependendo se a ogiva representar as
freqüências acumuladas.
44
45Prof. Dr. Hercules de Souza
Minutos gastos ao telefone
102 124 108 86 103 82
71 104 112 118 87 95
103 116 85 122 87 100
105 97 107 67 78 125
109 99 105 99 101 92
45
46Prof. Dr. Hercules de Souza
Fazendo uma distribuição de
freqüência com 5 classes, teremos:
Classe Ponto
médio
Freqüência relativa
Freqüência cumulativa
67–78
79–90
91–102
103–114
115–126
72,5
84,5
96,5
108,5
120,5
0,10
0,17
0,27
0,30
0,17
3
8
16
25
30
46
47Prof. Dr. Hercules de Souza
Gráfico de ogiva e um gráfico de freqüência cumulativa
que mostra o número de valores, em um conjunto de
dados, que são iguais ou inferiores a um dado valor x.
Fre
qüência
cum
ula
tiva
minutos
66,5 78,5 90,5 102,5 114,5 126,50
10
20
30
0
3
8
16
25
30
47
48
SETE FERRAMENTAS DA
QUALIDADE
1. Diagrama de causa-efeito (espinha de peixe ou Ishikawa);
2. Diagrama de Pareto;
3. Histogramas;
4. Folhas de verificação;
5. Gráficos de dispersão;
6. Fluxogramas;
7. Cartas de controle.
Prof. Dr. Hercules de Souza
Diagrama de causa-efeito
(espinha de peixe ou Ishikawa) Fonte: Internet
Prof. Dr. Hercules de Souza 49
50Prof. Dr. Hercules de Souza
DIAGRAMA DE PARETO
O diagrama de Pareto é uma
homenagem ao engenheiro,
economista, filósofo e sociólogo italiano
Vilfredo Frederico Samaso Pareto
(1848 – 1923).
50
51
DIAGRAMA DE PARETO
Também conhecido como diagrama
ABC,80-20, é um gráfico de barras que
ordena as frequências das ocorrências,
da maior para a menor, permitindo a
priorização dos problemas, procurando
levar a cabo o princípio de Pareto.
Prof. Dr. Hercules de Souza
52
PRINCÍPIO DE PARETO
Afirma que para muitos fenômenos, 80%
das consequências advêm de 20% das
causas. A lei foi sugerida por Joseph
Moses Juran, (1904-2008) que deu o
nome em honra ao economista italiano
Vilfredo Pareto.
Prof. Dr. Hercules de Souza
54Prof. Dr. Hercules de Souza
DIAGRAMA DE PARETO
Considere uma amostra com 23
elementos: 2, 2, 4, 4, 4, 4, 4, 6, 6, 6, 6,
6, 6, 6, 6, 6, 8, 8, 8, 8, 8, 10, 10.
54
55Prof. Dr. Hercules de Souza
Classe Freqüência
%
cumulativo Classe Freqüência
%
cumulativo
2 ├ 4 2 8,70% 6├ 8 9 39,13%
4├ 6 5 30,43% 4├ 6 5 60,87%
6├ 8 9 69,57% 8├ 10 5 82,61%
8├10 5 91,30% 2├ 4 2 91,30%
10├ 12 2 100,00% 10├ 12 2 100,00%
55
Como fazer um diagrama de
Pareto no Excel?
• 1º Passo: Construção da tabela: 1ª
coluna a descrição do problema ou
causa, na 2ª coluna teremos os valores
absolutos de cada problema e na 3ª
coluna o percentual acumulado.
Como fazer um diagrama de
Pareto no Excel?
• 2º Passo: Definição do tipo gráfico: a)
Selecione os valores na tabela. b)
Clique no ícone assistente de gráfico. c)
Na pasta “tipos personalizados”
selecione o gráfico “Lins – Cols. em 2
eixos” e clique em avançar. Na próxima
janela clique em avançar novamente.
Como fazer um diagrama de
Pareto no Excel?
• 3º Passo: Opções iniciais: a) Na pasta
título digite o título do gráfico. b) No
espaço “Eixo dos valores (x)” digite o
título para os problemas ou causas. c)
No espaço “Eixo dos valores (y)” digite
o título para os valores absolutos.
Como fazer um diagrama de
Pareto no Excel?
• 4º Passo: Na pasta Rótulos de dados
marque a opção “Mostrar rótulo”. Na
pasta Legenda desative a opção
“Mostrar legenda”. Clique em avançar e
concluir.
61Prof. Dr. Hercules de Souza
Exemplo da utilização de um diagrama de Pareto para tipos de
defeitos que ocorreram no processo de produção de placas de
circuito impresso.
Fonte: Internet
61
Exemplo da utilização de um diagrama de
Pareto para tipos de defeitos que
ocorreram em caixas de marcha de
veículos no processo de produção.
Fonte: Internet
Prof. Dr. Hercules de Souza 63
65
FATORES DE MORTANDADE NO TRÂNSITO
DE BRASÍLIA (fonte: Detran - DF – 2001)
Atropelamento de pedestre 163
Colisão 122
Capotamento 36
Choque com objeto fixo 43
Queda 17
Atropelamento de animal 01
Demais tipos 04
Total 386
Prof. Dr. Hercules de Souza
Motivos dos atrasos em cirurgias marcadas
Fonte: balancedscorecard.blogspot.com
Prof. Dr. Hercules de Souza68
• Governo do Estado de São Paulo
elaborou um relatório baseado nos
dados do PROCON em 2010. Uma das
informações levantadas foi a
participação das “Áreas de Assuntos”
nas reclamações procedentes
recebidas em 2010.
74Prof. Dr. Hercules de Souza
São medidas que possibilitam representar
um conjunto de dados relativos à
observação de determinado fenômeno
de forma resumida. Estas medidas nos
orientam quanto à posição da
distribuição no eixo dos números reais,
possibilitam comparações de conjuntos
de dados. Enfim, representam os
fenômenos pelos seus valores médios.
74
75Prof. Dr. Hercules de Souza
n
1i i
i
n Fn
n
2F
2
1F
1
n
1i
i
n
1i
ii
n
1i
ii_
x
F
nmh)harmônicaMédia(
xxxmg)geométricaMédia(
w
xw
x)ponderadaMédia(
n
Fx
x)amostralmédiaouaritméticaMédia(
75
76Prof. Dr. Hercules de Souza
EXERCÍCIO
• Dada a seguinte distribuição: Calcule a
média aritmética ou média amostral.
Xi 1 2 3 4
Fi 1 3 5 1
76
77Prof. Dr. Hercules de Souza
EXERCÍCIO
Sejam X1, X2, X3,.........,Xn, valores de X
associados às freqüências absolutas
F1, F2, F3,......Fn.
Calcule as médias geométricas
para as tabelas a seguir:
77
79Prof. Dr. Hercules de Souza
EXERCÍCIO
Sejam X1, X2, X3,.........,Xn, valores de X
associados às freqüências absolutas
F1, F2, F3,......Fn, respectivamente.
Calcule a média harmônica e
geométrica para a mostra: 2, 2, 2, 5,
5, 5, 5, 8, 8.
79
Utilizando uma calculadora científica
padrão Casio, HP ou similar
Antes de iniciar qualquer inserção de
dados na calculadora é interessante
limpar a memória. No caso da Casio o
procedimento é o seguinte:
• SHIFT
• MODE
• ALL
• =
Prof. Dr. Hercules de Souza 80
Inserindo os dados na
calculadora
• 1- selecione em MODE a opção SD.
• 2- Insira o ponto médio de cada classe
seguido de ponto e vírgula (;) e a
frequência absoluta da mesma classe,
em seguida tecle M+.
• Siga esse procedimento até finalizar
com a última classe.
Prof. Dr. Hercules de Souza 81
Observação: Como é vital a correta
inserção dos dados de ponto médio
e frequência absolutas na
calculadora, é recomendável
verificar se não houve nenhuma
inserção errada.
Prof. Dr. Hercules de Souza 83
Como visto, a média aritmética amostral pode
ser calculada pela expressão:
O somatório do numerador da expressão acima
pode ser obtido clicando a tecla SHIFT e em
seguida a tecla 1. No display da calculadora
aparecerão 3 opções:
Escolha a opção 2
e em seguida divida
por n
Prof. Dr. Hercules de Souza 84
n
FxX ii
321
2 nxx
A média aritmética amostral também
pode ser obtida diretamente seguindo o
seguinte procedimento:
• Teclar SHIFT e em seguida a tecla 2.
• Deverá aparecer no display da
calculadora 3 opções:
• 1- Média aritmética amostral:
• 2 – Desvio padrão populacional:
• 3 – Desvio padrão amostral:
Prof. Dr. Hercules de Souza 85
X
n
nn Sou1
86Prof. Dr. Hercules de Souza
MEDIANA
É uma medida de posição que divide a
amostra ou a população em duas
partes iguais.
86
87Prof. Dr. Hercules de Souza
CÁLCULO DA MEDIANA PARA
UMA VARIÁVEL DISCRETA
Se o número n de elementos for ímpar, a
mediana será o elemento central, de
ordem (n+1)/2. Se o número n de
elementos for par, a mediana será a
média entre os elementos centrais de
ordem n/2 e n/2 +1.
87
88Prof. Dr. Hercules de Souza
EXEMPLO
Xi Fi Fac
1 1 1
2 3 4
3 5 9
4 2 11
=11
Como existem 11 elementos a mediana pode ser calculada
por (n+1)/2, logo (11+1)/2=6º elemento.
Nesse caso a mediana será o número 3.
88
89Prof. Dr. Hercules de Souza
EXEMPLO
Como existem 42 elementos a mediana pode ser calculada:
42/2 = 21º elemento e 42/2 +1=22º elemento. O 21º elemento
é o 87 e o 22º também, logo a mediana será (87+87)/2=87.
Xi Fi Fac
82 5 5
85 10 15
87 15 30
89 8 38
90 4 42
=42
89
90Prof. Dr. Hercules de Souza
CÁLCULO DA MEDIANA PARA
UMA VARIÁVEL CONTÍNUA
• Calcule a ordem N/2. Como a variável
é contínua não se preocupe se n é par
ou ímpar.
• Pela freqüência acumulada (Fac)
identifique a classe que contém à
mediana (classe Md).
90
91Prof. Dr. Hercules de Souza
1- Utilize a equação:
md
mdF
hf2
N
LMediana
Lmd = limite inferior da classe Md;
N = tamanho da amostra;
f = soma das freqüências anteriores à classe Md;
h = amplitude da classe Md;
Fmd = freqüência da classe Md.
91
92Prof. Dr. Hercules de Souza
EXEMPLO
Classes Fi Fac
35├45 5 5
45├55 12 17
55├65 18 35
65├75 14 49
75├85 6 55
85├95 3 58
=58
92
95Prof. Dr. Hercules de Souza
Para distribuições simples (sem agrupamento em classes), a identificação da moda se
faz simplesmente pela observação do elemento que apresenta maior freqüência.
Nesse caso a moda é 28
Xi 20 25 28 21 30
Fi 2 9 10 4 5
95
96Prof. Dr. Hercules de Souza
Para dados agrupados em classes pode-se utilizar a fórmula de Czuber:
1- Identificar a classe modal, ou seja, aquela que possui a maior freqüência.
2- Aplica-se a fórmula:
21
1 hinf.limModa
lim. Inf = limite inferior da classe modal.
1 = diferença entre a freqüência da classe modal e a imediatamente anterior.
2 = diferença entre a freqüência da classe modal e a imediatamente posterior.
h = amplitude da classe.
96
97Prof. Dr. Hercules de Souza
EXERCÍCIO: Calcule a moda da
seguinte distribuição:
1- A classe modal é a 3ª
2- 44,297
172Moda
Classes 0├ 1 1├ 2 2├ 3 3├ 4 4├ 5
Fi 3 10 17 8 5 43
97
98Prof. Dr. Hercules de Souza
Utilize os dados da TABELA 1
para calcular: a média, a moda,
e a mediana amostrais.
98
99Prof. Dr. Hercules de Souza
Separatrizes
A principal característica das
medidas separatrizes consiste na
separação da série em partes iguais
que apresentam o mesmo número
de valores.
99
101Prof. Dr. Hercules de Souza
Quartis
• Os quartis são valores de um conjunto
de dados ordenados, que os dividem
em quatro partes iguais. É necessário,
portanto, três quartis (Q1, Q2 e Q3) para
dividir um conjunto de dados ordenados
em quatro partes iguais.
101
102Prof. Dr. Hercules de Souza
Quartis
• Q1 : deixa 25% dos elementos abaixo
dele.
• Q2 : deixa 50% dos elementos abaixo
dele e coincide com a mediana.
• Q3 : deixa 75% dos elementos abaixo
dele.
102
103Prof. Dr. Hercules de Souza
Quartis
• A fórmula para o caso da mediana (Q2)
pode ser adaptada para o cálculo de Q1
(n/4) e Q3 (3n/4).
103
104Prof. Dr. Hercules de Souza
Decis e percentis
• Identicamente para o caso do cálculo
dos quartis, os decis e os percentis
podem ser obtidos pela adaptação da
equação para o cálculo da mediana, o
que muda é:
• D1 = n/10, D2 = 2n/10 ......D9 = 9n/10
• P1 = n/100, P2 = 2n/100... P99 = 99n/100
104
105Prof. Dr. Hercules de Souza
Utilize os dados da TABELA 1
para calcular:
Q1, Q2, Q3, D4, D7, P20, P60.
105
106Prof. Dr. Hercules de Souza
BOX-PLOT
• Visto as chamadas medidas de posição
de dados estatísticos, vamos retornar a
uma representação gráfica da síntese
desses dados chamada de Box-plot. É
um tipo gráfico muito utilizado,
representando a dispersão dos dados,
a mediana e os quartis.
106
107Prof. Dr. Hercules de Souza
200 – 11 - 2,5 - 5 – 5 - 5,5 – 3 - 3,5 – 3 - 0,4 - 3,2 – 5 – 3 - 3,2 - 7,4 - 6
0,4 - 2,5 - 3 - 3 - 3 - 3,2 - 3,2 - 3,5 - 5 - 5 - 5 - 5,5 - 6 - 7,4 - 11 - 200
•25% dos dados estão abaixo de 3, assim, o Primeiro Quartil é Q1=3;
•50% dos dados estão abaixo de 4,25, assim, o Segundo Quartil, (Q2) que também é a
Mediana é Q2=M=4,25;
•75% dos dados estão abaixo de 5,75, assim, o Terceiro Quartil é Q3=5,75
Exemplo: a seguinte amostra de dados colocados fora de ordem:
107
108Prof. Dr. Hercules de Souza
• Assim sendo podemos sumarizar esses
dados simplesmente fornecendo
apenas 5 valores:
valor mínimo = 0,4,
Q1=3,
mediana = 4,25,
Q3=5,75
Valor máximo = 200
108
109Prof. Dr. Hercules de Souza
Suponha os dados
sumarizados por sexo
Sexo F M
Q1 1,60 1,72
Min 1,52 1,62
Mediana 1,66 1,75
Max 1,79 1,90
Q3 1,70 1,82
109
• As medidas de variabilidade mais
conhecidas são:
• Amplitude total;
• Desvio simples;
• Desvio médio;
• Variância;
• Desvio padrão;
• Coeficiente de variação
de Pearson (CVP).
Prof. Dr. Hercules de Souza 113
114Prof. Dr. Hercules de Souza
Amplitude total
É a diferença entre o maior e o menor
valor de uma distribuição.
Amplitude = Maior Valor – Menor Valor
114
Desvio simples
È a diferença entre cada valor da amostra
e a sua média aritmética.
Prof. Dr. Hercules de Souza 115
xxdi
Desvio médio
Corresponde a média aritmética dos
valores absolutos dos desvios simples.
Prof. Dr. Hercules de Souza 116
n
diDM
117Prof. Dr. Hercules de Souza
Variância
Trata-se da média aritmética dos
quadrados dos desvios. Pode ser
calculada tanto para uma amostra
quanto para uma população.
117
118Prof. Dr. Hercules de Souza
Desvio padrão
Baseia-se nos desvios dos elementos
amostrais ou populacionais em torno
da média aritmética. Ou seja,
corresponde à raiz quadrada da
variância.
118
119
O desvio padrão é definido desta
forma de maneira a dar-nos uma
medida da dispersão que:
1. Seja um número não-negativo;
2. Use a mesma unidade de medida dos
dados fornecidos inicialmente.
120
n
1i
2n
1i
ii
i
2
i
2
n
1i
i
2_
i
2
22
n
1i
2_
i
n
1i
2
i
n
Fx
Fx1n
1Sou
1n
F)xx(
S.)agrup.amosdados/pVar(
S)amostralVariância(alpopulacionVariância(
1n
)xx(
S)amostral.P.D(n
)x(
)alpopulacion.P.D(
121
Porque o desvio padrão costuma ser
mais apropriado que o desvio médio?
O cálculo do desvio médio considera apenas o módulo da diferença entre o
valor e sua média, enquanto que o desvio padrão considera o dobro dessa
diferença. Isso faz com que o desvio padrão tenha uma sensibilidade maior e capte melhor a variação dos números
em relação a sua média.
122
Observe as amostras abaixo:
1. (-1,5; -1,5; 0; 1,5; 1,5)Média= 0; DM = 1,2 e DP = 1,5000
2. (-2; -1; 0; 1; 2)Média= 0; DM = 1,2 e DP = 1,5811
3. (-2,5; -0,5; 0; 0,5; 2,5)
Média= 0; DM = 1,2 e DP = 1,8028
As amostras são diferentes, mas o desvio médio é sempre o mesmo; enquanto que o desvio padrão
varia de amostra para amostra e apresenta um valor maior naquela cujos números estão mais distantes
da média.
Exemplo
• Calcular o desvio padrão e a variância
para a seguinte amostra de dados não
agrupados: S2 = 10,267, S = 3,204
Prof. Dr. Hercules de Souza 123
5 7 10 9 11
12 15 6 8 13
Obtendo o desvio padrão
amostralApós a inserção dos dados, como feito para o
cálculo da média aritmética amostral.
• Teclar SHIFT e em seguida a tecla 2.
• Deverá aparecer no display da calculadora 3
opções:
• 1- Média aritmética;
• 2 – Desvio padrão populacional;
• 3 – Desvio padrão amostral.
Prof. Dr. Hercules de Souza 124
125Prof. Dr. Hercules de Souza
Coeficiente de variação de Pearson
É uma medida útil para a comparação
entre séries distintas, mesmo quando
essas se referem a fenômenos
distintos inclusive com unidades de
medidas diferentes.
125
100Média
PadrãoDesvioCVP
126
Exemplo
• Considere a tabela abaixo que contem a média
do comprimento e a massa de determinada
peça.
Média Desvio Padrão
Comprimento
(cm)8,0 2,0
Massa (g) 50,0 10,0
127
Qual das duas medidas possuem maior
homogeneidade?
Essa resposta pode ser respondida pelo cálculo
do Coeficiente de variação de Pearson.
CVP (comprimento) = (2,0 x 100)/8 = 25%
CVP (massa) = (10,0 x 100)/50 = 20 %
Logo a massa por possuir menor CVP
apresenta menor grau de dispersão
128Prof. Dr. Hercules de Souza 128
Classe Ponto médio Freqüência XiFi Xi2Fi
0 ├ 10 5 2 10 50
10 ├ 20 15 1 15 225
20 ├ 30 25 5 125 3125
30 ├ 40 35 8 280 9800
40 ├ 50 45 4 180 8100
n=20 Σ=610 Σ=21300
Exemplo
131Prof. Dr. Hercules de Souza
• Utilize os dados da TABELA 1
para calcular: A variância, o
desvio padrão amostrais e o
coeficiente de variação.
131
Outlier
O que é? É uma observação que
apresenta um grande afastamento das
demais da série[1] (que esta "fora" dela),
ou que é inconsistente.
Prof. Dr. Hercules de Souza 132
133Prof. Dr. Hercules de Souza
TEOREMA DE TCHEBYCHEV
Pafnuti Lvovitch Tchebychev, matemático
russo que realizou vários trabalhos, no
século XIX na área de probabilidade e
Estatística, dentre eles esse famoso teorema.
Esse teorema diz que muitas vezes é
interessante descobrirmos, utilizando a
média e o desvio padrão, a posição relativa
de uma observação com relação a uma
amostra.
133
134Prof. Dr. Hercules de Souza
• O Teorema de Tchebychev permite
fazer observações sobre o percentual
dos dados que estão dentro de um
número específico de desvios padrões
da média.
134
135Prof. Dr. Hercules de Souza
Para qualquer distribuição amostral com média e desvio padrão S, tem-se:
• (X S) - O intervalo contém, no mínimo 68% de todas as observações amostrais.
• (X 2S) O intervalo contém, no mínimo 75% de todas as observações amostrais.
• (X 3S) O intervalo contém, no mínimo 89% de todas as observações amostrais.
135
136Prof. Dr. Hercules de Souza
ASSIMETRIA
• Assimetria é o grau de desvio, ou
afastamento de uma distribuição da
unidade de simetria.
136
137
• Se uma distribuição é simétrica então:
média = mediana = moda
• Se a distribuição é assimétrica positiva
então:
moda < Mediana < Média
• Se a distribuição é assimétrica negativa
então:
média < Mediana < Moda.X
X
X
Prof. Dr. Hercules de Souza
139
• Existem várias fórmulas para o cálculo do
coeficiente de assimetria, dentre elas, temos:
• 1º Coeficiente de Pearson:
• 2º Coeficiente de Pearson (Bowley):
s
MoxASou
MoxAS
Prof. Dr. Hercules de Souza
13
d31
M2QQAS
140
• Se:
• AS = 0 diz-se que a distribuição é simétrica;
• AS > 0 diz-se que a distribuição é assimétrica
positiva (à direita);
• AS < 0 diz-se que a distribuição é assimétrica
negativa (à esquerda);
Prof. Dr. Hercules de Souza
141Prof. Dr. Hercules de Souza
CURTOSE
• Curtose é o grau de achatamento de
uma distribuição, pode ser denominada
leptocúrtica (delgada), platicúrtica
(achatada) ou mesocúrtica (nem
delgada nem achatada).
141
143
Índice Percentílico de Curtose:
Encontra-se este índice usando a
seguinte fórmula:
Prof. Dr. Hercules de Souza
19
13
2 DD
QQC
144
• Se C<0,263 A distribuição é LEPTOCÚRTICA;
• Se C=0,263 A distribuição é MESOCÚRTICA;
• Se C>0,263 A distribuição é PLATICÚRTICA.
Prof. Dr. Hercules de Souza
145Prof. Dr. Hercules de Souza
OBSERVAÇÃO
• O software Excel apresenta-se como uma
poderosa ferramenta de análise estatística,
permitindo ao seu usuário uma análise das
várias medidas estatísticas, vistas nesta
apostila.
• Para tanto basta que o usuário selecione a
opção Análise de Dados no menu
Ferramentas do Excel, e analise as várias
possibilidades estatísticas ali existentes.
145
147Prof. Dr. Hercules de Souza
1. Suponha a idade de 50 funcionários de uma empresa, construa um histograma e
um polígono de freqüências absolutas. Calcule a média amostral, moda,
mediana, desvio padrão, Q1, Q3, P60 e D3. Faça um diagrama de Pareto e um
Box-plot, interpretando o seu significado. Interprete o Teorema de
Tchebychev.
18 20 20 21 22 24 25 25 26 27
29 29 30 30 31 31 32 33 34 35
36 36 37 37 37 37 38 38 38 40
41 43 44 44 45 45 45 46 47 48
49 50 51 53 54 54 56 58 62 65
147
148Prof. Dr. Hercules de Souza
2. Construa gráficos de barra e pizza, analise os dados e resuma seus resultados, a
partir das tabelas abaixo.
Causas de problemas de
coluna
Percentagem (%)
Quedas 20,8
Veículos 47,7
Esportes 14,2
Violência 14,6
Outros 2,7
Total 100,0
148
149Prof. Dr. Hercules de Souza
3. Construa gráficos de barra e pizza, analise os dados e resuma seus resultados, a
partir das tabelas abaixo.
Causas de problemas de
coluna por esporte
Percentagem (%)
Mergulho 66,0
Futebol 6,1
Ginástica 2,2
Equitação 2,0
Esportes de inverno 2,3
Esqui na neve 3,8
Surfe 3,1
Trampolim 2,6
Luta 2,3
Outros 9,6
Total 100,0
149
150Prof. Dr. Hercules de Souza
4. Dados relativos a uma amostra aleatória.
4,5 6,5 2,0 2,5 4,0 3,5 5,0 3,0 5,0 5,5
1,0 7,5 3,0 2,0 3,0 3,5 3,5 5,0 6,0 4,5
2,0 3,0 3,5 3,5 3,0 3,0 4,0 1,5 1,5 2,5
a) Posicione os dados em uma distribuição ramo-e-folha;
b) Elabore a distribuição de freqüência relativa e percentual;
c) Elabore um histograma de percentagem;
d) Elabore um polígono de percentagem.
e) Calcule a média aritmética a moda a mediana, Q1, Q3, P80 e D4, a variância e o
coeficiente de variação de Pearson e em seguida construa um diagrama de
Pareto e um box-plot. Interprete o Teorema de Tchebychev.
150
151Prof. Dr. Hercules de Souza
5. Distribuições de freqüências para contas a receber.
MONTANTE
Freqüência (março)
Freqüência
(abril)
R$ 0,00 ├ R$ 2.000,00
6
10
R$ 2.000,00 ├ R$ 4.000,00
12 14
R$ 4.000,00 ├ R$ 6.000,00
17 13
R$ 6.000,00 ├ R$ 8.000,00
10 10
R$ 8.000,00 ├ R$ 10.000,00
4 0
R$ 10.000,00 ├ R$ 12.000,00
1 3
Total 50 50
a) Construa um histograma e um polígono de freqüência absoluta para cada mês;
b) Construa um diagrama de Pareto para cada mês interpretando-os;
c) Calcule a média aritmética a moda a mediana e o desvio padrão, amostrais;
d) Calcule o coeficiente de variação de Pearson interpretando o seu significado.
151
152Prof. Dr. Hercules de Souza
6. Suponha a seguinte tabela onde temos os dias gastos para auditorias em
empresas. Construa um histograma de freqüências absolutas, um histograma de
freqüências relativas e um histograma de freqüências percentual. Calcule a
média amostral, moda, mediana, desvio padrão. Calcule também qual a
probabilidade das observações amostrais estarem entre a média mais ou menos
dois desvios padrões.
12 14 19 18
15 15 18 17
20 27 22 23
22 21 33 28
14 18 16 13
152
153Prof. Dr. Hercules de Souza
7. Calcular a média geométrica e harmônica para as séries: a) 8, 15, 10, 12.
b) 3, 4, 5, 6, 7, 8. c) 5, 7, 12, 15. d) 3, 3, 3, 4, 4, 4, 4, 5, 6, 6.
8. Calcule a média geral das turmas de uma escola na disciplina de matemática,
cujas médias por turma são as seguintes: turma A (40 alunos), média 6,5, turma
B (35 alunos), média 6,0, turma C (35 alunos), média 4,0 e turma D (20 alunos),
média 7,5.
153
154Prof. Dr. Hercules de Souza
9. Uma determinada instituição financeira possui 3 operadores trabalhando na
bolsa de valores de São Paulo. A tabela abaixo apresenta uma amostra com o
número de operações fechadas por um desses operadores nos últimos dois anos.
Utilize o Excel para as conclusões estatísticas possíveis.
14 12 13 11 12 13 16 14 14 15 17 14 11
13 14 15 13 12 14 13 14 13 15 16 12 12
154
155Prof. Dr. Hercules de Souza
10. A classe média brasileira gasta em média R$ 65,88 por mês jantando fora de
casa. Uma amostra com adolescentes forneceu, no último mês, os seguintes
gastos em R$, que os mesmos gastam em refeições ou lanches feitos fora de
casa:
253 101 245 467 131
0 225 80 113 69
198 95 129 124 11
178 104 161 0 118
151 55 152 134 169
Calcule a média, mediana, moda, variância e o desvio padrão. Qual a conclusão que se
pode tirar com relação aos gastos desses adolescentes com relação à média da classe
média brasileira.
155
156Prof. Dr. Hercules de Souza
11. Um levantamento foi realizado com relação à habilidade dos fabricantes de
computadores de resolverem os problemas técnicos com rapidez. Foram obtidos
os seguintes resultados:
Empresa Dias p/ resolver Empresa Dias p/ resolver
Compaq 13 Gateway 21
Packard Bell 27 Digital 27
Quantex 11 IBM 12
Dell 14 HP 14
Nec 14 AT&T 20
Ast 17 Toshiba 37
Acer 16 Mícron 17
Calcule a média, a mediana, a variância e o desvio padrão dessa distribuição. Qual a
conclusão que se chega a partir dessas medidas de posição e dispersão?
156
157Prof. Dr. Hercules de Souza
12. Suponha a seguinte distribuição com as notas obtidas por 50 alunos na
disciplina de português.
60,0 85,0 33,0 52,0 65,0 77,0 84,0 65,0 74,0 57,0
71,0 35,0 81,0 50,0 35,0 64,0 74,0 47,0 54,0 68,0
80,0 61,0 41,0 91,0 55,0 73,0 59,0 53,0 77,0 45,0
41,0 55,0 78,0 48,0 69,0 85,0 67,0 39,0 60,0 76,0
94,0 98,0 66,0 66,0 73,0 42,0 65,0 94,0 88,0 89,0
Calcule: a) Amplitude; b) Número de classes; c) Freqüência absoluta e relativa; d)
Ponto médio de cada classe; e) Freqüência acumulada; f)Histograma; g) Polígono de
freqüência; h) Diagrama de Pareto; i) Média; j) Moda; k) Mediana. l) desvio padrão.
m)Q1, Q3, P35 e D8, n)Box-plot. o) Interprete o Teorema de Tchebychev.
157