Post on 18-Nov-2021
Aula 07 – Estatística Descritiva
ESTATÍSTICA DESCRITIVA
2
Aula 07 – Estatística Descritiva
Estatística Descritiva
O que fazer com as observações que coletamos?
Resumo dos dados: organizar, descrever e resumir os dados coletados ⇒ Estatística descritiva
Primeira etapa da análise:
5
Aula 07 – Estatística Descritiva
QUALITATIVA
QUANTITATIVA
NOMINAL
ORDINAL
CONTÍNUA
DISCRETA
tempo, distância, salário
número de clientes, número de caminhões
origem de um pedido (capital ou interior)
porte de uma empresa (pequena, média, grande)
Variável: Qualquer característica associada a uma população.
Classificação das variáveis
Aula 07 – Estatística Descritiva
Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação
MEDIDAS DE DISPERSÃO:
Mínimo, Máximo, Moda, Média, Média Aparada, Mediana, Percentis
MEDIDAS DE POSIÇÃO:
Variáveis Quantitativas
Aula 07 – Estatística Descritiva
• Mínimo (min): o menor valor observado • Máximo (max): o maior valor observado• Moda (mo): é o valor (ou atributo) que ocorre com maior frequência,
Medidas de Posição
Aula 07 – Estatística Descritiva
n
x
nxxxxx
n
ii
n∑==
++++= 1321 ...
• Média
Medidas de Posição
• Mediana
A mediana é o valor da variável que ocupa a posiçãocentral de um conjunto de n dados ordenados,
Aula 07 – Estatística Descritiva
O percentil de ordem p ×100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável tal que p ×100 das observações do conjunto dos ndados ordenados são inferiores ou iguais a ele.
• Percentil p
percentil 50 = mediana ou segundo quartil (Md)percentil 25 = primeiro quartil (Q1)percentil 75 = terceiro quartil (Q3)
Casos particulares
Medidas de Posição
Aula 07 – Estatística Descritiva
Finalidade: encontrar um valor que resuma avariabilidade de um conjunto de dados
• Amplitude (A)
A = máx - min
Medidas de Dispersão
• Intervalo-Interquartil É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1.
Aula 07 – Estatística Descritiva
∑= −
−=
−−++−
==n
i
in
nxx
nxxxxsVariância
1
22212
1)(
1)(...)(
VariânciasPadrãoDesvio ==
• Variância
• Desvio padrão
Medidas de Dispersão
Aula 07 – Estatística Descritiva
- é uma medida de dispersão relativa- elimina o efeito da magnitude dos dados- exprime a variabilidade em relação à média
%100×=xsCV
• Coeficiente de Variação (CV)
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Idade 27,47 anos 1,88 anos 6,8%Renda 3763,7 reais 594,7reais 15,8%
Média DesvioPadrão
Coef, de Variação
Conclusão: Os indivíduos são, aproximadamente, duas vezes mais dispersos quanto à renda do que quanto à idade
Idade e renda de indivíduosExemplo 1 :
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Conclusão: Em relação às médias, os atrasos de ambas as companhias apresentam variabilidade quase iguais.
Desviopadrão
Coef. devariaçãoMédia
Cia. A 50 6 12%Cia. B 160 16 10%
Número de atrasos de vôos de uma amostra da Cia. A e de uma amostra de Cia. B
Exemplo 2:
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Representa os dados através de umretângulo construído com os quartis efornece informações sobre os valoresextremos.
Gráfico Boxplot
GRÁFICOS
Aula 07 – Estatística Descritiva
“Máximo”
Q3Mediana
Q1
“Mínimo”
25%
50%75%
LS = Q3+1,5(Q3-Q1)
LI = Q1-1,5(Q3-Q1)
“Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI.
Boxplot
Aula 07 – Estatística Descritiva
md = 41,5 Q1 = 30,25 Q3 = 49,5
*
*
120
100
80
60
40
20
Dados ordenados (n=36)
18 21 21 23 23 25
27 29 30 31 32 32
32 34 35 36 38 41
42 42 43 44 45 46
46 47 48 50 54 56
57 58 60 61 98 116
LI = Q1 - 1,5(Q3 - Q1) =1,38
LS = Q3 + 1,5(Q3 - Q1) =78,38
Observações discrepantes
Vida útil de máquinas (dias)Exemplo 3:
Boxplot
Aula 07 – Estatística Descritiva
Os dados também podem ser resumidos construindo-se uma tabela de distribuição de frequências .
Distribuição de frequências de uma variávelé uma lista dos valores individuais ou deintervalos de valores que a variável podeassumir, com as respectivas frequências deocorrência.
Aula 07 – Estatística Descritiva
Dados do Tempo de duração de 187 viagens (em horas)
Tempo Frequência (ni) Tempo Frequência (ni)0 55 30 2
2 1 35 2
4 1 40 1
5 59 44 1
6 2 50 1
7 3 57 1
8 2 60 1
9 1 70 2
10 28 75 2
13 2 95 1
15 10 660 1
20 6 1245 1
28 1
N = 187
Exemplo 4: Distribuição de frequências
Aula 07 – Estatística Descritiva
Com a simples tabulação dos dados detectou-se:
• em 55 viagens encontra-se registrado o tempo zero, que é um valor claramente impossível;
• percebe-se a existência de um número excessivo de viagens com tempo de duração múltiplo de 5: 5, 10, 15 horas, etc. Existe uma tendência observada na população em geral em arredondar valores numéricos para múltiplos de 5;
• dois valores apresentam-se muito superiores aos demais (660 e 1245).
Exemplo 4 (continuação):
Distribuição de frequências
Aula 07 – Estatística Descritiva
Medidas descritivas para a variável Tempo de duração de viagens
Medida Descritiva Amostra Completa Excluindo o valor 1245
Excluindo os valores 1245 e 660
Média 27,5 18,2 13,3
Mediana 7,5 7,0 7,0
Desvio-padrão 121,8 58,8 16,4
Q1 5,0 5,0 5,0
Q3 14,5 13,0 13,0
n 132 131 130
Exemplo 4 (cont.): Retirando os “zero’s”
Distribuição de frequências
Aula 07 – Estatística Descritiva
Variável: distância contínua Construir intervalos de classeClasses de distâncias ni fri
0,0 |- 10,010,0 |- 20,020,0 |- 30,030,0 |- 40,040,0 |- 50,050,0 |- 60,060,0 |- 70,070,0 |- 80,080,0 |- 90,090,0 |- 100,0
Total
6940
74221401
130
0,5310,3080,0540,0310,0150,0150,0080,0310,0000,0081,000
Distribuição de frequências para a variável Tempo de duração de viagens
Exemplo 4 (cont.): Retirando o “zero”
Distribuição de frequências
Aula 07 – Estatística Descritiva
• Bases iguais ou diferentes• Construir um retângulo para cada classe, com baseigual ao tamanho da classe e área do retângulo iguala frequência relativa da classe (fr).• A altura será dada porh = fr/tamanho da base (densidade de frequência).
Dados agrupados em intervalos de classes (distribuição de frequências)
Gráfico histograma
Aula 07 – Estatística Descritiva
Classes (meses) ni fri hi
0 |- 3 140 0,28 0,093
3 |- 12 100 0,20 0,022
12 |-24 80 0,16 0,013
24 |-60 180 0,36 0,010
Total 500 1,000 3 12 24 60
h0,10
0,02
0,04
0,06
0,08
Exemplo 5: Vida útil de lâmpadas
Histograma
Aula 07 – Estatística Descritiva
Exemplo 6: Tempo de duração de viagens
Histograma
Aula 07 – Estatística Descritiva
Sobre um eixo, são representados retângulos, um para cada categoria da variável.
A altura do retângulo é proporcional à frequência da categoria.
⇒Adequado para variáveis qualitativas
Gráfico de Barras
Aula 07 – Estatística Descritiva
Exemplo 7:
3210
60
50
40
30
20
10
0
Activity
Coun
t of A
ctiv
ity
Variável Activity : atividade de armazéns (nenhuma – 0; leve – 1; moderada – 2; intensa –3)
Gráfico de barras
⇒ Variável qualitativa ordinal
Aula 07 – Estatística Descritiva
Porcentagem acumulada
Exemplo 8: Considere a variável “Número de funcionários” de empresas pequenas de logística.
Um levantamento de 20 empresas forneceu os seguintes dados (já ordenados):5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25.
Aula 07 – Estatística Descritiva
Dados: 5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25
Porcentagem acumulada
Distribuição de frequências do no. de funcion.No.de filhos ni fi fi(%) Ni Fi Fi (%)
5 4 0,20 20 4 0,20 2010 5 0,25 25 9 0,45 4515 7 0,35 35 .16 0,80 8020 3 0,15 15 19 0,95 9525 1 0,05 5 20 1,00 100Total n=20 1,00 100,0
Considerando os distintos valores da variável ordenados, temosNi: frequencia absoluta acumulada no valor xi da variável;Fi: frequencia relativa acumulada no valor xi;Fi (%) : frequencia relativa acumulada no valor xi, em %
Exemplo 8 (cont):
Aula 07 – Estatística Descritiva
Porcentagem acumulada
Distribuição de frequências do número de funcionáriosno.de func. ni fi fi(%) Ni Fi Fi (%)
5 4 0,20 20 4 0,20 2010 5 0,25 25 9 0,45 4515 7 0,35 35 16 0,80 8020 3 0,15 15 19 0,95 9525 1 0,05 5 20 1,00 100Total n=20 1,00 100,0
• 25 % das empresas tem 10 funcion.; (5 empresas das 20)• 45 % tem até 10 funcion.; (que são 9 das 20 empresas)• 7 empresas tem 15 funcion;• 19 empresas tem até 20 funcion. (ou 95% dos empresas tem 20 funcion. ou menos); etc...
Exemplo 8 (cont.): Interpretação
Aula 07 – Estatística Descritiva
Forma da Distribuição