Estatística Descritiva

158
1 Prof. Dr. Hercules de Souza ESTATÍSTICA DESCRITIVA 1

description

estatistica

Transcript of Estatística Descritiva

1Prof. Dr. Hercules de Souza

ESTATÍSTICA

DESCRITIVA

1

2Prof. Dr. Hercules de Souza

O que é Estatística?

• Poder-se-ia sintetizar como sendo a

ciência dos dados. Historicamente

surgiu a partir de dois fenômenos

distintos: a necessidade de dados

censitários e o desenvolvimento da

teoria do cálculo das probabilidades.

2

3Prof. Dr. Hercules de Souza

ALGUNS CONCEITOS

ESTATÍSTICOS IMPORTANTES

• ESTATÍSTICA DESCRITIVA Sugere a organização, sumarização e descrição de um conjunto de dados. Com a construção de gráficos, tabelas, e com o cálculo de medidas com base em uma coleção de dados numéricos.

3

4Prof. Dr. Hercules de Souza

• por exemplo, com as idades dos

alunos, poderemos melhor

compreender o comportamento da

variável expressa no conjunto de dados

sob análise.

4

5Prof. Dr. Hercules de Souza

ALGUNS CONCEITOS

ESTATÍSTICOS IMPORTANTES

• ESTATÍSTICA INFERENCIAL Pode-

se definir como sendo os métodos que

tornam possível a estimação de

características de uma população

baseadas nos dados amostrais.

5

6Prof. Dr. Hercules de Souza

ALGUNS CONCEITOS

ESTATÍSTICOS IMPORTANTES

• POPULAÇÃO É a totalidade de

itens, objetos ou pessoas sob

consideração.

• AMOSTRA É uma parte da

população que é selecionada para

análise.

6

7Prof. Dr. Hercules de Souza

SUPONHA A SEGUINTE

TABELA

EMPRESA

BOLSA DE

VALORES

SÍMBOLO DO

PAINEL

VENDAS

ANUAIS

(milhões de

reais)

PREÇO DA AÇÃO

(R$)

Petrobrás ON Peb 215,70 11,5

Ford PN Fd 107,5 9,2

Arisco PP Ar 23,7 3,5

Microsoft ON Mft 89,9 9,8

Intel PN Itl 323,8 8,7

Cosipa PP Cpa 157,2 12,7

Açominas ON Mas 79,3 6,6

7

8Prof. Dr. Hercules de Souza

• ELEMENTOS São as entidades

sobre os quais os dados são coletados,

por exemplo, na tabela anterior, cada

empresa é um elemento.

• VARIÁVEL É uma característica de

interesse para os elementos (quatro

variáveis na tabela anterior).

8

9Prof. Dr. Hercules de Souza

• VARIÁVEL QUALITATIVA Bolsa de

valores constitui uma variável

qualitativa. O símbolo do painel

eletrônico também constitui uma

variável qualitativa.

• VARIÁVEL QUANTITATIVA Vendas

anuais denotam uma variável desse

tipo.

9

10Prof. Dr. Hercules de Souza

• DADOS QUANTITATIVOS Indicam

quantidade, ex: 215,70 milhões de

reais.

• DADOS QUALITATIVOS Podem ser

numéricos ou não, por exemplo,

podemos especificar que um significa

uma ação comercializada na Bolsa de

valores de SP.

10

11Prof. Dr. Hercules de Souza

DESCRIÇÃO GRÁFICA DE

VARIÁVEIS QUALITATIVAS

• Coluna, Pizza e Barra são os gráficos

mais comuns para a descrição de

dados oriundos de variáveis

qualitativas.

11

12Prof. Dr. Hercules de Souza

Preço das ações de três

empresas em um determinado

ano (R$)

1° Trim 2°Trim 3° Trim 4° Trim

Petrobrás 20,4 27,4 90,0 20,4

Açominas 30,6 38,6 34,6 31,6

Arisco 45,9 46,9 45,0 43,9

12

13Prof. Dr. Hercules de Souza

COLUNA

13

14Prof. Dr. Hercules de Souza

PIZZA

Petrobrás

14

15Prof. Dr. Hercules de Souza

BARRA

15

16Prof. Dr. Hercules de Souza

• EXEMPLOS DE

APRESENTAÇÕES DE

DADOS

• Exemplo: Características do

eleitor nordestino. (Veja

16/08/2006)

16

17Prof. Dr. Hercules de Souza 17

18Prof. Dr. Hercules de Souza

Compensação salarial em

relação ao nível de instrução

(Veja 06/09/2006)

18

19Prof. Dr. Hercules de Souza 19

20Prof. Dr. Hercules de Souza 20

21Prof. Dr. Hercules de Souza

DESCRIÇÃO GRÁFICA DE

VARIÁVEIS QUANTITATIVAS

TABELA 1

21

7,2 4,9 10,7 10,4 6,4 4,8 4,7 4,6 6,0 5,4

4,8 4,7 8,3 3,9 4,8 8,3 6,4 6,6 4,5 8,0

3,6 2,4 8,5 8,8 7,7 4,9 8,6 12,0 4,9 7,0

11,0 4,9 3,9 4,9 4,4 4,9 4,9 8,0 3,6 7,4

7,9 4,9 5,8 3,9 11,6 10,3 3,4 3,9 5,0 3,9

8,0 3,5 4,9 5,8 4,1 3,9 3,5 4,8 5,9 3,6

22Prof. Dr. Hercules de Souza

• Ao arranjo dos dados numéricos brutos

da tabela anterior em ordem crescente

(poderia ser decrescente) chama-se de

ROL, e denomina-se como

AMPLITUDE TOTAL dos dados como

sendo a diferença entre o maior e o

menor número do ROL.

22

23Prof. Dr. Hercules de Souza

ROL CRESCENTE

da TABELA 1

23

2,4 3,4 3,5 3,5 3,6 3,6 3,6 3,9 3,9 3,9

3,9 3,9 3,9 4,1 4,4 4,5 4,6 4,7 4,7 4,8

4,8 4,8 4,8 4,9 4,9 4,9 4,9 4,9 4,9 4,9

4,9 4,9 5,0 5,4 5,8 5,8 5,9 6,0 6,4 6,4

6,6 7,0 7,2 7,4 7,7 7,9 8,0 8,0 8,0 8,3

8,3 8,5 8,6 8,8 10,3 10,4 10,7 11,0 11,6 12,0

24Prof. Dr. Hercules de Souza

Descrição dos dados inicialmente a partir

da chamada:DISPOSIÇÃO

RAMO-E-FOLHA

2

3

4

5

6

7

8

9

10

11

12

4

969694995956

9876878599994999918

48089

4046

27049

33058600

743

06

0

24

25Prof. Dr. Hercules de Souza

DISTRIBUIÇÃO DE

FREQÜÊNCIA

• É um sumário tabular de dados que

mostra a freqüência de observações em

cada uma das diversas classes não

sobrepostas.

25

26Prof. Dr. Hercules de Souza

DISTRIBUIÇÃO DE

FREQÜÊNCIA

• Freqüência absoluta de cada classe Total de elementos em cada classe.

• Freqüência relativa Para um conjunto de dados com N observações, a freqüência relativa de cada classe é como segue:

• Freqüência relativa = freqüência absoluta da classe/N

• A freqüência percentual de uma classe é a freqüência relativa multiplicada por 100.

26

27Prof. Dr. Hercules de Souza

Exemplo: Empresas

(número de funcionários)

27

Empresa Frequência abs. Frequência rel. Frequência Perc.

Empresa 01 380 0,38 38,00 %

Empresa 02 160 0,16 16,00 %

Empresa 03 100 0,10 10,00 %

Empresa 04 260 0,26 26,00 %

Empresa 05 100 0,10 10,00 %

Total 1000 1,00 100,00 %

28Prof. Dr. Hercules de Souza

29Prof. Dr. Hercules de Souza

Para a construção de uma distribuição de

frequência são necessários alguns cálculos

iniciais:

1. Amplitude total (R) = maior valor da

amostra menos o menor valor da

amostra.

29

30Prof. Dr. Hercules de Souza

2. Número de classes São formadas

especificando-se os intervalos que

serão usados para agrupar as

observações no conjunto de dados.

Número de Classes (Fórmula de

Sturges): k 1+3,33log n (n = número

de elementos que se deseja

representar).

30

31Prof. Dr. Hercules de Souza

3. Tamanho do intervalo de cada classe

(h): (pode ser representado por

intervalo fechado, aberto ou misto)

h R/k

31

32Prof. Dr. Hercules de Souza

Com isso é possível construir um

histograma, que é uma representação

gráfica de frequência por meio de

retângulos justapostos ou um gráfico

denominado polígono.

32

33Prof. Dr. Hercules de Souza

O histograma pode ser de freqüências

absolutas, de freqüências relativas ou

de freqüências percentual ou um

polígono de freqüência que seria a

ligação, através de retas, do ponto

médio de cada retângulo.

33

34Prof. Dr. Hercules de Souza 34

35

EXEMPLO PARA ELABORAÇÃO

DE UMA DISTRIBUIÇÃO DE

FREQUÊNCIA

2,1 4,8 5,5 10,4

3,3 3,5 4,8 5,8

5,3 5,5 2,8 3,6

5,9 6,6 7,8 10,5

7,5 6,0 4,5 4,8

Prof. Dr. Hercules de Souza

36

ROL CRESCENTE

Prof. Dr. Hercules de Souza

37

Número de classes:

k = 1+3,33 log20=5,33 ~ 6 classes

Amplitude: R = 10,5 -2,1= 8,4

Largura da classe:

h ~ R/k = 8,4/(1+3,33 log20)= 1,58 ~ 1,6

Prof. Dr. Hercules de Souza

38

OBSERVAÇÃO:

O número de classes e a largura das

mesmas deve ser tal que todos os

elementos da amostra estejam contidos

nessas classes e a última classe deve

conter pelo menos um elemento.

Prof. Dr. Hercules de Souza

39Prof. Dr. Hercules de Souza

40Prof. Dr. Hercules de Souza

41Prof. Dr. Hercules de Souza

42Prof. Dr. Hercules de Souza

Faça uma distribuição de freqüência

absoluta, relativa, percentual e

percentual acumulada e em

seguida construa um histograma

de freqüência absoluta e um

polígono com os dados da

TABELA 1

42

43Prof. Dr. Hercules de Souza

ROL CRESCENTE

da TABELA 1

43

2,4 3,4 3,5 3,5 3,6 3,6 3,6 3,9 3,9 3,9

3,9 3,9 3,9 4,1 4,4 4,5 4,6 4,7 4,7 4,8

4,8 4,8 4,8 4,9 4,9 4,9 4,9 4,9 4,9 4,9

4,9 4,9 5,0 5,4 5,8 5,8 5,9 6,0 6,4 6,4

6,6 7,0 7,2 7,4 7,7 7,9 8,0 8,0 8,0 8,3

8,3 8,5 8,6 8,8 10,3 10,4 10,7 11,0 11,6 12,0

44Prof. Dr. Hercules de Souza

Gráfico de ogiva

Os gráficos chamados de ogivas

correspondem a um polígono de

freqüências acumuladas, nas quais

estas freqüências são localizadas sobre

perpendiculares levantadas nos limites

inferiores ou superiores das classes,

dependendo se a ogiva representar as

freqüências acumuladas.

44

45Prof. Dr. Hercules de Souza

Minutos gastos ao telefone

102 124 108 86 103 82

71 104 112 118 87 95

103 116 85 122 87 100

105 97 107 67 78 125

109 99 105 99 101 92

45

46Prof. Dr. Hercules de Souza

Fazendo uma distribuição de

freqüência com 5 classes, teremos:

Classe Ponto

médio

Freqüência relativa

Freqüência cumulativa

67–78

79–90

91–102

103–114

115–126

72,5

84,5

96,5

108,5

120,5

0,10

0,17

0,27

0,30

0,17

3

8

16

25

30

46

47Prof. Dr. Hercules de Souza

Gráfico de ogiva e um gráfico de freqüência cumulativa

que mostra o número de valores, em um conjunto de

dados, que são iguais ou inferiores a um dado valor x.

Fre

qüência

cum

ula

tiva

minutos

66,5 78,5 90,5 102,5 114,5 126,50

10

20

30

0

3

8

16

25

30

47

48

SETE FERRAMENTAS DA

QUALIDADE

1. Diagrama de causa-efeito (espinha de peixe ou Ishikawa);

2. Diagrama de Pareto;

3. Histogramas;

4. Folhas de verificação;

5. Gráficos de dispersão;

6. Fluxogramas;

7. Cartas de controle.

Prof. Dr. Hercules de Souza

Diagrama de causa-efeito

(espinha de peixe ou Ishikawa) Fonte: Internet

Prof. Dr. Hercules de Souza 49

50Prof. Dr. Hercules de Souza

DIAGRAMA DE PARETO

O diagrama de Pareto é uma

homenagem ao engenheiro,

economista, filósofo e sociólogo italiano

Vilfredo Frederico Samaso Pareto

(1848 – 1923).

50

51

DIAGRAMA DE PARETO

Também conhecido como diagrama

ABC,80-20, é um gráfico de barras que

ordena as frequências das ocorrências,

da maior para a menor, permitindo a

priorização dos problemas, procurando

levar a cabo o princípio de Pareto.

Prof. Dr. Hercules de Souza

52

PRINCÍPIO DE PARETO

Afirma que para muitos fenômenos, 80%

das consequências advêm de 20% das

causas. A lei foi sugerida por Joseph

Moses Juran, (1904-2008) que deu o

nome em honra ao economista italiano

Vilfredo Pareto.

Prof. Dr. Hercules de Souza

Prof. Dr. Hercules de Souza 53

54Prof. Dr. Hercules de Souza

DIAGRAMA DE PARETO

Considere uma amostra com 23

elementos: 2, 2, 4, 4, 4, 4, 4, 6, 6, 6, 6,

6, 6, 6, 6, 6, 8, 8, 8, 8, 8, 10, 10.

54

55Prof. Dr. Hercules de Souza

Classe Freqüência

%

cumulativo Classe Freqüência

%

cumulativo

2 ├ 4 2 8,70% 6├ 8 9 39,13%

4├ 6 5 30,43% 4├ 6 5 60,87%

6├ 8 9 69,57% 8├ 10 5 82,61%

8├10 5 91,30% 2├ 4 2 91,30%

10├ 12 2 100,00% 10├ 12 2 100,00%

55

Como fazer um diagrama de

Pareto no Excel?

• 1º Passo: Construção da tabela: 1ª

coluna a descrição do problema ou

causa, na 2ª coluna teremos os valores

absolutos de cada problema e na 3ª

coluna o percentual acumulado.

Como fazer um diagrama de

Pareto no Excel?

• 2º Passo: Definição do tipo gráfico: a)

Selecione os valores na tabela. b)

Clique no ícone assistente de gráfico. c)

Na pasta “tipos personalizados”

selecione o gráfico “Lins – Cols. em 2

eixos” e clique em avançar. Na próxima

janela clique em avançar novamente.

Como fazer um diagrama de

Pareto no Excel?

• 3º Passo: Opções iniciais: a) Na pasta

título digite o título do gráfico. b) No

espaço “Eixo dos valores (x)” digite o

título para os problemas ou causas. c)

No espaço “Eixo dos valores (y)” digite

o título para os valores absolutos.

Como fazer um diagrama de

Pareto no Excel?

• 4º Passo: Na pasta Rótulos de dados

marque a opção “Mostrar rótulo”. Na

pasta Legenda desative a opção

“Mostrar legenda”. Clique em avançar e

concluir.

60Prof. Dr. Hercules de Souza 60

61Prof. Dr. Hercules de Souza

Exemplo da utilização de um diagrama de Pareto para tipos de

defeitos que ocorreram no processo de produção de placas de

circuito impresso.

Fonte: Internet

61

62Prof. Dr. Hercules de Souza 62

Exemplo da utilização de um diagrama de

Pareto para tipos de defeitos que

ocorreram em caixas de marcha de

veículos no processo de produção.

Fonte: Internet

Prof. Dr. Hercules de Souza 63

Prof. Dr. Hercules de Souza 64

65

FATORES DE MORTANDADE NO TRÂNSITO

DE BRASÍLIA (fonte: Detran - DF – 2001)

Atropelamento de pedestre 163

Colisão 122

Capotamento 36

Choque com objeto fixo 43

Queda 17

Atropelamento de animal 01

Demais tipos 04

Total 386

Prof. Dr. Hercules de Souza

66Prof. Dr. Hercules de Souza

Prof. Dr. Hercules de Souza 67

Motivos dos atrasos em cirurgias marcadas

Fonte: balancedscorecard.blogspot.com

Prof. Dr. Hercules de Souza68

• Governo do Estado de São Paulo

elaborou um relatório baseado nos

dados do PROCON em 2010. Uma das

informações levantadas foi a

participação das “Áreas de Assuntos”

nas reclamações procedentes

recebidas em 2010.

Sistema de atendimento ao cliente da

livraria virtual

72Prof. Dr. Hercules de Souza

MEDIDAS DE

TENDÊNCIA

CENTRAL OU DE

POSIÇÃO

72

Prof. Dr. Hercules de Souza 73

74Prof. Dr. Hercules de Souza

São medidas que possibilitam representar

um conjunto de dados relativos à

observação de determinado fenômeno

de forma resumida. Estas medidas nos

orientam quanto à posição da

distribuição no eixo dos números reais,

possibilitam comparações de conjuntos

de dados. Enfim, representam os

fenômenos pelos seus valores médios.

74

75Prof. Dr. Hercules de Souza

n

1i i

i

n Fn

n

2F

2

1F

1

n

1i

i

n

1i

ii

n

1i

ii_

x

F

nmh)harmônicaMédia(

xxxmg)geométricaMédia(

w

xw

x)ponderadaMédia(

n

Fx

x)amostralmédiaouaritméticaMédia(

75

76Prof. Dr. Hercules de Souza

EXERCÍCIO

• Dada a seguinte distribuição: Calcule a

média aritmética ou média amostral.

Xi 1 2 3 4

Fi 1 3 5 1

76

77Prof. Dr. Hercules de Souza

EXERCÍCIO

Sejam X1, X2, X3,.........,Xn, valores de X

associados às freqüências absolutas

F1, F2, F3,......Fn.

Calcule as médias geométricas

para as tabelas a seguir:

77

78Prof. Dr. Hercules de Souza

Xi 1 2 3 5

Fi 8 6 5 3

Xi 3 6 12 24 48

78

79Prof. Dr. Hercules de Souza

EXERCÍCIO

Sejam X1, X2, X3,.........,Xn, valores de X

associados às freqüências absolutas

F1, F2, F3,......Fn, respectivamente.

Calcule a média harmônica e

geométrica para a mostra: 2, 2, 2, 5,

5, 5, 5, 8, 8.

79

Utilizando uma calculadora científica

padrão Casio, HP ou similar

Antes de iniciar qualquer inserção de

dados na calculadora é interessante

limpar a memória. No caso da Casio o

procedimento é o seguinte:

• SHIFT

• MODE

• ALL

• =

Prof. Dr. Hercules de Souza 80

Inserindo os dados na

calculadora

• 1- selecione em MODE a opção SD.

• 2- Insira o ponto médio de cada classe

seguido de ponto e vírgula (;) e a

frequência absoluta da mesma classe,

em seguida tecle M+.

• Siga esse procedimento até finalizar

com a última classe.

Prof. Dr. Hercules de Souza 81

Prof. Dr. Hercules de Souza 82

Observação: Como é vital a correta

inserção dos dados de ponto médio

e frequência absolutas na

calculadora, é recomendável

verificar se não houve nenhuma

inserção errada.

Prof. Dr. Hercules de Souza 83

Como visto, a média aritmética amostral pode

ser calculada pela expressão:

O somatório do numerador da expressão acima

pode ser obtido clicando a tecla SHIFT e em

seguida a tecla 1. No display da calculadora

aparecerão 3 opções:

Escolha a opção 2

e em seguida divida

por n

Prof. Dr. Hercules de Souza 84

n

FxX ii

321

2 nxx

A média aritmética amostral também

pode ser obtida diretamente seguindo o

seguinte procedimento:

• Teclar SHIFT e em seguida a tecla 2.

• Deverá aparecer no display da

calculadora 3 opções:

• 1- Média aritmética amostral:

• 2 – Desvio padrão populacional:

• 3 – Desvio padrão amostral:

Prof. Dr. Hercules de Souza 85

X

n

nn Sou1

86Prof. Dr. Hercules de Souza

MEDIANA

É uma medida de posição que divide a

amostra ou a população em duas

partes iguais.

86

87Prof. Dr. Hercules de Souza

CÁLCULO DA MEDIANA PARA

UMA VARIÁVEL DISCRETA

Se o número n de elementos for ímpar, a

mediana será o elemento central, de

ordem (n+1)/2. Se o número n de

elementos for par, a mediana será a

média entre os elementos centrais de

ordem n/2 e n/2 +1.

87

88Prof. Dr. Hercules de Souza

EXEMPLO

Xi Fi Fac

1 1 1

2 3 4

3 5 9

4 2 11

=11

Como existem 11 elementos a mediana pode ser calculada

por (n+1)/2, logo (11+1)/2=6º elemento.

Nesse caso a mediana será o número 3.

88

89Prof. Dr. Hercules de Souza

EXEMPLO

Como existem 42 elementos a mediana pode ser calculada:

42/2 = 21º elemento e 42/2 +1=22º elemento. O 21º elemento

é o 87 e o 22º também, logo a mediana será (87+87)/2=87.

Xi Fi Fac

82 5 5

85 10 15

87 15 30

89 8 38

90 4 42

=42

89

90Prof. Dr. Hercules de Souza

CÁLCULO DA MEDIANA PARA

UMA VARIÁVEL CONTÍNUA

• Calcule a ordem N/2. Como a variável

é contínua não se preocupe se n é par

ou ímpar.

• Pela freqüência acumulada (Fac)

identifique a classe que contém à

mediana (classe Md).

90

91Prof. Dr. Hercules de Souza

1- Utilize a equação:

md

mdF

hf2

N

LMediana

Lmd = limite inferior da classe Md;

N = tamanho da amostra;

f = soma das freqüências anteriores à classe Md;

h = amplitude da classe Md;

Fmd = freqüência da classe Md.

91

92Prof. Dr. Hercules de Souza

EXEMPLO

Classes Fi Fac

35├45 5 5

45├55 12 17

55├65 18 35

65├75 14 49

75├85 6 55

85├95 3 58

=58

92

93Prof. Dr. Hercules de Souza

67,61

18

10172955Mediana

93

94Prof. Dr. Hercules de Souza

MODA

É o valor que mais se repete

na distribuição.

94

95Prof. Dr. Hercules de Souza

Para distribuições simples (sem agrupamento em classes), a identificação da moda se

faz simplesmente pela observação do elemento que apresenta maior freqüência.

Nesse caso a moda é 28

Xi 20 25 28 21 30

Fi 2 9 10 4 5

95

96Prof. Dr. Hercules de Souza

Para dados agrupados em classes pode-se utilizar a fórmula de Czuber:

1- Identificar a classe modal, ou seja, aquela que possui a maior freqüência.

2- Aplica-se a fórmula:

21

1 hinf.limModa

lim. Inf = limite inferior da classe modal.

1 = diferença entre a freqüência da classe modal e a imediatamente anterior.

2 = diferença entre a freqüência da classe modal e a imediatamente posterior.

h = amplitude da classe.

96

97Prof. Dr. Hercules de Souza

EXERCÍCIO: Calcule a moda da

seguinte distribuição:

1- A classe modal é a 3ª

2- 44,297

172Moda

Classes 0├ 1 1├ 2 2├ 3 3├ 4 4├ 5

Fi 3 10 17 8 5 43

97

98Prof. Dr. Hercules de Souza

Utilize os dados da TABELA 1

para calcular: a média, a moda,

e a mediana amostrais.

98

99Prof. Dr. Hercules de Souza

Separatrizes

A principal característica das

medidas separatrizes consiste na

separação da série em partes iguais

que apresentam o mesmo número

de valores.

99

100Prof. Dr. Hercules de Souza

Separatrizes

AS PRINCIPAIS SÃO OS

QUARTIS, DECIS E

PERCENTIS.

100

101Prof. Dr. Hercules de Souza

Quartis

• Os quartis são valores de um conjunto

de dados ordenados, que os dividem

em quatro partes iguais. É necessário,

portanto, três quartis (Q1, Q2 e Q3) para

dividir um conjunto de dados ordenados

em quatro partes iguais.

101

102Prof. Dr. Hercules de Souza

Quartis

• Q1 : deixa 25% dos elementos abaixo

dele.

• Q2 : deixa 50% dos elementos abaixo

dele e coincide com a mediana.

• Q3 : deixa 75% dos elementos abaixo

dele.

102

103Prof. Dr. Hercules de Souza

Quartis

• A fórmula para o caso da mediana (Q2)

pode ser adaptada para o cálculo de Q1

(n/4) e Q3 (3n/4).

103

104Prof. Dr. Hercules de Souza

Decis e percentis

• Identicamente para o caso do cálculo

dos quartis, os decis e os percentis

podem ser obtidos pela adaptação da

equação para o cálculo da mediana, o

que muda é:

• D1 = n/10, D2 = 2n/10 ......D9 = 9n/10

• P1 = n/100, P2 = 2n/100... P99 = 99n/100

104

105Prof. Dr. Hercules de Souza

Utilize os dados da TABELA 1

para calcular:

Q1, Q2, Q3, D4, D7, P20, P60.

105

106Prof. Dr. Hercules de Souza

BOX-PLOT

• Visto as chamadas medidas de posição

de dados estatísticos, vamos retornar a

uma representação gráfica da síntese

desses dados chamada de Box-plot. É

um tipo gráfico muito utilizado,

representando a dispersão dos dados,

a mediana e os quartis.

106

107Prof. Dr. Hercules de Souza

200 – 11 - 2,5 - 5 – 5 - 5,5 – 3 - 3,5 – 3 - 0,4 - 3,2 – 5 – 3 - 3,2 - 7,4 - 6

0,4 - 2,5 - 3 - 3 - 3 - 3,2 - 3,2 - 3,5 - 5 - 5 - 5 - 5,5 - 6 - 7,4 - 11 - 200

•25% dos dados estão abaixo de 3, assim, o Primeiro Quartil é Q1=3;

•50% dos dados estão abaixo de 4,25, assim, o Segundo Quartil, (Q2) que também é a

Mediana é Q2=M=4,25;

•75% dos dados estão abaixo de 5,75, assim, o Terceiro Quartil é Q3=5,75

Exemplo: a seguinte amostra de dados colocados fora de ordem:

107

108Prof. Dr. Hercules de Souza

• Assim sendo podemos sumarizar esses

dados simplesmente fornecendo

apenas 5 valores:

valor mínimo = 0,4,

Q1=3,

mediana = 4,25,

Q3=5,75

Valor máximo = 200

108

109Prof. Dr. Hercules de Souza

Suponha os dados

sumarizados por sexo

Sexo F M

Q1 1,60 1,72

Min 1,52 1,62

Mediana 1,66 1,75

Max 1,79 1,90

Q3 1,70 1,82

109

110Prof. Dr. Hercules de Souza

1,2

1,3

1,4

1,5

1,6

1,7

1,8

1,9

2

F M

110

111Prof. Dr. Hercules de Souza

Utilize os dados da TABELA 1

para construir um Box-plot.

111

112Prof. Dr. Hercules de Souza

MEDIDAS DE

DISPERSÃO

112

• As medidas de variabilidade mais

conhecidas são:

• Amplitude total;

• Desvio simples;

• Desvio médio;

• Variância;

• Desvio padrão;

• Coeficiente de variação

de Pearson (CVP).

Prof. Dr. Hercules de Souza 113

114Prof. Dr. Hercules de Souza

Amplitude total

É a diferença entre o maior e o menor

valor de uma distribuição.

Amplitude = Maior Valor – Menor Valor

114

Desvio simples

È a diferença entre cada valor da amostra

e a sua média aritmética.

Prof. Dr. Hercules de Souza 115

xxdi

Desvio médio

Corresponde a média aritmética dos

valores absolutos dos desvios simples.

Prof. Dr. Hercules de Souza 116

n

diDM

117Prof. Dr. Hercules de Souza

Variância

Trata-se da média aritmética dos

quadrados dos desvios. Pode ser

calculada tanto para uma amostra

quanto para uma população.

117

118Prof. Dr. Hercules de Souza

Desvio padrão

Baseia-se nos desvios dos elementos

amostrais ou populacionais em torno

da média aritmética. Ou seja,

corresponde à raiz quadrada da

variância.

118

119

O desvio padrão é definido desta

forma de maneira a dar-nos uma

medida da dispersão que:

1. Seja um número não-negativo;

2. Use a mesma unidade de medida dos

dados fornecidos inicialmente.

120

n

1i

2n

1i

ii

i

2

i

2

n

1i

i

2_

i

2

22

n

1i

2_

i

n

1i

2

i

n

Fx

Fx1n

1Sou

1n

F)xx(

S.)agrup.amosdados/pVar(

S)amostralVariância(alpopulacionVariância(

1n

)xx(

S)amostral.P.D(n

)x(

)alpopulacion.P.D(

121

Porque o desvio padrão costuma ser

mais apropriado que o desvio médio?

O cálculo do desvio médio considera apenas o módulo da diferença entre o

valor e sua média, enquanto que o desvio padrão considera o dobro dessa

diferença. Isso faz com que o desvio padrão tenha uma sensibilidade maior e capte melhor a variação dos números

em relação a sua média.

122

Observe as amostras abaixo:

1. (-1,5; -1,5; 0; 1,5; 1,5)Média= 0; DM = 1,2 e DP = 1,5000

2. (-2; -1; 0; 1; 2)Média= 0; DM = 1,2 e DP = 1,5811

3. (-2,5; -0,5; 0; 0,5; 2,5)

Média= 0; DM = 1,2 e DP = 1,8028

As amostras são diferentes, mas o desvio médio é sempre o mesmo; enquanto que o desvio padrão

varia de amostra para amostra e apresenta um valor maior naquela cujos números estão mais distantes

da média.

Exemplo

• Calcular o desvio padrão e a variância

para a seguinte amostra de dados não

agrupados: S2 = 10,267, S = 3,204

Prof. Dr. Hercules de Souza 123

5 7 10 9 11

12 15 6 8 13

Obtendo o desvio padrão

amostralApós a inserção dos dados, como feito para o

cálculo da média aritmética amostral.

• Teclar SHIFT e em seguida a tecla 2.

• Deverá aparecer no display da calculadora 3

opções:

• 1- Média aritmética;

• 2 – Desvio padrão populacional;

• 3 – Desvio padrão amostral.

Prof. Dr. Hercules de Souza 124

125Prof. Dr. Hercules de Souza

Coeficiente de variação de Pearson

É uma medida útil para a comparação

entre séries distintas, mesmo quando

essas se referem a fenômenos

distintos inclusive com unidades de

medidas diferentes.

125

100Média

PadrãoDesvioCVP

126

Exemplo

• Considere a tabela abaixo que contem a média

do comprimento e a massa de determinada

peça.

Média Desvio Padrão

Comprimento

(cm)8,0 2,0

Massa (g) 50,0 10,0

127

Qual das duas medidas possuem maior

homogeneidade?

Essa resposta pode ser respondida pelo cálculo

do Coeficiente de variação de Pearson.

CVP (comprimento) = (2,0 x 100)/8 = 25%

CVP (massa) = (10,0 x 100)/50 = 20 %

Logo a massa por possuir menor CVP

apresenta menor grau de dispersão

128Prof. Dr. Hercules de Souza 128

Classe Ponto médio Freqüência XiFi Xi2Fi

0 ├ 10 5 2 10 50

10 ├ 20 15 1 15 225

20 ├ 30 25 5 125 3125

30 ├ 40 35 8 280 9800

40 ├ 50 45 4 180 8100

n=20 Σ=610 Σ=21300

Exemplo

129Prof. Dr. Hercules de Souza

84,141S

20

61021300

19

1S

5,30X

2

22

129

130Prof. Dr. Hercules de Souza

%05,395,30

10091,11

91,11

CV

S

130

131Prof. Dr. Hercules de Souza

• Utilize os dados da TABELA 1

para calcular: A variância, o

desvio padrão amostrais e o

coeficiente de variação.

131

Outlier

O que é? É uma observação que

apresenta um grande afastamento das

demais da série[1] (que esta "fora" dela),

ou que é inconsistente.

Prof. Dr. Hercules de Souza 132

133Prof. Dr. Hercules de Souza

TEOREMA DE TCHEBYCHEV

Pafnuti Lvovitch Tchebychev, matemático

russo que realizou vários trabalhos, no

século XIX na área de probabilidade e

Estatística, dentre eles esse famoso teorema.

Esse teorema diz que muitas vezes é

interessante descobrirmos, utilizando a

média e o desvio padrão, a posição relativa

de uma observação com relação a uma

amostra.

133

134Prof. Dr. Hercules de Souza

• O Teorema de Tchebychev permite

fazer observações sobre o percentual

dos dados que estão dentro de um

número específico de desvios padrões

da média.

134

135Prof. Dr. Hercules de Souza

Para qualquer distribuição amostral com média e desvio padrão S, tem-se:

• (X S) - O intervalo contém, no mínimo 68% de todas as observações amostrais.

• (X 2S) O intervalo contém, no mínimo 75% de todas as observações amostrais.

• (X 3S) O intervalo contém, no mínimo 89% de todas as observações amostrais.

135

136Prof. Dr. Hercules de Souza

ASSIMETRIA

• Assimetria é o grau de desvio, ou

afastamento de uma distribuição da

unidade de simetria.

136

137

• Se uma distribuição é simétrica então:

média = mediana = moda

• Se a distribuição é assimétrica positiva

então:

moda < Mediana < Média

• Se a distribuição é assimétrica negativa

então:

média < Mediana < Moda.X

X

X

Prof. Dr. Hercules de Souza

138Prof. Dr. Hercules de Souza

Assimétrica negativa Assimétrica positiva

Simétrica

139

• Existem várias fórmulas para o cálculo do

coeficiente de assimetria, dentre elas, temos:

• 1º Coeficiente de Pearson:

• 2º Coeficiente de Pearson (Bowley):

s

MoxASou

MoxAS

Prof. Dr. Hercules de Souza

13

d31

QQ

M2QQAS

140

• Se:

• AS = 0 diz-se que a distribuição é simétrica;

• AS > 0 diz-se que a distribuição é assimétrica

positiva (à direita);

• AS < 0 diz-se que a distribuição é assimétrica

negativa (à esquerda);

Prof. Dr. Hercules de Souza

141Prof. Dr. Hercules de Souza

CURTOSE

• Curtose é o grau de achatamento de

uma distribuição, pode ser denominada

leptocúrtica (delgada), platicúrtica

(achatada) ou mesocúrtica (nem

delgada nem achatada).

141

142Prof. Dr. Hercules de Souza 142

Curva Leptocúrtica

Curva Mesocúrtica

Curva Platicúrtica

143

Índice Percentílico de Curtose:

Encontra-se este índice usando a

seguinte fórmula:

Prof. Dr. Hercules de Souza

19

13

2 DD

QQC

144

• Se C<0,263 A distribuição é LEPTOCÚRTICA;

• Se C=0,263 A distribuição é MESOCÚRTICA;

• Se C>0,263 A distribuição é PLATICÚRTICA.

Prof. Dr. Hercules de Souza

145Prof. Dr. Hercules de Souza

OBSERVAÇÃO

• O software Excel apresenta-se como uma

poderosa ferramenta de análise estatística,

permitindo ao seu usuário uma análise das

várias medidas estatísticas, vistas nesta

apostila.

• Para tanto basta que o usuário selecione a

opção Análise de Dados no menu

Ferramentas do Excel, e analise as várias

possibilidades estatísticas ali existentes.

145

146Prof. Dr. Hercules de Souza

EXERCÍCIOS

146

147Prof. Dr. Hercules de Souza

1. Suponha a idade de 50 funcionários de uma empresa, construa um histograma e

um polígono de freqüências absolutas. Calcule a média amostral, moda,

mediana, desvio padrão, Q1, Q3, P60 e D3. Faça um diagrama de Pareto e um

Box-plot, interpretando o seu significado. Interprete o Teorema de

Tchebychev.

18 20 20 21 22 24 25 25 26 27

29 29 30 30 31 31 32 33 34 35

36 36 37 37 37 37 38 38 38 40

41 43 44 44 45 45 45 46 47 48

49 50 51 53 54 54 56 58 62 65

147

148Prof. Dr. Hercules de Souza

2. Construa gráficos de barra e pizza, analise os dados e resuma seus resultados, a

partir das tabelas abaixo.

Causas de problemas de

coluna

Percentagem (%)

Quedas 20,8

Veículos 47,7

Esportes 14,2

Violência 14,6

Outros 2,7

Total 100,0

148

149Prof. Dr. Hercules de Souza

3. Construa gráficos de barra e pizza, analise os dados e resuma seus resultados, a

partir das tabelas abaixo.

Causas de problemas de

coluna por esporte

Percentagem (%)

Mergulho 66,0

Futebol 6,1

Ginástica 2,2

Equitação 2,0

Esportes de inverno 2,3

Esqui na neve 3,8

Surfe 3,1

Trampolim 2,6

Luta 2,3

Outros 9,6

Total 100,0

149

150Prof. Dr. Hercules de Souza

4. Dados relativos a uma amostra aleatória.

4,5 6,5 2,0 2,5 4,0 3,5 5,0 3,0 5,0 5,5

1,0 7,5 3,0 2,0 3,0 3,5 3,5 5,0 6,0 4,5

2,0 3,0 3,5 3,5 3,0 3,0 4,0 1,5 1,5 2,5

a) Posicione os dados em uma distribuição ramo-e-folha;

b) Elabore a distribuição de freqüência relativa e percentual;

c) Elabore um histograma de percentagem;

d) Elabore um polígono de percentagem.

e) Calcule a média aritmética a moda a mediana, Q1, Q3, P80 e D4, a variância e o

coeficiente de variação de Pearson e em seguida construa um diagrama de

Pareto e um box-plot. Interprete o Teorema de Tchebychev.

150

151Prof. Dr. Hercules de Souza

5. Distribuições de freqüências para contas a receber.

MONTANTE

Freqüência (março)

Freqüência

(abril)

R$ 0,00 ├ R$ 2.000,00

6

10

R$ 2.000,00 ├ R$ 4.000,00

12 14

R$ 4.000,00 ├ R$ 6.000,00

17 13

R$ 6.000,00 ├ R$ 8.000,00

10 10

R$ 8.000,00 ├ R$ 10.000,00

4 0

R$ 10.000,00 ├ R$ 12.000,00

1 3

Total 50 50

a) Construa um histograma e um polígono de freqüência absoluta para cada mês;

b) Construa um diagrama de Pareto para cada mês interpretando-os;

c) Calcule a média aritmética a moda a mediana e o desvio padrão, amostrais;

d) Calcule o coeficiente de variação de Pearson interpretando o seu significado.

151

152Prof. Dr. Hercules de Souza

6. Suponha a seguinte tabela onde temos os dias gastos para auditorias em

empresas. Construa um histograma de freqüências absolutas, um histograma de

freqüências relativas e um histograma de freqüências percentual. Calcule a

média amostral, moda, mediana, desvio padrão. Calcule também qual a

probabilidade das observações amostrais estarem entre a média mais ou menos

dois desvios padrões.

12 14 19 18

15 15 18 17

20 27 22 23

22 21 33 28

14 18 16 13

152

153Prof. Dr. Hercules de Souza

7. Calcular a média geométrica e harmônica para as séries: a) 8, 15, 10, 12.

b) 3, 4, 5, 6, 7, 8. c) 5, 7, 12, 15. d) 3, 3, 3, 4, 4, 4, 4, 5, 6, 6.

8. Calcule a média geral das turmas de uma escola na disciplina de matemática,

cujas médias por turma são as seguintes: turma A (40 alunos), média 6,5, turma

B (35 alunos), média 6,0, turma C (35 alunos), média 4,0 e turma D (20 alunos),

média 7,5.

153

154Prof. Dr. Hercules de Souza

9. Uma determinada instituição financeira possui 3 operadores trabalhando na

bolsa de valores de São Paulo. A tabela abaixo apresenta uma amostra com o

número de operações fechadas por um desses operadores nos últimos dois anos.

Utilize o Excel para as conclusões estatísticas possíveis.

14 12 13 11 12 13 16 14 14 15 17 14 11

13 14 15 13 12 14 13 14 13 15 16 12 12

154

155Prof. Dr. Hercules de Souza

10. A classe média brasileira gasta em média R$ 65,88 por mês jantando fora de

casa. Uma amostra com adolescentes forneceu, no último mês, os seguintes

gastos em R$, que os mesmos gastam em refeições ou lanches feitos fora de

casa:

253 101 245 467 131

0 225 80 113 69

198 95 129 124 11

178 104 161 0 118

151 55 152 134 169

Calcule a média, mediana, moda, variância e o desvio padrão. Qual a conclusão que se

pode tirar com relação aos gastos desses adolescentes com relação à média da classe

média brasileira.

155

156Prof. Dr. Hercules de Souza

11. Um levantamento foi realizado com relação à habilidade dos fabricantes de

computadores de resolverem os problemas técnicos com rapidez. Foram obtidos

os seguintes resultados:

Empresa Dias p/ resolver Empresa Dias p/ resolver

Compaq 13 Gateway 21

Packard Bell 27 Digital 27

Quantex 11 IBM 12

Dell 14 HP 14

Nec 14 AT&T 20

Ast 17 Toshiba 37

Acer 16 Mícron 17

Calcule a média, a mediana, a variância e o desvio padrão dessa distribuição. Qual a

conclusão que se chega a partir dessas medidas de posição e dispersão?

156

157Prof. Dr. Hercules de Souza

12. Suponha a seguinte distribuição com as notas obtidas por 50 alunos na

disciplina de português.

60,0 85,0 33,0 52,0 65,0 77,0 84,0 65,0 74,0 57,0

71,0 35,0 81,0 50,0 35,0 64,0 74,0 47,0 54,0 68,0

80,0 61,0 41,0 91,0 55,0 73,0 59,0 53,0 77,0 45,0

41,0 55,0 78,0 48,0 69,0 85,0 67,0 39,0 60,0 76,0

94,0 98,0 66,0 66,0 73,0 42,0 65,0 94,0 88,0 89,0

Calcule: a) Amplitude; b) Número de classes; c) Freqüência absoluta e relativa; d)

Ponto médio de cada classe; e) Freqüência acumulada; f)Histograma; g) Polígono de

freqüência; h) Diagrama de Pareto; i) Média; j) Moda; k) Mediana. l) desvio padrão.

m)Q1, Q3, P35 e D8, n)Box-plot. o) Interprete o Teorema de Tchebychev.

157

13. Calcule o desvio padrão, a variância e

o CVP para as seguintes amostras de

dados não agrupados.

Prof. Dr. Hercules de Souza 158

13 15 16 12 18 19

14 11 13 17 12 20

2 5 9 3 7 8 6

1 4 3 7 3 8 1