INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação,...

22
1 Rui Carvalho Oliveira [email protected] INTRODU INTRODU Ç Ç ÃO ÃO À À ESTAT ESTAT Í Í STICA STICA DESCRITIVA DESCRITIVA Introdução à Estatística Descritiva Rui Carvalho Oliveira da recolha • tratamento • síntese • apresentação … da informação A Estatística é a ciência que trata: Introdução à Estatística Descritiva Rui Carvalho Oliveira A Estatística é a menos exacta das Ciências Exactas! Incertezas... Incertezas... Só incertezas! A Estatística é uma Ciência Exacta Instrumento de modelação da incerteza apoio à decisão Introdução à Estatística Descritiva Rui Carvalho Oliveira A incerteza (como nível de conhecimento) não é atributo da situação decisional mas sim do estado de conhecimento (do decisor) acerca dessa situação Descrever a situação Reduzir a incerteza Grandes alterações Pequenas alterações Grandes efeitos Pequenos efeitos Medir os efeitos da incerteza Decidir (com risco assumidos) níveis de Redução da incerteza - Reprocessamento da informação disponível - Aquisição de nova informação

Transcript of INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação,...

Page 1: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

1

Rui Carvalho [email protected]

INTRODUINTRODU ÇÇÃO ÃO ÀÀESTATESTATÍÍ STICA STICA DESCRITIVADESCRITIVA

Introdução à Estatística Descritiva Rui Carvalho Oliveira

• da recolha

• tratamento

• síntese

• apresentação

… da informação

A Estatística é a ciência que trata:

Introdução à Estatística Descritiva Rui Carvalho Oliveira

A Estatística é a menos exacta das Ciências Exactas!

Incertezas... Incertezas... Só incertezas!

� A Estatística é uma Ciência Exacta

� Instrumento de

� modelação da incerteza

� apoio à decisão

Introdução à Estatística Descritiva Rui Carvalho Oliveira

A incerteza (como nível de conhecimento) não é atributo da situação decisional mas sim do estado de conhecimento (do decisor) acerca dessa situação

Descrever a

situação

Reduzir a

incerteza

Grandesalterações

Pequenasalterações

Grandesefeitos

Pequenosefeitos

Medir os efeitosda incerteza

Decidir (com

risco assumidos)níveis de

� Redução da incerteza- Reprocessamento da informação disponível- Aquisição de nova informação

Page 2: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

2

Introdução à Estatística Descritiva Rui Carvalho Oliveira

A Estatística é uma ciência para ignorantes !

� Representação da variabilidade de resultados quando não éconhecida “explicação” dessa variabilidade

� Utilizada em todos os domínios para os quais o conhecimento dos fenómenos não é suficiente para produzir modelos explicativos

Introdução à Estatística Descritiva Rui Carvalho Oliveira

1) "A pluviosidade diária média durante os três últimos meses foi de 13 mm."

2) "Atendendo à pluviosidade registada durante os três últimos meses, este vai ser um ano de seca."

1) Afirmação descritiva, sumarizando a informação disponível

2) Afirmação que transcende o observado, partindo deste para inferir sobre o futuro

Amostra População

� Regular a recolha de informação adicional

� Quantificar e controlar erros

� Generalizar (inferir sobre a população a partir da informação da amostra)

� Sumarizar� Descrever a amostra

� Inferência Estatística� Estatística Descritiva

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

�Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

� Tratamento e descrição de dados: representações sin téticas visando

i) simplificar e tornar mais atraente a apresentação

ii) facilitar a leitura e interpretação

� Transformar dados em informação

(observações que constituem uma amostraextraída de uma fonte, que se designa por população )

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

� Descrição de resultados das observações:

Variáveis

Categorias Quantidades

Nominal Ordinal Discretas(contagem)

Contínuas(Medição)

Page 3: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

3

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

� Tratamento e apresentação de resultados das observações:

�É habitual sintetizar e apresentar os dados recolhidos através de Tabelas (de frequência) e Gráficos

Exemplo: dados sobre estado civil (amostra de 150 indivíduos)

Gráfico de barras

52%

33%

3%

11%

0%

10%

20%

30%

40%

50%

60%

Solteiro Casado Viúvo Divorciado

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

Apresentação de dados: representações gráficas

� Gráficos de barras:

Taxa de Saída Precoce - Ensino Secundário

32,6%29,4%

24,8%

38,7%

26,3%

36,1%33,2%

35,7%

23,8%

44,0%

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

Portugal GrandeLisboa

Porto Coimbra Sintra Lisboa Loures Odivelas Amadora Oeiras

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

Apresentação de dados: representações gráficas

� Gráficos de barras (acumulado):

Repartição modal do tráfego de mercadorias – 1998(ton.km em %)

0%

20%

40%

60%

80%

100%

Eslov

énia

Eslov

áquia

Rom

énia

Polón

ia

Litu

ânia

Letó

nia

Hun

gria

Est

ónia

Rep

. Che

ca

Bul

gária

PEC

O

Por

tuga

l

UE 1

5

Rodoviário Ferroviário Fluvial Pipeline

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

Apresentação de dados: representações gráficas

� Gráficos de sectores circulares

22%

30%

14%

21%13%

Pré-escolar

1º Ciclo E.B.

2º Ciclo E.B.

3º Ciclo E.B.

Secundário

Repartição de alunos por nível e ciclo de ensino

Page 4: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

4

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

Apresentação de dados: representações gráficas

� Gráficos de “bolhas”

Pol ó nia: 1,27 km 2 Eslov á quia: 0,11 km 2

Let ó nia: 0,40 km 2

Portugal: 1,29 km 2

Rep.Checa : 1,68 km 2

Est ó nia: 0,88 km 2

Lituânia: 1,72 km 2

Hungria: 10,23 km 2

Eslov é nia: 1,24 km 2

0,00

0,20

0,40

0,60

0,80

1,00

1,20

0,0 20,0 40,0 60,0 80,0 100,0 120,0

m 2 de Plataforma Logística por km

2 de Superfície Nacional

m 2 de Plataforma Logística por

Habitante

Nota: dimensão da “bolhas” proporcional à área total de Plataformas Logísticas (em Portugal e países do Alargamento -PECO)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva

� Uso (e abuso) de gráficos (pictogramas)

• Kennedy: 94 c • Johnson: 83 c • Nixon: 64 c • Carter: 44 c

Convenção: poder de compra proporcional ao “comprimento” da nota representada

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência

Exemplo: observações do nº de acidentes ao longo de 16 semanas:

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

� Amostra: conjunto de observações (valores numéricos ) de uma grandeza

� Variabilidade (aleatória, logo inexplicável e imprevisível) é inerente a muitos fenómenos

� Distribuição de frequências : caracterização e descrição sintética do comportamento de uma variável aleatória tirando partido de observações (numéricas) dessa grandeza (amostra)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência

Observações (nº de acidentes ao longo de 16 semanas):

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

• Absoluta (f’): número de vezes que o valor x foi observado

• Relativa (f): quociente entre o número de vezes que o valor x foi observado e o número total de observações

� Frequência simples (para um dado valor x da grandeza em estudo):

0,06119

0,13218

0,25417

0,38616

0,19315

RelativaAbsoluta

Frequência simplesNº de acidentes

Page 5: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

5

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência

Observações (nº de acidentes ao longo de 16 semanas):

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

0,06119

0,13218

0,25417

0,38616

0,19315

RelativaAbsoluta

Frequência simplesNº de acidentes

Histograma de Frequências Simples

0,00

0,10

0,20

0,30

0,40

15 16 17 18 19

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência

Observações (nº de acidentes ao longo de 16 semanas):

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

1,00160,06119

0,94150,13218

0,81130,25417

0,5690,38616

0,1930,19315

RelativaAbsolutaRelativaAbsoluta

Frequência acumuladaFrequência simplesNº de acidentes

• Absoluta (F’): número de vezes que o se observou um valor . menor ou igual a x

• Relativa (F): quociente entre a frequência acumulada absoluta e o número total de observações

Frequência acumulada (para um dado valor x da grandeza em estudo):

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência

Observações (nº de acidentes ao longo de 16 semanas)

1,00160,06119

0,94150,13218

0,81130,25417

0,5690,38616

0,1930,19315

RelativaAbsolutaRelativaAbsoluta

Frequência acumuladaFrequência simplesNº de acidentes

Histograma de Frequências Acumuladas

0,00

0,20

0,40

0,60

0,80

1,00

14 15 16 17 18 19 20 21

Introdução à Estatística Descritiva Rui Carvalho Oliveira

363 369 370 371 371 373 374 376 377 379380 381 381 382 382 383 383 383 384 385386 387 388 389 390 390 391 391 392 393393 394 394 394 395 395 395 395 396 396396 396 397 397 397 397 397 398 398 399399 400 400 401 402 402 402 403 403 404404 404 405 405 405 406 406 407 407 407407 408 408 408 409 409 410 411 411 412412 413 414 414 415 415 416 416 416 416417 418 420 422 423 424 426 428 429 435

386 370 371 374 377 435 383 383 422 418363 388 390 391 392 412 395 395 408 408396 397 397 397 398 404 403 402 401 400404 405 405 406 407 396 411 409 394 394412 414 415 416 416 385 428 424 382 381413 414 406 416 407 384 426 423 381 380404 405 415 398 416 396 410 409 394 393396 397 397 407 399 403 402 402 400 399387 389 390 391 393 411 395 395 408 407369 371 373 376 379 429 383 382 420 417

Estatística Descritiva - Distribuições de frequência

Amostra: medições do tempo de realização de uma tarefa (100 observações)

Observações ordenadas

Page 6: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

6

363 369 370 371 371 373 374 376 377 379380 381 381 382 382 383 383 383 384 385386 387 388 389 390 390 391 391 392 393393 394 394 394 395 395 395 395 396 396396 396 397 397 397 397 397 398 398 399399 400 400 401 402 402 402 403 403 404404 404 405 405 405 406 406 407 407 407407 408 408 408 409 409 410 411 411 412412 413 414 414 415 415 416 416 416 416417 418 420 422 423 424 426 428 429 435

Estatística Descritiva - Distribuições de frequência

Observações ordenadas

1,001000,011439.9430

0,99990,077429.9420

0,92920,1616419.9410

0,76760,2525409.9400

0,51510,2727399.9390

0,24240,1414389.9380

0,10100,088379.9370

0,0220,022369.9360

RelativaAbsolutaRelativaAbsolutaSuperiorInferior

Freq.ia acumuladaFreq.ia simplesLimites das classes

Tratamento de dados:

8 classes de amplitude 10 (abertas à direita)

Muitas vezes (nomeadamente quando a grandeza é contínua) as frequências são apuradas não para valores singulares da grandeza mas sim para intervalos de variação (classes)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Histograma de Frequências Acumuladas

0,00

0,20

0,40

0,60

0,80

1,00

355 365 375 385 395 405 415 425 435 445

Histograma de Frequências Simples

0.00

0.05

0.10

0.15

0.20

0.25

0.30

355 365 375 385 395 405 415 425 435 445

1,001000,011440430

0,99990,077430420

0,92920,1616420410

0,76760,2525410400

0,51510,2727400390

0,24240,1414390380

0,10100,088380370

0,0220,022370360

RelativaAbsolutaRelativaAbsolutaSuperiorInferior

Freq.ia acumuladaFreq.ia simplesLimites das classesEstatística Descritiva Distribuições de

frequência

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Histogramas

Amplitude: 1 nº classes: 71

Média: 398,74 desvio padrão: 14,77

Amplitude: 5 nº classes: 15

Média: 398,70 desvio padrão: 14,88

Amplitude: 3 nº classes: 25

Média: 398,73 desvio padrão: 14,79

Amplitude: 10 nº classes: 8

Média: 399,6 desvio padrão: 14,52

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Histogramas

Amplitude: 5 nº classes: 15

Média: 398,70 desvio padrão: 14,88

Amplitude: 10 nº classes: 8

Média: 399,6 desvio padrão: 14,52

Amplitude: 15 nº classes: 5

Média: 399,00 desvio padrão: 15,44

Amplitude: 25 nº classes: 3

Média: 398,75 desvio padrão: 16,01

Page 7: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

7

Introdução à Estatística Descritiva Rui Carvalho Oliveira

75 %

50 %

25 %

Estatística Descritiva

Quartil de 25% : = 390.4 Mediana =

Quartil de 50% : = 399.6

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

360 370 380 390 400 410 420 430 440 450

Quartil de 75% : = 409.6

q50%

q25%q75%

� Quartisvalores da variável que

dividem a distribuiçãode frequências em 4 partes iguais

Quartil de 50% : = 399.6

1,001000,011440430

0,99990,077430420

0,92920,1616420410

0,76760,2525410400

0,51510,2727400390

0,24240,1414390380

0,10100,088380370

0,0220,022370360

RelativaAbsolutaRelativaAbsolutaSuperiorInferior

Freq.ia acumuladaFreq.ia simplesLimites das classes Estatística Descritiva

q50%

Interpolação linear:

q 50% =

Quartil de 50% estáentre 390 e 400

0,1

0,2

0,3

0,4

0,5

0,6

385 390 395 400 405

0,51- 0,24

10

0,24 -0,510,24 -0,5x10390 +

0,5 – 0,24

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva – Medidas de tendência não central

100,0%0,8%46093941 1/2

99,2%0,9%45704041

98,3%3,3%453015040 1/2

95,0%5,4%438025040

89,6%9,5%413044039 1/2

80,1%16,3%369075039

63,8%17,8%294082038 1/2

46,0%20,6%212095038

25,4%13,0%117060037 1/2

12,4%6,5%57030037

5,9%3,3%27015036 1/2

2,6%1,1%1205036

1,5%0,9%704035 1/2

0,7%0,7%303035

Acum.SimplesAcum.Simples

Frequênciasabsolutas

FrequênciasabsolutasTamanho

dos sapatos� Quartis : valores da variável quedividem a distribuição de frequênciasem 4 partes iguais

� Q1 (quartil de 25%) – valor da variávelpara o qual a frequência acumuladaatinge 25%

Q1 = 37 ½

� Q2 (quartil de 50%) – idem, para 50%Q2 = 38 ½

� Q3 (quartil de 75%) – idem, para 75%Q3 = 39

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva – Medidas de tendência não central

100,0%0,8%46093941 1/2

99,2%0,9%45704041

98,3%3,3%453015040 1/2

95,0%5,4%438025040

89,6%9,5%413044039 1/2

80,1%16,3%369075039

63,8%17,8%294082038 1/2

46,0%20,6%212095038

25,4%13,0%117060037 1/2

12,4%6,5%57030037

5,9%3,3%27015036 1/2

2,6%1,1%1205036

1,5%0,9%704035 1/2

0,7%0,7%303035

Acum.SimplesAcum.Simples

Frequênciasrelativas

FrequênciasabsolutasTamanho

dos sapatos

• Decis : valores da variável quedividem a distribuição de

frequências em 10 partes iguais

• Percentil (ou quantil) de αααα %:valor da variável para o qual a

frequência acumulada atinge α%

Page 8: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

8

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Diagramas de “caixa e bigodes”

299.8

298.9

301.3

305.1

297.5

Exemplo: selecção de fornecedor de baterias

Dados: distribuição da duração (vida útil, em horas) das baterias

Fornecedor A

FornecedorB

100,0%0,2%290280

99,8%0,2%280270

99,6%1,2%270260

98,4%2,6%260250

95,8%5,2%250240

90,6%5,2%240230

85,4%10,0%230220

75,4%11,6%220210

63,8%12,4%210200

51,4%12,2%200190

39,2%10,6%190180

28,6%11,2%180170

17,4%8,0%170160

9,4%4,2%160150

5,2%2,2%150140

3,0%1,6%140130

1,4%0,6%130120

0,8%0,6%120110

0,2%0,2%110100

Acum.Simplesa [de [

Frequências relativasVida útil (horas)

100,0%0,2%460440

99,8%0,4%440420

99,4%0,4%420400

99,0%0,6%400380

98,4%0,8%380360

97,6%1,2%360340

96,4%1,4%340320

95,0%2,6%320300

92,4%2,8%300280

89,6%4,2%280260

85,4%5,8%260240

79,6%8,6%240220

71,0%9,8%220200

61,2%16,4%200180

44,8%19,6%180160

25,2%15,8%160140

9,4%7,8%140120

1,6%1,6%120100

Acum.Simplesa [de [

Frequências relativasVida útil (hoas)

Média=201hD. padrão= 60h

Média= 199hD. padrão=30h

Exemplo: selecção de fornecedor de baterias

a) Política de manutenção: substituição da bateria cada 200 horas. Risco de falha?

Fornecedor A

FornecedorB

100,0%0,2%290280

99,8%0,2%280270

99,6%1,2%270260

98,4%2,6%260250

95,8%5,2%250240

90,6%5,2%240230

85,4%10,0%230220

75,4%11,6%220210

63,8%12,4%210200

51,4%12,2%200190

39,2%10,6%190180

28,6%11,2%180170

17,4%8,0%170160

9,4%4,2%160150

5,2%2,2%150140

3,0%1,6%140130

1,4%0,6%130120

0,8%0,6%120110

0,2%0,2%110100

Acum.Simplesa [de [

Frequências relativasVida útil (horas)

100,0%0,2%460440

99,8%0,4%440420

99,4%0,4%420400

99,0%0,6%400380

98,4%0,8%380360

97,6%1,2%360340

96,4%1,4%340320

95,0%2,6%320300

92,4%2,8%300280

89,6%4,2%280260

85,4%5,8%260240

79,6%8,6%240220

71,0%9,8%220200

61,2%16,4%200180

44,8%19,6%180160

25,2%15,8%160140

9,4%7,8%140120

1,6%1,6%120100

Acum.Simplesa [de [

Frequências relativasVida útil (hoas)

Risco de falha =

61.2 %

Risco de falha =

51.4%

Exemplo: selecção de fornecedor de baterias

b) Risco de falha: max. de 10%. Intervalo de temp o entre substituições?

Fornecedor A

FornecedorB

100,0%0,2%290280

99,8%0,2%280270

99,6%1,2%270260

98,4%2,6%260250

95,8%5,2%250240

90,6%5,2%240230

85,4%10,0%230220

75,4%11,6%220210

63,8%12,4%210200

51,4%12,2%200190

39,2%10,6%190180

28,6%11,2%180170

17,4%8,0%170160

9,4%4,2%160150

5,2%2,2%150140

3,0%1,6%140130

1,4%0,6%130120

0,8%0,6%120110

0,2%0,2%110100

Acum.Simplesa [de [

Frequências relativasVida útil (horas)

100,0%0,2%460440

99,8%0,4%440420

99,4%0,4%420400

99,0%0,6%400380

98,4%0,8%380360

97,6%1,2%360340

96,4%1,4%340320

95,0%2,6%320300

92,4%2,8%300280

89,6%4,2%280260

85,4%5,8%260240

79,6%8,6%240220

71,0%9,8%220200

61,2%16,4%200180

44,8%19,6%180160

25,2%15,8%160140

9,4%7,8%140120

1,6%1,6%120100

Acum.Simplesa [de [

Frequências relativasVida útil (hoas)

Intervalo =

140 horas

Intervalo =

160 horas

Page 9: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

9

Exemplo: selecção de fornecedor de baterias

c) Baterias “Muito Boas”: duram pelo menos 260 hora s.

Fornecedor A

FornecedorB

100,0%0,2%290280

99,8%0,2%280270

99,6%1,2%270260

98,4%2,6%260250

95,8%5,2%250240

90,6%5,2%240230

85,4%10,0%230220

75,4%11,6%220210

63,8%12,4%210200

51,4%12,2%200190

39,2%10,6%190180

28,6%11,2%180170

17,4%8,0%170160

9,4%4,2%160150

5,2%2,2%150140

3,0%1,6%140130

1,4%0,6%130120

0,8%0,6%120110

0,2%0,2%110100

Acum.Simplesa [de [

Frequências relativasVida útil (horas)

100,0%0,2%460440

99,8%0,4%440420

99,4%0,4%420400

99,0%0,6%400380

98,4%0,8%380360

97,6%1,2%360340

96,4%1,4%340320

95,0%2,6%320300

92,4%2,8%300280

89,6%4,2%280260

85,4%5,8%260240

79,6%8,6%240220

71,0%9,8%220200

61,2%16,4%200180

44,8%19,6%180160

25,2%15,8%160140

9,4%7,8%140120

1,6%1,6%120100

Acum.Simplesa [de [

Frequências relativasVida útil (hoas)

% de baterias “muito boas” =

1-0.854

14.6%

% de baterias “muito boas” =

1-0.984

1.6%

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Síntese de Informação

Parâmetros : números singulares que evidenciam determinadas propriedades das distribuições de frequência

i. Medidas de tendência central (localização do “centro da distribuição”);

ii. Medidas de dispersão (grau de variação dos valores em torno do ponto central);

iii. Medidas de assimetria (grau de simetria em relação ao ponto central).

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Média

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

1,00160,0625119

0,94150,125218

0,81130,25417

0,5690,375616

0,1930,1875315

RelativaAbsolutaRelativaAbsoluta

Frequência acumuladaFrequência simplesNº de acidentes

Média = 16.5 16 / 18)1617161517161716151817161915(16X =+++++++++++++++=

(usando dados originais, sem tratamento)

X = (3 x 15 + 6 x 16 + 4 x 17 + 2 x 18 + 1 x 19) / 16(usando frequências absolutas , após tratamento estatístico dos dados)

X = (0.1875 x 15 + 0.375 x 16 + 0.25 x 17 + 0.125 x 18 + 0.0625 x 19) (usando frequências relativas , após tratamento estatístico dos dados)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Média

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

Média = 16.5 16 / 18)1617161517161716151817161915(16X =+++++++++++++++=

(usando dados originais, sem tratamento)

∑=

=n

1iiX

n

1X

n – número de observações

Xi – valor da i-ésima observação(nº de acidentes na semana i, neste exemplo)

Page 10: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

10

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Média

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

1,00160,0625119

0,94150,125218

0,81130,25417

0,5690,375616

0,1930,1875315

RelativaAbsolutaRelativaAbsoluta

Frequência acumuladaFrequência simplesNº de acidentes

X

(usando frequências relativas , após tratamento estatístico dos dados)

∑=

⋅=c

1kkk XfX

c – número de classes

fk – frequência relativa da k-ésima classe

Xk – valor (médio) da k-ésima classe

= (0.1875 x 15 + 0.375 x 16 + 0.25 x 17 + 0.125 x 18 + 0.0625 x 19)

Nota: quando classes contêm mais do que um valor da grandeza, esta expressão produz uma aproximação

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Inferior Superior Absoluta Relativa Absoluta Relativa360 370 365 2 0,02 2 0,02370 380 375 8 0,08 10 0,1380 390 385 14 0,14 24 0,24390 400 395 27 0,27 51 0,51400 410 405 25 0,25 76 0,76410 420 415 16 0,16 92 0,92420 430 425 7 0,07 99 0,99430 440 435 1 0,01 100 1

Limites das classes Freq.ia simples Freq.ia acumuladaMarca da classe

Média = 0.02 x 365 + 0.08 x 375 + 0.14 x 385 + 0.27 x 395 + 0.25 x 405 +

+ 0.16 x 415 + 0.07 x 425 + 0.01 x 435 = 399.6

(Nota: Média = 399.17 para dados originais, não tratados)

Medidas de tendência central - Média

∑=

⋅=c

1kkk XfX

c – número de classesfk – frequência relativa da k-ésima classeXk – valor (médio) da k-ésima classe

Cálculo da média para dados tratados (usando frequências relativas de ocorrência)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

A média corresponde ao “centro de gravidade” da distribuição de frequências

Estatística Descritiva – Medidas de centralidade

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Mediana

Distribuição de salários numa organização com 25 colaboradores:

100%4%120.000

96%4%110.000

92%8%25.000

84%12%32.000

72%20%51.200

52%4%1800

48%48%12600

Frequênciaacumulada

Frequênciarelativa (%)

Nº de colaboradores

Salário

� Média: 2400X =

�Mediana (Med): valor da grandeza tal que há um número igual de observações abaixo e acima desse valor mediano (divide a distribuiçãode frequência em duas partes iguais)

Med = 800

Page 11: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

11

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Mediana

Notas:

1) Quando o nº de observações é par, há dois valores median os, convencionando-se que a mediana é a média aritmética desses dois valores

Dados : 5 ; 8 ; 14 ; 21 Med = (8+1 4)/2 = 11

2) Para dados agrupados em classes, pode falar-se de “classe mediana” que correspondeà primeira classe para a qual a frequência acumulada é igua l ou superior a 50%

1,001000,011440430

0,99990,077430420

0,92920,1616420410

0,76760,2525410400

0,51510,2727400390

0,24240,1414390380

0,10100,088380370

0,0220,022370360

RelativaAbsolutaRelativaAbsolutaSuperiorInferior

Freq.ia acumuladaFreq.ia simplesLimites das classes

Classe mediana

Introdução à Estatística Descritiva Rui Carvalho Oliveira

100%4%120.000

96%4%110.000

92%8%25.000

84%12%32.000

72%20%51.200

52%4%1800

48%48%12600

Frequênciaacumulada

Frequênciarelativa (%)

Nº de colaboradores

Salário

Medidas de tendência central - Moda

Moda (Mod): corresponde ao valor da grandeza com maior frequência de ocorrência

Mod = 600

Nota: para dados tratados (agrupados em classes), pode falar-se de “classe modal”

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central

( )X� Propriedades da Média

X corresponde ao “centro da gravidade” dos valores observados

Requer dados quantitativos

� Mediana corresponde a um “centro posicional ”, quando as observaçõessão ordenadas do menor para o maior valor, não interessando o valor numérico de cada observação mas apenas a sua posição nessaordenação.

� É, portanto, aplicável a dados qualitativos (sem métrica), desde queexpressos numa escala ordinal.

� Propriedades da Mediana :

→ Soma dos desvios (em relação à média) é nula(desvios positivos “compensam” desvios negativos)

( ) 0XXn

1ii =−∑

=

0)(...)()( 21 =−++−+− XXXXXX n

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central

� Propriedades da moda (Mod):

• É aplicável a todos os tipos de dados (qualitativos ou quantitativos), mesmoquando estes são puramente nominais.

• Quando os dados são quantitativos e estão classificados em classes (ou sãoqualitativos), usa-se o termo classe (ou categoria) modal.

• Pode haver mais de uma moda ou classe (ou categoria) modal

Page 12: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

12

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Comparação das medidas de tendência central

�Média requer dados quantitativos, enquanto a mediana pode ser aplicada a dados qualitativos ordinais e a moda é até aplicável a simples categorias

�Média é sensível aos valores numéricos das observações, sendo afectada poralterações dos casos extremos, o que não sucede com a mediana :

57 ; 69 ; 72 ; 81 ; 86 →72

73

==

Med

X 57 ; 69 ; 72 ; 81 ; 961 →72

248

==

Med

X

�No caso de distribuições muito assimétricas, a média é “puxada” para o lado emque a “cauda” da distribuição é mais estendida (com valores extremos maisafastados dos “casos típicos” ou mais frequentes), podendo dar indicaçõesenganadoras quanto à localização do “centro” da distribuição.

� Média usa toda a informação disponível (nomeadamente, de carácter numérico), enquanto que à mediana apenas importa a posição relativa das observações.

� Mediana é mais sensível aos resultados amostrais, apresentando maioresvariações de amostra para amostra

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Comparação das medidas de tendência central

100%4%120.000

96%4%110.000

92%8%25.000

84%12%32.000

72%20%51.200

52%4%1800

48%48%12600

Frequênciaacumulada

Frequênciarelativa (%)

Nº de colaboradores

Salário

Média = 2400 Mediana=800 Moda=600

100%4%15.000

96%4%14.000

92%8%23.000

84%12%32.000

72%20%51.200

52%4%1800

48%48%12600

Freq.Acumul.

Freq.Relat. (%)

Nº de colabor.

Salário

Média = 1400 Mediana=800 Moda=600

� Média é sensível aos valores (numéricos) das observações , particularmentea “casos extremos”

� O mesmo não sucede com a mediana (desde que o “valor central” naordenação das observações não sofra alteração)

�Domínio (diferença entre o máximo e o mínimo das observações)

�Crítica: demasiado sensível a valores extremos (e eventualmente “atípicos”)

Estatística Descritiva – Medidas de dispersão

� Diferença inter-quartílica : diferença entre os quartis de 75% (q75%)e de 25% (q25%)

�Corresponde a ignorar os valores mais altos (25%) e mais baixos (25%)

421385380352338335…….634118Observações ->

500º499º498º497º496º495º…….3º2º1ºNº de ordem ->

q75% = 274

q25% = 142

Introdução à Estatística Descritiva Rui Carvalho Oliveira

VARIÂNCIA : desvio quadrático médio

644937246Observações →a)

ΧMédia: = (6+24+37+49+64) / 5 = 36

Variância: 399.6 = 5

784+169+1+144+900 = 2S

Desvio padrão : S = 399.6 = 20

Coeficiente de variação:

Estatística Descritiva – Medidas de dispersão

7841691144900Desvio quadrático →

a)

+28+13+1-12-30Desvio →

.55603620 =

Médiapadrão Desvio =

( )S2 = 1

n i=1

ni ∑ −Χ Χ

2

Page 13: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

13

Introdução à Estatística Descritiva Rui Carvalho Oliveira

1641425Desvio quadrático →+4+2+1-2-5Desvio →

120118117114111Observação →b)

Média: ΧΧΧΧ = (111+114+117+118+120) / 5 = 116

Variância: S2 = 25+4+1+4+165

= 10

Desvio padrão: S 10 = 3.16=

Coeficiente de variação: .02701163.16 =

Médiapadrão Desvio =

Estatística Descritiva – Medidas de dispersão

[ ]SXSX 3,3 +−

X

S6

Desvio Padrão

� Para uma distribuição normal…

…aproximadamente 68% das observações estão no

intervalo [ ]SXSX +− ,

…aproximadamente 95% das observações estão no

intervalo

95%

68%

[ ]SXSX 2,2 +−

…aproximadamente 99% das observações

estão no intervalo [ ]SXSX 3,3 +−99%

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva – medidas de dispersão

0.420.30.62Coeficiente de variação

503674Desvio padrão

253612905498Variância

119119119Média

12500

25350

41310200

122020160

926830120

32497080

71350

Empresa CEmpresa BEmpresa A

Número de trabalhadoresSaláriomensal

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de dispersão - Variância

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

Média = 16.5 =X

(usando dados originais, sem tratamento)

n – número de observações

Xi – valor da i-ésima observação(nº de acidentes na semana i, neste exemplo)

( ) ( ) ( ) ( )[ ] 16 / 5.1618...5.16195.16155.1616 22222 −++−+−+−=S

( )S2 = 1

n i=1

ni ∑ −Χ Χ

2

Page 14: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

14

18161716151716171615181716191516Nº de acidentes

16151413121110987654321Semana

1,00160,0625119

0,94150,125218

0,81130,25417

0,5690,375616

0,1930,1875315

RelativaAbsolutaRelativaAbsoluta

Frequência acumuladaFrequência simplesNº de acidentes

(usando frequências relativas , após tratamento estatístico dos dados)

c – número de classes

fi – frequência relativa da i-ésima classe

Xi – valor (médio) da i-ésima classe

S2 = 0.1875 x (15-16.5)2 + 0.375 x (16-16.5)2 + 0.25 x (17-16.5)2 +

+ 0.125 x (18-16.5)2 + 0.0625 x (19-16.5)2

Nota: quando classes contêm mais do que um valor da grandeza, esta expressão produz uma aproximação

Medidas de dispersão - Variância

16.5 =X

2

'i

if c

1=i = 2S

Χ−Χ∑

Média =

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de dispersão - Variância

( ) S2 = i=1

c fi i

' 2

∑ −Χ Χ

• Variância (desvio quadrático médio): cálculo para dados agrupados

marca da classe

frequência relativa da classe

Inferior Superior Absoluta Relativa Absoluta Relativa360 370 365 2 0,02 2 0,02370 380 375 8 0,08 10 0,1380 390 385 14 0,14 24 0,24390 400 395 27 0,27 51 0,51400 410 405 25 0,25 76 0,76410 420 415 16 0,16 92 0,92420 430 425 7 0,07 99 0,99430 440 435 1 0,01 100 1

Limites das classes Freq.ia simples Freq.ia acumuladaMarca da classe

Variância: S 2 = 0.02 (365-399.6)2 + 0.08 (375-399.6)2 + 0.14 (385-399.6)2 +

+ ... + 0.07 (425-399.6)2 + 0.01 (435-399.6)2 = 210.84

Desvio padrão: S = 14.52 (Nota: S= 14.82 para dados originais, não tratados)

Média= 399.6

Comparação de distribuições de

frequência

385,0Máximo

18,0Mínimo

56,9Desvio padrão

199,0Média

300,0Máximo

101,0Mínimo

58,6Desvio padrão

199,7Média

491,0Máximo

114,0Mínimo

60,6Desvio padrão

202,5Média

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de Assimetria

� Coeficientes de assimetria de Pearson:

( )s

Med.-X3 Ap

s

.ModXAp 21 =

−=

Média

Mediana

Moda

Ap < 0 – distribuição com assimetria esquerda(ou negativa)Ap = 0 – distribuiçãosimétricaAp > 0 - distribuição com assimetria direita(ou positiva)

� Coeficiente assimetria

∑=

−=n

1i

3

i1 s

XX

n

1C

Page 15: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

15

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência e parâmetros de síntese

100%4%13.500

96%8%23.000

88%20%52.500

68%36%92.000

32%20%51.500

12%8%21.000

4%4%1500

Freq.iaacumulada

Freq.iarelativa

Nº de colab.

Salário

0%

5%

10%

15%

20%

25%

30%

35%

40%

500 1.000 1.500 2.000 2.500 3.000 3.500

Média = Mediana = Moda = 2000 Desvio padrão = 663 Coef. assimetria = 0

100%4%13.500

96%4%13.000

92%8%22.500

84%12%32.000

72%16%41.500

56%24%61.000

32%32%8500

Freq.iaacumulada

Freq.iarelativa

Nº de colab.

Salário

0%

5%

10%

15%

20%

25%

30%

35%

500 1.000 1.500 2.000 2.500 3.000 3.500Média=1340 Mediana=1000 Moda=500 Desvio pa drão=845 Coef. assimetria= 0.91

Introdução à Estatística Descritiva Rui Carvalho Oliveira

0%

5%

10%

15%

20%

25%

30%

35%

500 1.000 1.500 2.000 2.500 3.000 3.500

Estatística Descritiva - Distribuições de frequência e parâmetros de síntese

100%4%13.500

96%8%23.000

88%20%52.500

68%36%92.000

32%20%51.500

12%8%21.000

4%4%1500

Freq.iaacumulada

Freq.iarelativa

Nº de colab.

Salário

0%

5%

10%

15%

20%

25%

30%

35%

40%

500 1.000 1.500 2.000 2.500 3.000 3.500

Média = Mediana = Moda = 2000 Desvio padrão = 663 Coef. assimetria = 0

Média=2660 Mediana=3000 Moda=3500 Desvio p adrão=845 Coef. assimetria= - 0.91100%32%83.500

68%24%63.000

44%16%42.500

28%12%32.000

16%8%21.500

8%4%11.000

4%4%1500

Freq.iaacumulada

Freq.iarelativa

Nº de colab.

Salário

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos: distribuição do nº de pedidos diários(requisições de veículos)

1,00920,01111

0,99910,01110

0,98900,0339

0,95870,0448

0,90830,0557

0,85780,1096

0,75690,15145

0,60550,17164

0,42390,20183

0,23210,13122

0,1090,0761

0,0330,0330

RelativaAbsolutaRelativaAbsoluta

Frequênciaacumulada

Frequência simplesNº de pedidos

Média = 4,2 pedidos/dia

Variância = 4,7

Histograma de Frequências Simples

0,00

0,05

0,10

0,15

0,20

0 1 2 3 4 5 6 7 8 9 10 11

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

0 0,033 0,0331 0,065 0,0982 0,130 0,2283 0,196 0,4244 0,174 0,5985 0,152 0,7506 0,098 0,8487 0,054 0,9028 0,043 0,9469 0,033 0,97810 0,011 0,98911 0,011 1,000

Nº de pedidos

Frequência simples

Frequência acumulada

� Nº de veículos da frota própria = 4

Freq (Rotura) = Freq (Nº de pedidos > 4) =

= Freq (X > 4) =

= 1 - Freq (X ≤ 4) =

= 1 - 0.598 = 40%

Frequência com que a frota própria é insuficiente para sat isfazer todos ospedidos (rotura)?

Page 16: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

16

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

0 0,033 0,0331 0,065 0,0982 0,130 0,2283 0,196 0,4244 0,174 0,5985 0,152 0,7506 0,098 0,8487 0,054 0,9028 0,043 0,9469 0,033 0,97810 0,011 0,98911 0,011 1,000

Nº de pedidos

Frequência simples

Frequência acumulada

� Quantos veículos deveria ter a frota própria para queesta possa satisfazer todos os pedidos em 95% dos dias?

Freq (Nº de pedidos ≤ N) = 95%

N – nº de veículos da frota própria

N = 8

Freq (X ≤ 8) = 0,946

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

� Nº de veículos da frota própria = 4

Em média, quantos veículos são utilizados (por dia)?

Média = 4,2 pedidos/dia

0 0,033 0,033 01 0,065 0,098 12 0,130 0,228 23 0,196 0,424 34 0,174 0,598 45 0,152 0,750 46 0,098 0,848 47 0,054 0,902 48 0,043 0,946 49 0,033 0,978 410 0,011 0,989 411 0,011 1,000 4

Nº de pedidos

Frequência simples

Frequência acumulada

Veículos usados

Y – nº de veículos utilizados

Média = 0x0.033 + 1x0.065 + 2x0.13 +

+ 3x0.196 +4x(1-0.424)

= 3.2

Taxa de utilização = 3.2 / 4 = 80.4%

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

� Nº de veículos da frota própria = 4

Em média, quantos pedidos não são satisfeitos (por dia)?

Média = 4,2 pedidos/dia

0 0,033 0,033 01 0,065 0,098 02 0,130 0,228 03 0,196 0,424 04 0,174 0,598 05 0,152 0,750 16 0,098 0,848 27 0,054 0,902 38 0,043 0,946 49 0,033 0,978 510 0,011 0,989 611 0,011 1,000 7

Nº de pedidos

Frequência simples

Frequência acumulada

Pedidos não sat.

Z – nº de pedidos não satisfeitos

Média = 0x0.598 + 1x0.152 + 2x0.098 +

+ 3x0.054 + … + 7x0,011

= 0.99

Pedidos satisfeitos = 4.2 – 0.99 = 3.21

Nível de serviço = 3.21 / 4.2 = 76.4%

(% de pedidos satisfeitos pela frota própria)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

� Nº de veículos da frota própria = 8

Taxa de utilização = 4.1 / 8

= 51.5%

Pedidos satisfeitos =

= 4.2 – 0.09 = 4.11

Nível de serviço =

= 4.11 / 4.2 = 97.9%

(% de pedidos satisfeitos pela frota própria)

0 0,033 0,033 0 01 0,065 0,098 1 02 0,130 0,228 2 03 0,196 0,424 3 04 0,174 0,598 4 05 0,152 0,750 5 06 0,098 0,848 6 07 0,054 0,902 7 08 0,043 0,946 8 09 0,033 0,978 8 110 0,011 0,989 8 211 0,011 1,000 8 34,2 4,1 0,09

Nº de pedidos

Veículos usados

Pedidos não sat.

Médias

Frequência simples

Frequência acumulada

(Resolvendo como para frota de 4 veículos)

Page 17: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

17

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

�Comparação de alternativas de frota própria (4 ou 8 veículos)

4 40% 3.2 80,4% 0,99 76,5%8 5% 4.1 51,5% 0,09 97,9%

Nível serviço

Veículos usados

Frota (nº veic.)

Risco rotura

Taxa utilização

Pedidos não satisfeitos

Indicadores de desempenho

� Quando há rotura (frota insuficiente), recorre-se a veículos alugados

� Aluguer de um veículo custa 10 000 dobrões/dia

� Custo de um veículo da frota própria: 1 000 dobrões/dia

� Custo total = custo da frota própria + custo de alu gueres= 1000 x Nº veículos da frota própria + 10 000 x Nº veículos alugados

� 4 veículos : Custo médio diário: 4x1000 + 0.99x10 000 = 13 900 dobrões

� 8 veículos : Custo médio diário: 8x1000 + 0.09x10 000 = 8 900 dobrões

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

�Comparação de alternativas de frota própria

Custo Nº veic. Custo Custo Risco Nível Taxafrota alugados aluguer total rotura serviço utilização

4 4.000 0,9891 9.891 13.891 40% 76% 80,4%5 5.000 0,5870 5.870 10.870 25% 86% 72,4%6 6.000 0,3370 3.370 9.370 15% 92% 64,5%7 7.000 0,1848 1.848 8.848 10% 96% 57,5%8 8.000 0,0870 870 8.870 5% 98% 51,5%9 9.000 0,0326 326 9.326 2% 99% 46,4%10 10.000 0,0109 109 10.109 1% 100% 42,0%11 11.000 0,0000 0 11.000 0% 100% 38,2%

Frota (nº veic.)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

Dimensionamento de uma frota de veículos

�Comparação de alternativas de frota própria

0

2.000

4.000

6.000

8.000

10.000

12.000

14.000

3 4 5 6 7 8 9 10 11 12

Nº de veículos (frota)

Cus

tos

Custo frota

Custo aluguer

Custo total

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação (caso 2)

�Dimensionamento de uma frota de veículos: distribuição do nº de pedidos diários

Histograma de Frequências Simples

0,00

0,05

0,10

0,15

0,20

0 1 2 3 4 5 6 7 8 9 10 11

� Para risco de rotura de 5% � Nº de veículos = 10

Absoluta Relativa Absoluta Relativa0 15 0,16 15 0,161 13 0,14 28 0,302 12 0,13 40 0,433 8 0,09 48 0,524 6 0,07 54 0,595 6 0,07 60 0,656 6 0,07 66 0,727 6 0,07 72 0,788 5 0,05 77 0,849 5 0,05 82 0,8910 5 0,05 87 0,9511 5 0,05 92 1,00

Nº de pedidos

Freq. simples Freq. acumulada

Média = 4,2 pedidos/dia

Variância = 9.4

Page 18: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

18

Introdução à Estatística Descritiva Rui Carvalho Oliveira

37,8%100%0%11.00000,000011.00011

41,1%99%5%10.5435430,054310.00010

44,4%96%11%10.6301.6300,16309.0009

48,0%92%16%11.2613.2610,32618.0008

51,7%87%22%12.4355.4350,54357.0007

55,6%80%28%14.2618.2610,82616.0006

59,8%72%35%16.73911.7391,17395.0005

64,4%62%41%19.87015.8701,58704.0004

utilizaçãoserviçoroturatotalalugueralugadosfrota

TaxaNívelRiscoCustoCustoNº veic.CustoFrota(nº veic.)

Dimensionamento de uma frota de veículos (caso 2)

�Comparação de alternativas de frota própria

Distribuições de frequência – exemplo de aplicação (caso 2)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Dimensionamento de uma frota de veículos

�Comparação de alternativas de frota própria

0

2.000

4.000

6.000

8.000

10.000

12.000

14.000

16.000

18.000

20.000

3 4 5 6 7 8 9 10 11 12

Nº de veículos (frota)

Cus

tos

méd

ios

Custo frota

Custo aluguer

Custo total

Distribuições de frequência – exemplo de aplicação (caso 2)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação

0

2.000

4.000

6.000

8.000

10.000

12.000

14.000

3 4 5 6 7 8 9 10 11 12

Nº de veículos (frota)

Cus

tos

Custo frota

Custo aluguer

Custo total

Histograma de Frequências Simples

0,00

0,05

0,10

0,15

0,20

0 1 2 3 4 5 6 7 8 9 10 11

0

2.000

4.000

6.000

8.000

10.000

12.000

14.000

16.000

18.000

20.000

3 4 5 6 7 8 9 10 11 12

Nº de veículos (frota)

Cus

tos

méd

ios

Custo frota

Custo aluguer

Custo total

Média = 4,2 pedidos/diaVariância = 4,7

Histograma de Frequências Simples

0,00

0,05

0,10

0,15

0,20

0 1 2 3 4 5 6 7 8 9 10 11

Média = 4,2 pedidos/diaVariância = 9.4

Frota óptima= 7 veículos Frota óptima= 10 veículos

Caso 1 Caso 2Distribuição “empírica” (frequências observadas) – Média = 4.2

Distribuição “teórica” - Poisson (λ = 4.2)

!)(

xxp

xe λλ=

1,0000,0001,000920,000013

1,0000,0011,000920,000012

0,9990,0031,000920,011111

0,9960,0070,989910,011110

0,9890,0170,978900,03339

0,9720,0360,946870,04348

0,9360,0690,902830,05457

0,8670,1150,848780,09896

0,7520,1640,750690,152145

0,5890,1940,598550,174164

0,3940,1850,424390,196183

0,2090,1320,228210,130122

0,0780,0630,09890,06561

0,0150,0150,03330,03330

acum.simplesRelativaAbsolutaRelativaAbsoluta

ProbabilidadeFrequênciaacumulada

Frequência simplesNº de pedidos

Distribuições “empíricas” vs modelos “teóricos”

Page 19: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

19

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuição “empírica” (frequências observadas) – Média = 4.2

Distribuição “teórica” - Poisson (λ = 4.2)!

)(x

xp

xe λλ=

Distribuições “empíricas” vs modelos “teóricos”

0,000

0,050

0,100

0,150

0,200

0 1 2 3 4 5 6 7 8 9 10 11 12 13

Observado

Poisson

Distribuição “empírica” (frequências observadas)Distribuição “teórica” - Normal (400, 14.5)

1,0000,0201,001000,011440430

0,9800,0650,99990,077430420

0,9150,1620,92920,1616420410

0,7530,2550,76760,2525410400

0,4970,2540,51510,2727400390

0,2430,1600,24240,1414390380

0,0830,0640,10100,088380370

0,0190,0190,0220,022370360

Acum.SimplesRelativaAbsolutaRelativaAbsolutaSuperiorInferior

ProbabilidadesFreq.ia acumuladaFreq.ia simplesLimite das classes

0,00

0,05

0,10

0,15

0,20

0,25

0,30

365 375 385 395 405 415 425 435

Observado

Normal

Distribuições “empíricas”

vsmodelos “teóricos”

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Modelos “teóricos” - Distribuição normal (de Gauss)

Densidade de probabilidade:

[ ]( ) iânciaXE

médiaXE

x

exf

var22

2

2

1

2

1)(

−=

→=

−−

Π=

µσµ

σµ

σ

µ (média)

� Distribuição simétrica � centrada na média� 50% dos valores abaixo da

média e 50% acima da mesma� Moda = mediana = média

� Maiores probabilidades na vizinhança da média, decaindo àmedida que os valores se vão afastando da média (quer para esquerda, quer para a direita)

µ – média

σ – desvio padrão

Modelos “teóricos” - Distribuição normal (de Gauss)

Efeito da alteração da média (localização do “centro” da distribuição)

Média = 10 Média = 15

Efeito da alteraçãoda variância(grau de dispersão)

Page 20: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

20

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuição normal (de Gauss)

[ ] %68105X95P

)5,100(Normal~X

≈≤≤

[ ] %68130Y70P

)30,100(Normal~Y

≈≤≤

� Cerca de 68% das probabilidades concentram-se no in tervalo

(média – desvio padrão) ; (média + desvio padrão)

Exemplo 1:

Exemplo 2:

Maior dispersão Intervalo mais largo

X ~ Normal (Média=100, Desvio padrão=5)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

[ ] %5.95110X90P ≈≤≤

[ ] %5.95160Y40P ≈≤≤

[ ] %7.99115X85P ≈≤≤

[ ] %7.99190Y10P ≈≤≤

X ~ Normal (100, 5)Y ~ Normal (100, 30)

Distribuição normal (de Gauss)

� Cerca de 95.5% das probabilidades concentram-se no intervalo

(média – 2 d. padrão) ; (média + 2 d. padrão)

� Cerca de 99.7% das probabilidades concentram-se no intervalo

(média – 3 d. padrão) ; (média + 3 d. padrão)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuição normal padrão (ou reduzida, ou standardizada)

( )

[ ][ ]

( )

[ ] [ ]

977.0)2(

215

100130130

15,100~

1

0

,~

≈∅=

≤=

−≤=≤

=

=

−=→

ZPZPXP

NormalX

ZVAR

ZE

XZNormalX

σµσµ

Função cumulativa da lei normal padrão(estão disponíveis tabelas)

Padronização da variável X

Z – variável normal padrão• média nula

• variância unitária

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Teorema do Limite Central (TLC)

� Seja Y uma variável que resulta da soma de n variáveis (Xi) independentes e com idêntica distribuição:

nXXXY +++= ...21

� À medida que n cresce, a distribuição de Y tendeassimptóticamente para a distribuição normal (qualquer que seja a distribuição dos Xi )

( )yyn

n

ii NormalXY σµ ,

1

→= ∞→=∑

Média de Y = soma das médias das variáveis

Variância de Y = soma das variâncias das variáveis Xi

Xi

Page 21: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

21

Introdução à Estatística Descritiva Rui Carvalho Oliveira

TLC - População Uniforme

Introdução à Estatística Descritiva Rui Carvalho Oliveira

TLC - População Uniforme

Introdução à Estatística Descritiva Rui Carvalho Oliveira

TLC - População Exponencial

Introdução à Estatística Descritiva Rui Carvalho Oliveira

TLC - População Exponencial

Page 22: INTRODU ÇÃO À ESTAT ÍSTICA · Estatística Descritiva: recolha, organização, apresentação, análise e interpretação de conjuntos de dados

22

Introdução à Estatística Descritiva Rui Carvalho Oliveira

� Note-se que:

1. Rapidez da convergência depende da distribuição dos Xi, sendo necessárias menos parcelas se esta distribuição for simétrica. Por exemplo:

� Se Xi ~ Uniforme, a aproximação normal será "razoável" se n ≥ 12

� Se Xi ~ exponencial negativa (muito assimétrica), poderão ser necessárias algumas dezenas de parcelas para a aproximação à normal ser "aceitável“

2. Convergência para a normal verifica-se mesmo quando as parcelas (Xi) não têm a mesma distribuição!

Teorema do Limite Central (TLC)

� A distribuição da soma de n variáveis aleatórias (independentes e identicamente distribuídas) tende para a distribuiç ão normal àmedida que n cresce (qualquer que seja a distribuição das parcelas!)