EA-01 Introdução à Avaliação Operacionalhelcio/GE-814 Revisao de Estatistica.pdf ·...

36

Transcript of EA-01 Introdução à Avaliação Operacionalhelcio/GE-814 Revisao de Estatistica.pdf ·...

GE-814: Introdução à Avaliação Operacional

Mentiras, mentiras

deslavadas … e estatísticas

O título acima é uma

referência a uma

frase comumente

atribuída a um ex

primeiro-ministro

britânico chamado

Benjamin Disraeli.

.

Mentiras estatísticas

33% do acidentes de trânsito

envolvem pessoas embriagadas.

Portanto 67% estão completamente

sóbrias, a conclusão é que devemos

dirigir totalmente bêbados.

Mentiras estatísticas

Surpreendente! Finalmente a solução para os seus problemas capilares: de todos os compradores do tónico capilar JUBA DE LEÃO, apenas 3% ficaram insatisfeitos e pediram o reembolso do dinheiro.

Objetivo

Que a audiência revise os principais

tópicos de estatística concernentes à

Avaliação Operacional

7/47

população

amostra

inferência

estatística

(indução)

probabilidade

(dedução)

8/47

Definições

Um experimento é qualquer processo que permite ao pesquisador fazer observações

Um evento é uma coleção de resultados de um experimento

O espaço amostral de um experimento consiste de todos os eventos possíveis

9/47

Exemplo

experimento: lançamento de dois dados

evento: soma dos valores é par

espaço amostral:

S = { (1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3), (5,5), (6,2), (6,4), (6,6) }

10/47

Definição clássica

Suponha que um experimento tenha n eventos

simples diferentes, cada um dos quais com a

mesma chance de ocorrer. Se o evento A pode

ocorrer em s dentre as n maneiras, então:

P(A) = = nº de maneiras como A pode ocorrer s

nº de eventos simples n

11/47

Aproximação da probabilidade

pela freqüência relativa

Realize (ou observe) um experimento um grande número de vezes e conte quantas vezes o evento A ocorre efetivamente. Então P(A) é estimada como segue:

P(A) = nº de ocorrências de A

nº de repetições do experimento

12/47

Lei dos grandes números

Se se repete um experimento um

grande número de vezes a

probabilidade pela freqüência relativa de

um evento tende para a probabilidade

teórica.

Estatística

A Estatística é uma coleção de métodos

para planejar experimentos, obter dados

e organizá-los, resumi-los, analisá-los,

interpretá-los e deles extrair conclusões.

Um aspecto importante da Estatística é

sua aplicabilidade óbvia a situações

reais e relevantes.

Problemas da AVAOP

relacionados com estatística O sistema novo é significativamente melhor

que o velho?

Quais sistemas competidores são significativamente melhores que os demais?

O teste foi bom? Existiu tendência nos dados?

Houve muita variabilidade nos dados?

Os dados foram suficientes?

Quão seguro você está nas suas conclusões sobre os dados?

Descritiva x Inferência

Estatística Descritiva: são os métodos que envolvem a coleta, a apresentação e caracterização de um conjunto de dados de modo a descrever apropriadamente as várias características deste conjunto.

Inferência Estatística ou Estimação: são métodos que tornam possível a estimativa de uma característica de uma população ou a tomada de uma decisão referente à população com base somente em resultados amostrais.

Definições

POPULAÇÃO (UNIVERSO) - é uma coleção completa de todos os elementos (valores, pessoas, medidas etc.) a serem estudados.

CENSO – é uma coleção de dados relativos a todos os elementos da população.

AMOSTRA – é uma subcoleção de elementos extraídos da população.

PARÂMETRO – é uma medida numérica que descreve uma característica da população.

ESTATÍSTICA – uma medida numérica que descreve uma característica de uma amostra.

Medidas de Tendência Central Média aritmética

valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Essa medida particular de tendência central será utilizada freqüentemente designada simplesmente como média.

Mediana valor do meio desse conjunto, quando os valores estão dispostos em

ordem crescente (ou decrescente). A mediana é representada geralmente por x.

Moda valor que ocorre com maior freqüência. Quando dois valores ocorrem

com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto de diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda e o conjunto é multimodal. Costuma-se denotar a moda por M.

Ponto médio valor que está a meio caminho entre o maior valor e o menor valor.

Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2.

~

Exemplo Bi-modal

Média: 3,2

Média e mediana

Distribuição Normal

A distribuição normal ocorre naturalmente:

Altura das pessoas

Peso das pessoas

Performance de atiradores

Miss distances

Através de amostragem de qualquer outra

distribuição!

Distribuição Normal

Notações

s denota o desvio-padrão (SD) de

um conjunto de dados amostrais

denota o desvio-padrão de um

conjunto de dados populacionais

s2 é a variância (Var) de um conjunto

de dados amostrais

2 é a variância de um conjunto de

dados populacionais

Desvio-Padrão

Desvio-padrão de um conjunto de dados

populacionais

Desvio-padrão de uma amostra

2( )x

N

222( )

1 ( 1)

in x xx x

sn n n

Teorema do Limite Central

Se uma variável randômica X tem uma

média populacional µ e um desvio padrão

σ, então a distribuição das médias das

amostras tende a ser normalmente

distribuída com média µ e um desvio

padrão , quando n se torna grande.

INDEPENDENTEMENTE DA

DISTRIBUIÇÃO DA POPULAÇÃO

n

9990 números

aleatórios entre 10

e 15 divididos em

333 grupos de 30

Exemplo do TLC

Histogram (Spreadsheet1 10v*9990c)

9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5

Var2

0

200

400

600

800

1000

1200

No

of

ob

s

Histograma dos 9990 números

Exemplo do TLC

Histogram (Design: 1 factors, 1 Blocks, 5000 Runs (Spreadsheet1) 6v*168c)

Var2 = 168*0,1186*normal(x; 12,4827; 0,267)

11,8439

11,9626

12,0812

12,1998

12,3185

12,4371

12,5558

12,6744

12,7930

12,9117

13,0303

13,1490

Var2

0

5

10

15

20

25

30

35

No

of

ob

s

Histogram (Spreadsheet1 10v*9990c)

9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5

Var2

0

200

400

600

800

1000

1200

No

of

ob

s

Histograma das médias dos 333 grupos de 30 números

Outras distribuições

t de Student

n< 30

Aproxima distribuição normal com n próximo de

30. Usada para garantia da performance e testes

de comparações quando n é pequeno.

F

Razão entre duas variâncias. Usada pela ANOVA

Binomial

Usada em testes seqüenciais e confiabilidade

Distribui-

ção t de

Student

Distribuição F

Distribuição Binomial

Distribuição Normal

2 testes de normalidade

Histograma

Medida de percentil cumulativo (gráfico de

probabilidade normal)

Distribuição Normal Exemplo do comportamento de uma

distribuição Gama no teste de normalidade

Testes de normalidade considerados

bons pelo livro do Montgomery

outlier

Testes de normalidade pelo livro do

Montgomery

Ruim Bom (após transformação y*=ln y)

Objetivo

Que a audiência revise os principais

tópicos de estatística concernentes à

Avaliação Operacional

GE-814: Introdução à Avaliação Operacional