cap2entradadedados-1227661017183783-9

download cap2entradadedados-1227661017183783-9

of 31

Transcript of cap2entradadedados-1227661017183783-9

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    1/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 1

    Prof. Afonso C. Medina

    Prof. Leonardo Chwif

    Coleta e Modelagem dos Dados de EntradaCaptulo 2Pginas 24-52

    Este material disponibilizado para uso

    exclusivode docentes que adotam o livroModelagem e Simulao de EventosDiscretosem suas disciplinas. O materialpode (e deve) ser editado pelo professor.

    Pedimos apenas que seja sempre citadaafonte original de consulta.

    Verso 0.119/04/06

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    2/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 2

    Coleta

    Tratamento Inferncia

    Trs Etapas

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    3/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 3

    1. Escolha adequada davarivel de estudo

    2. O tamanho da amostra deve estarentre100 e 200 observaes. Amostras com

    menos de 100 observaes podemcomprometer a identificao do melhormodelo probabilstico, e amostras com

    mais de 200 observaes no trazemganhos significativos ao estudo;

    Coleta dos Dados

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    4/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 4

    3. Coletar e anotar as observaesna mesmaordem em que o fenmeno est ocorrendo,para permitir a anlise de correlao ;

    4. Se existe alguma suspeita de que os dadosmudam em funo do horrio ou do dia dacoleta, acoleta deve ser refeitaparaoutros horrios e dias. Na modelagem de

    dados, vale a regra: toda suspeita deveser comprovada ou descartadaestatisticamente.

    Coleta dos Dados

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    5/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 5

    Exemplo 2.1: Filas nos Caixas do Supermercado

    Um gerente de supermercado est preocupadocom as filas formadas nos caixas de pagamentodurante um dos turnos de operao. Quais seriamas variveis de estudo para coleta de dados? (S)ou (N).

    ( ) O nmero de prateleiras no supermercado

    ( ) Os tempos de atendimento nos caixas

    ( ) O nmero de clientes em fila

    ( ) O tempo de permanncia dos clientes no supermercado

    ( ) Os tempos entre chegadas sucessivas de clientes noscaixas de pagamento

    N

    S

    N

    N

    S

    resultado!!

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    6/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 6

    Exemplo 2.1: Coleta de DadosIntervalo entre chegadas de pessoas nos caixas do supermercado(100 medidas). Tempos em minutos:

    11 5 2 0 9 9 1 5 5 1

    1 3 3 3 7 4 12 8 7 5

    5 2 6 1 11 1 2 4 4 2

    2 1 3 9 0 10 3 3 4 5

    1 5 18 4 22 8 3 0 4 4

    8 9 2 3 12 1 3 1 11 9

    7 5 14 7 7 28 1 3 3 4

    2 11 13 2 0 1 6 12 8 12

    15 0 6 7 19 1 1 9 12 4

    1 5 3 17 10 15 43 2 9 11

    6 1 13 13 19 10 9 20 17 24

    19 2 27 5 20 5 10 8 728 8

    2 3 1 1 4 3 6 13 12 12

    10 9 1 1 3 9 9 4 6 3

    0 3 6 3 27 3 18 4 4 7

    6 0 2 2 8 4 5 1 3 1

    4 18 1 0 16 20 2 2 9 3

    2 12 28 0 7 3 18 12 2 1

    3 2 8 3 19 12 5 4 0 3

    6 0 5 0 3 7 0 8 5 8

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    7/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 7

    Exemplo 2.1: Medidas de Posio e Disperso

    13,80Coeficiente Assimetria

    493%Coeficiente de Variao

    2.643,81Varincia da amostra

    51,42Desvio padro

    728Amplitude

    Medidas de disperso

    728Mximo

    0Mnimo

    3Moda

    5Mediana

    10,44Mdia

    Medidas de posio

    O 728 um outlier?

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    8/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 8

    Exemplo 2.1: OutlierIntervalo entre chegadas de pessoas nos caixas do supermercado(100 medidas). Tempos em minutos:

    11 5 2 0 9 9 1 5 5 1

    1 3 3 3 7 4 12 8 7 5

    5 2 6 1 11 1 2 4 4 2

    2 1 3 9 0 10 3 3 4 5

    1 5 18 4 22 8 3 0 4 4

    8 9 2 3 12 1 3 1 11 9

    7 5 14 7 7 28 1 3 3 4

    2 11 13 2 0 1 6 12 8 12

    15 0 6 7 19 1 1 9 12 4

    1 5 3 17 10 15 43 2 9 11

    6 1 13 13 19 10 9 20 17 24

    19 2 27 5 20 5 10 8 728 8

    2 3 1 1 4 3 6 13 12 12

    10 9 1 1 3 9 9 4 6 3

    0 3 6 3 27 3 18 4 4 7

    6 0 2 2 8 4 5 1 3 1

    4 18 1 0 16 20 2 2 9 3

    2 12 28 0 7 3 18 12 2 1

    3 2 8 3 19 12 5 4 0 3

    6 0 5 0 3 7 0 8 5 8

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    9/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 9

    Outliers ou Valores Discrepantes Erro na coleta de dados. Este tipo de outlier o mais comum,

    principalmente quando o levantamento de dados feito por meiomanual.

    Eventos Raros. Nada impede que situaes totalmente atpicasocorram na nossa coleta de dados. Alguns exemplos:

    Um dia de temperatura negativa no vero da cidade do Rio deJaneiro;

    Um tempo de execuo de um operador ser muito curto emrelao aos melhores desempenhos obtidos naquela tarefa;

    Um tempo de viagem de um caminho de entregas na cidade deSo Paulo, durante o horrio de rush, ser muito menor do quefora deste horrio.

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    10/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 10

    Exemplo 2.1: Outlier (valor discrepante)

    43,602.643,81Varincia da amostra

    55Mediana

    6,8310,44Mdia

    sem o

    outlier

    com o

    outlier

    Dados

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    11/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 11

    Identificao de Outliers: Box-plot

    0

    5

    10

    15

    20

    A B C Sries

    Valores

    mediana

    outlier

    Q1

    Q3

    Q1-1,5(Q3- Q1)

    Q3+1,5(Q3- Q1)

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    12/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 12

    Anlise de Correlao

    0

    10

    20

    30

    40

    50

    0 10 20 30 40 50Observao

    k

    Observao

    k+1

    Diagrama de disperso dos temposde atendimento do exemplo de

    supermercado, mostrando que noh correlaoentre as observaesda amostra.

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    13/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 13

    10

    12

    14

    16

    18

    20

    10 12 14 16 18 20Observao

    k

    Observao

    k+1

    Anlise de CorrelaoDiagrama de disperso de umexemplo hipottico em que existe

    correlaoentre os dados quecompem a amostra.

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    14/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 14

    Exemplo 2.1: Construo do Histograma

    1. Definir o nmero de classes:nK 10log3,31+=

    nK=

    Ohistograma utilizado para identificar qual a distribuio a serajustada aos dados coletados ou utilizado diretamente dentro domodelo de simulao.

    2. Definir otamanhodo intervalo:K

    Amplitudeh =

    3. Construir a tabela de freqncias

    4. Construir o histograma

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    15/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 15

    Exemplo 2.1: HistogramaHistograma h=4.8

    0

    20

    40

    60

    80

    100

    120

    4.8 14.3 23.9 33.4 43

    Bloco

    Freqncia

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    16/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 16

    Exemplo 2.1: InfernciaQual o melhor modelo probabilstico oudistribuio estatstica que pode representar a

    amostra coletada?Histograma h=4.8

    0

    20

    40

    60

    80

    100

    120

    4.8 14.3 23.9 33.4 43

    Bloco

    Freqncia

    x

    f(x )

    1/

    x

    f(x )

    x

    f(x )

    a bm

    x

    f(x)

    =1=1

    =1=0,5

    Exponencial?

    Normal?

    Triangular?

    Lognormal?

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    17/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 17

    Testes de Aderncia (no paramtricos)Testa avalidade ou noda hiptese de aderncia (ou hiptesenula) em confronto com a hiptese alternativa:

    H0:o modelo adequadopara representar a distribuio da

    populao.

    Ha:o modelono adequadopara representar a distribuio da

    populao.

    Se a um dado nvel de significncia(100)% rejeitarmos H0, o modelo testadono adequadopara representar a distribuio da populao. O nvel designificncia equivale probabilidade de rejeitarmos a hiptese nula H0,

    dado que ela est correta. Testes usuais:

    Qui quadrado

    Kolmogorov-Sminov

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    18/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 18

    Teste do Qui=quadrado

    Inf Sup Exponencial Terica (T) Observada (O) (O-T)^2/T

    0 4.8 0.5022 100 96 0.16

    4.8 9.6 0.2500 50 55 0.55

    9.6 14.3 0.1244 25 25 0.00

    14.3 19.1 0.0620 12 13 0.04

    19.1 1.0E+10 0.0614 12 10 0.40

    E 1.15

    Confiana5%

    3

    Valor Terico 7.81

    p-value 0.76

    Graus de liberdade

    Limites Freqncias

    Portanto,no

    rejeitamos

    a hiptese de que os dados

    aderem ao modelo

    exponencial

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    19/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 19

    P-value

    Evidnciafraca ou inexistente contra ahiptese de aderncia

    0,10p-value

    Evidnciapotencialcontra a hiptese deaderncia

    0,05p-value

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    20/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 20

    Distribuies discretas: Binomial

    x

    f( x )

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    21/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 21

    Distribuies discretas: Poisson

    (x )

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    22/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 22

    Distribuies contnuas: Beta

    0 0,5 1x

    f(x )

    =2

    =1=3

    =2

    =4

    =4

    =2

    =3

    =1,5 =5 =6 =2

    =2

    =1

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    23/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 23

    Distribuies contnuas: Erlang

    x

    f(x )

    =0,5 k= 3

    =0,5

    =0,2 k= 10

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    24/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 24

    Distribuies contnuas: Exponencial

    x

    f(x )

    1/

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    25/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 25

    Distribuies contnuas: Gama

    x

    f(x )

    =0,

    =1

    =2

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    26/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 26

    Distribuies contnuas: Lognormal

    x

    f(x )

    =1 =1

    =1 =0,5

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    27/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 27

    Distribuies contnuas: Normal

    f(x )

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    28/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 28

    Distribuies contnuas: Uniforme

    ba

    1/(b-a )

    x

    f(x )

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    29/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 29

    Distribuies contnuas: Triangular

    x

    f(x )

    a bm

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    30/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 30

    Distribuies contnuas: Weibull

    x

    f(x )

    =0,5 =1

    =1 =1 =2 =1

    =3 =1

    =3 =2

  • 8/4/2019 cap2entradadedados-1227661017183783-9

    31/31

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 31

    Modelagem de dados... Sem dados!

    Utilizada para a escolha de parmetros das entidades(por exemplo: em uma certa loja, 30% dos clientesrealizam suas compras no balco e 70% nas prateleiras)Quando se conhecem apenas valores intermedirios dadistribuio ou a porcentagem de ocorrncia de alguns

    valores discretos

    Apenas assume osvalores fornecidos peloanalista

    Valores eprobabilidadede ocorrnciadestes valores

    Discreta

    Quando no se tem nenhuma informao sobre oprocesso ou apenas os valores limites (simulao do pior

    caso)

    Todos os valores nointervalo so

    igualmente provveisde ocorrer

    Maior valor e

    menor valor

    Uniforme

    Quando a probabilidade de ocorrncia de valores acima

    da mdia a mesma que valores abaixo da mdiaQuando o tempo de um processo pode ser considerado asoma de diversos tempos de sub-processosProcessos manuais

    SimtricaForma de sinoVariabilidadecontrolada pelo desvio-padro

    Mdia edesvio-padro

    Normal

    Quando se conhece ou se tem um bom chute sobre amoda (valor que mais ocorre), o menor valor e o maiorvalor que podem ocorrer

    Simtrica ou noMenor valor,moda e maiorvalor

    Triangular

    Grande variabilidade dos valoresIndependncia entre um valor e outroMuitos valores baixos e poucos valores altosUtilizada para representar o tempo entre chegadas

    sucessivas e o tempo entre falhas sucessivas

    Varincia altaCauda para direita

    MdiaExponencial

    AplicabilidadeCaractersticasParmetrosDistribuio