Modelos Probabilisticos

download Modelos Probabilisticos

of 28

description

MODELOS PROBABILÍSTICOS

Transcript of Modelos Probabilisticos

Cap 7 - Modelos Probabilsticos

ESTATSTICA ICap 7 MODELOS PROBABILSTICOSProf Me Aloizio Magrini

NDICE

1. INTRODUO22. Definindo Probabilidade23. Conceitos e Definies23.1. Varivel Aleatria23.2. Varivel Aleatria Discreta e Contnua33.3. Exemplo de VA Discreta33.4. Funo de Probabilidade ou Funo de Densidade de Probabilidade (fdp)33.5. Funo de Repartio ou Funo de Distribuio Acumulada (FDA)43.6. Valor Esperado de uma Varivel Aleatria43.7. Varincia e Desvio Padro de uma Varivel Aleatria64. Modelos de Distribuies de Probabilidade64.1. Distribuio Binomial64.2. Distribuio de Poisson74.3. Distribuio Exponencial84.4. Distribuio Normal94.5. Distribuio Qui-Quadrado144.6. Distribuio t de Student154.7. Distribuio F de Snedecor16Apndice 1 Resumo Terico sobre Probabilidade20A1. Experimento Aleatrio (E)20A2. Espao Amostral (S)20A3. Evento20A4. Operaes com Eventos204.1. Complemento204.2. Interseo204.3. Unio20A5. Eventos Mutuamente Exclusivos (ou Excludentes)20A6. Eventos Independentes21A7. Probabilidade21A8. Principais Teoremas e Propriedades da Probabilidade21A9. Probabilidade Condicionada21A10. Probabilidade da Interseo (ou Teorema do Produto)22A11. Teorema da Probabilidade Total22A12. Teorema de Bayes23A13. Tcnicas de Contagem ou Anlise Combinatria2313.1. Permutaes e Arranjos2313.2. Combinaes24A14. Exerccios Propostos25

TABELA DA DISTRIBUIO NORMAL PADRO24

Tabela da Distribuio t DE STUDENT25

Tabela da Distribuio QUI-QUADRADO26

Tabela da Distribuio f DE SNEDECOR271. INTRODUO

Os captulos anteriores apresentaram temas como tipos de sries de dados (provenientes de amostras e populaes), organizao e apresentao tabular e grfica de dados (distribuies de freqncias), medidas estatsticas de posio (ou tendncia central), de disperso (ou variabilidade) e de forma da distribuio.

Estes conhecimentos permitiram-nos analisar sries de dados, e obter algumas concluses sobre como tais dados se distribuem em todo seu intervalo de variao ou ao redor de valores centrais como a sua mdia. Em sntese, partimos do princpio de que a partir da organizao, apresentao e descrio dos dados observados, possvel fazer conjecturas sobre o comportamento da varivel em estudo. A este tipo de raciocnio denominamos de Induo (a partir de resultados ou dados observados, lanamos hipteses sobre o comportamento do fenmeno).

A partir de agora, estamos interessados no raciocnio de forma inversa, ou seja, estamos interessados em compreender como podero ocorrer os resultados de uma varivel, a partir de suposies sobre o problema em estudo, caracterizando assim o que denominamos de raciocnio Dedutivo (a partir de hipteses e conjecturas sobre o comportamento de um fenmeno, tentamos prever os resultados).

Em resumo, estamos interessados agora em realizar inferncias sobre a populao de onde foi extrada a amostra. Para tanto, teremos que usar modelos matemtico-probabilsticos, o que nos obriga a conhecer os aspectos fundamentais do Clculo de Probabilidades, sobre o qual se assenta a Estatstica Inferencial.

2. Definindo ProbabilidadeDado um Experimento Aleatrio E (fenmenos aleatrios que, mesmo repetidos vrias vezes sob condies semelhantes, apresentam resultados que no se pode prever com certeza) e sendo S seu Espao Amostral (conjunto de todos os possveis resultados do experimento) a probabilidade de um evento A (denotada por P{A}) uma funo definida em S, que associa a cada evento um nmero real que satisfaz s seguintes propriedades:

0 P{A} 1 p{ai} = P{S} = 1, onde os ais representam todos os eventos elementares de S.

P{A B} = P{A} + P{B} se A e B forem eventos mutuamente excludentes.

A Probabilidade Terica de um evento obtida utilizando procedimentos de contagem (Anlise Combinatria) dos casos favorveis ocorrncia do evento e de contagem de todos os casos possveis:

Nota 1: A expresso P{A} acima uma conseqncia da suposio de que todos os resultados sejam igualmente verossmeis (ou equiprovveis), e portanto s deve ser aplicada quando essa suposio for atendida. Nota 2: Observe que a Probabilidade Terica, luz dos conceitos sobre Distribuio de Freqncias, poderia ser definida como o limite da freqncia simples relativa (fri expressa em frao decimal e no em %) quando o tamanho da amostra muito grande.O Apndice 1 deste captulo apresenta um resumo terico sobre Probabilidades.3. Conceitos e Definies

3.1. Varivel Aleatria

Os resultados de um experimento ou so naturalmente numricos, ou podem ser codificados numericamente (por exemplo ruim=0 e bom=1). A essa representao numrica de resultados denominamos de varivel aleatria. Uma VA ento uma funo que associa elementos do espao amostral ao conjunto de nmeros reais, conforme abaixo ilustrado.Observaes:

1. Apesar da tradio desta terminologia, na verdade uma VA uma funo cujo domnio S e contradomnio R.

2. Nas aplicaes de estatstica, muito mais conveniente trabalhar com nmeros e no com eventos.

3. Convenciona-se representar funes, variveis aleatrias, espao amostral e contradomnio por letras Maisculas, e os valores pontuais do espao amostral e contradomnio por letras Minsculas.

3.2. Varivel Aleatria Discreta e Contnua

3.3. Exemplo de VA DiscretaConsidere o lanamento simultneo de duas moedas.

O espao amostral S = {(Ca,Ca), (Ca,Co), (Co, Ca), (Co,Co)}.

Se X representa o nmero de caras, podemos associar um valor numrico para cada evento do espao amostral, conforme abaixo:Ponto AmostralX

(Ca,Ca)2

(Ca,Co)1

(Co,Ca)1

(Co,Co)0

3.4. Funo de Probabilidade ou Funo de Densidade de Probabilidade (fdp)Cada varivel aleatria X, seja discreta ou contnua, quantificada por uma Funo de Densidade de Probabilidade (fdp). A fdp a funo que associa a cada ponto do espao amostral de uma VA, a probabilidade de ocorrncia de tais pontos.

No caso da VA X acima, a funo de probabilidade de X, denotada por P{X=x} determina a distribuio de probabilidades da varivel X conforme mostrado abaixo:

Pto AmostralXP{X}XP{X}

(Ca,Ca)2 x = 0

(Ca,Co)1 x = = 1

(Co,Ca)1 x = 2

(Co,Co)0 x = 1

Ao definir a Funo de Densidade de Probabilidade, estabelecemos uma correspondncia unvoca entre os valores que a Varivel Aleatria X assume (x1, x2, ..., xn) , e os valores da varivel P (p1, p2, ..., pn). Observe que sempre teremos pi = 1 no caso de VA Discreta.

Assim, a funo p(x) = P{X = xi} determina a distribuio de probabilidade da varivel aleatria X, sendo no caso do exemplo denominada de funo de probabilidades de X. Esta denominao adotada para Variveis Discretas, enquanto para Variveis Contnuas permanece a denominao de Funo de Densidade de Probabilidade [f(x)].Caractersticas da fdp:VA DiscretaVA ContnuaFaixa de Aplicabilidadex = a, a+1, ...,ba x bCondiesp(x) 0,

f(x) 0,

3.5. Funo de Repartio ou Funo de Distribuio Acumulada (FDA) uma outra forma de representar uma distribuio de probabilidades de uma varivel aleatria.

Define-se Funo de Distribuio Acumulada ou Funo de Repartio da varivel aleatria X no ponto x, como sendo a probabilidade de que X assuma um valor menor ou igual a x, isto :F(x) = P{X x})

FDAVA DiscretaVA ContnuaF(x)=P{X x}F(x) =

F(x) =

No caso do exemplo de lanamento de duas moedas para verificar o n de caras, calculamos a FDA como sendo:xP{x}xF(x)

00

11

221

Da definio F(x)=P{X x} decorre imediatamente que, para x1 x2 contidos no espao amostral da VA X:P{x1 < X x2} = F(x2) F(x1)Para uma VA Discreta valem ainda as seguintes relaes:P{x1 X x2} = F(x2) F(x1 - 1)

P{x1 X < x2} = F(x2 - 1) F(x1 - 1)

P{x1 < X < x2} = F(x2 - 1) F(x1)Notas sobre VA Contnua: a) A probabilidade da VA Contnua X sempre definida em um intervalo de valores de X, por exemplo, (x1,x2).b) A probabilidade da VA Contnua medida pela rea sob a curva da funo densidade em um determinado intervalo: . c) Observe-se que para a VA Contnua X, a fdp f(x) no mede a probabilidade no ponto x. Mostra-se facilmente que P{X=x} = P{x X x} = F(x)-F(x) = 0, onde utilizamos o seguinte artifcio para representamos (X = x) (x X x). Por considerarmos a probabilidade de um ponto como igual a zero, decorre imediatamente que para uma VA Contnua P{x1 < X < x2} = P{x1 X < x2} = P{x1 < X x2} = P{x1 X x2} = F(x2) F(x1)3.6. Valor Esperado de uma Varivel Aleatria

Define-se Valor Esperado (ou Esperana Matemtica ou Mdia) de uma varivel aleatria X como a mdia ponderada de longo prazo de x em relao Funo de Densidade de Probabilidade (fdp).Valor EsperadoVA DiscretaVA ContnuaE{X} = x

No nosso exemplo, E{X} = 0.(1/4) + 1.(1/2) + 2.(1/4) = (1/2) + (1/2) = 1 cara. 3.7. Varincia e Desvio Padro de uma Varivel Aleatria

Define-se Varincia para uma VA como a mdia dos desvios quadrticos da varivel em relao sua prpria mdia. Matematicamente, expressa por:VarinciaVA DiscretaVA ContnuaV{X} =

O Desvio Padro definido como a raiz quadrada positiva da Varincia:Desvio PadroVA Discreta e VA ContnuaDesvPad{X} =

Nota: Alternativamente, a Varincia pode ser calculada por

No exemplo dado:XP{X}

0

1

2

1

A Varincia V{X} = (0-1)2.(1/4) + (1-1)2.(1/2) + (2-1)2.(1/4) = (1/4) + (1/4) = 1/2 , e DesvPad{X} = 0,7074. Modelos de Distribuies de Probabilidade

At o momento, construmos como exemplo a distribuio de probabilidade de uma varivel discreta (n de caras no lanamento de duas moedas), empregando nosso conhecimento para o clculo das probabilidades envolvidas. Veremos adiante alguns Modelos Probabilsticos Padres, que nos auxiliaro em diversas situaes prticas. Nosso problema passa a ser determinar qual modelo o mais adequado para a situao em estudo.

4.1. Distribuio Binomial

Trata-se de uma distribuio de probabilidade adequada aos experimentos que apresentam apenas dois resultados possveis: sucesso ou fracasso. Fornece a base para inferncias sobre propores.Hipteses do Modelo Binomial1. O experimento repetido n vezes nas mesmas condies.2. Os resultados das repeties so independentes, ou seja, uma repetio no interfere nas subseqentes.3. Cada repetio admite apenas dois resultados: sucesso ou fracasso.4. As probabilidades de sucesso p e de insucesso q (q=1-p) se mantm constantes durante as repeties.

Por exemplo:

a) Lanar uma moeda 5 vezes e observar o nmero de caras.

b) Numa linha de produo, observar 10 itens tomados ao acaso e verificar o nmero de defeituosos.

c) Verificar o nmero de bits que no esto afetados por rudo num pacote com n bits.

Define-se a Varivel Binomial X como o nmero de sucessos em n repeties do experimento. A expresso geral da Distribuio Binomial :Notas:1. O nome Binomial se deve ao fato da expresso acima corresponder ao termo geral do desenvolvimento do Binmio de Newton.2. Para p=0,5 a distribuio simtrica. Para P5 e nq>5), a Distribuio Binomial pode ser aproximada pela Distribuio Normal, que ser vista adiante.

Principais Caractersticas da Distribuio BinomialMdia x = E{X} = np e Varincia 2x = V{X} = npq.

No ExcelFuno DISTRBINOM(nm_s ; tentativas ; probabilidade_s ; cumulativo), ondenm_s: nmero de sucessostentativas: nmero de tentativas independentesprobabilidade_s: probabilidade de sucesso em uma tentativacumulativo: um valor lgico que define o tipo de distribuio:Verdadeiro (1): retorna o valor da funo de probabilidade acumulada P(X num_s)Falso (0): retorna o valor da funo de probabilidade no ponto num_s: P(X = num_s)Exemplo: Uma moeda no viciada lanada 5 vezes. Encontre a probabilidade de:a) dar exatamente 3 carasb) pelo menos uma carac) no mximo 2 carasd) calcular o valor esperado e o desvio padro

Soluo: Seja X a varivel Binomial com os parmetros: n=5, p=1/2 (e portanto q=1/2).a) Desejamos P{X = 3} = C(5,3)x(1/2)3x(1/2)2 e portanto

P{X = 3} = 10 x (1/2)5 = 10/32 = 31,25%No Excel, a chamada funo DISTRBINOM(3;5;50%;0) fornece o valor 0,3125.b) Desejamos P{X 1} que o mesmo que 1 P{X < 1}, equivalente a 1 P{X = 0} = 1 0,03125 = 96,88%No Excel, a funo 1-DISTRBINOM(0;5;50%;0) fornece o valor 0,96875.c) Desejamos P(X 2) que equivale a P{X = 0} + P{X = 1} + P{X = 2} = 50%No Excel, a chamada funo DISTRBINOM(2;5;50%;1) fornece o valor 0,5000.d) E{X} =np e portanto E{X} = 2,5 caras, e V{X} = npq = 5/4 = 1,25 . Logo DesvPad{X} = 1,12 caras.4.2. Distribuio de PoissonConsidere as situaes em que se avalia o nmero de ocorrncias de um determinado evento por unidade de tempo, de comprimento, de rea ou de volume (genericamente denominados de rea de oportunidade). Em muitos casos, conhece-se o nmero de sucessos, mas s vezes muito difcil ou at mesmo impossvel determinar o nmero de fracassos. Imagine o nmero de automveis que passam por uma esquina: pode-se anotar o nmero de veculos que passaram num determinado intervalo de tempo, mas no se pode determinar quantos deixaram de passar.

A distribuio de Poisson aplicada nos tipos de situaes em que nos interessa o nmero de vezes em que um evento pode ocorrer durante um intervalo de tempo ou em determinado ambiente fsico (rea de oportunidade). Tomando como referncia o nmero de ocorrncias em determinado intervalo de tempo, em um processo de Poisson podem ser observados eventos discretos num intervalo de tempo, de tal forma que, reduzindo suficientemente este intervalo, tenhamos:Hipteses do Modelo de Poisson1. A probabilidade de observar apenas um sucesso no intervalo estvel.2. A probabilidade de observar mais que um sucesso no intervalo zero.3. A ocorrncia de um sucesso em qualquer intervalo independente da ocorrncia de sucesso em qualquer outro intervalo.

A distribuio de Poisson caracterizada apenas pelo parmetro , que representa o valor esperado ou mdia, do nmero de sucessos por intervalo t. Em outras palavras, a taxa de ocorrncia dos eventos no intervalo de tempo.

A funo de probabilidade da distribuio de Poisson :

onde:e uma constante (base do logartmo neperiano) valendo aproximadamente 2,718... o nmero esperado de sucessos no intervalo consideradox o nmero de sucessos (x = 0, 1, 2, ...,.)Principais Caractersticas da Distribuio de PoissonMdia x = E{X} = e Varincia 2x = V{X} = .

No ExcelFuno POISSON(x ; mdia ; cumulativo), ondex: nmero de sucessosmdia: valor esperado no intervalocumulativo: um valor lgico que define o tipo de distribuio:

VERDADEIRO (1): retorna o valor da funo de probabilidade acumulada P(X x)

FALSO (0): retorna o valor da funo de probabilidade no ponto x: P(X = x)Exemplo: As consultas a um banco de dados ocorrem de forma independente e aleatria, base de 3 consultas por minuto. Calcule as probabilidades:

a) no prximo minuto ocorrerem exatamente 3 consultas

b) no prximo minuto ocorrerem menos de 3 consultas

c) nos prximos dois minutos, ocorrerem mais do que 5 consultas

Soluo: Seja X a varivel Poisson com ocorrncia mdia de 3 consultas por minuto (=3)a) Desejamos P(X = 3) = [e-3. 33 ]/3! = 22,4%No Excel, a chamada funo POISSON(3;3;0) fornece o valor 0,22404.b) Desejamos P(X < 3) = P(X 2) = P(X=0) + P(X=1) + P(X=2) = 42,32%No Excel, a chamada funo POISSON(2;3;1) fornece o valor 0,42319.c) Observe que a unidade de tempo alterou de 1 para 2 minutos. Como a taxa mdia de 3 por minuto, ento em dois minutos teremos =6. Desejamos assim P(X > 5) = 1 P(X 5) = 1 0,44568 = 55,43%No Excel, a chamada funo 1 - POISSON(5;6;1) fornece o valor 0,55432.Nota: A Distribuio de Poisson aparece com destaque no estudo das filas.

4.3. Distribuio ExponencialSe o nmero de ocorrncias de um evento por unidade de tempo seguir a Distribuio de Poisson, ento automaticamente a distribuio do intervalo de tempo entre ocorrncias do evento segue a Distribuio Exponencial. Assim, se a taxa qual ocorrem eventos de Poisson, a distribuio do tempo entre chegadas sucessivas expressa por:A distribuio exponencial tambm caracterizada apenas pelo parmetro , que representa a taxa de ocorrncia dos eventos no intervalo de tempo.

A funo de probabilidade acumulada da distribuio exponencial :

onde:e constante de Euler (base do logartmo neperiano) valendo aproximadamente 2,71828... a taxa de ocorrncia do evento por unidade de tempox o tempo entre chegadas sucessivasPrincipais Caractersticas da Distribuio ExponencialMdia x = E{X} = 1/ e Varincia 2x = V{X} = 1/.

No ExcelFuno DISTEXPON(x ; lambda ; cumulativo), ondex: intervalo de tempo entre chegadas sucessivaslambda: inverso da taxa de chegada por unidade de tempocumulativo: um valor lgico que define o tipo de distribuio:

VERDADEIRO (1): retorna o valor da funo de probabilidade acumulada P(X x)

FALSO (0): retorna o valor da funo densidade de probabilidade no ponto x: P(X = x)Exemplo: Carros chegam a um posto de gasolina aleatoriamente a cada 2 minutos em mdia. Determine a probabilidade de o tempo entre chegadas no exceder 1 minuto.

Soluo: Seja X a varivel Exponencial que representa o tempo entre chegadas. Queremos determinar:

P{X1) com =1/2, o que implica em calcular . Note que primeiramente necessrio converter a taxa de chegadas por unidade de tempo para a mesma unidade de tempo empregada no valor da varivel do problema.

No Excel, a chamada funo DISTEXPON(1;1/2;1) fornece o valor 0,3935 ou 39,35%.

Note que se x=1/2 (de 2 minutos) e =1 (em 2 minutos), DISTEXPON(1/2;1;1) tambm retorna 39,35%.4.4. Distribuio Normal

considerada a distribuio de probabilidades mais importante, pois permite modelar uma infinidade de fenmenos naturais, e alm disso, possibilita realizar aproximaes para calcular probabilidades de muitas variveis aleatrias que tm outras distribuies, tais como a Binomial (n 30, np>5 e nq>5).

tambm conhecida como distribuio de Gauss, Laplace ou Laplace-Gauss, e muito importante tambm na inferncia estatstica, como ser observado at o final do curso.

A distribuio Normal caracterizada por uma Funo de Densidade de Probabilidade cujo grfico descreve uma curva em forma de sino, que evidencia maior probabilidade de a VA assumir valores prximos aos valores centrais.

Funo Densidade de Probabilidade da Distribuio NORMALUma VA ter Distribuio Normal se sua FDP for da forma abaixo,

onde:

= mdia da distribuio = desvio padro da distribuio e e so constantes (3,1416... e 2,718...)

Parmetros da Distribuio NormalMdia ou Valor Esperado x = E{X} = e Varincia 2x = V{X} = 2Principais Caractersticas:1. Teoricamente, a curva prolonga-se de a +, sendo que lim f(x) =0 para x tendendo a .2. A rea total sob a curva igual a 1, ou seja:

3. A curva simtrica em torno de , o que faz com que mdia = mediana = moda. Adicionalmente, temos tambm que P(X < - a) = P(X > + a).

4. A curva tem dois pontos de inflexo, respectivamente em - e + . Cerca de 68% dos valores recaem no intervalo de um desvio padro de cada lado da mdia, 95% recaem no intervalo mdia 2 desvios e 99,7% recaem no intervalo mdia 3 desvios.Considerando a enorme dificuldade de calcularmos probabilidades pela integrao da Funo de Densidade de Probabilidade (fdp) para as infinitas combinaes de valores de e , utiliza-se a Distribuio Normal Padro ou Reduzida, definida conforme a seguir.Distribuio Normal PadroSeja Z a varivel com distribuio normal com mdia = 0 e varincia = 1, geralmente denotada por N(0;1). Neste caso (lembrando que desvio-padro = varincia = 1) a fdp de Z ser

com a forma:

Observe-se a convenincia de termos a mdia igual a zero e o desvio padro igual a 1, fazendo com que esta distribuio passe a representar os valores de zi como nmero de desvios em relao mdia (origem). Assim, esta distribuio nos permite trabalhar com valores relativos de desvios em relao mdia.

Transformao de uma Distribuio Normal N(;2) para a Normal Padro (ou Reduzida) N(0;1)Qualquer distribuio normal com mdia e desvio padro pode ser transformada, para efeito de clculo de probabilidades, na distribuio normal padro, atravs de uma mudana de varivel conforme a seguir.

Tabelas da Funo Normal PadroH vrios tipos de tabelas que fornecem as reas (probabilidades) sob a curva Normal Padro. O tipo mais comum a tabela de Faixa Central. Este tipo de tabela fornece a rea sob a curva normal padro entre z=0 e qualquer valor positivo de z. A simetria em torno de z=0 permite-nos obter a rea entre quaisquer valores de z, sejam positivos ou negativos, no sem razovel esforo na identificao correta de intervalos.

No Captulo Tabelas Estatsticas, apresentamos uma Tabela da Distribuio Acumulada da Normal Padro, de uso muito mais fcil que as tabelas de faixa central encontradas na maioria da bibliografia recomendada. Na nossa tabela, podemos obter diretamente a probabilidade P(Z z).Exemplos de Uso da Tabelaa) Calcule P(z < 0,85)A rea solicitada exatamente a rea fornecida pela tabela. Basta procurar a linha que contenha o valor 0,8 e sua interseo com a coluna que contenha o valor 0,05. (lembrando que 0,85 = 0,8 + 0,05).

Logo, P(z < 0,85) = 0,8023 ( ou 80,23%).

b) Calcule P(0 < z < 1,25)O valor procurado corresponde a P(z