Probabilidade e Estatística I – Antonio Roque – Aula 21
1
Algumas Distribuições de Probabilidade Discretas
Algumas variáveis aleatórias discretas podem ser usadas com muito sucesso
para modelar certos fenômenos de interesse prático, por exemplo, a
distribuição binomial. Vamos apresentar algumas das mais importantes
distribuições discretas aqui.
Distribuição Uniforme Discreta
Este é o caso em que as probabilidades de que uma variável aleatória
discreta assuma um valor dentre um conjunto de n possibilidades são todas
iguais,
pn
xp i ==1)( , para todo i = 1, ..., n.
Os valores da média e da variância desta distribuição são:
∑ ∑∑= ==
===n
i
n
iii
n
iii x
nnxxpx
1 11
11)(µ ,
e
( )
.1
11)(
1
2
122
2
1 1 1
22
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡⎟⎠
⎞⎜⎝
⎛
−=⇒
⇒⎥⎦
⎤⎢⎣
⎡−=−=
∑∑
∑ ∑ ∑
=
=
= = =
n
i
n
ii
i
n
i
n
i
n
iiiii
n
xx
n
nx
nxxpx
σ
µσ
Tente mostrar esta última passagem como exercício.
Probabilidade e Estatística I – Antonio Roque – Aula 21
2
Distribuição Binomial
Já estudamos a distribuição binomial e vimos a fórmula para o cálculo da
probabilidade de k sucessos em n repetições, com a probabilidade de um
sucesso sendo p e a de um fracasso sendo q = 1 − p,
( ).
!!!)|( knk qpknk
nnkXP −
−==
O cálculo do valor esperado (ou médio) de sucessos em n repetições e da
variância não é tão fácil de ser feito e vamos apenas dar os resultados aqui.
Porém, vamos calcular µ e σ 2 para alguns casos com n pequeno de maneira
que um raciocínio indutivo pode nos levar a aceitar as fórmulas gerais para
qualquer n.
Qual é o valor esperado de sucessos quando há apenas um experimento (n =
1)? Temos apenas duas possibilidades, sucesso ou fracasso. Vamos definir
uma variável aleatória x que pode assumir apenas dois valores, x1 = 1
quando há um sucesso e x2 = 0 quando há um fracasso. Usando a fórmula do
valor esperado temos então,
pqpxpxxpxxpxi
ii =+=+==∑=
.0.1)()()( 2211
2
1
µ ;
e a variância é,
( ) ( ) ( ) ( ) ( ) ( )∑=
=−+−=−+−=−=2
1
222
221
21
22 01)()(i
ii qpppxppxxppxxpx µσ
( ) ( ) ( ) .111 22 pqpppppp =−=−+−=
E quando n = 2, quais os valores de µ e σ 2? Neste caso, temos três
resultados possíveis: 2 sucessos, x1 = 2; 1 sucesso, x2 = 1; e 0 sucessos, x3 =
0. Usando as fórmulas para µ e σ 2 temos então:
Probabilidade e Estatística I – Antonio Roque – Aula 21
3
,222)!02(!0
!2.0)!12(!1
!2.1)!22(!2
!2.2)( 2223
1ppqpqpqpxpx
iii =+=
−+
−+
−==∑
=
µ
e
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )( ) .282818288828
4412181421214
)!02(!0!220
)!12(!1!221
)!22(!2!222)(
22222222222
22222222
223
1
22222
pqqppqqppqppqqpqppqppqqppppqppppppqpp
qppqpppxpxi
ii
=−+=−−+=+−+
=+−+−=−+−+−=
=−
−+−
−+−
−=−=∑=
µσ
Para n qualquer, a média e a variância da distribuição binomial valem:
np=µ e npq=2σ .
Distribuição de Poisson
Esta é uma importante distribuição de probabilidade discreta que é muito
usada para modelar a ocorrência de eventos aleatórios dentro de um
intervalo, de tempo ou de espaço, especificado. Ela deve o seu nome ao
matemático francês Poisson (1781-1840), que estudou suas características.
Se x for a variável discreta que dá o número de ocorrências de um evento
aleatório em um intervalo (de tempo ou de espaço) dado, a probabilidade de
que x ocorra é dada pela distribuição de Poisson,
!)(
xexpx µµ −
= ,
onde x = 0, 1, 2, 3, ... (a constante e vale aproximadamente 2,71828).
A letra grega µ é chamada de parâmetro da distribuição de Poisson e dá o
número médio de ocorrências do evento no intervalo em questão.
Probabilidade e Estatística I – Antonio Roque – Aula 21
4
Pode-se mostrar que p(x) ≥ 0 para todo x e que 1)(0
=∑∞
=xxp , de maneira que
p(x) satisfaz as condições de uma distribuição de probabilidade.
Uma distribuição de probabilidade de Poisson resulta do seguinte processo,
chamado de processo de Poisson:
1. A ocorrência de um evento em um intervalo (de espaço ou tempo) não
tem qualquer efeito sobre a probabilidade de ocorrência de um segundo
evento, no mesmo ou em qualquer outro intervalo. Os eventos
modelados por um processo de Poisson são independentes.
2. Dado um intervalo, um evento pode ocorrer qualquer número de vezes
dentro dele. Não há limite superior para o número de possíveis
ocorrências do evento dentro de um intervalo.
3. Para um intervalo suficientemente pequeno, a probabilidade de
ocorrência de um único evento dentro do intervalo é proporcional ao
intervalo.
4. Para um intervalo suficientemente pequeno, a probabilidade de
ocorrência de dois ou mais eventos dentro do intervalo é desprezível.
Pode-se mostrar que, para uma distribuição de Poisson, a média (valor
esperado) e a variância são iguais:
µ=)(xE e µσ =2 .
A distribuição de Poisson é empregada quando se faz contagens de eventos
aleatórios dentro de um certo intervalo de tempo ou de espaço. Vejamos
alguns exemplos:
Probabilidade e Estatística I – Antonio Roque – Aula 21
5
1. Uma ONG dedicada à preservação ambiental fez um estudo em uma área
da Mata Atlântica que está sendo reflorestada e concluiu que o número
médio de espécies de Pau Brasil por Km2 é igual a 2. Supondo que o
número de espécies de Pau Brasil por Km2 da área estudada obedeça a
uma distribuição de Poisson, calcule:
a. A probabilidade de se encontrar uma ou nenhuma árvore de Pau
Brasil em uma área de 1 Km2 escolhida ao acaso da área estudada.
Esta probabilidade é:
4060,02707,01353,0!1
2!0
2)1()0(2120
=+=+=+−− eepp (40,6
%).
b. A probabilidade de que uma área de 2 Km2 escolhida ao acaso da
área estudada tenha 3 espécies de Pau Brasil. Se o número médio
de espécies de Pau Brasil por Km2 é 2, o número médio por 2 Km2
é 2.2 = 4. Portanto,
1954,0!3
4)3(43
==−ep (19,54 %).
2. Uma companhia de seguros fez um estudo sobre o número semanal de
solicitações de socorro para automóveis recebidas durante os últimos
anos. A conclusão foi que o número médio de pedidos de socorro por
semana é de 12. A empresa gostaria de saber qual a probabilidade de que
ocorram 10 chamadas de socorro na próxima semana.
A ocorrência de um pedido de socorro em uma semana é uma variável
aleatória que satisfaz a uma distribuição de Poisson. Portanto, a
probabiliade desejada é:
105,0!10
12!10
)10(121010
≈==−− eep
µµ (10,5 %).
Probabilidade e Estatística I – Antonio Roque – Aula 21
6
A conta acima pode ser feita com uma calculadora científica ou com o
uso de um programa estatístico ou do MS® Excel. Caso não se tenha
acesso a nenhum desses recursos, pode-se recorrer a um livro de
estatística que tenha tabelas dando os valores calculados da distribuição
de Poisson.
Usando o MS® Excel, montou-se o seguinte gráfico dando a distribuição
de probabilidade do número de pedidos de socorro por semana para o
exemplo dado (µ = 12).
Distribuição do número semanal de pedidos de socorro (Poisson)
0.0000.0200.0400.0600.0800.1000.1200.140
0 5 10 15 20 25 30 35
x
p(x)
Observe que a forma da distribuição de Poisson tem alguma similaridade
com a da distribuição binomial vista anteriormente. Em alguns casos, as
duas curvas ficam praticamente iguais indicando que pode-se usar a
distribuição de Poisson para aproximar a binomial. Por exemplo, pense
numa situação em que um experimento binomial será repetido um grande
número n de vezes com uma probabilidade p pequena de sucesso a cada
repetição.
Para tornar mais concreto o que estamos dizendo, vamos para o exemplo
seguinte.
Probabilidade e Estatística I – Antonio Roque – Aula 21
7
3. Os administradores de uma maternidade estão interessados em saber a
probabilidade de que, dos próximos 100 nascimentos, 3 sejam de
crianças com uma certa doença congênita. A probabilidade de que nasça
um bebê com essa doença é p = 0,01 (1%) e o número de repetições de
nascimentos é n = 100. Portanto, este é um problema que pode ser
resolvido usando-se a distribuição binomial:
973
!97!3!100),100|3( qppXP == .
O cálculo da expressão acima pode ser um pouco tedioso. Por isso,
vamos tentar resolve-lo usando a distribuição de Poisson.
Vamos supor que os próximos 100 nascimentos na maternidade ocorram
dentro de um período de tempo T. A ocorrência de um nascimento de
uma criança com a doença congênita dentro desse intervalo de tempo é
um evento aleatório e independente de outro nascimento de uma criança
com a doença.
Vamos subdividir o intervalo T em pequenos intervalos de tempo δt de
maneira que se possa assumir que a probabilidade de que ocorra um
nascimento de uma criança com a doença dentro de δt seja proporcional
a δt e que a probabilidade de que ocorram dois ou mais nascimentos de
crianças com a doença em δt seja desprezível. Isto nos indica que
podemos usar a distribuição de Poisson para calcular o número de
nascimentos de bebês com a doença congênita no intervalo T.
Para usar a distribuição de Poisson, precisamos saber a média de
nascimentos de crianças com a doença dentro do intervalo T.
Probabilidade e Estatística I – Antonio Roque – Aula 21
8
Esta média pode ser obtida com a fórmula do valor esperado do número
de crianças com a doença congênita nascidas em 100 nascimentos para a
distribuição binomial (lembre-se de que o problema satisfaz a uma
distribuição binomial).
O valor esperado de uma variável binomial para n repetições com
probabilidade p de sucesso (sucesso aqui é nascer uma criança com a
doença) é µ = np = 100x0,01 = 1. Portanto, usando a fórmula da
distribuição de Poisson:
0613,0!3
1!3
)3(133
===−− eep
µµ (6,13 %).
Para conferir se este resultado é uma boa aproximação para o valor que
teria sido obtido com o uso da fórmula da distribuição binomial, o seu
valor é P(3|100,0,01) = 0,0609 (6,09 %). O erro cometido pelo uso da
distribuição de Poisson é de menos de 1 % (0,66 %).
O gráfico a seguir, mostra as duas distribuições (binomial e de Poisson)
para x (o número de nascimentos de crianças com a doença congênita)
variando de 0 a 10. Observe que os pontos das duas distribuições caem
um em cima do outro (na escala do gráfico), indicando que a distribuição
de Poisson fornece uma ótima aproximação para a distribuição binomial
neste caso.
Probabilidade e Estatística I – Antonio Roque – Aula 21
9
Comparação entre Binomial e Poisson
00.050.10.150.20.250.30.350.4
0 2 4 6 8 10 12
x
p(x)
Os quadrados são os pontos da distribuição binomial e os losangos são os
pontos da distribuição de Poisson.
Aproximação da Distribuição Binomial pela Distribuição de Poisson
Seja a distribuição binomial para y sucessos em n repetições com
probabilidade p de que haja um sucesso a cada repetição:
( )( )
( )
( ) ( ) ( )
( )( ) ( )( ) ( ) .11)1()2()1()(!
1
11...)1()2)(1(!
1
1!!
!,|
yn
yn
ynyyny
pppynpnpnnpy
ppppppynnnny
ppyny
nqpyn
pnyP
−
−
−−
−−+−−−=
=−−−−−−=
=−−
=⎟⎟⎠
⎞⎜⎜⎝
⎛=
…
……
Lembrando que o valor esperado da distribuição binomial é
npnp µ
µ =⇒= :
Probabilidade e Estatística I – Antonio Roque – Aula 21
10
( )yn
nnnyn
nn
nn
ypnyP
−
⎟⎠
⎞⎜⎝
⎛ −⎟⎠
⎞⎜⎝
⎛ −+−−−=µµµµµ
µ 11)1()2.()1.(!1,| … .
No limite em que ∞→n :
• Termos do tipo ;)( µµ→−
nin
• ;1lim µµ −
∞→=⎟
⎠
⎞⎜⎝
⎛ − en
n
n
• .11lim =⎟⎠
⎞⎜⎝
⎛ −−
∞→
y
n nµ
De maneira que:
( ) .!
1....!1,|
yee
ypnyP
yy
µµ µ
µµµµ−
− ==!"!#$…
Portanto, no limite em que ∞→n ( 0→p ) a distribuição binomial é
aproximada pela distribuição de Poisson.
Distribuição Geométrica
Suponha um experimento de Bernoulli que é repetido várias vezes. Seja p a
probabilidade de se obter um sucesso e q = 1− p a probabilidade de um
fracasso. Então, a probabilidade de que o primeiro fracasso ocorra na i-
ésima repetição é:
Probabilidade e Estatística I – Antonio Roque – Aula 21
11
! );1(...)4(
);1(..)3();1(.)2(
;1)1(
3
2
ppqpppipppqppip
ppqpippqip
−===
−===
−===
−===
Definindo a variável aleatória Y = número de sucessos antes do primeiro
fracasso, temos:
.)1()(
;)1()4()3(;)1()3()2(;)1()2()1(;).1()1()0(
3
2
1
0
yppyp
ppipypppipypppipypppipyp
−=
−====
−====
−====
−====
!
A distribuição
… ,2 ,1 ,0 ,)1()( =−= yppyp yY ,
é chamada de distribuição geométrica. O seu nome deve-se ao fato de que
ela é formada por uma progressão geométrica.
Costuma-se chamar a variável aleatória Y de comprimento de uma
seqüência de sucessos. Note que a probabilidade de um dado comprimento
de uma seqüência de sucessos após um fracasso também satisfaz a uma
distribuição geométrica.
Pode-se mostrar que o valor esperado e a variância de uma distribuição
geométrica são iguais a:
Probabilidade e Estatística I – Antonio Roque – Aula 21
12
ppyE−
=1
)( e ( )22
1 pp−
=σ .
A função de distribuição acumulada para a distribuição geométrica é:
( )
⇒−+++−+−+−=
=−++−+−+−=−=≤=
+
=∑
133220
2
1
)1()1()1()1()1(Prob)(
yy
y
i
yiY
pppppppp
pppppppppyYyF
…
…
.1)( 1+−=⇒ yY pyF
Exercício: Sejam as duas seqüências de DNA vindas, por exemplo, de duas
espécies diferentes. As setas indicam pares de bases que são comuns às duas
seqüências:
accgtgtagtctacttcagacttctcggatgactcagctagagctgagtgacct
↓↓↓↓↓↓↓↓↓↓↓
Chamando uma seqüência de sucesso a um trecho das duas seqüências de
DNA cujas baes sejam iguais, calcule P(Y = 0), P(Y = 1), P(Y = 2) e P(Y =
3) (p = ¼):
.43
41
43)1()(
0117187,02563
41
43)1()3(
;046875,0643
41
43)1()2(
;1875,0163
4143)1()1(
;75,043)1()0(
1
33
22
+=⎟
⎠
⎞⎜⎝
⎛=−=
==⎟⎠
⎞⎜⎝
⎛=−=
==⎟⎠
⎞⎜⎝
⎛=−=
===−=
==−=
y
yyppyP
ppP
ppP
ppP
pP
!
Probabilidade e Estatística I – Antonio Roque – Aula 21
13
Distribuição Binomial Negativa
Em muitos casos, a variável aleatória de interesse não é o número de
sucessos em n repetições do experimento binomial, mas quantas repetições
são necessárias para se atingir m sucessos não necessariamente em
seqüência.
Seja m o número pré-fixado de sucessos. A variável aleatória Y é o número
de repetições do experimento de Bernoulli até se atingir este número de
sucessos:
PY(n) = probabilidade de que nas primeiras (n – 1) repetições haja (m – 1)
sucessos (e, portanto, n – m fracassos) e de que na n-ésima repetição haja
um sucesso.
A probabilidade de que em (n – 1) repetições haja (m – 1) sucessos é dada
por uma distribuição binomial,
)1()1(1 )1(11
),1|1( −−−− −⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−=−− mnm ppmn
pnmP ,
e a probabilidade de que na n-ésima repetição haja um sucesso é
simplesmente p.
Logo:
)1()1()1()1(1 )1(11
)1(11
.)( −−−−−−− −⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−=−⎟⎟
⎠
⎞⎜⎜⎝
⎛
−
−= mnmmnm
Y ppmn
ppmn
pnP , n ≥ m.
Pode-se mostrar que o valor esperado e a variância da distribuição binomial
negativa são iguais a:
Probabilidade e Estatística I – Antonio Roque – Aula 21
14
pmnE =)( e 2
2 )1(ppm −
=σ .
Exercício: Um professor está precisando selecionar uma equipe de quatro
alunos para participar de um projeto de pesquisa. Os requisitos para que um
aluno participe da equipe são que ele seja um bom programador, seja fluente
em inglês e tenha tirado nota acima de 7 em uma dada matéria. A proporção
de alunos com essas qualificações na sua universidade é igual a 30%. Qual é
probabilidade de que a equipe seja formada quando o décimo candidato for
considerado?
Neste caso, quando o décimo candidato for considerado ele satisfará os
requisitos necessários e será o quarto dos dez candidatos a fazê-lo, de
maneira que a equipe estará montada e não será mais necessário considerar
novos alunos. Isto quer dizer que seis dos nove candidatos anteriores ao
décimo foram rejeitados. Temos então: n = 10, m = 4 e p = 0,3. Logo:
.08,0)7,0()3,0(!6!3!9)7,0()3,0(
14110
)10( 64)14()110(4 ==⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−= −−−
YP
Portanto, a probabilidade de que o professor consiga “fechar” a sua equipe
com o décimo candidato que aparecer é de 8%.
Distribuição Hipergeométrica
Consideremos o seguinte problema. Um departamento de uma universidade
contém 50 professores: 30 mulheres e 20 homens. Deseja-sa escolher uma
amostra aleatória de 5 desses professores para formar uma comissão para
discutir a criação de novas disciplinas de graduação. Qual a probabilidade
de que essa comissão de cinco professores contenha exatamente 2 homens?
Probabilidade e Estatística I – Antonio Roque – Aula 21
15
Como o departamento tem 50 professores, o número de possíveis comissões
diferentes contendo 5 professores é dado por
760.118.2!45!5!50
550
==⎟⎟⎠
⎞⎜⎜⎝
⎛.
A quantidade de maneiras diferentes de se escolher uma amostra de 5
professores composta exatamente por 2 homens e 3 mulheres é dada por:
! !400.771
!27!3!30
!18!2!20
330
220
mulheres 30 de totalumde mulheres 3escolher se de
diferentes maneiras de No.
homens 20 de totalum de homens 2escolher se de
diferentes maneiras de No.
=×=⎟⎟⎠
⎞⎜⎜⎝
⎛×⎟⎟
⎠
⎞⎜⎜⎝
⎛.
Portanto, a resposta para o problema é:
.364,0760.118.2
400.771
550
330
220
mulheres) 3 e homens Prob(2 ≈=
⎟⎟⎠
⎞⎜⎜⎝
⎛
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛
=
Quando temos uma população contendo N elementos, dos quais M são
considerados sucessos (por exemplo, homens no caso anterior) e N – M são
considerados fracassos, a probabilidade de selecionarmos uma amostra
aleatória de n elementos da população, sem reposição, contendo exatamente
x sucessos e n – x fracassos é dada pela distribuição hipergeométrica:
( )( )
( ) ( ) ( )[ ]
( )!!!
!!!
!!!
)(
nNnN
xnMNxnMN
xMxM
nN
xnMN
xM
xPX
−
−−−−−
×−
=
⎟⎟⎠
⎞⎜⎜⎝
⎛
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−⎟⎟⎠
⎞⎜⎜⎝
⎛
= .
Probabilidade e Estatística I – Antonio Roque – Aula 21
16
Pode-se mostrar que o valor esperado e a variância da distribuição
hipergeométrica são iguais a:
npxE =)( e ( )
NMp
NnNpnp =
−−−
= onde ,1
)1(2σ .
Exercício: Suponha que lhe peçam para retirar 5 cartas de um baralho
normal de 52 cartas, sem reposição. Qual a probabiliade de que as 5 cartas
contenham 2 cartas de ouros?
Num baralho normal de 52 cartas existem 13 cartas de cada naipe. Portanto,
considerando uma carta de ouros como um sucesso, a fórmula da
distribuição hipergeométrica nos dá:
.2743,0
!47!5!52
!36!3!39
!11!2!13
552339
213
)2( =×
=
⎟⎟⎠
⎞⎜⎜⎝
⎛
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛
=P
A seguir, são dados gráficos das distribuições discretas apresentadas:
Probabilidade e Estatística I – Antonio Roque – Aula 21
17
Top Related