A Distribuição Binomial Muitas aplicações de probabilidade podem ...

12
Probabilidade e Estatística I – Antonio Roque – Aula 19 1 A Distribuição Binomial Muitas aplicações de probabilidade podem ser reduzidas a um modelo em que um experimento é repetido várias vezes, cada uma independentemente da outra, e com apenas dois resultados possíveis para cada experimento. Quando um experimento tem apenas dois resultados possíveis e a probabilidade de cada resultado permanece constante ao longo das suas repetições independentes, ele é chamado de experimento binomial, ou experimento de Bernoulli. O modelo tradicional para um tal experimento é o de uma moeda sendo lançada, com os possíveis resultados sendo cara ou coroa. Para cada repetição do experimento (lançar a moeda), os resultados possíveis são sempre dois, cara ou coroa, com probabilidades independentes dos resultados obtidos em experimentos anteriores. As propriedades de um experimento binomial são resumidas a seguir: 1. Deve haver um número definido de repetições. 2. O resultado de cada repetição deve ser um entre dois possíveis eventos. 3. As probabilidades de cada uma das duas possibilidades devem permanecer constantes ao longo das repetições. 4. Cada repetição deve ser independente das outras. Em geral, como apenas dois resultados são possíveis, denota-se a probabilidade de um evento por p e a do outro por q=1-p. Como exemplos, temos: a transmissão de uma doença genética, uma gravidez resultar em menina ou menino, um paciente morrer ou não dentro de um ano, um paciente ter teste positivo ou não etc.

Transcript of A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Page 1: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

1

A Distribuição Binomial

Muitas aplicações de probabilidade podem ser reduzidas a um modelo em que

um experimento é repetido várias vezes, cada uma independentemente da outra,

e com apenas dois resultados possíveis para cada experimento.

Quando um experimento tem apenas dois resultados possíveis e a probabilidade

de cada resultado permanece constante ao longo das suas repetições

independentes, ele é chamado de experimento binomial, ou experimento de

Bernoulli.

O modelo tradicional para um tal experimento é o de uma moeda sendo lançada,

com os possíveis resultados sendo cara ou coroa. Para cada repetição do

experimento (lançar a moeda), os resultados possíveis são sempre dois, cara ou

coroa, com probabilidades independentes dos resultados obtidos em

experimentos anteriores.

As propriedades de um experimento binomial são resumidas a seguir:

1. Deve haver um número definido de repetições.

2. O resultado de cada repetição deve ser um entre dois possíveis eventos.

3. As probabilidades de cada uma das duas possibilidades devem permanecer

constantes ao longo das repetições.

4. Cada repetição deve ser independente das outras.

Em geral, como apenas dois resultados são possíveis, denota-se a probabilidade

de um evento por p e a do outro por q=1-p.

Como exemplos, temos: a transmissão de uma doença genética, uma gravidez

resultar em menina ou menino, um paciente morrer ou não dentro de um ano,

um paciente ter teste positivo ou não etc.

Page 2: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

2

Suponhamos que se queira investigar a presença de certa doença genética entre

três filhos de um casal. Todos os resultados possíveis estão mostrados na tabela

a seguir (N=normal; D=doente):

Filho 1 Filho 2 Filho 3 Probabilidade Nº de

Normais

N N N p. p. p 3

N N D p. p. q 2

N D N p. q. p 2

D N N q. p. p 2

N D D p. q. q 1

D N D q. p. q 1

D D N q. q. p 1

D D D q. q. q 0

Para o cálculo das probabilidades, usou-se o produto das probabilidades dos

eventos individuais porque eles são independentes.

Para a tabela anterior, o filho 1 é o mais velho, o 2 é o do meio e o 3 é o mais

novo. A probabilidade de que uma criança seja normal é p e a probabilidade de

que ela seja doente é pq −= 1 . As probabilidades dadas na tabela foram

calculadas usando a fórmula para a probabilidade conjunta de três eventos

independentes: )()()() ( CPBPAPCeBeAP ⋅⋅= . Um sumário dos resultados,

desprezando a ordem das crianças é dado na tabela a seguir.

Nº de

Normais (K)

Nº de maneiras em que

K normais podem

ocorrer

Probabilidade de haver

K normais

Page 3: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

3

0 1 q3

1 3 3pq2

2 3 3p2q

3 1 P3

Como existem 3 crianças, há quatro possibilidades quanto ao número de

normais: 0 normais, 1 normal, 2 normais e os 3 normais.

Cada possibilidade pode ocorrer um certo número de vezes: nenhum normal

ocorre 1 vez; 1 normal pode ocorrer de 3 maneiras diferentes (NDD, DND,

DDN); 2 normais pode ocorrer de 3 maneiras diferentes (NND, NDN, DNN); e

3 normais só pode ocorrer de uma maneira.

Para se calcular as probabilidades de ocorrência de um dado número de normais,

usou-se a regra da soma de probabilidades.

Por exemplo, para se saber a probabilidade de que, dos 3 irmãos 2 sejam

normais calculou-se P(NND ou NDN ou DNN).

Como as três seqüências de nascimento são mutuamente exclusivas (se as

crianças nascem em uma ordem, não podem nascer em outra) basta somar as três

probabilidades para se obter o resultado desejado:

P(NND ou NDN ou DNN)=P(NND)+P(NDN)+P(DNN) =

qpppqpqpqpp 23=⋅⋅+⋅⋅+⋅⋅= .

Outra maneira útil de se visualizar experimentos binomiais é através de

“diagramas de árvore” (veja abaixo). Uma árvore começa com um dos dois

resultados possíveis e sua probabilidade, enquanto a outra árvore começa com o

outro resultado possível e sua probabilidade. Depois, elas se ramificam entre os

dois resultados possíveis e suas probabilidades e assim por diante. A

Page 4: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

4

probabilidade de uma seqüência será dada pelos produtos das probabilidades ao

longo do ramo associado à seqüência.

Por exemplo, a seqüência correspondente a nenhum nascimento normal (K=0) é

representada pelo ramo mais à direita da árvore à direita (DDD), na figura

acima. Sua probabilidade é então dada pelo produto das probabilidades

associadas a cada trecho do ramo:

P(No de normais = 0) =3qqqq =⋅⋅ .

Outro exemplo, a probabilidade de apenas 1 filho normal é dada pela soma das

probabilidades associadas aos ramos mais grossos na figura a seguir:

P(No de normais = 1) = 23pqpqqqpqqqp =⋅⋅+⋅⋅+⋅⋅ .

Page 5: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

5

As árvores desenhadas acima são uma maneira gráfica de representar o que se

chama matematicamente de função geratriz da distribuição de probabilidades

binomial, usualmente chamada apenas de função binomial.

Especificamente, para o exemplo em questão, todas as probabilidades de

ocorrência de qualquer número K de crianças normais em um total de 3 filhos

(ou 3 repetições do experimento binomial que é ter um filho) podem ser obtidas

da fórmula:

( ) ( ) ( ) ( ) ( ) ( )3223

223

332

qpqqppqpqpqpqpqpqpqp

+++=

=+⋅++=+⋅+⋅+=+

Para calcular a probabilidade p de se obter k normais, seleciona-se o termo para

o qual o expoente de p é igual a k (note que 10 =x , de maneira que 033 qpp = e

⎟⎠⎞= 303 qpq :

P(0 Normal) = termo para o qual 30 qk ⇒=

P(1 Normal) = termo para o qual 231 pqk ⇒=

P(2 Normais) = termo para o qual qpk 232⇒=

P(3 Normais) = termo para o qual 33 pk ⇒= .

Em geral, para qualquer experimento binomial, com possíveis resultados A e Ā

a cada repetição:

( )

.

10

0

0

1100

∑=

−−−

⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛+

+⎟⎟⎠

⎞⎜⎜⎝

⎛++⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛=+

n

k

knkn

mnmnnn

qpkn

qpnn

qpmn

qpn

qpn

qp ……

Onde:

p = probabilidade de A, a cada repetição;

Page 6: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

6

q = 1 − p = probabilidade de Ā a cada repetição;

n = número de repetições;

( )!!!

, knknC

kn

kn −==⎟⎟

⎞⎜⎜⎝

⎛= possíveis combinações de k elementos

retirados de um conjunto de n elementos;

( )( ) ( )( )1221! …−−= nnnn = n fatorial.

Porque se usou a fórmula ( )!!!knk

nkn

−=⎟⎟

⎞⎜⎜⎝

⎛ para expressar o número de

formas possíveis de se obter k filhos normais em n nascimentos?

Esta fórmula dá o número de possíveis combinações de k elementos distintos

retirados de um conjunto de n elementos, como você deve se lembrar da aula

sobre análise combinatória. Como os pais não estão interessados (neste caso!) na

identidade dos filhos normais, mas apenas no número de maneiras em que k

filhos normais podem ser combinados em uma seqüência de n filhos, eles devem

usar a fórmula da combinação de n, k a k.

Se você está em dúvida sobre esta fórmula, releia as notas de aula sobre

contagem e, em particular, o último exercício daquelas notas.

Se você ainda continua em dúvida, veja o seguinte exemplo. Suponha que um

casal tenha 12 filhos (antigamente era comum) e que 5 deles sejam meninos (as

outras 7 sejam meninas). De quantas maneiras o casal pode ter 5 meninos em

um conjunto de 12 filhos? Observe que não estamos interessados na identidade

dos meninos, mas apenas no sexo deles.

Vamos considerar que os 12 filhos estão ordenados por ordem de nascimento (o

1o filho, o 2o filho, o 3o filho ... até o 12o filho). Então, tomando um dos 5

meninos ele pode ser qualquer um desses 12 filhos; há 12 possibilidades para

Page 7: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

7

ele. Fixando esse primeiro menino em uma posição qualquer, para o segundo

menino existem agora apenas 11 posições possíveis. O número de possibilidades

de colocarmos os dois na lista de 12 filhos é 12×11. Fixando os dois primeiros

meninos, o número de posições possíveis para o terceiro menino é agora 10.

Fixando este, o número de possibilidades para o quarto é igual a 9. Da mesma

forma, para o quinto o número de possibilidades é 8. Portanto, o número de

maneiras de distribuir 5 meninos em 12 posições é

12×11×10×9×8.

O resultado acima pode ser generalizado para o número de possibilidades de se

arranjar k meninos em n posições como

n×(n−1)×(n−2)× ... ×(n−k+2)×(n−k+1).

Como visto na aula sobre contagem, esta expressão corresponde ao arranjo de n

elementos k a k:

( ).!

!, kn

nA kn −=

Note, porém, que a fórmula acima leva em consideração a identidade dos

meninos e não apenas a sua posição.

Por exemplo, suponha que saibamos que há filhos meninos na 2a e na 5a

posições. Então, se o João é o 2o e o Pedro é o 5o ou se o Pedro é o 2o e o João é

o 5o faz diferença do ponto de vista da identidade deles, mas não do ponto de

vista de termos o 2o e o 5o filhos meninos. Se estamos preocupados apenas com

as posições ocupadas pelos filhos meninos, as duas situações (João na 2a e Pedro

na 5a ou Pedro na 2a e João na 5o) são idênticas.

Por causa disso, para calcularmos o número de possibilidades distintas de

combinarmos k filhos meninos em n posições devemos contar apenas uma de

todas as possíveis maneiras de se arranjar os k meninos em k posições dadas.

Para se fazer isso deve-se dividir o número acima por k!,

Page 8: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

8

( ).!!

!knk

n−

Por exemplo, para a condição em que os 5 filhos ocupam as posições (2a, 5a, 7a,

9a e 10a) existem 5! permutações diferentes, mas só se deve contar uma delas.

Para cada possível conjunto de 5 posições diferentes contido na fórmula

( )!512!12−

, existem 5! casos que somente diferem entre si quanto à identidade dos

filhos. Chamando o número de combinações diferentes de 5 posições dentre as

12 possíveis de C12,5, podemos escrever,

( ).x!5

!512!12

5,12C=−

Então,

( ).!512!5

!12512

5,12 −==⎟⎟

⎞⎜⎜⎝

⎛ C

Generalizando para o caso de n posições possíveis e k elementos a distribuir

entre elas,

( ).!!

!5,12 knk

nCkn

−==⎟⎟

⎞⎜⎜⎝

Para Fixar: FUNÇÃO BINOMIAL

A função binomial é dada por:

∑=

−−−⎟⎟⎠

⎞⎜⎜⎝

⎛++⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=+

n

ok

onnonoknkn qpnn

qpn

qpon

qpkn

qp …11

1)( .

Onde:

.)!(!

!, mnm

nCmn

mn −==⎟⎟

⎞⎜⎜⎝

Cada termo da função binomial corresponde a um conjunto específico de ramos

dos diagramas de árvore apropriados.

Page 9: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

9

Para o exemplo dos 3 filhos temos:

n=3; P(normal)=p; P(doente)=q.

Usando a função binomial, temos:

∑=

−−−− +⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛3

0

2321310303

23

13

033

k

kk qpqpqpqpk

+−

+−

=⎟⎟⎠

⎞⎜⎜⎝

⎛+ − 2130333

)!13(!1!3

)!03(!0!3

33

qpqpqp

+⋅⋅⋅

⋅⋅=

−+

−+ 300312

)123(1123

)!33(!3!3

)!23(!2!3 qpqpqp

=⋅⋅⋅

⋅⋅+

⋅⋅

⋅⋅+

⋅⋅+ 031221

1)123(123

)1()12(123

)12(1123 qpqpqp

322303122130 3333 pqppqqqpqpqpqp +++=+++= .

Então:

P(0 normais) = termo para o qual o expoente de p é zero = q3;

P(1 normal) = termo para o qual o expoente de p é 1 = 3pq2;

P(2 normais) = termo para o qual o expoente de p é 2 = 3p2q;

P(3 normais) = termo para o qual o expoente de p é 3 = p3.

A notação pode ainda ser mais refinada para tornar o uso da função binomial

mais produtivo. Suponha que o resultado que nos interessa em um experimento

binomial seja simbolizado pela letra y.

Então, pode-se escrever:

,),|( knkqpkn

pnkyP −⎟⎟⎠

⎞⎜⎜⎝

⎛== ,nk ≤

Page 10: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

10

que é igual à probabilidade de que o evento y ocorra k vezes em n repetições,

quando a probabilidade de ocorrência de y a cada repetição é p. Usando esta

notação concisa para o exemplo dos irmãos, e chamando a y de uma criança

normal:

P(No de normais = k|3, p) = ,3 3 kk qpk

−⎟⎟⎠

⎞⎜⎜⎝

⎛ 3,2,1=k .

A função de probabilidade binomial também pode ser utilizada para calcular

probabilidades de eventos compostos. Lembre-se que se alguns eventos forem

mutuamente exclusivos, a probabilidade de ocorrência de um ou de outro ou de

outro etc, é dada pela soma das probabilidades individuais.

P(dois ou mais normais|3, p) =

32032 333

23

),3|3(),3|2( pqpqpqppkPpkP +=⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛==+== .

Poderíamos também ter escrito:

P(2 ou mais normais|3,p) =∑=

−⎟⎟⎠

⎞⎜⎜⎝

⎛3

2

33

k

kk qpk .

Em geral:

∑=

− ≤⎟⎟⎠

⎞⎜⎜⎝

⎛=≤

m

k

knk nmqpkn

pnmyP0

,),|( ,

e

∑=

− ≤⎟⎟⎠

⎞⎜⎜⎝

⎛=≥

n

mk

knk nmqpkn

pnmyP ,),|( .

A primeira fórmula dá a probabilidade de termos qualquer número de casos que

nos interessam, até m, em n repetições possíveis.

Page 11: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

11

A segunda fórmula dá a probabilidade de termos qualquer número de casos que

nos interessam, de m até o máximo número possível, quando este número

máximo é n.

Exemplos:

1. Suponha que a probabilidade de se transmitir um gene responsável por certa

doença seja de ¼. Qual a probabilidade de que, em uma família de 4 crianças,

haja um filho são ou nenhum filho são? E qual a probabilidade de que haja

exatamente 2 filhos doentes?

P(1 filho são ou 0 filhos sãos) = P(3 filhos doentes ou 4 filhos doentes) = P(3 ou

mais filhos doentes).

Aplicando a fórmula:

P(3 ou mais doentes/4, ¼) =∑=

− =⎟⎟⎠

⎞⎜⎜⎝

⎛4

3

44

k

kk qpk

=⋅⎟⎠

⎞⎜⎝

⎛+⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛−

=⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛= 1

41

!0!4!4

43

41

)!34(!3!4

44

34 43

0413 qpqp

25613

4112

41

434

41

!4!4

43

41

1)123(1234

444

43

=+

=+⋅=⎟⎠

⎞⎜⎝

⎛+⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛⋅⋅⋅

⋅⋅⋅= .

Já a probabilidade de ter exatamente dois filhos doentes é:

P(2 doentes/4,¼) = =⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛−

=⎟⎟⎠

⎞⎜⎜⎝

⎛ −22

242

43

41

)!24(!2!4

24

qp

12827

25654

169

1616

49

41

)12)(12(1234

22 ==××=⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛⋅⋅

⋅⋅⋅= .

2. Um industrial percebeu que 15% das peças produzidas por uma certa máquina

apresentam defeitos. Em uma amostra aleatória de 5 peças produzidas pela

máquina, qual será a probabilidade de: (a) todas serem defeituosas; (b) uma ser

defeituosa; (c) duas serem defeituosas; e (d) pelo menos uma ser defeituosa.

Page 12: A Distribuição Binomial Muitas aplicações de probabilidade podem ...

Probabilidade e Estatística I – Antonio Roque – Aula 19

12

A probabilidade de uma peça ser defeituosa é p = 0,15, de maneira que q = 1 -

0,15 = 0,85. Temos 5 repetições do experimento binomial. Logo:

a) ( ) ( ) ( ) 00008,015,085,015,0)!55(!5

!555

)15,0,5/5( 505555 ==×−

=⎟⎟⎠

⎞⎜⎜⎝

⎛= −qpP ;

b) ( ) ( ) ( ) 39,052,015,0585,015,0!4!1!5

15

15,0,5/1 441 =××=×=⎟⎟⎠

⎞⎜⎜⎝

⎛= qpP ;

c) ( ) ( ) ( ) 14,061,00225,01085,015,0!3!2!5

25

15,0,5/2 3232 =××==⎟⎟⎠

⎞⎜⎜⎝

⎛= qpP ;

d)P(No de defeituosas ≥ 1/5,0,15) ( ) ( )∑=

− =⎟⎟⎠

⎞⎜⎜⎝

⎛=

5

1

585,015,05

k

kk

k

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) +⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛= 14233241 85,015,0

45

85,015,035

85,015,025

85,015,015

( ) ( ) +××+××++=⎟⎟⎠

⎞⎜⎜⎝

⎛+ 85,00005,0572,00034,01014,039,085,015,055 05

556,000008,0002,002,014,039,000008,0 =++++=+ .

Note que o último item poderia ser resolvido de outra maneira mais direta

lembrando que P(ao menos uma) = 1 – P(nenhuma) = 1 – q5 = 1 – 0,444 =

0,556.