M odulo III - D6 An alise Combinat oria, Probabilidade No ...

112
Universidade Estadual de Campinas M´odulo III - D6 An´ alise Combinat´oria, Probabilidade No¸ c˜oesdeEstat´ ıstica Tema 1 - Elementos da Teoria de Conjuntos Prof. Laura L. R. Rifo - Novembro, 2010 -

Transcript of M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Page 1: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Universidade Estadual de Campinas

Modulo III - D6

Analise Combinatoria, ProbabilidadeNocoes de Estatıstica

Tema 1 - Elementos da Teoria de Conjuntos

Prof. Laura L. R. Rifo

- Novembro, 2010 -

Page 2: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Sumario

1 Elementos da teoria de conjuntos 1

1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Relacoes entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Colecoes de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4 Produto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Medida de contagem 5

2.1 Regra da soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Algumas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4 Regra do produto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 Estruturas de contagem 9

3.1 Permutacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.2 Combinacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.3 Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Amostra ordenada com reposicao . . . . . . . . . . . . . . . . . . . . . . 12

Amostra ordenada sem reposicao . . . . . . . . . . . . . . . . . . . . . . 12

Amostra nao ordenada sem reposicao . . . . . . . . . . . . . . . . . . . . 12

Amostra nao ordenada com reposicao . . . . . . . . . . . . . . . . . . . 13

Page 3: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

ii Sumario

3.4 Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

A Exercıcios 17

A.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

A.2 Medida de Contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

A.3 Estruturas de contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 20

B Demonstracoes 23

B.1 Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

B.2 Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 24

B.3 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 24

B.4 Amostragem nao-ordenada com reposicao . . . . . . . . . . . . . . . . . 24

B.5 Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 25

B.6 Coeficientes multinomiais - Exemplo 1 . . . . . . . . . . . . . . . . . . . 26

Page 4: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 1

Elementos da teoria de conjuntos

1.1 Conjuntos

A teoria de conjuntos e a base para toda a probabilidade e estatıstica, assim como de

outras areas da matematica. Nesta secao, faremos uma pequena revisao do material

necessario para este modulo.

Lembremos que um conjunto e uma colecao de objetos, chamados os elementos do con-

junto. A afirmacao de que s e um elemento do conjunto A e escrita como s ∈ A.

Por definicao, um conjunto fica completamente determinado por seus elementos; em

particular dois conjuntos A e B sao iguais se eles tiverem os mesmos elementos:

A = B se e somente se (s ∈ A ⇐⇒ s ∈ B) .

Se a A e B sao conjuntos, entao A e um subconjunto de B se todo elemento de A for

tambem elemento de B:

A ⊂ B se e somente se (s ∈ A⇒ s ∈ B) .

Figura 1.1: Diagrama de Euler-Venn para dois conjuntos, A ⊂ B.

Podemos representar conjuntos e relacoes entre eles com desenhos esquematicos chama-

dos diagramas de Euler - Venn. O diagrama da Figura 1.1 por exemplo representa a

relacao de subconjunto.

Page 5: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

2 Elementos da teoria de conjuntos

Trabalharemos usualmente com conjuntos que serao todos subconjuntos de um conjunto

especıfico Ω, chamado conjunto universo. Definimos tambem o conjunto vazio, denotado

por ∅, como o conjunto sem elementos.

Consideremos um predicado q(s), ou seja, uma afirmacao matematica que ou e ver-

dadeira ou e falsa para cada elemento s ∈ Ω. Entao s ∈ Ω : q(s) e verdadeira define

completamente um subconjunto de Ω: o conjunto de todos os elementos de Ω que satis-

fazem q(s).

1.2 Relacoes entre conjuntos

Lembremos que as operacao basicas em teoria de conjuntos permitem definir novos con-

juntos. Mais precisamente, sejam A e B subconjuntos de um mesmo conjunto universo,

Ω. Entao definimos a uniao entre A e B, como o conjunto que combina os elementos de

A e B,

A ∪B = s ∈ Ω : s ∈ A ou s ∈ B.

A intersecao de A e B e o conjunto dos elementos em comum entre A e B,

A ∩B = s ∈ Ω : s ∈ A e s ∈ B.

A diferenca de conjuntos de B e A e o conjunto dos elementos que estao em B mas nao

em A,

B \A = s ∈ Ω : s ∈ B e s /∈ A.

O complementar de A e o conjunto de elementos que nao estao em A,

AC = s ∈ Ω : s /∈ A.

Dizemos que os conjuntos A e B sao disjuntos se sua intersecao for o conjunto vazio,

A ∩B = ∅.

Uma discussao mais aprofundada de teoria de conjuntos pode ser encontrada no livro

classico de Halmos [4]. O projeto Laboratorio de Probabilidade e Estatıstica da Univer-

sidade do Alabama [12] disponibiliza um applet sobre o diagrama de Euler-Venn para

visualizar as possıveis relacoes entre dois conjuntos (deve ser usado o navegador Mozilla).

Page 6: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Colecoes de conjuntos 3

1.3 Colecoes de conjuntos

Podemos estender as relacoes anteriores para colecoes finitas ou infinitas de conjuntos.

Seja A uma colecao de subconjuntos de Ω. Podemos indexar os subconjuntos em A por

um conjunto de ındices I, escrevendo assim A = Ai ⊂ Ω : i ∈ I.

A uniao da colecao A e o conjunto que combina os elementos dos conjuntos em A,⋃A = s ∈ Ω : s ∈ A para algum A ∈ A,

ou, escrito de outra maneira,⋃i∈I

Ai = s ∈ Ω : s ∈ Ai para algum i ∈ I.

A intersecao da colecao A e o conjunto dos elementos em comum a todos os conjuntos

em A, ⋂A =

⋂i∈I

Ai = s ∈ Ω : s ∈ Ai para todo i ∈ I.

A Figura 1.2 mostra estes novos conjuntos a partir de uma colecao.

Figura 1.2: Diagrama de Euler-Venn para a uniao e a intersecao de uma colecao de

conjuntos.

A colecao A e disjunta dois a dois se a intersecao de quaisquer dois conjuntos da colecao

for vazia,

A ∩B = ∅ para quaisquer A ∈ A e B ∈ A , com A 6= B.

Dizemos que a colecao A forma uma particao de um conjunto B se A for disjunta dois

a dois e⋃A = B.

Dado um conjunto Ω, uma colecao importante e a colecao de todos os subconjuntos de

Ω, chamado o conjunto das partes de Ω, que denotaremos por P(Ω) ou 2Ω.

Page 7: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

4 Elementos da teoria de conjuntos

1.4 Produto cartesiano

Consideremos os conjuntos Ω1,Ω2, . . . ,Ωn. Definimos o produto cartesiano como o con-

junto

Ω1 × Ω2 × · · · × Ωn = (s1, s2, . . . , sn) : si ∈ Ωi para todo i ∈ 1, 2, . . . , n.

Se todos os conjuntos forem iguais, Ωi = Ω, denotamos o produto cartesiano como Ωn.

Podemos estender esta definicao para uma sequencia infinita de conjuntos (Ω1,Ω2, . . . )

como

Ω1 × Ω2 × · · · = (s1, s2, . . . ) : si ∈ Ωi para todo i ∈ 1, 2, . . . .

Denotaremos os elementos de um produto cartesiano com a notacao vetorial

(s1, s2, . . . , sn)

ou simplesmente como letras de uma palavra s1s2 . . . sn.

O experimento A matematica dos calendarios, disponıveis no site do projeto Matematica

Multimıdia [10] tratam de conjuntos em geral e de conjuntos numericos, em particular,

podendo ser utilizados como material auxiliar com os alunos.

Maos a obra. Exercıcios A.1.

Page 8: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 2

Medida de contagem

Suponhamos que Ω e um conjunto finito.

Se A ⊂ Ω entao a cardinalidade de A e o numero de elementos de A, e sera denotado por

#(A) ou simplesmente #A. A funcao # e chamada medida de contagem e e fundamental

na teoria de probabilidades discretas.

Em particular, quando trabalhamos com problemas envolvendo amostragens de um con-

junto finito, o conjunto Ω e tipicamente um conjunto grande, o que nos leva a necessidade

de construir formas eficientes de contagem.

Uma das regras basicas da contagem e o axioma de aditividade da medida de contagem,

mais conhecido como regra da soma.

2.1 Regra da soma

Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao

#

(⋃i

Ai

)=∑i

#(Ai).

Uma consequencia imediata desta propriedade e que dados dois conjuntos A e B tais

que A ⊂ B entao #A ≤ #B. Desta forma, # e uma funcao crescente relativa a ordem

parcial dos subconjuntos de Ω e a ordem usual em R.

2.2 Algumas desigualdades

As seguintes desigualdades nos permitem obter limitantes para o numero de elementos

de um conjunto.

Page 9: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

6 Medida de contagem

Desigualdade de Boole

Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao

#

(⋃i

Ai

)≤∑i

#(Ai).

Veja a prova B.1.

Em palavras, se n = 2, o total de elementos da uniao de dois conjuntos e menor ou

igual que a soma dos totais de elementos de cada conjunto, ja que se houver intersecao

nao-vazia, contaremos os elementos da intersecao duas vezes.

Desigualdade de Bonferroni

Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao

#

(⋂i

Ai

)≥ #Ω−

∑i

(#Ω−#Ai) .

Veja a prova B.2, que e uma consequencia da Desigualdade de Boole e da lei de De

Morgan.

2.3 Formula de inclusao-exclusao

Dados A,B ⊂ Ω,

#(A ∪B) = #A+ #B −#(A ∩B).

Veja a prova B.3.

Esta formula nos da o total exato de elementos de uma uniao, indicando que devemos so-

mar os totais de elementos de cada conjunto e subtrair o total de elementos da intersecao

(que foram contados duas vezes).

Este resultado pode ser estendido para mais de dois elementos, de forma natural. Por

exemplo, para n = 3 conjuntos, temos que

#(A ∪B ∪ C) = #A+ #B −#(A ∩B)−#(A ∩ C)−#(B ∩ C) + #(A ∩B ∩ C),

que pode ser visualizado no diagrama da Figura 2.1.

Page 10: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Regra do produto 7

Figura 2.1: Diagrama de Euler-Venn para 3 conjuntos.

2.4 Regra do produto

A regra do produto em contagem se baseia na formulacao de um procedimento ou algo-

ritmo que permita gerar os objetos que devem ser contados. Suponha que o procedimento

consiste em k passos, a serem realizados sucessivamente, e que cada passo j pode ser

realizado de nj formas diferentes, independentemente das escolhas feitas previamente.

Entao o numero total de formas de realizar o procedimento e igual a n1 n2 . . . nk, que e

tambem o numero total de possıveis objetos.

Podemos visualizar este algoritmo em uma arvore de contagem. Consideremos uma

arvore com k nıveis de galhos, de modo que cada galho do nıvel i − 1 se divida em ni

novos galhos, para i = 1, . . . , k, como mostrado na Figura 2.2.

O total de nodos no extremo da arvore e igual a n1 n2 . . . nk.

Em particular, se em cada passo do algoritmo tivermos o mesmo numero de possibili-

dades, n, entao o procedimento completo pode ser realizado de nk maneiras possıveis.

Exemplo. A placa de um carro consiste em 3 letras e 4 dıgitos. Quantas placas diferentes

podem ser licenciadas?

O fundamental para a correta aplicacao desta regra em um problema de contagem e

fazer uma formulacao clara do algoritmo que gera os diversos possıveis objetos, de modo

que cada objeto seja contado e que seja contado uma unica vez.

Os exercıcios ao fim desta secao sao importantes para perceber diferentes abordagens

desta regra.

O vıdeo Desejos e o software Geometria do Taxi, disponıveis no site do projeto Mate-

matica Multimıdia [10] tratam de algumas regras de contagem, podendo ser utilizados

como material auxiliar com os alunos.

Page 11: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

8 Medida de contagem

Figura 2.2: Diagrama de arvore de contagem.

Uma referencia bibliografica classica e o livro de Feller [2], que aborda este topico nos

primeiros capıtulos, com problemas que sao verdadeiros desafios.

Maos a obra. Exercıcios A.2.

Page 12: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 3

Estruturas de contagem

A definicao de um algoritmo para gerar os elementos de um conjunto permite determinar

uma estrutura de contagem. Veremos aqui duas estruturas basicas: permutacoes e

combinacoes.

3.1 Permutacoes

Consideremos um conjunto D = d1, d2, . . . , dn com n elementos. Uma permutacao de

k elementos de D e uma sequencia ordenada de k elementos diferentes de D:

(x1, x2, . . . , xk) ∈ Dk , onde xi ∈ D e xi 6= xj se i 6= j , para todos i, j.

Claramente, k nao pode ser maior que n. Uma permutacao de n elementos de D, ou seja,

uma ordenacao de todos os elementos de D, e chamada simplesmente uma permutacao

de D.

Podemos interpretar uma permutacao de k elementos de D como um resultado de um

mecanismo fısico que extrai k elementos da populacao D sem reposicao.

Com esta interpretacao, observemos que na primeira extracao, temos todos os n elemen-

tos de D como possıveis resultados. Para a segunda extracao, como o primeiro elemento

extraıdo nao e reposto, temos n−1 possıveis resultados. Para a terceira extracao, temos

n − 2 possıveis resultados. Assim por diante, ate a k-esima extracao, em que temos

n− k + 1 possıveis resultados, como mostra a Figura 3.1.

Assim, pela regra do produto, temos que o total de permutacoes de k elementos em n,

que denotaremos n(k), e igual a

n(k) = n(n− 1) . . . (n− k + 1) =n!

(n− k)!,

Page 13: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

10 Estruturas de contagem

Figura 3.1: Arvore de contagem para uma permutacao de k elementos em n.

onde n! = n(n− 1) . . . 1 e o fatorial de n.

Usaremos a regra do produto e o mecanismo de extracao como um algoritmo de con-

strucao de permutacoes de k elementos de D para contar o total de possıveis per-

mutacoes.

3.2 Combinacoes

Consideremos um conjunto D = d1, d2, . . . , dn com n elementos. Uma combinacao de

k elementos de D e um subconjunto (nao-ordenado) de k elementos diferentes de D:

x1, x2, . . . , xk , onde xi ∈ D e xi 6= xj se i 6= j , para todos i, j.

Novamente, k nao pode ser maior que n.

Podemos interpretar uma combinacao como o resultado do mecanismo fısico que extrai

uma amostra nao-ordenada de uma populacao D sem reposicao.

Denotemos por C(n, k) o total de combinacoes de k elementos de um grupo de n.

Observemos que cada combinacao permite construir k! ordenacoes diferentes, ou seja,

k! permutacoes de comprimento k.

Page 14: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Amostras 11

Figura 3.2: Uma combinacao de k elementos gera k! permutacoes desses elementos.

Isto nos permite obter o total de combinacoes possıveis de k elementos a partir do total

de permutacoes de k elementos, ja que

n(k) = k!C(n, k) =⇒ C(n, k) =n

(n− k)!k!=

(n

k

).

O numero(nk

)e chamado coeficiente binomial.

Note que se n e k sao inteiros nao negativos e k > n, entao(nk

)= 0. Por convencao,

definimos(nk

)= 0, se k < 0.

O raciocınio anterior nos leva a um novo algoritmo (com dois passos) para construir per-

mutacoes: primeiro selecionamos uma combinacao de k elementos e depois selecionamos

uma ordem para estes elementos.

Os exercıcios desta secao mostram algumas propriedades basicas dos conceitos definidos.

Maos a obra. Exercıcios A.3.

3.3 Amostras

Um dos experimentos basicos e importantes em probabilidade e o de obter uma amostra

de uma populacao finita.

Neste tipo de experimento, duas propriedades da amostragem sao essenciais:

• se a ordem e ou nao importante, e

• se um objeto amostrado e ou nao reposto na populacao antes da proxima extracao.

Page 15: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

12 Estruturas de contagem

Figura 3.3: Amostra de tamanho k de uma populacao D com n elementos.

Consideremos uma populacao D = d1, d2, . . . , dn com n objetos, da qual queremos

obter uma amostra de k objetos, chamados unidades amostrais.

Cada uma das quatro formas possıveis de amostragens sera descrita com mais detalhe

a seguir.

Amostra ordenada com reposicao

Se a ordem for importante e as extracoes forem feitas com reposicao, entao uma amostra e

um elemento do produto cartesiano Dk, ou seja, uma amostra e um vetor (a1, a2, . . . , ak),

onde ai representa o i-esimo elemento extraıdo de D.

Observemos que podemos ter coordenadas repetidas, indicando que um mesmo elemento

foi extraıdo mais de uma vez.

Neste caso, pela regra do produto, o total de amostras possıveis de k elementos e igual

ao total de vetores possıveis em Dk, igual a nk.

Amostra ordenada sem reposicao

Se a ordem for importante e as extracoes forem feitas sem reposicao, entao uma amostra

de k elementos e simplesmente uma permutacao de tamanho k escolhida de D. Nova-

mente, pela regra do produto, o total de amostras possıveis e igual a n(k).

Amostra nao ordenada sem reposicao

Se a ordem nao for importante e as extracoes forem feitas sem reposicao, entao uma

amostra e uma combinacao de k elementos de D; neste caso, o total de amostras possıveis

Page 16: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Coeficientes multinomiais 13

e C(n, k).

Amostra nao ordenada com reposicao

Finalmente, consideremos o caso em que a ordem nao e importante e as extracoes sao

feitas com reposicao. As possıveis amostras podem ter apenas um elemento repetido

k vezes, ou apenas dois elementos diferentes no total de k extracoes, ou apenas tres

diferentes, ou assim por diante, ate k elementos diferentes, nao-ordenados. O total de

amostras possıveis, neste caso, e igual a(k + n− 1

k

).

Veja a prova B.4.

O software Probabilidade com urnas, disponıveis no site do projeto Matematica Mul-

timıdia [10] trata de diversos tipos de amostragens, podendo ser utilizados como material

auxiliar com os alunos.

Para pensar: em um jogo de bingo, qual tipo de amostragem estamos realizando? e em

uma loteria?

Maos a obra. Exercıcios A.3.

3.4 Coeficientes multinomiais

Consideremos o conjunto D = d1, d2, . . . , dn com n elementos.

Observemos que uma combinacao de j elementos de D define uma particao de D, for-

mada por um conjunto A, contendo os j elementos da combinacao, e AC , contendo os

n− j elementos restantes.

Figura 3.4: Particao de um conjunto em dois subconjuntos, com cardinalidades j e n−j.

Page 17: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

14 Estruturas de contagem

Uma generalizacao natural deste conceito e o de particao de D em ate k subconjuntos

diferentes e disjuntos dois-a-dois, (A1, A2, . . . , Ak), com #Ai = ni ≥ 0, para todo i =

1, 2, . . . , k, tais que n1 + n2 + · · ·+ nk = n.

Figura 3.5: Particao de um conjunto em k subconjuntos, cada um com cardinalidade

nk.

O total de particoes possıveis de D em ate k subconjuntos, C(n;n1, n2, . . . , nk), e igual

a

C(n;n1, n2, . . . , nk) =n!

n1!n2! . . . nk!.

Veja a prova B.5.

Este numero e chamado coeficiente multinomial e e denotado tambem por(n

n1, n2, . . . , nk

).

Exemplo 1

Consideremos o conjunto T = 1, 2, . . . , kn. Os elementos de T sao vetores de compri-

mento n em que cada coordenada e um valor natural entre 1 e k, como por exemplo os

vetores

t = (1, 1, 2, 1, . . . , 1) t = (k, k, . . . , k) t = (k, 4, 5, k, 4, 5, . . . , 5), etc.

Para cada valor i ∈ 1, 2, . . . , k, denotemos por ni o total de vezes em que o valor i

aparece no vetor t.

Por exemplo, se n = 3 e k = 5, T e o conjunto de todos os vetores com tres coordenadas,

onde cada coordenada e um valor inteiro entre 1 e 5. Para o vetor t = (3, 3, 2), temos

que n1 = 0 = n4 = n5, ja que os valores 1, 4 e 5 nao aparecem no vetor, e n2 = 1 e

n3 = 2, ja que o valor 2 aparece uma vez e o valor 3 aparece duas vezes.

Com esta definicao, podemos perceber que a soma n1 +n2 + · · ·+nk deve ser igual a n,

que e o total de coordenadas do vetor t.

Page 18: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Coeficientes multinomiais 15

Entao, o total de sequencias em T tais que o valor i ocorre ni vezes, para i = 1, 2, . . . , k,

e igual a C(n;n1, n2, . . . , nk).

Veja a prova B.6.

Com este resultado, no exemplo anterior temos que o total de sequencias de 3 elementos

com um 2 e dois 3’s (e nenhum 1, 4 ou 5) e igual a

C(3; 0, 1, 2, 0, 0) =

(3

0, 1, 2, 0, 0

)=

3!

0! 1! 2! 0! 0!=

3 · 2 · 12

= 3,

que sao (3, 3, 2), (3, 2, 3), (2, 3, 3).

Exemplo 2

Consideremos n objetos de k tipos diferentes, k ≤ n, com ni elementos do tipo i, para

cada i = 1, 2, . . . , n.

Por exemplo, Joao tem 5 cadeiras, 2 azuis, 1 branca, 1 preta e 1 verde.

Admitindo que objetos de um mesmo tipo sao indistinguıveis entre si, entao o total de

permutacoes distinguıveis dos n objetos e igual a C(n;n1, n2, . . . , nk).

Observemos que cada permutacao distinguıvel destes objetos corresponde a um unico el-

emento T do Exemplo 1, e cada elemento de T define uma unica permutacao distinguıvel,

provando assim o resultado.

No exemplo das cadeiras, o Joao tem portanto C(5; 2, 1, 1, 1) = 120 formas diferentes de

colocar as cadeiras em linha.

Podemos verificar isto, contando da seguinte maneira: chamemos por 1, 2, 3, 4, 5 as

possıveis posicoes de cada cadeira.

As cadeiras azuis podem ser vizinhas nas posicoes 1-2, 2-3, 3-4, 4-5. Para cada uma

destas as outras 3 cadeiras podem se ordenar de 3!=6 formas diferentes.

Do mesmo modo, as cadeiras azuis podem estar a uma cadeira de distancia nas posicoes

1-3, 2-4, 3-5; a duas cadeiras de distancia, nas posicoes 1-4, 2-5; e totalmente afastadas

na posicao 1-5. Para cada uma destas possibilidade, temos 3! formas de ordenar as

restantes.

Finalmente, as cadeiras azuis podem ocupar cada uma dessas posicoes de duas maneiras

possıveis, trocando-as de lugar entre si.

Assim, temos 3!(4 + 3 + 2 + 1)2 = 120 possibilidades.

Maos a obra. Exercıcios A.3.

Page 19: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

16 Estruturas de contagem

Page 20: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Apendice A

Exercıcios

A.1 Conjuntos

1. Mostre que ∅ ⊂ A, para qualquer conjunto A.

2. Dados conjuntos A e B de um conjunto universo Ω, mostre que A∩B ⊂ A ⊂ A∪B.

3. Dado um subconjunto A de um conjunto universo Ω, mostre que A ∪ AC = Ω e

que A ∩AC = ∅.

4. (Leis de De Morgan) Dados dois conjuntos A e B, mostre que

(a) (A ∪B)C = AC ∩BC

(b) (A ∩B)C = AC ∪BC

5. Seja Ω = 1, 2, 3, 4× 1, 2, 3, 4, 5, 6. Este conjunto pode ser interpretado como o

conjunto de resultados do lancamento de uma dado de 4 faces e um dado de 6 faces.

Considere os conjuntos A = (x, y) ∈ Ω : x e par e B = (x, y) ∈ Ω : x+ y = 5.Liste os elementos de cada um dos conjuntos a seguir: A, B, A∪B, A∩B, A \B,

B \A.

6. Seja Ω = 0, 13. Este conjunto pode ser visto como o conjunto de resultados

de tres lancamentos de uma moeda (0 denota coroa e 1 denota cara). Defina os

conjuntos A = (s1, s2, s3) ∈ Ω : s2 = 1 e B = (s1, s2, s3) ∈ Ω : s1 +s2 +s3 = 2.Liste os elementos de cada um dos conjuntos a seguir: Ω, A, B, AC , BC , A ∪ B,

A ∩B, A \B, B \A.

7. Seja Ω = 0, 12, o conjunto de resultados em dois lancamentos de uma moeda.

Determine P(Ω).

Page 21: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

18 Exercıcios

8. Podemos denotar um conjunto de cartas de baralho como o conjunto produto

Ω = As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,Q,K × ♣,♥,♦,♠,

onde o primeiro elemento do par ordenado indica o valor da carta e o segundo

indica o naipe. Denotemos por A o conjunto de coracoes, e por B o conjunto de

cartas com personagens. Determine os conjuntos A ∪B, A ∩B, A \B, B \A.

9. * Considere a sequencia de conjuntos An = [0, 1 − 1/n], para n ∈ 1, 2, . . . .Determine

⋂An,

⋃An,

⋂ACn ,

⋃ACn .

Voltar 1.4.

A.2 Medida de Contagem

Considere os subconjuntos A,B,C,A1, A2, . . . , An ⊂ Ω, com Ω finito, para os seguintes

exercıcios.

Dica: antes de fazer as demonstracoes, construa pelo menos um exemplo, atribuindo

valores para as quantidades e conjuntos envolvidos.

1. Mostre que #AC = #Ω−#A.

2. Mostre que #(B \A) = #B −#(B ∩A).

3. Mostre que se A ⊂ B entao #(B \A) = #B −#A.

4. Suponha que Ω e um conjunto de sequencias de comprimento k, com elementos da

forma (x1, x2, . . . , xk). Mostre que se cada coordenada j tiver nj possıveis valores,

independentemente das demais coordenadas, entao

#Ω = n1 n2 . . . nk.

5. Mostre que se Ω tem n elementos, entao Ωk tem nk elementos.

6. Mostre que o numero de amostras ordenadas de k elementos que podem ser sele-

cionadas com reposicao de uma populacao de n objetos e igual a nk.

7. Mostre que o numero total de funcoes de um conjunto A com n elementos em um

conjunto B com m elementos e mn. Este resultado e uma motivacao para usar a

notacao BA para o conjunto de todas as funcoes de A em B.

Page 22: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Estruturas de contagem 19

8. Suponha que Ω tem n elementos. Mostre que o conjunto das partes de Ω tem 2n

elementos.

9. Um experimento consiste em lancar um dado comum de 6 faces, escolher uma

carta de um baralho e lancar uma moeda honesta. Quantos possıveis resultados

tem este experimento?

10. Uma moeda honesta e lancada 10 vezes, observando a sequencia de resultados.

Quantas sequencias possıveis ha? Quantas sequencias tem exatamente 3 caras?

11. Um experimento com dados e moedas consiste em lancar um dado e depois lancar a

moeda o numero de vezes mostrado no dado, observando a sequencia de resultados

da moeda. Quantos resultados possıveis existem? Quantos deles tem exatamente

duas caras?

Voltar 2.4.

A.3 Estruturas de contagem

Nos exercıcios abaixo, considere n,m, k inteiros nao negativos.

Dica: antes de fazer as demonstracoes, construa pelo menos um exemplo, atribuindo

valores para as quantidades envolvidas.

1. Mostre que(n0

)=(nn

)= 1.

2. Mostre que se n < k entao(nk

)= 0.

3. Utilizando argumento combinatorio, mostre que(n

k

)=

(n

n− k

),

ou seja, mostre que cada lado da igualdade representa uma forma diferente de

contar a mesma colecao. Dica: observe que ao selecionar um subconjunto de k

elementos de um conjunto de tamanho n, deixamos n−k elementos nao seleciona-

dos.

4. Utilizando um argumento combinatorio, mostre que(n

k

)=

(n− 1

k − 1

)+

(n− 1

k

).

Dica: fixe um elemento do conjunto, e conte o total de subconjuntos de tamanho k

que contem o elemento e o total de subconjuntos de tamanho k que nao o contem.

Page 23: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

20 Exercıcios

5. Utilizando um argumento combinatorio, mostre que

k

(n

k

)= n

(n− 1

k − 1

).

Dica: considere duas formas de escolher um comite de tamanho k de um grupo

de tamanho n; na primeira, o comite e escolhido e depois um chefe dentre os

escolhidos, e na segunda, um chefe e escolhido da populacao e entao k−1 membros

sao escolhidos do restante n− 1 membros da populacao.

6. Utilizando um argumento combinatorio, mostre que

k∑j=0

(n

j

)(m

k − j

)=

(n+m

k

).

Dica: considere duas formas de escolher um comite de tamanho k de um grupo de

tamanho n + m com n homens e m mulheres; conte o numero de comites com j

homens e k − j mulheres.

Voltar 3.2.

Amostras

1. Um lote contem 12 itens bons e 8 itens defeituosos. Uma amostra de 5 itens

e extraıda. Determine o total de amostras contendo exatamente 3 itens bons.

Considere cada um dos quatro tipos de amostragem definidos.

Voltar 3.3

Coeficientes multinomiais

1. Em uma corrida com 10 cavalos, os tres primeiros lugares sao anotados. Quantos

resultados possıveis existem?

2. Uma placa de carro tem 3 letras e 4 dıgitos. Determine o total de placas com

letras e dıgitos todos diferentes.

3. Quatro casais estao sentados em uma fileira com 8 cadeiras. Determine o total de

arranjos em que eles podem estar sentados. Determine o total de arranjos em que

eles podem estar sentados de modo que:

(a) os homens fiquem juntos e as mulheres fiquem juntas;

Page 24: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Estruturas de contagem 21

(b) os homens fiquem juntos;

(c) os casais fiquem juntos.

4. Refaca o exercıcio anterior, assumindo agora que os casais estao sentados em uma

mesa redonda.

5. Em uma estante ha 12 livros, dos quais 3 sao de fısica, 5 sao de matematica e 4

sao de historia. Determine o total de arranjos de modo que:

(a) nao ha restricao;

(b) os livros de mesmo tipo devem ficar juntos;

(c) os livros de matematica devem ficar juntos.

6. Determine o total de arranjos diferentes das letras de: probabilidade, arranjo.

7. Um clube tem 20 membros: 12 homens e 8 mulheres, com os quais e necessario

criar um comite de 6 pessoas. De quantas formas pode ser composto o comite se:

(a) nao ha restricao;

(b) o comite deve ter 4 mulheres e 2 homens;

(c) o comite deve ter pelo menos 2 mulheres e pelo menos 2 homens.

8. Em um grupo de 10 pessoas, todas elas se apertam as maos. Quantos apertos de

mao sao dados?

9. Suponha que 5 dados distinguıveis de 6 faces sao lancados e que a sequencia obtida

e observada. Determine o total de sequencias. Determine o total de sequencias

com todos os resultados diferentes.

10. Refaca o exercıcio anterior, assumindo que os dados sao identicos.

Voltar 3.4.

Page 25: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

22 Exercıcios

Page 26: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Apendice B

Demonstracoes

B.1 Desigualdade de Boole

Definamos os conjuntos B1 = A1 e Bi = Ai \ (A1 ∪ · · · ∪Ai−1) para i ∈ 1, 2, . . . , n.

Observe que os elementos de B2 sao os elementos de A2 que nao estao em A1. Do mesmo

modo, os elementos de B3 sao os elementos de A3 que nao estao nem em A1 nem em

A2, e assim por diante. A Figura B.1 mostra o caso para 3 conjuntos.

Figura B.1: Construcao da prova da desigualdade de Boole.

Page 27: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

24 Demonstracoes

Portanto, os conjuntos B1, B2, . . . , Bn sao disjuntos dois a dois e tem a mesma uniao

que A. (Prove estas afirmacoes formalmente dentro da teoria de conjuntos) Desta forma

#(∪Ai) = #(∪Bi).

Pela regra da adicao, #(∪Bi) =∑

#Bi.

Finalmente, como Bi ⊂ Ai, temos que

# (∪iAi) = # (∪iBi) =∑

#Bi ≤∑

#Ai,

como queriamos provar.

Voltar 2.2.

B.2 Desigualdade de Bonferroni

Aplique a desigualdade de Boole aos conjuntos AC1 , AC2 , . . . , A

Cn e use as leis de De

Morgan.

Voltar 2.2.

B.3 Formula de inclusao-exclusao

Observemos que podemos escrever A ∪ B como a uniao dos conjuntos disjuntos A e

B \A. Pela regra da adicao, chegamos ao resultado.

A generalizacao para n conjuntos segue o mesmo raciocınio.

Voltar 2.3.

B.4 Amostragem nao-ordenada com reposicao

Para sistematizar a contagem, denotemos por xj o total de vezes em que o j-esimo

elemento da populacao foi observado na amostra, para j = 1, . . . , n. Como observamos

uma amostra de tamanho k, temos que x1 + x2 + · · ·+ xn = k.

O total de amostras possıveis, corresponde portanto ao total de solucoes inteiras nao

negativas da equacao anterior.

Uma forma bonita de resolver este problema e via modelo de urnas e bolinhas. Consid-

eremos n urnas e k bolinhas, k < n, que serao dispostas aleatoriamente nas urnas. A

Page 28: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Coeficientes multinomiais 25

equacao anterior representa este problema, e uma solucao possıvel corresponde a uma

forma possıvel de preencher as urnas.

Denotemos as urnas por n+ 1 barras verticais |, indicando os limitantes das urnas. Os

espacos entre as barras indicam cada uma das n urnas. Denotemos as k bolinhas por k

sımbolos .

Por exemplo, a configuracao

| | | |

representa 3 urnas: a primeira esta vazia, a segunda tem 3 bolinha e a terceira tem uma

bolinha.

Queremos contar o numero de maneiras de dispor k sımbolos entre n+1 barras |. Como

a primeira e a ultima barras devem permanecer nos extremos (ja que as bolinhas nao

podem ficar fora das urnas), devemos considerar todas as combinacoes entre k sımbolos

entre n− 1 barras |.

Com isto, o total de amostras possıveis de k elementos de uma populacao com n ele-

mentos diferentes, sem ordem e com reposicao, e igual a(k + n− 1

k

).

Voltar 3.3.

B.5 Coeficientes multinomiais

Dado o conjunto D = d1, d2, . . . , dn com n elementos, consideremos uma permutacao

de todos os elementos

π(d1, d2, . . . , dn) = (dπ1 , dπ2 , . . . , dπn).

Dados n1, n2, . . . , nk inteiros nao-negativos tais que n1 + n2 + · · · + nk = n, definamos

o conjunto A1 como o conjunto formado pelo primeiros n1 elementos da permutacao

anterior. Definamos A2 como o conjunto formado pelo seguintes n2 elementos da per-

mutacao, e assim por diante, ate obter Ak definido como o conjunto formado pelo ultimos

nk elementos da permutacao. Se para algum i, ni = 0, definimos o conjunto Ai como o

conjunto vazio.

Desta forma, para cada uma das n! possıveis permutacoes, construımos os conjuntos

A1, A2, . . . , Ak da mesma maneira.

Page 29: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

26 Demonstracoes

Observemos que estes conjuntos sao disjuntos entre si e sua uniao corresponde ao con-

junto D, ja que todos os elementos aparecem na permutacao, e aparecem uma unica

vez. Em outras palavras, os conjuntos A1, A2, . . . , Ak definem uma particao de D.

Observemos tambem que qualquer permutacao envolvendo apenas os n1 primeiros ele-

mentos, define o mesmo conjunto A1; do mesmo modo, qualquer permutacao envolvendo

apenas os n2 elementos seguintes, define o mesmo conjunto A2, e assim por diante.

Sendo assim, dada uma pemutacao definindo os conjuntos A1, A2, . . . , Ak, temos

n1!n2! . . . nk!

permutacoes diferentes definindo os mesmos conjuntos A1, A2, . . . , Ak, que sao aquelas

que permutam apenas os elementos de cada conjunto entre si.

Portanto, o total de particoes diferentes de D e igual a n!/(n1!n2! . . . nk!), como que-

rıamos provar.

Voltar 3.4.

B.6 Coeficientes multinomiais - Exemplo 1

Para provar o resultado, consideremos um conjunto D = d1, d2, . . . , dn com n elemen-

tos.

Observemos que cada t ∈ T = 1, 2, . . . , kn define uma particao de D.

De fato, para cada vetor t = (t1, t2, . . . , tn) ∈ T , definamos os conjuntos A1, A2, . . . , Ak

de modo que o elemento di ∈ D pertenca ao conjunto Ati , dado pela coordenada i-esima

de t. Se o vetor t nao tiver nenhuma coordenada com valor igual a j ∈ 1, 2, . . . , k,entao Aj = ∅.

Esta relacao define biunivocamente cada particao de D a partir de t ∈ T . Portanto, o

total de elementos em T e igual ao total de particoes de D em ate k conjuntos.

Voltar 3.4.

Page 30: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Referencias Bibliograficas

[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)

Analise Combinatoria e Probabilidade. Editora SBM.

[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora

Edgard Blucher.

[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.

[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.

[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto

Euclides.

[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.

[7] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman

Co.

Paginas da internet

Em portugues

[8] ALEA, Accao Local de Estatıstica Aplicada, Portugal.

[9] Mais - Recursos Educacionais em Matematica, Brasil.

[10] Matematica Multimıdia, Unicamp.

Em ingles

[11] Historia da Matematica, Universidade de St. Andrews, Escocia.

[12] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.

Page 31: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Universidade Estadual de Campinas

Modulo III - D6

Analise Combinatoria, ProbabilidadeNocoes de Estatıstica

Tema 2 - Espacos de Probabilidade

Prof. Laura L. R. Rifo

- Novembro, 2010 -

Page 32: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Sumario

1 Experimentos aleatorios 1

1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Experimento composto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Amostragem como experimento . . . . . . . . . . . . . . . . . . . . . . . 3

Dados, moedas, baralhos e urnas . . . . . . . . . . . . . . . . . . . . . . 4

Confiabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Genetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Espaco amostral e eventos 7

2.1 Espaco amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Criando novos eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

A partir de mais de dois eventos . . . . . . . . . . . . . . . . . . . . . . 9

3 Variaveis aleatorias 11

3.1 Eventos induzidos por uma variavel aleatoria . . . . . . . . . . . . . . . 11

3.2 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Lancamentos de uma moeda . . . . . . . . . . . . . . . . . . . . . . . . . 13

Lancamentos de um dado . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Experimentos compostos . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Page 33: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

ii Sumario

4 Medida de probabilidade 17

4.1 Probabilidade como grau de informacao . . . . . . . . . . . . . . . . . . 17

4.2 Diversas interpretacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4.3 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4.4 Algumas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.5 Distribuicao de uma variavel aleatoria . . . . . . . . . . . . . . . . . . . 20

4.6 Distribuicao uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . 21

4.7 Distribuicoes discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.8 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 22

4.9 Moedas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Total de caras em n lancamentos uniformes . . . . . . . . . . . . . . . . 23

4.10 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.11 Distribuicao do maximo e do mınimo de variaveis uniformes . . . . . . . 25

5 Probabilidade condicional 27

5.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5.2 Regra do produto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5.3 Lei da probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5.4 Regra de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

6 Independencia 33

6.1 De dois eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

6.2 De uma colecao de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 34

6.3 De variaveis aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

6.4 Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Page 34: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Sumario iii

A Demonstracoes 39

A.1 Uniao de uma colecao de eventos . . . . . . . . . . . . . . . . . . . . . . 39

A.2 Intersecao de uma colecao de eventos . . . . . . . . . . . . . . . . . . . . 39

A.3 Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Page 35: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 1

Experimentos aleatorios

1.1 Introducao

A teoria de probabilidades se baseia na nocao de experimento aleatorio, ou seja, um

experimento cujo resultado nao e conhecido com certeza.

Esta nocao e bastante ampla: tudo o que nao conhecemos pode ser considerado um

experimento aleatorio, um experimento ou observacao que sera feita, ou que ja aconteceu

ou que esta acontecendo no momento.

A observacao sobre se havera chuva amanha ou nao, ou o resultado do proximo jogo de

nosso time pode ser considerado um experimento aleatorio. O numero de especies ma-

rinhas abaixo de uma certa profundidade ou o nıvel de poluicao em um certo ponto de

nossa cidade neste momento tambem pode ser considerado um experimento aleatorio,

ja que nao dispomos de instrumentos de medicao extremamente precisos. A data ou

lugar do surgimento de seres humanos ou o numero de troncos linguısticos existentes na

America do Sul em 1500, mesmo ja tendo ocorrido, podem ser considerados experimentos

aleatorios, e de fato, sao objeto de inumeros estudos antropologicos e arqueologicos.

Uma definicao completa de um experimento aleatorio requer uma definicao precisa do

que e que esta sendo observado no experimento, ou seja, uma definicao do que e de fato

um resultado possıvel.

Os exemplos anteriores sao chamados experimentos simples.

Page 36: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

2 Experimentos aleatorios

1.2 Experimento composto

Suponha que temos um experimento simples. A repeticao um certo numero de vezes

deste experimento simples pode ser visto como um novo experimento, chamado experi-

mento composto.

Inversamente, em muitos casos, podemos idealizar um experimento dado como uma

sequencia de subexperimentos simples.

Por exemplo, consideremos um experimento simples com apenas dois possıveis resulta-

dos, como a observacao da face obtida no lancamento de uma moeda. Repeticoes suces-

sivas deste tipo de experimento sao chamadas ensaios de Bernoulli, em homenagem ao

matematico Jacob Bernoulli (em ingles).

Se cada experimento simples tiver k possıveis resultados, como a observacao da face

obtida no lancamento de um dado de k faces, repeticoes deste experimento sao chamadas

ensaios multinomiais.

As repeticoes podem ser feitas de maneira independente ou com alguma forma de de-

pendencia entre si. Intuitivamente, as repeticoes sao independentes se o resultado de

qualquer uma delas nao entregar informacao sobre o resultado das demais repeticoes.

Maos a obra.

Exercıcios

1. Considere o experimento de lancar n moedas diferentes e observar o resultado de

cada moeda, adotando 1 para cara e 0 para coroa.

(a) Estabeleca um modelo probabilıstico para este experimento.

(b) Descreva o experimento como um experimento composto com repeticoes inde-

pendentes de um experimento simples, identificando o experimento simples.

(c) Descreva o experimento como uma amostragem com reposicao de uma popu-

lacao, identificando a populacao e o tamanho da amostra.

(d) Descreva o experimento como n ensaios de Bernoulli.

2. Refaca a questao anterior, considerando o experimento de lancar n dados diferen-

tes, cada um com k faces numeradas de 1 a k, observando o resultado de cada

dado. No item (d), troque ensaios de Bernoulli por ensaios multinomiais.

Page 37: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Aplicacoes 3

3. Considere o experimento de lancar um dado comum de 6 faces e entao lancar uma

moeda o numero de vezes obtido no dado, observando a sequencia de resultados da

moeda (1 para cara e 0 para coroa). Descreva o experimento como um experimento

composto, como etapas sucessivas de experimentos simples, identificando estes

experimentos simples. O applet Die-Coin simula este experimento para um dado,

com diversos pesos para cada face, e uma moeda com probabilidade p ∈ [0, 1] de

obter cara em um lancamento.

4. Considere o experimento de extrair n cartas de um baralho comum.

(a) Descreva o experimento como um experimento composto, com etapas depen-

dentes.

(b) Descreva o experimento como uma amostragem sem reposicao de uma popu-

lacao, identificando a populacao e o tamanho da amostra.

1.3 Aplicacoes

Amostragem

Na grande maioria dos estudos estatısticos, desejamos estudar uma populacao de inte-

resse: pessoas com uma certa caracterıstica (de uma certa cidade, ou com uma certa

doenca ou com uma certa faixa etaria, etc.), itens produzidos por uma fabrica, produtos

agropecuarios de uma certa regiao, por exemplo.

Em geral, queremos analisar diversas caracterısticas (numericas ou nao) desta populacao:

sexo, peso e pressao sanguınea de uma pessoa, tempo de vida util do item produzido,

quantidade de fertilizante, salinidade do solo e produtividade de uma plantacao de soja,

e assim por diante.

Analisar a populacao inteira pode ser custoso ou mesmo impossıvel: no exemplo dos

itens deverıamos testar TODA a producao para analisar a vida util, e claramente isto

nao faz sentido.

Desta forma, recorremos a uma amostra da populacao, observando as caracterısticas de

interesse em cada elemento da amostra, chamado unidade amostral.

Amostragem como experimento

Uma amostragem pode ser realizada basicamente de duas formas: com ou sem reposicao.

Na primeira, cada unidade amostral e devolvida a populacao antes de extrair a proxima,

Page 38: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

4 Experimentos aleatorios

de modo que um unico objeto pode aparecer diversas vezes na amostra. Na segunda

forma, sem reposicao, as unidades amostrais nao sao devolvidas a populacao durante a

amostragem.

Podemos imaginar o processo de amostragem como um experimento composto, baseado

na repeticao do experimento simples de extrair um unico objeto da populacao e observar

as caracterısticas de interesse.

Em uma amostragem com reposicao, as repeticoes podem ser consideradas indepen-

dentes, enquanto que em uma amostragem sem reposicao, o experimento consiste em

etapas dependentes entre si.

Dados, moedas, baralhos e urnas

Os experimentos classicos de observar a face obtida no lancamento de uma moeda ou

um dado, e na extracao de uma carta de um baralho ou de uma bolinha de uma urna,

por exemplo, permitem construir modelos matematicos simples para fenomenos reais

mais complexos.

No applet Coin Sample e possıvel simular uma sequencia de n lancamentos de uma

moeda com probabilidade p de obter cara em cada lancamento individual.

No applet Dice Sample temos um experimento analogo com dado de seis faces; clicando

no dado, e possıvel alterar as probabilidades de cada face, de acordo com seis modelos

possıveis.

Um baralho comum pode ser representado como o espaco produto

Ω = As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,Q,K × ♣,♥,♦,♠.

O applet Card simula uma extracao de n cartas de um baralho comum.

O software Probabilidade com urnas, do projeto Matematica Multimıdia [11], simula ex-

tracoes de bolinhas de uma urna, com ou sem reposicao, e apresenta o modelo conhecido

como urna de Polya.

Estes softwares estao disponıveis para serem utilizados por professores e alunos.

Confiabilidade

No modelo usual de estudos em confiabilidade, um sistema consiste em n componentes,

cada um deles ou funcionando bem ou com defeito.

Page 39: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Aplicacoes 5

O status de cada componente e desconhecido, e portanto define um experimento alea-

torio.

O funcionamento do sistema como um todo depende do status dos componentes e de

como eles estao conectados entre si. Por exemplo, um sistema em serie funciona se e

somente se todos os componentes estiverem funcionando, enquanto que um sistema em

paralelo funciona se e somente se pelo menos um componente estiver funcionando.

Figura 1.1: Diagrama de dois sistemas com n componentes: o de cima, em serie, o de

baixo, em paralelo.

Mais geralmente, um sistema k-de-n funciona se ao menos k componentes estiverem

funcionando.

O modelo definido acima e um modelo estatico. Podemos estender a definicao para um

modelo dinamico: inicialmente todas as componentes estao funcionando, mas em um

instante desconhecido (e portanto aleatorio) uma componente qualquer pode falhar. O

sistema como um todo tambem pode ter um instante de falha aleatorio que depende dos

tempos de falha das componentes e da estrutura do sistema, exigindo uma modelagem

matematica mais elaborada.

Para pensar: Considere o modelo de confiabilidade k-de-n. Quais valores de k represen-

tam um sistema em serie? E um sistema em paralelo?

Genetica

Em sistemas de reproducao sexuada, o material genetico dos descendentes e uma com-

binacao desconhecida (e portanto aleatoria) do material genetico dos pais. Em parti-

cular, o nascimento de um crianca pode ser considerado um experimento aleatorio com

relacao a resultados como cor dos olhos, do cabelo e outras caracterısticas possıveis. Em

medicina molecular, temos interesse por exemplo na transmissao de doencas geneticas.

Consideremos um modelo muito simples de uma caracterıstica hereditaria com dois

possıveis estados, como por exemplo uma planta de ervilha cuja vagem pode ser verde

Page 40: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

6 Experimentos aleatorios

ou amarela. Dado que uma planta recebe dois genes para a caracterıstica, os possıveis

genotipos sao: vv, dois genes verdes; va, um gene verde e outro amarelo, e aa, um gene

amarelo de cada pai.

Os genotipos vv e aa sao chamados homozigotos, e o genotipo va, heterozigoto. Em

muitos casos, um dos estados herdados e dominante e o outro recessivo. Se, por exemplo,

o verde for um estado dominante para a cor da vagem, entao uma planta com genotipo

vv ou va tera vagens verdes, e uma com genotipo aa tera vagens amarelas.

Figura 1.2: Diagrama de duas situacoes de possıveis genotipos: para os filhos, a esquerda,

e para os pais, a direita.

Conhecer os genes dos pais nao nos permite afirmar certamente qual sera o genotipo do

filho, ou inversamente, conhecendo o genotipo do filho, existem diversas possibilidades

para os genotipos dos pais (que, alias, sao analisadas em testes de paternidade). Desta

forma, podemos considerar o genotipo desconhecido como um experimento aleatorio.

Page 41: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 2

Espaco amostral e eventos

2.1 Espaco amostral

O espaco amostral de um experimento aleatorio e um conjunto Ω contendo todos os

possıveis resultados do experimento. Um elemento ω ∈ Ω e chamado evento elementar.

Para experimentos simples, o espaco amostral pode ser exatamente o conjunto de todos

os resultados possıveis, mas em modelos matematicos mais complexos, o espaco amostral

poderia conter mais elementos se for conveniente.

Por exemplo, se o experimento for lancar um dado e observar a face obtida, o espaco

amostral pode ser definido como Ω = 1, 2, 3, 4, 5, 6, mas se o experimento for medir

o peso de seu gato de estimacao, poderıamos definir como espaco amostral o intervalo

Ω = (0,∞), mesmo que a maioria de seus elementos seja praticamente impossıvel.

Se o resultado de um experimento entregar informacao sobre diversas variaveis, entao

o espaco amostral contem as sequencias de valores que poderiam ser observadas. Por

exemplo, se um experimento consiste em medir o peso, o comprimento do pelo e a

cor do seu gato de estimacao entao o espaco amostral e formado por vetores com tres

componentes indicando cada uma destas caracterısticas. Assim, um evento elementar

poderia ser o vetor (4kg, pelo medio, laranja e branco com manchas pretas).

Neste caso, se tivermos informacao sobre n variaveis entregue pelo experimento, podemos

considerar o espaco amostral como o produto cartesiano Ω1 × Ω2 × · · · × Ωn, onde Ωi e

o espaco amostral relacionado a i-esima variavel.

Analogamente, se tivermos n repeticoes de um mesmo experimento, com espaco amostral

Ω, entao Ωn e o espaco amostral natural para o experimento composto, ou seja, para o

experimento que consiste em n repeticoes do experimento original.

Page 42: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

8 Espaco amostral e eventos

Por exemplo, se considerarmos o experimento de lancar uma moeda 7 vezes, entao o

espaco amostral Ω consiste em todas as sequencias de caras e coroas, com 7 componentes.

Por outro lado, podemos ver este conjunto como o produto cartesiano do espaco amostral

mais simples, Ωi, consistindo de apenas dois elementos, cara e coroa. Denotando cara

por C e coroa por K, temos

Ω = CCCCCCC,CCCCCCK,CCCCCKC, . . . ,KKKKKKK= C,K × C,K × · · · × C,K = C,K7.

Ou seja, este conjunto tem 27 elementos.

Vemos neste exemplo que a forma de descrever um espaco amostral pode nos ajudar na

contagem de seus elementos.

2.2 Eventos

Chamamos evento qualquer conjunto observavel de possıveis resultados do experimento,

ou seja, qualquer subconjunto observavel do espaco amostral Ω.

Cada vez que o experimento e realizado, diremos que um evento A ocorre se o resultado

observado for um elemento de A, e diremos que nao ocorre se o resultado observado nao

for um elemento de A.

Em particular, sao eventos o proprio espaco amostral Ω, que por definicao e o evento

que sempre ocorre, e o conjunto vazio ∅, que por definicao e o evento que nunca ocorre.

No exemplo dos 7 lancamentos de uma moeda, um possıvel evento e “obter uma unica

cara”, definido pelo conjunto

A = CKKKKKK,KCKKKKK,KKCKKKK,KKKCKKK,

KKKKCKK,KKKKKCK,KKKKKKC.

Denotaremos por F o conjunto de todos os possıveis eventos associados ao experimento

aleatorio.

Maos a obra.

Exercıcios

1. Um experimento consiste em lancar um dado comum de 6 faces, ate aparecer face

3 ou 5. Seja A o evento em que a ultima face do experimento e 5 e nao 3. Defina

o espaco amostral Ω e descreva o evento A como subconjunto de Ω.

Page 43: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Criando novos eventos 9

2. Um experimento consiste em lancar dois dados comuns de 6 faces, ate que a soma

obtida seja 5 ou 7. Seja A o evento em que a soma e 5 e nao 7 no ultimo lancamento.

Suponha que sao registrados os pares obtidos em cada lancamento. Defina o espaco

amostral Ω e descreva o evento A como subconjunto de Ω.

3. No exercıcio anterior, suponha que apenas o ultimo par e registrado. Defina o

espaco amostral Ω e descreva o evento A como subconjunto de Ω.

2.3 Criando novos eventos

As propriedades e operacoes entre conjuntos, vistas na primeira parte do curso, permitem

descrever e contruir novos eventos a partir de eventos dados.

Dizemos que um evento ocorre em uma realizacao do experimento se for observado um

evento elementar pertencente ao evento.

Assim, por exemplo, dado um evento A, o evento AC e o evento que ocorre se e somente

se A nao ocorrer, ja que ω ∈ AC se e somente se ω /∈ A.

Do mesmo modo, dados os eventos A e B, o evento A ∪ B e o evento que ocorre se

pelo menos um dos eventos A ou B ocorrer, e A ∩B e o evento que ocorre se ambos os

eventos A e B ocorrerem.

Diremos que dois eventos A e B sao mutuamente exclusivos se eles nao puderem ocorrer

simultaneamente, ou seja, se A ∩B for o evento que nunca ocorre ∅.

Figura 2.1: Diagrama de dois eventos mutuamente exclusivos.

A partir de mais de dois eventos

Esta definicao continua valida para a uniao e a intersecao de mais de dois eventos. Dados

os eventos A1, A2, . . . , An, ∪Ai e o evento que ocorre se pelo menos um dos eventos

Page 44: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

10 Espaco amostral e eventos

ocorrer, e ∩Ai e o evento que ocorre se todos os eventos ocorrerem. Formalmente,

ω ∈ ∪ni=1Ai se e somente se ω ∈ Ai, para algum i ∈ 1, 2, . . . , n,

ω ∈ ∩ni=1Ai se e somente se ω ∈ Ai, para todo i ∈ 1, 2, . . . , n.

Consideremos uma colecao enumeravel de eventos A = A1, A2, . . . de um experimento

aleatorio.

A uniao desta colecao ∪A e o evento que ocorre se e somente se pelo menos um evento

da colecao ocorrer. Veja a prova A.1.

Analogamente, a intersecao desta colecao ∩A e o evento que ocorre se e somente se todos

os eventos da colecao ocorrerem. Veja a prova A.2.

Por exemplo, se os Ai’s forem os intervalos [0,1], [0,1/2], [0,1/3], etc, entao, ∪A = [0, 1]

e ∩A = 0.

Maos a obra.

Exercıcios

Nos exercıcios seguintes, assuma que A e B sao eventos.

1. Mostre que A ⊂ B se e somente se a ocorrencia do evento A implica a ocorrencia

do evento B.

2. Mostre que A \B e o evento que ocorre se e somente se A ocorre e B nao ocorre.

3. Mostre que (A∩BC)∪ (AC ∩B) e o evento que ocorre se e somente se exatamente

um entre A e B ocorrer. Este evento e chamado a diferenca simetrica entre A e

B, e e denotado por A4B.

4. Mostre que (A ∩ B) ∪ (A ∪ B)C e o evento que ocorre se e somente se ou ambos

ou nenhum dos eventos A ou B ocorrerem.

5. Mostre em um diagrama de Euler-Venn todos os 16 eventos que podem ser cons-

truıdos a partir de A e B.

6. Considere o experimento de dois lancamentos de um dado comum de 6 faces.

Sejam Ω o espaco amostral, A o evento de que o resultado do primeiro lancamento

e igual a 1, e B o evento de que a soma dos dois resultados obtidos e igual a 7.

Descreva todos os elementos de: Ω, A, B, A ∪B, A ∩B, A \B, AC ∩BC .

Page 45: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 3

Variaveis aleatorias

Consideremos um experimento aleatorio com espaco amostral Ω.

Em muitos casos, estamos interessados em caracterısticas numericas associadas a um

resultado ω ∈ Ω.

Uma funcao real definida em Ω, X : Ω→ R, e chamada variavel aleatoria. Denotaremos

estas funcoes usualmente por letras maiusculas da segunda metade do alfabeto.

Uma variavel aleatoria em si pode tambem ser considerada um experimento aleatorio,

ja que seu valor (desconhecido) depende do resultado (desconhecido) do experimento.

Inversamente, se os resultados de um experimento forem valores numericos, entao o

resultado pode ser considerado uma variavel aleatoria.

Exemplo: Considere o experimento de lancar um dado e observar a face obtida. O

espaco amostral e um subconjunto real, Ω = 1, 2, 3, 4, 5, 6. Portanto a funcao X que

indica a face observada e uma variavel aleatoria, como na Figura 3.1.

Exemplo: Considere o experimento de lancar uma moeda 2 vezes e observar a sequencia

das faces obtidas. A funcao real X que indica o numero de caras de uma sequencia

observada e uma variavel aleatoria.

Quando o experimento e realizado e observamos o resultado ω, a variavel aleatoria

assume o valor X(ω) = x. Denotaremos por χ o conjunto dos possıveis valores assumidos

por X.

3.1 Eventos induzidos por uma variavel aleatoria

Denotemos por A o conjunto de eventos em Ω e por B o conjunto de eventos em R.

Page 46: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

12 Variaveis aleatorias

Figura 3.1: Diagrama de uma funcao (variavel aleatoria) X entre os conjuntos Ω e R.

Dado um evento B ∈ B, denotaremos por (X ∈ B) o conjunto imagem inversa de B, ou

seja,

(X ∈ B) = ω ∈ Ω : X(ω) ∈ B

e o conjunto de resultados do experimento que tem a caracterıstica X com valor em B.

Dois casos particulares importantes desta notacao sao os eventos em Ω

(X = x) = ω ∈ Ω : X(ω) = x,

o conjunto de resultados do experimento com caracterıstica X exatamente igual a x, e

(X ≤ x) = ω ∈ Ω : X(ω) ≤ x,

o conjunto de resultados do experimento com caracterıstica X menor ou igual a x.

Exemplo. No exemplo dos 2 lancamentos de uma moeda, o evento (X = 1) e o conjunto

de sequencias em Ω que apresentam uma unica cara,

(X = 1) = CK,KC,

onde C denota cara e K coroa. O evento (X ≤ 1) e o conjunto de sequencias em Ω que

apresentam no maximo uma cara,

(X ≤ 1) = KK,CK,KC.

Maos a obra.

Exercıcios

Assuma que X e uma variavel aleatoria e que A e B sao eventos em R. As seguintes

afirmacoes trabalham com o conjunto imagem inversa e sua preservacao por operacoes

de conjuntos. Prove os resultados.

Page 47: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Aplicacoes 13

1. (X ∈ A ∪B) = (X ∈ A) ∪ (X ∈ B)

2. (X ∈ A ∩B) = (X ∈ A) ∩ (X ∈ B)

3. (X ∈ A \B) = (X ∈ A) \ (X ∈ B)

4. Se A e B sao disjuntos entao (X ∈ A) e (X ∈ B) tambem sao.

5. 1A∩B = 1A1B = min1A, 1B

6. 1A∪B = 1− (1− 1A)(1− 1B) = max1A, 1B

7. 1A\B = 1A(1− 1B)

8. 1AC = 1− 1A

9. A ⊂ B se e somente se 1A ≤ 1B.

3.2 Aplicacoes

Os exemplos que veremos geralmente tratarao de problemas com moedas e dados, por sua

relativa simplicidade matematica. No entanto, nao devemos esquecer que estes modelos

podem ser vistos como uma primeira resolucao para problemas reais mais complexos.

Lancamentos de uma moeda

Um experimento basico com moedas e o de n lancamentos sucessivos de uma moeda,

obtendo como resultado do experimento uma sequencia X = (X1, X2, . . . , Xn) de zeros

e uns, onde 0 denota coroa e 1 denota cara, por exemplo. Esta notacao e util, ja que

permite obter algumas caracterısticas do experimento de maneira rapida. Por exemplo,

se quisermos o total de caras obtidas nos n lancamentos, digamos S, basta observar que

S = X1 +X2 + · · ·+Xn, e se quisermos o total de coroas, basta obter n− S.

O applet Coin Sample realiza este experimento, permitindo ver um padrao nas respostas

obtidas. Por exemplo, selecione n = 6 lancamentos com p = 0, 5, o que indica que voce

lancara 6 vezes uma moeda balanceada (com mesma chance de obter cara ou coroa em

um lancamento qualquer). Rode o programa vinte vezes, e veja quantas vezes ocorreu o

evento (S = 2). Depois selecione outros valores de p e veja o que ocorre com a frequencia

deste evento ao repetir o experimento varias vezes.

Um experimento deste tipo, com repeticao de experimentos, cada um tendo apenas dois

possıveis resultados, e chamado uma sequencia de ensaios de Bernoulli.

Page 48: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

14 Variaveis aleatorias

Lancamentos de um dado

Uma generalizacao natural e considerar n lancamentos de um dado de k lados (que

pode ser visto como uma moeda com k faces). Este tipo de experimento e chamado uma

sequencia de ensaios multinomiais. O caso especial de k = 6 corresponde a um dado

comum de 6 faces.

O applet Dice Sample realiza este experimento com um dado de 6 faces, permitindo ver

algum padrao nas respostas obtidas. Por exemplo, selecione n = 2 e rode o programa

diversas vezes. O que ocorre com a frequencia do evento A =“o resultado do primeiro

lancamento e par”?

O experimento Jogo dos Divisores, construıdo pelo projeto Matematica Multimıdia [11],

define funcoes numericas a partir das faces obtidas no lancamento de um dado comum.

Experimentos compostos

Consideremos agora o experimento em dois estagios dado-moeda: lancamos um dado

e depois lancamos uma moeda o total de vezes que foi obtido no dado. Registramos a

sequencia X de resultados da moeda. Seja N a variavel aleatoria que denota o valor

obtido no dado e S o total de caras obtidas nos lancamentos da moeda.

Figura 3.2: Experimento de lancar um dado e uma moeda.

Determine o espaco amostral Ω e #Ω. Expresse N e S como funcoes definidas em Ω.

Liste os elementos do evento (S = 5).

Resposta:

Ω = 1, 0, 11, 10, 01, 00, 111, 110, 101, 011, 100, 010, 001, 000, 1111, . . . , 000000 tem

#Ω = 2 + 22 + 23 + 24 + 25 + 26 = 126

Page 49: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Aplicacoes 15

elementos. A variavel aleatoria N e a funcao

N(1) = N(0) = 1

N(11) = N(10) = N(01) = N(00) = 2

N(111) = N(110) = N(101) = N(011) = · · · = N(000) = 3

N(1111) = N(1110) = N(1101) = N(1011) = · · · = N(0000) = 4

...

N(111111) = N(111110) = · · · = N(000000) = 6

e S e

S(0) = S(00) = S(000) = S(0000) = S(00000) = S(000000) = 0

S(1) = S(10) = S(01) = S(100) = S(010) = · · · = S(000001) = 1

S(11) = S(110) = S(101) = S(011) = · · · = S(000011) = 2

S(111) = S(1110) = S(1101) = S(1011) = · · · = S(000111) = 3

...

S(111111) = 6

O evento (S = 5) e descrito como o conjunto

(S = 5) = 11111, 111110, 111101, 111011, 110111, 101111, 011111.

Maos a obra.

Exercıcios

1. Considere o experimento de lancar uma moeda n = 4 vezes, observando a sequencia

de resultados, e seja Y o numero de caras obtidas.

(a) Descreva o espaco amostral Ω, listando todos os seus elementos.

(b) Descreva o evento (Y = k), para todo k possıvel.

(c) Quantos elementos tem o evento (Y = k)?

2. Considere o experimento anterior no caso geral de n lancamentos. Quantos ele-

mentos tem o espaco amostral? Quantos elementos tem o evento (Y = k), para

cada k = 0, 1, . . . , n?

Page 50: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

16 Variaveis aleatorias

3. Considere o experimento de n = 2 lancamentos de um dado comum de 6 faces.

Sejam Y a variavel aleatoria que indica a soma obtida nos dois lancamentos, U a

variavel aleatoria que indica o menor resultado e V o maior resultado obtidos nos

dois lancamentos. Expresse cada uma destas variaveis aleatorias como uma funcao

do espaco amostral Ω e determine o conjunto de possıveis valores. Determine o

conjunto de possıveis valores de (U, V ).

4. No contexto do exercıcio anterior, denote por X1 o resultado do primeiro lanca-

mento e por X2, o resultado do segundo. Descreva os elementos dos seguintes

eventos como subconjuntos do espaco amostral Ω:

(a) (X1 < 3, X2 > 4);

(b) (Y = 7);

(c) (U = 2);

(d) (V = 5);

(e) (U = V − 1).

5. Suponha que 3 dados comuns de 6 faces sao lancados e que o resultado de cada

um (X1, X2, X3) e registrado. Uma pessoa paga $1 para lancar os dados e recebe

$1 por cada 6 que aparecer no lancamento. Seja W o lucro dessa pessoa em

uma realizacao do experimento. Descreva o espaco amostral Ω do experimento e

expresse W como funcao definida em Ω.

Page 51: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 4

Medida de probabilidade

4.1 Probabilidade como grau de informacao

Dependendo do grau de informacao do observador, e possıvel ter diversos graus de

precisao sobre os possıveis resultados de um experimento aleatorio. Um antropologo,

mesmo nao sabendo exatamente, deve ter uma ideia mais precisa a respeito do numero de

troncos linguısticos na America do Sul em 1500 do que alguem que nao tem informacao

especializada a respeito.

Este grau de informacao pode ser quantificado no que definiremos como funcao de pro-

babilidade. Da discussao anterior, na maioria dos casos reais, observadores diferentes

terao informacoes diferentes a respeito do fenomeno estudado, e portanto funcoes de

probabilidade diferentes. Em alguns casos teoricos, no entanto, e possıvel que haja con-

senso entre diversos observadores, levando assim a uma mesma funcao de probabilidade

para o problema estudado.

Qualquer que seja o caso, a probabilidade de um resultado reflete um grau de certeza a

respeito da ocorrencia desse resultado.

4.2 Diversas interpretacoes

Historicamente, encontramos basicamente duas interpretacoes para o conceito de pro-

babilidade.

A mais antiga e a chamada interpretacao frequentista, baseada na suposicao de que o

experimento pode ser repetido indefinidamente sob as mesmas condicoes. Neste caso, a

Page 52: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

18 Medida de probabilidade

probabilidade de um evento e proporcional ao limite da frequencia observada do evento

nas repeticoes.

A segunda e a chamada interpretacao subjetivista, baseada no conhecimento ou grau

de informacao do observador a respeito dos possıveis resultados do experimento. Se o

experimento nao for repetıvel (como e o caso da maioria das situacoes na pratica), a

interpretacao frequentista fica sem sentido, e utilizamos naturalmente toda nossa in-

formacao para atribuir probabilidade a um evento de interesse.

A interpretacao frequentista pode ser vista como um caso particular da subjetivista, ja

que um observador poderia achar razoavel atribuir para um evento uma probabilidade

igual ao limite da frequencia se o experimento pudesse ser repetido.

Independentemente da interpretacao, uma definicao completa de uma probabilidade

requer uma definicao precisa do espaco amostral e do conjunto de eventos possıveis.

O processo de atribuir uma funcao de probabilidade aos resultados de um experimento

aleatorio e o que chamamos de modelagem probabilıstica ou estocastica.

O vıdeo BrasilxArgentina mostra uma aplicacao da teoria subjetivista em teoria de

decisao.

4.3 Definicao

Consideremos um experimento aleatorio com espaco amostral Ω e conjunto de eventos

F .

Uma medida de probabilidade P em Ω e uma funcao real com domınio F , P : F → R,

satisfazendo as seguintes propriedades:

P1 P (A) ≥ 0 para todo evento A ∈ F .

P2 P (Ω) = 1.

P3 Dada uma colecao contavel de eventos A1, A2, . . . , disjuntos dois a dois, entao

P (∪iAi) =∑i

P (Ai).

Estas propriedades sao chamadas axiomas de Kolmogorov, em homenagem ao matemati-

co russo Andrei Kolmogorov. A terceira propriedade e conhecida como a propriedade de

aditividade contavel, e afirma que a probabilidade de uma colecao finita ou enumeravel

de eventos mutuamente exclusivos e igual a soma de suas probabilidades.

Page 53: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Algumas desigualdades 19

As propriedades P1 e P2 sao uma convencao na qual decidimos medir a probabilidade

de um evento como um numero entre 0 e 1; mas a propriedade P3 e fundamental, e

analoga as demais forma de medir o “tamanho” de um conjunto: via cardinalidade de

conjuntos finitos, comprimento de intervalos reais, area de subconjuntos em R2, e volume

de subconjuntos em R3, por exemplo.

Maos a obra.

Exercıcios

Suponha que temos um experimento aleatorio com espaco amostral Ω e uma medida

de probabilidade P . Nos seguintes exercıcios, A e B sao eventos. Prove os seguintes

resultados usando os axiomas de Kolmogorov.

1. Regra do complementar. P (AC) = 1− P (A).

2. P (∅) = 0.

3. Regra da diferenca. P (B \A) = P (B)− P (A ∩B).

4. Se A ⊂ B entao P (B \A) = P (B)− P (A).

5. A probabilidade e uma funcao crescente relativa a ordem parcial dos conjuntos.

Se A ⊂ B entao P (A) ≤ P (B). Em particular, P (A) ≤ 1 para todo evento A.

6. Suponha que A ⊂ B.

(a) Se P (B) = 0 entao P (A) = 0.

(b) Se P (A) = 1 entao P (B) = 1.

7. Se P (A) = 0 entao P (A ∪B) = P (B).

8. Se P (A) = 1 entao P (A ∩B) = P (B).

4.4 Algumas desigualdades

Para os seguintes resultados, suponha que Ai : i ∈ I e uma colecao enumeravel de

eventos em Ω.

Page 54: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

20 Medida de probabilidade

Desigualdade de Boole

P (∪i∈IAi) ≤∑i∈I

P (Ai).

Veja a prova A.3.

Desigualdade de Bonferroni

P (∩i∈IAi) ≥ 1−∑i∈I

(1− P (Ai)).

A prova e feita aplicando a desigualdade de Boole a colecao ACi : i ∈ I.

Maos a obra.

Exercıcios

1. Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos com P (Ai) = 0,

para i ∈ I. Use a desigualdade de Boole para mostrar que P (∪iAi) = 0.

Um evento A com P (A) = 0 e dito um evento nulo. Desta forma, a uniao enu-

meravel de eventos nulos e um evento nulo.

2. Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos com P (Ai) = 1,

para todo i ∈ I. Use a desigualdade de Bonferroni para mostrar que P (∩iAi) = 0.

Um evento A com P (A) = 1 e dito um evento quase certo. Desta forma, a

intersecao enumeravel de eventos quase certos e um evento quase certo.

4.5 Distribuicao de uma variavel aleatoria

A terna (Ω,F , P ) definida na secao anterior e chamada espaco de probabilidade e e o

que devemos definir para modelar um experimento aleatorio.

Suponha que X e uma variavel aleatoria definida em Ω, onde (Ω,F , P ) define um espaco

de probabilidade.

Entao a funcao PX definida por

PX(B) = P (X ∈ B) = P (ω ∈ Ω : X(ω) ∈ B)

e uma medida de probabilidade em R. Este resultado sai diretamente das propriedades

da imagem inversa ja estudadas.

Page 55: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Distribuicao uniforme discreta 21

A funcao PX e chamada distribuicao de probabilidade de X.

Desta forma, uma variavel aleatoria define um novo espaco de probabilidade em R,

(R,B, PX).

4.6 Distribuicao uniforme discreta

Suponhamos que Ω e um conjunto finito e nao-vazio. A distribuicao uniforme em Ω e

definida como

P (A) =#A

#Ω, A ⊂ Ω,

e e particularmente importante em experimentos amostrais e combinatorios, como os

definidos anteriormente.

Basicamente, se tivermos um espaco amostral finito, a distribuicao uniforme atribui aos

eventos de Ω uma probabilidade proporcional ao seu numero de elementos. Daqui a

importancia de construir formas eficientes de contagem.

Observemos que, neste caso, a probabilidade de cada resultado elementar e a mesma.

4.7 Distribuicoes discretas

Se Ω for um conjunto discreto e nao-vazio, podemos definir uma probabilidade em Adefinindo a probabilidade de todos os eventos elementares, P (ω), para ω ∈ Ω, que

denotaremos simplesmente por P (ω).

De fato, neste caso, temos que

P (A) =∑ω∈A

P (ω).

Generalizando esta ideia, se tivermos um particao enumeravel de Ω, Ai, i ∈ I, entao

podemos escrever

P (B) =∑i∈I

P (B ∩Ai).

Esta igualdade e conhecida como Lei da Probabilidade Total, e e util quando as proba-

bilidades das intersecoes sao conhecidas.

Estas particoes usualmente aparecem quando lidamos com variaveis aleatorias discretas,

que definem uma particao natural com os eventos da forma (X = x). Se X assumir

Page 56: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

22 Medida de probabilidade

Figura 4.1: Lei da Probabilidade Total.

valores apenas em um conjunto enumeravel χ ⊂ R, entao

P (A) =∑x∈χ

P (A ∩ (X = x)) =:∑x∈χ

P (A,X = x).

4.8 Formula de inclusao-exclusao

A formula de inclusao-exclusao vista para a medida de contagem se aplica tambem a

medidas de probabilidade, e a demonstracao e muito similar.

Dados tres eventos A,B,C, temos que

P (A ∪B) = P (A) + P (B)− P (A ∩B),

e

P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B∩C)+P (A∩B∩C).

Em geral, dados A1, A2, . . . , An, temos que

P (∪Ai) =n∑i=1

P (Ai)−∑

1≤i<j≤nP (Ai ∩Aj) + · · ·+ (−1)n−1P (A1 ∩A2 ∩ · · · ∩An).

Maos a obra.

Exercıcios

Nos seguintes exercıcios, assuma que A,B,C sao eventos de um espaco amostral Ω.

1. Prove a formula de inclusao-exclusao.

2. Suponha que P (A) = 1/3, P (B) = 1/4, P (A ∩B) = 1/10. Expresse cada um dos

seguintes eventos em linguagem de experimentos e determine sua probabilidade:

A \B, A ∪B, AC ∪BC , AC ∩BC , A ∪BC .

Page 57: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Moedas 23

3. Suponha que P (A) = 0.3, P (B) = 0.2, P (C) = 0.4, P (A∩B) = 0.04, P (A∩C) =

0.1, P (B∩C) = 0.1, P (A∩B∩C) = 0.01. Expresse cada um dos seguintes eventos

em notacao de conjuntos e determine sua probabilidade:

(a) pelo menos um dos tres eventos ocorre;

(b) nenhum dos tres eventos ocorre;

(c) exatamente um dos tres eventos ocorre;

(d) exatamente dois dos tres eventos ocorrem.

4.9 Moedas

Consideremos o experimento de lancamento de uma moeda n vezes, observando a

sequencia de resultados obtidos X = (X1, . . . Xn), onde 1 denota cara e 0 denota coroa.

Figura 4.2: Resultado X do experimento “6 lancamentos de uma moeda”.

No experimento Coin, selecione n = 2 moedas e rode o experimento 50 vezes, atua-

lizando a tabela depois de cada rodada. Determine a frequencia dos eventos A =“o

primeiro lancamento e cara” e B =“os dois lancamentos sao cara”.

Total de caras em n lancamentos uniformes

Definamos a variavel aleatoria Y como o total de caras obtidas em n lancamentos de

uma moeda. Observemos que o espaco amostral do experimento e χ = 0, 1n.

Se assumirmos que a probabilidade de obter cara em cada lancamento e a mesma de

obter coroa, entao cada resultado elementar tem a mesma probabilidade de ocorrer,

ou seja, X tem distribuicao uniforme em χ. Como temos 2n resultados, cada um tem

probabilidade 1/2n = (1/2)n.

O evento (Y = k) consiste em todos os valores de X com exatamente k caras. Pelo ja

visto, temos um total de(nk

)possibilidades de ordenar as k caras em n lancamentos.

Portanto,

P (Y = k) =

(n

k

)(1

2

)n,

Page 58: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

24 Medida de probabilidade

para todo k ∈ 0, 1, . . . , n.

O vıdeo Noite de forro mostra uma aplicacao destas distribuicoes.

Maos a obra.

Exercıcios

1. Considere o experimento de lancar uma moeda balanceada 3 vezes. Seja A o

evento “o primeiro lancamento e cara” e B, o evento “exatamente dois lancamentos

resultam em cara”. Para cada um dos eventos seguintes, liste seus elementos e

determine sua probabilidade: A, B, A ∩B, A ∪B, AC ∪BC , AC ∩BC , A ∪BC .

2. Considere o experimento de lancar uma moeda balanceada 4 vezes, e denote por

Y o total de caras observadas. Liste os elementos do evento (Y = k), para cada k

possıvel, e determine a probabilidade do evento.

4.10 Dados

Considere o experimento de lancar n vezes um dado de k faces, com faces numeradas

de 1 a k, registrando a sequencia de resultados X = (X1, X2, . . . , Xn). O caso k = 6

corresponde ao dado comum.

Figura 4.3: Resultado X do experimento “6 lancamentos de um dado”.

Se assumirmos que cada face tem a mesma probabilidade de ser observada em cada

lancamento, entao todos os kn valores possıveis de X tem a mesma probabilidade, 1/kn.

No experimento Dice, selecione n = 2 dados e rode o experimento 50 vezes, atualizando

a tabela depois de cada rodada. Determine a frequencia dos eventos A =“o primeiro

lancamento e menor que 3” e B =“a soma dos dois lancamentos e 6”.

Page 59: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Distribuicao do maximo e do mınimo de variaveis uniformes 25

4.11 Distribuicao do maximo e do mınimo de variaveis uni-

formes

Considere o experimento de lancar n vezes um dado de k faces igualmente provaveis, e

definamos as variaveis aleatorias U igual ao mınimo valor obtido nos n lancamentos e

V igual ao maximo valor.

Claramente, U e V podem assumir qualquer valor entre 1 e k. Obteremos a distribuicao

de U para n = 2 e k = 6. As provas do caso geral e da distribuicao de V sao analogas.

Observemos que (U = 6) ocorre somente se ambos os lancamentos forem 6. Como temos

um total de 62 = 36 possibilidades, entao P (U = 6) = 1/36. Para os demais casos, a

Tabela 4.1 mostra todos os possıveis resultados dos dois lancamentos e o valor de U em

cada caso.

(D1, D2) 1 2 3 4 5 6

1 1 1 1 1 1 1

2 1 2 2 2 2 2

3 1 2 3 3 3 3

4 1 2 3 4 4 4

5 1 2 3 4 5 5

6 1 2 3 4 5 6

Tabela 4.1: Possıveis resultados do mınimo de dois lancamentos de um dado.

Sendo assim, para determinar a probabilidade do evento (U = k) basta contar o total

de resultados cujo mınimo e igual a k.

O software Explorando o Jogo do Maximo trabalha com a simulacao de V para dois

dados.

Page 60: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

26 Medida de probabilidade

Page 61: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 5

Probabilidade condicional

5.1 Definicao

Como antes, consideremos o esquema basico de um experimento aleatorio, um espaco

amostral Ω, um conjunto de eventos F e uma medida de probabilidade P .

Assumamos que um evento B tenha ocorrido. Usualmente, esta informacao altera a

probabilidade atribuıda a outros eventos. De fato, um outro evento A pode ocorrer se e

somente se A∩B pode ocorrer. Assim, a probabilidade de A, assumindo que B ocorreu,

deve ser proporcional a P (A ∩B).

Em particular, P (Ω) deve ser proporcional a P (Ω ∩B) = P (B).

Dado um evento B com P (B) > 0, definimos a probabilidade condicional dado B como

a funcao que a cada evento A ∈ F atribui o valor P (A|B) igual a

P (A|B) =P (A ∩B)

P (B).

A funcao P (A|B) e uma medida de probabilidade e tem, portanto, todas as propriedades

vistas no capıtulo anterior.

Os experimentos Jogo da trilha e Jogo das amebas mostram uma aplicacao de probabil-

idades condicionais para mais de dois eventos.

Maos a obra.

Exercıcios

Prove as seguintes afirmacoes, assumindo que A,B sao eventos com P (B) > 0.

Page 62: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

28 Probabilidade condicional

1. A funcao P (A|B) e uma medida de probabilidade.

2. Se B ⊂ A entao P (A|B) = 1.

3. Se A ⊂ B entao P (A|B) = P (A)/P (B).

4. Se A e B forem disjuntos entao P (A|B) = 0.

5. Suponha que A tambem tem probabilidade positiva.

(a) P (A|B) > P (A) se e so se P (B|A) > P (B) se e so se P (A∩B) > P (A)P (B).

Neste caso, dizemos que A e B sao eventos positivamente correlacionados.

(b) P (A|B) < P (A) se e so se P (B|A) < P (B) se e so se P (A∩B) < P (A)P (B).

Neste caso, dizemos que A e B sao eventos negativamente correlacionados.

(c) P (A|B) = P (A) se e so se P (B|A) = P (B) se e so se P (A∩B) = P (A)P (B).

Neste caso, dizemos que A e B sao eventos nao correlacionados ou indepen-

dentes: intuitivamente, a ocorrencia de um dos eventos nao altera a proba-

bilidade do outro evento.

6. A e B tem a mesma correlacao que AC e BC .

5.2 Regra do produto

Eventualmente, podemos quantificar probabilidades condicionais de maneira simples e

usa-las para determinar a probabilidade de um evento.

Dados os eventos A e B,

P (A ∩B) = P (A)P (A|B),

e, mais geralmente, dados os eventos A1, A2, . . . , An,

P (A1 ∩A2 ∩ · · · ∩An) = P (A1)P (A2|A1) . . . P (An|A1 ∩A2 ∩ · · · ∩An−1).

Esta e chamada a regra do produto, e e particularmente util para experimentos que

consistem de etapas dependentes, com Ai um evento relacionado a etapa i.

5.3 Lei da probabilidade total

Com a regra do produto, podemos reescrever a Lei da Probabilidade Total como

P (B) =∑i∈I

P (Ai)P (B|Ai),

Page 63: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Lei da probabilidade total 29

onde Ai : i ∈ I e uma particao de Ω.

Este resultado e util quando conhecemos as probabilidades dos eventos da particao,

P (Ai), e as probabilidades condicionais, P (B|Ai), e com isso podemos determinar P (B)

por partes.

Maos a obra.

Exercıcios

1. Suponha que A,B sao eventos com P (A) = 1/3, P (B) = 1/4, P (A ∩ B) = 1/10.

Determine: P (A|B), P (B|A), P (AC |B), P (BC |A), P (AC |BC).

2. Suponha que A,B,C sao eventos com P (A|C) = 1/2, P (B|C) = 1/3, P (A ∩B|C) = 1/4. Determine: P (A \B|C), P (A ∪B|C), P (AC ∩BC |C).

3. Suponha que A,B sao eventos com P (A) = 1/2, P (B) = 1/3, P (A ∩ B) =

3/4. Determine: P (A ∩ B), P (A ∪ B), P (B|A), P (AC ∪ B); A e B sao positiva,

negativamente correlacionados ou nao correlacionados?

4. Uma empresa tem 200 funcionarios: 120 mulheres e 80 homens. Das 120 fun-

cionarias, 30 sao gerentes, enquanto que 20 dos 80 funcionarios sao gerentes. Se-

lecionando um funcionario, determine a probabilidade de que:

(a) seja mulher;

(b) seja gerente;

(c) seja gerente, dado que e mulher;

(d) seja mulher, dado que e gerente.

As caracterısticas mulher e gerente sao correlacionadas? como?

5. Considere o experimento de lancar 2 dados e observar o resultado obtido X =

(X1, X2) em cada dado. Assuma que os dados sao equilibrados e que os lancamen-

tos nao favorecem nenhuma face. Defina Y como a soma dos resultados. Para cada

par de eventos a seguir, determine a probabilidade de cada evento, a probabilidade

condicional de um evento dado o outro, e que tipo de correlacao eles apresentam.

(a) X1 = 3, Y = 5;

(b) X1 = 3, Y = 7;

(c) X1 = 2, Y = 5;

Page 64: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

30 Probabilidade condicional

(d) X1 = 3, X1 = 2.

6. Simule o exercıcio anterior no applet Dice, selecionando n = 2.

7. Considere novamente o exercıcio anterior, e defina U como o resultado mınimo e

V como o resultado maximo. Determine:

(a) P (U = u|V = 4), para os valores possıveis de u;

(b) P (Y = y|V = 4), para os valores possıveis de y;

(c) P (V = v|Y = 8), para os valores possıveis de v;

(d) P (U = u|Y = 8), para os valores possıveis de u;

(e) P (X1 = x1, X2 = x2|Y = 8), para os valores possıveis de (x1, x2).

5.4 Regra de Bayes

Seja Ai : i ∈ I uma particao de Ω e B um evento. Da regra do produto, dado j ∈ I,

podemos escrever P (Aj |B) como

P (Aj ∩B) = P (Aj)P (B|Aj).

Pela Lei da Probabilidade Total obtemos entao

P (Aj |B) =P (Aj ∩B)

P (B)=

P (Aj)P (B|Aj)∑i∈I P (Ai)P (B|Ai)

,

conhecida como a Regra de Bayes.

Este resultado nos permite atualizar a probabilidade dos eventos Ai, apos saber ou

supor que B ocorreu. E comumente utilizada para atualizar a probabilidade dos diversos

modelos considerados para uma populacao apos obter informacao de uma amostra da

mesma.

Os vıdeos Teste de gravidez e Crime da rua do Gasometro apresentam duas situacoes

em que a regra de Bayes pode ser aplicada.

Maos a obra.

Exercıcios

1. Considere o experimento dado-moeda de lancar um dado e depois uma moeda o

numero de vezes que aparece no dado. Seja N o resultado do dado e C o evento de

que todos os lancamentos da moeda resultam em cara. Determine: P (C), P (N =

Page 65: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Regra de Bayes 31

n|C) para n ∈ 1, 2, 3, 4, 5, 6, compare estes resultados com P (N = n) para

n ∈ 1, 2, 3, 4, 5, 6, dizendo como os eventos C e (N = n)estao correlacionados.

2. Simule o exercıcio anterior no applet Die-Coin, comparando as frequencias obser-

vadas com as probabilidades calculadas no item anterior.

3. Uma bolsa contem 12 moedas indistinguıveis: 5 moedas equilibradas, 4 moedas

viesadas com probabilidade de cara igual a 1/3, e 3 moedas com duas caras. Uma

moeda e selecionada e lancada. Qual e a probabilidade de obter cara? Se o

resultado fosse cara, qual e a probabilidade condicional de cada tipo de moeda?

4. Considere o experimento moeda-dado, no qual uma moeda e lancada. Se o re-

sultado for coroa, lancamos um dado balanceado; se for cara, lancamos um dado

as-seis (as faces 1 e 6 tem probabilidade 1/4 cada uma, e as demais, 1/8 cada).

Seja H o evento de obter cara, e seja Y o resultado obtido no dado. Assumindo

que a moeda e balanceada, determine:

(a) P (Y = y) para y ∈ 1, 2, 3, 4, 5, 6;

(b) P (H|Y = y) para y ∈ 1, 2, 3, 4, 5, 6;

(c) compare as probabilidades do item anterior com P (H), indicando o tipo de

correlacao entre os eventos H e (Y = y).

(d) Simule o exercıcio anterior no applet Coin-Die, comparando as frequencias

observadas com as probabilidades calculadas no item anterior.

5. Uma fabrica tem 3 linhas de montagem para produzir chips de memoria. A linha

1 produz 50% dos chips, com uma taxa de defeituosos de 4%; a linha 2 produz

30% dos chips, com uma taxa de defeituosos de 5%; a linha 3 produz 20% dos

chips, com uma taxa de defeituosos de 1%. Ao selecionar um chip, determine a

probabilidade de que o chip seja defeituoso. Determine a probabilidade condicional

de cada linha se o chip for defeituoso.

6. Em uma populacao, composta igualmente por homens e mulheres, 10% dos homens

sao daltonicos, enquanto que apenas 1% das mulheres o sao. Determine a pro-

porcao de daltonicos na populacao, e a proporcao de daltonicos que sao homens.

Page 66: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

32 Probabilidade condicional

Page 67: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 6

Independencia

6.1 De dois eventos

Como antes, suponhamos que temos um experimento aleatorio com espaco amostral Ω,

conjunto de eventos F e medida de probabilidade P .

Independencia e um dos conceitos fundamentais em teoria de probabilidade, e utilizado

como suposicao para uma ampla gama de modelos.

Dados dois eventos A,B, dizemos que eles sao independentes se

P (A ∩B) = P (A)P (B).

Se ambos os eventos tiverem probabilidade positiva, entao independencia e equivalente

a

P (A|B) = P (A) e P (B|A) = P (B).

Desta forma, fica evidenciado que dois eventos sao independentes se ao assumir que um

deles ocorre, a probabilidade do outro ocorrer nao e alterada.

Maos a obra.

Exercıcios

1. Suponha que A,B sao eventos disjuntos, ambos com probabilidade positiva. Mos-

tre que P (A ∩ B) = 0, mas que P (A)P (B) > 0. Portanto, A e B nao sao

independentes, mais ainda, eles sao negativamente correlacionados (se um dele

ocorrer, o outro nao pode ocorrer).

2. Suponha que A,B sao eventos independentes. Mostre que tambem sao indepen-

dentes: AC e B, B e AC , AC e BC .

Page 68: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

34 Independencia

6.2 De uma colecao de eventos

Consideremos uma colecao A = Ai : i ∈ I de eventos. Dizemos que eles sao indepen-

dentes se para qualquer subcolecao finita A1, A2, . . . , Ak ⊂ A,

P (

k⋂i=1

Ai) =

k∏i=1

P (Ai).

Esta definicao de independencia e muito mais geral do que uma simples independencia

dois a dois; todas as colecoes finitas de Ai’s devem ser independentes, dois a dois, tres

a tres, etc. Os exercıcios dao exemplos desta diferenca.

Maos a obra.

Exercıcios

1. Descreva todas as condicoes para que A,B,C sejam eventos independentes.

2. Suponha que A,B,C sao eventos independentes. Mostre que os eventos A∪BC e

C tambem sao independentes.

3. Suponha que A1, A2, . . . , An e uma colecao finita de eventos independentes.

Mostre que

P (n⋃i=1

Ai) = 1−n∏i=1

(1− p(Ai)).

4. Suponha que A,B,C sao eventos independentes com P (A) = 0.3, P (B) = 0.5,

P (C) = 0.8. Expresse cada um dos seguintes eventos em notacao de conjuntos e

determine sua probabilidade:

(a) todos os tres eventos ocorrem;

(b) nenhum dos tres eventos ocorre;

(c) ao menos um dos tres eventos ocorre;

(d) exatamente um dos tres eventos ocorre;

(e) exatamente dois dos tres eventos ocorrem.

5. Suponha que A,B,C sao eventos independentes com P (A) = 1/2, P (B) = 1/3,

P (C) = 1/4. Determine a probabilidade dos seguintes eventos: (A ∩ B) ∪ C,

A ∪BC ∪ C, (AC ∩BC) ∪ CC .

Page 69: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

De variaveis aleatorias 35

6.3 De variaveis aleatorias

Suponha que X1 e X2 sao variaveis aleatorias. Intuitivamente, duas variaveis aleatorias

sao independentes se o conhecimento do valor de uma delas nao altera a distribuicao de

probabilidade da outra variavel.

Formalmente, X1 e X2 sao variaveis aleatorias independentes se as colecoes de eventos

(X1 ∈ B) : B ∈ B e (X2 ∈ B) : B ∈ B

forem independentes, ou equivalentemente, se para cada escolha B1, B2 ∈ B, tivermos

que

P (X1 ∈ B1, X2 ∈ B2) = P (X1 ∈ B1)P (X2 ∈ B2).

Generalizando a definicao anterior, dizemos que uma sequencia de variaveis aleatorias

X1, X2, . . . e independente se qualquer subcolecao finita delas for independente.

Suponhamos que temos um experimento basico no qual observamos a variavel X0. Por

definicao, o resultado do experimento que consiste em repeticoes independentes do exper-

imento basico e uma sequencia de variaveis aleatorias independentes X = (X1, X2, . . . ),

cada uma com a mesma distribuicao de probabilidade que X0.

6.4 Ensaios de Bernoulli

Um sequencia de ensaios de Bernoulli e uma sequencia X = (X1, X2, . . . ) de variaveis

independentes identicamente distribuıdas, onde cada variavel pode assumir apenas os

valores 0 ou 1. Da terminologia de teoria da confiabilidade, usualmente chamamos o

resultado 1 de sucesso e o 0 de fracasso.

Um exemplo usual e o de sucessivos lancamentos de uma moeda nao necessariamente

balanceada, ou de repeticoes de um experimento basico no qual temos interesse em saber

se um evento A ocorre ou nao.

Este processo tem um unico parametro p = P (Xi = 1) que determina completamente o

modelo probabilıstico.

Para este modelo, temos

P (X1 = x1, X2 = x2, . . . , Xn = xn) = px1+x2+···+xn(1− p)n−(x1+x2+···+xn),

para xi ∈ 0, 1, i ∈ 1, 2, . . . , n.

Page 70: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

36 Independencia

Observemos que esta sequencia de variaveis e permutavel, ou seja, se permutarmos a

sequencia (x1, x2, . . . , xn), a probabilidade nao muda.

Maos a obra.

Exercıcios

1. Seja X = (X1, X2, . . . ) uma sequencia de ensaios de Bernoulli. Mostre que

P (X1 = x1, X2 = x2, . . . , Xn = xn) = px1+x2+···+xn(1− p)n−(x1+x2+···+xn),

para xi ∈ 0, 1, i ∈ 1, 2, . . . , n.

2. Seja Y o total de sucessos nas n primeiras tentativas. Mostre que

P (Y = k) =

(n

k

)pk(1− p)n−k,

para k ∈ 0, 1, . . . , n. A distribuicao de Y e chamada distribuicao binomial com

parametros n e p.

3. Considere o experimento de lancar 2 dados balanceados de seis faces e observar

a sequencia obtida. Seja A o evento de obter 3 no primeiro dado, B o evento de

obter 4 no segundo dado e C o de que a soma seja 7.

(a) Mostre que os eventos A,B,C sao independentes dois a dois.

(b) Mostre que A ∩B implica C e que portanto eles sao dependentes.

4. No applet Dice Sample, selecione n = 2 e rode o experimento 500 vezes. Para

cada par de eventos no exercıcio anterior, determine o produto das frequencias

observadas e a frequencia observada da intersecao. Compare os resultados com o

valor teorico.

5. Considere o experimento de lancar um dado balanceado e observar a face obtida,

e os eventos A = 1, 2, 3, 4 e B = C = 4, 5, 6. Mostre que P (A ∩ B ∩ C) =

P (A)P (B)P (C), mas que B e C sao dependentes.

6. Um dado balanceado e lancado 4 vezes. Determine a probabilidade de que: 6 nao

ocorra; 6 ocorra pelo menos uma vez; a soma dos dois primeiros resultados seja 5

e a soma dos dois ultimos resultados seja 7.

7. Uma moeda com probabilidade de cara igual a 1/3 e lancada 5 vezes. Seja X o

resultado dos lancamentos (em 0’s e 1’s) e Y o total de caras. Determine:

Page 71: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Ensaios de Bernoulli 37

(a) P (X = x) para cada x ∈ 0, 15;

(b) P (Y = k) para cada k ∈ 0, 1, 2, 3, 4, 5;

(c) P (1 ≤ Y ≤ 3).

Page 72: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

38 Independencia

Page 73: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Apendice A

Demonstracoes

A.1 Uniao de uma colecao de eventos

Dada uma colecao enumeravel de eventos A = A1, A2, . . . , a uniao ∪A e o evento que

ocorre se e somente se pelo menos um evento da colecao ocorrer.

De fato, consideremos uma realizacao do experimento, con resultado observado ω.

Entao, ∪A ocorre se e somente se ω ∈ ∪A. Isto significa que ω ∈ Ai, para algum i ∈ I,

que e equivalente a afirmar que Ai ocorre, para algum i ∈ I.

A.2 Intersecao de uma colecao de eventos

Dada uma colecao enumeravel de eventos A = A1, A2, . . . , a intersecao ∩A e o evento

que ocorre se e somente se todos os eventos da colecao ocorrerem.

De fato, consideremos o evento complementar (∩iAi)C = ∪iACi . Pela afirmacao anterior,

∪iACi ocorre se e somente se pelo menos um evento ACi ocorrer, ou seja, se pelo menos

um evento Ai nao ocorrer.

Assim ∩iAi = (∪iACi )C ocorre se e somente se nenhum dos eventos ACi ocorrer, ou seja,

se todos os eventos Ai ocorrerem.

A.3 Desigualdade de Boole

Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos em Ω.

Page 74: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

40 Demonstracoes

Consideremos inicialmente o caso em que I e um conjunto finito, ou seja, podemos

considerar I = 1, 2, . . . n.

Definamos os eventos B1 = A1 e Bi = Ai \ (A1 ∪ · · · ∪Ai−1) para i ∈ 2, . . . , n, como

feito no Tema 1.

Portanto, os conjuntos B1, B2, . . . , Bn sao disjuntos dois a dois e tem a mesma uniao

que A. Desta forma P (∪Ai) = P (∪Bi).

Pelo axioma de aditividade, P (∪Bi) =∑PBi.

Finalmente, como Bi ⊂ Ai e P e uma funcao crescente, temos que

P (∪iAi) = P (∪iBi) =∑i

P (Bi) ≤∑i

P (Ai),

como querıamos provar.

O caso nao finito e demonstrado usando o Princıpio de Inducao Finita e o argumento

anterior para os conjuntos ∪ni=1Ai e An+1.

Voltar 4.4.

Page 75: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Referencias Bibliograficas

[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)

Analise Combinatoria e Probabilidade. Editora SBM.

[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora

Edgard Blucher.

[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.

[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.

[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto

Euclides.

[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.

[7] Revista do Professor de Matematica. SBM.

[8] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman

Co.

Paginas da internet

Em portugues

[9] ALEA, Accao Local de Estatıstica Aplicada, Portugal.

[10] Mais - Recursos Educacionais em Matematica, Brasil.

[11] Matematica Multimıdia, Unicamp.

Em ingles

[12] Historia da Matematica, Universidade de St. Andrews, Escocia.

[13] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.

Page 76: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Universidade Estadual de Campinas

Modulo III - D6

Analise Combinatoria, ProbabilidadeNocoes de Estatıstica

Tema 3 - Nocoes de Estatıstica

Prof. Laura L. R. Rifo

- Janeiro, 2011 -

Page 77: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Sumario

1 Estatıstica e o metodo cientıfico 1

1.1 O metodo cientıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Estatıstica como aprendizagem . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Estudo sobre a malaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Amostragem, populacao e previsoes . . . . . . . . . . . . . . . . . . . . . 5

2 Representando dados 7

2.1 Grafico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Grafico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3 Grafico de setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4 Tabela de frequencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.5 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.6 Diagrama de ramo-e-folhas . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.7 Outros graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Serie temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Grafico radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Cartogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 Resumindo dados 21

3.1 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.2 Desvio-padrao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3 Relacao entre media e desvio-padrao . . . . . . . . . . . . . . . . . . . . 23

Page 78: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

ii Sumario

3.4 Medianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.5 Outros quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.6 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Elementos de Amostragem 27

4.1 Amostragem aleatoria simples . . . . . . . . . . . . . . . . . . . . . . . . 28

4.2 Amostragem estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.3 Amostragem por conglomerado . . . . . . . . . . . . . . . . . . . . . . . 29

4.4 Amostragem sistematica 1-em-k . . . . . . . . . . . . . . . . . . . . . . . 30

Page 79: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 1

Estatıstica e o metodo cientıfico

Esta parte do curso pretende apresentar ferramentas que permitam analisar criticamente

informacoes como as que recebemos diariamente dos meios de comunicacao.

Figura 1.1:

As inferencias obtidas a partir dos dados sao estatısticas, e tem essencialmente duas

caracterısticas: e possıvel obter evidencias por meio de experimentos ou observacoes, e

as conclusoes obtidas envolvem um grau de incerteza.

A experimentacao e a quantificacao da incerteza sao fundamentais em ciencia. Os cien-

tistas aprendem usando o metodo cientıfico. Mas cientistas diferentes usam diferentes

metodologias, e algumas delas nao tao cientıficas assim. E importante portanto ter uma

definicao precisa do que significa o metodo cientıfico.

Page 80: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

2 Estatıstica e o metodo cientıfico

1.1 O metodo cientıfico

De acordo com o fısico Stephen Hawking, o objetivo fundamental da ciencia e entregar

uma descricao completa do universo em que vivemos. Os cientistas tentam alcancar este

objetivo contruindo teorias cientıficas e verificando as predicoes destas teorias. Hawking

nao ve a ciencia como uma forma de aproximar a realidade (seja la o que possa ser

realidade), mas como uma forma de pensar sobre a realidade. Este ponto de vista e o

que sera adotado nesta abordagem.

Uma teoria cientıfica pode ser vista como um modelo do universo, ou de uma parte

dele, e um conjunto de regras relacionando caracterısticas do modelo a observacoes que

podemos fazer.

Por exemplo, “a terra e redonda” e uma teoria cientıfica. Aristoteles e outros cien-

tistas da Grecia Antiga usaram o metodo cientıfico para verificar esta teoria, fazendo

observacoes e comparando-as com as previsoes da teoria. Primeiro, se a terra fosse re-

donda, ela deveria deixar sempre uma sombra redonda sobre a lua durante um eclipse

lunar (e isto ocorre), enquanto que se ela fosse um disco plano, a imagem seria as vezes

elıptica. Segundo, se a terra fosse redonda a estrela do Norte deveria aparecer cada vez

mais baixa no ceu quando vista de mais ao sul (isto acontece). Terceiro, se a terra fosse

redonda os mastros dos navios se aproximando deveriam aparecer antes que seus cascos

(e isto tambem acontece).

Estendendo o procedimento anterior, o metodo cientıfico e um processo que envolve

idealizar experimentos e atualizar o conhecimento usando a evidencia dos experimentos.

Experimentos melhores sao mais informativos. Mas experimentos sao caros, com custos

envolvendo tempo, dinheiro e recursos em geral. Estes custos, mesmo parecendo estar

separados da metodologia, eles sao centrais na metodologia e devem ser considerados

explicitamente.

Neste contexto, os metodos estatısticos entregam ferramentas matematicas que per-

mitem otimizar este processo.

Basicamente, podemos identificar os seguintes estagios:

1. Formulacao de uma hipotese, que tera certas consequencias

2. Amostragem ou coleta de dados

3. Resumo, representacao grafica e comparacao dos dados obtidos com o que seria de

se esperar de acordo com a hipotese estabelecida

Page 81: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Estatıstica como aprendizagem 3

4. Aceitacao ou rejeicao da hipotese. No caso de rejeicao, formulacao de uma nova

hipotese. No caso de aceitacao, manter a hipotese ate que novas amostras determinem

sua rejeicao.

Figura 1.2: Diagrama do metodo de aprendizagem.

Estas etapas formam um ciclo iterativo entre o avanco teorico (hipotese) e os procedi-

mentos de obtencao de dados.

A formulacao das hipoteses esta relacionada ao levantamento de possıveis respostas para

um problema especıfico.

Ao coletar dados, estamos interessados em obter informacao que permita manter a

validade de uma hipotese ou que entregue evidencias suficientes para rejeita-la e entao

formular novas hipoteses, que serao testadas com uma nova coleta de dados e assim por

diante.

A estatıstica tem um papel fundamental no planejamento e na obtencao de conclusoes

de experimentos.

1.2 Estatıstica como aprendizagem

A palavra estatıstica tem varios significados. Tecnicamente, estatısticas sao numeros

que resumem os resultados de um estudo. No singular, estatıstica e uma disciplina

cientıfica que estuda a forma em que as pessoas aprendem quando obtem informacoes,

respondendo a questao: o que este estudo significa?

Aprender e apenas uma parte da estatıstica. Outra parte do pensamento estatıstico

consiste em usar o que se aprendeu, por exemplo, guiando o processo de tomada de

decisoes, usando a informacao disponıvel.

Page 82: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

4 Estatıstica e o metodo cientıfico

E importante levar em conta que o mesmo conjunto de dados pode levar a diferentes

conclusoes dependendo de outras informacoes disponıveis.

As duas partes principais do processo de aprendizagem sao o planejamento de experi-

mentos (que dados devem ser coletados e de que maneira?) e a analise dos dados do

experimento (como aprendemos dos dados coletados?).

Aprender de uma informacao numerica nao e um processo intuitivo; as vezes damos

credibilidade demais a uma poucas informacoes, mas, por outro lado, com muitas in-

formacoes, o processo de aprendizagem e mais difıcil.

Ao coletar informacoes, usualmente obtemos valores diferentes. A variabilidade nao

invalida os resultados do experimento, mas e importante saber reconhece-la e como

lidar com ela.

Precisamos tambem de um formalismo para incorporar os resultados obtidos em um

experimento a informacao que ja temos, permitindo assim descrever o conhecimento

disponıvel em um momento dado. Este conhecimento pode ser transformado em in-

ferencias, decisoes e planejamento de novos experimentos.

O problema de decidir entre diversas acoes possıveis ocorre nos negocios, medicina,

ciencia, e nas diversas situacoes do cotidiano. A decisao apropriada depende dos nossos

objetivos, dos custos das diversas consequencias de nossa escolha, e do nosso estado de

conhecimento sobre quais serao as consequencias.

1.3 Estudo sobre a malaria

Nos anos 50, foi realizado um estudo para determinar se portadores do gene de um certo

tipo de anemia (drepanocitose) eram mais resistentes a malaria do que nao-portadores.

Este tipo de anemia e mais comum em pessoas negras, de modo que foram recrutadas

30 pessoas negras voluntarias, das quais 15 eram portadores do gene e 15 nao eram.

Os 30 voluntarios foram injetados com malaria, sendo que 14 dos 15 nao-portadores

contraıram a doenca contra apenas 2 dos portadores.

Antes de continuar a analise, observemos que este estudo e altamente questionavel em

termos de custos: o estudo e claramente anti-etico. Das 30 pessoas expostas a doenca

com o proposito de obter informacao, 16 contraıram a doenca. Este e um alto preco

pela informacao.

O pensamento estatıstico mostra como usar a informacao obtida para concluir se porta-

dores do gene sao ou nao mais resistentes a malaria, ajudando a expressar este conheci-

Page 83: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Amostragem, populacao e previsoes 5

mento adquirido.

Mas estatıstica nao e simplesmente um apanhado de tecnicas para analisar dados. Por

exemplo, suponha que cada um dos 30 indivıduos do estudo anterior lancasse uma

moeda, tentando adivinhar qual face seria obtida, e que o resultado fosse que 14 dos

15 nao-portadores e 2 dos 15 portadores adivinhassem. Os dados seriam os mesmos,

mas eu nao comecaria a acreditar que nao-portadores tem mais dom de adivinhacao que

portadores.

As conclusoes seriam diferentes ao levar em conta o contexto em que os dados foram

coletados. A analise do contexto, ou seja, o entendimento do problema analisado, e

tambem importante.

1.4 Amostragem, populacao e previsoes

Uma tecnica comumente utilizada em estatıstica para estudar uma populacao e a rea-

lizacao de uma amostragem da populacao: escolhemos alguns indivıduos da populacao

a fim de mensurar as caracterısticas de interesse nesses indivıduos, para depois tirar

conclusoes para a populacao completa.

Figura 1.3: Uma amostra e uma colecao de informacoes.

Uma das perguntas em um processo de amostragem e se a amostra obtida e realmente

representativa da populacao, ou seja, se o que observamos na amostra e semelhante ao

que ocorre na populacao, em termos das perguntas que devem ser respondidas.

O conjunto de todas as possıveis observacoes (reais ou imaginadas) e chamado uma

populacao. Uma populacao pode ser finita ou infinita.

No experimento “Quantos peixes ha no lago?”, o objetivo e a realizacao de um processo

de amostragem para estimar o tamanho de uma populacao.

Page 84: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

6 Estatıstica e o metodo cientıfico

Um problema tıpico de estatıstica envolve tirar conclusoes sobre alguma caracterıstica

da populacao a partir de uma amostra da populacao. Estas conclusoes podem levar a

tomada de decisoes baseadas na amostra.

As inferencias estatısticas extrapolam as informacoes de uma amostra para a populacao

que esta sendo amostrada.

Um tipo particular de inferencia e obter conclusoes ou previsoes para uma proxima

observacao (ou conjunto de informacoes) da populacao. As previsoes nao sao especıficas,

como “a proxima observacao sera 7”, mas estao sujeitas tambem a incertezas. A analise

destas incertezas tambem faz parte do metodo estatıstico.

O vıdeo Sem discriminacao aborda o problema de analisis precipitadas levarem a con-

clusoes incorretas com um caso real ocorrido em universidade nos anos 70, nos Estados

Unidos.

Page 85: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 2

Representando dados

Um dos objetivos centrais da estatıstica e a formalizacao do processo de aprendizagem

sobre uma populacao de interesse atraves de uma amostra da populacao.

O primeiro passo deste processo consiste na apresentacao e resumo da informacao

amostral.

Figura 2.1: Descricao de dados.

Reportar a informacao contida nos dados e um exercıcio de comunicacao: a forma de

graficar um conjunto de dados pode ser mais importante que as palavras que o acom-

panham. Aqui veremos alguns graficos basicos, mas cada problema tem suas particu-

laridades: em um problema especıfico voce poderia precisar criar seu proprio tipo de

grafico.

Alguns princıpios que devem ser seguidos ao construir um grafico sao:

1. ele deve ser entendıvel, agradavel de ver e nao complicado em excesso;

2. deve entregar toda a informacao possıvel (sem comprometer o item 1);

Page 86: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

8 Representando dados

3. os aspectos do experimento ou dos dados que nao aparecem no grafico devem estar

explicados claramente na legenda.

O vıdeo 200 paıses, 200 anos em 4 minutos do Prof. Hans Rosling mostra uma forma

diferente e muito clara de mostrar alguns dados de saude mundial. Estes dados rela-

cionam renda per capita media (em dolares) com expectativa media de vida (em anos)

para todos os paıses do mundo e sua evolucao nos ultimos 200 anos. Vale a pena ver.

Exercıcio

Considere o seguinte conjunto de dados referentes ao peso, em kg, de uma turma de 92

alunos:

homens: 63.5, 65.5, 72.5, 85.5, 69, 74, 68, 85.5, 87, 62, 72.5, 69, 68.5, 65.5, 76.5, 79, 79,

76.5, 81, 62, 76.5, 70, 59, 83, 85.5, 69, 76.5, 69, 96, 68, 65.5, 69, 69, 68, 69, 68, 81, 72.5,

62, 72.5, 59, 69, 68, 65.5, 69, 68, 63.5, 81, 85.5, 65.5, 68, 74, 63.5, 65, 62, 55.4, 68

mulheres: 63.5, 54.5, 59, 62, 54.5, 56.5, 52, 65, 68, 50.5, 56.5, 59, 54.5, 59, 59, 54.5, 52,

56.5, 62, 56.5, 52, 55, 52, 46, 52, 68, 49.5, 52, 48.5, 43, 56.5, 59, 49.5, 68, 48.5

Registre estes dados em uma tabela com duas colunas: a primeira coluna indicando o

genero do aluno (M/F) e a segunda, com o peso (em kg) do aluno. Voce deve obter 92

linhas, referentes a cada aluno da amostra, com 57 homens e 35 mulheres.

2.1 Grafico de pontos

Um grafico de pontos e a forma mais simples de apresentar dados numericos. Cada

observacao e representada por um ponto colocado sobre uma reta, mostrando a posicao

relativa entre as observacoes.

Exemplo. Para encontrar a viscosidade da dimetilanilina a 20C, sao obtidas a se-

guintes mensuracoes: 146, 154, 141, 140, 136, 132, 147, 140, 147, 139, 140, 140 (em

centipoises ou cP). Os dados apresentam esta variabilidade porque nao ha controle de

todos os fatores que afetam a medicao (precisao de instrumento de medicao, expertise

da pessoa que realiza a mensuracao, etc). O grafico de pontos destes dados aparece na

Figura 2.2.

Neste grafico, cada ponto representa uma mensuracao, portanto para dados repetidos,

podemos colocar os pontos empilhados, como no exemplo. Podemos usar sımbolos (pon-

tos) menores se houver um grande numero de dados. Observemos que os extremos sao

Page 87: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Grafico de pontos 9

Figura 2.2: Grafico de pontos para os dados de viscosidade (em cP).

facilmente visıveis neste grafico, e que as mensuracoes estao concentradas proximas a

140cP.

Uma questao tıpica em ciencias e se ha relacao entre duas mensuracoes. O grafico de

pontos pode ser util para comparar mensuracoes em diferentes grupos.

Exemplo. Em uma entrevista feita com 97 estudantes, foram coletados dados sobre

seu consumo de cafeına (em mg) estimado a partir do consumo diario de cafe, cha e

outras bebidas contendo cafeına, e seu consumo de bebidas alcolicas (em doses). Os

pesquisadores queriam saber se havia alguma relacao entre as variaveis, classificando a

quantidade de doses nas categorias 0, 1-2, 3-5, 6+. Os resultados sao os mostrados na

Tabela 2.1.

Os dados da tabela podem ser graficados como na Figura 2.3. Em cada linha, temos

uma das categorias de consumo de bebida alcolica. Os pontos representam cada um

dos entrevistados e o tamanho do ponto representa o total de entrevistados na mesma

categoria com mesmo consumo de cafeına diaria.

Podemos perceber que de acordo com os dados coletados nao ha evidencias de algum

tipo de relacao entre o consumo diario de cafeına e consumo de alcool.

O grafico de pontos e adequado quando as observacoes sao numericas e o tamanho da

amostra e pequeno o suficiente para mostrar um ponto por observacao.

Exercıcio

Faca o grafico de pontos para os dados do peso dos alunos: (a) considerando todos os

dados da classe juntos; (b) classificando os dados nas categorias M e F. Voce observa

Page 88: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

10 Representando dados

0 1-2 3-5 6+

68 0 0 210 505 68 260 390

180 0 68 260 598 68 260 390

180 68 68 260 805 68 260 390

210 93 68 278 810 98 260 398

210 98 98 373 975 98 260 525

323 165 98 390 98 260 570

368 210 98 390 98 270 665

368 210 98 398 113 323 860

698 210 113 405 165 323

260 165 405 180 328

293 180 405 180 373

323 180 435 210 373

405 180 435 210 373

405 210 480 225 373

435 210 495 260 373

Tabela 2.1: Consumo diario de cafeına (em mg) por categoria de consumo de alcool (em

doses).

Figura 2.3: Grafico de pontos para os dados de consumo de cafeına (mg) por categoria

de consumo de bebida alcolica (em doses).

alguma relacao entre peso e genero?

Page 89: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Grafico de barras 11

2.2 Grafico de barras

O grafico de pontos e adequado quando as observacoes sao numericas e o tamanho da

amostra e pequeno o suficiente para mostrar um ponto por observacao. No entanto se

tivermos muitos valores repetidos, um grafico de barras pode ser mais adequado.

Exemplo. No exemplo dos dados de consumo de cafeına, podemos representar os

dados pelo grafico de barras por categorias da Figura 2.4.

Figura 2.4: Grafico de barras para os dados de consumo de cafeına (mg) por categoria

de consumo de bebida alcolica (em doses).

Neste caso, dados repetidos sao representados pela altura da barra. Se uma observacao

aparece duas vezes mais que outra, a altura da barra correspondente deve ser o dobro da

altura da barra da outra. A largura da barra deve ser a mesma para todas as observacoes.

Exemplo Tratamento de leucemia. Um estudo foi realizado em 1963 para avaliar a

eficacia de um agente quimioterapeutico, 6-MP, para o tratamento de leucemia aguda.

Para realizar a avaliacao e necessario um grupo de comparacao, de modo que os pacientes

foram aleatorizados para dois grupos (6-MP ou placebo) mediante o lancamento de uma

moeda. O primeiro paciente receberia o 6-MP se a moeda indicasse cara ou placebo se

fosse coroa; o segundo paciente receberia o outro tratamento. O mesmo procedimento

foi seguido com o 3o e o 4o pacientes, com o 5o e o 6o, e assim por diante, com 21 pares

de pacientes. Para cada par, foi registrado se o procedimento 6-MP foi melhor (M) ou

pior (P) que o placebo, obtendo

MPMMM PMMMM MMMPM MMMMM M

Page 90: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

12 Representando dados

Desta forma, o 6-MP foi mais eficaz em 18 dos 21 pares de pacientes. Podemos rep-

resentar estes dados com um grafico de barras, onde a altura de cada barra indica a

proporcao ou a quantidade de indivıduos na categoria correspondente, como na Figura

2.5.

Figura 2.5: Grafico de barras para os dados do tratamento 6-MP contra a leucemia

aguda.

Exercıcio

Faca o grafico de barras para os dados do peso dos alunos: (a) considerando todos os

dados da classe juntos; (b) classificando os dados nas categorias M e F. A relacao entre

peso e genero fica mais visıvel, menos visıvel ou nao ha diferenca entre este grafico e o

de pontos?

2.3 Grafico de setores

Outra alternativa ao grafico de barras, quando os dados estiverem classificados em ca-

tegorias, e o grafico de setores. Neste grafico a area de cada setor e proporcional a

frequencia de cada categoria na amostra completa.

Exemplo No exemplo do tratamento contra a leucemia aguda, podemos representar

os resultados como no grafico da Figura

O experimento Dobra a lıngua e coca a orelha propoe uma analise de dados, atraves

de tabelas e de graficos de barras e de setores, sobre duas informacoes antropometricas:

Page 91: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Tabela de frequencias 13

Figura 2.6: Grafico de setores para os dados do tratamento 6-MP contra a leucemia

aguda.

“Voce consegue dobrar a lıngua?”e “Qual e o formato do lobulo da sua orelha?”.

Exercıcio

Faca o grafico de setores e o de barras para os dados do peso dos alunos, para representar

a proporcao de homens e mulheres na classe.

2.4 Tabela de frequencias

Podemos resumir dados numericos com uma tabela de frequencias. Dividimos a reta

numerica em intervalos e contamos o total de mensuracoes dentro de cada intervalo. A

frequencia e o total de observacoes em cada intervalo e a frequencia relativa e a proporcao

de observacoes em cada intervalos, ou seja, e a frequencia dividida pelo tamanho da

amostra.

Cada intervalo e chamado intervalo de classe e seu ponto medio, marca de classe. Para

evitar confusao com os extremos de cada intervalo, e nao contar informacoes duas vezes,

podemos considerar intervalos abertos a esquerda e fechados a direita, (a, b].

Exemplo No exemplo do consumo de cafeına, observemos que o consumo mınimo e

0 e o consumo maximo e 975 mg, considerando todos os dados. Podemos dividir a reta

em intervalos de 100mg, entre 0 e 1000 mg, e contar o total de casos em cada intervalo,

como aparece na Tabela 2.2.

Page 92: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

14 Representando dados

intervalo marca de frequencia frequencia

de classe classe relativa

0 - 100 50 21 0,216

100 - 200 150 12 0,124

200 - 300 250 24 0,247

300 - 400 350 20 0,206

400 - 500 450 10 0,103

500 - 600 550 4 0,042

600 - 700 650 2 0,021

700 - 800 750 0 0

800 - 900 850 3 0,031

900 - 1000 950 1 0,010

total 97 1

Tabela 2.2: Tabela de frequencias do consumo diario de cafeına (em mg).

Um criterio para escolher o total de intervalos nesta tabela e o mesmo que para a

escolha do grafico: a tabela deve entregar a informacao amostral, sem esconder dados

importantes e sem sobrecarregar a informacao.

Eventualmente, podemos considerar intervalos de tamanhos diferentes, se for mais con-

veniente.

Exemplo No exemplo do consumo de cafeına, observemos que os ultimos 4 intervalos

contem poucos ou nenhum dado, em relacao aos anteriores. Podemos considerar entao

o intervalo (600-1000], como na Tabela 2.3

intervalo marca de frequencia frequencia

de classe classe relativa

0 - 100 50 21 0,216

100 - 200 150 12 0,124

200 - 300 250 24 0,247

300 - 400 350 20 0,206

400 - 500 450 10 0,103

500 - 600 550 4 0,042

600 - 1000 800 6 0,062

total 97 1

Tabela 2.3: Tabela de frequencias do consumo diario de cafeına (em mg).

Page 93: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Histograma 15

Exercıcio

Construa duas tabelas de frequencias para os dados do peso dos alunos, considerando

todos os dados. Faca uma das tabelas com intervalos de mesmo comprimento e a outra,

nao.

2.5 Histograma

Podemos representar graficamente a informacao dada na tabela de frequencias atraves

do chamado histograma. Um histograma e um grafico de barras, onde a base de cada

barra e o intervalo de classe e a area de cada barra representa a frequencia do intervalo.

Observemos que se os intervalos tiverem todos o mesmo comprimento, entao a frequencia

de cada intervalo e representada pela altura da barra correspondente.

Se os comprimentos nao forem todos iguais, devemos escolher uma unidade de re-

ferencia, como por exemplo o comprimento do menor intervalo, como veremos no exem-

plo seguinte.

Exemplo No exemplo do consumo de cafeına, obtemos os seguintes histogramas, re-

ferentes a cada uma das tabelas de frequencias anteriores.

Figura 2.7: Histograma para os dados de consumo de cafeına (mg): a esquerda com

intervalos de mesmo comprimento; a direita, o ultimo intervalo e maior que os outros.

Lembremos que no histograma a area de cada barra deve representar a frequencia de

cada intervalo. Sendo assim, no ultimo intervalo devemos dividir a frequencia observada

por 4, ja que ele tem comprimento 4 vezes maior que os demais. Graficamente, este

Page 94: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

16 Representando dados

procedimento nos leva a uma barra para o ultimo intervalo cuja altura representa a

altura media dos intervalos combinados.

O vıdeo Cada grafico no seu galho mostra diversos tipos de grafico, entre eles o grafico de

setores, o de barras e o histograma. Alem disso, mostra como interpretar as informacoes

ali presentes e discute qual o tipo de grafico mais adequado para cada tipo de variavel.

Exercıcio

O applet Histograma permite fazer um histograma com dados variando de a a w. Defina

estes limites para os dados de peso e ingresse os dados no applet. Observe o histograma

obtido.

2.6 Diagrama de ramo-e-folhas

O estatıstico John Tukey inventou uma forma rapida de resumir dados, mantendo a

informacao original, chamada diagrama de ramo-e-folhas.

Exemplo Consideremos o seguinte conjunto de dados referente ao ganho de peso (em

kg) de 100 porquinhos submetidos a uma certa dieta, durante um mes:

3 , 7 , 11, 12, 13, 14, 15, 16, 17, 17, 18, 18, 18, 19, 19, 19, 20, 20, 21, 21, 21, 22, 22, 23,

23, 24, 24, 24, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 30,

30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 32, 32, 33, 33, 33, 33, 33, 34, 34, 34, 35, 35, 35,

36, 36, 36, 37, 37, 38, 38, 39, 39, 39, 40, 40, 41, 41, 41, 42, 42, 42, 43, 43, 44, 45, 46, 47,

48, 48, 53, 57

ramo folhas

0 3 7

1 1 2 3 4 5 6 7 7 8 8 8 9 9 9

2 0 0 1 1 1 2 2 3 3 4 4 4 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9

3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 8 8 9 9 9

4 0 0 1 1 1 2 2 2 3 3 4 5 6 7 8 8

5 3 7

Tabela 2.4: Diagrama de ramo-e-folhas para o ganho de peso.

Neste diagrama, os ramos representam as casas decimais e as folhas as unidades. Os

ramos sao primeiramente colocados em uma linha vertical, depois adicionamos as folhas

em cada linha, mantendo a mesma distancia entre elas e de forma ordenada, como na

Tabela 2.4.

Page 95: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Outros graficos 17

Assim como na Tabela de frequencias, podemos definir os galhos de diversas maneiras.

Por exemplo, poderıamos considerar cada galho contendo apenas 5 dıgitos, de 0 a 4 ou

de 5 a 9. Assim, o diagrama anterior fica como na Tabela 2.5.

ramo folhas

0 3

0 7

1 1 2 3 4

1 5 6 7 7 8 8 8 9 9 9

2 0 0 1 1 1 2 2 3 3 4 4 4

2 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9

3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4

3 5 5 5 6 6 6 7 7 8 8 9 9 9

4 0 0 1 1 1 2 2 2 3 3 4

4 5 6 7 8 8

5 3

5 7

Tabela 2.5: Diagrama de ramo-e-folhas para o ganho de peso, com 5 dıgitos em cada

ramo.

Exercıcio

Construa o diagrama de ramo-e-folhas para os dados do peso dos alunos, considerando

todos os dados.

2.7 Outros graficos

Serie temporal

Muitas das informacoes que recebemos em nosso dia a dia dizem respeito a dados

numericos que apresentam variabilidade no tempo. Em economia, por exemplo, o preco

do real em relacao a alguma moeda estrangeira, a taxa mensal de desemprego no paıs

durante os ultimos 5 anos. Em meio ambiente, temos as temperaturas media e maxima

diarias em uma certa regiao durante o ultimo mes, ou os nıveis de radiacao observados.

Em estudos sociais, podemos considerar a evolucao da proporcao de votantes em um

certo candidato, e assim por diante.

Conjuntos de dados referentes a variaveis numericas observadas durante um perıodo de

tempo sao chamados series temporais.

Page 96: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

18 Representando dados

O grafico da Figura 2.8 mostra a evolucao do salario mınimo real brasileiro, desde

sua instituicao em 1940, pelo governo do Estado Novo. Em 1943, foi incorporado a

Consolidacao das Leis do Trabalho (CLT) e, em 1963, foi estendido ao campo por meio

do Estatuto do Trabalhador Rural.

Figura 2.8: Evolucao temporal do salario mınimo real no Brasil.

Este tipo de grafico permite visualizar claramente a evolucao no tempo de variaveis

numericas.

O experimento Series Temporais realiza um estudo descritivo de um conjunto de dados

temporais com o fim de conhecer algumas das ferramentas utilizadas nesta area da

analise estatıstica.

Grafico radial

Em 1855, a enfermeira Florence Nightingale produziu graficos contundentes sobre a

mortalidade em hospitais militares na Gra-Bretanha.

Na Figura 2.9, o eixo radial mostra o total de mortes de soldados britanicos durante a

Guerra da Crimeia.

A area de cada regiao colorida, medida a partir do centro, representa a proporcao de

uma das variaveis medidas. A parte azul, mais externa, representa mortes por doencas

prevenıveis ou provenientes de infeccoes agudas, como colera e tifo. A parte mais clara

central, representa morte por ferimentos e a parte escura intermediaria, mortes por

outras causas.

Seus estudos estatısticos levaram a polıticas publicas para melhorar as condicoes nos

hospitais, diminuindo a taxa de mortalidade por infeccoes. Por seu trabalho, foi a

primeira mulher a ser eleita para a Royal Statistical Society, em 1858.

Page 97: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Outros graficos 19

Figura 2.9: Grafico radial construıdo por Florence Nightingale, em 1855.

Cartogramas

Em 2004, os fısicos Michael Gastner do Imperial College London e Mark Newman da Uni-

versidade de Michigan desenvolveram uma ferramenta que permitiu criar este incrıveis

graficos a respeito do nosso mundo.

Na Figura 2.10, vemos a esquerda o mapa mundi usual, em que a area ocupada por

cada paıs representa sua extensao geografica; a direita, a area ocupada por cada paıs

representa sua taxa de desnutricao infantil.

Figura 2.10: Cartogramas: a esquerda, a extensao territorial e, a direita, a taxa de

desnutricao infantil.

A taxa de desnutricao infantil consiste na proporcao de criancas do paıs com um quadro

de desnutricao. Esta pode ser da ordem de 1%, como no Chile e no Japao, ou chegar a

quase 50%, como em Bangladesh, Nepal e India.

Mais cartogramas podem ser encontrados na pagina do projeto Worlmapper. Voce nunca

mais vera o mundo do mesmo jeito.

Page 98: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

20 Representando dados

Page 99: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 3

Resumindo dados

Passaremos dos graficos para as formulas: nosso objetivo e obter umas poucas simples

mensuracoes das caracterısticas cruas de um conjunto de dados.

Qualquer conjunto de mensuracoes tem duas propriedades importantes: o valor tıpico

ou central, e a dispersao em torno desse valor. Podemos ter uma ideia destes conceitos

nos dois histogramas hipoteticos da Figura 3.1.

Figura 3.1: Medida central e de dispersao para dois histogramas.

Denotaremos um conjunto de n observacoes pela lista de valores x1, x2, . . . , xn.

Suponha que, por exemplo, perguntamos a 5 pessoas quantas horas elas assistem TV

por semana, obtendo a lista: x1 = 5, x2 = 7, x3 = 3, x4 = 38, x5 = 7.

Qual e o valor central destes dados? Ha diversas formas de defini-lo, e veremos apenas

duas delas, a media e a mediana. Do mesmo modo, ha diversas formas de definir a

dispersao; estudaremoso desvio-padrao e a distancia interquartil.

Page 100: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

22 Resumindo dados

3.1 Media

A media ou media amostral e representada por x, e e obtida somando todos os dados e

dividindo pelo total de observacoes:

x =soma dos dados da amostra

n=

x1 + x2 + · · ·+ xnn

.

Em nosso exemplo, x = (5 + 7 + 3 + 38 + 7)/5 = 60/5 = 12 horas, representa o tempo

medio semanal assistindo TV, na amostra obtida.

Podemos representar a soma pelo sımbolo∑

, assim x1 + x2 + · · ·+ xn =∑n

i=1 xi.

Geometricamente, imagine cada ponto da amostra na reta como um copo sobre uma

bandeja. A media representa o seu centro de massa, ou seja, o lugar onde segurar a

bandeja para que ela fique em equilıbrio.

Exercıcio

Obtenha a media para os dados do peso dos alunos, considerando todos os dados, e

depois obtenha o peso medio das alunos e dos alunos, separadamente.

3.2 Desvio-padrao

O desvio-padrao representa uma medida da dispersao media dos dados da amostra em

torno do valor medio, veja a Figura 3.2.

Figura 3.2: Dispersao dos dados com relacao a media.

Page 101: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Relacao entre media e desvio-padrao 23

Consideremos uma amostra x1, x2, . . . , xn e sua media x. Obtenhamos primeiramente o

quadrado das distancias de cada ponto da amostra ate a media

(x1 − x)2, (x2 − x)2, . . . , (xn − x)2,

e obtenhamos sua media aritmetica

1

n

((x1 − x)2 + (x2 − x)2 + · · ·+ (xn − x)2

).

O desvio-padrao, denotado por dp, e igual a raiz quadrada desta soma,

dp =

√1

n((x1 − x)2 + (x2 − x)2 + · · ·+ (xn − x)2),

e esta na mesma unidade dos valores observados.

Exercıcio

Obtenha o desvio-padrao para os dados do peso dos alunos, considerando todos os dados,

e depois obtenha o desvio-padrao do peso das alunos e dos alunos, separadamente.

3.3 Relacao entre media e desvio-padrao

Uma relacao empırica curiosa entre a media x e o desvio-padrao dp, que ocorre em

grande parte dos conjuntos de dados, e que

aproximadamente 2/3 da amostra encontra-se a distancia de 1dp da media

aproximadamente 95% da amostra encontra-se a distancia de 2dp da media

aproximadamente 99% da amostra encontra-se a distancia de 3dp da media

Esta propriedade ocorre para a maioria dos histogramas aproximadamente simetricos,

e mesmo para assimetricos, e permite estimar o desvio-padrao apenas olhando o his-

tograma.

A aproximacao nao e boa em conjuntos de dados com apenas dois valores diferentes,

como por exemplo, 0 0 0 0 0 0 0 1 1 1 1 1 1 1, em que os intervalos centrados na media

1/2 ou contem todos os dados ou nao contem nenhum.

Exercıcio

Verifique a proporcao da amostra sobre peso dos alunos dentro de cada um destes tres

intervalos em torno da media. Obtenha outros conjuntos de dados e verifique esta

relacao.

Page 102: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

24 Resumindo dados

Figura 3.3: Intervalos a 1dp, 2dp e 3dp da media.

3.4 Medianas

A mediana e uma outra forma de centro: e o “ponto medio” dos dados.

Formalmente, a mediana de um conjunto de valores x1, x2, . . . , xn e um valor m tal que:

pelo menos metade da amostra e menor ou igual a m, e

pelo menos metade da amostra e maior ou igual a m.

No exemplo das horas de TV, temos que 4 valores sao menores ou iguais a 7 (3, 5, 7, 7)

e que 3 valores sao maiores ou iguais a 7 (7, 7, 38), portanto 7 e uma mediana: o tempo

mediano de TV semanal da amostra e igual a 7.

Na lista de valores 2, 3, 7, 8, temos que 3 e uma mediana, pois 2 valores sao menores

ou iguais e 3 valores sao maiores ou iguais; que 7 e uma mediana, e que qualquer valor

entre 3 e 7 e um valor mediano. Neste caso, temos mais de uma mediana amostral.

Observe que a mediana nao e afetada por valores extremos afastados da maioria dos

dados. De fato, no exemplo das horas de TV, se trocarmos 38 por 123, a mediana

continuara sendo 7, ja a media passara para 29.

Por esta razao a mediana e uma medida mais representativa que a media ao analisar,

por exemplo, salarios em uma empresa ou em uma cidade, onde os dados apresentam

uma dispersao assimetrica com relacao ao seu ponto central.

Page 103: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Outros quantis 25

Exercıcio

Obtenha a mediana para os dados do peso dos alunos, considerando todos os dados, e

depois obtenha o peso mediano das alunos e dos alunos, separadamente.

3.5 Outros quantis

Podemos generalizar o conceito de mediana para outra divisoes da amostra. Dado

p ∈ [0, 1], definimos o quantil p, e o denotamos q(p), ao valor tal que:

pelo menos p ∗ 100% da amostra e menor ou igual a q(p), e

pelo menos (1− p) ∗ 100% da amostra e maior ou igual a q(p).

Os quantis mais usados sao o primeiro quartil, correspondente a p = 0.25 tambem

denotado por q1, o terceiro quartil, para p = 0.75 e denotado por q3, e os decis, para

p = 0.1, 0.2, . . . , 0.9, denotados por d1, d2, . . . , d9, respectivamente.

Observe que a mediana corresponde ao segundo quartil e ao quinto decil.

Outra medida de dispersao para os dados e a chamada distancia interquartil, definida

como a distancia entre os quartis 1o e 3o, dq = q(0.75)− q(0.25).

Exercıcio

Obtenha o primeiro e o terceiro quartis para os dados do peso dos alunos, considerando

todos os dados, e depois obtenha-os para o peso das alunos e dos alunos, separadamente.

3.6 Boxplot

Uma representacao grafica util para comparar uma variavel numerica em diferentes

categorias e o chamado boxplot.

A Figura 3.4 mostra o boxplot dos dados do consumo de cafeına para as categorias de

doses. O eixo y representa a variavel quantidade de cafeına, e o eixo x, as categorias

comparadas.

Para cada retangulo que forma o grafico, a base representa o primeiro quartil, q1, o topo

representa q3 e a linha interna, a mediana.

Podemos, neste grafico, comparar uma medida central e a dispersao em cada categoria.

Page 104: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

26 Resumindo dados

Figura 3.4: Boxplot para o consumo semanal de cafeına, por categoria de doses.

Os pontos isolados fora dos retangulos representam dados atıpicos da amostra, ou seja,

valores afastados da grande massa dos dados. Por convencao, um dado e atıpico se

estiver afastado da amostra a uma distancia de q1 ou q3 maior que 1.5dq.

As linhas verticais que saem do retangulo vao ate o menor e o maior valores nao-atıpicos

da amostra.

Os softwares Medidas do Corpo: Graficos univariados e Medidas do Corpo: Boxplot

fazem parte de um conjunto de recursos educacionais que analisam, do ponto de vista

estatıstico, algumas medidas do corpo humano. Nestes recursos sao apresentados e

discutidos os seguintes graficos univariados: de barra, de setores, histograma e boxplot,

relacionando-os com as medidas resumo anteriores.

Exercıcio

Grafique o boxplot para os dados do peso dos alunos, considerando todos os dados, e

depois grafique-os para o peso das alunos e dos alunos, separadamente. Que diferencas

voce observa nas categorias? Compare pontos centrais e dispersao, assim como presenca

ou ausencia de pontos atıpicos.

Page 105: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Capıtulo 4

Elementos de Amostragem

Ao estudar uma populacao, geralmente e impossıvel realizar observacoes do todos os

indivıduos. Um dos poucos casos em que podemos observar a populacao completa e a

populacao de votos, depois de contabiliza-los.

Nosso metodo e tomar uma amostra: uma parte relativamente pequena da populacao,

como fazem os institutos de pesquisa de opiniao ou de intencao de voto.

Duas questoes sao fundamentais no processo de amostragem:

1. qual deve ser o tamanho da amostra?

2. quao representativa e a amostra coletada?

A primeira questao foge ao escopo deste curso, mas pode ser encontrada no livro de

Meyer, nas referencias.

Figura 4.1: Amostragem aleatoria.

Page 106: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

28 Elementos de Amostragem

Trataremos aqui de alguns processos de selecao que permitem, em princıpio, obter

uma amostra representativa da populacao, os chamados processos probabilısticos ou

aleatorios de amostragem.

Estes procedimentos asseguram que cada elemento de uma populacao finita tem a mesma

chance de ser escolhido para a amostra.

4.1 Amostragem aleatoria simples

Suponha que temos uma grande populacao de N objetos e que queremos extrair uma

amostra de tamanho n.

A amostragem aleatoria simples (a.a.s.) consiste em sortear n elementos desta pop-

ulacao, por exemplo, numerando todos os elementos da populacao e entao sorteando n

valores de 1 ate N .

Figura 4.2: Amostragem aleatoria simples.

Na pratica, nao e sempre simples obter uma lista da populacao, e se for, as unidades

sorteadas podem ser de difıcil acesso ou ter um custo alto ou mesmo ser impossıvel de

coletar.

Alem disso, se n for pequeno, nada garante que a amostra seja representativa: de um

grupo de 50 homens e 50 mulheres do qual queremos extrair 10 pessoas, poderıamos

sortear 9 mulheres e 1 homem para um estudo biomedico, viesando a resposta de uma

variavel para a qual sexo seja uma caracterıstica relevante.

Existem outros metodos mais eficientes e baratos que a a.a.s., se tivermos informacao

sobre a populacao em estudo, como os que veremos a seguir.

Page 107: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Amostragem estratificada 29

4.2 Amostragem estratificada

Quando a populacao e formada por subpopulacoes homogeneas com relacao a variavel

analisada, podemos realizar aas dentro de cada subpopulacao (ou estrato): esta e a

chamada amostragem estratificada.

Figura 4.3: Amostragem estratificada.

Por exemplo, se estivermos interessados em estudar a altura das pessoas adultas de uma

regiao, podemos dividir a populacao entre homens e mulheres. Dentro de cada um destes

estratos, realizamos entao uma aas.

Este procedimento permite diminuir a variabilidade das observacoes, obtendo estimati-

vas mais precisas dentro de cada grupo.

4.3 Amostragem por conglomerado

Se for natural dividir a populacao em conglomerados (cidades, quarteiroes, salas de aula,

etc), a amostragem por conglomerado realiza uma aas para escolher alguns conglomer-

ados e depois amostra todos os indivıduos dos conglomerados selecionados.

Esta metodologia pode ser muito eficiente em reduzir custos se os custos das viagens

entre unidades amostrais escolhidas aleatoriamente forem altos.

Um exemplo e dividir uma cidade em quarteiroes, e entao amostrar todas as casas de

quarteiroes selecionados aleatoriamente.

Page 108: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

30 Elementos de Amostragem

Figura 4.4: Amostragem por conglomerado.

4.4 Amostragem sistematica 1-em-k

Este tipo de amostragem comeca ordenando a populacao de interesse, em uma lista de

nomes, em uma fila, no tempo, etc. Dado um valor natural k, selecionamos a primeira

unidade amostral aleatoriamente dentre os k primeiros. A seguir, selecionamos a amostra

escolhendo uma unidade a cada k unidades a partir da primeira.

Figura 4.5: Amostragem sistematica.

Por exemplo, um estudo sobre o transito nas rodovias poderia entrevistar um a cada

100 carros passando em um pedagio; uma pesquisa de boca de urna, normalmente usa

este sistema para evitar amostrar eleitores que comparecam em grupo para votar (e

provavelmente votantes de um mesmo candidato).

Page 109: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Amostragem sistematica 1-em-k 31

Este tipo de amostragem e facil de ser aplicado, sendo mais eficiente se as unidades

variarem suavemente ao longo da lista ou do tempo.

Page 110: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

32 Elementos de Amostragem

Page 111: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

Referencias Bibliograficas

[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)

Analise Combinatoria e Probabilidade. Editora SBM.

[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora

Edgard Blucher.

[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.

[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.

[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto

Euclides.

[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.

[7] Revista do Professor de Matematica. SBM.

[8] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman

Co.

Paginas da internet

Em portugues

[9] ALEA, Accao Local de Estatıstica Aplicada, Portugal.

[10] Mais - Recursos Educacionais em Matematica, Brasil.

[11] Matematica Multimıdia, Unicamp.

Em ingles

[12] Historia da Matematica, Universidade de St. Andrews, Escocia.

[13] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.

Page 112: M odulo III - D6 An alise Combinat oria, Probabilidade No ...

34 Referencias Bibliograficas

[14] Cartogramas: informacoes graficas sobre os paıses para saude, economia, ciencia,

poluicao, etc.