Estatística aplicada à informática

27
MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA Centro: CIÊNCIAS EXATAS E DA TERRA UFRN Departamento: ESTATÍSTICA DISCIPLINA CÓDIGO DENOMINAÇÃO CRÉDITOS CARGA HORÁRIA Tot. Aul. Lab. Est. Tot. Aul. Lab. Est. EST0322 Estatística Aplic. à Informát. 04 03 01 - 60 45 15 - P R É - R E Q U I S I T O S CÓDIGO DENOMINAÇÃO CRÉDITOS CARGA HORÁRIA Tot. Aul. Lab. Est. Tot. Aul. Lab. Est. MAT0005 Cálculo Diferencial e Integral II ou 06 04 02 - 90 60 30 - MAT0312 Matemática p/ Engenharia II 06 04 02 - 90 60 30 - E M E N T A Probabilidade. Variáveis Aleatórias Discretas e Contínuas Unidimensionais e Bidimensionais. Distribuições de Probabilidade Discretas: Poisson e Binomial e Contínuas: Normal e Exponencial. Introdução aos Processos Estocásticos. Correlação e Auto–Correlação. PROFESSOR RESPONSÁVEL ALLAN ROBERT DA SILVA Natal 2007

description

estatistica aplicada a informática

Transcript of Estatística aplicada à informática

Page 1: Estatística aplicada à informática

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA

Centro: CIÊNCIAS EXATAS E DA TERRA

UFRN Departamento: ESTATÍSTICA

DISCIPLINA

CÓDIGO DENOMINAÇÃO CRÉDITOS CARGA HORÁRIA

Tot. Aul. Lab. Est. Tot. Aul. Lab. Est. EST0322 Estatística Aplic. à Informát.

04 03 01 - 60 45 15 -

P R É - R E Q U I S I T O S

CÓDIGO DENOMINAÇÃO CRÉDITOS CARGA HORÁRIA

Tot. Aul. Lab. Est. Tot. Aul. Lab. Est. MAT0005

Cálculo Diferencial

e Integral II ou 06 04 02 - 90 60 30 -

MAT0312 Matemática p/ Engenharia II 06 04 02 - 90 60 30 -

E M E N T A

Probabilidade. Variáveis Aleatórias Discretas e Contínuas Unidimensionais e Bidimensionais. Distribuições de Probabilidade Discretas: Poisson e Binomial e Contínuas: Normal e Exponencial. Introdução aos Processos Estocásticos. Correlação e Auto–Correlação.

PROFESSOR RESPONSÁVEL

ALLAN ROBERT DA SILVA

Natal 2007

Page 2: Estatística aplicada à informática

2

P R O G R A M A EST0322 – Estatística Aplicada à Informática (4 créditos, 60 horas/aula)

UNIDADE I – PROBABILIDADE

1.1 - Experimentos Aleatórios 1.2 - Espaço Amostral 1.3 - Eventos 1.4 - Probabilidade 1.5 - Definições Clássicas e Axiomáticas de Probabilidade. Propriedades 1.6 - Probabilidade Condicional 1.7 - Teorema do Produto, da Probabilidade Total e de Bayes 1.8 - Eventos Independentes

UNIDADE II – VARIÁVEIS ALEATÓRIAS 2.1 - Variáveis Aleatórias Unidimensionais 2.1.1 - Variáveis Aleatórias Discretas 2.1.2 - Variáveis Aleatórias Contínuas

2.1.3 - Média, Variância e Desvio Padrão para Variáveis aleatórias Discretas e Contínuas

2.2 - Variáveis Aleatórias Discretas Bidimensionais 2.2.1 - Distribuição Conjunta de Probabilidade 2.2.2 - Variáveis Aleatórias Independentes 2.2.3 - Covariância 2.2.4 – Coeficiente de Correlação UNIDADE III – DISTRIBUIÇÕES DE PROBABILIDADE 3.1 - Principais Distribuições Discretas (Bernoulli, Binomial, Poisson) 3.2 - Principais Distribuições Contínuas (Exponencial, Normal) UNIDADE IV – PROCESSOS ESTOCÁTICOS 4.1 - Noções Básicas de Processos Estocásticos

4.2 - Processos Markovianos

UNIDADE V – CORRELAÇÃO E AUTOCORRELAÇÃO 5.1 - Coeficiente de correlação

5.2 - Propriedades do Coeficiente de Correlação Linear 5.3 - Regressão Linear Simples 5.4 - Análise de Resíduos

5.5 - Autocorrelação

Page 3: Estatística aplicada à informática

3

B I B L I O G R A F I A

1. MAGALHÃES, M. N.; LIMA, A. C. P. de . Noções de Probabilidade e Estatística. 5ª Ed. Edusp. São Paulo. 2004. 2. DANTAS, C. A. B. Probabilidade: Um Curso Introdutório. Ed. USP, São Paulo, 2a Ed., 2000.

3. MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro. Livros técnicos e científicos editora, 1984.

4. AZEVEDO, Paulo Roberto Medeiros de. Introdução à Estatística. Natal, ed. UFRN, 2005.

5. CLARKE, A. Bruce. Probabilidade e Processos Estocásticos. Rio de Janeiro, LTC S. A. 1979.

6. TRIOLA, Mario F., Introdução à Estatística, 9ª ed., LTC Editora (2005).

Page 4: Estatística aplicada à informática

4

UNIDADE I - PROBABILIDADE

1.1 Experimentos Aleatórios

A Teoria da probabilidade é útil para analisar situações que envolvem o acaso. Jogos de

dados e de cartas, ou o lançamento de uma moeda para o ar. As distribuições de probabilidade

incorporam a estatística descritiva e a teoria da probabilidade. Ambas formam a base da

inferência estatística. Algumas aplicações:

Na maioria dos jogos esportivos (futebol, basquete, turfe...), até certo ponto;

Na decisão de parar de imunizar pessoas com menos de 20 anos contra determinada

doença;

Na decisão de arriscar-se a usar determinado antivírus;

Todas utilizam a probabilidade consciente ou inconscientemente.

Um fenômeno ou experimento se diz aleatório se:

a) O experimento pode ser repetido sob condições idênticas;

b) Todos os possíveis resultados do experimento são conhecidos de antemão;

c) Em qualquer realização do experimento, não de pode predizer com certeza, qual

resultado particular ocorrerá, quando o experimento for realizado.

Dito de outra forma: um experimento aleatório é aquele cuja natureza, envolve um

elemento casual, que torna impossível a previsão, com certeza, de qualquer resultado particular,

dentre todos os possíveis, que este experimento possa apresentar, quando de sua realização.

1.2 Espaço Amostral

É o conjunto dos distintos resultados de um experimento aleatório, e será representado

por Ω . Cada elemento desse conjunto (dos resultados possíveis), é chamado ponto amostral.

Page 5: Estatística aplicada à informática

5

1.3 Eventos

É um subconjunto do espaço amostral, isto é, é um subconjunto de todos os resultados

possíveis de um experimento aleatório, e é sempre representado por letras maiúsculas A, B, etc.

Se um evento A é formado por apenas um ponto amostral, A é dito evento elementar. Temos

ainda que φ e Ω são eventos. O primeiro é chamado de evento impossível (nuca ocorre), o

segundo é chamado de evento certo (sempre ocorre).

Dado que os eventos associados a um espaço amostral, são, por sua vez conjuntos,

podemos efetuar as operações do tipo: união, intercessão, complementação e diferença, de forma

semelhante às respectivas operações que se realizam com os subconjuntos de qualquer conjunto

abstrato, e formar a partir destas operações, novos eventos tais como:

• BxouAx:xBA ∈∈=∪ , isto é: A ∪ B é o evento que ocorre sempre que

ocorre A ou sempre que ocorre B, e somente neste caso.

• BxeAx:xBA ∈∈=∩ isto é: A ∩ B é o evento que ocorre somente quando

ocorrem A e B simultaneamente.

• Ac = x : x ∈ Ω, x ∉ A, isto é Ac é o evento contrário de A, somente ocorre se A não

ocorre, (e não ocorre, se A ocorre). Claramente nota-se que Ac ∪ A = Ω.

• A – B = x : x ∈ A e x ∉ B, isto é: (A – B) é o evento que ocorre unicamente

quando ocorre A e não ocorre B.

Quando dois eventos são tais que, eles nunca podem ocorrer simultaneamente, neste caso

se tem que A ∩ B = ∅, eles são chamados eventos mutuamente exclusivos ou mutuamente

excludentes, (em termos de conjunto, diríamos que são conjuntos disjuntos). Seguem-se

exemplos, para melhor esclarecer o acima exposto.

Ex. 1. Uma fábrica produz um determinado artigo. Da linha de produção são retirados 03

artigos e cada um testado, e classificado como B (bom), D (defeituoso). Um espaço amostral

associado ao experimento é: Ω = BBB, DDD, BBD, DBB, DDB, DBD, BDD, BDB

Ex. 2. Considere o experimento que consiste em selecionar uma família aleatoriamente,

em certo distrito do Seridó, e verificar o nº de filhos que esta família já registrou. Um espaço

amostral associado a este experimento é: Ω = 0, 1, 2, 3, 4, ...

Ex. 3. Seja agora o experimento que consiste em retirar uma lâmpada de um lote e medir

seu tempo de vida antes de se queimar. Um espaço amostral pode ser:

Page 6: Estatística aplicada à informática

6

Ω = R+, isto é, Ω = t : t ≥ 0

Ex. 4. Um dado é lançado e o nº que aparece na face superior é observado. Um espaço

amostral é:

Ω = 0, 1, 2, 3, 4, 5, 6

Com exceção do exemplo 3, que é contínuo, todos os demais são espaços amostrais do

tipo chamado discreto. Um espaço amostral é discreto quando é formado por um conjunto

contável (finito ou infinito). Caso contrário, ele é dito contínuo.

Consideremos novamente o Ex. 1. Sejam os eventos associados a este espaço, tais como:

• A = “obter dois artigos defeituosos”. Logo, A = DDB, DBD, BDD

• B = “obter no mínimo 1 artigo bom”. Logo, B = DDB, DBD, BDD, BBD, BDB,

DBB, BBB

• C = “obter no máximo 1 artigo defeituosos”. Logo, C = BBB, BBD, BDB, DBB

Então poderemos ter, por exemplo, os novos eventos (resultantes das operações).

• A ∩ B = DDB, DBD, BDD = A

• A ∩ C = ∅, (portanto A e C são incompatíveis ou mutuamente exclusivos ou

excludentes).

• A ∪ C = BBB, BBD, DBB, DDB, DBD, BDD, BDB

• Bc = DDD, (portanto Bc é um evento elementar).

Consideremos agora o exemplo 3 (espaço amostral contínuo), e seja A o evento dado por:

A = “o tempo de vida da lâmpada é inferior a 20 horas”. Então, A = t : 0 ≤ t < 20 e Ac = (t ≥

20.

Naturalmente que A ∪ Ac = (t : t ≥ 0) = Ω é o evento certo. E observe que, sempre, A ∩

Ac = ∅, para qualquer evento A.

Obs.: Vale a pena lembrar as leis de MORGAN, referente a álgebra de conjuntos:

• (A ∪ B)c = Ac ∩ Bc (o complementar da união é igual à interseção dos

complementares)

• (A ∩ B)c = Ac ∪ Bc (o complementar da interseção é igual à união dos

complementares)

Page 7: Estatística aplicada à informática

7

1.4 Resultados Equiprováveis

Muitos experimentos aleatórios sugerem que os distintos resultados de um espaço

amostral finito estejam associados, cada um deles, a um mesmo valor p, que representa a

probabilidade de sua ocorrência. Por exemplo, em um lançamento de um dado honesto se tem

que o espaço amostral finito é formado por:

Ω = 1, 2, 3, 4, 5, 6

e cada ponto amostral tem a mesma probabilidade de ocorrência que será neste caso, p = 1/6.

Suponha por exemplo que sorteamos, numa urna com n bolas numeradas, 1, 2, 3, ..., n,

uma bola ao acaso. A probabilidade de cada bola (cada ponto amostral) será 1/n. Se um evento

A, associado a este espaço é formado por K pontos, digamos A = 1, 2, ..., 10, (n>10), então se

tem :

n

10

n

1.10)A(P ==

possíveiscasos

favoráveiscasos

espaçodoelementosdeºn

Aeventodoelementosdeºn)A(P =

Ω=

1.5 Principio fundamental da contagem e relação com a probabilidade:

Se determinado acontecimento ocorre em n etapas diferentes, e se a primeira etapa pode ocorrer

de k1 maneiras diferentes, a segunda de k2 maneiras diferentes, e assim sucessivamente, então o

número total T de maneiras de ocorrer o acontecimento é dado por:

T = k1 · k2 · k3 · ... · kn

Exemplo: uma pessoa pode viajar de natal ate recife de 2 maneiras: avião ou ônibus, mas pode

voltar de 3 maneiras: avião, ônibus ou uma carona com um amigo. Quantas maneiras ele pode

fazer esta viagem? qual a probabilidade dele ir de avião e voltar de carona? e de volta de carona?

Vejamos que pela regra ele tem 2 maneiras de ir e 3 de voltar. Logo ele tem 3*2 maneiras de ir e

voltar, ou seja, 6 maneiras de fazer a viagem, a seguir escritas:

Avião - Avião Ônibus - Avião

Avião - Ônibus Ônibus - Ônibus

Avião – Carona Ônibus - Carona

Page 8: Estatística aplicada à informática

8

A probabilidade de ir de avião é 1/2 e voltar de carona 1/3 = 1/2*1/3=1/6

Qual a probabilidade dele volta de carona? Não há restrições a sua ida, logo ele pode escolher 2

entre duas opções 2/2=1 e de a probabilidade de voltar de carona é 1/3=1*1/3=1/3.

1.6 Conceitos de Probabilidade

1.6.1 Definição Frequentista

Probabilidade definida como limite de freqüências relativas (definição de R. Von

Misses). Seja n o nº de provas realizadas em um experimento aleatório, e seja a, um evento

associado a este experimento. Seja f(A), a freqüência da ocorrência de evento A, isto é, o nº de

vezes em que se observou a ocorrência do evento A, nas n provas. Então a probabilidade do

evento A, segundo a definição frequentista, é dada por:

limnumero de ocorrencias de A f (A)

P(A) P(A)nnº total de provas ou observações n

= ⇒ =→ ∞

1.6.2 Definição Clássica

Regra de Laplace, aplicada aos casos de espaços amostrais finitos, cujos resultados,

(pontos amostrais), (têm cada um a mesma probabilidade de ocorrência).

n

n

possíveiscasosdeºn

Aeventodoocorrênciaàfaveráveiscasosdeºn)A(P A==

Pela regra de Laplace, se tem que:

a) 0 ≤ P(A) ≤ 1

b) P(∅) = 0n

0= ; P(Ω) = 1

n

n=

c) Se A e B são incompatíveis, isto é A ∩ B = ∅, então P(A ∪ B) = P(A) + P(B)

1.6.3 Formulação Axiomática do Conceito de Probabilidade

Este conceito de probabilidade se estabelece a partir de uma função real P(A), definida

sobre os eventos associados a um espaço amostral, a qual faz corresponder a cada subconjunto

A, de Ω (sendo este subconjunto um evento), um nº real, tal que cumpra os seguintes axiomas:

a) P(A) ≥ 0

b) P(Ω) = 1

Page 9: Estatística aplicada à informática

9

c) Se A e B são eventos mutuamente exclusivos, isto é A ∩ B = ∅, então se tem que

P(A ∪ B) = P(A) + P(B)

Obs.: Esta definição axiomática é mais abrangente que a regra de Laplace, dado que, a definição

clássica se limita aos espaços amostrais finitos equiprováveis.

1.6.4 Teoremas Fundamentais do Cálculo das Probabilidades

a) Se ∅ é um conjunto vazio, então P(∅) = 0

Demonstração:

Pelo axioma (b), 1 = P(Ω) e pelo axioma (c), P(Ω ∪ ∅) = P(Ω) + P(∅) 1 = 1 + P(∅) P(∅) = 0

b) Sejam A e B eventos quaisquer, então, P(A ∪ B) = P(A) + P(B) – P(A ∩ B)

Demonstração:

• Se A e B são incompatíveis então A ∩ B = ∅ e P(∅) = 0, se tem então que

P(A ∪ B) = P(A) + P(B), com A ∩ B = ∅ (axioma c)

• Se A e B não são incompatíveis, da forma: A ∪ B = (A - B) ∪ B e sendo

assim pelo axioma (c), P(A ∪ B) = P(A - B) ∪ P(B) (1)

Analogamente A pode ser escrito da forma: A = (A ∩ B) ∪ (A – B), sendo (A

∩ B) e (A – B) eventos incompatíveis.

Portanto: P(A) = P(A ∩ B) + P(A – B) ou P(A – B) = P(A) – P(A ∩ B)

Substituindo em (1) se tem: P(A ∪ B) = P(A) + P(B) – P(A ∩ B).

c) Se Ac é o complementar de A, então: P(Ac) = 1 – P(A)

Demonstração:

Temos que Ω = A ∪ Ac, sendo A ∩ Ac = ∅

Pelo axioma (b), temos que P(Ω) = 1 e pelo axioma (c), temos que P(A ∪ Ac) =

P(A) + P(Ac)

Logo, P(Ω) = P(A ∪ Ac) = 1 = P(A) + P(Ac) donde P(Ac) = 1 – P(A)

Page 10: Estatística aplicada à informática

10

d) Se A ⊂ B então P(A) ≤ P(B)

Demonstração

Se A ⊂ B, podemos escrever B da forma: B = A ∪ (Ac ∩ B), onde A e (Ac ∩ B)

são eventos incompatíveis, e portanto, pelo axioma (c), se tem que P(B) = P(A) +

P(Ac ∩ B),

Logo P(B) - P(A) = P(Ac ∩ B), pelo axioma (a), P(Ac ∩ B) ≥ 0

Portanto, P(B) – P(A) ≥ 0 logo, P(B) ≥ P(A)

EXERCÍCIOS

1. Faça A e B serem eventos

I. Indique no Diagrama de VENN os novos eventos:

a) Ocorre A, mas não ocorre B.

b) Apenas A ou B ocorre, mas não ambos.

c) Não ocorre A.

II. Encontre uma expressão para estes eventos.

2. Considere o experimento aleatório: Lançar uma moeda e um dado. Pede-se:

a) Um conjunto que represente o espaço amostral associado a este experimento.

b) Expresse os eventos:

A = “cara e nº par”

B = “números primos”

C = “coroa e nº ímpar”

c) Expresse claramente os eventos:

1. A ou B ocorre

2. B ou C ocorre

3. Somente B ocorre

4. Ocorre BA ∪

d) Quais eventos A, B e C são mutuamente exclusivos?

Page 11: Estatística aplicada à informática

11

1.7 Relação Entre Probabilidade e Frequência Relativa

O método clássico para determinar probabilidades está limitado às situações em que os

resultados são igualmente prováveis. Mas, há muitos casos em que isso não ocorre. Por exemplo,

no caso de uma moeda não equilibrada, é claro que cara e coroa não são igualmente prováveis.

Uma forma de lidar com situações como esta é obter alguns dados empíricos, numa tentativa de

estimar as probabilidades. Parece razoável considerar o lance repetido da moeda, um grande

número de vezes (sob condições idênticas), observando os resultados para testar a hipótese de

resultados igualmente prováveis.

Mas não é absolutamente essencial realizar um experimento para obter dados amostrais.

Em muitos casos dispomos de informação histórica, que pode ser utilizada precisamente da

mesma maneira.

1.8 Probabilidade Condicionada

Sejam A e D, eventos quaisquer, associados a um espaço amostral sendo P(D) > 0.

Muitos problemas envolvem o cálculo da probabilidade da ocorrência de A, quando já se tem a

informação de que houve a ocorrência de D. Isto é, a probabilidade de A será calculada

considerando-se a condição de que já houve a ocorrência de D. Esta nova informação, (de que D

ocorreu), equivale a restringir o espaço amostral, que agora será considerado como o conjunto

dos pontos amostrais que formam o evento D. E, a probabilidade de A, dentro desta condição,

chama-se “probabilidade condicional de A, dentro desta condição, chama-se: “probabilidade

condicional de A, dado que D ocorreu”. A qual será escrita sob a forma: P(A / D), sendo definida

como:

)D(P

)DA(P)D/A(P

∩= , com P(D) > 0

Desta relação acima, obtemos a chamada REGRA DO PRODUTO DE

PROBABILIDADE, dada por:

P(A ∩ D) = P(D) . P(A / D) ou P(A ∩ D) = P(A) . P(D / A)

Esta regra pode ser estendida para mais de dois eventos: Sejam A1, A2, … , An eventos quaisquer

associados a Ω, então:

P(A1 ∩ A2 ∩ ... ∩ An) = P(A1).P(A2/A1).P(A3/A1 ∩ A2). ... . P(An/A1 ∩ A2 ∩ … ∩ An-1)

Page 12: Estatística aplicada à informática

12

Ex.: Um par de dados “honestos” é lançado. Qual a probabilidade de ocorrer o nº 2 em pelo

menos um dos dados, se já se tem a informação de que ocorreu que a soma dos nº dos dados é

igual a seis?

Solução:

Sejam os eventos: A: “a soma dos dois dados é 6”

B: “ocorre o nº 2 em pelo menos um dos dados”

)A(P

)BA(P)A/B(P

∩=

# Ω = 6 x 6 = 36

A = (1,5), (2,4), (3,3), (4,2), (5,1) ⇒ # A = 5

B = (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (1,2), (3,2), (4,2), (5,2), (6,2) ⇒ # B = 11

A ∩ B = (2,4), (4,2) ⇒ # (A ∩ B) = 2

Portanto, 5

2)A/B(P

365

362

==

Ex.: Consideremos novamente o lançamento de dois dados “honestos”. Qual a probabilidade de

ocorrer a soma igual a 6, se, sabe-se que em um dos dados apareceu o nº 2”

Solução: agora pede-se P(A/B).

Portanto P(A/B) = 11

2

)B(P

)BA(P

3611362

==∩

Ex.: Para a 3ª avaliação de estatística, um professor indica os 10 primeiros capítulos do livro

adotado e diz que elaborará 10 problemas, numerados de 1 a 10, onde cada um deles será

baseado no respectivo capítulo a ser estudado (ex: problema 1 – capítulo 1, etc.) O professor

avisa que a prova constará, de apenas 3 destes 10 problemas, os quais serão sorteados no início

da avaliação, aleatoriamente, um após outro, entre 10 papeizinhos numerados de 1 a 10, que

corresponderão aos respectivos problemas. Um estudante, por ter ido farrear na noite anterior,

somente estudou os 4 primeiros capítulos.

Page 13: Estatística aplicada à informática

13

a) Qual a probabilidade de que “caia” na avaliação somente capítulos que ele tenha

estudado?

b) Qual a probabilidade de que somente no 3º sorteio (a 3ª questão) “caia” exatamente um

ponto que ele não estudou?

Solução: Sejam os eventos:

A1 = “No 1º sorteio “cai” um ponto que ele estudou”

A2 = “No 2º sorteio “cai” um ponto que ele estudou”

A3 = “No 3º sorteio “cai” um ponto que ele estudou”

B = “No 3º sorteio “cai” um ponto que ele não estudou”

(A1 ∩ A2 ∩ A3) = P(A1).P(A2/A1).P(A3/A1∩ A2) = 4/10 . 3/9 . 2/8 = 1/30

(A1 ∩ A2 ∩ B) = P(A1).P(A2/A1).P(B/A1∩ A2) = 4/10 . 3/9 . 6/8 = 1/10

1.9 Teorema de Bayes

Uma das relações mais importantes envolvendo probabilidades condicionais é expressa

pelo Teorema de Bayes, também conhecido como regra das probabilidades das causas.

Suponha que o conjunto A1, A2, … , An seja uma partição do espaço amostral Ω, isto é, Ai ∩

Aj = ∅ para todo i ≠ j e A1 ∪ A2 ∪ … ∪ An = Ω. Seja B um evento qualquer, e suponha que são

conhecidas as probabilidades das causas P(Ai), e as probabilidades condicionais P(B/Ai) de

ocorrência do evento B, dado que ocorreu a causa Ai, i = 1, 2, ... , n. Então teremos:

Teorema de Bayes: A probabilidade P(Ai/B), de ocorrência da causa Ai, dado que

ocorreu o evento B é dado por:

)A/B(P)A(P...)A/B(P)A(P)A/B(P)A(P

)A/B(P)A(P)B/A(P

nn2211

iii

⋅++⋅+⋅

⋅=

Ex.: Temos 5 urnas externamente iguais, cada urna com 6 bolas. Duas destas urnas, (tipo A1),

tem 3 bolas brancas. Duas outras urnas, (tipo A2), têm 2 bolas brancas, e a última urna, (tipo A3),

tem as 6 bolas brancas. Escolhemos uma urna ao acaso e desta urna retiramos uma bola. Qual a

probabilidade da urna escolhida ser a do tipo A3, sabendo-se que a cor da bola retirada é branca?

Page 14: Estatística aplicada à informática

14

Solução:

Sejam os eventos:

B = “a bola retirada é branca”

A1 = “a urna selecionada contém 3 bolas brancas” P(A1) = 2/5 P(B/A1) = 3/6

A2 = “a urna selecionada contém 2 bolas brancas” P(A2) = 2/5 P(B/A2) = 2/6

A3 = “a urna selecionada contém 6 bolas brancas” P(A3) = 1/5 P(B/A3) = 6/6 = 1

)A/B(P)A(P)A/B(P)A(P)A/B(P)A(P

)A/B(P)A(P)B/A(P

332211

333

⋅+⋅+⋅

⋅=

8

3

1.5/16/2.5/26/3.5/2

1.5/1=

++=

Exercícios (Regra de Bayes)

1. Consideremos a situação: Um estudante que em certa manhã sai de casa apressado para a

escola e apanha na cozinha aleatoriamente uma das 3 sacolas iguais que estão em cima da

mesa. Uma delas contém o seu lanche: dois sanduíches de queijo manteiga. Outra sacola

contém o lanche de sua irmã: ums sanduíche de queijo manteiga e outro de presunto, (que ele

detesta). A terceira sacola contém restos de comida que será dada ao gato. Pensando em ter ou

não, pego a sacola errada, no meio do caminho, ele abre a sacola e tira um sanduíche. Verifica

que é de queijo manteiga. (Fica aliviado, pelo menos não é a da comida do gato). Pergunta-se:

Nestas condições, qual a probabilidade dele ter apanhado a sacola certa?

Solução: Sejam os eventos:

A = “o sanduíche é de queijo manteiga”

S1 = “a sacola contém 1 sanduíche de queijo”

S2 = “a sacola contém 2 sanduíche de queijo”

S3 = “a sacola contém a comida do gato”

Pede-se: P(S2/A) = ?

3

2

0.1..

1.

)S/A(P)S(P)S/A(P)S(P)S/A(P)S(P

)S/A(P)S(P)A/S(P

31

31

21

31

31

332211

222 =

++=

⋅+⋅+⋅

⋅=

Page 15: Estatística aplicada à informática

15

1.10 Eventos Independentes

Definição: Um evento A é considerado independente de um outro evento B se a probabilidade de

A é igual a probabilidade condicional de A dado B, isto é:

P(A) = P(A/B)

Naturalmente, que, se A é independente de B, B é também independente de A, desta forma:

P(B) = P(B/A)

A partir do teorema do produto podemos afirmar que se os eventos A e B são independentes

então se tem:

P(A ∩ B) = P(A) . P(B)

Têm-se n eventos: A1, A2, … , An, diremos que eles são independentes se e somente se, eles

forem independentes dois a dois; três a três; quatro a quatro; n a n.

P(A1 ∩ A2) = P(A1).P(A2)

P(A1 ∩ A2 ∩ A3) = P(A1).P(A2).P(A3)

. . . .

. . . .

. . . .

P(A1 ∩ A2 ∩ ... ∩ An) = P(A1).P(A2) ... P(An-1).P(An)

Exercícios

(Espaços amostrais – Eventos)

1 – Numa classe de Ciências, onde há 20 alunos, faz-se um sorteio de uma passagem aérea para

participação de um congresso sobre Política. Para isto, cada aluno da classe recebe um nº

entre 1 e 20. Determine:

a) O espaço amostral associado a este sorteio.

b) O evento A formado pelos nº múltiplos de 3.

c) O evento B formado pelos nº pares inferiores a 6.

d) O evento A

e) O evento BA ∩

f) O evento A ∪ B

g) Pergunta-se: Os eventos A e B são mutuamente exclusivos?

Page 16: Estatística aplicada à informática

16

2 – Retira-se ao acaso, uma após outra, sem reposição, de uma gaveta contendo 4 pastas

idênticas, (nestas pastas estão as contas de 4 firmas as quais estão numeradas de 1 a 4), duas

destas pastas. Após a retirada de cada pasta, seu nº é anotado, na ordem dos sorteios,

obtendo-se assim, um par ordenado.

Determine:

a) O espaço amostral associado a este experimento.

b) O evento A, formado pelos pares cuja soma é 4.

c) O evento B, formado pelos pares de nº iguais.

d) O evento C, formado pelos pares cujo 1º número é maior que o segundo número.

3 – Repita o exercício nº 2, supondo agora, que as retiradas das duas pastas sejam feitas com

reposição.

(Probabilidade – Axiomas e Principais Teoremas)

4 – Dados:

a) 3

1)B(P;

6

5)A(P)BA(P ===∩ . Calcule P(AUB)

b) 6

5)C(P;

3

2)CB(P)B(P ==∪= . Calcule P(B ∪ C)

c) P(A) = 6

1)C(P = . Sendo A e C eventos incompatíveis. Calcule P(A ∪ C)

5 – Numa gaveta, há misturados 3 recibos de telefones da Firma A; 5 da Firma B; 4 da firma C;

2 da Firma D; e 1 da Firma E. Extraindo-se um recibo ao acaso, pergunta-se:

a) Qual a probabilidade de sair um recibo que não seja da Firma C?

b) Qual a probabilidade de sair um recibo da Firma A ou um recibo da Firma D?

c) Qual a probabilidade de sair um recibo da Firma E ou um recibo da Firma D?

Page 17: Estatística aplicada à informática

17

6 – Seja o experimento: lançar um dado honesto e observar o nº que aparece na sua face superior.

Sejam os eventos associados a este experimento:

A : “Sai um nº ímpar”

B : “Sai um nº maior que 5”

a) Pergunta-se: os eventos A e B são incompatíveis?

b) Determine P(A ∪ B)

7 – Um experimento aleatório pode apresentar apenas 4 resultados possíveis distintos: A ou B ou

C ou D. Sabe-se que o resultado A ocorre com probabilidade igual a 1/10; a probabilidade

do resultado B não ocorrer é igual a 4/5; e o resultado de C não ocorrer é igual a 7/10.

Determine a probabilidade de ocorrer o resultado D.

8 – Seja o espaço amostral, dado por: (W1, W2, W3. Qual destas funções abaixo representa uma

probabilidade neste espaço amostral?

a) P(W1) = 1/4; P(W2) =1/3; P(W3) = 1/2

b) P(W1) = 2/3; P(W2) =-1/3; P(W3) = 2/3

c) P(W1) = 1/6; P(W2) =1/3; P(W3) = 1/2

d) P(W1) = 0; P(W2) = 1/3; P(W3) = 2/3

e) P(W1) = 0; P(W2) =1; P(W3) = 1/4

9 – Seja o experimento aleatório: lançar um dado e uma moeda (honestos). Considere os eventos:

A: “Sai coroa e nº par”

B: “Sai um nº maior que 4”

C: “Sai cara”

Determine:

a) P(A) b) P(B) c) P(C) d) )CA(P ∪ e) P(A ∩ C)

10 – Em um lançamento de um dado viciado, cuja probabilidade de sair um número menor que 3

é 4 vezes maior que a probabilidade de sair o nº 3, e a probabilidade de sair um número

Page 18: Estatística aplicada à informática

18

maior que 3 é duas vezes maior que a probabilidade de sair o número 3. Encontre a

probabilidade de sair o nº 1 ou o nº 5, em 1 lançamento do dado.

(Probabilidade Condicional – Independência - Teorema de Bayes)

11- Um restaurante popular apresenta apenas dois tipos de refeições: salada completa (S) ou um

prato à base de carne (C). 20% dos fregueses do sexo masculino (H) preferem salada; 30%

das mulheres (M) escolhem carne; 75% dos fregueses são homens.

a) Qual a probabilidade do freguês preferir salada, dado que é homem?

b) Qual a probabilidade do freguês preferir carne, dado que é mulher?

c) Qual a probabilidade do freguês ser mulher, dado que prefere salada?

12- A probabilidade de que A resolva um problema é de 2/3 e a probabilidade de que B resolva

é de 3/4. Se ambos tentarem independentemente, qual a probabilidade do problema ser

resolvido?

13- A urna I contém duas bolas pretas e três brancas, ao passo que a urna II contém três bolas

pretas e três brancas. Escolhemos uma urna ao acaso e dela extraímos uma bola, que tem

cor branca. Se a bola é recolocada na urna, qual é a probabilidade de se retirar novamente

uma bola branca da mesma urna?

14- Três máquinas A, B e C produzem respectivamente 50%, 30% e 20% do número total de

peças de uma fábrica. As porcentagens de defeituosas na produção destas máquinas são

3%, 4% e 5% respectivamente. Se uma peça é selecionada aleatoriamente é considerada

defeituosa, qual a probabilidade de que a peça tenha sido produzida pela máquina A?

Page 19: Estatística aplicada à informática

19

UNIDADE 2 - VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS

2.1 Definição de Variáveis Aleatórias

Ao descrever um espaço amostral de um experimento, não especificamos que um

resultado individual necessariamente seja um número. Por exemplo, ao descrever uma peça

manufaturada, podemos empregar apenas as categorias “defeituosa” e “não defeituosa”.

Também, ao observar a temperatura durante o período de 24 horas, podemos simplesmente

registrar a curva traçada pelo termógrafo. Contudo, em muitas situações experimentais,

estaremos interessados na mensuração de alguma coisa e no seu registro como um número.

Mesmo nos casos mencionados acima, poderemos atribuir um número a cada resultado (não

numérico) do experimento. Por exemplo, poderemos atribuir o valor 1 (um) às peças perfeitas e o

valor 0 (zero) às defeituosas. Poderemos registrar a temperatura máxima do dia, ou a temperatura

mínima, ou a média das temperaturas máxima e mínima (Meyer, 1983).

Consideremos um experimento aleatório ε, e seja Ω o espaço amostral associado a este

experimento.

Definição: Variável aleatória (que escrevemos de modo abreviado: v.a.) num espaço

amostral Ω, é uma função x, que associa Ω, (isto é, a cada ω ∈ Ω), um nº real, X(ω). Ver Figura

6.

Ω X R

ω X(ω)

Figura 6

Ex.1: Consideremos o experimento aleatório: extraem-se duas bolas, sem reposição, de uma

urna que contém: 2 bolas brancas (B) e 3 vermelhas (V). Vamos definir a v.a. X como: X = “o nº

de bolas vermelhas obtidas nas duas extrações”. Portanto os valores possíveis que a v.a. X pode

assumir são:

Page 20: Estatística aplicada à informática

20

X = 0, se ocorre o evento “BB”, (duas bolas brancas)

X = 1, se ocorre o evento: “VB” ou “BV” (vermelha e branca ou branca e vermelha)

X = 2, se ocorre o evento: “VV” (duas bolas vermelhas)

2.2 Tipos de Variáveis

As variáveis aleatórias podem ser de dois tipos: discretas ou contínuas. Uma v.a. é dita

discreta quando ela assume somente valores num conjunto enumerável de pontos do conjunto

real. Ela é uma v.a. contínua se for do tipo que pode assumir qualquer valor em um intervalo

real.

2.3 Variáveis Aleatórias Discretas e Contínuas

2.3.1 Variáveis Aleatórias Discretas

Seja X uma variável aleatória. Se o número de valores possíveis de X (isto é, Rx, o

contradomínio) for finito ou infinito numerável, denominamos X de variável aleatória discreta.

Isto é, os valores possíveis de X, podem ser postos em lista como x1, x2, x3, ..., xn.

• Distribuição de Probabilidade da Variável Aleatória

Seja X uma v.a. definida num espaço amostral Ω, tal que: X(Ω) = x1, x2, x3, ..., xn.

Podemos definir a probabilidade da v.a. X assumir o valor xi, (i = 1, 2, ..., n), a qual escreve-se

P(X = xi) ou f(xi). Esta função f, que a cada xi do conjunto X(Ω), (os valores possíveis que a v.a.

X pode assumir), associa sua probabilidade de ocorrência, é chamada de DISTRIBUIÇÃO (ou

FUNÇÃO) DE PROBABILIDADE DA V.A. X, e pode ser expressa por uma tabela, um gráfico

ou uma fórmula. Há outras notações, usuais para P(X = xi), que são por exemplo: pi ou P(xi) ou

P(X = x) ou P(x).

A distribuição dada por P(X = xi), satisfaz as condições:

a) P(xi) ≥ 0

b) ∑ ==

n

1ii 1)x(P

Ex.2: Consideremos uma urna com 3 bolas vermelhas e 2 brancas, de onde se extraem

sem reposição duas bolas. Tínhamos que a v.a. X foi definida como:

Page 21: Estatística aplicada à informática

21

X = “nº de bolas vermelhas obtidas nas duas extrações”.

Portanto: X(Ω) = 0, 1, 2. Construindo o diagrama da árvore termos o seguinte:

RESULTADOS X PROBABILIDADES

BB 0 1/10

BV 1 3/10

VB 1 3/10

VV 2 3/10

Σ 1

Portanto temos: P(X = 0) = P(BB) = 1/10

P(X = 1) = P(BV ou VB) = 3/10 + 3/10 = 6/10

P(X = 2) = P(VV) = 3/10

Desta forma, a DISTRIBUIÇÃO DE PROBABILIDADE desta v.a. X, (em esquema de tabela),

será:

x P(x)

0 1/10

1 6/10

2 3/10

Σ 1

Ex.3: Consideremos o lançamento de uma moeda “honesta” duas vezes. Seja a v.a. Y, definida

como: Y = “o nº de “caras” obtidas nos dois lançamentos”. ⇒ Y = 0, 1, 2. Portanto temos:

RESULTADOS Y PROBABILIDADES

C C 2 1/4

C C 1 1/4

C C 1 1/4

C C 0 1/4

Σ 1

Portanto: P(Y = 0) = P( C C ) = 1/4

P(Y = 1) = P(C C ou C C ) = 1/4 + 1/4 = 2/4

Page 22: Estatística aplicada à informática

22

P(Y = 2) = P(C C) = 1/4

Desta forma, a DISTRIBUIÇÃO DE PROBABILIDADE desta v.a. Y, (em esquema de tabela),

será:

x P(x)

0 1/4

1 2/4

2 1/4

Σ 1

Assim, variável aleatória é uma função que associa a cada ponto de um espaço amostral, um nº

real. E a tabela que associa a cada valor de uma variável aleatória, a sua probabilidade,

denominamos DISTRIBUIÇÃO (ou FUNÇÃO) DE PROBABILIDADES DA VARIÁVEL

ALEATÓRIA.

2.3.2 Variáveis Aleatórias Contínuas

Suponha-se que o contradomínio de x seja formado por um número finito muito grande

de valores, digamos todos os valores de x no intervalo 0 ≤ x ≤ 1, da form: 0; 0,01; 0,02; ... 0,98;

0,99; 1,00. A cada um desses valores está associado um número não negativo p(xi) = P(X = xi), i

= 1, 2, ..., cuja soma é igual a 1. Esta observação está representada geometricamente na Figura 7.

Poderia ser matematicamente mais fácil idealizar a apresentação probabilística de X, pela

suposição de que X pudesse tomar todos os valores possíveis, 0 ≤ x ≤ 1. Se fizermos isso, que

acontecerá às probabilidades no ponto p(xi)? Como os valores possíveis de X não são

numeráveis, não podemos realmente falar do i-ésimo valor de X, e, por isso, p(xi) se torna sem

sentido. O que faremos é substituir a função p definida somente para x1, x2,... por uma função f

definida para todos os valores de x, 0 ≤ x ≤ 1.

Figura 7

Page 23: Estatística aplicada à informática

23

• Função Densidade de Probabilidade (fdp)

Seja X uma v.a. contínua. A função densidade de probabilidade f(x) é uma função que satisfaz as

seguintes condições:

a) f(x) ≥ 0 para todo x ∈ Rx

b) ∫ =xR 1dx)x(f

c) Além disso, definimos, para qualquer a < b em Rx, P(a < X < b) = ∫ba dx)x(f

em que Rx é o contradomínio de X.

Exemplo

Se f(x) = 2x, para 0 ≤ x < 1, e zero fora desse intervalo, vemos que f(x) ≥ 0, qualquer que seja x,

e a área sob o gráfico de f é unitária (verifique Figura 8). Logo, a função f pode representar a

função densidade de uma variável aleatória contínua X.

Figura 8

Aqui, a P(0 ≤ x < ½) é igual à área do triângulo de base ½ e altura 1. Logo a probabilidade em

questão é P(0 ≤ x < ½) = ½.( ½ . 1) = ¼.

2.4 Valor Esperado de Variáveis Aleatórias Discretas e Contínuas

2.4.1 Valor Esperado de Variáveis Aleatórias Discretas

Definição: Se x1, x2, x3, ..., xn são os possíveis valores da v.a. X, e P(x1), P(x2), P(x3), ...,

P(xn) são as respectivas probabilidades então o valor esperado, (ou esperança matemática ou

média), de X, denotado por E(X) ou µx, é definido por:

Page 24: Estatística aplicada à informática

24

∑==

n

1iii )x(P.x)X(E

Ex.4: Consideremos novamente o exemplo da urna com 3 bolas vermelhas e 2 brancas, de onde

se extraem sem reposição duas bolas. A v.a. X é definida como:

X = “nº de bolas vermelhas obtidas nas duas extrações”. Portanto: X(Ω) = 0, 1, 2.

O valor esperado ou média da v.a. X será:

2,110

12

10

3.2

10

6.1

10

1.0)X(E ==++=

Ex.5: Consideremos novamente o exemplo do lançamento de uma moeda “honesta” duas vezes.

Seja a v.a. Y, definida como:

Y = “o nº de “caras” obtidas nos dois lançamentos”. ⇒ Y = 0, 1, 2. Portanto temos:

14

4

4

1.2

4

2.1

4

1.0)Y(E)y(P.y)Y(E

n

1iii ==++∑ ===

=

2.4.2 Valor Esperado de Variáveis Aleatórias Contínuas

Definição: Se x1, x2, x3, ..., xn são os possíveis valores da v.a. X, e P(x1), P(x2), P(x3), ..., P(xn)

são as respectivas probabilidades então o valor esperado, (ou esperança matemática ou média),

de X, denotado por E(X) ou µx, é definido por:

∫=∞

∞−

dx)x(f.x)X(E

Ex.: Considerando o mesmo exemplo onde f(x) = 2x, para 0 ≤ x < 1, temos que

∫=1

0dx)x(f.x)X(E = ∫

1

0dxx2.x =

1

0

3

3

x2= 2/3

2.5 Propriedades

1) A média de uma constante é a própria constante: E(K) = K

2) Multiplicando uma v.a. X por uma constante, sua média fica multiplicada por essa

constante. E(K.X) = K.E(X)

Page 25: Estatística aplicada à informática

25

3) Somando ou subtraindo uma constante a uma v.a., a sua média fica somada ou

subtraída da mesma constante. E(X ± K) = E(X) ± K

4) A média da soma ou da diferença de duas v.a’s é a soma ou a diferença das médias.

E(X ± Y) = E(X) ± E(Y)

5) A média do produto de duas v.a’s independentes é o produto das médias. E(XY) =

E(X).E(Y)

2.6 Variância de Variáveis Aleatórias Discretas e Contínuas

2.6.1 Variância de Variáveis Aleatórias Discretas

Seja o seguinte exemplo: Vamos considerar a v.a. X, com distribuição dada conforme

tabela abaixo:

X -2 -1 0 1 2

P(x) 1/5 1/5 1/5 1/5 1/5

Portanto a v.a. X tem média, E(X) = -2.1/5 + (-1).1/5 + 0.1/5 + 1. 1/5 + 2.1/5 = 0

Consideremos agora a v.a. Y dada por Y = 2.X. Então a tabela abaixo dá a distribuição e média

de Y:

y -4 -2 0 2 4

P(y) 1/5 1/5 1/5 1/5 1/5

Logo E(Y) = 0.

Observando as distribuições das v.a. X e Y, notamos que elas têm a mesma média, E(X)

= E(Y) = 0, e que são simétricas ao redor deste valor, (o ponto 0). Porém, pode-se notar ainda

que, a v.a. Y é mais “espalhada” ao redor deste ponto zero, do que a v.a. X, (ou

equivalentemente: X está mais “concentrada” ao redor do 0 do que Y). Ver graficamente.

Uma medida de “DISPERSÃO” ou “EXPANSÃO” dos valores assumidos por uma v.a.,

ao redor de sua média, é dada pela VARIÂNCIA desta variável aleatória, (ou pelo desvio

padrão).

Page 26: Estatística aplicada à informática

26

Definição: Seja X uma v.a. discreta, com média E(X). Então, a variância da v.a. X é

definida por:

)x(P)]X(Ex[Var i2

n

1ii ⋅−∑=

=

Pode-se mostrar que esta expressão acima equivale à fórmula alternativa (geralmente mais

usada) dada por:

Var(X) = E(X2) – [E(X)]2

Outras notações, também adotadas para a variância de uma v.a. X, além de Var(X), são:

σX2 ou σ2(X), ou simplesmente σ2 quando não suscitar dúvidas (quando, por exemplo, somente

se está tratando com uma variável, digamos X. Nestes casos é comum se referir a µ como média

de X, e a σ2 como variância de X).

Definição: O Desvio Padrão de uma v.a. X com média E(X), é definido como a raiz

quadrada positiva de Var(X). Portanto, o desvio padrão de X será:

)X(VarX =σ

As notações usuais para o desvio padrão, além desta usada, (σX), ou σ(X) ou

simplesmente σ, quando não suscitar dúvidas (ver comentário feito anteriormente a respeito das

notações usuais de variância).

Exemplo

Consideremos a v.a. X dada no exemplo anterior. Tínhamos que E(X) = 0. Calculemos a

variância e o desvio padrão desta v.a. X. Primeiro, devemos calcular E(X2) para aplicarmos a

fórmula da variância.

Portanto, E(X) = 10/5 = 2. Logo, Var(X) = E(X2) – [E(X)]2 = 2 – 02 = 2

E o desvio padrão será 4142,12 ==σ

x2 P(x) X2.P(x)

0 1/5 0

1 2/5 2/5

4 2/5 8/5

∑ 1 10/5 = 2

Page 27: Estatística aplicada à informática

27

2.6.2 Variância de Variáveis Aleatórias Contínuas

22 )]X(E[)X(E)X(Var −=

onde ∫=∞

∞−

dx)x(f.x)X(E 22

Ex.: Considerando o mesmo exemplo onde f(x) = 2x, para 0 ≤ x < 1, temos que para calcular a

Var(X), temos que primeiro achar E(X2).

∫=∞

∞−

dx)x(f.x)X(E 22 = ∫1

0

2 dxx2.x = 1

0

4

4

x2 = ½

Então, 22 )]X(E[)X(E)X(Var −=

Var(X) = ½ - (2/3)2 = 1/2 – 4/9 = 1/18

2.7 Propriedades

1) A variância de uma constante é zero. Var(K) = E[(K – E(K))2] = E[(K – K)2] = 0

2) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo

quadrado da constante. Var(KX) = K2.Var(X)

3) Somando-se ou subtraindo-se uma constante a uma v.a., sua variância não se altera.

Var(X ± K) = Var(X) ± Var(K) = Var(X), pois Var(K) = 0

4) A variância da soma ou diferença de duas v.a’s independentes, é a soma das

respectivas variâncias. Var(X ± Y) = Var(X) + Var(Y) , quando Cov(X,Y) = 0.