Revisão de Probabilidade e Estatística

Post on 25-Feb-2016

34 views 1 download

description

Revisão de Probabilidade e Estatística. Parte 1. Vivemos tomando decisões baseadas em informações incompletas. Peço uma sopa? As outras opções são tão CARAS, e eu não sei quem está pagando... Será que os estatísticos são pão-duros ? Nunca saí com um antes... - PowerPoint PPT Presentation

Transcript of Revisão de Probabilidade e Estatística

REVISÃO DE PROBABILIDADE E ESTATÍSTICAParte 1

Vivemos tomando decisões baseadas em informações incompletas...

Peço uma sopa?As outras opções são tão

CARAS, e eu não sei quemestá pagando... Será que osestatísticos são pão-duros?Nunca saí com um antes...

apesar de já ter conhecido um contador bastante generoso...

Peço uma sopa?Das 36 vezes em que a pedi,em 27 ela estava muito boa...Mas será que segunda é o dia

de folga do chef? E o queacontecerá se todas as moléculasde ar do salão de repente voarem

para o teto?

Muitos de nós vivemosconfortavelmente com um certo nível de incerteza...

Por favor,o senhor poderia

me trazer uma sopa? Argh! Você poderia me trazer uma

CALCULADORA?

O que distingue os estatísticos é a sua habilidade em quantificar a incerteza, em torná-la precisa. Isto lhes permite fazer afirmaçõescategóricas, com certeza absoluta - sobre o seu nível de incerteza!

Boa pedida! Eu estou 95%confiante de que a sopa de hoje à noite tem uma probabilidade

entre 73% e 77% de ser realmente deliciosa!

O que é Probabilidade? A teoria da probabilidade estuda os

fenômenos aleatórios. Um modelo probabilístico consiste de

uma lista de todos os possíveis resultados de um experimento e a atribuição de suas respectivas probabilidades.

Utilizada inicialmente para o estudo de jogos de azar!

O jogo de dados moderno popularizou-se na Idade Média,a tempo para que um libertino da época, o Cavaleiro De

Mere, apresentasse um quebra-cabeças matemático:

O que é mais provável:obter pelo menos uma sena emquatro rolagens de um único dado ou obter pelo menos uma dupla sena em 24 rolagens de um par de dados?

Por que, então, ele perdiamais freqüentemente coma segunda jogada???

O Cavaleiro considerou queo número médio de rolagenscom sucesso seria o mesmonos dois casos:

Chance de obter um seis=1/6Número médio em quatrorolagens= 4.(1/6) = 2/3Chance de obter uma dupla sena em uma rolagem= 1/36Número médio em 24rolagens= 24.(1/36) = 2/3

Pascal escreveu a seu colega PIERRE DE FERMAT, e após algumascartas, os dois finalizarama Teoria da Probabilidadena sua forma moderna - à exceção, claro, dos desenhos.

De Mere colocou a questão para o seu amigo, o gênio BLAISE PASCAL (1623-1666):

“Prezado Pierre,Que Teoria bonitapoderíamos ter, se ao menos um denós soubessedesenhar...”

Definições Básicas Um experimento aleatório é o processo

de observar o resultado de um evento não determinístico.

Resultados elementares são todos os possíveis resultados de um experimento aleatório.

O espaço amostral é o conjunto de todos os resultados elementares.

Eventos

AS

Um evento A (relativo a um particular espaço amostral S, associado a um experimento e) é simplesmente um conjunto de resultados possíveis.

Axiomas da probabilidade Seja e um experimento. Seja S um espaço

amostral associado a e. A cada evento A associaremos um número real representado por P(A) e denominado probabilidade de A, que satisfaça às seguintes propriedades:

1)(0 AP1)( SP

).()()( BPAPBAP Se A e B forem mutuamente exclusivos:

Atribuição de Probabilidades Clássica: Baseada em idéias de jogos, a

hipótese fundamental é que o jogo seja justo e que todos os resultados elementares tenham a mesma probabilidade.

Freqüência Relativa: Quando um dado experimento pode ser repetido então a probabilidade do evento é a proporção de vezes em que o evento ocorre para um número grande de repetições.

Pessoal: Avaliação pessoal da verossimilhança de um dado evento.

Combinação de Eventos Dados dois eventos E e F, podemos

obter novos eventos: E e F : ocorrência de ambos os eventos; E ou F : ocorrência de pelo menos um dos

eventos; não E : o evento E não ocorre.

PoucaOU

nenhuma.

Combinando as nossas definições primitivas de probabilidadecom estas operações lógicas obtemos fórmulas poderosas

para manipular probabilidades.

Eu jogo compulsivamenteE eu perdi a minha camisa

E M. Pascal ainda estátrabalhando no meu problema.Quais são as minhas chances

avec toi, cherie?

Regras Adição:

P(E ou F) = P(E) + P(F) - P(E e F) Subtração:

P(E) = 1 - P(não E)

Probabilidade condicional A probabilidade condicional de um

evento A, dado que ocorreu o evento B, ou a probabilidade condicional de A dado B é representada simbolicamente por:

P(A |B)

)()(

BPBAP

Regra da Multiplicação P(E e F ) = P(E | F ) P(F ) P(E e F ) = P(F | E ) P(E ) Se E e F forem eventos independentes,

então:P(E e F ) = P(E ) P(F )

Eventos Independentes Dois eventos são ditos independentes se

a ocorrência de um deles não afeta de modo algum a probabilidade do outro.

O conhecimento de que um dos eventos ocorreu não altera de nenhum modo a nossa estimativa da probabilidade do outro evento.

O que é mais provável: obter pelo menos uma sena em quatro rolagens de um único dado ou obter pelo menos

uma dupla sena em 24 rolagens de um par de dados?

Como podemos então resolver o quebra-cabeças de De Mere?

Tente!!!Seja E o evento de obter pelo menos uma sena em quatro

rolagens de um único dado. P(E) = ? É mais fácil descrever o complemento de E, não E, ou seja, não obter nenhuma sena em quatro rolagens do

dado! A probabilidade de não obter uma sena numa rolagem de dado é 5/6. Como as rolagens do dado são independentes,

temos que:

518,0) não(1)(

482,065) não(

4

EPEP

EP

Como podemos então resolver o quebra-cabeças de De Mere?

Seja F o evento de obter pelo menos uma dupla sena em vinte e quatro rolagens de dois dados. P(F) = ?

É mais fácil descrever o complemento de F, não F, ou seja, não obter nenhuma dupla sena em vinte e quatro

rolagens dos dados! A probabilidade de não obter uma dupla sena numa

rolagem de dois dados é 35/36. Como as rolagens dos dados são independentes, temos que:

491,0) não(1)(

509,03635) não(

24

FPFP

FP

O que é mais provável:obter pelo menos um seis emquatro rolagens de um único dado ou obter pelo menos uma dupla sena em 24 rolagens de um par de dados?

Como podemos então resolver o quebra-cabeças de De Mere?

P(E) = 0,518 > P(F) = 0,491

Regra de Bayes Teorema da Probabilidade Total:

Aplicando a definição de probabilidade condicional juntamente com este teorema, obtemos:

)()(

)|(APABPABP j

j

)()|(

)()|(

BPBAPBPBAP

ii

i

jj

n

iii BPBAPAP

1

)()|()(

Regra de Bayes

Aplicação da Regra de Bayes

Suponha que uma certa doença rara infecta uma pessoa a cada 1000 pessoas de uma população...

E suponha que existe um teste bom, mas imperfeito para esta doença: Se uma pessoa está infectada ele produz um resultado

positivo em 99% dos casos; Mas se uma pessoa não está infectada ele produz um

falso positivo para 2% deles. Se o seu resultado der positivo, quais são as

chances de que você esteja mesmo infectado?

Aplicação da Regra de Bayes Eventos:

A : O paciente está infectado B : O teste dá positivo.

Informações sobre a eficácia do teste: P(A) = 0,001 P(B|A) = 0,99 P(B|não A) = 0,02

Queremos saber: P(A|B) = ?

Aplicação da Regra de Bayes Eventos:

A : O paciente está infectado B : O teste dá positivo.

Usando a Regra de Bayes:

)()|()()|()()|()|(

APABPAPABPAPABPBAP

999,002,0001,099,0001,099,0)|(

BAP01998,000099,0

00099,0

0472,0

Apenas 5% dos que tiveram resultado positivo estão, de fato, infectados!!!