SebentaTeorica2_TeoriaDasProbabilidades
-
Upload
filipa-oliveira -
Category
Documents
-
view
15 -
download
0
Transcript of SebentaTeorica2_TeoriaDasProbabilidades
Estatística IEstatística IEstatística IEstatística I
Licenciatura em GestãoLicenciatura em GestãoLicenciatura em GestãoLicenciatura em Gestão
SEBENTA TEÓRICA
Teoria das Probabilidades
Setembro 2010
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 1
ÍNDICE
ÍNDICE ....................................................................................... 1
1. AXIOMÁTICA DAS PROBABILIDADES......................................................... 2 1.1. Experiência Aleatória............................................................ 2 1.2. Diversas Teorias das Probabilidades ......................................... 5
1.2.1. Teoria Clássica (de Laplace) ........................................... 5 1.2.2. Teoria Frequencista ..................................................... 5 1.2.3. Teoria Subjectiva ........................................................ 5 1.2.4. Teoria Axiomática (de Kolmogorov) .................................. 6
1.3. Espaço de Probabilidades....................................................... 6 1.4. Probabilidades Condicionais e Independência ............................. 8
1.4.1. Teorema das Probabilidades Compostas............................. 9 1.4.2. Teorema das Probabilidades Totais .................................10 1.4.3. Teorema de Bayes ......................................................11 1.4.4. Independência de Acontecimentos ..................................13
2. VARIÁVEIS ALEATÓRIAS .................................................................. 14 2.1. Função de Distribuição........................................................ 14 2.2. Variável Aleatória Discreta ................................................... 15 2.3. Variável Aleatória Contínua .................................................. 16 2.4. Valor Médio, Variância e Assimetria de uma Variável Aleatória ..... 19
2.4.1. Valor Médio ..............................................................19 2.4.2. Valor Esperado ..........................................................20 2.4.3. Momentos ................................................................21 2.4.4. Variância .................................................................21 2.4.5. Função Geradora de Momentos ......................................22 2.4.6. Assimetria ................................................................23
2.5. Transformadas de Variáveis Aleatórias .................................... 25 2.5.1. Variável Aleatória Discreta............................................25 2.5.2. Variável Aleatória Contínua...........................................26
3. VECTORES ALEATÓRIOS.................................................................. 29 3.1. Vector Bidimensional Discreto............................................... 30 3.2. Vector Bidimensional Contínuo.............................................. 33 3.3. Momentos e Coeficiente de Correlação ................................... 36
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 2
1. AXIOMÁTICA DAS PROBABILIDADES A teoria das probabilidades formula modelos de fenómenos naturais em que
se supõe intervir o acaso, isto é, em que a partir do passado não se pode prever deterministicamente o futuro, mas para os quais se pode encontrar, em certas condições, taxas de realização constante, que poderão permitir efectuar previsões.
Tais fenómenos dizem-se fenómenos aleatórios e os modelos que lhes dizem respeito modelos aleatórios. Um modelo aleatório é então um modo de calcular as probabilidades de certos acontecimentos.
1.1. EXPERIÊNCIA ALEATÓRIA Uma experiência é um processo capaz de provocar resultados observáveis.
Uma experiência aleatória é uma experiência em que o conjunto de resultados possíveis é conhecido antecipadamente, não se podendo prever exactamente o resultado individual, mesmo que se desenvolvam todos os esforços para controlar a experiência, e os resultados obtidos ao fim de uma longa repetição mostram uma grande regularidade. Esta experiência pode-se repetir um grande número de vezes nas mesmas condições ou pode estar associadas a experiências aleatórias que se podem realizar apenas uma vez.
O espaço de resultados, geralmente representa-se por Ω, é um conjunto, não vazio, formado por todos os resultados que é possível obter quando se efectua a experiência.
Um acontecimento é um subconjunto do espaço de resultados Ω.
Exemplos: Experiência aleatória: “lançar um dado” Espaço de resultados: Ω=1,2,3,4,5,6 Acontecimento: A = “saída de número par” = 2,4,6⊆Ω
Experiência aleatória: “lançar uma moeda ao ar” Espaço de resultados: Ω=cara, coroa Acontecimento: C = “saída de cara” = cara⊆Ω
Experiência aleatória: “lançar duas moedas ao ar” Ω=(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa) Acontecimento: B = “saída de duas caras” = (cara, cara)⊆Ω
Experiência aleatória: “n.º de chamadas recebidas por hora numa central” Ω=0, 1, 2, 3, ... Acontecimento: D = “n.º de chamadas inferior a 10” = 0, 1, 2, ..., 10⊆Ω
Experiência aleatória: “a observação da duração da vida humana” Ω=x: x>0 Acontecimento: V = “duração de vida superior a 60 anos” = x: x>60⊆Ω
Ao realizar uma experiência, dizemos que o acontecimento A (A⊆Ω) se realiza se o resultado é uma parte de A. Sendo os acontecimentos definidos como conjuntos, pode-se aplicar aos acontecimentos a álgebra dos conjuntos.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 3
1 - Implicação A realização de A implica a realização de B se e só se todo o elemento de A
é elemento de B:
A⊆B ⇔ (ω∈A ⇒ ω∈B)
B A
2 - Idênticos A e B são acontecimentos idênticos se e só se a realização de um implica a
realização do outro, isto é, A=B ⇔ A⊆B e B⊆A.
3 - Intersecção A intersecção de dois acontecimentos A e B é o acontecimento A∩B que se
realiza se e só se A e B se realizam conjuntamente:
B A A∩B
ω∈A∩B ⇔ (ω∈A e ω∈B)
4 - União A união de dois acontecimentos A e B é o acontecimento A∪B que se realiza
se e só se A ou B se realizam:
B A A∪B
ω∈ A∪B ⇔ (ω∈A ou ω∈B)
5 - Incompatibilidade A e B dizem-se acontecimentos incompatíveis (ou mutuamente exclusivos),
se e só se a realização de um implica a não realização do outro:
B A
6 - Diferença A diferença de dois acontecimentos A e B é o acontecimento B\A que se
realiza se e só se B se realiza e A não:
B A B\A=B∩A (ou B-A)
ω∈(B\A) ⇔ (ω∈B e ω∉A)
7 - Complementar O complementar de um acontecimento A é o acontecimento Ā=Ω\A que se
realiza se e só se A não se realiza:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 4
ΩΩΩΩ A
A = Ω\A
ω∈A ⇔ ω∉A
Exemplo: Experiência aleatória: “lançar um dado” Espaço de resultados: Ω=1,2,3,4,5,6 A = “saída de número par” B = “saída de número impar” C = 1,3,5 D = 1,2,3,4,5 E = 1,2 F = 3,4
Tem-se que: − a realização de C implica a realização de D (C⊆D); − B e C são idênticos (B=C); − C∩E = 1; − C∪E = 1,2,3,5; − E e F são incompatíveis; − D\F = 1,2,5; − B é o complementar de A (Ā = B).
Propriedades
− Associatividade A∪(B∪C) = (A∪B)∪C A∩(B∩C) = (A∩B)∩C
− Comutatividade A∪B = B∪A A∩B = B∩A
− Distributividade A∪(B∩C) = (A∪B)∩(A∪C) A∩(B∪C) = (A∩B)∪(A∩C)
− Idempotência A∪A = A A∩A = A
− Absorção Se A⊂B então A∪B = B A∩B = A
− Modulares A∪Ω = Ω A∩Ω = A A∪∅ = A A∩∅ = ∅
− Leis de De Morgan ( ) BABA ∩=∪ ( ) BABA ∪=∩
− Dupla negação
A = A
As operações de união e intersecção podem definir-se para um número finito qualquer ou para uma infinidade numerável de acontecimentos.
A união de uma infinidade numerável de acontecimentos LL ,A,,A,A n21 realiza-se se pelo menos um dos jA se realiza:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 5
ULL∞==∪∪∪∪1j jn21 AAAA
A intersecção de uma infinidade numerável de acontecimentos LL ,A,,A,A n21 realiza-se se todos se realizam:
ILL∞==∩∩∩∩1j jn21 AAAA
1.2. DIVERSAS TEORIAS DAS PROBABILIDADES
1.2.1. Teoria Clássica (de Laplace)
A probabilidade de um acontecimento é a razão do número de resultados favoráveis a esse acontecimento sobre o número total de resultados possíveis, desde que todos os resultados sejam igualmente prováveis. Esta definição é a mais intuitiva e a mais bem entendida por qualquer pessoa. Para mais fácil determinar a número de casos favoráveis e/ou número de casos possíveis pode utilizar-se poderosa ferramenta auxiliar que é o cálculo combinatório.
A probabilidade de um acontecimento está entre 0 e 1.
Exemplos:
No lançamento de um dado, a probabilidade de obtermos a face 5 é de 6
1.
No lançamento de um dado, a probabilidade de obtermos a face menor ou
igual a 3 é de 6
3.
Esta teoria tem dois grandes problemas associados aos factos do número total de resultados possíveis ter de ser finito e nem sempre se pode admitir que todos os resultados são igualmente prováveis.
1.2.2. Teoria Frequencista
A probabilidade de um acontecimento C é dado por
( ) ( )n
CnlimCP
n ∞→=
em que n(C) é o número de vezes em que ocorre o acontecimento C num total de n experiências aleatórias.
1.2.3. Teoria Subjectiva
A probabilidade mede o nosso de grau de crença na realização do acontecimento.
Deste ponto de vista, toda a afirmação tem o seu grau de probabilidade, deixando de associar a probabilidade apenas a acontecimentos repetíveis (em que há regularidade estatística) para passarmos a considerar também acontecimentos singulares.
Esta teoria, no fundo não é mais que uma teoria da ”credibilidade”.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 6
1.2.4. Teoria Axiomática (de Kolmogorov)
As probabilidades são objectos matemáticos que satisfazem um certo número de axiomas pragmáticos e coerentes, isto é, que podem dar uma descrição eficaz dos fenómenos naturais e que não induzem contradições.
A frequência relativa deve entender-se como uma medição física de uma grandeza teórica associada a um acontecimento que é a probabilidade. A probabilidade, do ponto de vista físico, é a taxa ou intensidade de realização de um fenómeno natural.
1.3. ESPAÇO DE PROBABILIDADES
Seja Ω um conjunto não vazio (universo) e ℑ uma família não vazia de subconjuntos de Ω. O par (Ω,ℑ) diz-se um espaço de acontecimentos se:
A1) Se A∈ℑ então Ā∈ℑ
A2) Se A∈ℑ e B∈ℑ então A∪B∈ℑ
Das propriedades habituais dos conjuntos resulta que:
1 - Ω ∈ ℑ, pois Ω = A ∪ Ā e existe A ∈ ℑ (ℑ é uma família não vazia)
2 - Se A ∈ ℑ e B ∈ ℑ então A ∩ B ∈ ℑ, pois A ∩ B = ( )BA ∪
3 - ∅ ∈ ℑ, porque A ∩ Ā =∅ ou ∅=Ω
4 - Se A∈ℑ e B∈ℑ então B\A = B ∩ Ā ∈ℑ
5 - Se A∈ℑ e B∈ℑ então a diferença simétrica A∆B = (A\B) ∪ (B\A) ∈ℑ
Um espaço de acontecimentos (Ω,ℑ) diz-se um espaço de probabilidades (Ω,ℑ,P) se, para todo o acontecimento A∈ℑ está definida uma função real P: ℑ→ℜ, dita probabilidade, tal que:
P1) P(A)≥0 P2) P(Ω)=1 P3) se A∩B = ∅ então P(A∪B) = P(A) + P(B)
Consequências:
1 - P(Ā) = 1 – P(A)
Como A ∪ Ā = Ω e A ∩ Ā = ∅,
logo, P(Ω) = 1 ⇔ P(A ∪ Ā) = 1 ⇔ P(A) + P(Ā) = 1 ⇔ P(Ā) = 1 – P(A)
2 - P(∅) = 0
pois ∅=Ω
3 - Se A⊆B então P(A)≤P(B)
Como B=A∪(B\A), então P(B)=P(A)+P(B\A) e P(B\A)≥0
4 - P(A\B)=P(A) – P(A∩B)
Como A=(A∩B)∪(A\B), então P(A)=P(A∩B)+P(A\B)
5 - Se B⊆A então P(A\B)=P(A) – P(B)
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 7
pois A∩B=B
6 - P(A) ≤ 1
P(Ā) = 1 – P(A) ⇒ P(A) ≤ 1
7 - Generalizando P3, ( )∑ == =
n
1i in
1i i APAP U se ji ,AA ji ≠∅=∩
)A)AA((P)AA(P n1n1n1 ∪∪∪=∪∪ −LL
)A(P)AA(P n1n1 +∪∪= −L )A(P)A)AA((P n1n2n1 +∪∪∪= −−L
)A(P)A(P)AA(P n1n2n1 ++∪∪= −−L )A(P)A(P n1 ++== LL
8 - ( )∑ == ≤
n
1i in
1i i APAP U
9 - P(A∪B) + P(A∩B) = P(A) + P(B) ⇔ P(A∪B) = P(A) + P(B) – P(A∩B)
Como A∪B = (A\B) ∪ (B\A) ∪ (A∩B), vem que:
P(A∪B) = P(A\B)+P(B\A)+P(A∩B) = P(A)–P(A∩B)+P(B)–P(B∩A)+P(A∩B) = P(A)+P(B)–P(A∩B)
10 - Generalização: )AA(P n1 ∪∪L )A(P)A(P n1 ++= L )AA(P)AA(P 3121 ∩−∩−
)AA(P n1n ∩−− −L )AAA(P 321 ∩∩+ )AAA(P n1n2n ∩∩++ −−L
( ) )AA(P1 n11n ∩∩−++ − LL
11 - Se A=a, b, c, ..., h então P(A)=P(a)+P(b)+P(c)+...+P(h) Daqui resulta, se os resultados forem equiprováveis, a definição de Laplace: P(A) = #A/#Ω (da equiprobabilidade vem pi = 1/#Ω) Seja Ω=x1,x2,...,xn #Ω=n
P(xi) todas iguais e Ω=x1 ∪x 2 ∪...∪x n
P(Ω)=P(x1)+P(x 2)+...+P(xn)
P(Ω)=1 ⇒ P(xi) = 1/n, i=1, 2, ..., n
Seja A⊆Ω, #A=k,
=
∈U
Axj
j
xP)A(Pn
1
n
1
n
1 +++= Ln
k= =Ω#
A#
Espaço de Acontecimentos Infinito*
Seja Ω um conjunto não vazio (universo) e ℑ uma família não vazia de subconjuntos de Ω. O par (Ω,ℑ) diz-se um espaço de acontecimentos se ℑ for uma σ-álgebra, isto é, se verificar as duas condições seguintes:
A1) Se A∈ℑ então A ∈ℑ
A2) Se Ai∈ℑ, i=1,2,... então U∞=1i iA ∈ℑ
Podemos assim considerar acontecimentos que são constituídos por uniões numeráveis de outras.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 8
É imediato verificar que a intersecção numerável de elementos de ℑ, pertence a ℑ, assim como Ω∈ℑ, ∅∈ℑ e as diferenças e diferenças simétricas pertencem a ℑ.
Podemos assim dizer que uma σ-álgebra contém, além de ∅ e Ω, os complementares, a diferença e a diferença simétrica, e as uniões e intersecções numeráveis.
Um espaço de acontecimentos (Ω,ℑ), em que ℑ é uma σ-álgebra, diz-se um espaço de probabilidades (Ω,ℑ,P) se, para todo o acontecimento A∈ℑ está definida uma função real ℜ→ℑ:P , dita probabilidade, tal que:
P1*) P(A)≥0 P2*) P(Ω)=1 P3*) dada uma sucessão de acontecimentos disjuntos L,A,A 21
(Ai∩Aj=∅, se i≠j), tem-se ( )∑∞=
∞= =
1i i1i i APAP U (série
convergente, pois é uma série de termos positivos, majorada
por 1, visto que Ω⊆∞=U 1i iA .
O axioma P3* é o axioma da aditividade generalizada.
Axioma da continuidade
Se LL ⊇⊇⊇⊇ n21 AAA e ∅=∞=I 1i iA então P(An)→0
Se LL ⊇⊇⊇⊇ n21 AAA e AA1i i =∞
=I então P(An)→A
1.4. PROBABILIDADES CONDICIONAIS E INDEPENDÊNCIA Qual a probabilidade de certo acontecimento se um outro acontecimento
se verificou?
Representa-se por P(A/B) a probabilidade de A se realizar em dada experiência aleatória sabendo que B se realizou ( (A/B) significa A dado B).
Exemplo do lançamento de um dado: Espaço de resultados: Ω=1,2,3,4,5,6 A = “saída de número par” B = “saída de número impar”
P(“sair o nº 6”) = 6
1, mas P(“sair o nº 6”/A) ≠ P(“sair o nº 6”/B)
Definição de probabilidade condicionada
Seja (Ω,ℑ,P) um espaço de probabilidades e B∈ℑ tal que P(B) ≠ 0, a função
( ) ( )( )BP
BAPB/AP
∩= diz-se probabilidade condicional (ou condicionada) de A
por B.
Esta função é uma probabilidade, pois verifica os axiomas P1, P2 e P3 sobre o mesmo espaço (Ω,ℑ). Tem-se ainda:
P(A/A) = 1 P(A/Ā) = 0
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 9
Se B⊆A então P(A/B) = 1
Exemplo do lançamento de um dado: No exemplo anterior:
P(“sair o nº 6”/A) = ( )
( )par" nºsair "P
par" nºsair " e 6" nº sair"P=
63
61
=3
1
P(“sair o nº 6”/B) = ( )
( )impar" nºsair "P
impar" nºsair " e 6" nº sair"P=
630
=0
P(“sair o nº ≤4”/A) = ( )( )par" nºsair "P
par" nºsair " e 4" nº sair"P ≤=
63
62
=3
2
Para calcular P(A/B), B funciona como espaço de resultados (reduzido), sendo P(A/B) uma fracção de P(B), que corresponde a A∩B.
Do mesmo modo, podemos definir ( ) ( )( )AP
BAPA/BP
∩= , quando P(A) ≠ 0.
Se P(A)>0 e P(B)>0, obtemos então:
P(A∩B) = P(A) × P(B/A) = P(B) × P(A/B)
Exemplo: Consideram-se duas caixas de parafusos: Caixa A com 10 parafusos, dos quais 8 são bons e 2 defeituosos; Caixa B com 12 parafusos, dos quais 7 são bons e 5 defeituosos. Escolhe-se uma caixa ao acaso e um parafuso ao acaso. Vamos definir os acontecimentos A = “o parafuso escolhido é da caixa A” e B = “o parafuso escolhido é bom”.
P(B/A) = 10
8 =
5
4 P(B/Ā) =
12
7
P(A∩B) = P(A) × P(B/A) = 5
4
2
1 × =5
2
P(Ā∩B) = P(Ā) × P(B/ Ā) = 12
7
2
1 × =24
7
1.4.1. Teorema das Probabilidades Compostas
Dados n acontecimentos n21 A,,A,A L tais que ( ) 0AAAP 1n21 >∩∩∩ −L , tem-se
( ) ( ) ( ) ( ) ( )1n1n213121n1 AA/APAA/APA/APAPAAP −∩∩××∩××=∩∩ LLL
Demonstração Dado que 1212n11n1 AAAAAAA ⊆∩⊆⊆∩∩⊆∩∩ −− LLL ,
então ( ) ( ) ( ) ( )1212n11n1 APAAPAAPAAP0 ≤∩≤≤∩∩≤∩∩< −− LLL são possíveis todas as probabilidades condicionadas
Para n=2, vem pela definição:
( ) ( ) ( )12121 A/APAPAAP ×=∩
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 10
Considerando-se que se verifica para n-1, isto é:
( ) ( ) ( ) ( )2n11n1211n1 AA/APA/APAPAAP −−− ∩∩×××=∩∩ LLL
Vai verificar-se para n:
( )n1 AAP ∩∩L = ( )( )n1n1 AAAP ∩∩∩ −L = ( ) ( )1n1n1n1 AA/APAAP −− ∩∩×∩∩ LL =
( ) ( ) ( ) ( )1n1n2n11n121 AA/APAA/APA/APAP −−− ∩∩×∩∩××× LLL
Pelo princípio de indução matemática fica provado o teorema.
Exemplo: Numa caixa há 20 peças, das quais 5 são defeituosas. Tiram-se sucessivamente e ao acaso 3 peças. Qual a probabilidade de que nenhuma seja defeituosa? Vamos definir os acontecimentos Ai = “saída de peça não defeituosa na i-ésima tiragem”, i=1, 2, 3. Temos então:
( )321 AAAP ∩∩ = ( ) ( ) ( )213121 AA/APA/APAP ∩×× = 18
13
19
14
20
15 ×× = 228
91
1.4.2. Teorema das Probabilidades Totais
Uma família de acontecimentos A1, ..., An é uma partição de Ω se Ai ∩ Aj = ∅, para i≠j
Un
1i iA= = A1∪A2∪...∪An = Ω
Podemos considerar partições com um número finito ou infinito numerável de elementos. Uma partição finita ou infinita numerável tem como propriedade imediata:
( ) ( )∑= ii APAPU =1
Teorema Se A1, ..., An é uma partição de Ω, e se P(Ai) > 0, i=1,2,...,n, então para
qualquer acontecimento B:
( ) ( ) ( )∑ = ×= n1i ii A/BPAPBP
ΩΩΩΩ A1 B
A4
A3
A2
A5
Demonstração B = B ∩ Ω = B ∩ (A1 ∪ A2 ∪ ... ∪ An) = (B ∩ A1) ∪ (B ∩ A2) ∪ ... ∪ (B ∩ An)
P(B) = P((B ∩ A1) ∪ (B ∩ A2) ∪ ... ∪ (B ∩ An)) = P(B ∩ A1) + P(B ∩ A2) + ... + P(B ∩ An) =
= P(A1)×P(B/A1) + P(A2)×P(B/A2) + ... + P(An)×P(B/An) = ( ) ( )∑ = ×n1i ii A/BPAP
Exemplo das caixas de parafusos: Qual a probabilidade do parafuso escolhido ser bom?
P(B) = P(A) × P(B/A) + P(Ā) × P(B/Ā) = 5
4
2
1 × +12
7
2
1 × = 5
2+
24
7 =
120
83
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 11
1.4.3. Teorema de Bayes
Se A1, ..., An é uma partição de Ω, com P(Ai) > 0, i=1,2,...,n, e dado qualquer acontecimento B, P(B)>0, então:
( ) ( ) ( )( ) ( )∑ = ×
×=n
1j jj
iii
A/BPAP
A/BPAPB/AP (Fórmula de Bayes)
Esta fórmula, com base em probabilidades “a priori”, P(Ai), combinadas com alguma informação adicional, P(B/Ai), permite fornecer as probabilidades “a posteriori”, P(Ai/B).
Demonstração
( ) ( )( )BP
BAPB/AP i
i∩=
Pelo teorema das probabilidades totais, ( ) ( ) ( )∑ = ×= n1j jj A/BPAPBP
Logo, ( ) ( ) ( )( ) ( )∑ = ×
×=n
1j jj
iii
A/BPAP
A/BPAPB/AP .
Exemplo das caixas de parafusos: Sabendo que o parafuso é bom, qual a probabilidade de ser da caixa A?
P(A/B) = ( ) ( )
( ) ( ) ( ) ( )A/BPAPA/BPAP
A/BPAP
×+××
= 12
72
15
42
15
42
1
×+×
× =
12083
52
= 83
48
Exemplo 1: Sabe-se que 5% da população portuguesa sofre de hipertensão, e que de entre os hipertensos se sabe que 75% ingerem bebidas alcoólicas. De entre os que não são hipertensos, 50% ingerem bebidas alcoólicas. Qual é a percentagem de pessoas que, bebendo álcool, sofrem de hipertensão?
Vamos definir os acontecimentos H = “a pessoa sofre de hipertensão” e B = “a pessoa ingere álcool” Temos então: P(H)=0,05 P(H )=1–P(H)=0,95 P(B/H)=0,75 P(B/H )=0,50 P(H/B)=?
0,05com
hipertensão
sem hipertensão
portugueses
0,95
0,75 ingere álcool
não ingere álcool 0,25
0,50 ingere álcool
não ingere álcool 0,50
P(H/B)=( ) ( )
( ) ( ) ( ) ( )H/BPHPH/BPHPH/BPHP
×+××
=5,095,075,005,0
75,005,0
×+××
=0,0732=7,32%
Qual é a percentagem de pessoas que, não bebendo álcool, sofrem de hipertensão?
( )B/HP =( ) ( )
( ) ( ) ( ) ( )H/BPHPH/BPHP
H/BPHP
×+××
=5,095,025,005,0
25,005,0
×+××
=0,0256=2,56%
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 12
Exemplo 2: Um estudante universitário sabe que tem uma probabilidade igual a 0,3 de obter uma bolsa de estudo. Se obtiver a bolsa de estudo, a probabilidade de que venha a concluir o curso é de 0,85, caso contrário essa probabilidade é de 0,45. Qual é a probabilidade de ele ter tido a bolsa de estudo sabendo que ele concluiu o curso?
0,3com bolsa
sem bolsa
estudante
0,7
0,85 conclui curso
não conclui curso 0,15
0,45 conclui curso
não conclui curso 0,55
Vamos definir os acontecimentos A1 = “o aluno obteve a bolsa de estudo”, A2 = “o aluno não obteve a bolsa de estudo” e B = “o aluno conclui o curso” Temos então: P(A1)=0,3 P(A2)=1–P(A1)=0,7 P(B/A1)=0,85 P(B/A2)=0,45 P(A1/B)=?
P(A1/B)=( ) ( )
( ) ( ) ( ) ( )2211
11A/BPAPA/BPAP
A/BPAP
×+××
=45,07,085,03,0
85,03,0×+×
×=0,4474
Exemplo 3:
O Sr. Silva está a pensar em comprar um carro usado de marca X, em certo stand. Para tomar uma boa decisão, consultou uma revista de automóveis e verificou que dos carros da marca X 30% têm defeitos na transmissão. Para ter mais informação sobre o carro que queria comprar, o Sr. Silva pediu a um mecânico seu amigo para dar uma volta com o carro e dar a sua opinião. Este mecânico não é infalível, sabe-se que dos carros com defeito que analisou, só deu com o defeito em 90% dos casos. Por outro lado, em relação a carros bons, ele acertou em 80% dos casos. Se o mecânico disser ao Sr. Silva que o carro é bom, qual é a probabilidade de que o carro tenha um defeito?
carro bom
0,30com defeito
sem defeito
carros da marca X
0,70
0,10 carro bom
carro mau 0,90
0,80
0,20carro mau
situação do carro mecânico classifica
Vamos definir os acontecimentos D1 = “o carro tem um defeito”, D2 = “o carro não tem um defeito” e B = “o mecânico diz que o carro é bom” Temos então: P(D1)=0,30 P(D2)=1–P(D1)=0,70 P(B/D1)=0,10 P(B/D2)=0,80 P(D1/B)=?
P(D1/B)=( ) ( )
( ) ( ) ( ) ( )2211
11D/BPDPD/BPDP
D/BPDP×+×
×=
8,07,01,03,01,03,0
×+××
=0,0508
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 13
1.4.4. Independência de Acontecimentos
Dois acontecimentos A e B dizem-se independentes se e só se
P(A∩B)=P(A)×P(B)
Esta definição é válida para P(A)≥0 e P(B)≥0. Assim, se A for tal que P(A)=0, então A é independente de qualquer outro acontecimento, e, em particular, é independente de ∅ e de Ω.
Se A e B são independentes, então temos que:
P(A/B)=P(A∩B)/P(B)=P(A)×P(B)/P(B)=P(A) se P(B)>0, significando que B não afecta a ocorrência de A
P(B/A)=P(A∩B)/P(A)=P(A)×P(B)/P(A)=P(B) se P(A)>0, significando que A não afecta a ocorrência de B
Exemplo da extracção de 3 peças: Considerando-se que a extracção é feita com reposição. Neste caso, os acontecimentos A1, A2 e A3 são independentes e por isso:
( )321 AAAP ∩∩ = ( ) ( ) ( )321 APAPAP ×× = 20
15
20
15
20
15 ×× = 3
4
3
= 64
27
Exemplo: No lançamento de dois dados, o número de pontos que sai num dado é independente do outro.
Acontecimentos independentes e acontecimentos incompatíveis traduzem relações diferentes.
Se P(A)>0 e P(B)>0, caso A e B sejam incompatíveis não podem ser independentes, visto que se tem:
A∩B=∅ ⇒ 0=P(A∩B)≠P(A)×P(B)
A realização de um implica a não realização do outro. As duas relações só coincidem se P(A)=0 (ou P(B)=0).
Teorema Se A e B são independentes, então também o são: A e B ; Ā e B; Ā e B .
Demonstração Se A e B são independentes, então P(A∩B)=P(A)×P(B).
Então, P(A∩ B )=P(A)-P(A∩B)=P(A)-P(A)×P(B)=P(A)×(1-P(B))=P(A)×P(B ), e por isso, A e B são independentes.
Então, P(Ā∩B)=P(B)-P(A∩B)=P(B)-P(A)×P(B)=(1-P(A))×P(B)=P(Ā)×P(B), e por isso Ā e B são independentes.
Então, P(Ā∩ B )=P( BA ∪ )=1–P(A∪B)=P(Ā)-P(B)+P(A∩B)= P(Ā)-P(B)+P(A)×P(B)=P(Ā)+(P(A)-1)×P(B)=P(Ā)-P(Ā)×P(B)=P(Ā)×P(B ), e por isso Ā e B são independentes.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 14
2. VARIÁVEIS ALEATÓRIAS Em muitas experiências aleatórias, os elementos do espaço de resultados
são números reais. Quando Ω não é um conjunto numérico, a aplicação de um procedimento estatístico passa, em geral, pela atribuição de um número real a cada elemento de ω∈Ω. Esta atribuição pode ser convencional.
Consideramos então uma função real e finita:
X: Ω → R
Dado um acontecimento, A⊆Ω, chama-se imagem de A por X a:
X(A) = X(ω): ω∈A (conjunto de números reais)
Por outro lado, para cada subconjunto E⊆R, podemos considerar X-1(E):
X-1(E) = ω: X(ω)∈E (imagem inversa de E)
X(ω)∈E ⇔ ω∈X-1(E)
Dado um espaço de probabilidades (Ω,ℑ,P), uma função X: Ω → R é uma variável aleatória se,
∀x∈R, o conjunto ω: X(ω)≤x ∈ ℑ
Assim, podemos definir a probabilidade associada ao conjunto E⊆R:
P(X(ω)∈E) = P(X-1(E))
PX(E) = P(X-1(E)), dado que X-1(E)∈ℑ e logo X-1(E)⊆Ω
Exemplo: Um casal quer ter 3 filhos. Quais são os resultados possíveis em termos de meninos e meninas?
MMM MMF M FM FMM M FF F FM FM F F F F
0
1
2
3
Ω
#Ω=8
X = “número de meninas”
X(ω)∈0,1,2,3
P(X=0) = P(MMM) = 1/8 P(X=1) = P(MMF,MFM,FMM) = 3/8 P(X=2) = P(MFF,FFM,FMF) = 3/8 P(X=3) = P(FFF) = 1/8
2.1. FUNÇÃO DE DISTRIBUIÇÃO
Podemos assim calcular P(X = a), P(a<X<b), P(X≤c), P(X>c), com a, b, c∈R.
Tem-se, em particular, que P(X≤c) + P(X>c) = 1 ⇔ P(X≤c) = 1 – P(X>c).
Assim, ∀x∈R, podemos calcular P(X≤x) que é uma função de x. F: R → [0;1] F(x) = P(X≤x)
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 15
é a função de distribuição da variável aleatória X. Esta função dá-nos a probabilidade de X tomar valores inferiores ou iguais a um dado número real
Propriedades:
P1) 0≤F(x)≤1, qualquer que seja a função de distribuição, visto que F(x) é uma probabilidade.
P2) F(x) é não decrescente
P3) 0)x(Flimx
=−∞→
e 1)x(Flimx
=+∞→
P4) P(x1<X≤x2) = F(x2) – F(x1)
P5) Toda a função de distribuição é contínua à direita.
Exemplo anterior do número de meninas (ou nº de coroas em 2 dados):
( )
≥<≤<≤<≤
<
=
3x,1
3x2,8/7
2x1,2/1
1x0,8/1
0x,0
xF
0 0.2 0.4 0.6 0.8 1
0 1 2 3 nº de meninas
F(x) Função de Distribuição
2.2. VARIÁVEL ALEATÓRIA DISCRETA Uma variável aleatória X diz-se discreta se o conjunto de pontos para os
quais X tem probabilidade positiva é finito ou infinito numerável. A variável aleatória X só toma valores num conjunto numerável.
Sejam x1, x2, x3, ... os valores que X pode tomar e p1, p2, p3, ..., as respectivas probabilidades, pi = P(X = xi)
Chamamos função de probabilidade de X à função:
( ) ==
= valoresoutros ,0
2, 1,i, xx ,pxf ii K
Exemplo anterior do número de meninas (ou nº de coroas em 2 dados):
( )
=∨==∨=
=
=
xde valoresoutros,0
2 x 1x,8/3
3 x 0x,8/1
xf
meninas" de número"X
0
3/8
0 1 2 3
função de probabilidade
nº de meninas
1/8
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 16
Exemplo lançamento de um dado:
022
0
1/6
0 1 2 3 4 5 6
função de probabilidade
nº pontos
Dos axiomas de probabilidade, tem-se:
- f(x)≥0, ∀x∈R
- ∑f(xi) = ∑pi = 1
- ( ) ( )∑∈
=∈⊆∀Ex
i
i
xfEXP ,RE
A função de distribuição de uma variável aleatória discreta pode então escrever-se:
F(x) = P(X≤x) = ( )∑≤xx
i
i
xf = ∑≤xx
i
i
p
A função de distribuição de uma variável aleatória discreta apresenta tanto “saltos” quantos os pontos xi de probabilidade diferente de zero.
O caso mais simples de uma variável aleatória discreta (caso degenerado) é aquele em que há apenas um valor para o qual a probabilidade é positiva (p=1).
0
1
a x
f(x)
( )
≠=
=ax ,0
ax ,1xf
0
1
a x
F(x)
( )
≥<
=ax ,1
ax ,0xF
2.3. VARIÁVEL ALEATÓRIA CONTÍNUA Uma variável aleatória X diz-se contínua se existir uma função f(x), não
negativa f(x)≥0, ∀x∈R, tal que:
( ) ( )∫∞−
∈∀=x
Rx,dttfxF
Se esta função existir, é chamada função densidade de probabilidade.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 17
Neste caso, F(x) é contínua em todos os pontos e também derivável em quase todos os pontos. Derivando F(x) obtém-se:
F’(x) = f(x)
em todos os pontos de x onde f(x) é contínua. Nos outros pontos f(x) = 0. Isto é, a função densidade de probabilidade f(x) é a derivada da função de distribuição.
Do axioma 1 das probabilidades, tem-se:
( ) 1dttf =∫+∞
∞−
Uma função f(x) é uma função densidade de probabilidade se e só se:
f(x)≥0, ∀x∈R
( ) 1dttf =∫+∞
∞−
Tem-se ainda que:
( ) ( ) ( ) ( ) ( ) ( )∫∫∫ =−=−=≤<∞−∞−
b
a
ab
dttfdttfdttfaFbFbXaP
Isto é, a probabilidade de que a variável aleatória X tome valores entre a e b é igual à área sob a curva f(x) entre x=a e x=b.
0
f(µµµµo)
b x
f(x)
a
( )bXaP ≤<
Área total sob a curva = ( ) 1dttf =∫+∞
∞−
Então, para um pequeno intervalo de comprimento ∆x centrado em x=c, a probabilidade associada é aproximada por ∆x×f(c) (área do rectângulo). Quando ∆x tende para zero, visto que F(x) é contínua, tem-se:
P(X=c) = 0, qualquer que seja c.
Atenção que pelo facto da probabilidade ser nula, não significa que X=c seja um acontecimento impossível!
Da continuidade de F(x) resulta que as probabilidades P(a<X≤b), P(a<X<b), P(a≤X<b), P(a≤X≤b) são todas iguais, o que não é verdade no caso discreto.
P(a<X≤b) = P(a<X<b) = P(a≤X<b) = P(a≤X≤b) = ( )∫b
a
dttf
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 18
Exemplo 1:
Suponha que X uma variável aleatória com função densidade:
( )( )
>≤≤
<=
−− 1x,e
1x0,5,0
0x,0
xf1x2
1) Verificar que f(x) é uma função densidade de probabilidade
f(x)≥0, pois ( ) 0e 1x2 ≥−− ; 0,5≥0 e 0≥0
( )∫+∞
∞−dttf = ( )
∫∫ ∫+∞
−−
∞−++
1
1t20 1
0
dtedt5,0dt0 = [ ]( ) x
0
1t2
x
10 2
elimt5,00
−++
−−
+∞→ =
( )
2
1
2
elim05,0
1x2
x+
−+−
−−
+∞→ = 0+1 = 1
2) Calcular a função de distribuição F(x)
( ) ( ) ( )∫∞−
=≤=x
dttfxXPxF
Se x<0, ( )xF = ∫∞−
x
dt0 = 0
Se 0≤x≤1, ( )xF =
( )
∫∫ +∞−
x
0
0F
0
dt2
1dt0
321
= x
02
t0
+ = 2
x
Se x>1, ( )xF =
( )
( )∫∫∫
−−
∞−++
x
1
1t2
1F
1
0
0
dtedt2
1dt0
4434421
= ( ) x
1
1t21
0 2
e
2
t0
−+
+−−
=
( )
2
1
2
e0
2
1 1x2+−−
−− =
( )
2
e1
1x2 −−−
( )( )
≥×−≤≤×
<=
−− 1x,e5,01
1x0,x5,0
0x,0
xF1x2
Exemplo 2:
Suponha que X é o tempo de vida de uma lâmpada, em anos, com função densidade:
( )
<≥=
−
0x,0
0x,e2xf
x2
1) Verificar que f(x) é uma função densidade de probabilidade
f(x)≥0, 0e20e x2x2 ≥⇔≥ −−
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 19
( )∫+∞
∞−dttf = ∫∫
+∞−
∞−+
0
t20
dte2dt0 = ∫−
+∞→+
x
0
t2
xdte2lim0 = [ ]x
0t2
xelim −
+∞→− =
( )1elim x2
x+− −
+∞→ = ( ) 1elim x2
x+− −
+∞→ = 0+1 = 1
2) Calcular P(X≥3)
P(X≥3) = ( )∫+∞
3
dttf = ∫+∞
−
3
t2 dte2 = ∫−
+∞→
x
3
t2
xdte2lim = [ ]x
3t2
xelim −
+∞→− =
( )6x2
xeelim −−
+∞→+− = ( ) 6x2
xeelim −−
+∞→+− = 6e0 −+ = 6e− ≈ 0,0025 = 0,25%
Exemplo 3:
Suponha que X é o tempo de vida de um novo tipo de lâmpadas, em milhares de anos, com função densidade de probabilidade:
( ) ( )[ ]
≤≤−−=
valoresoutros ,0
2x1 ,5,1x25,06xf2
1) Verificar que f(x) é uma função densidade de probabilidade
f(x)≥0, 2x1 ≤≤ ⇔ 5,05,1x5,0 ≤−≤− ⇒ ( ) 25,05,1x0 2 ≤−≤ ⇔
( ) 25,05,1x25,00 2 ≤−−≤ ⇔ ( ) 5,1xf0 ≤≤ ⇒ f(x)≥0
( )∫+∞
∞−dttf = ( )[ ] ∫∫∫
+∞
∞−+−−+
2
2
1
21
dt0dt5,1t25,06dt0 = ( )∫ −+−2
1
2 dtt325,2t65,1 =
∫ +−−2
1
2 tdt185,13t65,1 = ∫ −−2
1
2 dt12t6t18 = [ ]21
32 t12t2t9 −− =36-16-24-9+2+12=1
2.4. VALOR MÉDIO, VARIÂNCIA E ASSIMETRIA DE UMA VARIÁVEL ALEATÓRIA
2.4.1. Valor Médio
O valor médio ou média de uma distribuição, geralmente designa-se por µ, é dado por:
( )∑ ×=µx
xfx , se a distribuição é de uma variável discreta
( )∫+∞
∞−=µ dxxxf , se a distribuição é de uma variável contínua
Se a série (no caso discreto) ou o integral (no caso contínuo) não forem convergentes, diz-se que não existe média.
A média é também chamada de valor esperado e notada por E(X).
A moda corresponde ao valor de x para o qual f(x) é máxima localmente.
f(x)máx :Rxo ∈=µ
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 20
A mediana corresponde ao ponto onde a função de distribuição atinge os 0,5. Ou seja, no caso de X variável aleatória contínua:
( ) 0,5F : ee =µµ
Exemplo discreto – lançamento de um dado:
( )∑ ×=µx
xfx =6
16
6
15
6
14
6
13
6
12
6
11 ×+×+×+×+×+× =
6
21=3,5
Em média saem 3,5 pontos no lançamento do dado.
Exemplo discreto – número de meninas (ou nº de coroas em 2 dados):
( )∑ ×=µx
xfx =8
13
8
32
8
31
8
10 ×+×+×+× =
8
12=1,5
Em média o número de meninas é de 1,5.
Exemplo contínuo 1:
( )∫+∞
∞−=µ dxxxf = ( )
∫∫∫+∞
−−
∞−++
1
1x21
0
0
dxxexdx5,0dx0 = (integração por partes) =
( ) ( )
−−
−+
+ ∫
α −−α−−
+∞→α1
1x2
1
1x21
0
2dx
2
e
2
exlim
4
x0 =
( )( ) α−−
+∞→α−α+∞→α
−+
α−+−1
1x20
12 4
elim
2
e
e2lim0
4
1 =
( )( )
4
e
4
elim
2
1
e4
1lim
4
1 012
12+
−+
−−α−
+∞→α−α+∞→α =
4
100
4
3 +−− = 1
Exemplo contínuo 2:
( )∫+∞
∞−=µ dxxxf = ∫∫
+∞−
∞−+
0
x20
dxxe2dx0 = ∫α
−+∞→α
+0
x2 dxxe2lim0 = (integração por partes)
= [ ]
−−− ∫
α−α−
+∞→α0
x20
x2 dxexelim =
α−
+∞→α+∞→α
−+
−0
x20
x2 2
elime0
e
xlim =
2
e
2
elim
e2
1lim
02
x2+−
−α−
+∞→α+∞→α =
2
100 +− = 0,5
Em média uma lâmpada dura 0,5 anos.
2.4.2. Valor Esperado
Seja g(X) uma função da variável aleatória X. O valor esperado de g(X), E(g(X)) se existir é dado por:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 21
( )( ) ( ) ( )∑ ×=x
xfxgXgE , se X é uma variável discreta
( )( ) ( ) ( )∫+∞
∞−×= dxxfxgXgE , se X é uma variável contínua
Propriedades:
P1) E(c) = c , qualquer que seja a constante c
( ) ( )∫+∞
∞−×= dxxfccE = ( )∫
+∞
∞−dxxfc = 1c× =c
P2) Se E(g(X)) existe e c é uma constante, então E(c×g(X)) = c×E(g(X))
P3) Se E(g1(X)) e E(g2(X)) existem, então E[g1(X)+g2(X)] = E(g1(X))+E(g2(X))
P4) Se E(g(X)) existe e a e b são constantes, então E(a×g(X)+b)=a×E(g(X))+b
2.4.3. Momentos
O momento de ordem k em relação à origem, ou momento ordinário de ordem k, é dado pela seguinte expressão:
( )kk XE' =µ
Para k=1, ( )XE'1 =µ=µ .
O momento de ordem k em relação à média, ou momento centrado de ordem k, é dado pela seguinte expressão:
( )[ ]kk XE µ−=µ
Em particular, para k=1 vem que: ( ) ( ) 0XEXE1 =µ−=µ−=µ
2.4.4. Variância
O momento centrado de ordem 2, ( )[ ] ( )XVXE 222 =σ=µ−=µ é a variância
O desvio padrão é dado por: 2σ+=σ .
Assim, a expressão para cálculo da variância é uma das seguintes:
( ) ( ) ( )∑ ×µ−=σ=x
22 xfxXV , se X é uma variável discreta
( ) ( ) ( )∫+∞
∞−×µ−=σ= dxxfxXV 22 , se X é uma variável contínua
Tem-se ainda que: ( ) ( ) ( )[ ] ( )21222 ''XEXEXV µ−µ=−=
( ) ( )( )[ ]2XEXEXV −= = ( )( ) ( )[ ]XEX2XEXE 22 ×−+ =
( ) ( )( )[ ] ( )[ ]XEXE2XEEXE 22 ×−+ = ( ) ( )[ ] ( ) ( )XEXE2XEXE 22 −+ =
( ) ( )[ ] ( )[ ]222 XE2XEXE −+ = ( ) ( )[ ]22 XEXE −
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 22
Propriedades da Variância:
P1) Se a é uma constante, então V(a) = 0
P2) Se a é uma constante, então V(a×X) = a2×V(X)
P3) Se a e b são constantes, então V(a×X+b) = a2×V(X)
A variância é uma medida de dispersão dos valores da variável aleatória X em torno da média. Uma medida de dispersão relativa será o coeficiente de variação e é igual, no caso de existir:
µσ=CV
Exemplo discreto – lançamento de um dado:
V(X)= ( ) ( )∑ −x
2 xf5,3x = ( ) ( ) ( )6
15,2
6
15,1
6
15,0
6
15,0
6
15,1
6
15,2 222222 +++−+−+− =
2,92 ⇒ ( ) 92,2XV =+=σ =1,7
Exemplo discreto – número de meninas:
V(X)= ( ) ( )∑ −x
2 xf5,1x = ( ) ( )8
15,1
8
35,0
8
35,0
8
15,1 2222 ×+×+×−+×− = 0,75
( ) 75,0XV =+=σ =0,87
Exemplo contínuo:
( )∫+∞
∞−=µ dxxfx' 2
2 = ∫∫+∞
−
∞−+
0
x220
dxex2dx0 = ∫α
−+∞→α
+0
x22 dxex2lim0 =
[ ]
−−− ∫
α−α−
+∞→α0
x20
x22 dxxe2exlim = ∫α
−+∞→α+∞→α
++
−
0
x202x2
2dxxe2lime0
e
xlim =
2
1
e2
x2lim
x2+
−+∞→α
= 2
1
e2
1lim
x2+
−+∞→α
= 2
10+ = 0,5
V(X)= ( )212 '' µ−µ = 2
2
1
2
1
− = 4
1
2
1 − = 4
1 = 0,25 ⇒ ( ) 25,0XV =+=σ =0,5
2.4.5. Função Geradora de Momentos
Para calcular os momentos é, por vezes, mais simples utilizar a função geradora de momentos:
Ψ(t) = ( )tXeE
A função geradora de momentos está definida para todos os valores de t onde existe este valor esperado.
( ) ( ) ( )∑==Ψx
txtX xfeeEt , se X é uma variável discreta
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 23
( ) ( ) ( )∫+∞
∞−==Ψ dxxfeeEt txtX , se X é uma variável contínua
Derivando estas expressões, obtém-se:
( ) ( )∑=Ψx
tx xfxet'
( ) ( )∑=Ψx
txk)k( xfext , no caso discreto
( ) ( )∫+∞
∞−=Ψ dxxfxet' tx
( ) ( )∫+∞
∞−=Ψ dxxfext txk)k( , no caso contínuo
Calculando estas derivadas para t=0, vem que:
( ) ( )∑=Ψx
x0k)k( xfex0 = ( )∑x
k xfx = ( )kXE , no caso discreto
( ) ( )∫+∞
∞−=Ψ dxxfex0 x0k)k( = ( )∫
+∞
∞−dxxfxk = ( )kXE , no caso contínuo
Ou seja, as derivadas da função geradora de momentos calculadas para t=0 são iguais aos momentos ordinários de ordem da derivada respectiva,
( )( )0' kk Ψ=µ . Em particular, ( ) ( )0'XE Ψ==µ .
Exemplo discreto:
Seja X uma variável que representa o número de insucessos (probabilidade de insucesso q) antes de obter sucesso (probabilidade de sucesso p=1-q) numa determinada experiência:
( ) pqxf x= , x = 0, 1, 2, ...
Ψ(t)= ( )∑x
tx xfe = ∑∞
=0x
xtx pqe = ( )∑∞
=0x
xtqep = tqe1
1p
−× , se 1qet < ⇔
q
1et < ⇔
⇔ ( )qlnt −<
Ψ(t) = ( ) 1tqe1p−
− , ( )qlnt −<
Ψ’(t) = ( ) 2tt qe1pqe−
− ⇒ Ψ’(0) = ( ) 2q1pq −− = 2pqp −×× = p
q
2.4.6. Assimetria
Uma distribuição é simétrica em relação a um valor c se e só se:
f(c–d) = f(c+d) , ∀d>0
Se a distribuição é simétrica, então é simétrica em relação à média (ou seja, c=µ), e se o seu 3º momento centrado existe, então é nulo. Assim como, se existir o momento centrado de uma ordem ímpar qualquer, ele será nulo se a distribuição for simétrica.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 24
Medida de Assimetria (não depende de unidades)
( )( )[ ]
3
3
23
2
31
XE
σµ−=
µ
µ=γ
Coeficiente de Achatamento
( )( )[ ]
3XE
34
4
22
42 −
σµ−=−
µµ=γ
Quando 2γ =0, corresponde a uma distribuição mesocúrtica, como a distribuição Normal. No caso de 2γ >0, distribuição leptocúrtica, a distribuição apresenta as caudas mais “espessas” e com a zona central mais “pontiaguda” que a distribuição Normal. No caso contrário, 2γ <0, distribuição platicúrtica, a distribuição apresenta as caudas mais “finas” e com a zona central mais “achatada” que a distribuição Normal.
Exemplo de verificação da simetria:
Considere-se a função densidade de probabilidade:
( )
≤<−≤≤<≤
=
valoresoutros,0
3x2,2/x2/3
2x1,2/1
1x0,2/x
xf
( ) ( )∫+∞
∞−==µ dxxxfXE = ∫∫ ∫∫∫
+∞
∞−+−+++
2
2
1
3
2
21
0
20
dx0dx2
x
2
x3dx
2
xdx
2
xdx0 =
06
x
4
x3
4
x
6
x0
3
2
322
1
21
0
3+
−+
+
+ =
6
8
4
12
6
27
4
27
4
110
6
1 +−−+−+− = 3/2
A distribuição de X será simétrica se e só se f(3/2–d) = f(3/2+d) , ∀d>0
Para 0<d≤1/2, 3/2<3/2+d≤2 ⇒ f(3/2+d) = 1/2 1≤3/2-d<3/2 ⇒ f(3/2-d) = 1/2
Para 1/2<d≤3/2, 2<3/2+d≤3 ⇒ f(3/2+d) = 3/2-(3/2+d)/2 = 3/4-d/2 0≤3/2-d<1 ⇒ f(3/2-d) = (3/2-d)/2 = 3/4-d/2
Para d>3/2, 3/2+d>3 ⇒ f(3/2+d) = 0 3/2-d<0 ⇒ f(3/2-d) = 0
Logo, como para todo o d>0, f(3/2–x) = f(3/2+x) a distribuição é simétrica em relação ao ponto µ=3/2.
Exemplo discreto – lançamento de um dado:
µ3= ( ) ( )∑ −x
3 xf5,3x = ( ) ( ) ( )6
15,2
6
15,1
6
15,0
6
15,0
6
15,1
6
15,2 333333 +++−+−+− = 0
317,1
0=γ = 0, pois a distribuição é simétrica.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 25
Exemplo discreto – número de meninas:
µ3= ( ) ( )∑ −x
3 xf5,1x = ( ) ( )8
15,1
8
35,0
8
35,0
8
15,1 3333 ×+×+×−+×− = 0
3187,0
0=γ = 0, pois a distribuição é simétrica.
Exemplo contínuo:
Considere-se a função densidade de probabilidade:
( ) ≤≤
= valoresoutros ,0
2x0,2/1xf
( ) ( )∫+∞
∞−==µ dxxxfXE = ∫∫∫
+∞
∞−++
2
2
0
0
dx0dx2
xdx0 = 0
4
x0
2
0
2+
+ = 0
4
4 − = 1
( ) ( )∫+∞
∞−==µ dxxfxXE' 22
2 = ∫∫∫+∞
∞−++
2
2
0
20
dx0dx2
xdx0 = 0
6
x0
2
0
3+
+ = 0
6
8 − = 3
4
V(X)= ( )212 '' µ−µ = 213
4 − = 3
1 ⇒ ( ) 3/1XV =+=σ =0,577
( )[ ] ( ) ( )∫+∞
∞−−=−=µ dxxf1x1XE 33
3 =( )
∫∫∫+∞
∞−+−+
2
2
0
30
dx0dx2
1xdx0 =
( )0
8
1x0
2
0
4+
−+
= 8
1
8
1 − = 0 ⇒ 31
577,0
0=γ = 0, pois a distribuição é simétrica.
2.5. TRANSFORMADAS DE VARIÁVEIS ALEATÓRIAS O objectivo das transformadas de variáveis aleatórias é obter a função que
descreve a distribuição da variável aleatória Y dada como uma transformação de uma variável aleatória X para a qual se conhece a sua distribuição. Esta transformação pode ser dada por ( )XY ϕ= . Temos que distinguir os dois casos diferentes que pode ser a variável X, caso discreto e caso contínuo.
2.5.1. Variável Aleatória Discreta
Neste caso temos uma variável aleatória X discreta, para a qual conhecemos a sua função de probabilidade dada por ( )xfX . O objectivo é determinar a função de probabilidade da variável aleatória ( )XY ϕ= , que será representada por ( )yfY .
Pela definição de função de probabilidade obtém-se as seguintes igualdades:
( ) ( )yYPyfY == ( )( )yXP =ϕ= ( )( )∑ϕ=
==xy
xXP ( )( )∑ϕ=
=xy
X xf
Ou seja, a função de probabilidade de Y pode ser calculada pela seguinte expressão
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 26
( ) ( )( )∑ϕ=
=xy
XY xfyf
Exemplo
Seja X uma variável aleatória discreta com a função de probabilidade:
X -1 0 1 2 3
( )xfX 1/4 1/8 1/8 3/8 1/8
Seja Y a variável aleatória dada pela expressão Y=X2+1, a sua função de probabilidade será:
Y=X2+1 1 2 5 10
( ) ( )∑+=
=1xyXY
2
xfyf 1/8 3/8 (1/4+1/8)
3/8 1/8
Seja T a variável aleatória dada pela expressão T=(X-1)2/2, a sua função de probabilidade será:
T=(X-1)2/2 0 1/2 2
( ) ( )∑−=
=2/)1x(t
XT2
xftf 1/8 1/2 (1/8+3/8)
3/8 (1/4+1/8)
2.5.2. Variável Aleatória Contínua
Neste caso temos uma variável aleatória X contínua, para a qual conhecemos a sua função densidade de probabilidade dada por ( )xfX . O objectivo é determinar a função densidade de probabilidade da variável aleatória ( )XY ϕ= , que será representada por ( )yfY .
A transformação obtém-se relacionando as funções de distribuição de Y e de X. Com esta relação pode-se obter uma fórmula de determinar a relação entre a função densidade de Y e a de X.
( ) ( )yYPyFY ≤= ( )( )yXP ≤ϕ=
A inequação ( ) yX ≤ϕ terá de ser resolvida em relação a X. Esta resolução depende da forma da função ( )Xϕ que transforma a variável X em Y. Se esta função for injectiva crescente, se for injectiva decrescente ou se não for injectiva, terá uma resolução diferente.
2.5.2.1. ϕϕϕϕ(X) injectiva crescente
( ) ( )yYPyFY ≤= = ( )( )yXP ≤ϕ ( )( )yXP 1−ϕ≤= ( )( )yF 1X
−ϕ=
Derivando a função de distribuição obtém-se a função densidade de probabilidade:
( ) ( )[ ]yFdy
dyf YY = ( )( )[ ]yF
dy
d 1X
−ϕ= = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 27
Ou seja, obtém-se uma forma de calcular a função densidade de Y a partir da função densidade de X que, sendo ϕ(X) uma função injectiva e crescente, é dada pela seguinte expressão:
( )yfY = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ
Exemplo
Seja X uma variável aleatória contínua para a qual conhecemos a sua função densidade de probabilidade. Seja Y a variável aleatória dada pela expressão Y=2X+1.
Como ϕ(X)=2X+1 é uma função injectiva crescente, pode-se usar a relação anterior:
1x2y += ⇔ 2
1yx
−= ⇔ ( )2
1yy1 −=ϕ− ⇒ ( )[ ]
2
1y
dy
d 1 =ϕ−
( )yfY = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ =
2
1
2
1yf X ×
−
Considere-se a função densidade de probabilidade de X:
( )
≤<−≤≤<≤
=
valoresoutros,0
3x2,2/x2/3
2x1,2/1
1x0,2/x
xf X
Para 1≤y<3, 0≤y-1<2 ⇒ 12
1y0 <−≤ ⇒
4
1y
2
1yf X
−=
− ⇒ ( )
8
1yyf Y
−=
Para 3≤y≤5, 2≤y-1≤4 ⇒ 22
1y1 ≤−≤ ⇒
2
1
2
1yf X =
− ⇒ ( )
4
1yf Y =
Para 5<y≤7, 4<y-1≤6 ⇒ 32
1y2 ≤−< ⇒
4
1y
2
3
2
1yf X
−−=
−⇒ ( )
8
1y
4
3yf Y
−−=
Para y>7, y-1>6 ⇒ 32
1y >− ⇒ 0
2
1yf X =
− ⇒ ( ) 0yf Y =
Para y<1, y-1<0 ⇒ 02
1y <− ⇒ 0
2
1yf X =
− ⇒ ( ) 0yf Y =
( )
≤<−−≤≤<≤−
=
valoresoutros,0
7y5,8/)1y(4/3
5y3,4/1
3y1,8/)1y(
yf Y
2.5.2.2. ϕϕϕϕ(X) injectiva decrescente
( ) ( )yYPyFY ≤= = ( )( )yXP ≤ϕ ( )( )yXP 1−ϕ≥= ( )( )yF1 1X
−ϕ−=
Derivando a função de distribuição obtém-se a função densidade de probabilidade:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 28
( ) ( )[ ]yFdy
dyf YY = ( )( )[ ]yF1
dy
d 1X
−ϕ−= = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ−
Ou seja, obtém-se uma forma de calcular a função densidade de Y a partir da função densidade de X que, sendo ϕ(X) uma função injectiva e decrescente, é dada pela seguinte expressão:
( )yfY = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ−
Exemplo
Seja X uma variável aleatória contínua para a qual conhecemos a sua função densidade de probabilidade. Seja Y a variável aleatória dada pela expressão Y=-2X+1.
Como ϕ(X)=-2X+1 é uma função injectiva decrescente, pode-se usar a relação anterior:
1x2y +−= ⇔ 2
y1x
−= ⇔ ( )2
y1y1 −=ϕ− ⇒ ( )[ ]
2
1y
dy
d 1 −=ϕ−
( )yfY = ( )( ) ( )[ ]ydy
dyf 11
X−− ϕ×ϕ− =
2
1
2
y1f X ×
−
Considere-se a função densidade de probabilidade de X:
( )
<≥=
−
0x,0
0x,e2xf
x2
Para y≤1, 1-y≥0 ⇒ 02
y1 ≥− ⇒
−−=
− 2
y12
X e22
y1f ⇒ ( ) 1y
Y eyf −=
Para y<1, 1-y<0 ⇒ 02
y1 <− ⇒ 0
2
y1f X =
− ⇒ ( ) 0yf Y =
( )
>≤=
−
1y,0
1y,eyf
1y
Y
2.5.2.3. ϕϕϕϕ(X) não injectiva
Neste caso, assim como nos dois anteriores, o cálculo da f. d. p. de Y é feito em três passos:
- relacionar as funções de distribuição de Y e a de X;
- derivando-se, obtém-se uma relação entre as funções densidade de probabilidade, que terá uma forma geral:
( )yfY ( )( ) ( )[ ]∑ −− ϕ×ϕ=j
1j
1jX y
dy
dyf
- com base na relação anterior, e olhando para o domínio de X e para a forma da relação, pode-se obter a f. d. p. de Y.
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 29
3. VECTORES ALEATÓRIOS Num estudo estatístico, podemos estar interessados não apenas numa, mas
em várias características associadas à experiência aleatória, digamos que estamos interessados em k atributos quantitativos para cada elemento do espaço de resultados. Isto é, a cada ω∈Ω faremos corresponder não uma quantidade X(ω), mas um conjunto de valores (X1(ω), X2(ω), ..., Xk(ω)).
Dizemos então que estamos em presença de um vector aleatório, ou variável aleatória k-dimensional:
( ) ( ) ( )( )ωωω→ωℜ→Ω
k21
k
X,,X,X
:X
L
E que, à semelhança do caso unidimensional, este vector pode-se escrever simplesmente (X1, X2, ..., Xk).
Exemplo
Em dados de empresas podemos estar interessados em estudar conjuntamente o “nº de empregados”, “o capital social em Euros”, “o valor mensal da produção”, ...
A lei de probabilidade associada é equivalente à função de distribuição conjunta:
( )k21 x,,x,xF L = ( )kk2211 xXxXxXP ≤∧∧≤∧≤ L
As variáveis aleatórias bidimensionais (caso particular com k=2) são suficientemente importantes para justificar um estudo mais alargado. Em vez de se utilizar (X1, X2) para representar um par aleatório, por questões de simplificação de notação utiliza-se o par (X,Y). Neste caso, numa experiência aleatória estamos interessados em observar 2 quantidades X e Y.
A função F(x,y) = ( )yYxXP ≤∧≤ é chamada função de distribuição da variável aleatória bidimensional (X,Y), ou função de distribuição conjunta do par (X,Y).
0
(a,b) y
x
Esta figura representa a região de 2ℜ definida pelas desigualdades bYaX ≤∧≤ , e por isso a função de distribuição calculada no ponto (a,b) , F(a,b) = ( )bYaXP ≤∧≤ , corresponde ao total da probabilidade dentro daquela região.
A função de distribuição determina univocamente a distribuição de probabilidade.
Propriedades de qualquer função de distribuição conjunta F(x,y):
P1) 0≤F(x,y)≤1, qualquer que seja a função de distribuição, visto que F(x,y) é uma probabilidade.
P2) F(x,y) é não decrescente, separadamente, em relação a cada variável
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 30
P3) 0)y,x(Flim)y,x(Flimyx
==−∞→−∞→
e 1)y,x(Flim
yx
=
+∞→+∞→
P4) P(x1<X≤x2 ∧ y1<Y≤y2) = F(x2,y2) – F(x1,y2) - F(x2,y1) + F(x1,y1)
0 x1
y
x x2
y1
y2
P5) Qualquer função de distribuição é contínua à direita em relação a x e
em relação a y, isto é, )y,a(F)y,x(Flimax
=+→
e )b,x(F)y,x(Flimbx
=+→
.
3.1. VECTOR BIDIMENSIONAL DISCRETO A variável aleatória bidimensional (X,Y) é discreta se e só se cada uma das
variáveis aleatórias X e Y for discreta. O que é o mesmo que dizer que o conjunto de pontos A=(xi,yj) : P(X=xi ∧ Y=yj)>0 é finito ou infinito numerável.
A função definida como:
[ ]( )yYxXP)y,x(
1;0:f 2
=∧=→→ℜ
é a função de probabilidade conjunta do par (X,Y).
( ) ( )
ℜ∈
======∧== 2
jiij
y)(x, valoresoutros para ,0
... 2, 1,j e 2,... 1,i para ,yy e xx,pyYxXPy,xf
Como consequência desta definição resulta que:
- f(x,y)≥0 e f(x,y)≤1, para qualquer valor de 2y)(x, ℜ∈
- ( ) 1y,xfj,i
ji =∑
- F(x,y) = ( )yYxXP ≤∧≤ = ( )∑≤≤
yyxx
ji
ji
y,xf
Para além do estudo de duas variáveis aleatórias discretas, existe muitas vezes o interesse em trabalhar com cada uma das variáveis isoladamente, o que leva a definir as funções de probabilidade marginais:
- função de probabilidade marginal de X, f1(x), pode ser calculada da seguinte forma:
f1(xi) = P(X=xi) = ( )∑ =∧=j
ji yYxXP = ( )∑j
ji y,xf = ∑j
ijp = pi. para i=1,2,…
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 31
( ) ( )
ℜ∈==
=== x valoresoutros para ,0
2,... 1,i para xx,pxXPxf i.i
1
- função de probabilidade marginal de Y, f2(y), pode ser calculada da seguinte forma:
f2(yj) = P(Y=yj) = ( )∑ =∧=i
ji yYxXP = ( )∑i
ji y,xf = ∑i
ijp = p.j para j=1,2,…
( ) ( )
ℜ∈==
===y valoresoutros para ,0
2,... 1,j para yy,pyYPyf jj.
2
No caso em que X e Y são ambas finitas, a função de probabilidade é habitualmente representada numa tabela:
X
Y y1 y2 ... yj ... ym f1(x)
x1 p11 p12 ... p1j ... p1m p1. x2 p21 p22 ... p2j ... p2m p2. M M M ... M ... M M xi pi1 pi2 ... pij ... pim pi. M M M ... M ... M M xn pn1 pn2 ... pnj ... pnm pn.
f2(y) p.1 p.2 ... p.j ... p.m 1
As variáveis aleatórias X e Y são independentes se e só se
f(x,y) = f1(x) f2(y) , ∀(x,y)∈ℜ2
Ou seja, X e Y são independentes se e só se a função de probabilidade conjunta for igual ao produto das funções de probabilidade marginais.
Podem-se ainda definir as probabilidades condicionais:
- função de probabilidade de X condicionada por Y, fX|Y(x|y), representa a função de probabilidade de X condicionada pela ocorrência de um valor para Y, e para cada valor possível para Y pode ser calculada uma função de probabilidade condicional:
fX|Y(xi|yj) = P(X=xi|Y=yj) = ( )
( )jji
yYP
yYxXP
==∧=
= ( )
( )j2
ji
yf
y,xf =
j.
ij
p
p para i=1,2,…
( ) ( )
ℜ∈
====== x valoresoutros para ,0
2,... 1,i para xx,p
p
yY|xXPy|xf ij.
ij
jjY|X
- função de probabilidade de Y condicionada por X, fY|X(y|x), representa a função de probabilidade de Y condicionada pela ocorrência de um valor para X, e para cada valor possível para X pode ser calculada uma função de probabilidade condicional:
fY|X(yj|xi) = P(Y=yj|X=xi) = ( )
( )i
ij
xXP
xXyYP
==∧=
= ( )
( )i1
ji
xf
y,xf =
.i
ij
p
p para j=1,2,…
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 32
( ) ( )
ℜ∈
======y valoresoutros para ,0
2,... 1,j para yy,p
pxX|yYPx|yf j
.i
ij
iiX|Y
Exemplo 1:
Uma empresa tem 10 pessoas a trabalhar, das quais 2 são patrões, 5 são empregados sem qualificação superior e 3 são empregados com qualificação superior. Pretende-se escolher aleatoriamente uma comissão de 3 pessoas. Seja X a variável aleatória que representa “o número de patrões na comissão de 3 pessoas” e Y a variável aleatória que representa “o número de empregados com qualificação superior na comissão”.
Determinar f(x,y)?
f(x,y) = P(X=x∧Y=y) = 103
5yx3
3y
2x
C
CCC −− , x=0,1,2 e y=0,1,...,3-x
f(1,3) = f(2,2) = f(2,3) = 0 f(0,0)=P(X=0∧Y=0)=103
53
C
C=
120
10
f(0,1)=P(X=0∧Y=1)=103
52
31
C
CC=
120
30 f(0,2)=P(X=0∧Y=2)=
103
51
32
C
CC=
120
15
f(0,3)=P(X=0∧Y=3)=103
33
C
C=
120
1 f(1,0)=P(X=1∧Y=0)=
103
52
21
C
CC =
120
20
f(1,1)=P(X=1∧Y=1)=103
51
31
21
C
CCC=
120
30 f(1,2)=P(X=1∧Y=2)=
103
32
21
C
CC=
120
6
f(2,0)=P(X=2∧Y=0)=103
51
22
C
CC=
120
5 f(2,1)=P(X=2∧Y=1)=
103
31
22
C
CC=
120
3
X
Y 0 1 2 3 f1(x)
0 10/120 30/120 15/120 1/120 56/120 1 20/120 30/120 6/120 0 56/120 2 5/120 3/120 0 0 8/120
f2(y) 35/120 63/120 21/120 1/120 1
Função de probabilidade marginal de X: f1(x) = P(X=x) = ( )∑y
y,xf
X 0 1 2 f1(x) 56/120 56/120 8/120
Função de probabilidade marginal de Y: f2(y) = P(Y=y) = ( )∑x
y,xf
Y 0 1 2 3 f2(y) 35/120 63/120 21/120 1/120
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 33
F(x,y) = ( )yYxXP ≤∧≤ =
≥∧≥<≤∧≥≥∧<≤
<≤∧<≤<≤∧≥
<≤∧<≤≥∧<≤
<≤∧<≤<≤∧<≤
<≤∧≥<≤∧<≤<≤∧<≤
<∨<
3y2x,1
3y22x,120/119
3y2x1,120/112
3y22x1,120/111
2y12x,120/98
2y12x1,120/90
3y1x0,120/56
3y21x0,120/55
2y11x0,120/40
1y02x,120/35
1y02x1,120/30
1y01x0,120/10
0y0x,0
Estas variáveis não são independentes, pois f(2,3)=0 e como f1(2)≠0 e f2(3)≠0 implica que f1(2)×f2(3)≠f(2,3).
Funções de probabilidade de Y condicionada por X, fY|X(y|x), existem 3:
fY|X(y|0) = ( )
( )0f
y,0f
1 fY|X(y|1) =
( )( )1f
y,1f
1 fY|X(y|2) =
( )( )2f
y,2f
1
Y 0 1 2 3 fY|X(y|0) 10/56 30/56 15/56 1/56
Y 0 1 2 3 fY|X(y|1) 20/56 30/56 6/56 0
Y 0 1 2 3 fY|X(y|2) 5/8 3/8 0 0
Funções de probabilidade de X condicionada por Y, fX|Y(x|y), existem 4:
fX|Y(x|0)=( )
( )0f
0,xf
2 fX|Y(x|1)=
( )( )1f
1,xf
2 fX|Y(x|2)=
( )( )2f
2,xf
2 fX|Y(x|3)=
( )( )3f
3,xf
2
X 0 1 2 X 0 1 2 fX|Y(x|0) 10/35 20/35 5/35 fX|Y(x|1) 30/63 30/63 3/63
X 0 1 2 X 0 1 2 fX|Y(x|2) 15/21 6/21 0 fX|Y(x|3) 1 0 0
3.2. VECTOR BIDIMENSIONAL CONTÍNUO A variável aleatória bidimensional (X,Y) é de tipo contínuo quando existe
uma função não-negativa f(x,y) tal que:
F(x,y) = P(X≤x ∧ Y≤y) = ( )∫ ∫∞− ∞−
x y
dudvv,uf , ( ) 2y,x ℜ∈∀
F(x,y) é a função de distribuição conjunta do par (X,Y).
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 34
f(x,y) é a função densidade de probabilidade (f. d. p.) conjunta do par (X,Y).
Como consequência desta definição resulta que:
- f(x,y)≥0 para qualquer valor de 2y)(x, ℜ∈
- ( ) 1dydxy,xf =∫ ∫+∞
∞−
+∞
∞−
Se a f. d. p. conjunta for contínua no ponto (x,y), tem-se:
( ) ( )yx
y,xFy,xf
2
∂∂∂=
A função densidade de probabilidade marginal de X, f1(x), é dada por:
( ) ( )∫+∞
∞−= dyy,xfxf1
A função densidade de probabilidade marginal de Y, f2(y), é dada por:
( ) ( )∫+∞
∞−= dxy,xfyf 2
As variáveis aleatórias X e Y são independentes se e só se
f(x,y) = f1(x) × f2(y) , ∀(x,y)∈ℜ2
Ou seja, X e Y são independentes se e só se a f. d. p. conjunta for igual ao produto das f. d. p. marginais.
A função densidade de probabilidade de X condicionada por Y, ( )y|xf Y|X , representa a f. d. p. de X condicionada pela ocorrência de um
valor para Y, e para cada valor possível para Y pode-se calcular uma f. d. p. condicional:
( )y|xf Y|X = ( )
( )yf
y,xf
2, para cada y tal que f2(y)≠0
A função densidade de probabilidade de Y condicionada por X, ( )x|yf X|Y , representa a f. d. p. de Y condicionada pela ocorrência de um
valor para X, e para cada valor possível para X pode-se calcular uma f. d. p. condicional:
( )x|yf X|Y = ( )
( )xf
y,xf
1, para cada x tal que f1(x)≠0
Exemplo 2:
Seja (X,Y) uma v. a. bidimensional com a seguinte f. d. p. conjunta:
( ) ( )
ℜ∈≤≤∧≤≤
= 2y,x outros,0
xy01x0,kxyy,xf
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 35
Determinar k?
( ) ℜ∈∀≥ x,0y,xf ⇒ k≥0
1dxdy)y,x(f =∫ ∫+∞
∞−
+∞
∞−⇔ 1dxkxydy
1
0
x
0
=
∫ ∫ ⇔
1dx2
ykx
1
0
xy
0y
2=
∫
=
=
⇔ 1dx2
kx1
0
3=∫ ⇔ 1
8
kx1x
0x
4=
=
=
⇔
18
k = ⇔ k=8
0 1
y=x 1
y
x
x=1
Função densidade de probabilidade marginal de X: ( ) ( )∫+∞
∞−= dyy,xfxf1
Para 0≤x≤1, ( ) ∫=x
01 xydy8xf = [ ] xy
0y2xy4
== = 33 x40x4 =−
( )
ℜ∈≤≤= xoutros,0
1x0,x4xf
3
1
Função densidade de probabilidade marginal de Y: ( ) ( )∫+∞
∞−= dxy,xfyf 2
Para 0≤y≤1, ( ) ∫=1
y2 xydx8yf = [ ] 1x
yx2yx4
== = 3y4y4 −
( )
ℜ∈≤≤−=y outros,0
1y0,y4y4yf
3
2
Estas variáveis não são independentes, pois f(1/2,3/4)=0 e como f1(1/2)=1/2≠0 e f2(3/4)=21/16≠0 implica que f1(1/2)×f2(3/4)≠f(1/2,3/4).
Função densidade de probabilidade de X condicionada por Y
Existindo uma função para cada valor de y entre 0 e 1 e é dada por:
para 0<y<1, ( )y|xf Y|X = ( )
( )yf
y,xf
2 =
3y4y4
xy8
− =
2y1
x2
−, 0≤x≤1
( )
ℜ∈
≤≤−=
xoutros,0
1xy,y1
x2y|xf 2Y|X , com 0<y<1
Função densidade de probabilidade de Y condicionada por X
Existindo uma função para cada valor de x entre 0 e 1 e é dada por:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 36
para 0<x≤1, ( )x|yf X|Y = ( )
( )xf
y,xf
1 =
3x4
xy8 =
2x
y2, 0≤y≤1
( )
ℜ∈
≤≤=
youtros,0
xy0,x
y2x|yf 2X|Y , com 0<x≤1
3.3. MOMENTOS E COEFICIENTE DE CORRELAÇÃO Podem-se calcular valores esperados envolvendo apenas uma das variáveis
ou as duas variáveis. A expressão geral para calcular o valor esperado E(g(X,Y)) de uma função g(X,Y) envolvendo as variáveis X e/ou Y, podendo existir ou não, é a seguinte:
−−−− caso discreto:
( )( )Y,XgE = ( ) ( )∑∑ ×x y
y,xfy,xg = ( ) ( )∑ ×)y,x(
y,xfy,xg
−−−− caso contínuo:
( )( ) ( ) ( ) dydxy,xfy,xgY,XgE ∫ ∫+∞
∞−
+∞
∞−×=
Os valores esperados mais calculados são a média de cada uma das variáveis, E(X) e E(Y):
−−−− caso discreto:
Xµ =E(X)= ( )∑∑ ×x y
y,xfx = ( )∑ ×x
1 xfx =∑i
.ii px
Yµ =E(Y)= ( )∑∑ ×x y
y,xfy = ( )∑ ×y
2 yfy =∑j
j.jpy
−−−− caso contínuo:
Xµ =E(X)= ( ) dydxy,xfx∫ ∫+∞
∞−
+∞
∞−× = ( )dxxfx 1∫
+∞
∞−×
Yµ =E(Y)= ( ) dydxy,xfy∫ ∫+∞
∞−
+∞
∞−× = ( )dyyfy 2∫
+∞
∞−×
Valor esperado da soma e da diferença pode ser calculado pela definição ou utilizando uma propriedade do valor esperado.
−−−− caso discreto:
E(X+Y)= ( )∑∑ ×+x y
y,xf)yx( E(X-Y)= ( )∑∑ ×−x y
y,xf)yx(
−−−− caso contínuo:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 37
E(X+Y)= ( ) ( ) dydxy,xfyx∫ ∫+∞
∞−
+∞
∞−×+ E(X-Y)= ( ) ( ) dydxy,xfyx∫ ∫
+∞
∞−
+∞
∞−×−
−−−− propriedades do valor esperado:
E(X+Y)=E(X)+E(Y) E(X-Y)=E(X)-E(Y)
A variância de cada uma das variáveis, V(X) e V(Y):
−−−− caso discreto:
2Xσ =V(X)= ( )[ ]2
XXE µ− = ( ) ( )∑∑ ×µ−x y
2X y,xfx = ( ) ( )∑ ×µ−
x1
2X xfx
2Yσ =V(Y)= ( )[ ]2
YYE µ− = ( ) ( )∑∑ ×µ−x y
2y y,xfy = ( ) ( )∑ ×µ−
y2
2y yfy
−−−− caso contínuo:
2Xσ =V(X)= ( )[ ]2
XXE µ− = ( ) ( ) dydxy,xfx 2X∫ ∫
+∞
∞−
+∞
∞−×µ− = ( ) ( )dxxfx 1
2X∫
+∞
∞−×µ−
2Yσ =V(Y)= ( )[ ]2
YYE µ− = ( ) ( ) dydxy,xfy 2Y∫ ∫
+∞
∞−
+∞
∞−×µ− = ( ) ( )dyyfy 2
2Y∫
+∞
∞−×µ−
Como foi dito nas variáveis aleatórias, as variâncias podem também mais simplesmente ser calculados com base na diferença dos momentos ordinários:
V(X)= ( ) [ ]22 )X(EXE − V(Y)= ( ) [ ]22 )Y(EYE −
O valor esperado do produto E(XY):
−−−− caso discreto:
E(XY)= ( )∑∑ ×x y
y,xfxy =∑∑i j
ijji pyx
−−−− caso contínuo:
E(XY)= ( ) dydxy,xfxy∫ ∫+∞
∞−
+∞
∞−×
A covariância entre as duas variáveis, que é por definição (se o valor esperado existir):
cov(X,Y)= ( )( )[ ])Y(EY)X(EXE −−
Fica como exercício demonstrar que esta expressão é equivalente à seguinte expressão, sendo esta mais utilizada no cálculo da covariância:
cov(X,Y)=E(XY)-E(X)×E(Y)
Demostração de que cov(X,Y)=E(XY)-E(X)××××E(Y): cov(X,Y)= ( )( )[ ])Y(EY)X(EXE −− = [ ])Y(E)X(E)X(YE)Y(XEXYE +−− =
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 38
( ) ( ) ( ) ( ))Y(E)X(EE)X(YEE)Y(XEEXYE +−− =( ) ( ) ( ) ( ) ( ) )Y(E)X(EYEXEXEYEXYE +−− = ( ) ( ) ( )YEXEXYE −
A Variância da soma e da diferença pode ser calculado pela definição, mas pode ser deduzida uma expressão que torna mais simples o seu cálculo:
V(X+Y)=V(X)+V(Y)+2cov(X,Y) V(X-Y)=V(X)+V(Y)-2cov(X ,Y)
Demostração de que V(X+Y)=V(X)+V(Y)+2cov(X,Y):
V(X+Y)= ( )[ ]2)YX(E)YX(E +−+ = ( )[ ]2)Y(E)X(EYXE −−+ =
( ) ( )( )[ ]2)Y(EY)X(EXE −+− =
( ) ( ) ( )( )[ ])Y(EY)X(EX2)Y(EY)X(EXE 22 −−+−+− =
( )[ ] ( )[ ] ( )( )[ ])Y(EY)X(EXE2)Y(EYE)X(EXE 22 −−+−+− =V(X)+V(Y)+2cov(X,Y)
Demostração de que V(X-Y)=V(X)+V(Y)-2cov(X,Y):
V(X-Y)= ( )[ ]2)YX(E)YX(E −−− = ( )[ ]2)Y(E)X(EYXE +−− =
( ) ( )( )[ ]2)Y(EY)X(EXE −−− =
( ) ( ) ( )( )[ ])Y(EY)X(EX2)Y(EY)X(EXE 22 −−−−+− =
( )[ ] ( )[ ] ( )( )[ ])Y(EY)X(EXE2)Y(EYE)X(EXE 22 −−−−+− =V(X)+V(Y)-2cov(X,Y)
A covariância depende das unidades em que se exprimem X e Y. Define-se então o coeficiente de correlação linear, ρ(X,Y), que exprime a intensidade da ligação entre X e Y, mas não depende dessas unidades.
( ) ( )( ) ( )YVXV
Y,XcovY,X
×=ρ
Propriedades de ρ(X,Y) e da cov(X,Y)
- –1 ≤ ρ(X,Y) ≤ 1
- se X e Y são independentes então ρ(X,Y)=0
- mas ρ(X,Y) ser nulo não significa que X e Y sejam independentes;
- se X e Y são independentes então cov(X,Y)=0
- se X e Y são independentes então E(XY)=E(X)×E(Y)
- se X e Y são independentes então V(X±Y)=V(X)+V(Y)
- sendo a e b duas constantes reais:
cov(aX+b,Y) = a cov(X,Y) e cov(X,aY+b) = a cov(X,Y)
Demostração de que cov(aX+b,Y) = a cov(X,Y): cov(aX+b,Y)= ( )( ) ( ) ( )YEbaXEYbaXE +−+ = ( ) ( )( ) ( )YEbXaEbYaXYE +−+ =
( ) ( ) ( ) ( ) ( )( )YbEYEXaEYbEXYaE +−+ = ( ) ( ) ( )( ) ( ) ( )YbEYbEYEXEXYEa −+− =( )Y,Xcova
- sendo a>0 e b, duas constantes reais:
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 39
ρ(aX+b,Y)=ρ(X,Y) e ρ(X,aY+b)=ρ(X,Y)
- sendo a<0 e b, duas constantes reais:
ρ(aX+b,Y)=-ρ(X,Y) e ρ(X,aY+b)=-ρ(X,Y)
ρ(aX+b,Y)= ( )( ) ( )YVbaXV
Y,baXcov
++
=( )
( ) ( )YVXVa
Y,Xcova2
=( )
( ) ( )YVXVa
Y,Xcova=
<ρ−>ρ
0a ),Y,X(
0a ),Y,X(
Exemplo 1 (continuação):
E(X)= ( )∑ ×)y,x(
y,xfx = ( )∑ ×x
1 xfx =120
82
120
561
120
560 ×+×+× =
120
72=
5
3
E(X2)= ( )∑ ×)y,x(
2 y,xfx = ( )∑x
12 xfx =
120
84
120
561
120
560 ×+×+× =
120
88=
15
11
V(X)= ( ) [ ]22 )X(EXE − =2
5
3
15
11
− =75
28
E(Y)= ( )∑ ×)y,x(
y,xfy = ( )∑ ×y
2 yfy =120
13
120
212
120
631
120
350 ×+×+×+× =
120
108=
10
9
E(Y2)= ( )∑ ×)y,x(
2 y,xfy = ( )∑y
22 yfy =
120
19
120
214
120
631
120
350 ×+×+×+× =
120
156=
10
13
V(Y)= ( ) [ ]22 )Y(EYE − =2
10
9
10
13
− =100
49
E(XY)= ( )∑ ×)y,x(
y,xfxy =120
312
120
621
120
3011 ××+××+×× =
120
48=
5
2
cov(X,Y)=E(XY)-E(X)×E(Y)=10
9
5
3
5
2 ×− =50
7−
( ) ( )( ) ( )YVXV
Y,XcovY,X
×=ρ =
100
49
75
2850
7
×
−=-0,3273
( )1YXP ≤+ = ( )∑≤+ 1yx
y,xf =f(0,0)+f(0,1)+f(1,0)=120
20
120
30
120
10 ++ =120
60=
2
1
( )2YXP >+ = ( )∑>+ 2yx
y,xf =f(0,3)+f(1,2)+f(2,1)=120
3
120
6
120
1 ++ =120
10=
12
1
Exemplo 2 (continuação):
( ) ( )
ℜ∈≤≤∧≤≤
= 2y,x outros,0
xy01x0,xy8y,xf
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 40
Xµ =E(X)= ( ) dydxy,xfx∫ ∫+∞
∞−
+∞
∞−× = ( )dxxfx 1∫
+∞
∞−× = dxx4x
1
0
3∫ × = dxx4
1
0
4∫ =
1
0
5
5
x4
=
5
4
E(X2)= ( ) dydxy,xfx2∫ ∫
+∞
∞−
+∞
∞−= ( )dxxfx 1
2∫
+∞
∞−= dxx4x
1
0
32∫ × = dxx4
1
0
5∫ =
1
0
6
6
x4
=
6
4=
3
2
V(X)= ( ) [ ]22 )X(EXE − =2
5
4
3
2
− =325
316
253
252
××−
××
=75
2
Yµ =E(Y)= ( ) dydxy,xfy∫ ∫+∞
∞−
+∞
∞−× = ( )dyyfy 2∫
+∞
∞−× = ( )∫ −
1
0
3 dyy4y4y = ∫ −1
0
42 dyy4y4 =
1
0
53
5
y4
3
y4
− = 0
5
4
3
4 −− =15
8
E(Y2)= ( ) dydxy,xfy2∫ ∫
+∞
∞−
+∞
∞−= ( )dyyfy 2
2∫
+∞
∞−= ( )∫ −
1
0
32 dyy4y4y = ∫ −1
0
53 dyy4y4 =
1
0
64
6
y4y
− = 0
3
21 −− =
3
1
V(Y)= ( ) [ ]22 )Y(EYE − =2
15
8
3
1
− =225
64
753
75 −×
=225
11
E(XY)= ( ) dydxy,xfxy∫ ∫+∞
∞−
+∞
∞−× = ∫ ∫
1
0
x
0
22 dxdyyx8 =
∫=
=
1
0
xy
0y
32 dx
3
yx8 = ∫
1
0
5dx
3
x8=
1x
0x
6
18
x8=
=
=
9
4
0 1
y=x 1
y
x
x=1
cov(X,Y)=E(XY)-E(X)×E(Y)=15
8
5
4
9
4 ×− =375
332
259
254
××−
××
=225
4
( ) ( )( ) ( )YVXV
Y,XcovY,X
×=ρ =
225
11
75
2225
4
×=
225
11
225
6225
4
×=
66
4=0,4923
≤+2
1YXP = ( )∫∫
≤+ 2/1yx
dxdyy,xf = ∫ ∫
−4
1
0
y2
1
y
dyxydx8 =
0 1
1
y
x ½
½
x+y=½
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 41
[ ]∫−=
=
4
1
0
y2
1x
yy2 dyyx4 = ∫
−
−4
1
0
22
dyyy2
1y4 =
∫
−+−4
1
0
22 dyyyy4
1y4 = ∫ −
4
1
0
2dyy4y =4
1y
0y
32
3
y4
2
y=
=
− = 0
48
1
32
1 −− =96
1
Exemplo 3 (par discreto):
Lançam-se dois dados equilibrados. Seja X a v. a. que representa o número de seis que saem e Y a v. a. que representa o número cincos que saem.
Determinar f(x,y)? f(1,2) = f(2,1) = f(2,2) = 0
f(0,0)=P(X=0∧Y=0)=6
4
6
4 × =36
16 f(0,1)=P(X=0∧Y=1)=
6
4
6
1
6
4
6
1 ×+× =36
8
f(0,2)=P(X=0∧Y=2)=6
1
6
1 × =36
1 f(1,0)=P(X=1∧Y=0)=
6
4
6
1
6
4
6
1 ×+× =36
8
f(1,1)=P(X=1∧Y=1)=6
1
6
1
6
1
6
1 ×+× =36
2 f(2,0)=P(X=2∧Y=0)=
6
1
6
1 × =36
1
XY 0 1 2 f1(x)
0 16/36 8/36 1/36 25/36 1 8/36 2/36 0 10/36 2 1/36 0 0 1/36
f2(y) 25/36 10/36 1/36 1
Função de probabilidade marginal de X: f1(x) = P(X=x) = ( )∑y
y,xf
X 0 1 2 f1(x) 25/36 10/36 1/36
Função de probabilidade marginal de Y: f2(y) = P(Y=y) = ( )∑x
y,xf
Y 0 1 2 f2(y) 25/36 10/36 1/36
F(x,y)= ( )yYxXP ≤∧≤ =
( ) ( )( ) ( )
( ) ( )
≥∧≥<≤∧≥∨≥∧<≤
<≤∧<≤<≤∧≥∨≥∧<≤
<≤∧<≤∨<≤∧<≤<≤∧<≤
<∨<
2y2x,1
2y12x2y2x1,36/35
2y12x1,36/34
1y02x2y1x0,36/25
1y02x12y11x0,36/24
1y01x0,36/16
0y0x,0
Estas variáveis não são independentes, pois f(2,2)=0 e como f1(2)≠0 e f2(2)≠0 implica que f1(2)×f2(2)≠f(2,2).
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 42
Funções de probabilidade de X condicionada por Y, fX|Y(x|y), existem 3:
fX|Y(x|0)=( )
( )0f
0,xf
2 fX|Y(x|1)=
( )( )1f
1,xf
2 fX|Y(x|2)=
( )( )2f
2,xf
2
X 0 1 2 X 0 1 X 0 fX|Y(x|0) 16/25 8/25 1/25 fX|Y(x|1) 8/10 2/10 fX|Y(x|2) 1
Funções de probabilidade de Y condicionada por X, fY|X(y|x), existem 3:
fY|X(y|0) = ( )
( )0f
y,0f
1 fY|X(y|1) =
( )( )1f
y,1f
1 fY|X(y|2) =
( )( )2f
y,2f
1
Y 0 1 2 Y 0 1 Y 0 fY|X(y|0) 16/25 8/25 1/25 fY|X(y|1) 8/10 2/10 fY|X(y|2) 1
E(X)= ( )∑ ×)y,x(
y,xfx = ( )∑ ×x
1 xfx =36
12
36
101
36
250 ×+×+× =
36
12=
3
1
E(X2)= ( )∑ ×)y,x(
2 y,xfx = ( )∑x
12 xfx =
36
14
36
101
36
250 ×+×+× =
36
14=
18
7
V(X)= ( ) [ ]22 )X(EXE − =2
31
187
− =18
5
E(Y)= ( )∑ ×)y,x(
y,xfy = ( )∑ ×y
2 yfy =36
12
36
101
36
250 ×+×+× =
36
12=
3
1
E(Y2)= ( )∑ ×)y,x(
2 y,xfy = ( )∑y
22 yfy =
36
14
36
101
36
250 ×+×+× =
36
14=
18
7
V(Y)= ( ) [ ]22 )Y(EYE − =2
31
187
− =18
5
E(XY)= ( )∑ ×)y,x(
y,xfxy =36
2110 ××+ =
36
2=
18
1
cov(X,Y)=E(XY)-E(X)×E(Y)=3
1
3
1
18
1 ×− =18
1−
( ) ( )( ) ( )YVXV
Y,XcovY,X
×=ρ =
18
5
18
5181
×
−=
185181−=
5
1− =-0,20
( )1YXP =+ = ( )∑=+ 1yx
y,xf =f(0,1)+f(1,0)=36
8
36
8 + =36
16=
9
4
( )2YXP >+ = ( )∑>+ 2yx
y,xf =f(1,2)+f(2,1)+f(2,2)=0
Exemplo 4 (par contínuo):
Seja (X,Y) uma v. a. bidimensional com a seguinte f. d. p. conjunta:
( ) ( )
ℜ∈≤−≤∧≤+≤
= 2y,x outros,0
2xy02xy0,kyy,xf
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 43
Determinar k?
( ) ℜ∈∀≥ x,0y,xf ⇒ k≥0
1dxdy)y,x(f =∫ ∫+∞
∞−
+∞
∞−⇔
1dxkydydxkydy1
0
x2
x
0
1
2x
x
=
+
∫ ∫∫ ∫−
−
+
−⇔
0 2
y=x 2
y
x
y=x+2 y=2-x
-1 -2 1
y=-x
1
1dx2
ykdx
2
yk
1
0
x2y
xy
20
1
2xy
xy
2=
+
∫∫
−=
=−
+=
−=
⇔
( ) ( )1dx
2
xx2kdx
2
x2xk
1
0
220
1
22=−−+−+
∫∫−
⇔
1dx2
xxx44kdx
2
x4x4xk
1
0
220
1
22=−+−+−++
∫∫−
⇔
1kxdx2k2kdx2kx21
0
0
1
=−++ ∫∫−
⇔ [ ] [ ] 1kxkx2kx2kx1x0x
20x1x
2 =−++==
=−= ⇔
10kk2)k2k(0 =−−+−− ⇔ 1k2 = ⇔2
1k =
O integral também poderia ter sido calculado da seguinte forma:
1dxdy)y,x(f =∫ ∫+∞
∞−
+∞
∞−⇔ 1dykydxdykydx
2
1
y2
2y
1
0
y
y
=
+
∫ ∫∫ ∫−
−−⇔ ... ⇔
2
1k =
Função densidade de probabilidade marginal de X: ( ) ( )∫+∞
∞−= dyy,xfxf1
Para 0x1 ≤≤− ,
( ) ∫+
−=
x2
x1 dy
2
yxf =
x2y
xy
2
4
y+=
−=
=
( )4
xx2 22 −+=
4
xxx44 22 −++= x1+
Para 1x0 ≤< ,
( ) ∫−
=x2
x1 dy
2
yxf =
x2y
xy
2
4
y−=
=
=
( )4
xx2 22 −−=
4
xxx44 22 −+−= x1−
( )
ℜ∈≤<−≤≤−+
= xoutros,0
1x0,x1
0x1,x1
xf1
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 44
Função densidade de probabilidade marginal de Y: ( ) ( )∫+∞
∞−= dxy,xfyf 2
Para 1y0 ≤≤ , ( ) ∫−
=y
y2 dx
2
yyf =
yx
yx2
yx=
−=
=2
yy 22 += 2y
Para 2y1 ≤< ,
( ) ∫−
−=
y2
2y2 dx
2
yyf =
y2x
2yx2
yx−=
−=
=( )
2
)2y(yy2y −−−=
2
y2yyy2 22 +−−= 2yy2 −
( )
ℜ∈≤<−≤≤
=y outros,0
2y1,yy2
1y0,y
yf 2
2
2
Estas variáveis não são independentes, pois f(1/2,1/4)=0 e como f1(1/2)=1/2≠0 e f2(1/4)=1/16≠0 implica que f1(1/2)×f2(1/4)≠f(1/2,1/4).
Função densidade de probabilidade de X condicionada por Y
Existindo uma função para cada valor de y entre 0 e 2 e é dada por:
para 0<y≤1, ( )y|xf Y|X =( )
( )yf
y,xf
2=
2y
2/y=
y2
1 , para yxy ≤≤−
( )
ℜ∈
≤≤−= xoutros,0
yxy,y2
1y|xf Y|X , para 0<y≤1
para 1<y<2, ( )y|xf Y|X =( )
( )yf
y,xf
2=
2yy2
2/y
−=
y24
1
− , para y2x2y −≤≤−
( )
ℜ∈
−≤≤−−=
xoutros,0
y2x2y,y24
1y|xf Y|X , para 1<y<2
Todas estas distribuições são constantes (não dependem de x) e, por exemplo, a f. d. p. de X condicionada por Y=3/2 será (1<3/2<2):
ℜ∈
≤≤−=
xoutros,02
1x
2
1,1
2
3|xf Y|X
Função densidade de probabilidade de Y condicionada por X
Existindo uma função para cada valor de x entre -1 e 1 e é dada por:
para -1<x≤0, ( )x|yf X|Y = ( )
( )xf
y,xf
1 =
x1
2/y
+ =
x22
y
+, -x≤y≤2+x
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 45
( )
ℜ∈
+≤≤−+=
y outros,0
x2yx,x22
yx|yf X|Y , com -1<x≤0
para 0<x<1, ( )x|yf X|Y = ( )
( )xf
y,xf
1 =
x1
2/y
− =
x22
y
−, x≤y≤2-x
( )
ℜ∈
−≤≤−=
y outros,0
x2yx,x22
yx|yf X|Y , com 0<x<1
Todas estas distribuições funções da variável aleatória Y e, por exemplo, a f. d. p. de Y condicionada por X=-1/2 será (-1<-1/2≤0):
ℜ∈
≤≤=
−y outros,0
2
3y
2
1,y
2
1|yf X|Y
Xµ =E(X)= ( ) dydxy,xfx∫ ∫+∞
∞−
+∞
∞−× = ( )dxxfx 1∫
+∞
∞−× = ( ) ( )dxx1xdxx1x
1
0
0
1∫∫ −++
−=
dxxxdxxx1
0
20
1
2∫∫ −++
−=
1
0
320
1
32
3
x
2
x
3
x
2
x
−+
+
−
= 03
1
2
1
3
1
2
10 −−++− =0
E(X2)= ( ) dydxy,xfx2∫ ∫
+∞
∞−
+∞
∞−= ( )dxxfx 1
2∫
+∞
∞−= ( ) ( )dxx1xdxx1x
1
0
20
1
2∫∫ −++
−=
dxxxdxxx1
0
320
1
32∫∫ −++
−=
1
0
430
1
43
4
x
3
x
4
x
3
x
−+
+
−
= 04
1
3
1
4
1
3
10 −−+−+ =
61
V(X)= ( ) [ ]22 )X(EXE − = 2061 − =
61
Yµ =E(Y)= ( ) dydxy,xfy∫ ∫+∞
∞−
+∞
∞−× = ( )dyyfy 2∫
+∞
∞−× = ( )∫∫ −+×
2
1
21
0
2 dyyy2ydyyy =
∫∫ −+2
1
321
0
3 dyyy2dyy =
2
1
431
0
4
4
y
3
y2
4
y
−+
=
4
1
3
24
3
160
4
1 +−−+− =6
7
E(Y2)= ( ) dydxy,xfy2∫ ∫
+∞
∞−
+∞
∞−= ( )dyyfy 2
2∫
+∞
∞−= ( )∫∫ −+×
2
1
221
0
22 dyyy2ydyyy =
∫∫ −+2
1
431
0
4 dyyy2dyy =
2
1
541
0
5
5
y
2
y
5
y
−+
=
5
1
2
1
5
3280
5
1 +−−+− =2
3
V(Y)= ( ) [ ]22 )Y(EYE − =2
6
7
2
3
− =36
49182
183 −××
=36
5
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 46
E(XY)= ( ) dydxy,xfxy∫ ∫+∞
∞−
+∞
∞−× =
∫ ∫∫ ∫
+
−
−
+
−
1
0
x2
x
20
1
2x
x
2dxdy
2
xydxdy
2
xy=
0 2
y=x 2
y
x
y=x+2 y=2-x
-1 -2 1
y=-x
1
∫∫−=
=−
+=
−=
+
1
0
x2y
xy
30
1
2xy
xy
3dx
6
xydx
6
xy=
( ) ( )∫∫
−−+++
−
1
0
430
1
43dx
6
xx2xdx
6
x2xx=
∫∫−+−++++
−
1
0
4320
1
234dx
6
x2x6x12x8dx
6
x8x12x6x2=
∫∫ −+−++++−
1
0
432
0
1
234
dx3
xxx2
3
x4dx
3
x4x2x
3
x=
1x
0x
54320x
1x
2345
15
x
4
x
3
x2
3
x2
3
x2
3
x2
4
x
15
x=
=
=
−=
−+−+
+++ =
015
1
4
1
3
2
3
2
3
2
3
2
4
1
15
10 −−+−+−+−+ =0
cov(X,Y)=E(XY)-E(X)×E(Y)=6
700 ×− =0
( ) ( )( ) ( )YVXV
Y,XcovY,X
×=ρ =
365
61
0
×=0
( )0XP ≥ = ( )∫∫≥0x
dxdyy,xf = ∫ ∫
−1
0
x2
x
dxdy2
y=
∫−=
=
1
0
x2y
xy
2dx
4
y= ∫
−−1
0
22dx
4
x)x2(= ∫ −
1
0
xdx1 =
0 2
y=x 2
y
x
y=x+2 y=2-x
-1 -2 1
y=-x
1
1x
0x
2
2
xx
=
=
− = 0
2
11 −− =
2
1
Como esta probabilidade só envolve a v. a. X, poderia também ser calculada do seguinte modo:
( )0XP ≥ = ( )∫+∞
01 dxxf = ... =
2
1
Faculdade de Economia do Porto Estatística I - Licenciatura em Gestão
Teoria das Probabilidades Página 47
( )1YP < = ( )∫∫<1y
dxdyy,xf = ∫ ∫
−
1
0
y
y
dydx2
y=
∫=
−=
1
0
yx
yxdy
2
yx= ∫
+1
0
22dy
2
yy= ∫
1
0
2dyy =
0 2
y=x 2
y
x
y=x+2 y=2-x
-1 -2 1
y=-x
1 y=1
1y
0y
3
3
y=
=
= 0
3
1 − =3
1
Como esta probabilidade só envolve a v. a. Y, poderia também ser calculada do seguinte modo:
( )1YP < = ( )∫∞−
1
2 dyyf = ... = 3
1
( )1YXP ≤+ = ( )∫∫≤+ 1yx
dxdyy,xf =
∫ ∫∫ ∫∫ ∫
+
+
−
−
−
−
−
−
+
−
2/1
0
x1
x
0
2/1
x1
x
2/1
1
2x
x
dxdy2
ydxdy
2
ydxdy
2
y=
∫∫∫−=
=−
−=
−=
−
−
+=
−=
+
+
2/1
0
x1y
xy
20
2/1
x1y
xy
22/1
1
2xy
xy
2dx
4
ydx
4
ydx
4
y
0
2
y
x -1 1
x+y=1
1
= ∫∫∫−−+−−+−+
−
−
−
2/1
0
220
2/1
222/1
1
22dx
4
x)x1(dx
4
x)x1(dx
4
x)2x(=
∫∫∫−+−++
−
−
−
2/1
0
0
2/1
2/1
1
dx4
x21dx
4
x21dx1x =
2/1x
0x
20x
2/1x
22/1x
1x
2
4
x
4
x
4
x
4
xx
2
x=
=
=
−=
−=
−=
−+
−+
+ =
016
1
8
1
16
1
8
101
2
1
2
1
8
1 −−+++−+−− =8
3