Modelos probabilísticos continuos
Transcript of Modelos probabilísticos continuos
1
Introduccion al Tema 8
Tema 6. Variables aleatorias unidimensionalesDistribucion.
Caracterısticas: media, varianza, etc.
Transformaciones.
V.A. de uso frecuente
Tema 7. Modelos probabilısticos discretos X
Tema 8. Modelos probabilısticos continuos
Distribucion uniforme.
Distribucion exponencial.
Otras distribuciones (Pareto, Weibull y Cauchy).
Distribucion normal y relacionadas.
Introduccion a la Estadıstica Andres M. Alonso
2
Tema 8. Modelos probabilısticos continuos
Los contenidos a desarrollar en este tema son los siguientes:
Distribucion uniforme.
Distribucion exponencial.
Otras distribuciones (Pareto, Weibull y Cauchy).
Distribucion normal.• Propiedades.• Uso de tablas.• El teorema central del lımite y aproximaciones mediante la distribucion
normal.• Otras distribuciones relacionadas con la normal: logarıtmico-normal, χ2,
t de Student y F de Fisher–Snedecor.
Lecturas recomendadas: Capıtulos 17 y 18 del libro de Pena y Romo (1997) ylas secciones 5.5 a 5.8 de Newbold (2001).
Introduccion a la Estadıstica Andres M. Alonso
3
Distribucion uniforme
Supongamos que una variable X puede tomar valores al azar en un rango(a, b) y que la probabilidad de que X tome valores en cualquier intervalo delongitud fija en (a, b) sea la misma.
En este caso, se dice que X tiene una distribucion uniforme entre a y b y seescribe
X ∼ U(a, b).
-
6
a b
1b−a
0
f(x)
x
Introduccion a la Estadıstica Andres M. Alonso
4
La funcion de distribucion
Si X ∼ U(a, b), luego, si a < x ≤ b,
F (x) = Pr(X ≤ x) =∫ x
a
1b− a
du =[
u
b− a
]x
a
=x− a
b− a
-
6
a b
1
0
F (x)
x%
%%
%%
%%
%%
%%
%%
%%
%%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
Introduccion a la Estadıstica Andres M. Alonso
5
La media y desviacion tıpica
Teorema 1. Sea X ∼ U(a, b). Entonces
E[X] =a + b
2
V [X] =(b− a)2
12
DT [X] =b− a√
12
Demostracion
E[X] =∫ b
a
1b− a
× x dx =[
x2
2(b− a)
]b
a
=b2 − a2
2(b− a)=
a + b
2
Introduccion a la Estadıstica Andres M. Alonso
6
E[X2
]=
∫ b
a
x2
b− adx =
[x3
3(b− a)
]b
a
=b3 − a3
3(b− a)=
b2 + ab + a2
3
V [X] = E[X2
]− E[X]2 =
b2 + ab + a2
3−
(a + b
2
)2
=b2 + ab + a2
3− a2 + 2ab + b2
4
=a2 − 2ab + b2
12=
(b− a)2
12
Introduccion a la Estadıstica Andres M. Alonso
7
Ejemplo 1. Si juego con la siguiente rueda de fortuna:
&%'$
��
��
����
��
��
���
gano
X
pierdo
¿Cual es la probabilidad de que gane?
Sea X el angulo desde la vertical a la flecha. Luego X ∼ U(0, 360o). Laprobabilidad de que gane es
Pr(X ≤ 90) =90− 0360− 0
=14
Introduccion a la Estadıstica Andres M. Alonso
8
Distribucion exponencial
I En el tema anterior, estudiamos la distribucion Poisson X ∼ Pr(λ) comomodelo para el numero de sucesos raros en una unidad del tiempo. Ahora,supongamos que queremos estudiar la distribucion del tiempo Y entre unsuceso y el siguiente.
I En este caso, la distribucion de Y es una distribucion exponencial conparametro λ.
Definicion 1. Y tiene una distribucion exponencial con parametro λλλ si
f(y) = λe−λy
para 0 < y ≤ ∞. En este caso se escribe Y ∼ Ex(λ).
I La distribucion exponencial permite modelar la duracion de elementos: vidade personas, duracion de huelgas, del perıodo de desempleo, etc.
Introduccion a la Estadıstica Andres M. Alonso
9
La funcion de distribucion de Y es
F (y) = Pr(Y ≤ y)
=∫ y
0
λe−λu du
=[−e−λu
]y
0
= 1− e−λy para 0 < y < ∞.
Finalmente,
F (y) ={
0 si y ≤ 01− e−λy si 0 < y
.
Introduccion a la Estadıstica Andres M. Alonso
10
La media y varianza
Teorema 2. Si Y ∼ Ex(λ), entonces
E[Y ] =1λ
V [Y ] =1λ2
DT [Y ] =1λ
Demostracion parcial
Recordamos que λ es el numero de sucesos esperados en una unidad detiempo. Entonces, el tiempo esperado entre sucesos debe ser 1/λ, es decir queE[Y ] = 1/λ. �
Introduccion a la Estadıstica Andres M. Alonso
11
Ejemplo 2. En promedio, hay 50 incendios serios cada ano en una localidad.Sabemos que el numero de fuegos por ano tiene una distribucion PoissonPoisson(50).
¿Cual es el tiempo medio entre fuegos?
Hallar la probabilidad de que despues del ultimo fuego, se tarde mas de 2semanas hasta el siguiente.
El tiempo medio entre fuegos es 1/50 de un ano, es decir 365/50 = 7,3 dıas.
Pr(T > 14) =∫ ∞
14
50365
e−50365t dt
= e−50365×14
≈ 0,147
Introduccion a la Estadıstica Andres M. Alonso
12
Ejemplo 3. El tiempo T entre llegadas sucesivas de coches a un punto enla carretera se distribuye como una exponencial con parametro λ = 0,01segundos.
1) Hallar la media y varianza de T .
2) Una persona empieza a cruzar la calle inmediatamente despues de queun coche pasa por allı. Si tarda 50 segundos en cruzar la calle, ¿cual es laprobabilidad de que le atropelle la siguiente coche que pasa (suponiendo queno para)?
3) ¿Cual es la probabilidad de que en un minuto no llegue ningun coche?
Introduccion a la Estadıstica Andres M. Alonso
13
1) E[T ] = 1/0,01 = 100 y V [T ] = 1/0,012 = 10000.
2)
Pr(T < 50) =∫ ∞
0
0,01e−0,01t dt
= 1− e−0,01×50
= 1− e−0,5
≈ 0,393
3) Sea X el numero de coches que llegan en un minuto. La distribucion de Xes Poisson:
X ∼ Poisson(60× 0,01) = Poisson(0,6).
Entonces Pr(X = 0) = 0,60e−0,6
0! ≈ 0,549.
Introduccion a la Estadıstica Andres M. Alonso
14
Ejemplo 4. El tiempo de funcionamiento de una bombilla se distribuye comoexponencial con una media de 10 dıas.
a) ¿Cual es la probabilidad de que una bombilla funciona mas de 10 dıas?
b) Suponiendo que cada vez que falla una bombilla se la cambia por unanueva, hallar la probabilidad de que haya mas de un fallo en un mes (30 dıas).
c) Hallar el numero medio de fallos en un mes.
Introduccion a la Estadıstica Andres M. Alonso
15
a) Sea T ∼ Ex(λ) el tiempo de funcionamiento. Hallamos el valor de λ.Sabemos que E[T ] = 10 = 1
λ y luego λ = 0,1.
Ahora:Pr(T > 10) = 1− Pr(T ≤ 10)
= 1−{1− e−0,1×10
}= e−1 ≈ 0,368
b) El numero de fallos X en 30 dıas tiene una distribucion PoissonX ∼ Poisson(30× 0,1) = Poisson(3).
Pr(X > 1) = 1− Pr(X ≤ 1)
= 1−{
30e−3
0!+
31e−3
1!
}≈ 0.801
c) El numero medio de fallos por mes son 3.
Introduccion a la Estadıstica Andres M. Alonso
16
Otras distribuciones - Weibull
I La distribucion exponencial se caracteriza por no poseer memoria, es decir,la probabilidad de observar un evento en cualquier intervalo de tiempo nodepende del tiempo que ha pasado hasta ese intervalo.
I Esta caracterıstica es adecuada cuando los eventos aparecen al azar pero nocuando hay deterioro (e.g., duracion de huelgas y perıodo de desempleo) delsistema involucrado.
I Una generalizacion es la distribucion de Weibull:
Funcion de densidad: f(x) = cxc−1
bc exp(−x
n
)2
• Si c > 1 la tasa de eventos aumentara con el tiempo.• Si c < 1 la tasa de eventos disminuira con el tiempo.• Si c = 1, coincide con la exponencial.
Media: E[X] = bcΓ
(1c
).
Varianza: V [X] = b2
c
[2Γ
(2c
)− 1
cΓ2(1c
)].
Introduccion a la Estadıstica Andres M. Alonso
17
Otras distribuciones - Pareto
I En los trabajos pioneros para describir la distribucion de la renta, VilfredoPareto, tras estudiar la renta en numerosos paıses, observo que al menos paravalores grandes: ln(N) ≈ ln(A)− αx,
donde A y α > 0 son parametros y N es el numero de individuos que percibenuna renta mayor o igual que x.
Sea X una variable aleatoria, por ejemplo, la renta de una persona. Lafuncion de distribucion de Pareto(α, x0) es:
F (x) ={
1−(
x0x
)αsi x ≥ x0
0 si x < x0
Media: E[X] = αx0α−1
Varianza: V [X] = αx20
(α−2)(α−1)2
Notar que E[X] y V [X] existensi α > 1 y > 2, respectivamente.
Introduccion a la Estadıstica Andres M. Alonso
18
Otras distribuciones - Cauchy
I Una variable aleatoria se dice que sigue una distribucion de Cauchy(µ, θ),si tiene funcion de densidad:
f(x) =µ
π
1µ2 + (x− θ)2
, −∞ < x < ∞.
I La distribucion de Cauchy solo tiene momentos de orden p < 1:
E[|X|p] =1π
β
(1− p
2,1 + p
2
).
I La distribucion de Cauchy, por tanto, no posee ni media ni varianza.
I Se ha utilizado para modelar rendimientos de activos financieros.
Introduccion a la Estadıstica Andres M. Alonso
19
Distribucion normal
I La distribucion normal o gaussiana es, probablemente, la distribucion con-tinua mas conocida y utilizada.
Definicion 2. Se dice que una variable X se distribuye como una normalcon parametros µµµ y σσσ si
f(x) =1
σ√
2πexp
(− 1
2σ2(x− µ)2
).
En este caso, se escribe X ∼ N (µ, σ).
I La media de la distribucion normal es µ y la desviacion tıpica es σ.
I La densidad normal es simetrica respecto de su media, µ.
Introduccion a la Estadıstica Andres M. Alonso
20
Funcion de densidad de la distribucion normal
El siguiente grafico muestra la funcion de densidad de tres distribucionesnormales con distintas medias y desviaciones tıpicas.
−10 −5 0 5 10 15
0.0
0.1
0.2
0.3
0.4
x
f(x)
Introduccion a la Estadıstica Andres M. Alonso
21
Una propiedad de la distribucion normal:
Si X ∼ N (µ, σ), entonces
Pr(µ− σ < X < µ + σ) ≈ 0,683
Pr(µ− 2σ < X < µ + 2σ) ≈ 0,955
Pr(µ− 3σ < X < µ + 3σ) ≈ 0,997
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
xf(
x)
La regla de Chebyshev dice que para cualquier variable X:
Pr(µ− kσ < X < µ + kσ) ≥ 1− 1k2
.
Introduccion a la Estadıstica Andres M. Alonso
22
Transformacion lineal de una variable normal
Si X ∼ N (µ, σ) e Y = a + bX es una transformacion lineal, luego
Y ∼ N (a + bµ, bσ).
I En particular, utilizando la transformacion Z = X−µσ , se tiene
Z ∼ N (0, 1)
que es la distribucion normal estandar.
I Existen tablas de esta distribucion que pueden utilizarse para el calculo deprobabilidades con variables normales de media y varianzas conocidas.
Introduccion a la Estadıstica Andres M. Alonso
23
Tablas de la distribucion N (0, 1)N (0, 1)N (0, 1)
Introduccion a la Estadıstica Andres M. Alonso
24
Tablas de la distribucion N (0, 1)N (0, 1)N (0, 1)
Introduccion a la Estadıstica Andres M. Alonso
25
Ejemplo 5. Sea Z ∼ N(0, 1). Hallar:
Pr(Z < 1,5).Pr(Z > −1,5).Pr(−1,5 < Z < 1,5).Suponga que solo tiene la primera parte de la tabla ¿Se puede calcularPr(Z < 1,5)?
Tenemos
Pr(Z < 1,5) = 0,9332
Pr(Z > −1,5) = 1− Pr(Z < −1,5) = 1− 0,0668 = 0,9332
Pr(−1,5 < Z < 1,5) = Pr(Z < 1,5)− Pr(Z < −1,5)
= 0,9332− 0,0668 = 0,8664
Pr(Z < 1,5) = 1− Pr(Z > 1,5) = 1− Pr(Z < −1,5) ¿por que?
= 1− 0,0668 = 0,9332.
Introduccion a la Estadıstica Andres M. Alonso
26
Ejemplo 6. Sea X ∼ N(µ = 2, σ = 3). Calcular Pr(X < 4).
En este caso, tipificamos la variable original:
Pr(X < 4) = Pr(X − 2 < 4− 2) = P
(X − 2
3<
4− 23
)= Pr
(Z < 0,666
)donde Z ∼ N(0, 1)
≈ 0,74540,7454 < Pr(Z < 0,666) < 0,7486
¿Cual es Pr(−1 < X < 3,5)?
Pr(−1 < X < 3,5) = Pr(−1− 2 < X − 2 < 3,5− 2)
= P
(−1− 2
3<
X − 23
<3,5− 2
3
)= Pr(−1 < Z < 0,5) donde Z ∼ N(0, 1)
= Pr(Z < 0,5)− Pr(Z < −1)
= 0,6915− 0,1587 = 0,5328.
Introduccion a la Estadıstica Andres M. Alonso
27
Ejemplo 7. Es difıcil etiquetar la carne empaquetada con su peso correctodebido a los efectos de perdida de lıquido (definido como porcentaje del pesooriginal de la carne). Supongamos que la perdida de lıquido en un paquete depechuga de pollo se distribuye como normal con media 4 % y desviacion tıpica1 %.
Sea X la perdida de lıquido de un paquete de pechuga de pollo elegido al azar.
¿Cual es la probabilidad de que 3 % < X < 5 %?
¿Cual es el valor de x para que un 90 % de paquetes tengan perdidas de lıquidomenores de x?
En una muestra de 4 paquetes, hallar la probabilidad de que todos tenganperdidas de peso de entre 3 y 5 %.
Sexauer, B. (1980) Drained-Weight Labelling for Meat and Poultry: An Economic Analysis of
a Regulatory Proposal, Journal of Consumer Affairs, 14, 307-325.
Introduccion a la Estadıstica Andres M. Alonso
28
Pr(3 < X < 5) = Pr(
3− 41
<X − 4
1<
5− 41
)= Pr(−1 < Z < 1)
= Pr(Z < 1)− Pr(Z < −1) = 0,8413− 0,1587 = 0,6827
Queremos Pr(X < x) = 0,9. Entonces
Pr(
X − 41
<x− 4
1
)= Pr(Z < x− 4) = 0,9
Mirando las tablas, tenemos x − 4 ≈ 1,28 que implica que un 90 % de laspaquetes tienen perdidas de menos de x = 5,28 %.
Para un paquete p = Pr(3 < X < 5) = 0,6827. Sea Y el numero de paquetesen la muestra que tienen perdidas de entre 3 % y 5 %. Luego Y ∼ B(4, 0,6827).
Pr(Y = 4) =(
44
)0,68274(1− 0,6827)4 = 0,2172.
Introduccion a la Estadıstica Andres M. Alonso
29
Sumas y diferencias de dos variables normales
Si X ∼ N (µX, σX) e Y ∼ N (µ, σY ) son independientes, entonces la distribu-cion de la suma o diferencia de ambas variables es tambien normal con lassiguientes medias y desviaciones tıpicas:
X + Y ∼ N(
µX + µY ,√
σ2X + σ2
Y
)
X − Y ∼ N(
µX − µY ,√
σ2X + σ2
Y
).
Introduccion a la Estadıstica Andres M. Alonso
30
Ejemplo 8. (Junio/2004) Un determinado establecimiento vende tres marcasdiferentes de coches. Sean X1, X2 y X3 variables aleatorias independientesnormales, que representan el volumen semanal de ventas para cada una de lasmarcas. Las ventas medias semanales de estas marcas son 42, 60 y 78 mileuros, respectivamente, y sus desviaciones tıpicas respectivas son 12, 18 y 10mil euros.
a) ¿Cual es la probabilidad de que la primera marca no supere los 30 mil eurosen una semana? ¿Y la probabilidad de que la segunda marca supere en unsemana la mediana de la tercera marca?
b) Calcular la probabilidad de que, en una semana determinada, las ventas delestablecimiento sean superiores a los 120 mil euros.
c) ¿Cual es la probabilidad de que la suma de las ventas de la primera marcay de la tercera superen a las ventas de la segunda marca en mas de 18 mileuros, en una semana?
Introduccion a la Estadıstica Andres M. Alonso
31
a) X1 ∼ N(42, 12). Luego
Pr(X1 < 30) = P
(X1 − 42
12<
30− 4212
)= Pr(Z < −1) donde Z ∼ N (0, 1)
= 0,1587
La distribucion normal es simetrica en torno de su media, es decir que la moda,media y mediana son iguales. Entonces, queremos calcular Pr(X2 > 78).
Pr(X2 > 78) = P
(X2 − 60
18>
78− 6018
)= Pr(Z > 1)
= 0,1587
Introduccion a la Estadıstica Andres M. Alonso
32
b) Las ventas totales son Y = X1 + X2 + X3, y
E[Y ] = 42 + 60 + 78 = 180
V [Y ] = 122 + 182 + 102 = 568
DT [Y ] ≈ 23,833
Y ∼ N(180, 23,833)
Pr(Y > 120) = P
(Y − 18023,833
>120− 180
23,833
)= Pr(Z > −2,52) = Pr(Z < 2,52) = 0,9941
c) Se quiere Pr(X1 + X3 − X2 > 18). Sea D = X1 + X3 − X2. LuegoE[D] = 42 + 78− 60 = 60 y V [D] = 568 como calculamos anteriormente.
Pr(D > 18) = P
(D − 6023,833
>18− 6023,833
)= Pr(Z > −1,76) = Pr(Z < 1,76) = 0,9608.
Introduccion a la Estadıstica Andres M. Alonso
33
Ejemplo 9. (Junio/2002) Las calificaciones de 0 a 100 obtenidas en dospruebas distintas A y B por los alumnos presentados a la Selectividad, sonindependientes y siguen las distribuciones normales: NA(µ = 62;σ = 20) yNB(µ = 52; σ = 10), respectivamente. La prueba se considera superada con50 puntos. Calcular:
(a) La probabilidad de que un alumno en la prueba A haya obtenido unapuntuacion menor que 40.
(b) La probabilidad que haya superado la prueba B.
(c) Si un alumno ha obtenido una puntuacion de 68 en la primera prueba y de62,5 en la segunda ¿en que prueba ha obtenido mejor resultado respecto delos demas alumnos?
(d) Si para el acceso a una Universidad se necesita que la media aritmetica delas dos notas anteriores sea mayor que 70, ¿cual es la probabilidad de que unalumno escogido al azar pueda acceder a dicha Universidad?
Introduccion a la Estadıstica Andres M. Alonso
34
a) Sea X la nota del alumno de la prueba A. Luego X ∼ N (62, 20).
Pr(X < 40) = P (X − 62 < 40− 62)
= P
(X − 62
20<
40− 6220
)= Pr(Z < −1,1) donde Z ∼ N (0, 1)
≈ 0,1357
b) Sea Y la nota del alumno de la prueba B. Entonces Y ∼ N (52, 10).
Pr(Y > 50) = P
(Y − 52
10>
50− 5210
)= Pr(Z > −0,2) donde Z ∼ N (0, 1)
= Pr(Z < 0,2) por simetrıa
≈ 0,5793
Introduccion a la Estadıstica Andres M. Alonso
35
c) Si su resultado en la primera prueba es 68, calculamos el valor de Z
Z1 =68− 62
20= 0,3
En el segundo caso su resultado es 62,5 y
Z2 =62,5− 52
10= 1,05
Luego hace mucho mejor en la segunda prueba con respeto a sus companeros.
d) E[M ] =12(62 + 52) = 57 y V [M ] =
14
(202 + 102
)= 125.
Por tanto M ∼ N(57,√
125) y
Pr(M > 70) = P
(M − 57√
125>
70− 57√125
)≈ Pr(Z > 1,16) = Pr(Z < −1,16) = 0,1230.
Introduccion a la Estadıstica Andres M. Alonso
36
Aproximacion mediante la distribucion normal
Hacemos el experimento de tirar una moneda con p = 1/3 un numero n deveces. Dibujamos la funcion de probabilidad de X = # cruces en los casosn = 5, 20, 50 y 100.
0 1 2 3 4 5
0.00
0.10
0.20
0.30
x
p
0 5 10 15 20
0.00
0.05
0.10
0.15
x
p
0 10 20 30 40 50
0.00
0.04
0.08
0.12
x
p
0 20 40 60 80 100
0.00
0.02
0.04
0.06
0.08
x
p
Introduccion a la Estadıstica Andres M. Alonso
37
Se ve que para n grande, la funcion de probabilidad binomial tiene una formaparecida a la densidad normal.
0 20 40 60 80 100
0.00
0.02
0.04
0.06
0.08
x
p
Introduccion a la Estadıstica Andres M. Alonso
38
Aproximacion normal de la distribucion binomial
Teorema 3. Si X ∼ B(n, p), entonces si n es suficientemente grande,
X − np√np(1− p)
≈ N(0, 1).
Esta aproximacion funciona bastante bien si tanto n (n > 30) como np yn(1 − p) son grandes. Si np o n(1 − p) es pequeno, (< 5), la aproximacionPoisson funciona mejor.
Ejemplo 10. Sea X ∼ B(100, 1/3). Estimar Pr(X < 40).
Calculamos primero a media y varianza de X.
E[X] = 100× 13
= 33.3
V [X] = 100× 13× 2
3= 22.2
Introduccion a la Estadıstica Andres M. Alonso
39
Usamos la aproximacion normal
Pr(X < 40) = P
(X − 33.3
4,714<
40− 33.34,714
)≈ P (Z < 1,414) donde Z ∼ N(0, 1)
≈ 0,921.
La probabilidad correcta es
39∑x=0
(100x
) (13
)x (23
)100−x
= 0,903.
La aproximacion no parece muy satisfactoria pero la podemos mejorar.
Introduccion a la Estadıstica Andres M. Alonso
40
Correccion de continuidad
I Si X ∼ B(n, p), entonces Pr(X ≤ x) = Pr(X < x + 1) e igualmentePr(X ≥ x) = Pr(X > x− 1).
I Cuando implementamos la aproximacion normal, usamos la correccion decontinuidad
Pr(X ≤ x) = Pr(X < x + 0,5)
Pr(X ≥ x) = Pr(X > x− 0,5)
Pr(x1 ≤ X ≤ x2) = Pr(x1 − 0,5 < X < x2 + 0,5)
Ejemplo 11. Volvemos al Ejemplo 10.
Pr(X < 40) = Pr(X ≤ 39) = Pr(X < 39,5)
≈ P
(Z <
39,5− 33.34,714
)= Pr(Z < 1,308) = 0,905
La aproximacion mejora usando la correccion de continuidad.
Introduccion a la Estadıstica Andres M. Alonso
41
Ejemplo 12. El 35% de los habitantes de una ciudad votan a cierto partidopolıtico. Se encuesta a 200 personas. Llamemos X al numero de personas quevotan a dicho partido.
¿Cual es la distribucion de X?
Calcular la probabilidad de que entre la gente de la encuesta haya entre 70 y80 votantes de ese partido.
La “verdadera” distribucion de X es binomial
X ∼ B(200, 0,35).
La media de la distribucion es 70 y la desviacion tıpica es 6,745.
Para calcular Pr(70 ≤ X ≤ 80) usamos una aproximacion normal
Introduccion a la Estadıstica Andres M. Alonso
42
Pr(70 ≤ X ≤ 80) = Pr(69,5 < X < 80,5)
= P
(69,5− 70
6,745<
X − 706,745
<80,5− 70
6,745
)≈ Pr(−0,074 < Z < 1,557)
= Pr(Z < 1,557)− Pr(Z < −0,074)
= 0,940− 0,470 = 0,47
I La distribucion binomial no es la unica distribucion que se puede aproximarmediante una distribucion normal. La distribucion de la media (o suma) de“cualesquiera” variables independientes y identicamente distribuidas
X =1n
(X1 + . . . + Xn)
puede aproximarse por una normal.
Introduccion a la Estadıstica Andres M. Alonso
43
Teorema central del lımite
Teorema 4. Sean X1, X2, . . . , Xn variables aleatorias independientes e igual-mente distribuidas con media µ y desviacion tıpica σ, ambas finitas. Si n essuficientemente grande, entonces
X − µ
σ/√
n≈ N (0, 1).
I El teorema puede interpretarse como que si n es grande, la suma∑n
i=1 Xi
tiene aproximadamente una distribucion normal
n∑i=1
Xi ≈ N(nµ, nσ2
).
Introduccion a la Estadıstica Andres M. Alonso
44
Aproximacion normal de la distribucion Poisson
Sea X ∼ Poisson(λ) el numero de sucesos raros en una unidad de tiempo.Definimos Y como el numero de sucesos en n unidades de tiempo. Luegopodemos escribir
Y = X1 + X2 + . . . + Xn
donde Xi ∼ Poisson(λ) es el numero de sucesos en la i-esima unidad detiempo.
I Podemos aplicar el teorema central del lımite para aproximar la distribucionPoisson con una distribucion normal.
Teorema 5. Sea X ∼ Poisson(λ). Para λ grande (λ > 20), entonces
X ≈ N(λ,√
λ).
Introduccion a la Estadıstica Andres M. Alonso
45
El grafico muestra la funcion de probabilidad de la distribucion Poisson conλ = 20 y la densidad normal con media y varianza λ.
0 10 20 30 40
0.00
0.02
0.04
0.06
0.08
x
P(X
=x)
La aproximacion se mejora si el valor de λ es mas grande.
Introduccion a la Estadıstica Andres M. Alonso
46
I Cuando se utiliza la aproximacion normal de la distribucion Poisson, esimportante aplicar la correccion de continuidad.
Ejemplo 13. Sea X ∼ Poisson(49). Estimar Pr(45 ≤ X ≤ 52).
Pr(45 ≤ X ≤ 52) = Pr(44,5 < X < 52,5) por la correccion de continuidad
= P
(44,5− 49√
49<
X − 49√49
<52,5− 49√
49
)≈ Pr(−0,643 < Z < 0,5) donde Z ∼ N(0, 1)
= Pr(Z < 0,5)− Pr(Z < −0,643)
= 0,6915− 0,2602 ≈ 0,431
La solucion exacta calculada a traves de la distribucion Poisson es
Pr(45 ≤ X ≤ 52) =52∑
x=45
49xe−49
x!= 0,433.
Introduccion a la Estadıstica Andres M. Alonso
47
Distribuciones asociadas a la distribucion normal
Definicion 3. Si X ∼ N(µ, σ) y se define Y = eX, se dice que Y se distribuyecomo logarıtmico normal con parametros µ, σ.
La distribucion logarıtmico normal es un modelo empleado tıpicamente paratiempos de funcionamiento de maquinas y para variables asimetricas comoingresos o gastos.
• E[Y ] = exp(µ + σ2/2).• Var(Y ) = exp(2µ+σ2)(exp(σ2)−1).
0 5 10 15
0.0
0.1
0.2
0.3
0.4
0.5
0.6
x
f(x)
Introduccion a la Estadıstica Andres M. Alonso
48
Distribuciones asociadas a la distribucion normal
Definicion 4. Sean X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion χ2 con n grados de
libertad es la distribucion de la v.a. S =n∑
i=1
X2i .
E[S] = n.
Var(S) = 2n.
χ2α
α
Introduccion a la Estadıstica Andres M. Alonso
49
Distribuciones asociadas a la distribucion normal
Definicion 5. Sean Y , X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion t de Student con n
grados de libertad es la distribucion de la v.a. T = Y∑ni=1 X2
i.
E[T ] = 0.
Var(T ) = nn−2.
− tα tα 0
α α
Introduccion a la Estadıstica Andres M. Alonso
50
Distribuciones asociadas a la distribucion normal
Definicion 6. Sean X1, X2, . . . , Xn e Y1, Y2, . . . , Ym variables aleatorias in-dependientes e identicamente distribuidas N (0, 1). La distribucion Fn,m deFisher con n y m grados de libertad es la distribucion de la v.a. F =1n
∑ni=1 X2
i1m
∑mi=1 Y 2
i
.
E[F ] = mm−2.
Var(F ) = 2m2(n+m−2)n(m−2)2(m−4)
.
1/T ∼ Fm,n.
Fn,m,α = 1/Fm,n,1−α.
Fn,m,α
α
Introduccion a la Estadıstica Andres M. Alonso
51
Recapitulacion
Tema 8. Modelos probabilısticos continuos
Distribucion uniforme.Distribucion exponencial.
W Ejemplos sencillos de v.a.continuas.
Distribucion normal.• Propiedades.• Aproximaciones mediante la distribu-
cion normal.• Otras distribuciones relacionadas con
la normal.
W La distribucion masutilizada en estadısticay econometrıa.
Introduccion a la Estadıstica Andres M. Alonso
52
Tema 1. Introducción.Tema 2. Análisis de datos univariantes.Tema 3. Análisis de datos bivariantes.Tema 4. Correlación y regresión.Tema 5. Series temporales y números índice.
Tema 5. Probabilidad.Tema 6. Variables aleatorias unidimensionales.Tema 7. Modelos probabilísticos discretos.Tema 8. Modelos probabilísticos continuos.Tema 9. Variables aleatorias multidimensionales.
Descripción de variables y datos socioeconómicos
Modelización de la incertidumbre en las variables socieconómicas
Tema 5Tema 6Tema 7Tema 8
W Introduccion a la ProbabilidadVariables aleatorias unidimensionales:• Definicion y propiedades• Ejemplos.
Tema 9 W Variables aleatorias multidimensionales :
• Definicion y propiedades• Ejemplos.
⇑Estudiar situaciones mas realistas
Introduccion a la Estadıstica Andres M. Alonso