Modelos probabilísticos continuos

52
1 Introducci´ on al Tema 8 Tema 6. Variables aleatorias unidimensionales Distribuci´ on. Caracter´ ısticas: media, varianza, etc. Transformaciones. V.A. de uso frecuente Tema 7. Modelos probabil´ ısticos discretos Tema 8. Modelos probabil´ ısticos continuos Distribuci´ on uniforme. Distribuci´ on exponencial. Otras distribuciones (Pareto, Weibull y Cauchy). Distribuci´ on normal y relacionadas. Introducci´ on a la Estad´ ıstica Andr´ es M. Alonso

Transcript of Modelos probabilísticos continuos

Page 1: Modelos probabilísticos continuos

1

Introduccion al Tema 8

Tema 6. Variables aleatorias unidimensionalesDistribucion.

Caracterısticas: media, varianza, etc.

Transformaciones.

V.A. de uso frecuente

Tema 7. Modelos probabilısticos discretos X

Tema 8. Modelos probabilısticos continuos

Distribucion uniforme.

Distribucion exponencial.

Otras distribuciones (Pareto, Weibull y Cauchy).

Distribucion normal y relacionadas.

Introduccion a la Estadıstica Andres M. Alonso

Page 2: Modelos probabilísticos continuos

2

Tema 8. Modelos probabilısticos continuos

Los contenidos a desarrollar en este tema son los siguientes:

Distribucion uniforme.

Distribucion exponencial.

Otras distribuciones (Pareto, Weibull y Cauchy).

Distribucion normal.• Propiedades.• Uso de tablas.• El teorema central del lımite y aproximaciones mediante la distribucion

normal.• Otras distribuciones relacionadas con la normal: logarıtmico-normal, χ2,

t de Student y F de Fisher–Snedecor.

Lecturas recomendadas: Capıtulos 17 y 18 del libro de Pena y Romo (1997) ylas secciones 5.5 a 5.8 de Newbold (2001).

Introduccion a la Estadıstica Andres M. Alonso

Page 3: Modelos probabilísticos continuos

3

Distribucion uniforme

Supongamos que una variable X puede tomar valores al azar en un rango(a, b) y que la probabilidad de que X tome valores en cualquier intervalo delongitud fija en (a, b) sea la misma.

En este caso, se dice que X tiene una distribucion uniforme entre a y b y seescribe

X ∼ U(a, b).

-

6

a b

1b−a

0

f(x)

x

Introduccion a la Estadıstica Andres M. Alonso

Page 4: Modelos probabilísticos continuos

4

La funcion de distribucion

Si X ∼ U(a, b), luego, si a < x ≤ b,

F (x) = Pr(X ≤ x) =∫ x

a

1b− a

du =[

u

b− a

]x

a

=x− a

b− a

-

6

a b

1

0

F (x)

x%

%%

%%

%%

%%

%%

%%

%%

%%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

%%

Introduccion a la Estadıstica Andres M. Alonso

Page 5: Modelos probabilísticos continuos

5

La media y desviacion tıpica

Teorema 1. Sea X ∼ U(a, b). Entonces

E[X] =a + b

2

V [X] =(b− a)2

12

DT [X] =b− a√

12

Demostracion

E[X] =∫ b

a

1b− a

× x dx =[

x2

2(b− a)

]b

a

=b2 − a2

2(b− a)=

a + b

2

Introduccion a la Estadıstica Andres M. Alonso

Page 6: Modelos probabilísticos continuos

6

E[X2

]=

∫ b

a

x2

b− adx =

[x3

3(b− a)

]b

a

=b3 − a3

3(b− a)=

b2 + ab + a2

3

V [X] = E[X2

]− E[X]2 =

b2 + ab + a2

3−

(a + b

2

)2

=b2 + ab + a2

3− a2 + 2ab + b2

4

=a2 − 2ab + b2

12=

(b− a)2

12

Introduccion a la Estadıstica Andres M. Alonso

Page 7: Modelos probabilísticos continuos

7

Ejemplo 1. Si juego con la siguiente rueda de fortuna:

&%'$

��

��

����

��

��

���

gano

X

pierdo

¿Cual es la probabilidad de que gane?

Sea X el angulo desde la vertical a la flecha. Luego X ∼ U(0, 360o). Laprobabilidad de que gane es

Pr(X ≤ 90) =90− 0360− 0

=14

Introduccion a la Estadıstica Andres M. Alonso

Page 8: Modelos probabilísticos continuos

8

Distribucion exponencial

I En el tema anterior, estudiamos la distribucion Poisson X ∼ Pr(λ) comomodelo para el numero de sucesos raros en una unidad del tiempo. Ahora,supongamos que queremos estudiar la distribucion del tiempo Y entre unsuceso y el siguiente.

I En este caso, la distribucion de Y es una distribucion exponencial conparametro λ.

Definicion 1. Y tiene una distribucion exponencial con parametro λλλ si

f(y) = λe−λy

para 0 < y ≤ ∞. En este caso se escribe Y ∼ Ex(λ).

I La distribucion exponencial permite modelar la duracion de elementos: vidade personas, duracion de huelgas, del perıodo de desempleo, etc.

Introduccion a la Estadıstica Andres M. Alonso

Page 9: Modelos probabilísticos continuos

9

La funcion de distribucion de Y es

F (y) = Pr(Y ≤ y)

=∫ y

0

λe−λu du

=[−e−λu

]y

0

= 1− e−λy para 0 < y < ∞.

Finalmente,

F (y) ={

0 si y ≤ 01− e−λy si 0 < y

.

Introduccion a la Estadıstica Andres M. Alonso

Page 10: Modelos probabilísticos continuos

10

La media y varianza

Teorema 2. Si Y ∼ Ex(λ), entonces

E[Y ] =1λ

V [Y ] =1λ2

DT [Y ] =1λ

Demostracion parcial

Recordamos que λ es el numero de sucesos esperados en una unidad detiempo. Entonces, el tiempo esperado entre sucesos debe ser 1/λ, es decir queE[Y ] = 1/λ. �

Introduccion a la Estadıstica Andres M. Alonso

Page 11: Modelos probabilísticos continuos

11

Ejemplo 2. En promedio, hay 50 incendios serios cada ano en una localidad.Sabemos que el numero de fuegos por ano tiene una distribucion PoissonPoisson(50).

¿Cual es el tiempo medio entre fuegos?

Hallar la probabilidad de que despues del ultimo fuego, se tarde mas de 2semanas hasta el siguiente.

El tiempo medio entre fuegos es 1/50 de un ano, es decir 365/50 = 7,3 dıas.

Pr(T > 14) =∫ ∞

14

50365

e−50365t dt

= e−50365×14

≈ 0,147

Introduccion a la Estadıstica Andres M. Alonso

Page 12: Modelos probabilísticos continuos

12

Ejemplo 3. El tiempo T entre llegadas sucesivas de coches a un punto enla carretera se distribuye como una exponencial con parametro λ = 0,01segundos.

1) Hallar la media y varianza de T .

2) Una persona empieza a cruzar la calle inmediatamente despues de queun coche pasa por allı. Si tarda 50 segundos en cruzar la calle, ¿cual es laprobabilidad de que le atropelle la siguiente coche que pasa (suponiendo queno para)?

3) ¿Cual es la probabilidad de que en un minuto no llegue ningun coche?

Introduccion a la Estadıstica Andres M. Alonso

Page 13: Modelos probabilísticos continuos

13

1) E[T ] = 1/0,01 = 100 y V [T ] = 1/0,012 = 10000.

2)

Pr(T < 50) =∫ ∞

0

0,01e−0,01t dt

= 1− e−0,01×50

= 1− e−0,5

≈ 0,393

3) Sea X el numero de coches que llegan en un minuto. La distribucion de Xes Poisson:

X ∼ Poisson(60× 0,01) = Poisson(0,6).

Entonces Pr(X = 0) = 0,60e−0,6

0! ≈ 0,549.

Introduccion a la Estadıstica Andres M. Alonso

Page 14: Modelos probabilísticos continuos

14

Ejemplo 4. El tiempo de funcionamiento de una bombilla se distribuye comoexponencial con una media de 10 dıas.

a) ¿Cual es la probabilidad de que una bombilla funciona mas de 10 dıas?

b) Suponiendo que cada vez que falla una bombilla se la cambia por unanueva, hallar la probabilidad de que haya mas de un fallo en un mes (30 dıas).

c) Hallar el numero medio de fallos en un mes.

Introduccion a la Estadıstica Andres M. Alonso

Page 15: Modelos probabilísticos continuos

15

a) Sea T ∼ Ex(λ) el tiempo de funcionamiento. Hallamos el valor de λ.Sabemos que E[T ] = 10 = 1

λ y luego λ = 0,1.

Ahora:Pr(T > 10) = 1− Pr(T ≤ 10)

= 1−{1− e−0,1×10

}= e−1 ≈ 0,368

b) El numero de fallos X en 30 dıas tiene una distribucion PoissonX ∼ Poisson(30× 0,1) = Poisson(3).

Pr(X > 1) = 1− Pr(X ≤ 1)

= 1−{

30e−3

0!+

31e−3

1!

}≈ 0.801

c) El numero medio de fallos por mes son 3.

Introduccion a la Estadıstica Andres M. Alonso

Page 16: Modelos probabilísticos continuos

16

Otras distribuciones - Weibull

I La distribucion exponencial se caracteriza por no poseer memoria, es decir,la probabilidad de observar un evento en cualquier intervalo de tiempo nodepende del tiempo que ha pasado hasta ese intervalo.

I Esta caracterıstica es adecuada cuando los eventos aparecen al azar pero nocuando hay deterioro (e.g., duracion de huelgas y perıodo de desempleo) delsistema involucrado.

I Una generalizacion es la distribucion de Weibull:

Funcion de densidad: f(x) = cxc−1

bc exp(−x

n

)2

• Si c > 1 la tasa de eventos aumentara con el tiempo.• Si c < 1 la tasa de eventos disminuira con el tiempo.• Si c = 1, coincide con la exponencial.

Media: E[X] = bcΓ

(1c

).

Varianza: V [X] = b2

c

[2Γ

(2c

)− 1

cΓ2(1c

)].

Introduccion a la Estadıstica Andres M. Alonso

Page 17: Modelos probabilísticos continuos

17

Otras distribuciones - Pareto

I En los trabajos pioneros para describir la distribucion de la renta, VilfredoPareto, tras estudiar la renta en numerosos paıses, observo que al menos paravalores grandes: ln(N) ≈ ln(A)− αx,

donde A y α > 0 son parametros y N es el numero de individuos que percibenuna renta mayor o igual que x.

Sea X una variable aleatoria, por ejemplo, la renta de una persona. Lafuncion de distribucion de Pareto(α, x0) es:

F (x) ={

1−(

x0x

)αsi x ≥ x0

0 si x < x0

Media: E[X] = αx0α−1

Varianza: V [X] = αx20

(α−2)(α−1)2

Notar que E[X] y V [X] existensi α > 1 y > 2, respectivamente.

Introduccion a la Estadıstica Andres M. Alonso

Page 18: Modelos probabilísticos continuos

18

Otras distribuciones - Cauchy

I Una variable aleatoria se dice que sigue una distribucion de Cauchy(µ, θ),si tiene funcion de densidad:

f(x) =µ

π

1µ2 + (x− θ)2

, −∞ < x < ∞.

I La distribucion de Cauchy solo tiene momentos de orden p < 1:

E[|X|p] =1π

β

(1− p

2,1 + p

2

).

I La distribucion de Cauchy, por tanto, no posee ni media ni varianza.

I Se ha utilizado para modelar rendimientos de activos financieros.

Introduccion a la Estadıstica Andres M. Alonso

Page 19: Modelos probabilísticos continuos

19

Distribucion normal

I La distribucion normal o gaussiana es, probablemente, la distribucion con-tinua mas conocida y utilizada.

Definicion 2. Se dice que una variable X se distribuye como una normalcon parametros µµµ y σσσ si

f(x) =1

σ√

2πexp

(− 1

2σ2(x− µ)2

).

En este caso, se escribe X ∼ N (µ, σ).

I La media de la distribucion normal es µ y la desviacion tıpica es σ.

I La densidad normal es simetrica respecto de su media, µ.

Introduccion a la Estadıstica Andres M. Alonso

Page 20: Modelos probabilísticos continuos

20

Funcion de densidad de la distribucion normal

El siguiente grafico muestra la funcion de densidad de tres distribucionesnormales con distintas medias y desviaciones tıpicas.

−10 −5 0 5 10 15

0.0

0.1

0.2

0.3

0.4

x

f(x)

Introduccion a la Estadıstica Andres M. Alonso

Page 21: Modelos probabilísticos continuos

21

Una propiedad de la distribucion normal:

Si X ∼ N (µ, σ), entonces

Pr(µ− σ < X < µ + σ) ≈ 0,683

Pr(µ− 2σ < X < µ + 2σ) ≈ 0,955

Pr(µ− 3σ < X < µ + 3σ) ≈ 0,997

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

xf(

x)

La regla de Chebyshev dice que para cualquier variable X:

Pr(µ− kσ < X < µ + kσ) ≥ 1− 1k2

.

Introduccion a la Estadıstica Andres M. Alonso

Page 22: Modelos probabilísticos continuos

22

Transformacion lineal de una variable normal

Si X ∼ N (µ, σ) e Y = a + bX es una transformacion lineal, luego

Y ∼ N (a + bµ, bσ).

I En particular, utilizando la transformacion Z = X−µσ , se tiene

Z ∼ N (0, 1)

que es la distribucion normal estandar.

I Existen tablas de esta distribucion que pueden utilizarse para el calculo deprobabilidades con variables normales de media y varianzas conocidas.

Introduccion a la Estadıstica Andres M. Alonso

Page 23: Modelos probabilísticos continuos

23

Tablas de la distribucion N (0, 1)N (0, 1)N (0, 1)

Introduccion a la Estadıstica Andres M. Alonso

Page 24: Modelos probabilísticos continuos

24

Tablas de la distribucion N (0, 1)N (0, 1)N (0, 1)

Introduccion a la Estadıstica Andres M. Alonso

Page 25: Modelos probabilísticos continuos

25

Ejemplo 5. Sea Z ∼ N(0, 1). Hallar:

Pr(Z < 1,5).Pr(Z > −1,5).Pr(−1,5 < Z < 1,5).Suponga que solo tiene la primera parte de la tabla ¿Se puede calcularPr(Z < 1,5)?

Tenemos

Pr(Z < 1,5) = 0,9332

Pr(Z > −1,5) = 1− Pr(Z < −1,5) = 1− 0,0668 = 0,9332

Pr(−1,5 < Z < 1,5) = Pr(Z < 1,5)− Pr(Z < −1,5)

= 0,9332− 0,0668 = 0,8664

Pr(Z < 1,5) = 1− Pr(Z > 1,5) = 1− Pr(Z < −1,5) ¿por que?

= 1− 0,0668 = 0,9332.

Introduccion a la Estadıstica Andres M. Alonso

Page 26: Modelos probabilísticos continuos

26

Ejemplo 6. Sea X ∼ N(µ = 2, σ = 3). Calcular Pr(X < 4).

En este caso, tipificamos la variable original:

Pr(X < 4) = Pr(X − 2 < 4− 2) = P

(X − 2

3<

4− 23

)= Pr

(Z < 0,666

)donde Z ∼ N(0, 1)

≈ 0,74540,7454 < Pr(Z < 0,666) < 0,7486

¿Cual es Pr(−1 < X < 3,5)?

Pr(−1 < X < 3,5) = Pr(−1− 2 < X − 2 < 3,5− 2)

= P

(−1− 2

3<

X − 23

<3,5− 2

3

)= Pr(−1 < Z < 0,5) donde Z ∼ N(0, 1)

= Pr(Z < 0,5)− Pr(Z < −1)

= 0,6915− 0,1587 = 0,5328.

Introduccion a la Estadıstica Andres M. Alonso

Page 27: Modelos probabilísticos continuos

27

Ejemplo 7. Es difıcil etiquetar la carne empaquetada con su peso correctodebido a los efectos de perdida de lıquido (definido como porcentaje del pesooriginal de la carne). Supongamos que la perdida de lıquido en un paquete depechuga de pollo se distribuye como normal con media 4 % y desviacion tıpica1 %.

Sea X la perdida de lıquido de un paquete de pechuga de pollo elegido al azar.

¿Cual es la probabilidad de que 3 % < X < 5 %?

¿Cual es el valor de x para que un 90 % de paquetes tengan perdidas de lıquidomenores de x?

En una muestra de 4 paquetes, hallar la probabilidad de que todos tenganperdidas de peso de entre 3 y 5 %.

Sexauer, B. (1980) Drained-Weight Labelling for Meat and Poultry: An Economic Analysis of

a Regulatory Proposal, Journal of Consumer Affairs, 14, 307-325.

Introduccion a la Estadıstica Andres M. Alonso

Page 28: Modelos probabilísticos continuos

28

Pr(3 < X < 5) = Pr(

3− 41

<X − 4

1<

5− 41

)= Pr(−1 < Z < 1)

= Pr(Z < 1)− Pr(Z < −1) = 0,8413− 0,1587 = 0,6827

Queremos Pr(X < x) = 0,9. Entonces

Pr(

X − 41

<x− 4

1

)= Pr(Z < x− 4) = 0,9

Mirando las tablas, tenemos x − 4 ≈ 1,28 que implica que un 90 % de laspaquetes tienen perdidas de menos de x = 5,28 %.

Para un paquete p = Pr(3 < X < 5) = 0,6827. Sea Y el numero de paquetesen la muestra que tienen perdidas de entre 3 % y 5 %. Luego Y ∼ B(4, 0,6827).

Pr(Y = 4) =(

44

)0,68274(1− 0,6827)4 = 0,2172.

Introduccion a la Estadıstica Andres M. Alonso

Page 29: Modelos probabilísticos continuos

29

Sumas y diferencias de dos variables normales

Si X ∼ N (µX, σX) e Y ∼ N (µ, σY ) son independientes, entonces la distribu-cion de la suma o diferencia de ambas variables es tambien normal con lassiguientes medias y desviaciones tıpicas:

X + Y ∼ N(

µX + µY ,√

σ2X + σ2

Y

)

X − Y ∼ N(

µX − µY ,√

σ2X + σ2

Y

).

Introduccion a la Estadıstica Andres M. Alonso

Page 30: Modelos probabilísticos continuos

30

Ejemplo 8. (Junio/2004) Un determinado establecimiento vende tres marcasdiferentes de coches. Sean X1, X2 y X3 variables aleatorias independientesnormales, que representan el volumen semanal de ventas para cada una de lasmarcas. Las ventas medias semanales de estas marcas son 42, 60 y 78 mileuros, respectivamente, y sus desviaciones tıpicas respectivas son 12, 18 y 10mil euros.

a) ¿Cual es la probabilidad de que la primera marca no supere los 30 mil eurosen una semana? ¿Y la probabilidad de que la segunda marca supere en unsemana la mediana de la tercera marca?

b) Calcular la probabilidad de que, en una semana determinada, las ventas delestablecimiento sean superiores a los 120 mil euros.

c) ¿Cual es la probabilidad de que la suma de las ventas de la primera marcay de la tercera superen a las ventas de la segunda marca en mas de 18 mileuros, en una semana?

Introduccion a la Estadıstica Andres M. Alonso

Page 31: Modelos probabilísticos continuos

31

a) X1 ∼ N(42, 12). Luego

Pr(X1 < 30) = P

(X1 − 42

12<

30− 4212

)= Pr(Z < −1) donde Z ∼ N (0, 1)

= 0,1587

La distribucion normal es simetrica en torno de su media, es decir que la moda,media y mediana son iguales. Entonces, queremos calcular Pr(X2 > 78).

Pr(X2 > 78) = P

(X2 − 60

18>

78− 6018

)= Pr(Z > 1)

= 0,1587

Introduccion a la Estadıstica Andres M. Alonso

Page 32: Modelos probabilísticos continuos

32

b) Las ventas totales son Y = X1 + X2 + X3, y

E[Y ] = 42 + 60 + 78 = 180

V [Y ] = 122 + 182 + 102 = 568

DT [Y ] ≈ 23,833

Y ∼ N(180, 23,833)

Pr(Y > 120) = P

(Y − 18023,833

>120− 180

23,833

)= Pr(Z > −2,52) = Pr(Z < 2,52) = 0,9941

c) Se quiere Pr(X1 + X3 − X2 > 18). Sea D = X1 + X3 − X2. LuegoE[D] = 42 + 78− 60 = 60 y V [D] = 568 como calculamos anteriormente.

Pr(D > 18) = P

(D − 6023,833

>18− 6023,833

)= Pr(Z > −1,76) = Pr(Z < 1,76) = 0,9608.

Introduccion a la Estadıstica Andres M. Alonso

Page 33: Modelos probabilísticos continuos

33

Ejemplo 9. (Junio/2002) Las calificaciones de 0 a 100 obtenidas en dospruebas distintas A y B por los alumnos presentados a la Selectividad, sonindependientes y siguen las distribuciones normales: NA(µ = 62;σ = 20) yNB(µ = 52; σ = 10), respectivamente. La prueba se considera superada con50 puntos. Calcular:

(a) La probabilidad de que un alumno en la prueba A haya obtenido unapuntuacion menor que 40.

(b) La probabilidad que haya superado la prueba B.

(c) Si un alumno ha obtenido una puntuacion de 68 en la primera prueba y de62,5 en la segunda ¿en que prueba ha obtenido mejor resultado respecto delos demas alumnos?

(d) Si para el acceso a una Universidad se necesita que la media aritmetica delas dos notas anteriores sea mayor que 70, ¿cual es la probabilidad de que unalumno escogido al azar pueda acceder a dicha Universidad?

Introduccion a la Estadıstica Andres M. Alonso

Page 34: Modelos probabilísticos continuos

34

a) Sea X la nota del alumno de la prueba A. Luego X ∼ N (62, 20).

Pr(X < 40) = P (X − 62 < 40− 62)

= P

(X − 62

20<

40− 6220

)= Pr(Z < −1,1) donde Z ∼ N (0, 1)

≈ 0,1357

b) Sea Y la nota del alumno de la prueba B. Entonces Y ∼ N (52, 10).

Pr(Y > 50) = P

(Y − 52

10>

50− 5210

)= Pr(Z > −0,2) donde Z ∼ N (0, 1)

= Pr(Z < 0,2) por simetrıa

≈ 0,5793

Introduccion a la Estadıstica Andres M. Alonso

Page 35: Modelos probabilísticos continuos

35

c) Si su resultado en la primera prueba es 68, calculamos el valor de Z

Z1 =68− 62

20= 0,3

En el segundo caso su resultado es 62,5 y

Z2 =62,5− 52

10= 1,05

Luego hace mucho mejor en la segunda prueba con respeto a sus companeros.

d) E[M ] =12(62 + 52) = 57 y V [M ] =

14

(202 + 102

)= 125.

Por tanto M ∼ N(57,√

125) y

Pr(M > 70) = P

(M − 57√

125>

70− 57√125

)≈ Pr(Z > 1,16) = Pr(Z < −1,16) = 0,1230.

Introduccion a la Estadıstica Andres M. Alonso

Page 36: Modelos probabilísticos continuos

36

Aproximacion mediante la distribucion normal

Hacemos el experimento de tirar una moneda con p = 1/3 un numero n deveces. Dibujamos la funcion de probabilidad de X = # cruces en los casosn = 5, 20, 50 y 100.

0 1 2 3 4 5

0.00

0.10

0.20

0.30

x

p

0 5 10 15 20

0.00

0.05

0.10

0.15

x

p

0 10 20 30 40 50

0.00

0.04

0.08

0.12

x

p

0 20 40 60 80 100

0.00

0.02

0.04

0.06

0.08

x

p

Introduccion a la Estadıstica Andres M. Alonso

Page 37: Modelos probabilísticos continuos

37

Se ve que para n grande, la funcion de probabilidad binomial tiene una formaparecida a la densidad normal.

0 20 40 60 80 100

0.00

0.02

0.04

0.06

0.08

x

p

Introduccion a la Estadıstica Andres M. Alonso

Page 38: Modelos probabilísticos continuos

38

Aproximacion normal de la distribucion binomial

Teorema 3. Si X ∼ B(n, p), entonces si n es suficientemente grande,

X − np√np(1− p)

≈ N(0, 1).

Esta aproximacion funciona bastante bien si tanto n (n > 30) como np yn(1 − p) son grandes. Si np o n(1 − p) es pequeno, (< 5), la aproximacionPoisson funciona mejor.

Ejemplo 10. Sea X ∼ B(100, 1/3). Estimar Pr(X < 40).

Calculamos primero a media y varianza de X.

E[X] = 100× 13

= 33.3

V [X] = 100× 13× 2

3= 22.2

Introduccion a la Estadıstica Andres M. Alonso

Page 39: Modelos probabilísticos continuos

39

Usamos la aproximacion normal

Pr(X < 40) = P

(X − 33.3

4,714<

40− 33.34,714

)≈ P (Z < 1,414) donde Z ∼ N(0, 1)

≈ 0,921.

La probabilidad correcta es

39∑x=0

(100x

) (13

)x (23

)100−x

= 0,903.

La aproximacion no parece muy satisfactoria pero la podemos mejorar.

Introduccion a la Estadıstica Andres M. Alonso

Page 40: Modelos probabilísticos continuos

40

Correccion de continuidad

I Si X ∼ B(n, p), entonces Pr(X ≤ x) = Pr(X < x + 1) e igualmentePr(X ≥ x) = Pr(X > x− 1).

I Cuando implementamos la aproximacion normal, usamos la correccion decontinuidad

Pr(X ≤ x) = Pr(X < x + 0,5)

Pr(X ≥ x) = Pr(X > x− 0,5)

Pr(x1 ≤ X ≤ x2) = Pr(x1 − 0,5 < X < x2 + 0,5)

Ejemplo 11. Volvemos al Ejemplo 10.

Pr(X < 40) = Pr(X ≤ 39) = Pr(X < 39,5)

≈ P

(Z <

39,5− 33.34,714

)= Pr(Z < 1,308) = 0,905

La aproximacion mejora usando la correccion de continuidad.

Introduccion a la Estadıstica Andres M. Alonso

Page 41: Modelos probabilísticos continuos

41

Ejemplo 12. El 35% de los habitantes de una ciudad votan a cierto partidopolıtico. Se encuesta a 200 personas. Llamemos X al numero de personas quevotan a dicho partido.

¿Cual es la distribucion de X?

Calcular la probabilidad de que entre la gente de la encuesta haya entre 70 y80 votantes de ese partido.

La “verdadera” distribucion de X es binomial

X ∼ B(200, 0,35).

La media de la distribucion es 70 y la desviacion tıpica es 6,745.

Para calcular Pr(70 ≤ X ≤ 80) usamos una aproximacion normal

Introduccion a la Estadıstica Andres M. Alonso

Page 42: Modelos probabilísticos continuos

42

Pr(70 ≤ X ≤ 80) = Pr(69,5 < X < 80,5)

= P

(69,5− 70

6,745<

X − 706,745

<80,5− 70

6,745

)≈ Pr(−0,074 < Z < 1,557)

= Pr(Z < 1,557)− Pr(Z < −0,074)

= 0,940− 0,470 = 0,47

I La distribucion binomial no es la unica distribucion que se puede aproximarmediante una distribucion normal. La distribucion de la media (o suma) de“cualesquiera” variables independientes y identicamente distribuidas

X =1n

(X1 + . . . + Xn)

puede aproximarse por una normal.

Introduccion a la Estadıstica Andres M. Alonso

Page 43: Modelos probabilísticos continuos

43

Teorema central del lımite

Teorema 4. Sean X1, X2, . . . , Xn variables aleatorias independientes e igual-mente distribuidas con media µ y desviacion tıpica σ, ambas finitas. Si n essuficientemente grande, entonces

X − µ

σ/√

n≈ N (0, 1).

I El teorema puede interpretarse como que si n es grande, la suma∑n

i=1 Xi

tiene aproximadamente una distribucion normal

n∑i=1

Xi ≈ N(nµ, nσ2

).

Introduccion a la Estadıstica Andres M. Alonso

Page 44: Modelos probabilísticos continuos

44

Aproximacion normal de la distribucion Poisson

Sea X ∼ Poisson(λ) el numero de sucesos raros en una unidad de tiempo.Definimos Y como el numero de sucesos en n unidades de tiempo. Luegopodemos escribir

Y = X1 + X2 + . . . + Xn

donde Xi ∼ Poisson(λ) es el numero de sucesos en la i-esima unidad detiempo.

I Podemos aplicar el teorema central del lımite para aproximar la distribucionPoisson con una distribucion normal.

Teorema 5. Sea X ∼ Poisson(λ). Para λ grande (λ > 20), entonces

X ≈ N(λ,√

λ).

Introduccion a la Estadıstica Andres M. Alonso

Page 45: Modelos probabilísticos continuos

45

El grafico muestra la funcion de probabilidad de la distribucion Poisson conλ = 20 y la densidad normal con media y varianza λ.

0 10 20 30 40

0.00

0.02

0.04

0.06

0.08

x

P(X

=x)

La aproximacion se mejora si el valor de λ es mas grande.

Introduccion a la Estadıstica Andres M. Alonso

Page 46: Modelos probabilísticos continuos

46

I Cuando se utiliza la aproximacion normal de la distribucion Poisson, esimportante aplicar la correccion de continuidad.

Ejemplo 13. Sea X ∼ Poisson(49). Estimar Pr(45 ≤ X ≤ 52).

Pr(45 ≤ X ≤ 52) = Pr(44,5 < X < 52,5) por la correccion de continuidad

= P

(44,5− 49√

49<

X − 49√49

<52,5− 49√

49

)≈ Pr(−0,643 < Z < 0,5) donde Z ∼ N(0, 1)

= Pr(Z < 0,5)− Pr(Z < −0,643)

= 0,6915− 0,2602 ≈ 0,431

La solucion exacta calculada a traves de la distribucion Poisson es

Pr(45 ≤ X ≤ 52) =52∑

x=45

49xe−49

x!= 0,433.

Introduccion a la Estadıstica Andres M. Alonso

Page 47: Modelos probabilísticos continuos

47

Distribuciones asociadas a la distribucion normal

Definicion 3. Si X ∼ N(µ, σ) y se define Y = eX, se dice que Y se distribuyecomo logarıtmico normal con parametros µ, σ.

La distribucion logarıtmico normal es un modelo empleado tıpicamente paratiempos de funcionamiento de maquinas y para variables asimetricas comoingresos o gastos.

• E[Y ] = exp(µ + σ2/2).• Var(Y ) = exp(2µ+σ2)(exp(σ2)−1).

0 5 10 15

0.0

0.1

0.2

0.3

0.4

0.5

0.6

x

f(x)

Introduccion a la Estadıstica Andres M. Alonso

Page 48: Modelos probabilísticos continuos

48

Distribuciones asociadas a la distribucion normal

Definicion 4. Sean X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion χ2 con n grados de

libertad es la distribucion de la v.a. S =n∑

i=1

X2i .

E[S] = n.

Var(S) = 2n.

χ2α

α

Introduccion a la Estadıstica Andres M. Alonso

Page 49: Modelos probabilísticos continuos

49

Distribuciones asociadas a la distribucion normal

Definicion 5. Sean Y , X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion t de Student con n

grados de libertad es la distribucion de la v.a. T = Y∑ni=1 X2

i.

E[T ] = 0.

Var(T ) = nn−2.

− tα tα 0

α α

Introduccion a la Estadıstica Andres M. Alonso

Page 50: Modelos probabilísticos continuos

50

Distribuciones asociadas a la distribucion normal

Definicion 6. Sean X1, X2, . . . , Xn e Y1, Y2, . . . , Ym variables aleatorias in-dependientes e identicamente distribuidas N (0, 1). La distribucion Fn,m deFisher con n y m grados de libertad es la distribucion de la v.a. F =1n

∑ni=1 X2

i1m

∑mi=1 Y 2

i

.

E[F ] = mm−2.

Var(F ) = 2m2(n+m−2)n(m−2)2(m−4)

.

1/T ∼ Fm,n.

Fn,m,α = 1/Fm,n,1−α.

Fn,m,α

α

Introduccion a la Estadıstica Andres M. Alonso

Page 51: Modelos probabilísticos continuos

51

Recapitulacion

Tema 8. Modelos probabilısticos continuos

Distribucion uniforme.Distribucion exponencial.

W Ejemplos sencillos de v.a.continuas.

Distribucion normal.• Propiedades.• Aproximaciones mediante la distribu-

cion normal.• Otras distribuciones relacionadas con

la normal.

W La distribucion masutilizada en estadısticay econometrıa.

Introduccion a la Estadıstica Andres M. Alonso

Page 52: Modelos probabilísticos continuos

52

Tema 1. Introducción.Tema 2. Análisis de datos univariantes.Tema 3. Análisis de datos bivariantes.Tema 4. Correlación y regresión.Tema 5. Series temporales y números índice.

Tema 5. Probabilidad.Tema 6. Variables aleatorias unidimensionales.Tema 7. Modelos probabilísticos discretos.Tema 8. Modelos probabilísticos continuos.Tema 9. Variables aleatorias multidimensionales.

Descripción de variables y datos socioeconómicos

Modelización de la incertidumbre en las variables socieconómicas

Tema 5Tema 6Tema 7Tema 8

W Introduccion a la ProbabilidadVariables aleatorias unidimensionales:• Definicion y propiedades• Ejemplos.

Tema 9 W Variables aleatorias multidimensionales :

• Definicion y propiedades• Ejemplos.

⇑Estudiar situaciones mas realistas

Introduccion a la Estadıstica Andres M. Alonso