ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos...

15
PROFESOR: DR. JORGE ACUÑA A. 1 ESTADISTICA ESTADISTICA INFERENCIAL INFERENCIAL PROFESOR: DR. JORGE ACUÑA A. 2 LA ESTADISTICA LA ESTADISTICA Estadística descriptiva Estadística descriptiva Método científico Método científico Muestreo Muestreo Información de entrada y de salida Información de entrada y de salida Estadística inferencial Estadística inferencial Inferencias Inferencias Intervalos de confianza Intervalos de confianza Pruebas de hipótesis Pruebas de hipótesis Dígitos significativos Dígitos significativos Diseño de experimentos Diseño de experimentos Errores Errores Distribuciones de probabilidad Distribuciones de probabilidad Toma de decisiones Toma de decisiones PROFESOR: DR. JORGE ACUÑA A. 3 BASES DE PROBABILIDAD BASES DE PROBABILIDAD Experimento Experimento actividad actividad con con resultados resultados inciertos inciertos y y que que dependen dependen de de los los elementos elementos del del sistema sistema Diámetro Diámetro de de una una pieza pieza , , tiempo tiempo de de proceso proceso , , tiempo tiempo de de espera espera , , número número de de piezas piezas que que se se producen producen por por turno turno ? ? Espacio Espacio muestral muestral lista lista completa completa de de todos todos los los posibles posibles resultados resultados individuales individuales de un de un experimento experimento PROFESOR: DR. JORGE ACUÑA A. 4 BASES DE PROBABILIDAD BASES DE PROBABILIDAD Evento Evento un un subconjunto subconjunto del del espacio espacio muestral muestral Se Se denota denota por por E E , , F F , , E E 1 1 , , E E 2 2 , etc. , etc. Unión Unión , , intersección intersección , , complementos complementos Probabilidad Probabilidad de un de un evento evento es es la la posibilidad posibilidad relativa relativa de de que que este este ocurra ocurra al al realizar realizar el el experimento experimento Es un Es un número número real real entre entre 0 y 1 (inclusive) 0 y 1 (inclusive) Se Se denota denota por por P P ( ( E E ), ), P P ( ( E E F F ), etc. ), etc. Interpretación Interpretación proporción proporción de de veces veces que que el el evento evento ocurre ocurre en en muchas muchas repeticiones repeticiones independientes independientes del del experimento experimento

Transcript of ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos...

Page 1: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

1

PROFESOR: DR. JORGE ACUÑA A. 1

ESTADISTICA ESTADISTICA INFERENCIALINFERENCIAL

PROFESOR: DR. JORGE ACUÑA A. 2

LA ESTADISTICALA ESTADISTICAEstadística descriptivaEstadística descriptiva

Método científicoMétodo científicoMuestreoMuestreoInformación de entrada y de salidaInformación de entrada y de salida

Estadística inferencialEstadística inferencialInferenciasInferencias

Intervalos de confianzaIntervalos de confianzaPruebas de hipótesisPruebas de hipótesisDígitos significativosDígitos significativosDiseño de experimentosDiseño de experimentos

ErroresErroresDistribuciones de probabilidadDistribuciones de probabilidadToma de decisionesToma de decisiones

PROFESOR: DR. JORGE ACUÑA A. 3

BASES DE PROBABILIDADBASES DE PROBABILIDAD

ExperimentoExperimento –– actividadactividad con con resultadosresultados inciertosinciertos y y queque dependendependen de de loslos elementoselementos del del sistemasistema

DiámetroDiámetro de de unauna piezapieza, , tiempotiempo de de procesoproceso, , tiempotiempo de de esperaespera, , númeronúmero de de piezaspiezas queque se se producenproducen porpor turnoturno??

EspacioEspacio muestralmuestral –– listalista completacompleta de de todostodos loslosposiblesposibles resultadosresultados individualesindividuales de un de un experimentoexperimento

PROFESOR: DR. JORGE ACUÑA A. 4

BASES DE PROBABILIDADBASES DE PROBABILIDADEventoEvento –– un un subconjuntosubconjunto del del espacioespacio muestralmuestral

Se Se denotadenota porpor EE, , FF, , EE11, , EE22, etc., etc.UniónUnión, , intersecciónintersección, , complementoscomplementos

ProbabilidadProbabilidad de un de un eventoevento eses la la posibilidadposibilidad relativarelativa de de queque esteeste ocurraocurra al al realizarrealizar el el experimentoexperimento

Es un Es un númeronúmero real real entreentre 0 y 1 (inclusive)0 y 1 (inclusive)Se Se denotadenota porpor PP((EE), ), PP((EE ∩∩ FF), etc.), etc.InterpretaciónInterpretación –– proporciónproporción de de vecesveces queque el el eventoeventoocurreocurre en en muchasmuchas repeticionesrepeticiones independientesindependientes del del experimentoexperimento

Page 2: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

2

PROFESOR: DR. JORGE ACUÑA A. 5

BASES DE PROBABILIDADBASES DE PROBABILIDADAlgunasAlgunas propiedadespropiedades de la de la probabilidadprobabilidad

SiSi SS eses la la totalidadtotalidad de de ocurrenciasocurrencias, , entoncesentonces PP((SS) = 1) = 1SiSi Ø Ø eses un un eventoevento, , entoncesentonces PP(Ø) = 0(Ø) = 0SiSi EECC eses el el complementocomplemento de de EE, , entoncesentonces PP((EECC) = 1 ) = 1 –– PP((EE))La P(E o F)= PLa P(E o F)= P((EE ∪∪ FF) = ) = PP((EE) + ) + PP((FF) ) –– PP((EE ∩∩ FF))SiSi EE y y FF son son mutuamentemutuamente excluyentesexcluyentes ((ejemploejemplo, , EE ∩∩ F = F = Ø), Ø), entoncesentonces PP((EE ∪∪ FF) = ) = PP((EE) + ) + PP((FF))SiSi EE eses un un subconjuntosubconjunto de de FF ((ejemploejemplo, la , la ocurrenciaocurrencia de de EEimplicaimplica la la ocurrenciaocurrencia de de FF), ), entoncesentonces PP((EE) ) ≤≤ PP((FF))SiSi oo11, , oo22, … son , … son resultadosresultados individualesindividuales en el en el espacioespaciomuestral, muestral, entoncesentonces

PROFESOR: DR. JORGE ACUÑA A. 6

VARIABLES ALEATORIASVARIABLES ALEATORIASEs Es unauna forma de forma de cuantificarcuantificar y y simplificarsimplificar eventoseventosasociadosasociados a a probabilidadesprobabilidadesUnaUna variable variable aleatoriaaleatoria (VA) (VA) eses un un númeronúmero cuyocuyovalor valor estáestá determinadodeterminado porpor el el resultadoresultado de un de un experimentoexperimento

Se Se puedenpueden obtenerobtener inferenciasinferencias sin sin tenertener quequetrabajartrabajar con el con el espacioespacio muestral muestral completocompleto..VA VA eses un un númeronúmero cuyocuyo valor no valor no conocemosconocemos con con certezacerteza peropero queque podemospodemos conocerconocer algoalgo acercaacercade el.de el.Se Se denotadenota con con letrasletras latinaslatinas: : XX, , YY, , WW11, , WW22, etc., etc.

Su Su conductaconducta probabilísticaprobabilística se describe se describe porpor mediomediode de unauna distribucióndistribución

PROFESOR: DR. JORGE ACUÑA A. 7

VARIABLES ALEATORIAS VARIABLES ALEATORIAS CONTINUAS Y DISCRETASCONTINUAS Y DISCRETASDos Dos formasformas básicasbásicas de de VAsVAs usadasusadas parapara representarrepresentar un un modelomodeloDiscretaDiscreta –– puedepuede tomartomar solamentesolamente ciertosciertos valoresvaloresseparadosseparados

El El númeronúmero de de valoresvalores posiblesposibles puedepuede ser ser finitofinito o o infinitoinfinito

ContinuaContinua –– puedepuede tomartomar cualquiercualquier valor en un valor en un rangorangoEl El númeronúmero de de valoresvalores eses siempresiempre infinitoinfinitoEl El intervalointervalo puedepuede ser ser abiertoabierto o o cerradocerrado en ambos o en ambos o un un ladolado

PROFESOR: DR. JORGE ACUÑA A. 8

DISTRIBUCIONES DISTRIBUCIONES DISCRETASDISCRETAS

Sea Sea XX unauna variable variable aleatoriaaleatoria discretadiscreta queque puedepuedetomartomar valoresvalores xx11, , xx22, … (, … (listalista finitafinita o o infinitainfinita))FunciónFunción densidaddensidad de de probabilidadprobabilidad (FDP(FDP))

pp((xxii) = ) = PP((XX = = xxii) ) parapara ii = 1, 2, ...= 1, 2, ...La La expresiónexpresión ““XX = = xxii” ” eses un un eventoevento queque puedepuedeo no o no ocurrirocurrir, sea , sea queque tienetiene unauna probabilidadprobabilidad de de ocurrenciaocurrencia, , queque eses medidamedida porpor la FDPla FDPDado Dado queque XX debedebe ser ser igualigual a a algúnalgún valor de valor de xxii, , y dado y dado queque loslos valoresvalores xxii’s’s son son todostodos distintosdistintos, ,

Page 3: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

3

PROFESOR: DR. JORGE ACUÑA A. 9

DISTRIBUCIONES DISTRIBUCIONES DISCRETASDISCRETAS

DistribuciónDistribución acumuladaacumulada de de probabilidadprobabilidad (DAP) (DAP) ––probabilidadprobabilidad de de queque la VA sea la VA sea ≤≤ a un valor a un valor fijofijo xx::

PropiedadesPropiedades de la DAP:de la DAP:

0 0 ≤≤ FF((xx) ) ≤≤ 1 1 parapara todotodo xxComo Como xx →→ ––∞∞, , FF((xx) ) →→ 00Como Como xx →→ ++∞∞, , FF((xx) ) →→ 11FF((xx) no ) no eses decrecientedecreciente en en xxFF((xx) ) eses unauna funciónfunción continua de la continua de la derechaderecha queque brincabrinca

de un valor de un valor discretodiscreto a a otrootro

Estas cuatro propiedadesson también verdaderaspara variables continuas

PROFESOR: DR. JORGE ACUÑA A. 10

DISTRIBUCIONES DISTRIBUCIONES DISCRETASDISCRETAS

Para Para calcularcalcular valoresvalores sumarsumar loslos valoresvalores de de pp((xxii) ) paraparaaquellosaquellos xxii’s’s queque satisfacensatisfacen la la condicióncondición::

TenerTener cuidadocuidado con con desigualdadesdesigualdades

PROFESOR: DR. JORGE ACUÑA A. 11

VALOR ESPERADO DE LA VALOR ESPERADO DE LA MEDIAMEDIA

El El conjuntoconjunto de de datosdatos tienetiene un “un “centrocentro” ” –– el el promediopromedioLas variables Las variables aleatoriasaleatorias tienentienen un “un “centrocentro” ” –– valor valor esperadoesperado

Se le llama Se le llama tambiéntambién la media o la media o esperadoesperado de de XXSe Se puedepuede indicarindicar con con notaciónnotación: : µµ, , µµXXPromedioPromedio ponderadoponderado de de loslos posiblesposibles valoresvalores de de xxii, , dondedonde loslos pesos son pesos son laslas respectivasrespectivas probabilidadesprobabilidades de de ocurrenciaocurrenciaEsperadoEsperado significasignifica: : RepetirRepetir “el “el experimentoexperimento” ” muchasmuchas vecesveces, , observandoobservando

muchosmuchos valoresvalores de de XX11, , XX22, …, , …, XXnnEE((XX) ) eses valor al valor al queque se converge se converge cuandocuando nn →→ ∞∞

PROFESOR: DR. JORGE ACUÑA A. 12

VALOR ESPERADO DE LA VALOR ESPERADO DE LA VARIANZA VARIANZA

MedidasMedidas de “de “dispersióndispersión” ”

VarianzaVarianza muestralmuestral

DesviaciónDesviación estándarestándar muestralmuestralLas Las VAsVAs tienetiene medidasmedidas similaressimilares

OtraOtra notaciónnotación: :

PromedioPromedio ponderadoponderado de de laslas desviacionesdesviaciones cuadradascuadradasde de loslos posiblesposibles valoresvalores de de xxii de la mediade la mediaLa La desviacióndesviación estándarestándar de de XX esesLa La interpretacióninterpretación eses análogaanáloga a la de a la de EE((XX))

Page 4: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

4

PROFESOR: DR. JORGE ACUÑA A. 13

DISTRIBUCIONES DISTRIBUCIONES CONTINUASCONTINUAS

Sea Sea XX unauna variable variable aleatoriaaleatoria continua VAcontinua VARangoRango limitadolimitado a la a la izquierdaizquierda o o derechaderecha o o ambosambosNo No importaimporta lo lo pequeñopequeño del del rangorango, el , el númeronúmero de de valoresvalores posiblesposibles de de XX esessiempresiempre incontableincontable ((infinitoinfinito))No No eses significativasignificativa la la PP((XX = = xx) ) aunqueaunque x x estéesté en el en el rangorango. . EseEse valor valor eses un un diferencialdiferencial con valor con valor cercanocercano a 0a 0Se describe la Se describe la conductaconducta de X en de X en términostérminosde de intervalosintervalos

PROFESOR: DR. JORGE ACUÑA A. 14

DISTRIBUCIONES DISTRIBUCIONES CONTINUASCONTINUAS

FunciónFunción densidaddensidad de de probabilidadprobabilidad (FDP) (FDP) esesunauna funciónfunción ff((xx) con ) con laslas siguientessiguientes trestrespropiedadespropiedades::

ff((xx) ) ≥≥ 0 0 parapara todostodos loslos valoresvalores realesreales de de xxEl El áreaárea total total bajobajo la la curvacurva eses f(f(xx) ) eses 1:1:Para Para cualquiercualquier valor valor fijofijo de de aa y y bb con con aa ≤≤ bb, , la la probabilidadprobabilidad de de queque XX caigacaiga entreentre a y a y bbeses el el áreaárea bajobajo ff((xx) ) entreentre aa y y bb::

PROFESOR: DR. JORGE ACUÑA A. 15

DISTRIBUCIONES DISTRIBUCIONES CONTINUASCONTINUAS

Distribución acumulada de probabilidad (FAP) (FAP) ––probabilidadprobabilidad de de queque la VA sea la VA sea ≤≤ a un valor a un valor fijofijo xx::

PropiedadesPropiedades de la FAPde la FAP

0 0 ≤≤ FF((xx) ) ≤≤ 1 1 parapara todotodo xxSiSi xx →→ ––∞∞, , FF((xx) ) →→ 00SiSi xx →→ ++∞∞, , FF((xx) ) →→ 11FF((xx) no ) no eses decrecientedecreciente en en xxFF((xx) ) eses unauna funciónfunción continua con continua con pendientependiente igualigual a FDP:a FDP:

ff((xx) = ) = FF'('(xx))

Estas cuatro propiedadesson también verdaderaspara variables discretas

PROFESOR: DR. JORGE ACUÑA A. 16

VALOR ESPERADO DE LA VALOR ESPERADO DE LA MEDIAMEDIA

EsperadoEsperado o media de X o media de X eses

PromedioPromedio ponderadoponderado “continuo” de “continuo” de loslos posiblesposiblesvaloresvalores de Xde XMismaMisma interpretacióninterpretación del del casocaso discretodiscreto: : promediopromedio de un de un númeronúmero infinitoinfinito de de observacionesobservaciones de la variable Xde la variable X

Page 5: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

5

PROFESOR: DR. JORGE ACUÑA A. 17

VALOR ESPERADO DE LA VALOR ESPERADO DE LA VARIANZAVARIANZA

VarianzaVarianza de X de X eses

DesviaciónDesviación estándarestándar de X de X eses

PROFESOR: DR. JORGE ACUÑA A. 18

DATOS EN SIMULACIONDATOS EN SIMULACIONENTRADAENTRADA

DistribucionesDistribuciones de de entradaentradaRecolectarRecolectar datosdatosAjustarAjustar distribucionesdistribuciones de de probabilidadprobabilidadProbarProbar HH00: : loslos datosdatos se se ajustanajustan a la a la distribucióndistribución seleccionadaseleccionada

SALIDASALIDACompararComparar dos o dos o masmas diseñosdiseños o o modelosmodelosProbarProbar HH00: : todostodos loslos diseñosdiseños dandan el el mismomismorendimientorendimiento, o , o HH00: : unouno de de loslos diseñosdiseños eses mejormejorqueque el el otrootro u u otrosotros..

PROFESOR: DR. JORGE ACUÑA A. 19

MUESTREOMUESTREOAnálisisAnálisis estadísticoestadístico –– estimaestima o o infiereinfiere algoalgo acercaacercade de unauna poblaciónpoblación o o procesoproceso basadobasado en en unauna únicaúnicamuestramuestra extraídaextraída de de ellaella..

MuestraMuestra aleatoriaaleatoria eses un un conjuntoconjunto de de observacionesobservaciones independientesindependientes e e idénticamenteidénticamentedistribuidasdistribuidas XX11, , XX22, …, , …, XXnn

En En simulaciónsimulación, , muestreomuestreo se se aplicaaplica al al hacerhacervariasvarias corridascorridas del del modelomodelo recolectandorecolectando datosdatosNo se No se conocenconocen loslos parámetrosparámetros de la de la poblaciónpoblación(o (o distribucióndistribución) y se ) y se quierequiere estimarlosestimarlos o o inferirinferiralgoalgo acercaacerca de de ellosellos basadobasado en en unauna muestramuestra

PROFESOR: DR. JORGE ACUÑA A. 20

MUESTREOMUESTREOParámetroParámetro poblacionalpoblacionalMedia Media µµ = = EE((XX))VarianzaVarianza σσ22

ProporciónProporción PPParámetroParámetro –– se se necesitanecesitatrabajartrabajar con con todatoda la la poblaciónpoblaciónFijoFijo peropero desconocidodesconocido

EstimadoEstimado muestralmuestralMedia xMedia xVarianzaVarianza muestral smuestral s22

ProporciónProporción muestral pmuestral pEstadísticoEstadístico muestralmuestral ––puedepuede ser ser calculadocalculado de de unauna muestramuestraVaríaVaría de de unauna muestramuestra a a otraotra –– eses unauna VA, y VA, y tienetieneunauna distribucióndistribución, , llamadallamadadistribucióndistribución muestral.muestral.

Page 6: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

6

PROFESOR: DR. JORGE ACUÑA A. 21

DATOS EN SIMULACIONDATOS EN SIMULACIONLos datos obtenidos de una simulación pueden ser Los datos obtenidos de una simulación pueden ser de dos tipos: de dos tipos: datos de observación o datos datos de observación o datos dependientes del tiempodependientes del tiempo..Datos de observación son aquellos para los cuales el Datos de observación son aquellos para los cuales el tiempo de recolección no modifica su valor. tiempo de recolección no modifica su valor. Ejemplo: número de entidades procesadas en el Ejemplo: número de entidades procesadas en el sistema se recoleta al final de la corrida.sistema se recoleta al final de la corrida.Datos dependientes del tiempo son aquellos cuyo Datos dependientes del tiempo son aquellos cuyo valor varía de acuerdo con el tiempo. Ejemplo: valor varía de acuerdo con el tiempo. Ejemplo: número de entidades residentes en una cola pues al número de entidades residentes en una cola pues al calcular el valor se debe considerar el tiempo que calcular el valor se debe considerar el tiempo que duró esperando.duró esperando.

PROFESOR: DR. JORGE ACUÑA A. 22

DIGITOS SIGNIFICATIVOSDIGITOS SIGNIFICATIVOSLos valores finales de una medida de efectividad se Los valores finales de una medida de efectividad se deben reportar en forma puntual, pero ¿con cuántas deben reportar en forma puntual, pero ¿con cuántas cifras significativas?cifras significativas?Si un determinado valor del tiempo de ciclo da Si un determinado valor del tiempo de ciclo da 14.87151 minutos, ¿qué tan significativas son 14.87151 minutos, ¿qué tan significativas son aslaslúltimas tres cifras?últimas tres cifras?Si en tres corridas se obtienen los valores de Si en tres corridas se obtienen los valores de 14.87151, 14.88155, 14.85141 es poco probable 14.87151, 14.88155, 14.85141 es poco probable que nos equivoquemos si reportamos 14.8 minutos. que nos equivoquemos si reportamos 14.8 minutos. En realidad la respuesta se da en términos de que En realidad la respuesta se da en términos de que tan grande es la desviación estándar del conjunto tan grande es la desviación estándar del conjunto de tiempos de ciclo.de tiempos de ciclo.

PROFESOR: DR. JORGE ACUÑA A. 23

DIGITOS SIGNIFICATIVOSDIGITOS SIGNIFICATIVOSProcedimiento:Procedimiento:1. Recolectar los n1. Recolectar los n--valores de la medida de valores de la medida de

efectividad.efectividad.2. Agrupe los valores según teorema del límite central2. Agrupe los valores según teorema del límite central3. Calcule el promedio de promedios.3. Calcule el promedio de promedios.4. Calcule el valor de la desviación estándar s.4. Calcule el valor de la desviación estándar s.5. Calcule el valor de 2(s/5. Calcule el valor de 2(s/√√n)n)6. Identifique el d6. Identifique el díígito mas significativo. Ejemplos:gito mas significativo. Ejemplos:

0.5678 es el (5) 1.235 es el (1)0.5678 es el (5) 1.235 es el (1) 13.45 es el (1)13.45 es el (1)7. Reporte el valor de la variable basado en el 7. Reporte el valor de la variable basado en el

promedio calculado en 3), pero con un dpromedio calculado en 3), pero con un díígito menos gito menos que el valor calculado en 5). que el valor calculado en 5).

PROFESOR: DR. JORGE ACUÑA A. 24

DIGITOS SIGNIFICATIVOSDIGITOS SIGNIFICATIVOSEjemplos:Ejemplos:

PromedioPromedio 2(s/2(s/√√n)n) Puntual IntervaloPuntual Intervalo1414.6875.6875 0.75850.7585 1414 10 10 -- 20 20 18188.88.8 6.86756.8675 180180 180180--1901904499.0999.09 13.7613.76 400400 400400--5005002522529.899.89 3.27893.2789 25202520 25202520--25302530110.10.1 5.2775.277 1010 10 10 -- 20205508.6708.67 16.24316.243 500500 500500--60060012561256.5.5 0.98760.9876 12561256 12561256--12571257

Page 7: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

7

PROFESOR: DR. JORGE ACUÑA A. 25

INTERVALOS DE CONFIANZAINTERVALOS DE CONFIANZAUn Un estimadorestimador puntualpuntual eses un simple un simple númeronúmero, con , con algunaalgunaincertidumbreincertidumbre o o variabilidadvariabilidad asociadaasociada a ela elIntervaloIntervalo de de confianzaconfianza cuantificacuantifica la la imprecisiónimprecisión probable del probable del estimadorestimador puntualpuntual

Un Un intervalointervalo queque contienecontiene el el parámetroparámetro poblacionalpoblacionaldesconocidodesconocido con con unauna probabilidadprobabilidad altaalta especificadaespecificada 1 1 –– αα

IntervaloIntervalo de de confianzaconfianza parapara media media poblacionalpoblacional µµ::

tn-1,1-α/2 bajo el cual el área es1 – α/2 en t student conn – 1 grados de libertad

PROFESOR: DR. JORGE ACUÑA A. 26

PRUEBA DE HIPOTESISPRUEBA DE HIPOTESISPruebaPrueba algunaalguna conjeturaconjetura sobresobre la la poblaciónpoblación o o sussusparámetrosparámetrosNuncaNunca determinadetermina algoalgo verdaderoverdadero o o falsofalso con con certezacerteza, , solamentesolamente dada evidenciaevidencia parapara tomartomar unauna de de laslas dos dos direccionesdireccionesHipótesisHipótesis nulanula ((HH00) ) –– lo lo queque vava a ser a ser probadoprobadoHipótesisHipótesis alternativaalternativa ((HH11 or or HHAA) ) –– negaciónnegación de de HH00HH00: : µµ = 6 vs. = 6 vs. HH11: : µµ ≠≠ 66HH00: : σσ < 10 vs. < 10 vs. HH11: : σσ ≥≥ 1010HH00: : µµ11 = = µµ22 vs. vs. HH11: : µµ11 ≠≠ µµ22

DesarrollaDesarrolla unauna reglaregla de de decisióndecisión parapara decidirdecidir sobresobreHH00 o o HH11 basadobasado en en loslos datosdatos de la de la muestramuestra

PROFESOR: DR. JORGE ACUÑA A. 27

ERRORES EN PRUEBA DE ERRORES EN PRUEBA DE HIPOTESISHIPOTESIS

H0 es verdadera H1 es verdadera

Decide H0 (“Acepta” H0)

No hay error Probabilidad 1 – α α es seleccionado

Error tipo II Probabilidad β β no está controlado– afectado por α y n

Decide H1 (Rechaza H0)

Error tipo I Probabilidad α

No hay error Probabilidad – β = potencia de la prueba

PROFESOR: DR. JORGE ACUÑA A. 28

VALORES DE pVALORES DE pCalcularCalcular el valor de el valor de p p de la de la pruebaprueba

pp--value (valor p) = value (valor p) = probabilidadprobabilidad de de obtenerobtener un un resultadoresultado masmas en favor de en favor de HH11 queque lo lo obtenidoobtenido en la en la muestramuestraPequeñoPequeño pp (< 0.01) (< 0.01) evidenciaevidencia convincenteconvincente en en contra de contra de HH00

GranGran pp (> 0.20) (> 0.20) indicaindica faltafalta de de evidenciaevidencia contra contra HH00

ConecciónConección con el con el métodométodo tradicionaltradicionalSiSi pp < < αα, , rechazarrechazar HH00

SiSi pp ≥≥ αα, no , no rechazarrechazar HH00

Page 8: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

8

PROFESOR: DR. JORGE ACUÑA A. 29

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESISComportamiento de un proceso con el fin de ejecutar acciones que prevengan problemas de calidad.Procedimiento mediante el cual, sujeto a un error tipo I denotado por α, se contrasta una hipótesis planteada con el fin de probar su veracidad o su falsedad.Error tipo I (α) es la probabilidad de rechazar la hipótesis nula siendo esta verdadera.Error tipo II (ß) es la probabilidad de aceptar la hipótesis nula siendo esta falsa.

PROFESOR: DR. JORGE ACUÑA A. 30

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

a. Plantear la hipótesis nula H0 y la hipótesisalternativa denotada por Ha.

b. Prueba debe ser unilateral o bilateral.c. Fijar el nivel de significación (α) o error tipo I, (1%,

5% ó 10%)d. Definir el estadístico a usar de acuerdo con la

distribución de probabilidad que le corresponde a la variable en estudio y según lo que se desee probar (una media, dos medias, una varianza, dos varianzas, una proporción o dos proporciones).

PROFESOR: DR. JORGE ACUÑA A. 31

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESISe. Definir las áreas donde se cumplirá cada una de

las hipótesis. f. Calcular el valor del estadístico seleccionado g. Comparar el estadístico obtenido con el estadístico

teórico. El resultado permitirá conocer la decisión de aceptación o rechazo

h. Obtener las conclusiones del experimento efectuado. Un valor importante de calcular aquíes el error tipo II.

PROFESOR: DR. JORGE ACUÑA A. 32

EJEMPLO 1EJEMPLO 1

En un proceso de fabricación de piezas de precisión se quiere que el valor nominal del diámetro de una pieza sea 20,0 mm. Se conoce que la desviación estándar de esta característica es 3,0 mm. Se toma una muestra de 25 piezas obteniéndose un promedio de diámetro de 19,2 mm. ¿Se ha cumplido con lo requerido? Use α=5%.

Page 9: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

9

PROFESOR: DR. JORGE ACUÑA A. 33

SOLUCIONSe seguirá el procedimiento planteado.a. Planteo de la hipótesis

H0: µ = 20,0Ha: µ ≠ 20,0

b. La hipótesis es bilateral puesto que no se cumple con lo requerido si el promedio de la muestra es mayor o menor que lo especificado.

c. El nivel de significación es dado, α= 5%.d. El estadístico por usar es el siguiente:

_x – µ

Z = ––––––σ/√ n

PROFESOR: DR. JORGE ACUÑA A. 34

SOLUCIONe. Las áreas de cumplimiento de la hipótesis .f. Cálculo del estadístico citado en d.

_x – µ 19,2 – 20,0

Z = ——— = —————— = –1,33σ/√ n 3,0/ √ 25

g. El valor de Z calculado (–1,33) se encuentra en el área de cumplimiento de la hipótesis nula.h. En conclusión, se puede afirmar, con α=5%, que estadísticamente se cumple con el valor nominal requerido.

PROFESOR: DR. JORGE ACUÑA A. 35

EJEMPLO 2EJEMPLO 2

Si en el Ejemplo 1 no se conoce la desviación estándar pero a partir de la muestra se calcula una desviación típica de 2,1 mm ¿Quéconclusiones se obtienen? Use α=5%.

PROFESOR: DR. JORGE ACUÑA A. 36

SOLUCIONSOLUCIONSe seguirá el procedimiento planteado.a. Planteo de la hipótesis

H0: µ = 20,0Ha: µ ≠ 20,0

b. La hipótesis es bilateral puesto que no se cumple con lo requerido si el promedio de la muestra es mayor o menor que lo especificado.

c. El nivel de significación es dado, α = 5%.d. El estadístico por usar es el siguiente:

_x – µ

t = ————s/√ n-1

Page 10: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

10

PROFESOR: DR. JORGE ACUÑA A. 37

SOLUCIONSOLUCION

e. Las áreas de cumplimiento de la hipótesis.f. Cálculo del estadístico citado en d.

_x – µ 19,2 – 20,0

t = –––––––––– = —————— = –1,87s/ √ n-1 2,1/ √24g. El valor de t calculado (–1,87) se encuentra

en el área de cumplimiento de la hipótesis nula.h. En conclusión, se puede afirmar, con

α = 5%, que estadísticamente se cumple con el valor nominal requerido.

PROFESOR: DR. JORGE ACUÑA A. 38

EJEMPLO 3EJEMPLO 3

Un proveedor envía lotes de producto que según sus registros son 5% defectuosos. Un cliente toma una muestra de 200 unidades y encuentra 16 unidades defectuosas. ¿Es cierto lo que muestran los registros del proveedor, con α =5%?

PROFESOR: DR. JORGE ACUÑA A. 39

SOLUCIONSOLUCIONSe seguirá el procedimiento planteado.

a. Planteo de la hipótesisH0: p = 0,05Ha: p > 0,05

b. La hipótesis es unilateral puesto que lo problemático en cuanto a calidad es que el porcentaje de defectuosos supere lo especificado.c. El nivel de significación es dado, α = 5%.d. El estadístico por usar es el siguiente:

x – npZ = –––––––

√npq

PROFESOR: DR. JORGE ACUÑA A. 40

SOLUCIONSOLUCION

e.e. Las áreas de cumplimiento de la hipótesis.f. Cálculo del estadístico

x – np 16 – 200(0,05)Z = ———— = ––––––––––––––– = 1,95

√npq √ 200*0,05*0,95g. El valor de Z calculado (1,95) se encuentra fuera del

área de cumplimiento de la hipótesis nula.h. En conclusión, no hay evidencia estadística para

aceptar la hipótesis nula con α= 5%. Por lo tanto, estadísticamente no es cierto lo que anotan los registros del fabricante.

Page 11: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

11

PROFESOR: DR. JORGE ACUÑA A. 41

EJEMPLO 4EJEMPLO 4

Para el mismo producto del Ejemplo 3, existe otro proveedor. Una muestra de 200 unidades extraídas de un lote enviado por él, tenía 12 unidades defectuosas. ¿Se puede decir con 95% de confianza que el proveedor del Ejemplo 3 da peor calidad que el de este ejemplo.

PROFESOR: DR. JORGE ACUÑA A. 42

SOLUCIONSOLUCIONSe seguirá el procedimiento planteado.a. Planteo de la hipótesis

p1: fracción defectuosa del proveedor Ap2: fracción defectuosa del proveedor B

H0: p1 = p2Ha: p1 > p2

b. La hipótesis es unilateral pues se quiere probar si la cantidad de defectuosos enviada por un proveedor es significativamente mayor que la del otro.

c. El nivel de significación es dado, α= 5%.

PROFESOR: DR. JORGE ACUÑA A. 43

SOLUCIONSOLUCIONd. El estadístico por usar es:

x1 + x2p’ = ————— q’ = 1 – p’

n1 + n2e. Las áreas de cumplimiento f. Cálculo del estadístico

x1 + x2 16 + 12p’ = –––––––– = ––––––––– = 0,07

n1 + n2 200 + 200 q’ = 1 – 0,07 = 0,93g. El valor de Z calculado (0,784) está en el área de cumplimiento de la hipótesis nula.h. Se puede afirmar, con α=5%, que no hay diferencia significativa entre las calidades suministradas por ambos proveedores.

784.0

2001

200193.0*07.0

20012

20016

11''21

2

2

1

1

=

+

−=

+

−=

Z

nnqp

nx

nx

Z

PROFESOR: DR. JORGE ACUÑA A. 44

EJEMPLO 4EJEMPLO 4

En el corte de una varilla cromada se genera una varianza de la longitud de 2,5 mm2. Se toma una muestra de 30 varillas y se mide la varianza muestral de la longitud, la que resulta ser 2,0 mm2. ¿Existe alguna diferencia significativa con el valor inicial de 2,5 mm2? Use α=5%.

Page 12: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

12

PROFESOR: DR. JORGE ACUÑA A. 45

SOLUCIONSOLUCIONSe seguirá el procedimiento planteado.a. Planteo de la hipótesis

H0: σ2 = 2,5Ha: σ2 ≠ 2,5

b. La hipótesis es bilateral puesto que no se cumple con lo requerido si la varianza de la muestra es mayor o menor que la especificada.c. El nivel de significación es dado, α= 5%.d. El estadístico por usar es el siguiente:

s2

χ2= (n-1) ——σ2

e. Las áreas de cumplimiento de la hipótesis.

PROFESOR: DR. JORGE ACUÑA A. 46

SOLUCIONSOLUCION

f. Cálculo del estadístico citado en d.s2

χ2= (n-1) —— = 29 * (2/2,5) = 23,2 σ2

g. El valor de χ2 calculado (23,2) se encuentra en el área de cumplimiento de la hipótesis nula.h. En conclusión, se puede afirmar, con α= 5%, que estadísticamente no existe diferencia con la varianza inicial.

PROFESOR: DR. JORGE ACUÑA A. 47

EJEMPLO 5EJEMPLO 5

En un proceso de corte de bolsas plásticas se usan dos máquinas. De la máquina A se toma una muestra de 30 unidades que genera una varianza en la longitud de corte de 3,3 mm2 y de la máquina B se toma una muestra de 25 unidades que genera una varianza en la longitud de corte de 4,1 mm2. ¿Se puede afirmar, con α= 5%, que una máquina es mejor en la ejecución de esta operación que la otra?

PROFESOR: DR. JORGE ACUÑA A. 48

SOLUCIONSOLUCIONSe seguirá el procedimiento planteado.

a. Planteo de la hipótesisSea σ2

A la varianza producida por la máquina Aσ2

B la varianza producida por la máquina BH0: σ2

A = σ2B

Ha: σ2A ≠ σ2

B

b. La hipótesis es bilateral puesto se desea probar la existencia de diferencias entre las varianzas de ambas máquinas. c. El nivel de significación es dado, α= 5%.d. El estadístico por usar es el siguiente:

s12

F = ———s2

2

Page 13: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

13

PROFESOR: DR. JORGE ACUÑA A. 49

SOLUCIONSOLUCIONe. Las áreas de cumplimiento de hipótesis. Los valores de F de 0.53 y 1.94 fueron extraídos de tablas F con α/2 = 0.025.f. Cálculo del estadístico citado en d.

s12 3,3

F = ——–– = ——–– = 0,805s2

2 4,1

g. El valor de F calculado (0,805) se encuentra en el área de cumplimiento de la hipótesis nula (ver Figura 2.18).h. En conclusión, se puede afirmar, con α=5%, que no existe ninguna diferencia de variabilidad de la longitud de corte entre ambas máquinas.

PROFESOR: DR. JORGE ACUÑA A. 50

EJEMPLO 6EJEMPLO 6Una inspección de calidad efectuada sobre dos marcas de baterías para linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con una desviación estándar de 1,5 horas.Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre la vida útil de ambas marcas.

PROFESOR: DR. JORGE ACUÑA A. 51

SOLUCIONSOLUCIONPara probar si hay diferencia significativa entre los promedios se debe comprobar primero la diferencia entre las varianzas, para así seleccionar el estadístico adecuado.1. Hipótesis de varianzasSiguiendo los pasos de una prueba de hipótesis se tiene:a. Planteo de la hipótesis

H0: σ2A = σ2

B

Ha: σ2A ≠ σ2

B

b. Como la hipótesis alternativa es de desigualdad, entonces es bilateral. Esto significa que puede darse una relación mayor o menor.

PROFESOR: DR. JORGE ACUÑA A. 52

SOLUCIONSOLUCIONc. El nivel de significancia es α= 5%.

d. El estadístico por usar es Fc = s12/ s2

2

(distribución F-Fisher), pues lo que se desea es medir la relación de varianzas.e. Las áreas de la hipótesis que se va a probar.v1 = n1–1 = 61–1=60 v2=n2-1 = 31–1=30De una Tabla F con α/2= 2.5% se tiene:

F 60,30,0.025 = 0,551F 60,30,0.975 = 1,440

f. Fc= s12/ s2

2 = 1,82/1,52 = 1,44g. Este valor calculado de Fc cae en el área donde se cumple Ho, por lo tanto se acepta Ho.

Page 14: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

14

PROFESOR: DR. JORGE ACUÑA A. 53

SOLUCIONSOLUCION

h. Se concluye que ambas varianzas, al 5% de significancia, son iguales.Se procede entonces a hacer la hipótesis de promedios.Siguiendo los pasos de prueba de hipótesis se tiene:a. Planteo de la hipótesis

Ho: µ1 = µ2

Ha : µ1 ≠ µ2

b. La hipótesis es bilateral al igual que en la hipótesis anterior.c. El nivel de significación es del 5%

PROFESOR: DR. JORGE ACUÑA A. 54

SOLUCIONSOLUCIONd. Según la hipótesis anterior las varianzas son desconocidas pero iguales, además, los tamaños de muestra son mayores que 30. Por lo tanto el estadístico por usar es:

e. Las áreas de cumplimiento y rechazo.v = n1 + n2 – 2v = 61 + 31 – 2v = 90

2

22

1

21

21

ns

nsxxt+

−−=

δ

PROFESOR: DR. JORGE ACUÑA A. 55

SOLUCIONSOLUCIONDe tablas se obtienen los valores:t 90, 0,025 = –1,987 t90,0,975=1,987

f. El estadístico calculado es:

En este caso (µ1 – µ2) = 0 pues es de suponer que tratándose de un mismo producto las medias poblacionales son iguales.g. No hay evidencia estadística, con α = 5%, para concluir que ambas medias sean diferentes.

845,0355,03,0

315,1

618,1

08,365,3622

−=−

=

+

−−=t

PROFESOR: DR. JORGE ACUÑA A. 56

CORRIDAS DE SIMULACIONCORRIDAS DE SIMULACIONNo sacar conclusiones en simulación con base en una sola No sacar conclusiones en simulación con base en una sola corrida. Se debe aplicar muestreo. Para ello:corrida. Se debe aplicar muestreo. Para ello:1. Hacer un número inicial de corridas n1. Hacer un número inicial de corridas ni i (10).(10).2. Calcular la desviación estándar para la medida de 2. Calcular la desviación estándar para la medida de

efectividad mas importante del modelo. efectividad mas importante del modelo. 3. Estimar el valor de 3. Estimar el valor de h = th = tαα/2,n/2,n--11*s/*s/√√nn4. Calcular n = n4. Calcular n = nii*(h/h’)*(h/h’)2 2 h’ es el valor deseado de h’ es el valor deseado de

intervalointervalo5. Correr la simulación por el número de corridas 5. Correr la simulación por el número de corridas

faltantes sea por n faltantes sea por n -- nnii , cambiando la semilla de , cambiando la semilla de número aleatorios, de lo contrario se repite la salida. número aleatorios, de lo contrario se repite la salida. Si Si nnii≥≥ nn entonces no hay necesidad de mas corridas. entonces no hay necesidad de mas corridas.

Page 15: ESTADISTICA INFERENCIAL - WordPress.com2, etc. Unión, intersección, complementos ProbabilidadProbabilidadde un eventoevento eses la posibilidad relativa de que este ocurra al realizar

15

PROFESOR: DR. JORGE ACUÑA A. 57

CORRIDAS DE SIMULACIONCORRIDAS DE SIMULACIONEJEMPLOEJEMPLO::Se han obtenido 10 corridas de una simulación que Se han obtenido 10 corridas de una simulación que han generado los siguientes tiempos de ciclo: 93, 113, han generado los siguientes tiempos de ciclo: 93, 113, 107, 103, 112, 103, 112, 100, 98 y 105. Se desea un 107, 103, 112, 103, 112, 100, 98 y 105. Se desea un h’h’ de 3.de 3.

1. Calcular la desviación estándar, s = 6.591. Calcular la desviación estándar, s = 6.592. Estimar 2. Estimar h=th=tαα/2,n/2,n--11*s/*s/√√nn = 2.262*6.59/= 2.262*6.59/√√99 = 4.97= 4.97

tt0.975,90.975,9= 2.262 (en tablas)= 2.262 (en tablas)3. 3. Calcular n = nCalcular n = nii*(h/h’)*(h/h’)2 2 = 10 * (4.97/3) = 10 * (4.97/3) 2 2 = 27.44 ~ 28 = 27.44 ~ 28 4. Obtener 18 corridas mas de la simulación.4. Obtener 18 corridas mas de la simulación.

PROFESOR: DR. JORGE ACUÑA A. 58

CALENTAMIENTO DE LA CALENTAMIENTO DE LA SIMULACIONSIMULACION

Los resultados de una simulación deben ser Los resultados de una simulación deben ser obtenidos en el estado estable de la corrida.obtenidos en el estado estable de la corrida.El momento desde el inicio de la simulación El momento desde el inicio de la simulación hasta que se obtiene el estado estable se hasta que se obtiene el estado estable se llama período de calentamiento.llama período de calentamiento.En el estado transiente el estado las En el estado transiente el estado las entidades residentes inicia en cero lo cual entidades residentes inicia en cero lo cual puede no representar la realidad. Esto hace puede no representar la realidad. Esto hace que el sistema aparezca funcionando mejor que el sistema aparezca funcionando mejor de lo que realmente puede ser. de lo que realmente puede ser.

PROFESOR: DR. JORGE ACUÑA A. 59

CALENTAMIENTO DE LA CALENTAMIENTO DE LA SIMULACIONSIMULACION

Formas de eliminar información obtenida durante el Formas de eliminar información obtenida durante el periodo de calentamiento:periodo de calentamiento:1. Seleccionar las condiciones iniciales del sistema antes 1. Seleccionar las condiciones iniciales del sistema antes

de las corridas. Se debe conocer muy bien el sistema.de las corridas. Se debe conocer muy bien el sistema.2. Descartar los datos obtenidos en la fase transiente, se 2. Descartar los datos obtenidos en la fase transiente, se

utilizan para ello el método de los promedios móviles utilizan para ello el método de los promedios móviles para identificar el inicio del estado estable de la para identificar el inicio del estado estable de la corrida.corrida.

3. Correr el modelo por un periodo lo suficientemente 3. Correr el modelo por un periodo lo suficientemente grande a fin de que los resultados obtenidos durante la grande a fin de que los resultados obtenidos durante la fase transiente sean absorbidos por los datos de la fase fase transiente sean absorbidos por los datos de la fase estable. estable.