Introduccion a la Estad´ısticaLa estad´ıstica inferencial, apoy´andose en el c´alculo de...
Transcript of Introduccion a la Estad´ısticaLa estad´ıstica inferencial, apoy´andose en el c´alculo de...
Introduccion a la Estadıstica
Profesor: Andres M. Alonso
Despacho: 10.1.32
Telefono: 9591
Email: [email protected]
Pagina web: http://www.est.uc3m.es/amalonso
Pagina web de la asignatura:
http://www.est.uc3m.es/esp/nueva docencia/getafe/economia/intro estadistica/
2
INTRODUCCIÓN A LA ESTADÍSTICA
Titulación 1 Licenciatura en Economía
INFORMACIÓN PARA LOS ALUMNOS MATRICULADOS EN EL CURSO
ACTUAL
ÚLTIMA HORA
INFORMACIÓN
Información general Prácticas y Ejercicios
Horarios y Aulas Exámenes de años anteriores
Profesores y Tutorías Fechas de examen
Documentación y transparencias
Introduccion a la Estadıstica Andres M. Alonso
3
Objetivos basicos de la asignatura
Introduccion a los conceptos y metodos fundamentales del analisis descriptivoy exploratorio de datos:
¿Como (sacar y) resumir una muestra de datos?
Introduccion a los conceptos fundamentales de la probabilidad:
¿Como medir la incertidumbre sobre los posibles resultados de unexperimento?
Metodos de calculo:
Utilizacion de un software estadıstico. Statgraphics
Introduccion a la Estadıstica Andres M. Alonso
4
Bibliografıa
Textos basicos:
Pena, D. y Romo, J. (1997) Introduccion a la Estadıstica para las CienciasSociales, Editorial McGraw–Hill, Madrid.
Newbold, P. (2001) Estadıstica para los Negocios y la Economıa, Editorial
Prentice–Hall, Madrid. Version en ingles
Bibliografıa complementaria:
Moore, D.S. (2004) The Basic Practice of Statistics, Editorial W.H. Free-man and Company, New York.
Pena, D. (2005) Fundamentos de Estadıstica, Alianza Editorial, Madrid.
Introduccion a la Estadıstica Andres M. Alonso
5
Criterios de evaluacion de la asignatura
Entrega de ejercicios resueltos.
Entrega de informes de practicas informaticas.
Analisis de un conjunto de datos reales.
Examen final.
Introduccion a la Estadıstica Andres M. Alonso
6
Temario
Dos unidades tematicas:Analisis descriptivo y exploratorio de datos.Probabilidad
Introducción.Tema 1. Análisis de datos univariantes.Tema 2. Análisis de datos bivariantes.Tema 3. Correlación y regresión.Tema 4. Series temporales y números índice.
Tema 5. Probabilidad.Tema 6. Variables aleatorias unidimensionales.Tema 7. Modelos probabilísticos discretos.Tema 8. Modelos probabilísticos continuos.Tema 9. Variables aleatorias multidimensionales.
Descripción de variables y datos socioeconómicos
Modelización de la incertidumbre en las variables socieconómicas
Introduccion a la Estadıstica Andres M. Alonso
7
Distribucion temporal del temario
Semana 1 4 Febrero 18 al 22 Introduccion / Tema 1
Semana 2 4 Febrero 25 al 29 Tema 1
Semana 3 4 Marzo 3 al 7 Statgraphics
Semana 4 4 Marzo 10 al 14 Tema 2
Semana 5 0 Marzo 17 al 21
Semana 6 2 Marzo 24 al 28 Tema 2
Semana 7 4 Marzo/Abril 31 al 4 Tema 3
Semana 8 4 Abril 7 al 11 Tema 3 / Tema 4
Semana 9 4 Abril 14 al 18 Tema 4
Semana 10 4 Abril 21 al 25 Tema 5
Semana 11 4 Abril/Mayo 28 al 2 Tema 5 / Tema 6
Semana 12 4 Mayo 5 al 9 Tema 6
Semana 13 2 Mayo 12 al 16 Tema 7
Semana 14 4 Mayo 19 al 23 Tema 7 / Tema 8
Semana 15 4 Mayo 26 al 30 Tema 8
Semana 16 4 Junio 2 al 6 Tema 9 / Conclusión
56
Introduccion a la Estadıstica Andres M. Alonso
8
Entrando en materia ...
Introduccion.
Los contenidos a desarrollar en este tema son los siguientes:
Concepto y usos de la estadıstica.
Terminos estadısticos: poblaciones, sub-poblaciones, individuos y muestras.
Variables y atributos.
Tipos de variables: cualitativas (categoricas, ordinales) y cuantitativas(discretas, continuas).
Lecturas recomendadas: Capıtulo 1 y seccion 2.1 del libro de Pena y Romo(1997), y Capıtulo 1 y la seccion 2.1 de Newbold (2001).
Introduccion a la Estadıstica Andres M. Alonso
9
Definicion de estadıstica - RAE
estadística.
(Del al. Statistik).
1. f. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
2. f. Conjunto de estos datos.
3. f. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.
estadístico, ca.
1. adj. Perteneciente o relativo a la estadística.
2. m. y f. Persona que profesa la estadística.
© Real Academia Española
Introduccion a la Estadıstica Andres M. Alonso
10
Definicion 1. La estadıstica se ocupa de los metodos y procedimientospara recoger, clasificar, resumir, hallar regularidades y analizar los datos,siempre y cuando la variabilidad e incertidumbre sea una causa intrınseca delos mismos; ası como de realizar inferencias a partir de ellos, con la finalidadde ayudar a la toma de decisiones y en su caso formular predicciones.
En esta definicion se entreven las etapas de un estudio estadıstico:1. Recogida de la informacion muestral.2. Analisis descriptivo.3. Inferencia estadıstica.
Tambien, muestra los usos de la estadıstica:1. Recogida y resumen de la informacion.2. Estimacion.3. Prediccion.4. Inferencia.5. Toma de decision.
Introduccion a la Estadıstica Andres M. Alonso
11
Estadıstica descriptiva e inferencial
Definicion 2. La estadıstica descriptiva se trata de describir, analizar yrepresentar un grupo de datos utilizando metodos numericos y graficos queresumen y presentan la informacion contenida en ellos.
Definicion 3. La estadıstica inferencial, apoyandose en el calculo deprobabilidades y a partir de datos muestrales, realiza estimaciones, decisiones,predicciones u otras generalizaciones sobre un conjunto mayor de datos.
En esta asignatura estudiaremos la estadıstica descriptiva y introduciremos lasideas basicas de la probabilidad.
Introduccion a la Estadıstica Andres M. Alonso
12
Usos de la estadıstica
Recogida y resumen de informacion.
Para calcular el Indice de Preciosal Consumo (IPC), el InstitutoNacional de Estadıstica hace unaencuesta sobre el consumo deaproximadamente 500 productos.
Ficha técnica
Indice de Precios de Consumo ? Tipo de encuesta: contínua de periodicidad mensual ? Período base: 2001 ? Periodo de referencia de las ponderaciones: desde el 2º trimestre de 1999 hasta el
1º de 2001 ? Muestra de municipios: 141 para alimentación y 97 para el resto ? Número de artículos: 484 ? Número de observaciones: aproximadamente 200.000 precios mensuales ? Clasificación funcional: 12 grupos, 37 subgrupos, 80 clases y 117 subclases; 57
rúbricas y 37 grupos especiales ? Método general de cálculo: Laspeyres encadenado ? Método de recogida: agentes entrevistadores en establecimientos y recogida
centralizada para art ículos especiales
Subir © INE 2005 CerrarVer http://www.ine.es/daco/ipc.htm
Introduccion a la Estadıstica Andres M. Alonso
13
Usos de la estadıstica
Estimacion.
Se usa el IPC para estimar la tasa de inflacion en Espana.
Prediccion.
Observando la serie mensual del IPC, se predice la tasa de inflacion en futurosmeses.
Instituto Nacional de Estadística
IPC – OCTUBRE 2006 (2/12)
Tasas de variación interanuales La tasa interanual del Índice de Precios de Consumo (IPC) general en el mes de octubre es del 2,5%, cuatro décimas por debajo de la registrada el mes de septiembre. Esta tasa es la más baja desde marzo de 2004. Por grupos, los que más destacan por haber experimentado variaciones positivas o negativas durante los últimos doce meses son los siguientes:
Vivienda, cuya variación anual disminuye nueve décimas y se sitúa en el 4,9%, debido principalmente a que en este mes han bajado los precios del gasóleo para calefacción y del gas, frente al aumento que experimentaron en octubre de 2005.
Hoteles, cafés y restaurantes, cuya tasa anual se mantiene estable en el 4,4%, por tercer
mes consecutivo.
Alimentos y bebidas no alcohólicas, con una variación del 4,4%, dos décimas por debajo de la registrada en el mes de septiembre. Cabe destacar la bajada del precio del pescado fresco y congelado y la carne de ovino, que explica gran parte de este comportamiento.
Comunicaciones, cuya tasa se sitúa en el –1,2%, una décima inferior a la de septiembre.
Transporte, con una variación anual del –1,0%, más de un punto por debajo de la del mes
pasado. Esta disminución se debe casi en su totalidad a que la bajada de los precios de los carburantes y lubricantes ha sido mayor que la experimentada en octubre del pasado año. La tasa anual de esta parcela se sitúa en el –7,4%, la más baja desde diciembre de 2001.
Ocio y cultura, que disminuye seis décimas su tasa anual hasta el –0,3%, debido en su
mayoría a la reducción de los precios de los paquetes turísticos, más acentuada este año que en octubre de 2005.
La tasa de variación interanual de la inflación subyacente (índice general sin alimentos no elaborados ni productos energéticos) disminuye una décima hasta el 2,8%, con lo que se sitúa por encima del índice general. Es la primera vez desde marzo de 2004 que la tasa anual del índice general es menor que la inflación subyacente.
Evolución anual del IPC, base 2001General y Subyacente
2,5
2,9
3,74,0
3,94,03,93,94,0
3,73,43,5
3,7
3,33,33,13,1
3,53,4
3,33,1
4,2
2,8
2,93,03,13,0
3,03,12,9
3,12,8 2,8 2,9
2,82,6 2,5 2,5
2,42,5 2,6 2,7
2,9 2,9
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
ene-
05
feb-0
5
mar-0
5
abr-0
5
may-0
5
jun-0
5
jul-0
5
ago-
05
sep-
05
oct-0
5
nov-0
5
dic-0
5
ene-
06
feb-0
6
mar-0
6
abr-0
6
may-0
6
jun-0
6
jul-0
6
ago-
06
sep-
06
oct-0
6
General Subyacente
?
Introduccion a la Estadıstica Andres M. Alonso
14
Usos de la estadıstica
Inferencia.
El gobierno quiere saber (contrastar) si la tasa de inflacion anual es menos deun 3%, para ver si cumplen los requisitos europeos.
Ayuda en la toma de decisiones.
Basado en la inflacion predicha, se debe decidir: cambiar o no las tasas deintereses del Banco Central; medidas para regular el precio de determinadosproductor; compras adelantadas y aumento del stock, etcetera.
Introduccion a la Estadıstica Andres M. Alonso
15
Introduccion.
Concepto y usos de la estadıstica. X
Terminos estadısticos: poblaciones, sub-poblaciones, individuos y muestras .
Variables y atributos.
Tipos de variables: cualitativas (categoricas, ordinales) y cuantitativas(discretas, continuas).
Introduccion a la Estadıstica Andres M. Alonso
16
Terminos estadısticos
Definicion 4. Una poblacion, colectivo o universo es el conjunto de indi-viduos o elementos, que se quiere estudiar y que tienen unas caracterısticascomunes.
Los residentes en una zona geografica (e.g., Espana).
Empresas de produccion y distribucion de electricidad, gas y agua.
Los licenciados en Economıa.
Los lectores de prensa diaria de Madrid.
Una individuo es un integrante de una poblacion.
Una sub-poblacion es una poblacion que es subconjunto de otra poblacion.
Ejemplos
Introduccion a la Estadıstica Andres M. Alonso
17
Terminos estadısticos
Definicion 5. Una muestra es un subconjunto de una poblacion.
100 residentes (elegidos al azar) en una zona geografica (e.g., Espana).
126 Empresas de produccion y distribucion de electricidad, gas y agua .
25 licenciados en Economıa.
Los lectores de prensa diaria de Madrid de 10 estancos (elegidos al azar).
Introduccion a la Estadıstica Andres M. Alonso
18
INNOVACION2000EGA.sf3 Statgraphics
Otra informaci ón en INEbase
Encuesta sobre Innovación Tecnológica en las EmpresasAño 2000 Formato fichero Tamaño ficheroDiseño de registro y valores v álidos de las variables WORD comprimido ZIP 15 Kb Fichero de microdatos ASCII comprimido ZIP 468 Kb Cuestionario PDF 124 Kb
Aviso Legal
Buscar
Productos y servicios Ficheros de microdatos
Introduccion a la Estadıstica Andres M. Alonso
19
Introduccion.
Concepto y usos de la estadıstica. X
Terminos estadısticos. X
Variables y atributos .
Tipos de variables: cualitativas (categoricas, ordinales) y cuantitativas(discretas, continuas).
Introduccion a la Estadıstica Andres M. Alonso
20
Variables y atributos
Definicion 6. Una variable es una caracterıstica de la poblacion que sequiere estudiar.
El ingreso familiar de los residentes en una zona geografica.
El numero de empleados de las empresas de produccion y distribucion deEGA.
La edad de graduacion de los licenciados en Economıa.
Numero de diarios que compran los lectores de prensa diaria de Madrid.
Cuantitativa / Cualitativa
Introduccion a la Estadıstica Andres M. Alonso
21
Variables y atributos
Definicion 7. Un atributo es una caracterıstica o rasgo no cuantitativo dela poblacion que se quiere estudiar.
Tipo de vivienda de los residentes en una zona geografica: Apartamento,Piso, Casa unifamiliar.
Pertenencia a un grupo empresarial de las empresas de produccion y dis-tribucion de EGA:• NO: La empresa no pertenece a un grupo.• GE: La empresa pertenece a un grupo con sede en Espana.• GUE: La empresa pertenece a un grupo con sede en otro paıs de la UE.• GOTROS: La empresa pertenece a un grupo con sede en un paıs no
comunitario.
El sexo de los licenciados en Economıa: Femenino/Masculino.
Diario que mas adquieren los lectores de prensa diaria de Madrid: 20minutos, Metro, El Paıs, El Mundo, ABC, etcetera.
Introduccion a la Estadıstica Andres M. Alonso
22
Introduccion.
Concepto y usos de la estadıstica. X
Terminos estadısticos. X
Variables y atributos. X
Tipos de variables: cualitativas (categoricas, ordinales) y cuantitativas(discretas, continuas).
Introduccion a la Estadıstica Andres M. Alonso
23
Variables cualitativas o Atributos
Definicion 8. Se dice que la informacion sobre una determinada caracterısticaviene dada en escala nominal cuando esta se puede clasificar en categorıasno numericas mutuamente excluyentes entre las cuales no se puede estableceruna relacion de orden.
Profesion de los residentes en una zona geografica.
Pertenencia a un grupo empresarial de las empresas de produccion y dis-tribucion de EGA:• NO: La empresa no pertenece a un grupo.• GE: La empresa pertenece a un grupo con sede en Espana.• GUE: La empresa pertenece a un grupo con sede en otro paıs de la UE.• GOTROS: La empresa pertenece a un grupo con sede en un paıs no
comunitario.
El sexo de los licenciados en Economıa: Femenino/Masculino.
Diario que mas adquieren los lectores de prensa diaria de Madrid: 20minutos, Metro, El Paıs, El Mundo, ABC, etcetera.
Introduccion a la Estadıstica Andres M. Alonso
24
Variables cualitativas o Atributos
Definicion 9. Se dice que la informacion sobre una determinada caracterısticaviene dada en escala ordinal cuando esta se puede clasificar en categorıasno numericas mutuamente excluyentes entre las cuales existe una relacion deorden.
Nivel de estudios de los residentes en una zona geografica: Primarios, Mediosy Superiores.
Importancia que atribuye la empresa a la rigidez de su organizacion comofactor que obstaculiza la actividad innovadora de las empresas de producciony distribucion de EGA: Alta, Media, Baja y No relevante.
Nota media de los licenciados en Economıa: Aprobado, Notable, Sobre-saliente y M.H.
Importancia del uso del color en los diarios: Alta, Media y Baja.
Introduccion a la Estadıstica Andres M. Alonso
25
Variables cuantitativas
Definicion 10. Una variable cuantitativa discreta toma valores en unconjunto finito o numerable de categorıas numericas.
Numero de hijos de los residentes en una zona geografica: 0, 1, 2, . . .
El numero de empleados de las empresas de produccion y distribucion deEGA: 1, 2, . . .
Numero de creditos aprobados por los licenciados en Economıa: 240, 241,242, . . .
Numero de diarios deportivos comprados por los lectores de prensa diaria:0, 1, 2, . . . .
Introduccion a la Estadıstica Andres M. Alonso
26
Variables cuantitativas
Definicion 11. Una variable cuantitativa continua toma valores en un in-tervalo del conjunto de los numeros reales.
Peso y altura de los residentes en una zona geografica.
Ventas de las empresas de produccion y distribucion de EGA.
Edad exacta los licenciados en Economıa.
Distancia recorrida, hasta el estanco mas cercano, por los lectores de prensadiaria.
¿Mediciones continuas?
Introduccion a la Estadıstica Andres M. Alonso
27
Variables cuantitativas
Definicion 12. Se dice que la informacion sobre una determinada variableviene dada en escala de intervalos cuando puede establecerse un tipo deunidad de medida y es posible cuantificar numericamente la distancia entre dosobservaciones cualesquiera.
Saldo en las cuentas de ahorro de los residentes en una zona geografica.
Ingresos de las empresas de produccion y distribucion de EGA.
Definicion 13. Se dice que la informacion sobre una determinada variableviene dada en escala de proporcion cuando cumple las propiedades de laescala de intervalo y ademas se puede fijar un punto de origen para el ceroabsoluto en dicha escala.
Edad exacta los licenciados en Economıa.
Distancia recorrida, hasta el estanco, por los lectores de prensa diaria.
Introduccion a la Estadıstica Andres M. Alonso
28
Construyendo un conjunto de datos reales
Excel
Introduccion a la Estadıstica Andres M. Alonso
29
Construyendo un conjunto de datos reales
C4.69.8337-1 ECONOMETRIA
Materiales de estudio
Actividades
Ejercicios
Prácticas
Autoevaluación
Debates
Tutoria y Comunicación Opciones
Asignaturas
TALLER DEL AULA: ¡un año en marcha! Ayúdenos a evaluar el servicio, rellenando esta breve encuesta.
Solución a los fallos originados por los caracteres acentuados en Internet Explorer
Desde aqu í se pueden ver los recursos docentes que están publicados en las diferentes Aulas en las que cada profesor trabaja. Es el equivalente a la visión del profesor. Desde esta sección también se puede gestionar el material que ya estaba creado en cada Aula. Se trata de una opción muy completa que permite, entre otras cosas, conocer qué recursos docentes de un determinado tipo est án publicados, quién es el proveedor de la información, acceder a información específica de los estudiantes de un grupo, publicar y borrar rápidamente, etc.
Aula Global es una aplicación especialmente diseñada para potenciar la enseñanza presencial y la comunicación profesor -alumno. Esta herramienta ofrece un entorno de trabajo específico para la creación, edición y gesti ón de los recursos docentes.
El acceso a Aula Global es personalizado, es decir, cada alumno accede a la lista de asignaturas a las que está matriculado - siendo cada asignatura un Aula Global en sí misma - y , sin embargo, cada profesor accede a la posibilidad de gestionar los recursos docentes de todas las asignaturas que imparte.
Servicio de apoyo para la elaboración de materiales docentes Selección de trabajos realizados en los Talleres del Aula
Resolución de incidencias en el funcionamiento de Aula Global
Manual de uso de Aula Global
Introduccion a la Estadıstica Andres M. Alonso
30
Construyendo un conjunto de datos reales
Entrega voluntaria del cuestionario por Aula Global Practicas.
Ejercicio para las proximas clases:
• Clasificar las variables del cuestionario.• Si 50 alumnos matriculados entregan el cuestionario cumplimentado,
¿como presentarıas la informacion?
Tema 1. Analisis de datos univariantesRepresentaciones y graficos.Resumen numerico.Transformacion de variables.
Introduccion a la Estadıstica Andres M. Alonso