programa oficial de postgrado en estadística e investigación operativa
Transcripción
programa oficial de postgrado en estadística e investigación operativa
PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA DATOS IDENTIFICATIVOS DE LA MATERIA Código de la materia: Nombre de la materia: Número de créditos: Curso académico: Profesorado: V03M017V01102 Análisis Exploratorio de Datos 6 ECTS 2016/2017 Javier Roca Pardiñas (UVigo): 3 ECTS (coordinador de la materia) M. Carmen Iglesias Pérez (UVigo): 3 ECTS OBJETIVOS Y COMPETENCIAS DE LA MATERIA 1. Comprender la finalidad, resultados y beneficios del análisis de un conjunto de datos, así como de sus requerimientos, con el fin de permitir una mejor modelización de problemas y experimentos. 2. Descubrir la problemática del análisis de un conjunto de datos, con el fin de motivar conceptos y técnicas de la teoría de la probabilidad y de la estadística matemática. 3. Conocer los conceptos, y técnicas numéricas y gráficas, esenciales para el descubrimiento y entendimiento de las estructuras y relaciones contenidas en un conjunto de datos. 4. Adquirir una visión general de algunos de los principales problemas estadísticos y de los grupos de técnicas más apropiadas para resolverlos. 5. Adquirir una formación básica en el manejo de herramientas estadísticas a través del programa R (http://www.r-project.org). CONTENIDOS DE LA MATERIA 1. Manejo del software estadístico R: Descarga e instalación. Estructuras de datos. Lectura, importación y exportación de datos. Tratamiento de datos. Procedimientos gráficos. Introducción a la programación. 2. Análisis descriptivo unidimensional: población, muestra, tipos de variables. Medidas descriptivas numéricas, creación de gráficos, detección de datos atípicos, estudio de la normalidad de los datos. 3. Análisis de variables cualitativas: tablas de contingencia y medidas de asociación. Análisis de variables numéricas: gráficos y medidas de correlación. Comparación de distribuciones: gráficos y aplicación de test paramétricos y no paramétricos. 4. Análisis de datos aplicando análisis de la varianza y modelos de regresión paramétricos. Selección de variables. Introducción a la regresión no paramétrica y modelos aditivos generalizados (GAM). 5. Introducción al análisis de datos multivariantes: análisis de componentes principales, análisis discriminante y análisis de conglomerados. 6. Introducción al análisis exploratorio de series temporales. BIBLIOGRAFÍA Abraira Santos, V. y Pérez de Vargas, A. (1996). Métodos Multivariantes en Bioestadística. Centro de Estudios Ramón Areces. Agresti, A. (1996). An Introduction to Categorical Data Analysis, John Wiley, Nueva York. Crawley, M. J. (2005). Statistics: an introduction using R. Ed. John Wiley and Sons. Crawley, M.J. (2013) The R book. Jonhn Wiley & Sons. Segunda edición. Everitt, B. S. (2005). An R and S-PLUS Companion to Multivariate Analysis. Ed. Springer Everitt, B. and Hothorn,T. (2011). An introduction to applied multivariate analysis with R. Springer. Hair J. F., Anderson, Tatham and Black (1996). Análisis multivariante. 5ª Edición. Prentice Hall. Maindonald, J. H. (2007). Data analysis and graphics using R: an example-based approach. Cambridge University Press. Martinez Almécija, Alfredo y otros (1993). Inferencia Estadística. Un enfoque clásico. Pirámide. Peña Sánchez de Rivera, D. (1999). Estadística. Modelos y Métodos. 2. Modelos Lineales y Series Temporales. Alianza Universidad Textos. Peña Sánchez de Rivera, D. (2002). Análisis de datos multivariantes. McGraw Hill, Madrid. Sheather, S. J. (2009). A modern approach to regression with R. New York; London: Springer. Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall. Wood S.N. (2006) Generalized Additive Models: An Introduction with R. Chapman and Hall/CRC Press Tukey, J.W. (1977). Exploratory Data Analysis. Addison-Wesley. Zuur, Alain F.( 2009) A Beginner's guide to R. New York . Springer. COMPETENCIAS Básicas y Generales G6 - Capacidad de identificar y resolver problemas G3 - Capacidad de trabajo en equipo y de forma autónoma Transversales T1 - Ser capaz de identificar un problema de la vida real. T4 - Habilidad para realizar el análisis estadístico con ordenador. T6 - Utilizar las técnicas estadísticas más adecuadas para analizar los datos de una investigación. Específicas E84: Ser capaz de manejar diverso software (en particular R) e interpretar los resultados que proporcionan éstos en los correspondientes estudios prácticos. E4: Conocer las aplicaciones de los modelos de la estadística y la investigación operativa. METODOLOGÍA DOCENTE: ACTIVIDADES DE APRENDIZAJE Y SU VALORACIÓN EN CRÉDITOS ECTS Sesión magistral: La docencia se desarrollará mediante la exposición por parte del profesor de las diferentes técnicas de Análisis Exploratorio de Datos Para ello, los alumnos dispondrán de apuntes elaborados que servirán de material básico para el estudio y en su defecto de material e información sobre bibliografía específica disponible en la biblioteca o en internet. Prácticas de laboratorio: La docencia se desarrollará mediante la resolución de problemas reales o simulados utilizando los modelos tratados en las sesiones magistrales. Se utilizará principalmente el software R. Tutoría en grupo: Se mantendrá un servicio de tutoría en grupo a los alumnos. Los alumnos también podrán consultar sus dudas por correo electrónico. CRITERIOS Y MÉTODOS DE EVALUACIÓN Los criterios de evaluación abarcarán el conocimiento teórico y la competencia práctica sobre los contenidos de la asignatura. Evaluación continua (40%): la evaluación continua se realizará en base a la resolución de problemas y/o ejercicios. En particular, se realizarán cuestionarios y actividades que serán planteadas durante el periodo de docencia da materia. La calificación obtenida se conservará entre las oportunidades (ordinaria y Extraordinaria) dentro de la convocatoria de cada curso. Con las distintas actividades que se propondrán a lo largo del curso, se valorará (junto con el examen final) el nivel de adquisición de las competencias generales G6 y G3, así como de las competencias específicas E84 y E4, y de las transversales, T1, T4, y T6. Examen final (60%): El examen final constará de varias cuestiones teórico-prácticas sobre los contenidos de la materia, y de varias tareas prácticas relacionadas con datos reales y/o simulados. Además de las competencias específicas E84 y E4, que se evalúan parcialmente a través de la evaluación continua, se evaluará la competencia general G6, y las transversales T1, T4 y T6. Para superar la materia será necesario obtener una calificación mínima de 4 puntos (sobre 10) en el examen final. El peso de la evaluación continua en la convocatoria extraordinaria de recuperación (pruebas de julio) será el mismo que en la evaluación ordinaria. En este caso se realizará un nuevo examen y se mantendrán las calificaciones de evaluación continua obtenidas en la convocatoria ordinaria. TIEMPO DE ESTUDIO Y DE TRABAJO PERSONAL QUE DEBE DEDICAR UN ESTUDIANTE PARA SUPERAR LA MATERIA Se estima que el alumnado necesitará 5 horas semanales para un correcto seguimiento de esta materia. RECOMENDACIONES PARA EL ESTUDIO DE LA MATERIA No se necesita haber cursado ninguna otra asignatura del máster. Sin embargo es fundamental la asistencia regular a las clases para la superación de esta materia, ya que es muy importante el seguimiento del trabajo realizado en el aula. Los requisitos básicos de esta materia son un conocimiento básico de la Estadística y conocimientos a nivel usuario de Windows. Como ya se ha comentado se utilizará el software libre R. En algunas sesiones se realizarán cuestionarios y ejercicios sobre temas impartidos para la valoración de la evolución y comprensión de los alumnos sobre la materia.