programa oficial de postgrado en estadística e investigación operativa

Transcripción

programa oficial de postgrado en estadística e investigación operativa
PROGRAMA OFICIAL DE POSTGRADO
EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA
DATOS IDENTIFICATIVOS DE LA MATERIA
Código de la materia:
Nombre de la materia:
Número de créditos:
Curso académico:
Profesorado:
V03M017V01102
Análisis Exploratorio de Datos
6 ECTS
2016/2017
Javier Roca Pardiñas (UVigo): 3 ECTS
(coordinador de la materia)
M. Carmen Iglesias Pérez (UVigo): 3 ECTS
OBJETIVOS Y COMPETENCIAS DE LA MATERIA
1. Comprender la finalidad, resultados y beneficios del análisis de un conjunto de datos, así
como de sus requerimientos, con el fin de permitir una mejor modelización de problemas y
experimentos.
2. Descubrir la problemática del análisis de un conjunto de datos, con el fin de motivar
conceptos y técnicas de la teoría de la probabilidad y de la estadística matemática.
3. Conocer los conceptos, y técnicas numéricas y gráficas, esenciales para el descubrimiento y
entendimiento de las estructuras y relaciones contenidas en un conjunto de datos.
4. Adquirir una visión general de algunos de los principales problemas estadísticos y de los
grupos de técnicas más apropiadas para resolverlos.
5. Adquirir una formación básica en el manejo de herramientas estadísticas a través del
programa R (http://www.r-project.org).
CONTENIDOS DE LA MATERIA
1. Manejo del software estadístico R: Descarga e instalación. Estructuras de datos. Lectura,
importación y exportación de datos. Tratamiento de datos. Procedimientos gráficos.
Introducción a la programación.
2. Análisis descriptivo unidimensional: población, muestra, tipos de variables. Medidas
descriptivas numéricas, creación de gráficos, detección de datos atípicos, estudio de la
normalidad de los datos.
3. Análisis de variables cualitativas: tablas de contingencia y medidas de asociación. Análisis de
variables numéricas: gráficos y medidas de correlación. Comparación de distribuciones:
gráficos y aplicación de test paramétricos y no paramétricos.
4. Análisis de datos aplicando análisis de la varianza y modelos de regresión paramétricos.
Selección de variables. Introducción a la regresión no paramétrica y modelos aditivos
generalizados (GAM).
5. Introducción al análisis de datos multivariantes: análisis de componentes principales,
análisis discriminante y análisis de conglomerados.
6. Introducción al análisis exploratorio de series temporales.
BIBLIOGRAFÍA
















Abraira Santos, V. y Pérez de Vargas, A. (1996). Métodos Multivariantes en Bioestadística.
Centro de Estudios Ramón Areces.
Agresti, A. (1996). An Introduction to Categorical Data Analysis, John Wiley, Nueva York.
Crawley, M. J. (2005). Statistics: an introduction using R. Ed. John Wiley and Sons.
Crawley, M.J. (2013) The R book. Jonhn Wiley & Sons. Segunda edición.
Everitt, B. S. (2005). An R and S-PLUS Companion to Multivariate Analysis. Ed. Springer
Everitt, B. and Hothorn,T. (2011). An introduction to applied multivariate analysis with R.
Springer.
Hair J. F., Anderson, Tatham and Black (1996). Análisis multivariante. 5ª Edición. Prentice
Hall.
Maindonald, J. H. (2007). Data analysis and graphics using R: an example-based approach.
Cambridge University Press.
Martinez Almécija, Alfredo y otros (1993). Inferencia Estadística. Un enfoque clásico.
Pirámide.
Peña Sánchez de Rivera, D. (1999). Estadística. Modelos y Métodos. 2. Modelos Lineales y
Series Temporales. Alianza Universidad Textos.
Peña Sánchez de Rivera, D. (2002). Análisis de datos multivariantes. McGraw Hill, Madrid.
Sheather, S. J. (2009). A modern approach to regression with R. New York; London:
Springer.
Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall.
Wood S.N. (2006) Generalized Additive Models: An Introduction with R. Chapman and
Hall/CRC Press
Tukey, J.W. (1977). Exploratory Data Analysis. Addison-Wesley.
Zuur, Alain F.( 2009) A Beginner's guide to R. New York . Springer.
COMPETENCIAS
Básicas y Generales
G6 - Capacidad de identificar y resolver problemas
G3 - Capacidad de trabajo en equipo y de forma autónoma
Transversales
T1 - Ser capaz de identificar un problema de la vida real.
T4 - Habilidad para realizar el análisis estadístico con ordenador.
T6 - Utilizar las técnicas estadísticas más adecuadas para analizar los datos de una investigación.
Específicas
E84: Ser capaz de manejar diverso software (en particular R) e interpretar los resultados que
proporcionan éstos en los correspondientes estudios prácticos.
E4: Conocer las aplicaciones de los modelos de la estadística y la investigación operativa.
METODOLOGÍA DOCENTE: ACTIVIDADES DE APRENDIZAJE Y SU VALORACIÓN EN CRÉDITOS ECTS
Sesión magistral: La docencia se desarrollará mediante la exposición por parte del profesor de
las diferentes técnicas de Análisis Exploratorio de Datos Para ello, los alumnos dispondrán de
apuntes elaborados que servirán de material básico para el estudio y en su defecto de material
e información sobre bibliografía específica disponible en la biblioteca o en internet.
Prácticas de laboratorio: La docencia se desarrollará mediante la resolución de problemas reales
o simulados utilizando los modelos tratados en las sesiones magistrales. Se utilizará
principalmente el software R.
Tutoría en grupo: Se mantendrá un servicio de tutoría en grupo a los alumnos. Los alumnos
también podrán consultar sus dudas por correo electrónico.
CRITERIOS Y MÉTODOS DE EVALUACIÓN
Los criterios de evaluación abarcarán el conocimiento teórico y la competencia práctica sobre
los contenidos de la asignatura.
Evaluación continua (40%): la evaluación continua se realizará en base a la resolución de
problemas y/o ejercicios. En particular, se realizarán cuestionarios y actividades que serán
planteadas durante el periodo de docencia da materia. La calificación obtenida se conservará
entre las oportunidades (ordinaria y Extraordinaria) dentro de la convocatoria de cada curso.
Con las distintas actividades que se propondrán a lo largo del curso, se valorará (junto con el
examen final) el nivel de adquisición de las competencias generales G6 y G3, así como de las
competencias específicas E84 y E4, y de las transversales, T1, T4, y T6.
Examen final (60%): El examen final constará de varias cuestiones teórico-prácticas sobre los
contenidos de la materia, y de varias tareas prácticas relacionadas con datos reales y/o
simulados. Además de las competencias específicas E84 y E4, que se evalúan parcialmente a
través de la evaluación continua, se evaluará la competencia general G6, y las transversales T1,
T4 y T6.
Para superar la materia será necesario obtener una calificación mínima de 4 puntos (sobre 10)
en el examen final.
El peso de la evaluación continua en la convocatoria extraordinaria de recuperación (pruebas de
julio) será el mismo que en la evaluación ordinaria. En este caso se realizará un nuevo examen y
se mantendrán las calificaciones de evaluación continua obtenidas en la convocatoria ordinaria.
TIEMPO DE ESTUDIO Y DE TRABAJO PERSONAL QUE DEBE DEDICAR UN ESTUDIANTE PARA
SUPERAR LA MATERIA
Se estima que el alumnado necesitará 5 horas semanales para un correcto seguimiento
de esta materia.
RECOMENDACIONES PARA EL ESTUDIO DE LA MATERIA
No se necesita haber cursado ninguna otra asignatura del máster. Sin embargo es fundamental
la asistencia regular a las clases para la superación de esta materia, ya que es muy importante el
seguimiento del trabajo realizado en el aula.
Los requisitos básicos de esta materia son un conocimiento básico de la Estadística y
conocimientos a nivel usuario de Windows. Como ya se ha comentado se utilizará el software
libre R.
En algunas sesiones se realizarán cuestionarios y ejercicios sobre temas impartidos para la
valoración de la evolución y comprensión de los alumnos sobre la materia.

Documentos relacionados