Nociones de Estadística Descriptiva. Medidas de tendencia central y
Transcripción
Nociones de Estadística Descriptiva. Medidas de tendencia central y
Seminario: Introducción a la metodología de investigación Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad Introducción a la estadística descriptiva La estadística descriptiva ayuda a describir las características de grupos de individuos (personas, objetos, etc.) reduciendo grandes volúmenes de información (datos) a unos pocos índices cuyo valor sea significativo. Si los índices se refieren a: La población, se llaman parámetros. La muestra, se llaman estadísticos o estadígrafos. La Estadística Inferencial trata de la elección adecuada de muestras y estimación del valor de los parámetros una vez conocidos los estadísticos. Los estadísticos más utilizados son los que indican: En torno a qué valores se agrupan los datos; medidas de tendencia central. En qué grado se desvían los datos concretos de esos valores centrales; medidas de variabilidad. Grupos de individuos con datos cuyos valores medios son similares pueden ser muy diferentes debido a la dispersión de los valores. Concepto de medida Para medir se requiere asignar previamente valores numéricos a las propiedades y/o características de los individuos medidos. Es necesario haber concretado previamente en qué consisten dichas propiedades o características. Para comprender que medir no es una operación simple recomendamos tratar de encontrar medios para “medir” “características” tales como la buena conducta, la imaginación, etc. Definición del tipo de investigación Seminario: Introducción a la metodología de investigación Por otro lado, y dado que para medir hay que comparar, hace falta de unos valores aceptados por consenso que sirvan de patrón de medida; esta cuestión está muy directamente afectada por las interrelaciones sociales, políticas, académicas. Por último, hay que disponer de un buen instrumento de medida de cuyos datos nos podamos fiar. Un informe serio de investigación debe mencionar qué cuestionario (en Ciencias Sociales es uno de los principales instrumentos de medida) se ha utilizado y en qué medida cumple los requisitos de calidad que se explicarán en el tema 14. Cada una de las variables (toda magnitud a la que se le pueden asignar diferentes valores numéricos) ha de ser: Definida operativamente indicando qué ha de hacerse para medirla. Expresada en unidades concretas; palabras por minuto, por ejemplo. Categorizada de forma que se agrupan valores comprendidos entre ciertos límites definidos. Hay que tener en cuenta que es necesario ponerse de acuerdo en el grado de exactitud que se “le pide” a una variable dada la imposibilidad de hacer medidas exactas. Se suele tomar como valor verdadero de una medida el valor medio de los valores indicando el margen de error. Tratamiento gráfico de datos Algunas consideraciones sobre los modos gráficos de tratar los datos podrían ser: Una buena forma de presentar una colección de datos es expresándolos visualmente mediante el uso de gráficos. Permite una comprensión global, rápida, directa y sintética, de la información que aparece en cifras. Es muy útil desarrollar la habilidad de interpretar gráficos. Tienen el inconveniente de la dificultad para informar con exactitud y precisión. Las actuales aplicaciones informáticas permiten confeccionar los gráficos muy fácilmente incluso de modo automático. En el aula virtual hay un documento “Asistente para gráficos en Excel.doc” que indica el icono que permite hacer gráficos. Definición del tipo de investigación Seminario: Introducción a la metodología de investigación Medidas de tendencia central Los estadísticos que indican en torno a que valores se agrupan los datos se llaman medidas de tendencia central. Las habituales son: Moda, Mediana y Media. Moda: Es el dato de mayor frecuencia. Ejemplo de modo de calcular en Excel: Si los datos estuvieran escritos en las celdas comprendidas entre A1 y A20 la formula en Excel sería: = MODA(A1:A 20) Mediana: Es aquella puntuación por debajo de la cual se encuentra el 50% de los datos. En Excel: = MEDIANA (A1:A 20) Media (aritmética): Es el cociente de dividir la suma de las puntuaciones entre el número de ellas. En Excel: = PROMEDIO(A1:A 20) Medidas de variabilidad Para valorar las diferencias entre ellos se necesitan, por tanto, indicadores de la heterogeneidad, dispersión y variabilidad de los datos. Son las llamadas medidas de variabilidad o de dispersión. Rango, amplitud, recorrido: Diferencia entre los valores máximo y mínimo. Desviación media: Es la media aritmética de los valores absolutos de las desviaciones de cada dato respecto de la media aritmética. Definición del tipo de investigación Seminario: Introducción a la metodología de investigación La misma idea expresada en lenguaje matemático: Dm = ∑ Xi − X N La fórmula que utiliza Excel es: = DESVPROM (A1:A20) Está en desuso. Varianza ( σ 2 ): Es la media de los cuadrados de las desviaciones. i=N σ 2 = ∑ (X i =1 i − X )2 N En Excel: = VARP(A1:A20) Desviación típica ( σ ): Es la raíz cuadrada de la varianza; es. la medida de dispersión más utilizada. i= N σ= ∑(X i =1 En Excel: i − X )2 N =DESVESTP(A1:A20) Nociones de Estadística Descriptiva. Curva normal. Correlación. Correlación: Para comprobar si cuando el valor de una variable aumenta o disminuye, la otra también varia y si lo hace en el mismo sentido o en el contrario disponemos del concepto: “Correlación”. Con unos ejemplos puede entenderse bien. Definición del tipo de investigación Seminario: Introducción a la metodología de investigación Ejemplo 1: Completa independencia entre ambas variables; los puntos del diagrama aparecen dispersos. Xi Yj 1 86 2 12 3 67 4 111 5 3 6 36 7 58 8 94 9 23 10 87 Coeficiente de correlación = 0,046 Definición del tipo de investigación Ejemplo 1 Seminario: Introducción a la metodología de investigación Ejemplo 2: Una variable crece al tiempo que la otra; Los puntos “sugieren” una recta. Xi Yj 1 2 2 5 3 6 4 7 5 8 6 15 7 12 8 15 9 16 10 21 Ejemplo 2 Coeficiente de correlación = 0,963 Ejemplo 3: Una variable crece al tiempo que la otra; los puntos “FORMAN” una recta. Xi Yj 1 2 2 4 3 6 4 8 5 10 6 12 7 14 8 16 9 18 10 20 Coeficiente de correlación =1 Definición del tipo de investigación Ejemplo 3 Seminario: Introducción a la metodología de investigación Ejemplo 4: Una variable disminuye a medida que la otra aumenta. Xi Yj 1 19 2 16 3 17 4 15 5 15 6 14 7 13 8 14 9 11 10 10 Ejemplo 4 Coeficiente de correlación= - 0,947 Un coeficiente igual o superior a 0,80 se considera grande; un coeficiente de 0,50 es moderado y un coeficiente igual o menor que 0,30 pequeño. El coeficiente de correlación no es una medida de causalidad. Puede existir relación causal entre las dos variables pero también puede ser casual. Cálculo de coeficientes A efectos prácticos, con las actuales herramientas informáticas no es necesario efectuar cálculo alguno, lo cual permite emplear el tiempo y el esfuerzo en la comprensión e interpretación de los fenómenos y los resultados. Definición del tipo de investigación Seminario: Introducción a la metodología de investigación A B 1 Xi Yj 2 1 2 3 2 5 4 3 6 5 4 7 6 5 8 7 6 15 8 7 12 9 8 15 10 9 16 11 10 21 C D E F G Ejemplo 1 Coeficiente de correlación = 12 0,963 = COEF.DE.CORREL(A2:A11;B2:B11) Bibliografía R. Hernández Sampieri, R., Fernández Collado, C. y Baptista Lucio, P. (1991): Metodología de la investigación. McGraw-Hill. Bernardo Carrasco, J. y Calderero, J. F. (2000): Aprendo a investigar en educación. Rialp. 2000. Definición del tipo de investigación