ORGANIZACIÓN DE LA INFORMACIÓN Supongamos que para
Transcripción
ORGANIZACIÓN DE LA INFORMACIÓN Supongamos que para
Organización de la Información ORGANIZACIÓN DE LA INFORMACIÓN Supongamos que para estudiar una variable se han definido k clases: C1 ,C 2 ,...,C k . Frecuencia Absoluta Se llama frecuencia absoluta de la clase C i al número de individuos que pertenecen a la clase C i . Se denota por n i . Como las clases C1 ,C 2 ,...,C k inducen una partición en la muestra, es fácil verificar la relación: (1) k ∑n i =1 i =n Frecuencia Relativa Se llama frecuencia relativa de la clase C i a la proporción de individuos sobre el total de la muestra que pertenecen a la clase C i . Se denota por f i . De la definición se puede verificar: (2) f i = ni n (3) k ∑f i =1 i =1 OBSERVACIÓN: Las dos definiciones dadas tiene sentido cuando se trabaja en cualquier escala de medida. Supongamos que estamos trabajando a lo menos en la escala ordinal (es decir las clases C1 ,C 2 ,...,C k pueden ser ordenadas), entones podemos definir: Frecuencia Absoluta Acumulada Se llama frecuencia absoluta acumulada hasta la clase C j al número de individuos que pertenecen a la clases C1 , C 2 ,..., C j . Se denota por N j . De la definición se puede verificar: j (4) N j = ∑ n i i =1 j = 1,2,...,k (5) Nk = n Profesor: Patricio Videla Jiménez. Organización de la Información Frecuencia Relativa Acumulada Se llama frecuencia relativa acumulada hasta la clase C j a la proporción de individuos sobre el total de la muestra que pertenecen a la clases C1 , C 2 ,...,C j . Se denota por F j . De la definición se puede verificar: (6) F j = j ∑f i =1 j = 1,2,...,k i Fk = 1 (7) PRESENTACIÓN DE LA INFORMACIÓN: TABLAS Y GRÁFICOS. a) Escala Nominal Diagrama en Bloques: Se dibujan rectángulos de igual basa y áreas proporcionales a las frecuencias observadas. Ejemplo: Supongamos que se tiene una muestra de 110 fumadores y se examina el carácter marca de cigarrillo, obteniéndose la siguiente distribución de frecuencias: ni 22 27 31 30 110 Marca A B C D Total fi 0.200 0.245 0.282 0.273 1.000 35 30 25 Frecuencia i) 20 15 10 5 0 A B C D Marca Profesor: Patricio Videla Jiménez. Organización de la Información ii) Sectores Circulares: Se dibuja un círculo y se divide en sectores circulares cuyas áreas sean proporcionales a las frecuencias observadas. En el ejemplo anterior: A D A B C D B C b) Escala Ordinal Diagrama en Bloques: La misma situación presentada en la escala ordinal, con la única salvedad que los bloques se presentan con el mismo orden establecido por la variable estadística. Ejemplo: En un curso de estudiantes de ingeniería, interesa analizar su rendimiento académico, con respecto a determina asignatura: Rendimiento Académico Deficiente (E) Admisible (D) Satisfactorio (C) Bueno (B) Muy Bueno (A) Total ni 20 10 18 16 6 70 fi 0.286 0.143 0.257 0.228 0.086 1.000 Ni 20 30 48 64 70 Fi 0.286 0.429 0.686 0.914 1.000 25 20 Frecuencia i) 15 10 5 0 E D C B A Rendimiento Profesor: Patricio Videla Jiménez. Organización de la Información c) Escala intervalar: (Variable de tipo discreta). Supongamos que la variable puede tomar los valores X 1 , X 2 ,..., X k . i) Diagrama diferencial o en barras: En un sistema de coordenadas se marca sobre la abscisa los valores que tome la variable manteniendo la orden, y sobre la ordenada la frecuencia absoluta (relativa) de cada valor. Se dibujan entonces líneas verticales cuya altura es proporcional a la frecuencia asociada a cada valor de la variable. Ejemplo: Los siguientes datos corresponden al resultado de la consulta al 3º medio D, de un determinado Liceo, presentado el número de veces que asistió cada alumno a alguna obra de teatro en el año. Nº de lista Nº de asistencias Nº de lista Nº de asistencias Nº de lista Nº de asistencias Nº de lista Nº de asistencias 1 2 3 4 5 6 7 8 9 0 1 4 3 0 5 1 0 2 10 11 12 13 14 15 16 17 18 4 5 5 0 2 3 3 1 4 19 20 21 22 23 24 25 26 27 3 2 7 7 1 2 3 4 0 28 29 30 31 32 33 34 35 36 7 5 5 1 3 0 3 6 5 ni 6 5 4 7 4 6 1 3 36 Nº de Asistencias 0 1 2 3 4 5 6 7 TOTAL fi 0.17 0.14 0.11 0.19 0.11 0.17 0.03 0.08 1.00 Ni 6 11 15 22 26 32 33 36 Fi 0.17 0.31 0.42 0.61 0.72 0.89 0.92 1.00 8 7 Frecuencia absoluta 6 5 4 3 2 1 0 -1 0 1 2 3 4 5 6 7 8 Nº de asistencias Profesor: Patricio Videla Jiménez. Organización de la Información c) Escala intervalar: (Variable de tipo continua) i) Diagrama diferencial (Histograma): Si la clase i -ésima tiene una amplitud a i , y tiene frecuencia relativa f i entonces la frecuencia media por unidad de amplitud es [ f i a i ] . El histograma es la curva que representa a la frecuencia media por unidad de amplitud, es decir, se tiene un gráfico con rectángulos de base a i y de superficie f i . Obs.: 1.-El área total encerrada bajo la curva es 1. 2.- Se puede construir un gráfico proporcional a éste, usando la frecuencia absoluta [ n i ], en lugar de f i . En este caso el área total encerrada bajo la curva es "n " . Ejemplo: La siguiente información corresponde a los diámetros en [mm] de los pernos producidos por una máquina en un día. 72 61 76 76 67 67 77 77 72 69 62 71 67 63 71 81 64 72 73 72 78 73 76 65 84 Para construir una tabla de frecuencias, podemos seguir el siguiente procedimiento: 1. Determinar el número de clases o intervalos k . Sea k = Nº de intervalos; n = tamaño de la muestra. Sugerencias: k ≅ 1 + 3,3 log n [Regla de Sturges] k ≅ n Determinar un número k , tal que 2k > n En nuestro ejemplo utilizaremos k = 25 = 5 2. Determinar el rango R . R = max{X i }i =1 − min{X i }i =1 n n En nuestro ejemplo: R = 84 − 61 = 23 Profesor: Patricio Videla Jiménez. Organización de la Información 3. Determinar la amplitud de los intervalos (a i = a ) ∀i = 1,2,...,k . a≅ R + 1(Unidad ) k En nuestro ejemplo: a≅ 23 + 1 = 4.8 ≅ 5 5 4. Determinar límites. L Ij = Límite inferior clase j -ésima. L Sj = Límite inferior clase j -ésima. L I 1 = min{X i }i =1 − 1 2 (Unidad ) n L S1 = L I 1 + a L I 2 = L S1 LS 2 = L I 2 + a M L Sk = L Ik + a En nuestro ejemplo: L I 1 = 61 − 1/ 2 = 60.5 LS1 = 60.5 + 5 = 65.5 L I 2 = LS1 = 65.5 LS 2 = 65.5 + 5 = 70.5 M LS 5 = 80.5 + 5 = 85.5 Finalmente Diámetro 60.5-65.5 65.5-70.5 70.5-75.5 75.5-80.5 80.5-85.5 TOTAL Mi 63 68 73 78 83 ni 5 4 8 6 2 25 fi 0.20 0.16 0.32 0.24 0.08 1.00 Ni 5 9 17 23 25 Fi 0.20 0.36 0.68 0.92 1.00 Profesor: Patricio Videla Jiménez. Organización de la Información Frecuencia Histograma 9 8 7 6 5 4 3 2 1 0 65,5 70,5 75,5 80,5 85,5 y mayor... Diámetro Frecuencia Absoluta Polígono de Frecuencias 9 8 7 6 5 4 3 2 1 0 65,5 70,5 75,5 80,5 85,5 Diámetro Frecuencia Acum ulada Ojiva 1,2 1 0,8 0,6 0,4 0,2 0 65,5 70,5 75,5 80,5 85,5 y mayor... Diámetro Profesor: Patricio Videla Jiménez.