ORGANIZACIÓN DE LA INFORMACIÓN Supongamos que para

Transcripción

ORGANIZACIÓN DE LA INFORMACIÓN Supongamos que para
Organización de la Información
ORGANIZACIÓN DE LA INFORMACIÓN
Supongamos que para estudiar una variable se han definido k clases:
C1 ,C 2 ,...,C k .
Frecuencia Absoluta
Se llama frecuencia absoluta de la clase C i al número de individuos que
pertenecen a la clase C i . Se denota por n i . Como las clases C1 ,C 2 ,...,C k
inducen una partición en la muestra, es fácil verificar la relación:
(1)
k
∑n
i =1
i
=n
Frecuencia Relativa
Se llama frecuencia relativa de la clase C i a la proporción de individuos
sobre el total de la muestra que pertenecen a la clase C i . Se denota por f i .
De la definición se puede verificar:
(2) f i =
ni
n
(3)
k
∑f
i =1
i
=1
OBSERVACIÓN: Las dos definiciones dadas tiene sentido cuando se
trabaja en cualquier escala de medida.
Supongamos que estamos trabajando a lo menos en la escala ordinal (es
decir las clases C1 ,C 2 ,...,C k pueden ser ordenadas), entones podemos
definir:
Frecuencia Absoluta Acumulada
Se llama frecuencia absoluta acumulada hasta la clase C j al número de
individuos que pertenecen a la clases C1 , C 2 ,..., C j . Se denota por N j . De la
definición se puede verificar:
j
(4) N j = ∑ n i
i =1
j = 1,2,...,k
(5)
Nk = n
Profesor: Patricio Videla Jiménez.
Organización de la Información
Frecuencia Relativa Acumulada
Se llama frecuencia relativa acumulada hasta la clase C j a la proporción
de individuos sobre el total de la muestra que pertenecen a la clases
C1 , C 2 ,...,C j . Se denota por F j . De la definición se puede verificar:
(6) F j =
j
∑f
i =1
j = 1,2,...,k
i
Fk = 1
(7)
PRESENTACIÓN DE LA INFORMACIÓN: TABLAS Y GRÁFICOS.
a) Escala Nominal
Diagrama en Bloques: Se dibujan rectángulos de igual basa y
áreas proporcionales a las frecuencias observadas.
Ejemplo: Supongamos que se tiene una muestra de 110
fumadores y se examina el carácter marca de cigarrillo,
obteniéndose la siguiente distribución de frecuencias:
ni
22
27
31
30
110
Marca
A
B
C
D
Total
fi
0.200
0.245
0.282
0.273
1.000
35
30
25
Frecuencia
i)
20
15
10
5
0
A
B
C
D
Marca
Profesor: Patricio Videla Jiménez.
Organización de la Información
ii)
Sectores Circulares: Se dibuja un círculo y se divide en sectores
circulares cuyas áreas sean proporcionales a las frecuencias
observadas. En el ejemplo anterior:
A
D
A
B
C
D
B
C
b) Escala Ordinal
Diagrama en Bloques: La misma situación presentada en la escala
ordinal, con la única salvedad que los bloques se presentan con el
mismo orden establecido por la variable estadística.
Ejemplo: En un curso de estudiantes de ingeniería, interesa
analizar su rendimiento académico, con respecto a determina
asignatura:
Rendimiento Académico
Deficiente (E)
Admisible (D)
Satisfactorio (C)
Bueno (B)
Muy Bueno (A)
Total
ni
20
10
18
16
6
70
fi
0.286
0.143
0.257
0.228
0.086
1.000
Ni
20
30
48
64
70
Fi
0.286
0.429
0.686
0.914
1.000
25
20
Frecuencia
i)
15
10
5
0
E
D
C
B
A
Rendimiento
Profesor: Patricio Videla Jiménez.
Organización de la Información
c) Escala intervalar: (Variable de tipo discreta). Supongamos que la
variable puede tomar los valores X 1 , X 2 ,..., X k .
i)
Diagrama diferencial o en barras: En un sistema de coordenadas
se marca sobre la abscisa los valores que tome la variable
manteniendo la orden, y sobre la ordenada la frecuencia absoluta
(relativa) de cada valor. Se dibujan entonces líneas verticales cuya
altura es proporcional a la frecuencia asociada a cada valor de la
variable.
Ejemplo: Los siguientes datos corresponden al resultado de la
consulta al 3º medio D, de un determinado Liceo, presentado el
número de veces que asistió cada alumno a alguna obra de teatro
en el año.
Nº de lista
Nº de
asistencias
Nº de lista
Nº de
asistencias
Nº de lista
Nº de
asistencias
Nº de lista
Nº de
asistencias
1
2
3
4
5
6
7
8
9
0
1
4
3
0
5
1
0
2
10
11
12
13
14
15
16
17
18
4
5
5
0
2
3
3
1
4
19
20
21
22
23
24
25
26
27
3
2
7
7
1
2
3
4
0
28
29
30
31
32
33
34
35
36
7
5
5
1
3
0
3
6
5
ni
6
5
4
7
4
6
1
3
36
Nº de Asistencias
0
1
2
3
4
5
6
7
TOTAL
fi
0.17
0.14
0.11
0.19
0.11
0.17
0.03
0.08
1.00
Ni
6
11
15
22
26
32
33
36
Fi
0.17
0.31
0.42
0.61
0.72
0.89
0.92
1.00
8
7
Frecuencia absoluta
6
5
4
3
2
1
0
-1
0
1
2
3
4
5
6
7
8
Nº de asistencias
Profesor: Patricio Videla Jiménez.
Organización de la Información
c) Escala intervalar: (Variable de tipo continua)
i)
Diagrama diferencial (Histograma): Si la clase i -ésima tiene una
amplitud a i , y tiene frecuencia relativa f i entonces la frecuencia
media por unidad de amplitud es [ f i a i ] .
El histograma es la curva que representa a la frecuencia media por
unidad de amplitud, es decir, se tiene un gráfico con rectángulos
de base a i y de superficie f i .
Obs.:
1.-El área total encerrada bajo la curva es 1.
2.- Se puede construir un gráfico proporcional a éste,
usando la frecuencia absoluta [ n i ], en lugar de f i . En este
caso el área total encerrada bajo la curva es "n " .
Ejemplo: La siguiente información corresponde a los diámetros en
[mm] de los pernos producidos por una máquina en un día.
72
61
76
76
67
67
77
77
72
69
62
71
67
63
71
81
64
72
73
72
78
73
76
65
84
Para construir una tabla de frecuencias, podemos seguir el
siguiente procedimiento:
1. Determinar el número de clases o intervalos k .
Sea k = Nº de intervalos; n = tamaño de la muestra.
Sugerencias:
k ≅ 1 + 3,3 log n [Regla de Sturges]
k ≅ n
Determinar un número k , tal que 2k > n
En nuestro ejemplo utilizaremos k = 25 = 5
2. Determinar el rango R .
R = max{X i }i =1 − min{X i }i =1
n
n
En nuestro ejemplo:
R = 84 − 61 = 23
Profesor: Patricio Videla Jiménez.
Organización de la Información
3. Determinar la amplitud de los intervalos (a i = a ) ∀i = 1,2,...,k .
a≅
R + 1(Unidad )
k
En nuestro ejemplo:
a≅
23 + 1
= 4.8 ≅ 5
5
4. Determinar límites.
L Ij = Límite inferior clase j -ésima.
L Sj = Límite inferior clase j -ésima.
L I 1 = min{X i }i =1 − 1 2 (Unidad )
n
L S1 = L I 1 + a
L I 2 = L S1
LS 2 = L I 2 + a
M
L Sk = L Ik + a
En nuestro ejemplo:
L I 1 = 61 − 1/ 2 = 60.5
LS1 = 60.5 + 5 = 65.5
L I 2 = LS1 = 65.5
LS 2 = 65.5 + 5 = 70.5
M
LS 5 = 80.5 + 5 = 85.5
Finalmente
Diámetro
60.5-65.5
65.5-70.5
70.5-75.5
75.5-80.5
80.5-85.5
TOTAL
Mi
63
68
73
78
83
ni
5
4
8
6
2
25
fi
0.20
0.16
0.32
0.24
0.08
1.00
Ni
5
9
17
23
25
Fi
0.20
0.36
0.68
0.92
1.00
Profesor: Patricio Videla Jiménez.
Organización de la Información
Frecuencia
Histograma
9
8
7
6
5
4
3
2
1
0
65,5
70,5
75,5
80,5
85,5
y mayor...
Diámetro
Frecuencia Absoluta
Polígono de Frecuencias
9
8
7
6
5
4
3
2
1
0
65,5
70,5
75,5
80,5
85,5
Diámetro
Frecuencia Acum ulada
Ojiva
1,2
1
0,8
0,6
0,4
0,2
0
65,5
70,5
75,5
80,5
85,5
y mayor...
Diámetro
Profesor: Patricio Videla Jiménez.

Documentos relacionados