20 - Departamento de Matemáticas

TranscripciΓ³n

20 - Departamento de Matemáticas
Estadística I*
Semestre 2016-2
Cálculo de las medidas centrales.
Con los datos siguientes calcula:
i) Media
ii) Mediana
aritmética.
viii) Rango intercuartílico
v) Quintiles vi) Deciles
2y3
2 y 8.
ix) Elabora el diagrama de caja e interprétalo.
iii) Moda.
iv) Cuartiles
vii) Percentiles
43 y 76
a) 22.3 20.4 19.8 19.9 20.1 20.8 21.6 19.8 20.5 23.4 19.6
Ejercicios para practicar.
b) 21.5 18.5 18.7 20.9 21.1 20.1 21.5 22.3 17.9 20.2
c) 47.8 23.1 12.4 35.4 44.0 26.2 18.6 11.0 32.0 12.4 49.4
d) 41.4 18.6 21.0 26.3 11.1 21.4 30.6 12.8 43.1 18.1
e) 38.1 16.8 12.4 33.6 40.9 15.2 33.2 48.2 37.0
Respuestas al inciso a).
i) Para calcular la media aritmética, se suman todos los datos y se dividen entre el número de datos que son.
𝑋̅ =
22.3 + 20.4 + 19.8 + 19.9 + 20.1 + 20.8 + 21.6 + 19.8 + 20.5 + 23.4 + 19.6
228.2
=
= 20.745
11
11
Interpretación. El valor de 20.745 representa el punto de equilibrio de la distribución. Es decir, el 50% del área de la
distribución se encuentra a la izquierda de este número y el otro 50% del área total a la derecha.
ii) Para calcula la mediana, se ordenan los datos de menor a mayor. Si el tamaño de la muestra es impar, se selecciona el
dato intermedio. Si el número de datos es par, se toman los dos datos intermedios, se suman y se dividen entre 2. En este
caso el tamaño de la muestra es impar. Por lo tanto, tomaremos el dato intermedio de los datos ordenados de menor a mayor.
Dato
Número
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
1
2
3
4
5
6
7
8
9
10
11
Así que la mediana es 20.4.
Interpretación. El dato 20.4 es el que divide a la distribución en dos partes iguales. 50% de los datos a la izquierda y 50%
de los datos a la derecha.
iii) Para calcula la moda, se elige de la distribución el número que más se repita. Si no hay número que se repita, la
distribución no tiene moda. Si hay sólo un valor que se repita la distribución es unimodal, si hay dos valores que se repiten
en igual cantidad, la distribución será bimodal, si tiene tres, trimodal, etc.
Dato
Número
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
1
2
3
4
5
6
7
8
9
10
11
Conclusión. La moda es 19.8 ya que es el único dato que se repite dos veces. La distribución es unimodal.
Interpretación. El dato 19.8 es el dato que más se repite en la distribución dada.
Departamento de Matemáticas.
Universidad de Sonora.
Estadística I*
π‘˜βˆ—π‘›
4
iv) Para calcular los cuartiles, se usa la relación Qk =
si el número de datos (n) es par y Qk =
Semestre 2016-2
π‘˜βˆ—(𝑛+1)
si el número
4
de
datos es impar. k es el número de cuartil deseado k = 0, 1, 2, 3, 4.
1βˆ—(11+1)
4
Ubicación del primer cuartil. Como n es impar, Q1 =
= 3. Este número me indica que el cuartil 1 es el tercer dato
de la distribución ordenada de menor a mayor.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
Conclusión, el primer cuartil = 19.8. Esto significa que el 25% de los datos es menor o igual que 19.8.
Ubicación del tercer cuartil. Q3 =
3βˆ—(11+1)
4
= 9. Concluimos que el cuartil 3 está ubicado en el dato 9 de la distribución
ordenada de menor a mayor.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
Conclusión, el tercer cuartil = 21.6. Esto significa que el 75% de los datos es menor o igual que 21.6.
Observación. Q0 = Dato mínimo; Q2 = Mediana; Q4 = Dato máximo. Así que:
0%
25%
15%
75%
100%
Porcentaje ≀
Cuartiles
Q0 = 19.6 Q1 = 19.8 Q2 = 20.4 Q3 = 21.6 Q4 = 23.4
v) Para calcular los quintiles, usamos la relación qk =
π‘˜βˆ—π‘›
5
si el número de datos (n) es par y qk =
π‘˜βˆ—(𝑛+1)
5
si el número de
datos es impar. k es el número de quintil deseado k = 0, 1, 2, 3, 4, 5
Calculamos el quintil 2 de la manera siguiente: y q2 =
2βˆ—(11+1)
5
= 4.8. Esto significa que el quintil 2 está ubicado entre el
dato 4 y el dato 5, justamente a 0.8 unidades a la derecha del dato 5.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
El segundo quintil se encuentra a 0.8 unidades del dato 4. Por lo tanto, realizamos el cálculo siguiente para obtenerlo:
Quintil 2 = 19.9 + 0.8 βˆ— (20.1 βˆ’ 19.9) = 20.06
Este valor significa que el 40% de los datos es menor o igual que 20.06.
Similarmente calculamos el tercer quintil. q3 =
3βˆ—(11+1)
5
= 7.2. Por lo tanto, el tercer quintil se encuentra entre los datos 7
y 8, justamente a 0.2 unidades a la derecha del dato 7.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
Tercer quintil = 20.5 + 0.2 βˆ— (20.8 βˆ’ 20.5) = 20.56.
Interpretación. Esto significa que el 60% de los datos de la distribución o de la muestra de datos es menor o igual a 20.56.
Departamento de Matemáticas.
Universidad de Sonora.
Estadística I*
vi) Para calcular los deciles, usamos la relación Dk =
π‘˜βˆ—π‘›
10
si el número de datos (n) es par y Dk =
Semestre 2016-2
π‘˜βˆ—(𝑛+1)
si el número
10
de
datos es impar. k es el número de decil deseado k = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
Calculamos el decil 2 de la manera siguiente: y D2 =
2βˆ—(11+1)
10
= 2.4. Esto significa que el decil 2 está ubicado entre el dato
2 y el dato 3. Esto es, 19.8 y 19.8.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
El segundo decil se encuentra a 0.4 unidades a la derecha del dato 4. Por lo tanto, realizamos el cálculo siguiente para
obtenerlo:
Decil 2 = 19.8 + 0.4 βˆ— (19.8 βˆ’ 19.8) = 19.8
Interpretación. Este valor significa que el 20% de los datos es menor o igual que 19.8.
Similarmente calculamos el octavo decil. D10 =
8βˆ—(11+1)
10
= 9.6. Por lo tanto, el octavo decil se encuentra entre los datos 9 y
10, justamente a 0.6 unidades a la derecha del dato 9.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
Octavo decil = 21.6 + 0.6 βˆ— (22.3 βˆ’ 21.6) = 22.02.
Esto significa que el 80% de los datos de la distribución es menor o igual a 22.02.
vii) Para calcular los percentiles, usamos la relación Pk =
π‘˜βˆ—π‘›
100
si el número de datos (n) es par y Pk =
π‘˜βˆ—(𝑛+1)
100
si el número de
datos es impar. k es el número de percentil deseado k = 0, 1, 2, 3, 4, . . . , 99, 100.
Calculamos el percentil 43 de la manera siguiente: y P43 =
43βˆ—(11+1)
100
= 5.16. Esto significa que el percentil 43 está ubicado
entre el dato 5 y el dato 6. Esto es, 20.1 y 20.4.
Dato
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
Número
1
2
3
4
5
6
7
8
9
10
11
El percentil 43 se encuentra a 0.16 unidades a la derecha del dato 5. Por lo tanto, realizamos el cálculo siguiente para
obtenerlo:
Percentil 43 = 20.1 + 0.16 βˆ— (20.4 βˆ’ 20.1) = 20.148
Interpretación. Este valor significa que el 43% de los datos es menor o igual que 20.148.
Similarmente calculamos el percentil 78. P78 =
78βˆ—(11+1)
100
= 9.36. Por lo tanto, el percentil 78 se encuentra entre los datos 9
y 10, justamente a 0.36 unidades a la derecha del dato 9.
Dato
Número
19.6 19.8 19.8 19.9 20.1 20.4 20.5 20.8 21.6 22.3 23.4
1
2
3
4
5
6
7
8
9
10
11
Percentil 78 = 21.6 + 0.36 βˆ— (22.3 βˆ’ 21.6) = 21.852.
Esto significa que el 78% de los datos de la distribución es menor o igual a 21.852.
Departamento de Matemáticas.
Universidad de Sonora.
Estadística I*
Semestre 2016-2
viii) El rango intercuartílico se calcula restando el cuartil 3 menos el cuartil 1. Es decir
𝑅𝐼 = 𝑄3 βˆ’ 𝑄1 = 21.6 βˆ’ 19.8 = 1.8.
Esto significa que el rango del 50% de los datos intermedios es 1.8.
ix) Para elaborar el diagrama de caja se usan los cuartiles que fueron calculados en el inciso iv). Los segmentos de Q0 a Q1
y Q3 a Q4 reciben el nombre de bigote inferior y bigote superior del diagrama de caja, respectivamente.
Q0 = 19.6 Q1 = 19.8 Q2 = 20.4 Q3 = 21.6 Q4 = 23.4
Considerando los valores de los bigotes, se elige una escala adecuada para dibujar el diagrama de caja.
19.6 19.8
20.4
21.6
23.4
Fig. 1. Diagrama de caja de la muestra de 11 datos.
19
20
21
22
23
24
Podemos obtener abundante información de una distribución a partir de su diagrama de caja. Veamos algunas usando la
Fig. 1:
ο‚·
ο‚·
ο‚·
La parte derecha de la caja es mayor que la de la izquierda, ello significa que los datos comprendidos entre el 50%
y el 75% de la muestra o población están más dispersos (separados) que entre el 25 y el 50%.
El bigote de la derecha (Q3, Xmáxima,), es más largo que el de la izquierda; por ello el 75% de los datos mayores
están más concentrados que el 25% de los datos menores.
El rango intercuartílico = 𝑄3 βˆ’ 𝑄1 = 1.8. Esto significa que el 50% de los datos de la muestra o población está
comprendido en un segmento de 1.8 unidades.
Con toda seguridad, tú podrás obtener más información que la anterior. Sugerencia: Usa la mediana.
La mayor utilidad de los diagramas de caja-bigotes es para comparar dos o más conjuntos de datos ya sean provenientes
de muestras o de poblaciones.
*Dr. Francisco Javier Tapia Moreno.
Referencia.
Tapia F. J. Mis Notas de Clase. Tomo 2. Universidad de Sonora. 2011.
http://www.mat.uson.mx/~ftapia/Notas%20de%20Clase/Notas%202016-2/Mis%20Notas%20Tema%20II%20%202016-2.pdf
Departamento de Matemáticas.
Universidad de Sonora.

Documentos relacionados