Práctica 1_PyE_FM
Transcripción
Práctica 1_PyE_FM
Probabilidade y Estadística - Práctica 1 1. Se dan a continuación los niveles de colesterol de una muestra de 30 pacientes. 231 190 209 159 192 169 203 209 159 304 161 225 248 206 217 238 219 220 209 185 219 193 239 217 225 239 226 244 152 228 (a) Construir una tabla de frecuenciasy dibujar un histograma. ¿La distribución es simétrica o sesgada? (b) Calcular la media y la mediana. (c) Calcular el rango intercuartílico y la desviación estándar. 2. A continuación se listan las edades (en años) de una muestra de 20 motociclistas muertos en accidentes de tránsito. 18 41 24 28 71 52 15 20 21 31 16 24 33 44 20 24 16 64 24 32 (a) Construir una tabla de frecuencias y dibujar un histograma. ¿La distribución es simétrica o sesgada? (b) Calcular la media y la mediana. (c) Calcular el rango intercuartílico y la desviación estándar. ¿Cuál es mejor para describir la variabilidad de estos datos? 3. A continuación se presenta una lista de cantidades de plomo (medidas en g=m3 ) en el aire. Calcule la media y la mediana de esta muestra.y compare los valores 5,40 1,10 0,42 0,73 0,48 1,10 0,66 4. Fumadores activos y pasivos Todos los valores son mediciones de niveles de cotinina en suero (en ng/ml), un metabolito de la nicotina. (Cuando el cuerpo absorbe la nicotina, se produce la cotinina). Los datos son del Departamento de Salud y Servicios Humanos de Estados Unidos (National Center for Health Statistics, Third National Health and Nutrition Examination Survey). Fumadores (sujetos que reportan 1 0 131 173 265 210 35 112 477 289 227 103 130 234 164 198 17 253 123 167 250 245 48 86 384 4 0 0 No fumadores expuestos al 0 69 19 1 0 0 543 17 1 0 3 1 45 13 3 551 2 1 1 1 0 0 1 0 No fumadores sin 0 0 0 0 9 0 0 0 0 0 0 90 0 0 0 0 consumo de 44 277 222 149 87 121 284 1 tabaco) 32 3 313 491 266 290 208 173 humo de tabaco 178 2 13 1 51 0 197 3 1 1 1 0 0 74 1 241 exposición al humo 0 0 0 0 0 0 0 0 244 0 1 0 309 0 0 0 0 0 0 0 Construya el diagrama de caja para cada grupo, compare, ¿hay observaciones atípicas? 5. La siguiente tabla muestra datos correspondientes a 52 pacientes con artritis reumatoidea tratados con SA En la tabla se muestra la dosis de SA junto con valores del “sulphoxidation index”(SI) y las edades de los pacientes, cuando un valor de SI es superior a 80 el método de medición no puede evaluarlo, por ese motivo hay pacientes para los cuales el valor de SI registrado es “>80”. Los pacientes han sido separados en dos grupos según hayan sufrido o no, reacciones adversas a la droga. 1 (a) ¿Cuál es la di…cultad para gra…car los histogramas de SI para cada grupo?¿Qué forma tienen las distribuciones? (b) Dar dos razones por las cuales es preferible la mediana en lugar de la media como medida de tendencia central para los valores de SI. (c) Obtener la mediana de los valores de SI para cada grupo de pacientes. (d) Obtener la mediana de la dosis de SA para cada grupo de pacientes. (e) Calcular la edad media de cada grupo de pacientes. Sin reacciones adversas Edad Dosis SI 44 1560 1.0 58 850 1.2 57 1250 1.7 51 950 1.8 64 850 1.8 33 1200 1.9 61 1390 2.0 67 3300 2.8 39 2760 2.8 42 860 3.4 35 1810 3.4 31 1310 3.8 37 1250 3.8 39 1460 4.9 53 2310 5.4 44 1360 5.9 41 1910 6.2 72 910 12.0 61 1410 18.8 59 1350 70.0 72 810 >80.0 59 1460 >80.0 71 760 >80.0 53 910 >80.0 Con reacciones Edad Dosis 53 360 29 1390 53 660 67 1135 54 410 51 910 57 360 51 560 68 1135 50 1410 61 960 59 1310 68 910 57 2950 49 360 49 1935 29 435 53 310 53 310 42 690 44 910 59 1260 46 1310 46 1350 41 1410 62 1535 49 1560 53 2050 adversas SI 2.0 2.0 3.0 3.5 5.7 6.5 13.0 13.9 14.7 15.4 16.6 16.6 16.6 22.3 33.2 47.0 65.0 65.0 >80.0 >80.0 >80.0 >80.0 >80.0 >80.0 >80.0 >80.0 >80.0 >80.0 6. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en la vulnerabilidad a enfermedades alérgicas. El artículo (“Dust Sampling Methods for Endotoxin-An Essential, But Underestimated Issue”, Indoor Air, 2006: 20-27) consideró temas asociados con la determinación de concentración de endotoxina. Los siguientes datos sobre concentración (EU/mg) en polvo asentado de una muestra de hogares urbanos y otra de casas rurales fueron amablemente suministrados por los autores del artículo citado. U R 6,0 4,0 5,0 14,0 11,0 11,0 33,0 9,0 4,0 9,0 5,0 8,0 80,0 4,0 18,0 20, 35,0 5,0 17,0 8,9 23,0 21,0 9,2 3,0 2,0 0,3 (a) Determine la media muestral y la desviación estandar de concentración de endotoxina en polvo asentado de casas urbanas y rurales. ¿Cómo se comparan? (b) Determine la mediana muestral de cada muestra. ¿Cómo se comparan? ¿Por qué es la mediana de la muestra urbana es tan diferente de la media de dicha muestra? (c) Calcule la media recortada de cada muestra eliminando la observación más pequeña y más grande. ¿Cuáles son los porcentajes de recorte correspondientes? ¿Cómo se comparan los valores de estas medias recortadas a las medias y medianas correspondientes 2 7. Conjunto de datos 1: Resultados de examen de salud La EDAD está dada en años, EST es estatura (pulgadas), PE es peso (libras), CINT es circunferencia de la cintura (cm), PULSO es frecuencia del pulso (en latidos por minuto), SIST es presión sanguínea sistólica (mmHg), DIAST es presión sanguínea diastólica (mmHg), COL es colesterol (mg), IMC es índice de masa corporal, MUS es longitud del muslo (cm), CODO es anchura del codo (cm), MUÑ es anchura de la muñeca (cm) y BRA es circunferencia del brazo (cm). Los datos son del Departamento de Salud y Servicios Humanos de Estados Unidos (a) Utilice los valores del índice de masa corporal (IMC) de las 40 mujeres. Construya una distribución de frecuencias iniciando con un límite de clase inferior de 15.0 y utilice una anchura de clase de 6.0. El IMC se calcula dividiendo el peso en kilogramos entre el cuadrado de la estatura en metros. Describa la naturaleza de la distribución. (b) Construya diagramas de caja para IMC de varones y mujeres, ¿se observan diferencias?, ¿hay valores atípicos? (c) Construya diagramas de caja para valores de colesterol para varones y mujeres, ¿se observan diferencias?, ¿hay valores atípicos? 3