Técnicas de Muestreo I
Transcripción
Técnicas de Muestreo I
Técnicas de Muestreo I Patricia Isabel Romero Mares Departamento de Probabilidad y Estadı́stica IIMAS UNAM noviembre 2016 1 / 17 Ejemplo datos de Oaxaca 2 / 17 Caso de Oaxaca El estado de Oaxaca tiene 8270 localidades agrupadas en 570 municipios, agrupados a su vez en 30 distritos1 . Nos interesa estimar: • Y total de viviendas particulares con TV • R proporción de viviendas con TV R= Y X donde X es el total de viviendas particulares 1 Fuente: XII Censo General de Población y Vivienda, INEGI 3 / 17 Caso de Oaxaca aqui va el mapa de Oaxaca 4 / 17 Valores poblacionales Los parámetros que se van a estimar toman los siguientes valores Parámetro Total de viviendas particulares con TV Total de viviendas particulares Proporción de viviendas con TV Valor 420,217 737,548 0.5698 5 / 17 Datos La base de datos cuenta con la siguiente información a nivel localidad: Distrito, municipio en el distrito (muni), localidad (localida), población total (pobtotal), número de viviendas particulares (vp), número de viviendas particulares con tv (vpcontv ), 6 / 17 Primer diseño de muestra Considerar a los municipios como conglomerados de localidades y seleccionar una muestra aleatoria simple de n = 20 conglomerados, censando todas las localidades de los municipios en muestra. Si no se especifica el factor de corrección por finitud, o el total de conglomerados en la población, R considera que se hizo un muestreo con reemplazo. 7 / 17 Resultados primer diseño muestral m.a.s. de municipios con reemplazo Parámetro Total viv part TV Prop viv TV estimador 650684 0.5500 ee 265711 0.1050 IC 95 % (129890.44,1171477.56) (0.34,0.76) m.a.s. de municipios sin reemplazo Parámetro Total viv part TV Prop viv TV estimador 650684 0.5500 ee 261008 0.1031 IC 95 % (139108.32,1162259.68) (0.35,0.75) 8 / 17 Segundo diseño muestral Considerar a los 30 distritos como estratos, seleccionar en cada distrito una muestra aleatoria simple de localidades, distribuyendo el tamaño de muestra a los estratos en forma proporcional al número de localidades. El tamaño de muestra global de n = 400 se distribuye proporcionalmente a los estratos y se selecciona una m.a.s. sin reemplazo de localidades de cada estrato. Los resultados son: 9 / 17 Resultados segundo diseño muestral m.a.s. estratificada con reemplazo Parámetro Total viv part TV Prop viv TV estimador 244722 0.4632 ee 47709 0.0425 IC 95 % (151212.4,338231.6) (0.3799,0.5466) m.a.s. estratificada sin reemplazo Parámetro Total viv part TV Prop viv TV estimador 244722 0.4632 ee 46493 0.0414 IC 95 % (153595.7,335848.3) (0.3820,0.5444) 10 / 17 Tercer diseño muestral Seleccionar una muestra bietápica, con municipios como UPM y localidades como USM. Los resultados son: muestra bietápica (m.a.s.,m.a.s.) Parámetro Total viv part TV Prop viv TV estimador 252122 0.4383 ee 87628 0.0603 IC 95 % (80371.1,423872.9) (0.3202,0.5564) 11 / 17 Cuarto diseño de muestra Considerar a los 30 distritos como estratos, seleccionar en cada distrito una muestra aleatoria simple de municipios (UPM), y seleccionar una m.a.s. de localidades (USM) en cada municipio en muestra. Se seleccionó la muestra y se estimó con SPSS 12 / 17 Cuarto diseño de muestra Los resultados son: muestra estratificada bietápica (m.a.s.,m.a.s.) Parámetro Total viv part TV Prop viv TV estimador 124617 0.352 ee 35042.97 0.053 IC 95 % (53049,196184) (0.243,0.460) 13 / 17 Quinto diseño de muestra Seleccionar n = 200 localidades con probabilidad proporcional al tamaño, con la medida de tamaño la población total de la localidad. Se encontraron 13 localidades cuyos tamaños son muy grandes, de tal manera que la probabilidad de que cualquiera de estas localidades esté en muestra es mayor que uno. Aún ası́, se seleccionó la muestra y se estimó con la librerı́a survey de R y “a mano”. Los resultados fueron: 14 / 17 Quinto diseño de muestra muestra con probabilidad proporcional al tamaño (ppt) con R Parámetro estimador ee IC 95 % Total viv part TV 420271 18754 (383513.2,457028.8) Prop viv TV 0.5696 0.02195 (0.527,0.613) muestra con probabilidad proporcional al tamaño (ppt) a mano Parámetro estimador ee IC 95 % Total viv part TV 420271.4 18753.6 (383514.4,457028.5) Prop viv TV 0.5696 0.02196 (0.527,0.613) 15 / 17 Estimador de la razón con muestreo ppt Como ya se habı́a visto, el estimador de la razón tiene la forma: R̂ = Ŷ X̂ que podemos expresar como R̂ = donde Zy = Z̄y Z̄x xi yi Zx = pi pi y pi = XXi es la probabilidad de que la unidad i sea seleccionada en una extracción. 16 / 17 Estimador de la razón con muestreo ppt Generando una nueva variable Z = Zy − R̂Zx tenemos que [ R̂ = 1 1 Ŝz2 ECM X̂ 2 n 17 / 17