Técnicas de Muestreo I

Transcripción

Técnicas de Muestreo I
Técnicas de Muestreo I
Patricia Isabel Romero Mares
Departamento de Probabilidad y Estadı́stica
IIMAS UNAM
noviembre 2016
1 / 17
Ejemplo datos de Oaxaca
2 / 17
Caso de Oaxaca
El estado de Oaxaca tiene 8270 localidades agrupadas en 570
municipios, agrupados a su vez en 30 distritos1 .
Nos interesa estimar:
• Y total de viviendas particulares con TV
• R proporción de viviendas con TV
R=
Y
X
donde X es el total de viviendas particulares
1 Fuente:
XII Censo General de Población y Vivienda, INEGI
3 / 17
Caso de Oaxaca
aqui va el mapa de Oaxaca
4 / 17
Valores poblacionales
Los parámetros que se van a estimar toman los siguientes
valores
Parámetro
Total de viviendas
particulares con TV
Total de viviendas
particulares
Proporción de
viviendas con TV
Valor
420,217
737,548
0.5698
5 / 17
Datos
La base de datos cuenta con la siguiente información a nivel
localidad:
Distrito,
municipio en el distrito (muni),
localidad (localida),
población total (pobtotal),
número de viviendas particulares (vp),
número de viviendas particulares con tv (vpcontv ),
6 / 17
Primer diseño de muestra
Considerar a los municipios como conglomerados de
localidades y seleccionar una muestra aleatoria simple de
n = 20 conglomerados, censando todas las localidades de los
municipios en muestra.
Si no se especifica el factor de corrección por finitud, o el total
de conglomerados en la población, R considera que se hizo un
muestreo con reemplazo.
7 / 17
Resultados primer diseño muestral
m.a.s. de municipios con reemplazo
Parámetro
Total viv part TV
Prop viv TV
estimador
650684
0.5500
ee
265711
0.1050
IC 95 %
(129890.44,1171477.56)
(0.34,0.76)
m.a.s. de municipios sin reemplazo
Parámetro
Total viv part TV
Prop viv TV
estimador
650684
0.5500
ee
261008
0.1031
IC 95 %
(139108.32,1162259.68)
(0.35,0.75)
8 / 17
Segundo diseño muestral
Considerar a los 30 distritos como estratos, seleccionar en
cada distrito una muestra aleatoria simple de localidades,
distribuyendo el tamaño de muestra a los estratos en forma
proporcional al número de localidades.
El tamaño de muestra global de n = 400 se distribuye
proporcionalmente a los estratos y se selecciona una m.a.s. sin
reemplazo de localidades de cada estrato.
Los resultados son:
9 / 17
Resultados segundo diseño muestral
m.a.s. estratificada con reemplazo
Parámetro
Total viv part TV
Prop viv TV
estimador
244722
0.4632
ee
47709
0.0425
IC 95 %
(151212.4,338231.6)
(0.3799,0.5466)
m.a.s. estratificada sin reemplazo
Parámetro
Total viv part TV
Prop viv TV
estimador
244722
0.4632
ee
46493
0.0414
IC 95 %
(153595.7,335848.3)
(0.3820,0.5444)
10 / 17
Tercer diseño muestral
Seleccionar una muestra bietápica, con municipios como UPM
y localidades como USM.
Los resultados son:
muestra bietápica (m.a.s.,m.a.s.)
Parámetro
Total viv part TV
Prop viv TV
estimador
252122
0.4383
ee
87628
0.0603
IC 95 %
(80371.1,423872.9)
(0.3202,0.5564)
11 / 17
Cuarto diseño de muestra
Considerar a los 30 distritos como estratos, seleccionar en
cada distrito una muestra aleatoria simple de municipios
(UPM), y seleccionar una m.a.s. de localidades (USM) en cada
municipio en muestra.
Se seleccionó la muestra y se estimó con SPSS
12 / 17
Cuarto diseño de muestra
Los resultados son:
muestra estratificada bietápica (m.a.s.,m.a.s.)
Parámetro
Total viv part TV
Prop viv TV
estimador
124617
0.352
ee
35042.97
0.053
IC 95 %
(53049,196184)
(0.243,0.460)
13 / 17
Quinto diseño de muestra
Seleccionar n = 200 localidades con probabilidad proporcional
al tamaño, con la medida de tamaño la población total de la
localidad.
Se encontraron 13 localidades cuyos tamaños son muy
grandes, de tal manera que la probabilidad de que cualquiera
de estas localidades esté en muestra es mayor que uno.
Aún ası́, se seleccionó la muestra y se estimó con la librerı́a
survey de R y “a mano”.
Los resultados fueron:
14 / 17
Quinto diseño de muestra
muestra con probabilidad proporcional al tamaño (ppt) con
R
Parámetro
estimador
ee
IC 95 %
Total viv part TV
420271
18754
(383513.2,457028.8)
Prop viv TV
0.5696
0.02195
(0.527,0.613)
muestra con probabilidad proporcional al tamaño (ppt) a
mano
Parámetro
estimador
ee
IC 95 %
Total viv part TV 420271.4 18753.6 (383514.4,457028.5)
Prop viv TV
0.5696
0.02196
(0.527,0.613)
15 / 17
Estimador de la razón con muestreo ppt
Como ya se habı́a visto, el estimador de la razón tiene la forma:
R̂ =
Ŷ
X̂
que podemos expresar como
R̂ =
donde
Zy =
Z̄y
Z̄x
xi
yi
Zx =
pi
pi
y pi = XXi es la probabilidad de que la unidad i sea seleccionada
en una extracción.
16 / 17
Estimador de la razón con muestreo ppt
Generando una nueva variable
Z = Zy − R̂Zx
tenemos que
[ R̂ = 1 1 Ŝz2
ECM
X̂ 2 n
17 / 17

Documentos relacionados