Tareas precensales - Asociación Latinoamericana de Población

Transcripción

Tareas precensales - Asociación Latinoamericana de Población
TAREAS PRECENSALES 2010 EN LA PROVINCIA DE BUENOS
AIRES DE LA REPÚBLICA ARGENTINA1
Autores: Angeletti Karina L.2, Serrano Sebastián3, Sotelo Rodrigo4
RESUMEN
La Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE) tiene entre sus
tareas principales la de coordinar las actividades relativas a los operativos censales que se
desarrollen en el territorio de la provincia de Buenos Aires.
Se trata de la provincia más grande y poblada de la República Argentina: con 304.907 km 2 de
superficie, está dividida administrativamente en 135 partidos 5.383.536 de viviendas y
15.625.084 habitantes, lo que representa el 39 % del total nacional.
Las características del diseño elegido para el Censo Nacional de Población, Hogares y
Viviendas 2010 (CNPHV 2010) unido a las de la Provincia y al plazo de 8 meses para la
realización de todas las tareas necesarias para llegar en condiciones al 27 de octubre, llevaron
a la decisión de establecer metodologías particulares de acuerdo con la realidad provincial.
En este trabajo se describen dos actividades: el listado de viviendas de todas las áreas urbanas
y las tareas cartográficas.
Todo lo realizado fue dirigido por la DPE, y constituye una innovación haber actuado
coordinadamente en tres puntos: la vinculación 1) con los municipios para la actualización
cartográfica y listado de viviendas, 2) con la industria informática respecto al soporte y
desarrollo de la actualización de la plataforma GIS y 3) con la universidad en cuanto al
desarrollo e implementación de un algoritmo de segmentación automática de viviendas.
1
Trabajo presentado en el V Congreso de la Asociación Latinoamericana de Población, Montevideo, Uruguay, del 23 al 26
de octubre de 2012.
2
Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE). Ministerio de Economía de la provincia de
Buenos Aires. E-mail: [email protected]
3
DPE. Ministerio de Economía de la provincia de Buenos Aires. E-mail: [email protected]
4
DPE. Ministerio de Economía de la provincia de Buenos Aires. E-mail: [email protected]
1
Además de haber llevado adelante el operativo censal de manera eficaz, el esfuerzo realizado
permitió otros logros: dio como resultado que la Provincia cuente con toda la cartografía
actualizada en un sistema que permite administrarla con mayor eficiencia y, por primera vez,
con un listado de viviendas urbanas completo y vinculado cartográficamente. A partir del
mismo, será posible realizar encuestas a hogares en el territorio provincial así como en cada
una de las localidades urbanas.
Palabras clave: actualización cartográfica, listado de viviendas, segmentación automática
2
1
INTRODUCCIÓN
La Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE) tiene sus
orígenes en el Registro Estadístico de la Provincia de Buenos Aires, creado el 13 de diciembre
de 1821. Entre sus tareas principales se encuentra la de coordinar las tareas relativas a los
operativos censales que se desarrollen en el territorio de la provincia de Buenos Aires.
Este trabajo describe dos actividades realizadas en la provincia de Buenos Aires (PBA) en
ocasión de las tareas precensales para el Censo Nacional de Población, Hogares y Viviendas
2010 (CNPHV 2010): el listado de viviendas de todas las áreas urbanas y las tareas
cartográficas.
Las características del diseño elegido para el CNPHV 2010 unido a las de la Provincia y al
plazo de 8 meses para realizar todas las tareas necesarias para llegar en condiciones al 27 de
octubre, llevaron a la decisión de establecer metodologías particulares de acuerdo a la realidad
provincial.
Primero se describe el diseño del CNPHV 2010, las características de la provincia de Buenos
Aires y del problema a resolver. Luego, se explica como se resolvió el problema detallando lo
realizado en relación con el listado de viviendas y las tareas cartográficas. Finalmente, se
cuantifican los resultados alcanzados y se presentan las consideraciones finales.
2
DISEÑO DEL CNPHV 2010
Para el CNPHV 2010 el Instituto Nacional de Estadística y Censos (INDEC) determinó que la
modalidad a aplicar sería la de censo de hecho con el método de cuestionario ampliado y
reducido. El día fijado fue el 27 de octubre de 2010, se aplicaría (en principio) el cuestionario
ampliado en todas las localidades de menos de 50.000 habitantes y a una muestra de 10% en
las localidades de más de 50.000 habitantes, mientras que el cuestionario reducido se aplicaría
al 90% restante.
La existencia de dos tipos de cuestionarios determinó que los tamaños de los segmentos
(carga de trabajo del censista) variaran según el tipo de localidad de la que se tratara.
3
3
CARACTERÍSTICAS DE LA PBA Y PROBLEMA A RESOLVER
La provincia de Buenos Aires es la provincia más grande y poblada de la República
Argentina: con 304.907 km2 de superficie, está dividida administrativamente en 134 partidos
con 5.581.761 de viviendas y 15.594.428 habitantes (INDEC 2010). Sobre un total de
40.091.359 de habitantes para todo el país, representa un 39 % del total nacional.
Dadas estas características, la planificación e implementación de operativos estadísticos en el
territorio provincial se tornan complejos para cumplir con el objetivo primordial de un censo:
el recuento de toda la población en el lugar en que haya pasado la noche anterior al día del
operativo (censo de hecho).
Como fuente estadística oficial, los censos de población presentan estrictos requerimientos de
universalidad, simultaneidad e identificación del territorio definido. En el caso argentino y en
particular en la provincia de Buenos Aires, sobre la base de los resultados censales se define:
 La representación política
 Los recursos a distribuir por sistemas de coparticipación
 La focalización de las políticas públicas
 La toma de decisiones del sector privado
Por ello es importante recalcar que una deficiente medición no sólo implicará asignaciones no
equitativas en el presente inmediato, sino por todo el período durante el cual se utilicen sus
resultados. Por lo tanto, es fundamental el desarrollo de tareas precensales vinculadas con las
siguientes temáticas:

Legislación

Institucionales

Administrativas

Logística

Tareas Cartográficas

Capacitación

Tecnología e Informática

Comunicaciones
4

Planificación, coordinación y seguimiento

Sensibilización

Prueba de campo
Por lo tanto, el problema a resolver era complejo tanto por la cantidad de personas
involucradas en este tipo de relevamiento, como el volumen de la tarea a realizar y lo acotado
de los plazos. El Decreto Nacional que fijó oficialmente la fecha del Censo se promulgó en
enero de 2010. Es sabido que muchas acciones recién pueden destrabarse a partir de él (como
por ejemplo el decreto provincial de adhesión, la conformación del Comité Censal Provincial
y la puesta en marcha de los Convenios específicos al interior de la Provincia).
El anterior censo de población llevado a cabo en 2001 en la provincia de Buenos Aires
contabilizó cerca de 14.000.000 de habitantes, y 4.800.000 viviendas, debiendo reclutar una
estructura de personal de más de 178.000 agentes entre tareas pre-censales, censales y postcensales. Y dado que en 2010 se había determinado un censo de hecho con muestra, que se
realizaría en un solo día, los cálculos preliminares de la estructura se elevaban a 185.000
censistas, 25.000 jefes de radio, 2.500 jefes de fracción y 134 jefes de partido, un número
cercano a las 220.000 personas, sólo para el relevamiento del día del censo. A toda esta
estructura no solo había que capacitarla sino que también dotarla de los materiales necesarios
en un plazo de 8 meses.
Al mismo tiempo, era necesario actualizar toda la cartografía estadística, redimensionar las
fracciones y los radios, determinar la cantidad de viviendas de manera que pudieran asignarse
exhaustivamente a los censistas, e imprimir y distribuir todos los materiales a ser utilizados el
día del operativo censal.
Respecto al tamaño de los segmentos, la utilización de dos tipos de cuestionarios según el tipo
de localidad agregó complejidad al problema a resolver. Por la diversidad provincial en los
134 Municipios existieron distintas situaciones: todo el Municipio con muestra, todo el
Municipio sin muestra, Municipios con localidades con muestra y resto de localidades sin
muestra.
En un segundo nivel, el INDEC estableció tamaños de segmentos diferenciales en los casos
de alta densidad de viviendas con familias numerosas, viviendas en asentamientos y villas de
emergencia, en áreas de country, barrios cerrados y demás urbanizaciones. Cabe señalar que
la Provincia tiene más de 500 urbanizaciones del tipo barrio cerrado o country.
5
Adicionalmente, hubo otras restricciones que enfrentar al inicio de la planificación:
 8 meses de plazo total para diseñar, implementar y terminar el trabajo.
 Software cartográfico anticuado.
 Falta de especificaciones detalladas.
 No existía formalización escrita de los procesos, ni tradición en intentarlo.
 Muchas decisiones iban a tener que tomarse sobre la marcha.
 El “ambiente estadístico” consideraba imposible realizar una segmentación
automática.
 27 de octubre como fecha inamovible.
4
CÓMO SE RESOLVIÓ
La manera de resolver el problema planteado fue planificar de manera integral todas las tareas
precisas para cumplir con el objetivo de generar las condiciones necesarias para la realización
exitosa del Censo el día 27 de octubre de 2010.
Los requisitos censales de universalidad, simultaneidad e identificación del territorio definido
llevó a la Provincia a tomar la decisión de realizar de un listado exhaustivo de viviendas en
las áreas urbanas en lugar del método de conteo/ listado definido por el INDEC5.
4.1 LISTADO DE VIVIENDAS
Para la implementación del listado de viviendas se trabajó coordinadamente con los
municipios. Primero solicitándoles que informen sobre cambios producidos en la cartografía
con la que contaba la DPE a inicios del 2010, segundo descentralizando en ellos el operativo
de listado, bajo las definiciones metodológicas de la DPE, y tercero la carga de los datos
resultantes del listado vía web en un sistema diseñado de manera tal de optimizar la
vinculación de las viviendas listadas y cargadas con la cartografía.
La decisión de realizar un listado exhaustivo de viviendas particulares y demás unidades de
listado6 en las zonas urbanas de todos los partidos de la provincia buscó, como principal, pero
no único objetivo, asegurar una eficiente asignación de la carga de trabajo de los censistas.
5
Este método establece que debe registrarse la sumatoria de las viviendas por lado de manzana cuando el total
de viviendas de una manzana no supera 39. En aquellas manzanas que cuenten con 40 viviendas y más se realiza
una listado mediante la registración de cada unidad.
6
Además de las viviendas particulares, se listaron unidades como viviendas colectivas, locales diferenciados en
servicios, comercio e industria, terrenos baldíos, de manera que todo el territorio urbano fuera cubierto de
manera exhaustiva.
6
Esto implicó revisar la metodología y los conceptos propuestos por el INDEC, para de
adecuarlos a las necesidades de la Provincia. Esto implicó rediseñar los instrumentos para la
tarea de campo, y definir un esquema de capacitación ad hoc, garantizando que todo resultara
compatible con los lineamientos establecidos por el INDEC para el Censo7.
Al ser un operativo completamente provincial fue necesario articular un mecanismo de envíos
y repliegues de material con una logística propia, que implicó la impresión de
aproximadamente 600.000 planillas y mapas, 2.000 manuales y anexos, la provisión de
artículos de librería para todos los puestos de la estructura, la afectación de sedes locales para
acopio de material, ingreso de datos y capacitaciones, y la distribución de todo ello por
diferentes vías.
La firma de convenios con cada uno de los 134 Intendentes para la actualización cartográfica
y la realización del listado sirvieron también para involucrar a los gobiernos locales en una
política de Estado, como es el Censo, y sensibilizarlos para las tareas censales.
La descentralización de esta tarea en todos los municipios se realizó a través de los términos
establecidos en el Convenio de Actualización Cartográfica y Listado, mediante el cual se
acordó la descentralización operativa de las tareas de listado (relevamiento en terreno e
ingreso de los datos), cuyos actores locales serían Jefe de Partido, Listadores, Supervisores e
Ingresadores, mientras que la provincia aportaría recursos, metodología, materiales, y apoyo y
control técnico. Por su parte el Jefe de Partido designado fue el responsable de convocar y
seleccionar a los Listadores, Supervisores e Ingresadores, siguiendo las pautas y perfiles
establecidos por la Dirección Provincial de Estadística. La coordinación e instrucción se
realizó con personal designado por la DPE.
Se definieron dos grupos de Subcoordinadores que trabajaron conjuntamente: los
Subcoordinadores Regionales, encargados de la comunicación constante desde la DPE con los
Jefes de Partido, la organización de cursos y el envío de materiales; y los Subcoordinadores
Zonales, responsables de capacitar a listadores, supervisores y jefes de partido, recapacitar en
caso de bajas de personal, contactar personalmente a los actores locales, y asesorar y controlar
el trabajo operativo. Todos ellos fueron capacitados en todos los roles operativos de la
estructura y como instructores, con participación de todos los coordinadores provinciales.
7
María Virginia Perez a cargo del área de Estudios Sociales coordinó el diseño de los manuales e instrumentos
de medición para la realización de un listado exhaustivo de acuerdo con las necesidades provinciales.
7
En una primera instancia se trabajó con dos Municipios completamente diferentes: Brandsen
y Lanús, a fin de testear tanto los instrumentos de recolección como de instrucción, y nutrir
así posteriores relevamientos en base a estas dos experiencias tan disímiles entre si. La
elección de estos dos Partidos posibilitó diferenciar y prever lo que serían problemáticas y
comportamientos inherentes a partidos grandes y del Gran Buenos Aires de las propias de
partidos más pequeños y del interior de la provincia.
Para el relevamiento se confeccionaron y enviaron a los municipios: manuales para cada
puesto de la estructura, planillas de Listado de Viviendas en Áreas Urbanas, planillas de
Listado de Viviendas Colectivas, Planillas Resumen de Viviendas por Fracción y Radio,
Planos generales y de fracción, y planillas de control de tareas.
Para el ingreso de los datos se diseñó una aplicación informática que permitió la carga de los
datos de una manera geográficamente descentralizada, a la que podía accederse únicamente a
través de la red provincial por cuestiones de seguridad informática, pudiendo la DPE controlar
el avance del ingreso en todo momento.
La decisión de crear e implementar un software de carga on line sobre un servidor provincial
que contenía la cartografía completa como respaldo, permitió validar los datos ingresados en
el momento de la carga y acelerar las sucesivas etapas de vinculación que de esta forma se
iniciaron a medida que el ingreso de datos se convalidaba. Cabe señalar que en muy pocos
casos, y por dificultades específicas del Municipio la carga se realizó en la DPE (fortaleciendo
para esa tarea el equipo de ingreso de la DPE con daty entries de otro Organismo).
En cuanto a las capacitaciones de los listados, se organizaron en sedes locales, agrupando
partidos por cercanía geográfica. En algunos casos, debido al tamaño del partido, no sólo no
fue posible agruparlos con otros sino que fue necesario realizar más de una capacitación
(cursos simultáneos y/o en etapas). En algunos incluso se llegaron a realizar hasta 4 cursos,
debido al tamaño del Municipio que requería, dado lo ajustado del plazo, una gran cantidad de
listadores. En general la duración de los cursos fue de 3 jornadas de aproximadamente 8 horas
cada una.
La fuente de datos fundamental e irremplazable del listado fue la recolección en campo de
cada dirección con su respectivo registro, clasificación y descripción. Adicionalmente se
solicitó a los Jefes de Partido, tanto en la Capacitación como en el Manual de procedimientos,
complementar y controlar en gabinete la información recolectada en campo con la
8
proveniente de otras fuentes, como registros locales y mediante contactos con instituciones,
principalmente en los casos de difícil acceso.
Los resultados de esta descentralización operativa fueron muy buenos, de otro modo era
imposible realizar la tarea. Involucrar a los Municipios también fue una decisión política, que
permitía a cada Intendente controlar de cerca cada etapa8.
Adicionalmente, la descentralización operativa tuvo una ventaja técnica derivada de que los
actores locales tienen conocimiento amplio de su zona de trabajo y de las vicisitudes que
pueden presentarse, lo cual mejora la eficiencia en el desarrollo de la tarea y la calidad de la
misma. Asimismo, les permitió prever las dificultades eventuales y anticipar una solución
conjunta con el personal de la DPE. En este sentido, por ejemplo, algunos partidos del Gran
Buenos Aires con extensas zonas de asentamientos y villas de emergencia decidieron afectar
más personal y/o convocar a la capacitación personal residente en dichas zonas, o también en
el caso de barrios privados proceder a hacer las solicitudes correspondientes con suficiente
antelación a fin de garantizar el ingreso.
Asimismo la descentralización facilitó la afectación y reemplazo del personal operativo,
permitió ajustes rápidos en tiempos y cargas de trabajo, y agilizó cuestiones administrativas,
al tiempo que generó que el municipio se involucrara más en el censo al participar activa y
directamente en todo el proceso previo.
Este operativo involucró 135 Jefes de Municipio9, 256 Supervisores, 1.259 Listadores y 342
puestos de carga. Las tareas correspondientes se emprendieron en el mes de mayo de 2010, y
culminaron a fines de septiembre.
4.2 TAREAS CARTOGRÁFICAS
La preparación de la Cartografía de la Provincia de Buenos Aires para el CNPHV 2010, fue
un desafío muy importante para el Departamento Cartografía Estadística. La magnitud y
complejidad territorial de la provincia, sumado al escaso tiempo disponible para realizar la
tarea, la desactualización de la cartografía digital disponible y el atraso tecnológico en el
equipamiento y software del Departamento, planteaban un cuadro de situación muy complejo
dada la velocidad con la que era necesario actuar. Para cumplir con la tarea se decidió
fortalecer el Departamento, llevando a cabo las siguientes acciones:
8
En la provincia. de Buenos Aires la cantidad de habitantes es un componente del cálculo de los porcentajes de
la distribución de la coparticipación municipal y por ende un tema muy sensible.
9
Dado el tamaño del Partido, en La Matanza se previeron dos jefes de Municipio.
9

Personal: se conformó un equipo total de 58 personas (originalmente de 8).

Software: se instaló una base Oracle para los datos GIS, se renovó todo el soft GIS
migrando al ArcGis 9.3.1.

Hardware: se instalaron 3 servidores, 55 PC, 8 impresoras láser, 6 impresoras láser
color, 3 plotters, 1 fotocopiadora de planos, 1 UPS, 1 Unidad de Backup, todo en
red.

Servicios: se contrataron los servicios de Impronta y UBA para automatizar todos
los procesos a través de programación y desarrollos a medida de las necesidades
de la Provincia. Esto incluyó el soporte y asistencia técnica en las nuevas
aplicaciones.

Capacitación: se capacitó a todo el personal en ArcView, ArcInfo, ArcGis, y en las
aplicaciones desarrolladas a medida.

Modelo de trabajo GIS: se cambió el modo de manejo de datos, pasando a un
modelo de datos cartográfico centralizado con acceso multiusuario en Oracle.

Lugar de trabajo: se trasladó la oficina del Departamento Cartografía Estadística
de la Torre II a una sala mucho más grande y confortable en el Ministerio de
Economía, que permitió el cambio de escala de personal y volumen de trabajo.
Las tareas cartográficas se iniciaron en el mes de marzo de 2010, y desde sus inicios
presentaron diversos desafíos relacionados con la tecnología, los recursos humanos y los
procedimientos de trabajo para proveer del material necesario para el operativo censal del 27
de octubre de 2010.
Dados los plazos, no resultaba factible diseñar la especificación detallada de cada uno de los
problemas a resolver para que luego sea tomada por un tercero que aporte una solución a cada
problema como si fueran compartimentos estancos. Sino que se requería una solución integral
que abarcara no solo cada una de las etapas sino que hiciera ágil el paso de una etapa a la otra.
Adicionalmente, desde el principio se sabía que muchas decisiones se iban a tener que tomar
sobre la marcha sin contar con los plazos habituales de testeo y análisis exhaustivo.
Ante los desafíos planteados, la manera de resolverlos fue mediante la interacción entre la
DPE, Impronta y la UBA.
10
La DPE tuvo a su cargo el gerenciamiento integral del proceso, la especificación funcional de
los requerimientos, y la asignación de la infraestructura y recursos humanos necesarios.
La empresa Impronta estuvo a cargo de la coordinación técnica, desarrollo e implementación
de las aplicaciones cartográficas, mientras que el equipo de la UBA desarrolló el algoritmo de
segmentación automática.
Esta estructura, al estar formada por tres actores que provienen de distintas tradiciones y
dinámicas como el Gobierno, la Industria y la Universidad fue un desafío en sí mismo
respecto a su gestión.
El mecanismo de gestión elegido consistió en la presencia permanente de los recursos
aportados por Impronta en las oficinas de la DPE junto con reuniones semanales donde se
tomaban las decisiones necesarias para realizar ajustes en forma concomitante con el diseño
de las aplicaciones. Además de resultar en este caso una forma ágil, permitió adaptar los
procedimientos a definiciones que tuvieron que ser tomadas con el proyecto en estado
avanzado.
Clave para la ejecución del proyecto fue dotar a la DPE de una plataforma de hardware y
software GIS de última generación basada en software ArcGIS. Esta plataforma informática
significó para la DPE un salto tecnológico de más de 10 años. Durante esta etapa, se entrenó
al personal afectado al proyecto y se proveyó un servicio de administración de infraestructura
informática GIS denominado GeoDBA. En el siguiente diagrama se detalla la arquitectura
informática utilizada.
Fig. 1. Arquitectura GIS de la DPE
11
La infraestructura informática incluyó:

Wide Area Network (WAN) conectando 134 municipios cargando viviendas a
través de la aplicación Web ABM de Listados residente en un servidor dedicado.

Red de Área Local (LAN) con 60 operadores GIS accediendo a una base de datos
geográfica denominada Geodatabase. Incluyó equipamiento de impresión de alta
velocidad.

Aplicación Tablero de Control para el seguimiento de las actividades del proyecto.
El desarrollo de aplicaciones se realizó sobre diferentes lenguajes de programación, que
incluyeron ASP .Net, VB Forms, ANSI C, PL SQL y ArcObjects.
4.2.1 Actualización cartográfica.
Durante el operativo de listado de viviendas, una de las tareas de los listadores y jefes
municipales era la de realizar la actualización de cartografía en campo sobre los planos de
fracción entregados por la DPE. Las modificaciones a registrar eran nuevas calles y
manzanas, cambio de nombres de calles existentes, hitos de referencia y nuevas
urbanizaciones. En los casos de countries, villas de emergencias o nuevas localidades, se
solicitaba al municipio un croquis de detalle o plano catastral que permitiera la actualización
de las nuevas manzanas y calles.
Para esta etapa se utilizó el software ArcInfo 9.3 GIS para realizar toda la actualización
cartográfica original en formato cobertura. Luego se produjo la migración de todas las
coberturas existentes al formato geodatabase de ArcGIS en base Oracle. Este cambio de
tecnología, demandó tiempo y esfuerzo para concretarse, pero representó una notable mejora
en productividad y rendimiento ya que entre otras cosas permitió el trabajo multiusuario,
unificó en un servidor y en una base de datos toda la provincia, fue más estable y más seguro.
En las zonas urbanas se actualizaron los ejes de calles y manzanas con imágenes satelitales
recortadas del Google Earth Pro y georeferenciadas con software GIS (Imágenes Satelitales
fecha 2007/2009, Precisión 0.50 m aprox.). Se digitalizaron 269 localidades pequeñas que se
encontraban en formato papel, y se realizó el cambio de sistema de referencia a WGS 84 para
las 320 localidades que ya estaban digitalizadas. Además, se generaron nuevas coberturas
provinciales de fracciones y radios censales.
En las zonas rurales se utilizó la base de caminos y parcelas rurales del año 2002, se realizó el
cambio de sistema de referencia a WGS 84 para todas las coberturas rurales, y se
12
compatibilizaron las zonas rurales con las zonas urbanas. Adicionalmente, se utilizaron las
coberturas de hitos, cursos de agua y escuelas rurales provistas por el IGN a través del
INDEC.
4.2.2 Impresión de cartografía de listado
Luego de la actualización cartográfica, se confeccionaron e imprimieron todos los planos de
las localidades para utilizar en el operativo de listado de viviendas (aproximadamente 2.500
planos). En cada plano de fracción o en un croquis adjunto los listadores volcaron las
modificaciones cartográficas que hallaron.
4.2.3 Vinculación de listado
A medida que los listados se iban cargando en los municipios se realizaba la vinculación de
los datos al GIS, se corregían inconsistencias, se detectaban modificaciones y se reportaban
faltantes. En los casos en que la carga se realizó sin errores y la cartografía no tuvo
modificaciones la vinculación de datos fue directa y automática.
La vinculación automática representó el 75% de las manzanas, quedando el 25% restante para
una vinculación asistida. Se utilizó una clave de lado única para cada lado de manzana de la
Provincia, como elemento fundamental en el proceso de vinculación.
4.2.4 Redimensionamiento de fracciones y radios censales
Producto de lo restringido del cronograma, la redimensión de fracciones se realizó con
anterioridad a la finalización del listado y en forma previa a la redimensión de radios, de
acuerdo a datos y proyecciones elaboradas especialmente para este fin. Se utilizó un método
manual con software ArcGis. De esta forma se redimensionaron 527 fracciones, conformando
un total de 2.184.
Para la redimensión de radios se utilizó un software desarrollado al efecto en base a ArcGis
9.3.1. Con él se redimensionaron los radios censales que superaban las 500 viviendas y los
radios que superaban las 40 manzanas. Se renumeraron los radios redimensionados y los
radios de las fracciones nuevas. Además se renumeraron todas las manzanas involucradas en
los radios resultantes. El resultado fue un total de 19.577 radios.
13
4.2.5 Segmentación
El desafío más importante del proyecto estuvo relacionado con el proceso de segmentación de
viviendas. Por lo tanto, se determinó que ineludiblemente debería realizarse de manera
automática.
El área de trabajo de cada censista se denomina segmento, que constituye un “conjunto de: a)
una porción de territorio, b) las viviendas que en ella se asientan, y c) un promedio estimado
de entrevistas a realizar durante el tiempo establecido para el operativo censal” (INDEC,
2010).
La segmentación es la tarea que permite subdividir el radio censal en unidades operativas
menores llamadas segmentos sujeta al cumplimiento de ciertas condiciones de contigüidad y
exhaustividad10. Se realiza a nivel de cada radio censal, con características diferentes según el
tipo de radio: urbano, rural o mixto. Este procedimiento de segmentación, habitualmente se
realiza manualmente o utilizando rudimentarios algoritmos de asignación.
Las restricciones en los plazos que debían cumplirse exigían diseñar mecanismos alternativos
a los utilizados en otras oportunidades. Por lo tanto, se determinó que en esta oportunidad
debería realizarse de manera automática.
Experiencias anteriores, y particularmente del Censo 2001, indicaban que la DPE necesitaba
emplear 6.000 horas hombre, el equivalente a 25 operadores trabajando full-time durante 25
días, para realizar la segmentación de manera manual, y esto sin considerar los tiempos de
entrenamiento, soporte y los riesgos asociados a los procesos manuales de asignación.
Fig. 2. Esquema de segmentación: lados de manzanas asignados a censistas. Cada color corresponde a un
segmento asignado a un censista.
10
Federico Ferella, como Coordinador del Departamento de Cartografía Estadística, aportó la descripción de los
procedimientos que tradicionalmente se realizaban de manera manual y que sirvieron de base para el desarrollo
de la segmentación automática.
14
La cantidad de viviendas asignada a cada segmento, comúnmente denominado “tamaño” del
segmento, varía en función de la cantidad de preguntas del formulario censal a utilizar, el
nivel socioeconómico de la población, la presencia de familias numerosas y las
particularidades de contexto geográfico. Típicamente el “tamaño” de los segmentos varía
entre 12 y 40 viviendas.
De acuerdo a la metodología establecida por el INDEC para el CNPHV 2010 hubieron dos
tipos de formularios: un Formulario Ampliado (A) para ser aplicado en aquellas localidades
con una población inferior a 50.000 habitantes y en el 10% de los segmentos de localidades
con 50.000 habitantes o más; y un segundo Formulario Básico (B) para aplicar en el 90% de
los segmentos de localidades con 50.000 habitantes o más.
De esta manera, y debido a la diversidad provincial en los 134 Municipios y considerando que
en esta Provincia el territorio de cada Municipio o Partido está conformado por una localidad
cabecera, el campo circundante y localidades menores, existieron distintas situaciones:

Todo el Municipio con muestra.

Todo el Municipio sin muestra, por no tener localidades que superen los 50.000
habitantes.

Municipios con localidades con muestra y resto de localidades sin muestra.
En un segundo nivel existió diversidad de densidad de viviendas en cada partido, por niveles
altos de pobreza, familias numerosas (información base proveniente del Censo 2001)
asentamientos y villas de emergencia (con información proveniente del Operativo Listado
Viviendas 2010). Áreas de country, barrios cerrados y demás urbanizaciones que implicaron
establecer diferentes tamaños de segmentos.
También el tamaño del segmento en áreas urbanas estuvo condicionado por su ubicación
geográfica de acuerdo a la localidad a la que pertenezca, por el hacinamiento en hogares por
radio censal según Censo 2001 y por el criterio de selección muestral utilizado.
De esta manera, la existencia de diversos tamaños de segmentos en una misma localidad
generó mayor complejidad para resolver la asignación de áreas de trabajo a cada censista. En
la siguiente tabla se detallan los ocho casos de segmentación utilizados y la cantidad de
viviendas (tamaño de segmento).
15
Tabla. 1. Tamaño del segmento según el tipo de localidad a la pertenece cada radio
Tamaño de
Localidad
Hacinamiento en
hogares 2001
Country / Villa E.
Muestra
Formulario
Tamaño de
Segmento
Más 50.000 hab.
NO
NO
NO
B
e/ 32 y 40 Viv.
Más 50.000 hab.
NO
NO
SI
A
e/ 16 y 20 Viv.
Más 50.000 hab.
SI
NO
NO
B
e/ 26 y 32 Viv.
Más 50.000 hab.
SI
NO
SI
A
e/ 12 y 18 Viv.
Más 50.000 hab.
NO
SI
NO
A
e/ 15 y 25 Viv.
Menos 50.000 hab.
NO
NO
NO
A
e/ 16 y 24 Viv.
Menos 50.000 hab.
SI
NO
NO
A
e/ 14 y 20 Viv.
Menos 50.000 hab.
NO
SI
NO
A
e/ 15 y 25 Viv.
A su vez, el resultado de la segmentación debía cumplir con una serie de restricciones de tipo
logísticas con el fin de minimizar el recorrido del censista.
Fig. 3. Restricciones en la segmentación (1)
16
Fig. 4. Restricciones en la segmentación (2)
Fig. 5. Restricciones en la segmentación (3)
Fig. 6. Restricciones en la segmentación (4)
17
Fig. 7. Restricciones en la segmentación (5)
Fig. 8. Restricciones en la segmentación (6)
Fig. 9. Restricciones en la segmentación (7)
18
En el esquema de segmentación es posible partir un lado de manzana, si está compuesto por
un número demasiado grande de viviendas o si no hay solución factible sin partirlo. Así, son
deseables las siguientes configuraciones, en orden de preferencia:
1. Segmentos compuestos por una o varias manzanas completas.
2. Segmentos formados por lados completos.
3. Edificios completos
4. Pisos de edificios completos.
Al momento de planificar la segmentación y habida cuenta de intentos en el Censo 2001 de
avanzar hacia una segmentación automática, esta DPE consideró que era la única alternativa
posible, enfrentándose así al convencimiento generalizado que la automatización de esta tarea
era imposible. Para ello inició una investigación que dio como resultado que se trataba de un
problema para el cual sí existía solución (Martin, D. 2001).
El problema de segmentación de viviendas puede relacionarse a los problemas de
"redistricting11" (Martin D, 2001; Altman M, 1997; Altman M, MacDonald K, McDonald
M.P., 2005). Sin embargo, los algoritmos para redistricting existentes no se adaptaban
fácilmente al problema particular de segmentación y por lo tanto había que desarrollarlos.
Además, no se encontraron evidencias de la existencia de algoritmos automáticos de
segmentación en la literatura.
El equipo de trabajo de la UBA, conformado por especialistas en optimización, trabajó en el
desarrollo de un algoritmo de segmentación automática basado en programación entera. Este
algoritmo fue integrado dentro del flujo de trabajo de la DPE dentro de la infraestructura GIS
existente, permitiendo que todos los equipos de trabajo actuaran armoniosamente y a máxima
capacidad.
En el siguiente diagrama se detalla una típica salida del algoritmo de segmentación.
11
Redistricting es el proceso de cubrir completamente un territorio con un conjunto mínimo de N polígonos que
satisfagan alguna restricción (por ejemplo que la cantidad de habitantes de cada polígono difiera en menos de un
5%).
19
Fig. 10. Esquemas de segmentación en áreas urbanas y mixtas
El éxito del algoritmo de segmentación se basó en la capacidad de resolver, con un mismo
modelo de programación entera, situaciones de distribución urbana muy distantes:

más de 160 viviendas por manzana, típico caso de “listado”12

manzanas de 40 viviendas: densidad media

manzanas con menos de 5 viviendas: baja densidad
El algoritmo de segmentación permitió construir automáticamente el 96% de los segmentos
urbanos y mixtos de la provincia en aproximadamente 320 hs de procesamiento (menos de un
día con un cluster de 15 PCs). Los segmentos restantes se resolvieron manualmente con un
programa de segmentación asistida desarrollado al efecto.
Como referencia se detalla el modelo de programación entera:
max  val ( s )  x s
sS
sujeto a
x
s
1
v  V
x
s
1
l  L 0
x s  {0,1}
s  S
sS v
sS l
Donde:
─ S: conjunto de todos los segmentos posibles s
─ xs: variable binaria que indica si el segmento s es parte de la solución
─ val(s): valuación del segmento s
12
Se denomina “listado” al proceso de segmentar manzanas cuyos lados tienen más viviendas de la capacidad
máxima del segmento, resultando en la asignación de N censistas por lado de manzana, incluso dentro de un
mismo edificio.
20
─ V: conjunto de viviendas
─ Sv: conjunto de segmentos que incluyen a la vivienda v
─ L0: conjunto de lados sin viviendas
─ Sl: conjunto de segmentos que incluyen al lado sin viviendas l
La función de valuación maximizada en el modelo, toma en cuenta la proporción de lados por
manzana contenidos en un segmento. Este valor proporciona una idea de qué tan compacto es
el segmento en cuestión, y este aspecto es de alguna manera una buena métrica para comparar
los segmentos entre sí. Por ejemplo, un segmento que recorre una manzana completa, tendrá
una proporción de lados por manzana de 4 (si la manzana tiene 4 lados) mientras que un
segmento que recorre cuatro manzanas visitando sólo un lado por manzana tendrá una
proporción de 1. Según los criterios de segmentación definidos, la configuración del primer
segmento es más deseada que la del segundo, y esto mismo queda reflejado en la función de
valuación propuesta.
El modelo de programación entera descripto anteriormente resuelve el problema de
segmentación planteado. Sin embargo, cabe aclarar que la cantidad de variables del mismo
(i.e., la cantidad de segmentos posibles en un radio) puede resultar intratable en la práctica.
Para resolver este inconveniente, se desarrolló un algoritmo que parte desde un conjunto
reducido de segmentos S1  S y ejecuta el modelo con dicho conjunto en busca de una
solución. Si no se encuentra solución, el algoritmo genera más segmentos y reitera la
ejecución del modelo con este nuevo conjunto de segmentos. El algoritmo continúa repitiendo
este proceso hasta hallar una solución o bien hasta alcanzar algún límite predefinido de
iteraciones.
El siguiente pseudocódigo describe el algoritmo implementado:
-i  1
- S1  segmentos no excedidos que no cruzan ninguna calle.
- Ejecutar el modelo de PE usando los segmentos válidos de S1.
- Mientras no haya solución e i < límite de iteraciones hacer
- Si+1  Si
- Para cada (si, s) en Si  S1 hacer
- Si (si  s) es conexo y no excedido entonces
- Si+1  Si+1  {(si  s)}
- fin si
- fin para
- Ejecutar el modelo de PE usando los segmentos válidos de Si+1.
- i  i+1
- fin mientras
21
donde un segmento “no excedido” es un segmento de tamaño no mayor al tamaño máximo
permitido (aunque no necesariamente no menor que el mínimo) y un segmento “válido” es un
segmento no excedido de tamaño no menor que el mínimo.
4.2.6 Impresión de cartografía para la estructura del operativo
Se confeccionaron e imprimieron todos los planos para cada uno de los participantes en la
estructura censal: 210.716 segmentos, 19.577 jefes de radio, 2.184 jefes de fracción y 134
jefes de partido. Además se imprimieron para los censistas de viviendas colectivas, todos los
planos de radio que incluyeran viviendas de este tipo.
Para los rótulos de identificación de cada plano, se diseñó un sistema gráfico cromático que
acompañaba e identificaba la cartografía según nivel de estructura, con buena legibilidad de
los datos. Se utilizó software GIS con un aplicativo de desarrollo propio que permitió
sistematizar todo el proceso de impresión. De esta manera, se imprimieron con
procedimientos “en serie” los aproximadamente 240.000 planos utilizados en el operativo.
Las planillas resumen para los jefes de radio urbanos (R3) y rurales (R4) como para los jefes
de fracción (F3) se confeccionaron e imprimieron automáticamente con un desarrollo a
medida, que funcionaba en relación directa con la salida del programa de segmentación. En
este caso, se imprimieron 80.000 planillas.
5
Resultados alcanzados
Luego de más de 500 meses hombre de esfuerzo, 8 meses de trabajo, y culminando con el
operativo Censal del 27 de octubre de 2010, se proveyó en tiempo y forma de todo el material
necesario para la ejecución del Censo Nacional de Población, Viviendas y Hogares en la
provincia de Buenos Aires. Durante el proyecto, se lograron las siguientes metas:

Confeccionar la Cartografía Actualizada de134 partidos residente en una única base
de Datos Multiusuario del Tipo Geodatabase.

Proveer a la DPE de una plataforma tecnológica GIS moderna y escalable.

5.500.000 unidades listadas durante el operativo precensal.

Listados de viviendas y cartografía vinculados en una única base de datos.

600 fracciones censales redimensionadas.

2.600 radios censales redimensionadas.
22

2.900 radios rurales segmentados manualmente13 con 10.300 segmentos.

16.700 radios urbanos y mixtos segmentados automáticamente con 200.500
segmentos.
6

Más de 300.000 mapas y reportes impresos14.

Material para censista, jefe de radio y fracción entregados en tiempo y forma.
CONSIDERACIONES FINALES
La realización de las tareas precensales para el Censo Nacional de Población, Hogares y
Viviendas 2010 de la provincia de Buenos Aires representó un enorme desafío: conformar un
equipo multidisciplinario, con alta disponibilidad y gran capacidad para desarrollar y ejecutar
en tiempo récord todas las tareas necesarias para proveer al operativo del material censal
necesario. Particularmente se necesitaban acortar los tiempos asociados de todos los procesos
para poder alcanzar los objetivos para el 27 de octubre de 2010.
Todo lo realizado fue coordinado y dirigido por la DPE lo que constituye una innovación al
haber actuado coordinadamente en tres puntos: la vinculación con los municipios para la
actualización cartográfica y listado de viviendas, con la industria informática respecto al
soporte y desarrollo de la actualización de la plataforma GIS y con la universidad en cuanto al
desarrollo e implementación del algoritmo de segmentación automática de viviendas.
Se logró el objetivo principal: poder salir a campo a las 8 de la mañana del 27 de octubre de
2010 con todo el material preparado, chequeado y distribuido, lo que permitió llevar adelante
el operativo censal de manera eficaz.
Adicionalmente el enorme esfuerzo de gestión realizado que implicó la organización
presupuestaria, administrativa, logística y técnica, permitió otros logros: que la Provincia
cuente con toda la cartográfica digital actualizada en una plataforma que permite
administrarla con mayor eficiencia y, por primera vez, con un listado de viviendas urbanas
completo y vinculado cartográficamente, a partir del cual realizar cualquier tipo de encuesta a
hogares en el territorio provincial
13
14
Los radios rurales no estaban incluidos en el algoritmo de segmentación.
Si se apilaran por la base todas las resmas de papel utilizadas, se alcanzaría la altura de un edificio de 10 pisos.
23
7
AGRADECIMIENTOS
Queremos agradecer especialmente a todas las autoridades del Ministerio de Economía de la
provincia de Buenos Aires que entendieron nuestras urgencias y compartieron nuestra
posición metodológica, respaldaron nuestras decisiones y fueron parte de las negociaciones
con el nivel nacional y municipal.
A todo el personal de la DPE, haya participado o no en las tareas, a toda la estructura de los
operativos de listado, capacitación, y relevamiento, así como a las personas involucradas en
las tareas informáticas y cartográficas.
A las 15.625.084 personas que respondieron.
24
8
Referencias
 Aliaga F, Bonomo F, Delle Donne D, Durán G, Marenco J, Sotelo R, 2011. Sistema de
Información Geográfica como apoyo a las actividades del Censo Nacional de Población,
Hogares y Viviendas 2010 de la provincia de Buenos Aires. Anales de las Jornadas de
Vinculación Universidad-Industria. 40JAIIO - JUI 2011.
 Altman M, 1997. Is Automation the Answer: The Computational Complexity of Automated
Redistricting. RC and Law Technology Journal, 23(1), pp: 81-141.
 Altman M, MacDonald K. and McDonald M.P., 2005. From Crayons to Computers: The
Evolution of Computer Use in Redistricting. Social Science Computer Review, 23(3), pp:
334-346.
 Delle Donne D, Durán G y Marenco J, 2011. Solving the segmentation problem for the
2010 Argentine census with integer programming. Electronic Notes in Discrete
Mathematics, en prensa. doi: 10.1016/j.endm.2011.05.
 Departamento de Cartografía y SIG-INDEC, 2010. Manual de Segmentación.
 INDEC, 2010. Censo Nacional de Población, Hogares y Viviendas 2010. Total del país.
Resultados provisionales.
 Martin D, 2001. Developing the Automated Zoning Procedure to Reconcile Incompatible
Zoning Systems. , Proceedings, 6th International Conference on GeoComputation, held at
Brisbane, Australia, 24-26 September 2001. CD-ROM Publication.
 Presentación “Memorias del proyecto GIS para el censo 2010”, Fernando Aliaga, diciembre
de 2010.
25

Documentos relacionados