Tareas precensales - Asociación Latinoamericana de Población
Transcripción
Tareas precensales - Asociación Latinoamericana de Población
TAREAS PRECENSALES 2010 EN LA PROVINCIA DE BUENOS AIRES DE LA REPÚBLICA ARGENTINA1 Autores: Angeletti Karina L.2, Serrano Sebastián3, Sotelo Rodrigo4 RESUMEN La Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE) tiene entre sus tareas principales la de coordinar las actividades relativas a los operativos censales que se desarrollen en el territorio de la provincia de Buenos Aires. Se trata de la provincia más grande y poblada de la República Argentina: con 304.907 km 2 de superficie, está dividida administrativamente en 135 partidos 5.383.536 de viviendas y 15.625.084 habitantes, lo que representa el 39 % del total nacional. Las características del diseño elegido para el Censo Nacional de Población, Hogares y Viviendas 2010 (CNPHV 2010) unido a las de la Provincia y al plazo de 8 meses para la realización de todas las tareas necesarias para llegar en condiciones al 27 de octubre, llevaron a la decisión de establecer metodologías particulares de acuerdo con la realidad provincial. En este trabajo se describen dos actividades: el listado de viviendas de todas las áreas urbanas y las tareas cartográficas. Todo lo realizado fue dirigido por la DPE, y constituye una innovación haber actuado coordinadamente en tres puntos: la vinculación 1) con los municipios para la actualización cartográfica y listado de viviendas, 2) con la industria informática respecto al soporte y desarrollo de la actualización de la plataforma GIS y 3) con la universidad en cuanto al desarrollo e implementación de un algoritmo de segmentación automática de viviendas. 1 Trabajo presentado en el V Congreso de la Asociación Latinoamericana de Población, Montevideo, Uruguay, del 23 al 26 de octubre de 2012. 2 Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE). Ministerio de Economía de la provincia de Buenos Aires. E-mail: [email protected] 3 DPE. Ministerio de Economía de la provincia de Buenos Aires. E-mail: [email protected] 4 DPE. Ministerio de Economía de la provincia de Buenos Aires. E-mail: [email protected] 1 Además de haber llevado adelante el operativo censal de manera eficaz, el esfuerzo realizado permitió otros logros: dio como resultado que la Provincia cuente con toda la cartografía actualizada en un sistema que permite administrarla con mayor eficiencia y, por primera vez, con un listado de viviendas urbanas completo y vinculado cartográficamente. A partir del mismo, será posible realizar encuestas a hogares en el territorio provincial así como en cada una de las localidades urbanas. Palabras clave: actualización cartográfica, listado de viviendas, segmentación automática 2 1 INTRODUCCIÓN La Dirección Provincial de Estadística de la provincia de Buenos Aires (DPE) tiene sus orígenes en el Registro Estadístico de la Provincia de Buenos Aires, creado el 13 de diciembre de 1821. Entre sus tareas principales se encuentra la de coordinar las tareas relativas a los operativos censales que se desarrollen en el territorio de la provincia de Buenos Aires. Este trabajo describe dos actividades realizadas en la provincia de Buenos Aires (PBA) en ocasión de las tareas precensales para el Censo Nacional de Población, Hogares y Viviendas 2010 (CNPHV 2010): el listado de viviendas de todas las áreas urbanas y las tareas cartográficas. Las características del diseño elegido para el CNPHV 2010 unido a las de la Provincia y al plazo de 8 meses para realizar todas las tareas necesarias para llegar en condiciones al 27 de octubre, llevaron a la decisión de establecer metodologías particulares de acuerdo a la realidad provincial. Primero se describe el diseño del CNPHV 2010, las características de la provincia de Buenos Aires y del problema a resolver. Luego, se explica como se resolvió el problema detallando lo realizado en relación con el listado de viviendas y las tareas cartográficas. Finalmente, se cuantifican los resultados alcanzados y se presentan las consideraciones finales. 2 DISEÑO DEL CNPHV 2010 Para el CNPHV 2010 el Instituto Nacional de Estadística y Censos (INDEC) determinó que la modalidad a aplicar sería la de censo de hecho con el método de cuestionario ampliado y reducido. El día fijado fue el 27 de octubre de 2010, se aplicaría (en principio) el cuestionario ampliado en todas las localidades de menos de 50.000 habitantes y a una muestra de 10% en las localidades de más de 50.000 habitantes, mientras que el cuestionario reducido se aplicaría al 90% restante. La existencia de dos tipos de cuestionarios determinó que los tamaños de los segmentos (carga de trabajo del censista) variaran según el tipo de localidad de la que se tratara. 3 3 CARACTERÍSTICAS DE LA PBA Y PROBLEMA A RESOLVER La provincia de Buenos Aires es la provincia más grande y poblada de la República Argentina: con 304.907 km2 de superficie, está dividida administrativamente en 134 partidos con 5.581.761 de viviendas y 15.594.428 habitantes (INDEC 2010). Sobre un total de 40.091.359 de habitantes para todo el país, representa un 39 % del total nacional. Dadas estas características, la planificación e implementación de operativos estadísticos en el territorio provincial se tornan complejos para cumplir con el objetivo primordial de un censo: el recuento de toda la población en el lugar en que haya pasado la noche anterior al día del operativo (censo de hecho). Como fuente estadística oficial, los censos de población presentan estrictos requerimientos de universalidad, simultaneidad e identificación del territorio definido. En el caso argentino y en particular en la provincia de Buenos Aires, sobre la base de los resultados censales se define: La representación política Los recursos a distribuir por sistemas de coparticipación La focalización de las políticas públicas La toma de decisiones del sector privado Por ello es importante recalcar que una deficiente medición no sólo implicará asignaciones no equitativas en el presente inmediato, sino por todo el período durante el cual se utilicen sus resultados. Por lo tanto, es fundamental el desarrollo de tareas precensales vinculadas con las siguientes temáticas: Legislación Institucionales Administrativas Logística Tareas Cartográficas Capacitación Tecnología e Informática Comunicaciones 4 Planificación, coordinación y seguimiento Sensibilización Prueba de campo Por lo tanto, el problema a resolver era complejo tanto por la cantidad de personas involucradas en este tipo de relevamiento, como el volumen de la tarea a realizar y lo acotado de los plazos. El Decreto Nacional que fijó oficialmente la fecha del Censo se promulgó en enero de 2010. Es sabido que muchas acciones recién pueden destrabarse a partir de él (como por ejemplo el decreto provincial de adhesión, la conformación del Comité Censal Provincial y la puesta en marcha de los Convenios específicos al interior de la Provincia). El anterior censo de población llevado a cabo en 2001 en la provincia de Buenos Aires contabilizó cerca de 14.000.000 de habitantes, y 4.800.000 viviendas, debiendo reclutar una estructura de personal de más de 178.000 agentes entre tareas pre-censales, censales y postcensales. Y dado que en 2010 se había determinado un censo de hecho con muestra, que se realizaría en un solo día, los cálculos preliminares de la estructura se elevaban a 185.000 censistas, 25.000 jefes de radio, 2.500 jefes de fracción y 134 jefes de partido, un número cercano a las 220.000 personas, sólo para el relevamiento del día del censo. A toda esta estructura no solo había que capacitarla sino que también dotarla de los materiales necesarios en un plazo de 8 meses. Al mismo tiempo, era necesario actualizar toda la cartografía estadística, redimensionar las fracciones y los radios, determinar la cantidad de viviendas de manera que pudieran asignarse exhaustivamente a los censistas, e imprimir y distribuir todos los materiales a ser utilizados el día del operativo censal. Respecto al tamaño de los segmentos, la utilización de dos tipos de cuestionarios según el tipo de localidad agregó complejidad al problema a resolver. Por la diversidad provincial en los 134 Municipios existieron distintas situaciones: todo el Municipio con muestra, todo el Municipio sin muestra, Municipios con localidades con muestra y resto de localidades sin muestra. En un segundo nivel, el INDEC estableció tamaños de segmentos diferenciales en los casos de alta densidad de viviendas con familias numerosas, viviendas en asentamientos y villas de emergencia, en áreas de country, barrios cerrados y demás urbanizaciones. Cabe señalar que la Provincia tiene más de 500 urbanizaciones del tipo barrio cerrado o country. 5 Adicionalmente, hubo otras restricciones que enfrentar al inicio de la planificación: 8 meses de plazo total para diseñar, implementar y terminar el trabajo. Software cartográfico anticuado. Falta de especificaciones detalladas. No existía formalización escrita de los procesos, ni tradición en intentarlo. Muchas decisiones iban a tener que tomarse sobre la marcha. El “ambiente estadístico” consideraba imposible realizar una segmentación automática. 27 de octubre como fecha inamovible. 4 CÓMO SE RESOLVIÓ La manera de resolver el problema planteado fue planificar de manera integral todas las tareas precisas para cumplir con el objetivo de generar las condiciones necesarias para la realización exitosa del Censo el día 27 de octubre de 2010. Los requisitos censales de universalidad, simultaneidad e identificación del territorio definido llevó a la Provincia a tomar la decisión de realizar de un listado exhaustivo de viviendas en las áreas urbanas en lugar del método de conteo/ listado definido por el INDEC5. 4.1 LISTADO DE VIVIENDAS Para la implementación del listado de viviendas se trabajó coordinadamente con los municipios. Primero solicitándoles que informen sobre cambios producidos en la cartografía con la que contaba la DPE a inicios del 2010, segundo descentralizando en ellos el operativo de listado, bajo las definiciones metodológicas de la DPE, y tercero la carga de los datos resultantes del listado vía web en un sistema diseñado de manera tal de optimizar la vinculación de las viviendas listadas y cargadas con la cartografía. La decisión de realizar un listado exhaustivo de viviendas particulares y demás unidades de listado6 en las zonas urbanas de todos los partidos de la provincia buscó, como principal, pero no único objetivo, asegurar una eficiente asignación de la carga de trabajo de los censistas. 5 Este método establece que debe registrarse la sumatoria de las viviendas por lado de manzana cuando el total de viviendas de una manzana no supera 39. En aquellas manzanas que cuenten con 40 viviendas y más se realiza una listado mediante la registración de cada unidad. 6 Además de las viviendas particulares, se listaron unidades como viviendas colectivas, locales diferenciados en servicios, comercio e industria, terrenos baldíos, de manera que todo el territorio urbano fuera cubierto de manera exhaustiva. 6 Esto implicó revisar la metodología y los conceptos propuestos por el INDEC, para de adecuarlos a las necesidades de la Provincia. Esto implicó rediseñar los instrumentos para la tarea de campo, y definir un esquema de capacitación ad hoc, garantizando que todo resultara compatible con los lineamientos establecidos por el INDEC para el Censo7. Al ser un operativo completamente provincial fue necesario articular un mecanismo de envíos y repliegues de material con una logística propia, que implicó la impresión de aproximadamente 600.000 planillas y mapas, 2.000 manuales y anexos, la provisión de artículos de librería para todos los puestos de la estructura, la afectación de sedes locales para acopio de material, ingreso de datos y capacitaciones, y la distribución de todo ello por diferentes vías. La firma de convenios con cada uno de los 134 Intendentes para la actualización cartográfica y la realización del listado sirvieron también para involucrar a los gobiernos locales en una política de Estado, como es el Censo, y sensibilizarlos para las tareas censales. La descentralización de esta tarea en todos los municipios se realizó a través de los términos establecidos en el Convenio de Actualización Cartográfica y Listado, mediante el cual se acordó la descentralización operativa de las tareas de listado (relevamiento en terreno e ingreso de los datos), cuyos actores locales serían Jefe de Partido, Listadores, Supervisores e Ingresadores, mientras que la provincia aportaría recursos, metodología, materiales, y apoyo y control técnico. Por su parte el Jefe de Partido designado fue el responsable de convocar y seleccionar a los Listadores, Supervisores e Ingresadores, siguiendo las pautas y perfiles establecidos por la Dirección Provincial de Estadística. La coordinación e instrucción se realizó con personal designado por la DPE. Se definieron dos grupos de Subcoordinadores que trabajaron conjuntamente: los Subcoordinadores Regionales, encargados de la comunicación constante desde la DPE con los Jefes de Partido, la organización de cursos y el envío de materiales; y los Subcoordinadores Zonales, responsables de capacitar a listadores, supervisores y jefes de partido, recapacitar en caso de bajas de personal, contactar personalmente a los actores locales, y asesorar y controlar el trabajo operativo. Todos ellos fueron capacitados en todos los roles operativos de la estructura y como instructores, con participación de todos los coordinadores provinciales. 7 María Virginia Perez a cargo del área de Estudios Sociales coordinó el diseño de los manuales e instrumentos de medición para la realización de un listado exhaustivo de acuerdo con las necesidades provinciales. 7 En una primera instancia se trabajó con dos Municipios completamente diferentes: Brandsen y Lanús, a fin de testear tanto los instrumentos de recolección como de instrucción, y nutrir así posteriores relevamientos en base a estas dos experiencias tan disímiles entre si. La elección de estos dos Partidos posibilitó diferenciar y prever lo que serían problemáticas y comportamientos inherentes a partidos grandes y del Gran Buenos Aires de las propias de partidos más pequeños y del interior de la provincia. Para el relevamiento se confeccionaron y enviaron a los municipios: manuales para cada puesto de la estructura, planillas de Listado de Viviendas en Áreas Urbanas, planillas de Listado de Viviendas Colectivas, Planillas Resumen de Viviendas por Fracción y Radio, Planos generales y de fracción, y planillas de control de tareas. Para el ingreso de los datos se diseñó una aplicación informática que permitió la carga de los datos de una manera geográficamente descentralizada, a la que podía accederse únicamente a través de la red provincial por cuestiones de seguridad informática, pudiendo la DPE controlar el avance del ingreso en todo momento. La decisión de crear e implementar un software de carga on line sobre un servidor provincial que contenía la cartografía completa como respaldo, permitió validar los datos ingresados en el momento de la carga y acelerar las sucesivas etapas de vinculación que de esta forma se iniciaron a medida que el ingreso de datos se convalidaba. Cabe señalar que en muy pocos casos, y por dificultades específicas del Municipio la carga se realizó en la DPE (fortaleciendo para esa tarea el equipo de ingreso de la DPE con daty entries de otro Organismo). En cuanto a las capacitaciones de los listados, se organizaron en sedes locales, agrupando partidos por cercanía geográfica. En algunos casos, debido al tamaño del partido, no sólo no fue posible agruparlos con otros sino que fue necesario realizar más de una capacitación (cursos simultáneos y/o en etapas). En algunos incluso se llegaron a realizar hasta 4 cursos, debido al tamaño del Municipio que requería, dado lo ajustado del plazo, una gran cantidad de listadores. En general la duración de los cursos fue de 3 jornadas de aproximadamente 8 horas cada una. La fuente de datos fundamental e irremplazable del listado fue la recolección en campo de cada dirección con su respectivo registro, clasificación y descripción. Adicionalmente se solicitó a los Jefes de Partido, tanto en la Capacitación como en el Manual de procedimientos, complementar y controlar en gabinete la información recolectada en campo con la 8 proveniente de otras fuentes, como registros locales y mediante contactos con instituciones, principalmente en los casos de difícil acceso. Los resultados de esta descentralización operativa fueron muy buenos, de otro modo era imposible realizar la tarea. Involucrar a los Municipios también fue una decisión política, que permitía a cada Intendente controlar de cerca cada etapa8. Adicionalmente, la descentralización operativa tuvo una ventaja técnica derivada de que los actores locales tienen conocimiento amplio de su zona de trabajo y de las vicisitudes que pueden presentarse, lo cual mejora la eficiencia en el desarrollo de la tarea y la calidad de la misma. Asimismo, les permitió prever las dificultades eventuales y anticipar una solución conjunta con el personal de la DPE. En este sentido, por ejemplo, algunos partidos del Gran Buenos Aires con extensas zonas de asentamientos y villas de emergencia decidieron afectar más personal y/o convocar a la capacitación personal residente en dichas zonas, o también en el caso de barrios privados proceder a hacer las solicitudes correspondientes con suficiente antelación a fin de garantizar el ingreso. Asimismo la descentralización facilitó la afectación y reemplazo del personal operativo, permitió ajustes rápidos en tiempos y cargas de trabajo, y agilizó cuestiones administrativas, al tiempo que generó que el municipio se involucrara más en el censo al participar activa y directamente en todo el proceso previo. Este operativo involucró 135 Jefes de Municipio9, 256 Supervisores, 1.259 Listadores y 342 puestos de carga. Las tareas correspondientes se emprendieron en el mes de mayo de 2010, y culminaron a fines de septiembre. 4.2 TAREAS CARTOGRÁFICAS La preparación de la Cartografía de la Provincia de Buenos Aires para el CNPHV 2010, fue un desafío muy importante para el Departamento Cartografía Estadística. La magnitud y complejidad territorial de la provincia, sumado al escaso tiempo disponible para realizar la tarea, la desactualización de la cartografía digital disponible y el atraso tecnológico en el equipamiento y software del Departamento, planteaban un cuadro de situación muy complejo dada la velocidad con la que era necesario actuar. Para cumplir con la tarea se decidió fortalecer el Departamento, llevando a cabo las siguientes acciones: 8 En la provincia. de Buenos Aires la cantidad de habitantes es un componente del cálculo de los porcentajes de la distribución de la coparticipación municipal y por ende un tema muy sensible. 9 Dado el tamaño del Partido, en La Matanza se previeron dos jefes de Municipio. 9 Personal: se conformó un equipo total de 58 personas (originalmente de 8). Software: se instaló una base Oracle para los datos GIS, se renovó todo el soft GIS migrando al ArcGis 9.3.1. Hardware: se instalaron 3 servidores, 55 PC, 8 impresoras láser, 6 impresoras láser color, 3 plotters, 1 fotocopiadora de planos, 1 UPS, 1 Unidad de Backup, todo en red. Servicios: se contrataron los servicios de Impronta y UBA para automatizar todos los procesos a través de programación y desarrollos a medida de las necesidades de la Provincia. Esto incluyó el soporte y asistencia técnica en las nuevas aplicaciones. Capacitación: se capacitó a todo el personal en ArcView, ArcInfo, ArcGis, y en las aplicaciones desarrolladas a medida. Modelo de trabajo GIS: se cambió el modo de manejo de datos, pasando a un modelo de datos cartográfico centralizado con acceso multiusuario en Oracle. Lugar de trabajo: se trasladó la oficina del Departamento Cartografía Estadística de la Torre II a una sala mucho más grande y confortable en el Ministerio de Economía, que permitió el cambio de escala de personal y volumen de trabajo. Las tareas cartográficas se iniciaron en el mes de marzo de 2010, y desde sus inicios presentaron diversos desafíos relacionados con la tecnología, los recursos humanos y los procedimientos de trabajo para proveer del material necesario para el operativo censal del 27 de octubre de 2010. Dados los plazos, no resultaba factible diseñar la especificación detallada de cada uno de los problemas a resolver para que luego sea tomada por un tercero que aporte una solución a cada problema como si fueran compartimentos estancos. Sino que se requería una solución integral que abarcara no solo cada una de las etapas sino que hiciera ágil el paso de una etapa a la otra. Adicionalmente, desde el principio se sabía que muchas decisiones se iban a tener que tomar sobre la marcha sin contar con los plazos habituales de testeo y análisis exhaustivo. Ante los desafíos planteados, la manera de resolverlos fue mediante la interacción entre la DPE, Impronta y la UBA. 10 La DPE tuvo a su cargo el gerenciamiento integral del proceso, la especificación funcional de los requerimientos, y la asignación de la infraestructura y recursos humanos necesarios. La empresa Impronta estuvo a cargo de la coordinación técnica, desarrollo e implementación de las aplicaciones cartográficas, mientras que el equipo de la UBA desarrolló el algoritmo de segmentación automática. Esta estructura, al estar formada por tres actores que provienen de distintas tradiciones y dinámicas como el Gobierno, la Industria y la Universidad fue un desafío en sí mismo respecto a su gestión. El mecanismo de gestión elegido consistió en la presencia permanente de los recursos aportados por Impronta en las oficinas de la DPE junto con reuniones semanales donde se tomaban las decisiones necesarias para realizar ajustes en forma concomitante con el diseño de las aplicaciones. Además de resultar en este caso una forma ágil, permitió adaptar los procedimientos a definiciones que tuvieron que ser tomadas con el proyecto en estado avanzado. Clave para la ejecución del proyecto fue dotar a la DPE de una plataforma de hardware y software GIS de última generación basada en software ArcGIS. Esta plataforma informática significó para la DPE un salto tecnológico de más de 10 años. Durante esta etapa, se entrenó al personal afectado al proyecto y se proveyó un servicio de administración de infraestructura informática GIS denominado GeoDBA. En el siguiente diagrama se detalla la arquitectura informática utilizada. Fig. 1. Arquitectura GIS de la DPE 11 La infraestructura informática incluyó: Wide Area Network (WAN) conectando 134 municipios cargando viviendas a través de la aplicación Web ABM de Listados residente en un servidor dedicado. Red de Área Local (LAN) con 60 operadores GIS accediendo a una base de datos geográfica denominada Geodatabase. Incluyó equipamiento de impresión de alta velocidad. Aplicación Tablero de Control para el seguimiento de las actividades del proyecto. El desarrollo de aplicaciones se realizó sobre diferentes lenguajes de programación, que incluyeron ASP .Net, VB Forms, ANSI C, PL SQL y ArcObjects. 4.2.1 Actualización cartográfica. Durante el operativo de listado de viviendas, una de las tareas de los listadores y jefes municipales era la de realizar la actualización de cartografía en campo sobre los planos de fracción entregados por la DPE. Las modificaciones a registrar eran nuevas calles y manzanas, cambio de nombres de calles existentes, hitos de referencia y nuevas urbanizaciones. En los casos de countries, villas de emergencias o nuevas localidades, se solicitaba al municipio un croquis de detalle o plano catastral que permitiera la actualización de las nuevas manzanas y calles. Para esta etapa se utilizó el software ArcInfo 9.3 GIS para realizar toda la actualización cartográfica original en formato cobertura. Luego se produjo la migración de todas las coberturas existentes al formato geodatabase de ArcGIS en base Oracle. Este cambio de tecnología, demandó tiempo y esfuerzo para concretarse, pero representó una notable mejora en productividad y rendimiento ya que entre otras cosas permitió el trabajo multiusuario, unificó en un servidor y en una base de datos toda la provincia, fue más estable y más seguro. En las zonas urbanas se actualizaron los ejes de calles y manzanas con imágenes satelitales recortadas del Google Earth Pro y georeferenciadas con software GIS (Imágenes Satelitales fecha 2007/2009, Precisión 0.50 m aprox.). Se digitalizaron 269 localidades pequeñas que se encontraban en formato papel, y se realizó el cambio de sistema de referencia a WGS 84 para las 320 localidades que ya estaban digitalizadas. Además, se generaron nuevas coberturas provinciales de fracciones y radios censales. En las zonas rurales se utilizó la base de caminos y parcelas rurales del año 2002, se realizó el cambio de sistema de referencia a WGS 84 para todas las coberturas rurales, y se 12 compatibilizaron las zonas rurales con las zonas urbanas. Adicionalmente, se utilizaron las coberturas de hitos, cursos de agua y escuelas rurales provistas por el IGN a través del INDEC. 4.2.2 Impresión de cartografía de listado Luego de la actualización cartográfica, se confeccionaron e imprimieron todos los planos de las localidades para utilizar en el operativo de listado de viviendas (aproximadamente 2.500 planos). En cada plano de fracción o en un croquis adjunto los listadores volcaron las modificaciones cartográficas que hallaron. 4.2.3 Vinculación de listado A medida que los listados se iban cargando en los municipios se realizaba la vinculación de los datos al GIS, se corregían inconsistencias, se detectaban modificaciones y se reportaban faltantes. En los casos en que la carga se realizó sin errores y la cartografía no tuvo modificaciones la vinculación de datos fue directa y automática. La vinculación automática representó el 75% de las manzanas, quedando el 25% restante para una vinculación asistida. Se utilizó una clave de lado única para cada lado de manzana de la Provincia, como elemento fundamental en el proceso de vinculación. 4.2.4 Redimensionamiento de fracciones y radios censales Producto de lo restringido del cronograma, la redimensión de fracciones se realizó con anterioridad a la finalización del listado y en forma previa a la redimensión de radios, de acuerdo a datos y proyecciones elaboradas especialmente para este fin. Se utilizó un método manual con software ArcGis. De esta forma se redimensionaron 527 fracciones, conformando un total de 2.184. Para la redimensión de radios se utilizó un software desarrollado al efecto en base a ArcGis 9.3.1. Con él se redimensionaron los radios censales que superaban las 500 viviendas y los radios que superaban las 40 manzanas. Se renumeraron los radios redimensionados y los radios de las fracciones nuevas. Además se renumeraron todas las manzanas involucradas en los radios resultantes. El resultado fue un total de 19.577 radios. 13 4.2.5 Segmentación El desafío más importante del proyecto estuvo relacionado con el proceso de segmentación de viviendas. Por lo tanto, se determinó que ineludiblemente debería realizarse de manera automática. El área de trabajo de cada censista se denomina segmento, que constituye un “conjunto de: a) una porción de territorio, b) las viviendas que en ella se asientan, y c) un promedio estimado de entrevistas a realizar durante el tiempo establecido para el operativo censal” (INDEC, 2010). La segmentación es la tarea que permite subdividir el radio censal en unidades operativas menores llamadas segmentos sujeta al cumplimiento de ciertas condiciones de contigüidad y exhaustividad10. Se realiza a nivel de cada radio censal, con características diferentes según el tipo de radio: urbano, rural o mixto. Este procedimiento de segmentación, habitualmente se realiza manualmente o utilizando rudimentarios algoritmos de asignación. Las restricciones en los plazos que debían cumplirse exigían diseñar mecanismos alternativos a los utilizados en otras oportunidades. Por lo tanto, se determinó que en esta oportunidad debería realizarse de manera automática. Experiencias anteriores, y particularmente del Censo 2001, indicaban que la DPE necesitaba emplear 6.000 horas hombre, el equivalente a 25 operadores trabajando full-time durante 25 días, para realizar la segmentación de manera manual, y esto sin considerar los tiempos de entrenamiento, soporte y los riesgos asociados a los procesos manuales de asignación. Fig. 2. Esquema de segmentación: lados de manzanas asignados a censistas. Cada color corresponde a un segmento asignado a un censista. 10 Federico Ferella, como Coordinador del Departamento de Cartografía Estadística, aportó la descripción de los procedimientos que tradicionalmente se realizaban de manera manual y que sirvieron de base para el desarrollo de la segmentación automática. 14 La cantidad de viviendas asignada a cada segmento, comúnmente denominado “tamaño” del segmento, varía en función de la cantidad de preguntas del formulario censal a utilizar, el nivel socioeconómico de la población, la presencia de familias numerosas y las particularidades de contexto geográfico. Típicamente el “tamaño” de los segmentos varía entre 12 y 40 viviendas. De acuerdo a la metodología establecida por el INDEC para el CNPHV 2010 hubieron dos tipos de formularios: un Formulario Ampliado (A) para ser aplicado en aquellas localidades con una población inferior a 50.000 habitantes y en el 10% de los segmentos de localidades con 50.000 habitantes o más; y un segundo Formulario Básico (B) para aplicar en el 90% de los segmentos de localidades con 50.000 habitantes o más. De esta manera, y debido a la diversidad provincial en los 134 Municipios y considerando que en esta Provincia el territorio de cada Municipio o Partido está conformado por una localidad cabecera, el campo circundante y localidades menores, existieron distintas situaciones: Todo el Municipio con muestra. Todo el Municipio sin muestra, por no tener localidades que superen los 50.000 habitantes. Municipios con localidades con muestra y resto de localidades sin muestra. En un segundo nivel existió diversidad de densidad de viviendas en cada partido, por niveles altos de pobreza, familias numerosas (información base proveniente del Censo 2001) asentamientos y villas de emergencia (con información proveniente del Operativo Listado Viviendas 2010). Áreas de country, barrios cerrados y demás urbanizaciones que implicaron establecer diferentes tamaños de segmentos. También el tamaño del segmento en áreas urbanas estuvo condicionado por su ubicación geográfica de acuerdo a la localidad a la que pertenezca, por el hacinamiento en hogares por radio censal según Censo 2001 y por el criterio de selección muestral utilizado. De esta manera, la existencia de diversos tamaños de segmentos en una misma localidad generó mayor complejidad para resolver la asignación de áreas de trabajo a cada censista. En la siguiente tabla se detallan los ocho casos de segmentación utilizados y la cantidad de viviendas (tamaño de segmento). 15 Tabla. 1. Tamaño del segmento según el tipo de localidad a la pertenece cada radio Tamaño de Localidad Hacinamiento en hogares 2001 Country / Villa E. Muestra Formulario Tamaño de Segmento Más 50.000 hab. NO NO NO B e/ 32 y 40 Viv. Más 50.000 hab. NO NO SI A e/ 16 y 20 Viv. Más 50.000 hab. SI NO NO B e/ 26 y 32 Viv. Más 50.000 hab. SI NO SI A e/ 12 y 18 Viv. Más 50.000 hab. NO SI NO A e/ 15 y 25 Viv. Menos 50.000 hab. NO NO NO A e/ 16 y 24 Viv. Menos 50.000 hab. SI NO NO A e/ 14 y 20 Viv. Menos 50.000 hab. NO SI NO A e/ 15 y 25 Viv. A su vez, el resultado de la segmentación debía cumplir con una serie de restricciones de tipo logísticas con el fin de minimizar el recorrido del censista. Fig. 3. Restricciones en la segmentación (1) 16 Fig. 4. Restricciones en la segmentación (2) Fig. 5. Restricciones en la segmentación (3) Fig. 6. Restricciones en la segmentación (4) 17 Fig. 7. Restricciones en la segmentación (5) Fig. 8. Restricciones en la segmentación (6) Fig. 9. Restricciones en la segmentación (7) 18 En el esquema de segmentación es posible partir un lado de manzana, si está compuesto por un número demasiado grande de viviendas o si no hay solución factible sin partirlo. Así, son deseables las siguientes configuraciones, en orden de preferencia: 1. Segmentos compuestos por una o varias manzanas completas. 2. Segmentos formados por lados completos. 3. Edificios completos 4. Pisos de edificios completos. Al momento de planificar la segmentación y habida cuenta de intentos en el Censo 2001 de avanzar hacia una segmentación automática, esta DPE consideró que era la única alternativa posible, enfrentándose así al convencimiento generalizado que la automatización de esta tarea era imposible. Para ello inició una investigación que dio como resultado que se trataba de un problema para el cual sí existía solución (Martin, D. 2001). El problema de segmentación de viviendas puede relacionarse a los problemas de "redistricting11" (Martin D, 2001; Altman M, 1997; Altman M, MacDonald K, McDonald M.P., 2005). Sin embargo, los algoritmos para redistricting existentes no se adaptaban fácilmente al problema particular de segmentación y por lo tanto había que desarrollarlos. Además, no se encontraron evidencias de la existencia de algoritmos automáticos de segmentación en la literatura. El equipo de trabajo de la UBA, conformado por especialistas en optimización, trabajó en el desarrollo de un algoritmo de segmentación automática basado en programación entera. Este algoritmo fue integrado dentro del flujo de trabajo de la DPE dentro de la infraestructura GIS existente, permitiendo que todos los equipos de trabajo actuaran armoniosamente y a máxima capacidad. En el siguiente diagrama se detalla una típica salida del algoritmo de segmentación. 11 Redistricting es el proceso de cubrir completamente un territorio con un conjunto mínimo de N polígonos que satisfagan alguna restricción (por ejemplo que la cantidad de habitantes de cada polígono difiera en menos de un 5%). 19 Fig. 10. Esquemas de segmentación en áreas urbanas y mixtas El éxito del algoritmo de segmentación se basó en la capacidad de resolver, con un mismo modelo de programación entera, situaciones de distribución urbana muy distantes: más de 160 viviendas por manzana, típico caso de “listado”12 manzanas de 40 viviendas: densidad media manzanas con menos de 5 viviendas: baja densidad El algoritmo de segmentación permitió construir automáticamente el 96% de los segmentos urbanos y mixtos de la provincia en aproximadamente 320 hs de procesamiento (menos de un día con un cluster de 15 PCs). Los segmentos restantes se resolvieron manualmente con un programa de segmentación asistida desarrollado al efecto. Como referencia se detalla el modelo de programación entera: max val ( s ) x s sS sujeto a x s 1 v V x s 1 l L 0 x s {0,1} s S sS v sS l Donde: ─ S: conjunto de todos los segmentos posibles s ─ xs: variable binaria que indica si el segmento s es parte de la solución ─ val(s): valuación del segmento s 12 Se denomina “listado” al proceso de segmentar manzanas cuyos lados tienen más viviendas de la capacidad máxima del segmento, resultando en la asignación de N censistas por lado de manzana, incluso dentro de un mismo edificio. 20 ─ V: conjunto de viviendas ─ Sv: conjunto de segmentos que incluyen a la vivienda v ─ L0: conjunto de lados sin viviendas ─ Sl: conjunto de segmentos que incluyen al lado sin viviendas l La función de valuación maximizada en el modelo, toma en cuenta la proporción de lados por manzana contenidos en un segmento. Este valor proporciona una idea de qué tan compacto es el segmento en cuestión, y este aspecto es de alguna manera una buena métrica para comparar los segmentos entre sí. Por ejemplo, un segmento que recorre una manzana completa, tendrá una proporción de lados por manzana de 4 (si la manzana tiene 4 lados) mientras que un segmento que recorre cuatro manzanas visitando sólo un lado por manzana tendrá una proporción de 1. Según los criterios de segmentación definidos, la configuración del primer segmento es más deseada que la del segundo, y esto mismo queda reflejado en la función de valuación propuesta. El modelo de programación entera descripto anteriormente resuelve el problema de segmentación planteado. Sin embargo, cabe aclarar que la cantidad de variables del mismo (i.e., la cantidad de segmentos posibles en un radio) puede resultar intratable en la práctica. Para resolver este inconveniente, se desarrolló un algoritmo que parte desde un conjunto reducido de segmentos S1 S y ejecuta el modelo con dicho conjunto en busca de una solución. Si no se encuentra solución, el algoritmo genera más segmentos y reitera la ejecución del modelo con este nuevo conjunto de segmentos. El algoritmo continúa repitiendo este proceso hasta hallar una solución o bien hasta alcanzar algún límite predefinido de iteraciones. El siguiente pseudocódigo describe el algoritmo implementado: -i 1 - S1 segmentos no excedidos que no cruzan ninguna calle. - Ejecutar el modelo de PE usando los segmentos válidos de S1. - Mientras no haya solución e i < límite de iteraciones hacer - Si+1 Si - Para cada (si, s) en Si S1 hacer - Si (si s) es conexo y no excedido entonces - Si+1 Si+1 {(si s)} - fin si - fin para - Ejecutar el modelo de PE usando los segmentos válidos de Si+1. - i i+1 - fin mientras 21 donde un segmento “no excedido” es un segmento de tamaño no mayor al tamaño máximo permitido (aunque no necesariamente no menor que el mínimo) y un segmento “válido” es un segmento no excedido de tamaño no menor que el mínimo. 4.2.6 Impresión de cartografía para la estructura del operativo Se confeccionaron e imprimieron todos los planos para cada uno de los participantes en la estructura censal: 210.716 segmentos, 19.577 jefes de radio, 2.184 jefes de fracción y 134 jefes de partido. Además se imprimieron para los censistas de viviendas colectivas, todos los planos de radio que incluyeran viviendas de este tipo. Para los rótulos de identificación de cada plano, se diseñó un sistema gráfico cromático que acompañaba e identificaba la cartografía según nivel de estructura, con buena legibilidad de los datos. Se utilizó software GIS con un aplicativo de desarrollo propio que permitió sistematizar todo el proceso de impresión. De esta manera, se imprimieron con procedimientos “en serie” los aproximadamente 240.000 planos utilizados en el operativo. Las planillas resumen para los jefes de radio urbanos (R3) y rurales (R4) como para los jefes de fracción (F3) se confeccionaron e imprimieron automáticamente con un desarrollo a medida, que funcionaba en relación directa con la salida del programa de segmentación. En este caso, se imprimieron 80.000 planillas. 5 Resultados alcanzados Luego de más de 500 meses hombre de esfuerzo, 8 meses de trabajo, y culminando con el operativo Censal del 27 de octubre de 2010, se proveyó en tiempo y forma de todo el material necesario para la ejecución del Censo Nacional de Población, Viviendas y Hogares en la provincia de Buenos Aires. Durante el proyecto, se lograron las siguientes metas: Confeccionar la Cartografía Actualizada de134 partidos residente en una única base de Datos Multiusuario del Tipo Geodatabase. Proveer a la DPE de una plataforma tecnológica GIS moderna y escalable. 5.500.000 unidades listadas durante el operativo precensal. Listados de viviendas y cartografía vinculados en una única base de datos. 600 fracciones censales redimensionadas. 2.600 radios censales redimensionadas. 22 2.900 radios rurales segmentados manualmente13 con 10.300 segmentos. 16.700 radios urbanos y mixtos segmentados automáticamente con 200.500 segmentos. 6 Más de 300.000 mapas y reportes impresos14. Material para censista, jefe de radio y fracción entregados en tiempo y forma. CONSIDERACIONES FINALES La realización de las tareas precensales para el Censo Nacional de Población, Hogares y Viviendas 2010 de la provincia de Buenos Aires representó un enorme desafío: conformar un equipo multidisciplinario, con alta disponibilidad y gran capacidad para desarrollar y ejecutar en tiempo récord todas las tareas necesarias para proveer al operativo del material censal necesario. Particularmente se necesitaban acortar los tiempos asociados de todos los procesos para poder alcanzar los objetivos para el 27 de octubre de 2010. Todo lo realizado fue coordinado y dirigido por la DPE lo que constituye una innovación al haber actuado coordinadamente en tres puntos: la vinculación con los municipios para la actualización cartográfica y listado de viviendas, con la industria informática respecto al soporte y desarrollo de la actualización de la plataforma GIS y con la universidad en cuanto al desarrollo e implementación del algoritmo de segmentación automática de viviendas. Se logró el objetivo principal: poder salir a campo a las 8 de la mañana del 27 de octubre de 2010 con todo el material preparado, chequeado y distribuido, lo que permitió llevar adelante el operativo censal de manera eficaz. Adicionalmente el enorme esfuerzo de gestión realizado que implicó la organización presupuestaria, administrativa, logística y técnica, permitió otros logros: que la Provincia cuente con toda la cartográfica digital actualizada en una plataforma que permite administrarla con mayor eficiencia y, por primera vez, con un listado de viviendas urbanas completo y vinculado cartográficamente, a partir del cual realizar cualquier tipo de encuesta a hogares en el territorio provincial 13 14 Los radios rurales no estaban incluidos en el algoritmo de segmentación. Si se apilaran por la base todas las resmas de papel utilizadas, se alcanzaría la altura de un edificio de 10 pisos. 23 7 AGRADECIMIENTOS Queremos agradecer especialmente a todas las autoridades del Ministerio de Economía de la provincia de Buenos Aires que entendieron nuestras urgencias y compartieron nuestra posición metodológica, respaldaron nuestras decisiones y fueron parte de las negociaciones con el nivel nacional y municipal. A todo el personal de la DPE, haya participado o no en las tareas, a toda la estructura de los operativos de listado, capacitación, y relevamiento, así como a las personas involucradas en las tareas informáticas y cartográficas. A las 15.625.084 personas que respondieron. 24 8 Referencias Aliaga F, Bonomo F, Delle Donne D, Durán G, Marenco J, Sotelo R, 2011. Sistema de Información Geográfica como apoyo a las actividades del Censo Nacional de Población, Hogares y Viviendas 2010 de la provincia de Buenos Aires. Anales de las Jornadas de Vinculación Universidad-Industria. 40JAIIO - JUI 2011. Altman M, 1997. Is Automation the Answer: The Computational Complexity of Automated Redistricting. RC and Law Technology Journal, 23(1), pp: 81-141. Altman M, MacDonald K. and McDonald M.P., 2005. From Crayons to Computers: The Evolution of Computer Use in Redistricting. Social Science Computer Review, 23(3), pp: 334-346. Delle Donne D, Durán G y Marenco J, 2011. Solving the segmentation problem for the 2010 Argentine census with integer programming. Electronic Notes in Discrete Mathematics, en prensa. doi: 10.1016/j.endm.2011.05. Departamento de Cartografía y SIG-INDEC, 2010. Manual de Segmentación. INDEC, 2010. Censo Nacional de Población, Hogares y Viviendas 2010. Total del país. Resultados provisionales. Martin D, 2001. Developing the Automated Zoning Procedure to Reconcile Incompatible Zoning Systems. , Proceedings, 6th International Conference on GeoComputation, held at Brisbane, Australia, 24-26 September 2001. CD-ROM Publication. Presentación “Memorias del proyecto GIS para el censo 2010”, Fernando Aliaga, diciembre de 2010. 25