un zettabyte de motivos para hablar de datos y desarrollo

Transcripción

un zettabyte de motivos para hablar de datos y desarrollo
U N ZE T TABY TE D E M OTI VO S
PAR A HABL AR D E DATO S Y D E S AR RO LLO
Septiembre de 2015
Bogotá D.C., Colombia
Datos en todas partes
Datos sobre los datos
Acordado el texto de la Agenda Global 2030, la atención
se mueve de la negociación política de prioridades
para el Desarrollo Sostenible hacia los desafíos de
implementación de los compromisos asumidos por
los países en el seno de las Naciones Unidas.
De acuerdo con IBM el 90% de todos los datos que
generan dispositivos como smartphones, tabletas,
vehículos y electrodomésticos conectados nunca
se analiza. ¿Es eso un problema realmente? ¿Qué
información relevante estamos perdiendo?
A pesar de las muchas opciones que plantea este
escenario parece existir un cruce de caminos ineludible:
la importancia de los datos.
“dato” tiene su origen en el vocablo latino
“datum”, lo dado. Originalmente expresaba
precisamente lo que los objetos dan a quienes
los estudian pero, como sostuvo Jensen ya en
1950, esto refleja un “desafortunado accidente
1
de la historia” en tanto los datos no son dados
por los objetos sino que son tomados de
ellos por alguien que los investiga. Lejos de
referir a una situación pasiva requieren de un
compromiso activo con ellos.
No se trata de un tema estrictamente nuevo: el uso
de datos y estadísticas ha acompañado a los debates
sobre desarrollo desde sus inicios. Lo realmente
novedoso es la forma en que hoy somos capaces de
relacionarnos con los datos. Lejos de ser algo ajeno
o extraño, propio del campo del estudio científico,
los datos son hoy la realidad cotidiana de millones
de personas alrededor del mundo que se conectan a
internet, hablan desde sus teléfonos móviles, siguen
una u otra ruta de regreso de casa al trabajo.
Señalar esto es de particular importancia hoy, cuando
los datos parecen generarse solos y por todas partes.
No es así. Todos ellos tienen un origen detectable
y solo se vuelven de valor cuando son activamente
apropiados y puestos en función.
En cierta forma podría decirse hoy que “somos datos”,
una afirmación que puede resultar incómoda en tanto
expone los riesgos asociados a nuestra realidad
cotidiana.
El Data Deluge (avalancha de datos) de que nos
2
hablaba The Economist es en realidad un Data Ocean
(océano de datos) en el cual sumergirnos. Se trata, vale
aclararlo, de un océano muy amplio: según se estima,
solo en el año 2013 la población mundial ha generado
entre 4 y 5 Zettabytes de información. Para entender
lo que eso significa podemos pensar que, según lo
estima Cisco, en 2016 toda la red de internet entre
1984 y 2015 puede almacenarse en 1.3 Zettabytes.
La denominada (R) evolución de Datos está aquí y ha
llegado para quedarse. Como toda herramienta no es
buena ni mala sino que asumirá el carácter que se
otorgue a su uso, la particularidad que tiene es que
una de las vías para asegurar el control sobre su
utilización es abrirla tanto como sea posible.
1 Ver Conceptualising Data, Pág. 2.
2 The Data Deluge, artículo publicado en The Economist, Febrero 25, 2010.
www.cepei.org
2
Del Megabyte al
Zettabyte
1000
1GB
1000
1PB
MEGABYTES
TERABYTES
1000
1TB
1000
1EB
GYGABYTES
PETABYTES
1000
1 ZETTABYTE (1ZB)
EXABYTES
Fuente: Elaborado por CEPEI con base en: The Dawn of the Zettabyte Era 3
Se trata mucho más de una posibilidad que de una
amenaza, tal como resulta de la afirmación que hace
el Grupo Asesor de Expertos Independientes del
Secretario General sobre la Revolución de los Datos
para el Desarrollo Sostenible en su informe Un mundo
que cuenta. Movilización de la revolución de los datos
para el Desarrollo Sostenible, cuando sostiene que
“los datos son el alma del proceso de adopción de
decisiones y la materia prima para la rendición de
cuentas”. ¿Alguien cree posible avanzar hacia mejores
niveles de desarrollo decidiendo políticas sociales
en una ruleta?
miseria, del hambre, entre otros) necesita de datos y
de personas preparadas para comprender y procesar
una cantidad cada vez mayor de ellos.
El desafío es enorme y abre la necesidad de una
“alfabetización de datos” que permita operar con ellos
no solo a los expertos y científicos de datos sino a
la población en general. ¿Quién sino el conjunto de
las personas debería poder comprender y analizar
las rendiciones de cuentas que los datos habilitan?
La (R) evolución de Datos no cambiará al mundo por
sí sola, pero la construcción de un mundo en que las
personas puedan vivir en libertad (del miedo, de la
3 Publicado por Thomas Barnett, Jr. 2011.
3
Un Zettabyte de motivos para hablar
de datos y desarrollo
¿Big Data? ¡Data
Revolution!
Para estos Zettabytes de información, tenemos un
término más sencillo: Big Data (Macrodatos). Este
término ha sido definido de maneras diferentes
para referirlo tanto al cada vez mayor volumen de
información que generamos las personas a través
del uso de tecnologías digitales, a las nuevas
tecnologías y métodos hoy disponibles para analizar
conjuntos enormes de datos que originalmente no
fueron elaborados para su análisis y a la capacidad
disponible para convertir cantidades gigantes de
datos en información que pueda utilizarse para
la formulación de políticas orientadas hacia el
Desarrollo Sostenible.
Volumen de
los Datos
Velocidad de
producción
y gestión
3V
Una perspectiva particularmente atractiva para nosotros
es la de entender el Big Data como “la capacidad de
la sociedad de aprovechar la información de formas
novedosas, para obtener percepciones útiles o bienes
4
y servicios de valor significativo” .
A través de las posibilidades que se abren con el Big
Data es posible desde mejorar tratamientos médicos
hasta establecer estrategias exitosas para equipos de
fútbol, definir los mejores momentos para comparar
alimentos ahorrando dinero o aumentar los niveles de
seguridad de mecanismos antirrobos; pero lo que es
más trascendental aquí es que permite también mejorar
la salud, el cuidado del medio ambiente, reducir el
hambre y aumentar los niveles de seguridad a escala
social. Cualquier parecido con la Agenda 2030 no es
mera casualidad sino demostración de la importancia
que pueden llegar a tener los datos para que seamos
exitosos en su implementación.
Variedad de
los Datos
Visión clásica del Big Data
Por otro lado, el ya mencionado informe Un mundo que
cuenta hizo popular la referencia más breve a la (R)
evolución de Datos cuyo sentido se comprende mejor
reemplazando las “Tres V” por las “Tres C” de crumbs
(migajas, en inglés), capacidades y comunidades.
La visión clásica sobre el Big Data estaba dada en
las TresV, tal como se muestra a continuación:
4 tal como los proponen Viktor Mayer-Schönberger y Kenneth Cukier en su
libro Big Data, la revolución de los datos masivos.
www.cepei.org
4
Las 3C: nuevo enfoque sobre Big Data y (R) evolución de Datos
Migajas de
información
Rastros digitales que vamos dejando con nuestras actividades y que asumen
la forma de datos estructurados y listos para su procesamiento
Capacidades
Herramientas y métodos para tratar con los datos
Comunidad
Inclusión de actores individuales e institucionales que tradicionalmente han
estado al margen de las esferas de la toma de decisiones y la investigación
y hoy hacen parte del equipo de la (R) evolución de Datos, entre ellos cada
uno de nosotros con nuestras actividades diarias.
Fuente: Emmanuel Letouzé, Big Data and Development. An overview
De esta manera el concepto de (R) evolución de Datos
es más amplio que el de Big Data por la consideración
de más variables en su definición5: “La revolución de
los datos es una explosión en el volumen de datos, la
velocidad con que se producen los datos, el número
de productores de datos, la difusión de los datos y
la gama de cosas en las que se encuentran datos”.
El concepto de (R) evolución de Datos tiene la ventaja
de volver a dar a las personas un rol protagónico no
solo como usuarios de datos, sino como sus hacedores,
en el sentido que dábamos a los datos al comienzo
de este trabajo, no como algo dado por el objeto sino
como algo intencionalmente tomado a partir de él en
una actitud proactiva de descubrimiento.
LOS MOTORES DE LAS REVOLUCIÓN DE DATOS
GOBIERNO
ABIERTO
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000
0000000000000000000000000000000000
MEGAS
DATOS
ACCIÓN
CUIDADANA
Fuente: Elaboración CEPEI
5 Tal como aparece en The data revolution. Finding the missing millions,
documento elaborado por ODI, 2015.
5
Un Zettabyte de motivos para hablar
de datos y desarrollo
Posdata: La humanidad
de los datos
• Las oficinas de estadística tienen competencia y
estatus limitados a nivel nacional.
El último punto señalado es de la mayor importancia:
la (R) evolución de Datos es, ante todo, una evolución
en y desde las personas que se apropian de ellos y
los utilizan asignándoles valor social y finalidades,
combinándolos para convertirlos en información y
utilizando esa información para lograr ciertos fines.
• Los datos no se divulgan ni se usan adecuadamente
• El potencial de las Tecnologías de la Información
y las Comunicaciones no se ha aprovechado al
máximo
• El diseño y gestión de procesos estadísticos son
insuficientes.
“La información es poder”, se repite hoy como un
mantra, pero eso es cierto solo en la medida en que
las personas pueden acceder a ella, comprenderla
y utilizarla. Empoderar a las personas en tiempos
de la (R) evolución de Datos y el Big Data implica
trabajar en una alfabetización de datos que evite la
aparición de una nueva división: la brecha de datos.
Los datos ya son parte del desarrollo no solo como
base para la toma de decisiones sino en sí mismos,
como factores de promoción de las capacidades y
libertades humanas.
• La ayuda técnica y económica no está correctamente
adaptada a las prioridades nacionales
• Los países pagan un coste muy elevado por la
gestión de la ayuda al desarrollo
• La coordinación global de los sistemas nacionales
de estadística es problemática.
Tal como lo afirma la naciente Alianza de Datos para
el Desarrollo Sostenible, iniciativa multi-actores que
tiene por objetivo movilizar y coordinar las acciones
e instituciones requeridas para cerrar las brechas
de información, potencializando la innovación y el
compromiso con la calidad de datos, “La Agenda 2030
ofrece una oportunidad a los gobiernos y ciudadanos
de revisar sus sistemas estadísticos, así como su
administración y el uso de los datos para el desarrollo
sostenible”.
En la muy limitada mirada que impone nuestro actual
interés en ella como posibilitadora de nuevas y
mejores decisiones orientadas al desarrollo -y, más
particularmente, a la implementación de la Agenda
2030- la nueva realidad es todavía una promesa que
podrá o no ser concretada pero de ninguna forma
negada: la (R) evolución de Datos ya está aquí y
es tan real como el texto que usted está leyendo.
Simplemente, no podremos cumplir los Objetivos de
Desarrollo Sostenible (ODS) planteados en esta Agenda
si no contamos con datos confiables y de calidad, y
técnicas innovadoras de recolección, análisis y difusión
de datos que permitan la toma de decisiones basada
en evidencias reales.
Hoy en día, contamos con la tecnología, el conocimiento,
y el recurso humano disponible para superar estos
obstáculos, fomentando así nuevas alianzas que
tiendan a la colaboración y así poder explotar el
potencial de cada uno de los actores involucrados no
solo en la (R) evolución de Datos, sino en el Desarrollo
Sostenible. El Zettabyte de motivos que tenemos para
hablar de datos y desarrollo debe convertirse en un
Zettabyte de acciones e iniciativas encaminadas a
poner a los datos al servicio del Desarrollo Sostenible.
La gigantesca cantidad de datos que hoy están
disp o nible s n o se traduc e dire ct a m ente en su
posibilidad de utilización ni en una excelente calidad
de todos los datos. Esta situación evidencia una serie
de obstáculos comunes6 :
6 Planteados por París 21 en “Guía para una Revolución de Datos dirigida
por los países”
www.cepei.org
6
Contacto
Philipp Schönrock, Director
[email protected]
www.
.org
Javier Surasky, Coordinador de Investigación y Análisis
[email protected]