Introducción del Periodismo de Datos

Transcripción

Introducción del Periodismo de Datos
Introducción al
Periodismo de Datos
Por Sandra Crucianelli
[email protected]
www.facebook.com/sandracrucianelli
www.facebook.com/periodismodedatos
@spcrucianelli
¿Qué hay de nuevo?
Muckrakers
Jacob Riis: La estadística asociada a
la imagen como elementos de denuncia
¿Cómo vive la otra mitad?
Un libro clave
Philip Meyer
Exploró las causas de los disturbios raciales en la década de 1960
http://www.sampler.isr.umich.edu/2011/featured/revealing-theroots-of-a-riot/
Investigación Social aplicada a la
Investigación Periodística
Investigación Cualitativa:
I. Estudio de Casos
II. Grupos Focales
III. Análisis del Discurso

Investigación Cuantitativa
I. Investigación Descriptiva (censo)
II. Investigación Inferencial (encuestas)

Encuentre la diferencia

Periodismo de Investigación: Sobre la base
de la iniciativa del reportero, se descubre una
verdad social importante que alguien intenta
mantener en secreto

Periodismo de Precisión: Indagar por
iniciativa propia, un conjunto de datos
difíciles de obtener y más complejos de
verificar o interpretar, con los que se pone en
evidencia una realidad oculta que no se quería
revelar.
Periodismo Asistido por Computadora

I.
II.
III.
IV.
PAC: introduce el uso de hojas de
cálculo, como herramienta para procesar
datos
Clarence Jones (Miami Herald) , 1969, buscó patrones en el
sistema de justicia penal.
David Burnham (The New York Times), 1972, expuso
discrepancias en las tasas de delitos denunciados por la policía
Elliot Jaspin (The Providence Journal), 1986, usó bases de datos
para denunciar malos historiales de conducción y antecedentes
penales de choferes de transporte escolar
Bill Dedman (The Atlanta Journal-Constitution), Pulitzer 1988,
“El color del dinero”: abordó el tema de la discriminación racial
en la otorgación de préstamos hipotecarios
América Latina
¿Periodismo de Datos?
Todo el periodismo se hace a partir de datos: Cierto
 Cualquier cosa que se diga del Periodismo de Datos
hoy, no es definitiva
¿Qué hay de nuevo?
 Casi todo se expresa con números
 En el mundo digital, tenemos capacidad para acceder
a grandes cantidades de datos
 En el proceso, los datos no se transforman; la única
transformación que hay es desde lo abstracto hacia lo
tangible
 Visión Científica: el periodista de datos reporta sus
métodos, de modo que otros podrían replicar el
proceso y llegar a la misma conclusión

Del PAC al PAH
Periodismo asistido por Hackers
Grandes conjuntos de datos: Big Data




Búsqueda de Datos
Extracción de Datos
Procesamiento de Datos
Visualización de Datos
El programador se incorpora al equipo
periodístico
Periodismo de Datos
Manual Colaborativo (traducción al
español)
http://interactivos.lanacion.com.ar/man
ual-data/
1) Salarios de 667.000 empleados públicos
2) Crearon una aplicación incorporando un buscador de sueldos por
nombre, oficina gubernamental, año, categoría.
3) Socializaron la información
http://www.texastribune.org/library/data/government-employee-salaries/
¿No tenemos ningún dato?








¿Realizó el diagnóstico?
Búsqueda avanzada
Búsquedas reversas
Por defecto, restringiendo dominio, formatos
y/o fechas
Búsquedas geolocalizadas
Lectura de URLs y recorte de dominio
Bases de Datos interactivas
Monitoreo de redes sociales
http://www.google.com.ar/advanced_search
•Explorar la Web Profunda
•Usar el Académico
•Buscar en Grupos, Libros e Imágenes
http://datos.bancomundial.org/
Herramientas Analíticas (software de descarga gratuita)
1.Análisis económico
2.Medidas de Pobreza
3.Cruce de variables para Pobreza
4.Mapeo de pobreza
Monitoreo en redes sociales: ¿de qué
habla la gente?
www.socialmention.com
www.48ers.com
www.twitterfall.com
Pro Pública: Datos cualitativos se “cuantifican”
-Vecinos expresaron curiosidad, vía Twitter, por recibir mails de campaña
de Obama, pidiendo distintos montos en donación y los hicieron públicos
-En 190 mensajes, encontraron 6 variaciones del contenido
-http://www.propublica.org/article/reverse-engineering-obamas-message-machine
Ver no es lo mismo que acceder
Formatos deberían ser reutilizables
¿Cómo extraer datos cuando no están accesibles?
Un PDF de un JPEG
Datos de campañas publicidad oficial
En el sitio de la Jefatura de Gabinete de Ministros
http://www.jgm.gov.ar/paginas.dhtml?pagina=196
Scraping de Datos
Programas informáticos o técnicas de programación
cuya finalidad es la de extraer datos (“raspar”) para:
1. Obtener datos estructurados (De PDF a Excel)
2. Leer datos de imágenes fotográficas para convertirlos
en textos o tablas (OCR: Reconocimiento Óptico de
Caracteres)
Secuencia:
I. Recoger (Ruby: lenguaje de programación)
II. Procesar (Google Refine: para limpiar y organizar los
datos)
III. Almacenar (Panda Project: repositorio para compartir
bases de datos)
Minería de Datos: detecta patrones
sobre un gran conjunto de datos
Proceso






Búsqueda de relaciones entre variables
cualitativas
Búsqueda de relaciones entre valores, dentro
de una base de datos
Establece relaciones de jerarquía entre los
datos
Calcula proporciones (3 de cada 10)
Calcula frecuencias (veces que un mismo dato
se repite o combinaciones de datos que se
repiten)
Datos abstractos Datos inteligentes
Caso Diario La Nación (Argentina)
http://www.transporte.gov.ar/content/subsidios-sistau/
13 meses de trabajo, 285.000 documentos: estudio de la progresión en los pagos
Finalista Data Journalism Award 2012
http://blogs.lanacion.com.ar/projects/data/subsidies-for-the-bus-transportation-system-datajournalism-project-in-argentina-lanacion/
Aplicaciones Sociales
Where does my money go?
¿A dónde van mis impuestos?
Iniciativas en Argentina

www.gastopublicobahiense.org

www.mapa76.info

www.quepasariachuelo.org.ar

http://www.malvinastreinta.com.ar/
Muchas Gracias…
[email protected]
www.facebook.com/sandracrucianelli
www.facebook.com/periodismodedatos
@spcrucianelli

Documentos relacionados