Entrevista realizada por Juantxo Cruz en enero de 2015 a Ben Welsh, periodista de datos y database producer en LA Times.
Ben Welsh y ‘The Data Desk’ de Los Ángeles Times
THE DATA DESK
¿Qué es el Data Desk de Los Ángeles Times?
Ben: Yo trabajo en LA Times en California en un equipo denominado ‘The Data Desk’.
‘The Data Desk’ comenzó más como una idea que cómo una organización estructurada, se trata de un lugar común para trabajar con datos y se extiende entre varios departamentos de Los Ángeles Times, con gente que trabaja en el sitio web, gente que trabaja en el periodismo de investigación, gente que trabaja en el departamento de gráficos.
Entonces, es como una zona de conexión entre los periodistas, un punto de encuentro. ¿Cómo se organiza este flujo de conexiones?
Ben: Para mí lo importante es la capacidad de crear relaciones entre los grupos que componen la organización, personas que están interesadas en utilizar los datos para encontrar y contar historias que nos serían posibles de otra manera. Después vienen los ajustes de organización para ver quién va a hacer qué y o quién va a escribir la historia. Lo importante es la idea de utilizar los datos para hacer que las historias aparezcan y encontrar las personas en la organización que estén de acuerdo con ello.
HERRAMIENTAS DE LOS PERIODISTAS
¿Cuáles son las principales herramientas que utilizáis en ‘The Data Desk’?
Ben: En nuestro equipo tenemos desarrolladores web, que trabajan todo el día con editores de texto y entornos de código abierto para construir sitios web, hasta personas que son más analistas y reporteros de investigación que utilizan Microsoft Excel y otros programas que hacen estos objetivos más sencillos sin necesidad de programar. Así es que es muy variado, dependiendo de la persona y en lo que esté trabajando tú puedes utilizar cualquier herramienta.
Y tú, ¿cuál es la herramienta que dominas mejor?
Ben: Personalmente, yo prefiero el código abierto por la calidad es muy alta, el coste es muy bajo, un coste cero, y me permite conseguir todo lo que quiero sin coste alguno.
(Ver aquí algunas de sus aplicaciones)
EL EQUIPO DE DATOS
¿Cuántas personas participan en el equipo? ¿Son todos periodistas?
Ben: Somos alrededor de 500 personas especializadas en diversas tareas y en trabajando con datos. Sí, somos periodistas. Escribimos historias además de código y trabajamos con los reporteros para darle forma a las historias y contarlas.
PROGRAMACIÓN Y PERIODISMO
Tus aplicaciones muestran una complejidad técnológica importante. ¿Has estudiado ingeniería o alguna rama tecnológica especializada?
Ben: No tengo una educación formal en computación, mucha gente sabe programar, pero yo empecé a interesarme por los ordenadores en la escuela secundaria cuando era joven.
Nunca fue un objetivo para mi ser programador, pero estaba interesado en programación como usuario y entonces cuando empecé a trabajar como un periodista tradicional enseguida vi las posibilidades que tenía para encontrar historias con unos conocimientos mínimos de programación.
¿Cuáles eran tus conocimientos de programación cuando empezaste en el mundo del periodismo de datos en 2007?
Ben: Estudié en la Universidad de Misuri en EEUU. Allí había un grupo especial, llamado NICAR – ‘National Institute por Computer Assisted Reporting’-. No era un grado o un programa educativo. Es un grupo profesional dentro de la Universidad que realiza sesiones de entrenamiento con los periodistas para aprender programación. Ahí trabajé como estudiante graduado para ayudar a la organización. Tenía el tiempo, la gente y la ayuda para ser convertirme en un programador profesional.
BASES DE DATOS Y PERIODISMO
Afirmas que, trabajando con bases de datos, si haces las cosas bien, no se puede mentir. ¿Cuáles son los errores más comunes trabajando o entrevistando las bases de datos?
Ben: No entender cómo fue organizada o cómo fue creada la base de datos y cuáles son sus puntos débiles. Todos los procesos de creación de bases de datos tienen problemas, fallos, agujeros, puntos que hay que revisar, que pueden hacer que el análisis sea equivocado. Si la base de datos tiene duplicados y no tienes cuidado con esto, si los datos son alterados y no te das cuenta, si la persona que la creó falló en la forma de almacenar los datos y no te das cuenta o haces una mala interpretación.
¿Y en cuanto a la estadística?
Ben: Tu operación matemática puede ser perfecta cuando se hace la suma, pero tu interpretación, en la declaración que puedas hacer, quizás sea equivocada, excesiva o malinterpretada.
También son importantes las fuentes…
Ben: Tienes que conocer tus datos, cómo se consiguieron, cuáles fueron las observaciones antes de hacer una afirmación.
PYTHON Y ROBOTS COMPUTACIONALES
Estáis programando robots con el lenguaje Python para construir bases de datos y encontrar historias. Cuéntanos más sobre esto.
Ben: Un ejemplo puede ser los arrestos realizados de la Policía de Los Ángeles. Todos los días por la mañana la policía envía un correo electrónico con la lista de las personas que han detenido el día anterior. Tenemos una secuencia de comandos, un robot si lo quieres llamar así, en realidad es un programa escrito con Python y, que para ser honesto, es muy modesto, que descarga el fichero y lo incorpora a la base de datos para hacerlo accesible a los reporteros y utilizarlo en búsquedas e investigaciones.
También pregunta automáticamente a los datos sobre una serie de cuestiones, como por ejemplo una serie de profesiones, como políticos o productores de cine. Si han sido arrestados, el programa manda un correo con un aviso a todo el mundo. Si el arresto ha sido consecuencia de un asesinato o se trata de un acontecimiento grave, estos sucesos tienen una señal especial en el programa para avisarnos.
¿Son como máquinas que hacen el trabajo sucio…?
Ben: Lo que realmente estás haciendo cuando escribes este tipo de código, la secuencia de comandos, lo que buscas son las preguntas que los periodistas harían siempre a esta base de datos.
Ben Welsh estuvo en Madrid el pasado mes de diciembre asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.