DATA: La oportunidad del análisis y la visualización de datos

Out of Sight, Out of Mind, pitchinteractive.com

Texto publicado en UNIR Revista el 28 de enero de 2014.

Sin duda, el tratamiento de los datos se ha convertido en una poderosa herramienta en todos los frentes del mundo de la comunicación. ¿De dónde salen todos estos datos? ¿Quién está detrás de ellos? Podemos pensar que la ciencia de los datos la desarrollan increíbles mentes pensantes de los departamentos de Ingeniería y Ciencia Computacional en las más importantes compañías de tecnología. Y por un lado es así. Los ingenieros en computación, los estadísticos y los matemáticos han encontrado un nuevo continente en el desarrollo de aplicaciones que manejan millones de datos. Es lo que se conoce como ‘Big Data’. Sus trabajos no deben quedarse en el manejo de las cifras: los números hay que convertirlos en algo que se pueda consumir.

Hablamos de la visualización de los datos a través de lenguajes de programación. El principal lenguaje de programación del lado del cliente e implementado por todos los navegadores (Chrome, Safari, Explorer…) es JavaScript. Así, el desarrollo de este lenguaje en los últimos años ha disfrutado de una evolución exponencial. Cada día nacen nuevas librerías del lenguaje para tareas de lo más diversas y especializadas.

Para la visualización de datos, la librería más dinámica y estructurada para la visualización de cantidades se llama ‘Data-Driven Documents –D3–’. Estas dos letras, D3, están de moda entre las empresas que se dedican a la presentación de datos en el navegador. Buscan ‘chicos D3’: Urgente. Obviamente, se trata de un perfil tecnológico; una persona que sepa programar, que tenga un buen conocimiento de Javascript y controle los lenguajes de la World Wide Web moderna (HTML5) y sus hojas de estilo (CSS).

Sin embargo, ser un gran programador no garantiza ser un buen contador de historias. Y aquí se abre la gran oportunidad para los periodistas en cualquiera de sus ramas. Se trata de encontrar la respuesta adecuada a cuestiones a veces muy complicadas y darles una solución sencilla.

 

Ejemplo de visualización de datos:

Out of Sight, Out of Mind Pitch Interactive, Berkely, California.
Out of Sight, Out of Mind Pitch Interactive, Berkely, California.

 

Ejemplo de estadística de investigación:

 Ejemplo de estadística de investigación In Climbing Income Ladder, Location Matters The New York Times, NY, EEUU
In Climbing Income Ladder, Location Matters The New York Times, NY, EEUU

 

Todo trabajo de investigación debe comenzar por la formulación de preguntas relevantes para luego identificar, obtener y transformar los datos en algo manejable que pueda utilizarse en infografías, gráficos, visualizaciones y textos escritos.

La cultura del ciudadano está cambiando: ahora exige que las información que se aporta esté sustentada en datos. Si no se los damos, el mismo puede consultar en la red lo que están diciendo otros, y siempre tendrá más fuerza un argumento con los pies en los datos que un comentario o opinión sin ellos. Ahora, los datos y su análisis ya no son exclusivos de las grandes compañías tecnológicas como Google, eBay o Facebook: prácticamente todo tipo de industria, grande o pequeña, necesita el análisis de datos para convencer al ciudadano y mejorar el rendimiento de sus negocios.

 

Se necesitan programadores, claro, pero también gente que sepa como hacer las preguntas adecuadas, qué datos recoger, cómo tratarlos para encontrar los datos que nos sirvan, como hacer un resumen de ellos y finalmente, qué herramientas existen para presentarlos en sociedad. A veces, tendremos que echar mano de programadores especializados en visualización; otras, bastará una infografía sencilla realizada por uno mismo en Excel o Tableu.

La comunicación es un aspecto de la nueva cultura de la red que interesa a todo tipo de industria y actividad, desde educadores y estudiantes hasta agentes de publicidad. Los personas que se dedican o quieran dedicarse a la comunicación deben conocer cómo trabajar con distintos perfiles en el desarrollo de los gráficos y el análisis de datos.

Muchas veces, las empresas echan en falta la penetración de sus informe en su propia empresa o hacia el exterior. La mayoría de las veces, la causas se encuentran en la mala presentación de los conceptos, la poca o nula información visual y la gran extensión de los textos. En una sociedad sin tiempo, es imprescindible el resumen de conceptos y ofrecer una alternativa visual. Los sectores más interesados en el análisis de los números son las empresas de análisis de los consumidores (marketing, análisis social, consultoría, gobiernos), de los resultados de las máquinas (ingeniería, medicina, topografía, finanzas), de los contenidos (medios de comunicación, educación) y de la investigación (I+D, alta tecnología). Los profesionales con más proyección en la visualización de información son periodistas, documentadores, directores de arte, diseñadores y desarrolladores de páginas web que deben presentar la información de forma coherente y digerible para el usuario final. En definitiva, personas que sepan encontrar el valor en los datos para después presentarlo de forma eficaz.

DATA: Entrevista a Adolfo Antón Bravo

Adolfo Antón Bravo

Video entrevista realizada por Juantxo Cruz a @adolflow, experto en tecnologías de la Web Semántica, en MediaLab Prado.

 
Adolfo Antón Bravo: “El Periodismo de Datos debe buscar patrones y tendencias”
 

EXTRACTO DE LA ENTREVISTA

Nos encontramos con Adolfo Antón en un II Taller de Periodismo de Datos en ebullición; un aula llena de voluntariosos ‘data journalists’ que habían quedado en Madrid el pasado mes de diciembre para seguir “el rastro del dinero público”. Éste era el nombre de la convocatoria.

Según el investigador de las relaciones entre la web y la semántica “el periodista siempre ha trabajado con datos; lo que ocurre ahora es que el volumen de datos es mayor”; así, “el Periodismo de Datos debe buscar patrones y tendencias, debe dejarte caminar, debe dejarte pensar y debe ser verídico lo que te está contando”.

En esta entrevista Adolfo reivindica la disciplina de la Estadística en los estudios de Periodismo, “en ciencias Sociales y Letras está abandonada”, y el papel fundamental del código libre para trabajar con datos.

Sobre los medios, afirma que ”en España están tardando en incorporar las nuevas tecnologías, en parte por la crisis” y que “como ciudadano estoy aburrido de los medios de comunicación porque no dicen nada que no pueda saber por la nota de prensa de una empresa o un organismo gubernamental”.

 

REFERENCIADAS DE LA ENTREVISTA:

Antonio Delgado [ @adelgado ]: Colaborador de tecnología en medios de comunicación y consultor independiente asesorando a empresas e instituciones sobre sus estrategias on line. Impulsor de los encuentros de debate #redada.

Jesús Escudero [ @jescuderoma ]: Periodista especializado en Periodismo de Datos en elconfidencial.com.

– Noemí Ramírez [ @noemiRamirez ]: Directora de Producto Digital de El País; experta en gestión de servicios informativos para medios de comunicación.

 elconfidencial [ @elconfidencial ]: “Alvia 04155: así fue el minuto a minuto del accidente que conmocionó a un país”.

DATA: Entrevista a Andy Lehren

Andy Lehren

Entrevista realizada por Juantxo Cruz durante el II Taller de Periodismo de Datos en MediaLab Prado, noviembre de 2014.

Andy Lehren: “No hay que tener miedo a los datos”
Su especialidad son temas de defensa nacional estadounidense, como los contratos iraquíes, los ataques con gas en Siria, la base de Guantánamo, los documentos de Wikileaks o la situación de los hospitales militares.

NOTICIAS Y PERIODISMO DE DATOS

Pregunta: Cada vez se oye más las palabra datos asociada al periodismo. ¿Cuál es la importancia de los datos en las noticias y a la hora de construir titulares?

Andy: Las historias tienen que ser diferentes, tenemos que hacer todo lo posible para encontrar puntos de vista distintos. Una de las herramientas para hacerlo es el periodismo de datos; ayuda a encontrar historias relevantes e importantes para nuestros lectores.

P.- ¿Cómo es ese proceso para encontrar historias interesantes y relevantes?

Andy: Contamos con estas fases: datos, periodismo, ordenadores e investigación; creo que lo importante es mezclar periodismo de datos e investigación. El periodismo pone sobre la mesa la curiosidad, el ser escéptico, poner en duda las cosas y comprobarlas. En EEUU decimos, si tu madre te dice que te quiere, compruébalo. No hay que quedarse en las cosas pequeñas, hay que ir a por las grandes historias.

P.- ¿Qué herramientas utilizas en tu trabajo diario?

Andy: He estado haciendo investigación desde hace 20 años. Si me hubieras preguntado hace 20 años, la gente contestaría que debes utilizar Microsoft Visual FoxPro (lenguaje de programación orientado a objetos con un sistema de gestor de bases de datos) o ficheros XTB. Sin embargo, los programas vienen y se van. Lo importante para hacer periodismo de datos es manejar hojas de cálculo y no tener miedo de las matemáticas. También es muy importante tener conocimientos de bases de datos como MySql, Oracle Database o SQL Server, conocer cómo funciona un gestor de bases de datos.

Por otro lado hay que conocer programas de estadística, como IBM SPSS, SAS o R, y también programas para mapear la información como ArcGIS. Tienes que analizar la información geográficamente para conseguir la historia, el programa no es lo más importante ya que vienen y se van.

P.- ¿Es importante la colaboración en equipo?

Andy: Trabajé en la canal de noticias de la televisión NBC durante más de diez años. Lo que aprendí en televisión es la importancia de trabajar en equipo, todavía hago historias en solitario, pero generalmente trabajo en equipo.

TRABAJO COLABORATIVO Y REDES SOCIALES

P.- ¿Cuales son las piezas principales de tu equipo?

Andy: Puede haber una persona analizando los datos y otra persona puede estar haciendo las entrevistas, pero no son tareas exclusivas, debe ser un proceso fluido. En The New York Times muchas veces la gente de tu equipo no aparece en las firmas del reportaje, pero ellos hacen un trabajo impresionante, especialmente los desarrolladores web que hacen que las cosas aparezcan elegantes y brillantes en la página digital o hacen que la información sea atractiva visualmente. Esta gente tiene un valor increíble.

P.- ¿Es importante contar con los medios sociales?

Andy: Recientemente hemos trabajado historias sobre los hospitales militares de EEUU. La división social de The New York Times ha creado una aplicación que anima a la gente a contarnos experiencias personales. A través de estas historias hemos encontrado informes secretos, con un valor incalculable para nuestras investigaciones. Un equipo compuesto por expertos en medios sociales, la gente de gráficos, los fotógrafos y el editor tradicional.

P.- ¿Cómo trabajas con el equipo visual?

Andy: Si estamos trabajando la historia de los hospitales militares y vemos que los datos son horribles, feos, intentamos enganchar al equipo de gráficos cuanto antes en la historia; incluso si todavía no está escrita, para que se vayan empapando del material. Tenemos que saber cómo va a ser el flujo de trabajo. Porque la peor cosa que puede pasar es llamar al equipo visual en el último minuto y decirles que la historia es para mañana. Así es muy difícil. Si entran en el círculo desde el inicio de la historia, se pueden hacer cosas maravillosas.

Andy Lehren estuvo en Madrid asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

DATA: Entrevista a Nicolas Kayser-Bril

Nicolas Kayser-Bril

Entrevista realizada por Juantxo Cruz y publicada el 4 de noviembre de 2014 en UNIR Revista.

Nicolas Kayser-Bril: “En periodismo de datos, muchas veces la pieza fundamental es el texto”

Este grupo independiente de investigadores esta diseminado por Europa. Trabajan en red desde Estocolmo, Berlín, Colonia, Amsterdam, París y Oporto. Sus proyectos no sólo son periodísticos. También realizan aplicaciones que ayuden a los periodistas a encontrar y visualizar su reportaje. El equipo está involucrado en el desarrollo de DataWrapper, una librería de gráficos para internet, y en la herramienta de análisis de datos Detective.io.

Pregunta: ¿Qué es Journalism++?

Nicolas: Es una agencia para contar historias a través de los datos. Hacemos periodismo de datos para medios, instituciones o grupos de mantenimiento de sistemas. También desarrollamos herramientas específicas de datos, como Detective.io.

P-. Cada vez se relaciona más las palabras datos y periodismo. ¿Por qué ahora son más importantes los datos para encontrar y contar historias?

Nicolas: Si quieres hacer una reportaje periodístico hoy en día, los datos van a entrar en juego en un momento u otro. Los datos te van a ayudar a apoyar tu punto de vista y hacer que tenga una vida más larga, ya que los datos pueden actualizarse y quizás puedas reutilizar la historia, por ejemplo, seis meses después. Los datos son extremadamente importantes si quieres hacer periodismo.

P-. ¿Qué es Detective.io?

Nicolas: Cuando entramos en el mundo de los datos, obviamente, necesitamos más herramientas que el procesador de texto. Para almacenar los datos, reutilizarlos y trabajar con varias personas en una investigación, nosotros hemos desarrollado Detective.io.

P-. Los programas para realizar análisis de datos se multiplican cada día que pasa, ¿cuáles son las herramientas básicas que utilizas?

Nicolas: En cuanto a los programas, en un nivel básico puedes utilizar programas como Microsoft Excel o Google Doc Spreadsheet o Open Office. Otra habilidad que debes desarrollar es la limpieza los datos, porque los datos muchas veces llegan en formatos que no puedes utilizar. Para eso tenemos Google Refine. Y, claro, también tenemos herramientas de visualización de información geográfica como CartoDB, o Datawrapper para información estadística sencilla.

Debes aprender código o saber trabajar con desarrolladores. Así que el número de cosas que hay que aprender son muchas, pero la buena noticia es que la curva de aprendizaje es suave, puedes empezar despacio e ir incrementando tus destrezas poco a poco.

P-. Journalism++ es una red de periodistas que trabajan desde distintas ciudades europeas, ¿cómo organizáis el trabajo en equipo?

Nicolas: Necesitas conocer muchas herramientas y tener muchas habilidades para poder hacer una buena investigación conducida por datos. El número de personas que son buenos periodistas, buenos programadores, buenos visualizadores… no conozco a ninguna que reúna todas estas habilidades. Tienes que trabajar en equipo, lo más importante es contar con un conductor de proyectos, puede ser un periodista o puede ser un responsable de producto; es la persona que pone todas las destrezas juntas, está pendiente de cumplir los plazos y respetar los costes aprobados para el proyecto.

P-. ¿Cómo organizáis el trabajo con el equipo visual?

Nicolas: En periodismo de datos siempre te encuentras con la parte de la visualización, cuando has encontrado el ángulo de la historia tienes que comunicarla. Sin embargo, la mayor parte de las veces la pieza fundamental es el artículo, el texto. Un buen artículo de texto es extremadamente poderoso si la historia es buena.

Otras veces, si quieres ir más allá del texto y publicar tu propia base de datos, profundizar en los datos, entonces debes trabajar con diseñadores y desarrolladores profesionales para crear las piezas interactivas. Pero en un nivel básico, puedes utilizar herramientas para hacer simples visualizaciones. En estos casos no necesitas a estos especialistas, con unas horas de aprendizaje cualquier periodista puede realizar historias interactivas.

Nicolas Kayser-Bril (derecha) y Andy Lehren (izquierda) estuvieron en Madrid asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

Entrevista realizada por Juantxo Cruz y Javier Herrera durante el II Taller de Periodismo de Datos, MediaLab Prado, octubre de 2014.