DATA: Entrevista a Ben Welsh, The Data Desk

Ben Welsh y 'The Data Desk' de Los Ángeles Times

Entrevista realizada por Juantxo Cruz en enero de 2015 a Ben Welsh, periodista de datos y database producer en LA Times.

Ben Welsh y ‘The Data Desk’ de Los Ángeles Times

THE DATA DESK

¿Qué es el Data Desk de Los Ángeles Times?
Ben: Yo trabajo en LA Times en California en un equipo denominado ‘The Data Desk’.
‘The Data Desk’ comenzó más como una idea que cómo una organización estructurada, se trata de un lugar común para trabajar con datos y se extiende entre varios departamentos de Los Ángeles Times, con gente que trabaja en el sitio web, gente que trabaja en el periodismo de investigación, gente que trabaja en el departamento de gráficos.

Entonces, es como una zona de conexión entre los periodistas, un punto de encuentro. ¿Cómo se organiza este flujo de conexiones?
Ben: Para mí lo importante es la capacidad de crear relaciones entre los grupos que componen la organización, personas que están interesadas en utilizar los datos para encontrar y contar historias que nos serían posibles de otra manera. Después vienen los ajustes de organización para ver quién va a hacer qué y o quién va a escribir la historia. Lo importante es la idea de utilizar los datos para hacer que las historias aparezcan y encontrar las personas en la organización que estén de acuerdo con ello.

HERRAMIENTAS DE LOS PERIODISTAS

¿Cuáles son las principales herramientas que utilizáis en ‘The Data Desk’?
Ben: En nuestro equipo tenemos desarrolladores web, que trabajan todo el día con editores de texto y entornos de código abierto para construir sitios web, hasta personas que son más analistas y reporteros de investigación que utilizan Microsoft Excel y otros programas que hacen estos objetivos más sencillos sin necesidad de programar. Así es que es muy variado, dependiendo de la persona y en lo que esté trabajando tú puedes utilizar cualquier herramienta.

Y tú, ¿cuál es la herramienta que dominas mejor?
Ben: Personalmente, yo prefiero el código abierto por la calidad es muy alta, el coste es muy bajo, un coste cero, y me permite conseguir todo lo que quiero sin coste alguno.

(Ver aquí algunas de sus aplicaciones)

EL EQUIPO DE DATOS
¿Cuántas personas participan en el equipo? ¿Son todos periodistas?
Ben: Somos alrededor de 500 personas especializadas en diversas tareas y en trabajando con datos. Sí, somos periodistas. Escribimos historias además de código y trabajamos con los reporteros para darle forma a las historias y contarlas.

PROGRAMACIÓN Y PERIODISMO

Tus aplicaciones muestran una complejidad técnológica importante. ¿Has estudiado ingeniería o alguna rama tecnológica especializada?
Ben: No tengo una educación formal en computación, mucha gente sabe programar, pero yo empecé a interesarme por los ordenadores en la escuela secundaria cuando era joven.

Nunca fue un objetivo para mi ser programador, pero estaba interesado en programación como usuario y entonces cuando empecé a trabajar como un periodista tradicional enseguida vi las posibilidades que tenía para encontrar historias con unos conocimientos mínimos de programación.

¿Cuáles eran tus conocimientos de programación cuando empezaste en el mundo del periodismo de datos en 2007?
Ben: Estudié en la Universidad de Misuri en EEUU. Allí había un grupo especial, llamado NICAR – ‘National Institute por Computer Assisted Reporting’-. No era un grado o un programa educativo. Es un grupo profesional dentro de la Universidad que realiza sesiones de entrenamiento con los periodistas para aprender programación. Ahí trabajé como estudiante graduado para ayudar a la organización. Tenía el tiempo, la gente y la ayuda para ser convertirme en un programador profesional.


BASES DE DATOS Y PERIODISMO

Afirmas que, trabajando con bases de datos, si haces las cosas bien, no se puede mentir. ¿Cuáles son los errores más comunes trabajando o entrevistando las bases de datos?
Ben: No entender cómo fue organizada o cómo fue creada la base de datos y cuáles son sus puntos débiles. Todos los procesos de creación de bases de datos tienen problemas, fallos, agujeros, puntos que hay que revisar, que pueden hacer que el análisis sea equivocado. Si la base de datos tiene duplicados y no tienes cuidado con esto, si los datos son alterados y no te das cuenta, si la persona que la creó falló en la forma de almacenar los datos y no te das cuenta o haces una mala interpretación.

¿Y en cuanto a la estadística?
Ben: Tu operación matemática puede ser perfecta cuando se hace la suma, pero tu interpretación, en la declaración que puedas hacer, quizás sea equivocada, excesiva o malinterpretada.

También son importantes las fuentes…
Ben: Tienes que conocer tus datos, cómo se consiguieron, cuáles fueron las observaciones antes de hacer una afirmación.

Mapa interactivo desarrollado por Ben Welsh. Palewire, Applications.
Mapa interactivo desarrollado por Ben Welsh. Palewire, Applications.

PYTHON Y ROBOTS COMPUTACIONALES
Estáis programando robots con el lenguaje Python para construir bases de datos y encontrar historias. Cuéntanos más sobre esto.
Ben: Un ejemplo puede ser los arrestos realizados de la Policía de Los Ángeles. Todos los días por la mañana la policía envía un correo electrónico con la lista de las personas que han detenido el día anterior. Tenemos una secuencia de comandos, un robot si lo quieres llamar así, en realidad es un programa escrito con Python y, que para ser honesto, es muy modesto, que descarga el fichero y lo incorpora a la base de datos para hacerlo accesible a los reporteros y utilizarlo en búsquedas e investigaciones.

También pregunta automáticamente a los datos sobre una serie de cuestiones, como por ejemplo una serie de profesiones, como políticos o productores de cine. Si han sido arrestados, el programa manda un correo con un aviso a todo el mundo. Si el arresto ha sido consecuencia de un asesinato o se trata de un acontecimiento grave, estos sucesos tienen una señal especial en el programa para avisarnos.

¿Son como máquinas que hacen el trabajo sucio…?
Ben: Lo que realmente estás haciendo cuando escribes este tipo de código, la secuencia de comandos, lo que buscas son las preguntas que los periodistas harían siempre a esta base de datos.

Ben Welsh estuvo en Madrid el pasado mes de diciembre asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

DATA: Entrevista a Adolfo Antón Bravo

Adolfo Antón Bravo

Video entrevista realizada por Juantxo Cruz a @adolflow, experto en tecnologías de la Web Semántica, en MediaLab Prado.

 
Adolfo Antón Bravo: “El Periodismo de Datos debe buscar patrones y tendencias”
 

EXTRACTO DE LA ENTREVISTA

Nos encontramos con Adolfo Antón en un II Taller de Periodismo de Datos en ebullición; un aula llena de voluntariosos ‘data journalists’ que habían quedado en Madrid el pasado mes de diciembre para seguir “el rastro del dinero público”. Éste era el nombre de la convocatoria.

Según el investigador de las relaciones entre la web y la semántica “el periodista siempre ha trabajado con datos; lo que ocurre ahora es que el volumen de datos es mayor”; así, “el Periodismo de Datos debe buscar patrones y tendencias, debe dejarte caminar, debe dejarte pensar y debe ser verídico lo que te está contando”.

En esta entrevista Adolfo reivindica la disciplina de la Estadística en los estudios de Periodismo, “en ciencias Sociales y Letras está abandonada”, y el papel fundamental del código libre para trabajar con datos.

Sobre los medios, afirma que ”en España están tardando en incorporar las nuevas tecnologías, en parte por la crisis” y que “como ciudadano estoy aburrido de los medios de comunicación porque no dicen nada que no pueda saber por la nota de prensa de una empresa o un organismo gubernamental”.

 

REFERENCIADAS DE LA ENTREVISTA:

Antonio Delgado [ @adelgado ]: Colaborador de tecnología en medios de comunicación y consultor independiente asesorando a empresas e instituciones sobre sus estrategias on line. Impulsor de los encuentros de debate #redada.

Jesús Escudero [ @jescuderoma ]: Periodista especializado en Periodismo de Datos en elconfidencial.com.

– Noemí Ramírez [ @noemiRamirez ]: Directora de Producto Digital de El País; experta en gestión de servicios informativos para medios de comunicación.

 elconfidencial [ @elconfidencial ]: “Alvia 04155: así fue el minuto a minuto del accidente que conmocionó a un país”.

DATA: Entrevista a Mariano Zafra

Mariano Zafra

Entrevista realizada por Juantxo Cruz en MediaLab-Prado Madrid a Mariano Zafra, infógrafo y visualizador de información en El País.

 

Mariano Zafra: “Creo en la especialización y en los equipos multi disciplinares que tengan periodista y programadores”

 

 

EXTRACTO DE LA ENTREVISTA

Introducirse en el mundo de los datos: Microsoft Excel:
Algunas aplicaciones interactivas que encuentras en la web – Tableau, Datawrapper, CartoDB – “funcionan de una forma semejante: utilizan datos contenidos en celdas, por ello, la mejor forma de entrar es a través de Excel”, según el periodista.

Infografía y visualización:
“Veo más compleja la visualización tradicional, hay que aprender dibujar con programas como Illustrador, hacer las gráficas a mano, picar los datos, muchas veces los periodistas traen los datos escritos en un cuaderno.”

“Ahora eso se ha simplificado, ahora te puedes meter en una aplicación web sencilla como Datawrapper copias los datos de Excel, los pega y prácticamente ya tienes una gráfica interactiva. De entrada un periodista se puede olvidar de la programación e ir directamente a estas aplicaciones”.

Especialización y coordinación:
“Creo en la especialización y en los equipos multi disciplinares que tengan periodista y programadores, e incluso perfiles intermedios como puede ser un infografista, que sepa cómo utilizar esos datos.”

“Cada perfil tiene saber lo que están haciendo los demás. Todo el mundo tiene que aprender cosas de lo que hace el otro: el periodista tiene que saber que el programador utiliza el lenguaje javascript y que a través de un archivo JSON o Excel va a coger esos datos y luego utilizarlos.”

“El programador también tiene que saber que hay unas fuentes oficiales, que tienen que hacer públicos esos datos, cómo sacar los datos de ahí”.

Noticias y bases de datos:
“A veces, al analizar la base de datos, el programador va a ver historias que no ha visto el periodista.”

“La historia está antes de los datos, pero con los datos van haber más historias.”

REFERENCIADAS DE LA ENTREVISTA

Microsoft Excel [ @msexcel ]: Toda la información está en los datos.

Tableau [ @tableau ]: el modo más rápido y más fácil de compartir análisis en la nube.

Datawrapper [ @Datawrapper ]: Gráficos y mapas en solo cuatro pasos.

CartoDB [ @cartoDB ]: Design amazing maps with your data.

Adobe Illustrator [ @Illustrator ]: Ilustraciones vectoriales. Sobre la marcha y en el escritorio.

ICIJ [ @ICIJorg ]: Luxembourg Leaks: Global Companies’ secret exposed.

Mariano Zafra [ @Mariano_Zafra ]: Trabajos en El País.

El País Infografía [ @elpais_info ]: Sección de Infografía e Ilustración de @el_pais.

Mariano Zafra estuvo en Madrid asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

 

DATA: Entrevista a Andy Lehren

Andy Lehren

Entrevista realizada por Juantxo Cruz durante el II Taller de Periodismo de Datos en MediaLab Prado, noviembre de 2014.

Andy Lehren: “No hay que tener miedo a los datos”
Su especialidad son temas de defensa nacional estadounidense, como los contratos iraquíes, los ataques con gas en Siria, la base de Guantánamo, los documentos de Wikileaks o la situación de los hospitales militares.

NOTICIAS Y PERIODISMO DE DATOS

Pregunta: Cada vez se oye más las palabra datos asociada al periodismo. ¿Cuál es la importancia de los datos en las noticias y a la hora de construir titulares?

Andy: Las historias tienen que ser diferentes, tenemos que hacer todo lo posible para encontrar puntos de vista distintos. Una de las herramientas para hacerlo es el periodismo de datos; ayuda a encontrar historias relevantes e importantes para nuestros lectores.

P.- ¿Cómo es ese proceso para encontrar historias interesantes y relevantes?

Andy: Contamos con estas fases: datos, periodismo, ordenadores e investigación; creo que lo importante es mezclar periodismo de datos e investigación. El periodismo pone sobre la mesa la curiosidad, el ser escéptico, poner en duda las cosas y comprobarlas. En EEUU decimos, si tu madre te dice que te quiere, compruébalo. No hay que quedarse en las cosas pequeñas, hay que ir a por las grandes historias.

P.- ¿Qué herramientas utilizas en tu trabajo diario?

Andy: He estado haciendo investigación desde hace 20 años. Si me hubieras preguntado hace 20 años, la gente contestaría que debes utilizar Microsoft Visual FoxPro (lenguaje de programación orientado a objetos con un sistema de gestor de bases de datos) o ficheros XTB. Sin embargo, los programas vienen y se van. Lo importante para hacer periodismo de datos es manejar hojas de cálculo y no tener miedo de las matemáticas. También es muy importante tener conocimientos de bases de datos como MySql, Oracle Database o SQL Server, conocer cómo funciona un gestor de bases de datos.

Por otro lado hay que conocer programas de estadística, como IBM SPSS, SAS o R, y también programas para mapear la información como ArcGIS. Tienes que analizar la información geográficamente para conseguir la historia, el programa no es lo más importante ya que vienen y se van.

P.- ¿Es importante la colaboración en equipo?

Andy: Trabajé en la canal de noticias de la televisión NBC durante más de diez años. Lo que aprendí en televisión es la importancia de trabajar en equipo, todavía hago historias en solitario, pero generalmente trabajo en equipo.

TRABAJO COLABORATIVO Y REDES SOCIALES

P.- ¿Cuales son las piezas principales de tu equipo?

Andy: Puede haber una persona analizando los datos y otra persona puede estar haciendo las entrevistas, pero no son tareas exclusivas, debe ser un proceso fluido. En The New York Times muchas veces la gente de tu equipo no aparece en las firmas del reportaje, pero ellos hacen un trabajo impresionante, especialmente los desarrolladores web que hacen que las cosas aparezcan elegantes y brillantes en la página digital o hacen que la información sea atractiva visualmente. Esta gente tiene un valor increíble.

P.- ¿Es importante contar con los medios sociales?

Andy: Recientemente hemos trabajado historias sobre los hospitales militares de EEUU. La división social de The New York Times ha creado una aplicación que anima a la gente a contarnos experiencias personales. A través de estas historias hemos encontrado informes secretos, con un valor incalculable para nuestras investigaciones. Un equipo compuesto por expertos en medios sociales, la gente de gráficos, los fotógrafos y el editor tradicional.

P.- ¿Cómo trabajas con el equipo visual?

Andy: Si estamos trabajando la historia de los hospitales militares y vemos que los datos son horribles, feos, intentamos enganchar al equipo de gráficos cuanto antes en la historia; incluso si todavía no está escrita, para que se vayan empapando del material. Tenemos que saber cómo va a ser el flujo de trabajo. Porque la peor cosa que puede pasar es llamar al equipo visual en el último minuto y decirles que la historia es para mañana. Así es muy difícil. Si entran en el círculo desde el inicio de la historia, se pueden hacer cosas maravillosas.

Andy Lehren estuvo en Madrid asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

DATA: Entrevista a Nicolas Kayser-Bril

Nicolas Kayser-Bril

Entrevista realizada por Juantxo Cruz y publicada el 4 de noviembre de 2014 en UNIR Revista.

Nicolas Kayser-Bril: “En periodismo de datos, muchas veces la pieza fundamental es el texto”

Este grupo independiente de investigadores esta diseminado por Europa. Trabajan en red desde Estocolmo, Berlín, Colonia, Amsterdam, París y Oporto. Sus proyectos no sólo son periodísticos. También realizan aplicaciones que ayuden a los periodistas a encontrar y visualizar su reportaje. El equipo está involucrado en el desarrollo de DataWrapper, una librería de gráficos para internet, y en la herramienta de análisis de datos Detective.io.

Pregunta: ¿Qué es Journalism++?

Nicolas: Es una agencia para contar historias a través de los datos. Hacemos periodismo de datos para medios, instituciones o grupos de mantenimiento de sistemas. También desarrollamos herramientas específicas de datos, como Detective.io.

P-. Cada vez se relaciona más las palabras datos y periodismo. ¿Por qué ahora son más importantes los datos para encontrar y contar historias?

Nicolas: Si quieres hacer una reportaje periodístico hoy en día, los datos van a entrar en juego en un momento u otro. Los datos te van a ayudar a apoyar tu punto de vista y hacer que tenga una vida más larga, ya que los datos pueden actualizarse y quizás puedas reutilizar la historia, por ejemplo, seis meses después. Los datos son extremadamente importantes si quieres hacer periodismo.

P-. ¿Qué es Detective.io?

Nicolas: Cuando entramos en el mundo de los datos, obviamente, necesitamos más herramientas que el procesador de texto. Para almacenar los datos, reutilizarlos y trabajar con varias personas en una investigación, nosotros hemos desarrollado Detective.io.

P-. Los programas para realizar análisis de datos se multiplican cada día que pasa, ¿cuáles son las herramientas básicas que utilizas?

Nicolas: En cuanto a los programas, en un nivel básico puedes utilizar programas como Microsoft Excel o Google Doc Spreadsheet o Open Office. Otra habilidad que debes desarrollar es la limpieza los datos, porque los datos muchas veces llegan en formatos que no puedes utilizar. Para eso tenemos Google Refine. Y, claro, también tenemos herramientas de visualización de información geográfica como CartoDB, o Datawrapper para información estadística sencilla.

Debes aprender código o saber trabajar con desarrolladores. Así que el número de cosas que hay que aprender son muchas, pero la buena noticia es que la curva de aprendizaje es suave, puedes empezar despacio e ir incrementando tus destrezas poco a poco.

P-. Journalism++ es una red de periodistas que trabajan desde distintas ciudades europeas, ¿cómo organizáis el trabajo en equipo?

Nicolas: Necesitas conocer muchas herramientas y tener muchas habilidades para poder hacer una buena investigación conducida por datos. El número de personas que son buenos periodistas, buenos programadores, buenos visualizadores… no conozco a ninguna que reúna todas estas habilidades. Tienes que trabajar en equipo, lo más importante es contar con un conductor de proyectos, puede ser un periodista o puede ser un responsable de producto; es la persona que pone todas las destrezas juntas, está pendiente de cumplir los plazos y respetar los costes aprobados para el proyecto.

P-. ¿Cómo organizáis el trabajo con el equipo visual?

Nicolas: En periodismo de datos siempre te encuentras con la parte de la visualización, cuando has encontrado el ángulo de la historia tienes que comunicarla. Sin embargo, la mayor parte de las veces la pieza fundamental es el artículo, el texto. Un buen artículo de texto es extremadamente poderoso si la historia es buena.

Otras veces, si quieres ir más allá del texto y publicar tu propia base de datos, profundizar en los datos, entonces debes trabajar con diseñadores y desarrolladores profesionales para crear las piezas interactivas. Pero en un nivel básico, puedes utilizar herramientas para hacer simples visualizaciones. En estos casos no necesitas a estos especialistas, con unas horas de aprendizaje cualquier periodista puede realizar historias interactivas.

Nicolas Kayser-Bril (derecha) y Andy Lehren (izquierda) estuvieron en Madrid asesorando el II Taller de Periodismo de Datos organizado por Mar Cabra y Adolfo Antón Bravo, del grupo de periodismo de datos de MediaLab Prado, un centro cultural dependiente del Área de Las Artes, Deportes y Turismo del Ayuntamiento de Madrid.

Entrevista realizada por Juantxo Cruz y Javier Herrera durante el II Taller de Periodismo de Datos, MediaLab Prado, octubre de 2014.

GRAPHIC: El gráfico de Pisa

Gráfico contenido en el examen de comprensión lectora para elaborar el informe PISA, octava pregunta.
El gráfico lo realizó MCTdirect (McClatchy-Tribune Information Services), la antigua Knight Ridder Tribune Graphics (KRT) de George Rorick.

Preguntas de comprensión lectora.
La población objetiva del informe son más de 31 millones de jóvenes de 15 años repartidos por todo el mundo.
La prueba la realizaron 512.000 alumnos (el 1,65% de la población).
Aquí una buena discusión sobre porcentajes y muestras.

El protagonista: Vijaypat Singhania.
Récord en altitud en globo.

Reading Literacy

Question: What is the main idea of this text?
  1. Singhania was in danger during his balloon trip.
  2. Singhania set a new world record.
  3. Singhania travelled over both sea and land.
  4. Singhania’s balloon was enormous.
Answer: B. Singhania set a new world record.
Question: Vijaypat Singhania used technologies found in two other types of transport. Which types of transport?
Answer: Refers to BOTH airplanes AND spacecraft (in either order). [can include both answers on one line]
  • 1. Aircraft
  • 2. Spacecraft
  • 1. Airplanes
  • 2. space ships
  • 1. Air travel
  • 2. space travel
  • 1. Planes
  • 2. space rockets
  • 1. jets
  • 2. rockets
Partial Credit: Refers to EITHER airplanes OR spacecraft.
  • spacecraft
  • space travel
  • space rockets
  • rockets
  • Aircraft
  • Airplanes
  • Air travel
  • jets
Question: What is the purpose of including a drawing of a jumbo jet in this text?
Question: Refers explicitly or implicitly to the height of the balloon OR to the record. May refer to comparison between the jumbo jet and the balloon.
  • To show how high the balloon went.
  • To emphasise the fact that the balloon went really, really high.
  • To show how impressive his record really was – he went higher than jumbo jets!
  • As a point of reference regarding height.
  • To show how impressive his record really was. [minimal]
Question: Why does the drawing show two balloons?
  1. To compare the size of Singhania’s balloon before and after it was inflated.
  2. To compare the size of Singhania’s balloon with that of other hot air balloons.
  3. To show that Singhania’s balloon looks small from the ground.
  4. To show that Singhania’s balloon almost collided with another balloon.
Answer: B. To compare the size of Singhania’s balloon with that of other hot air balloons.
Otras historias
Gráficos de 1945 sobre bombas japonesas y globos.

Infografía ‘pata negra’

Se acaba de aprobar la norma de calidad para el jamón.

Etiquetado de mayor calidad a peor (Visualización de la pureza ibérica de los animales en la denominación de venta):

NEGRO: Bellota 100%, los realmente ‘pata negra’.
ROJO: Bellota ibérico
VERDE: cebo de campo ibérico
BLANCO: cebo ibérico.

En la foto, la visualización presenta el código de colores desordenado.

El gráfico correcto en la presentación. López Ortega, 2014

Los cerdos en cebaderos de 110 kilos tendrán un espacio mínimo de 2 metros cuadrados.
En la montanera (carga productiva de la dehesa), de 0,25 a 1,25 cerdos por hectárea.

La nueva normativa explicada.

Ilustración del corte del jamón (profesor Ramón de Arcos Nieto-Guerrero).

Corte del jamón, La Vanguardia. Jaime Serra, Rosa M. Anechina, Jorge Portaz. 2009.

Las trampas en el jamón ibérico, El Periódico. 2013. En La Buena Prensa.

El cerdo Ibérico.
Adolfo Arranz.
2009. El Mundo.

Julie Steele: ‘Big Data’ necesita personas comprometidas con los datos que los hagan inteligentes’

Julie Steele y la visualización

Entrevista realizada por Juantxo Cruz durante la conferencia internacional Big Data Spain 2013 celebrada en Madrid.

Julie es una apasionada de Shakespeare, la ciencia política, el yoga y el diseño. Ahora trabaja como editora de la prestigiosa editorial de libros tecnológicos O’Reilly Media en Nueva York.

Nos sentamos en el hall de los cines Kinépolis de La Ciudad de la Imagen (Madrid), donde tuvieron lugar las conferencias internacionales del evento Big Data Spain 2013.

Responde a nuestras preguntas muy concentrada, encogida, con la mirada caída. No quiere que se le pase nada por alto. Para ella, el lenguaje visual es una gramática, reglas y principios para explicar de forma sencilla temas complejos.

— En tu libro ‘Designing Data Visualizations’ haces una diferenciación entre la infografía y la visualización de datos, ¿podrías darnos las claves?

El lenguaje y el vocabulario que utilizan los diseñadores es a veces muy apasionado; si preguntas a distintas personas encontrarás distintas respuestas. Siendo honesta, la infografía es algo que tiene relativamente una cantidad de datos baja y, en cambio, una alta manipulación manual. La visualización tiene casi siempre un algo contenido de datos, quizás cientos, miles o millones de datos, que tienen que ser manipulados aritméticamente.

— ¿Cuáles crees que tienen que ser las cualidades de un visualizador de datos?

Debe comprender los principios generales del diseño, las formas en las que el cerebro interpreta la información visual. Debe llevar en el bolsillo el lenguaje del que está hablando.

Sin embargo, también debe tener conocimientos de programación, conocer las herramientas, que son muchas, y también debe tener conocimientos de estadísticas. No hace falta que sea un modelador de estadística, pero debe saber qué es la regresión estadística y el lenguaje básico de estadística que se encontrará en el campo de la visualización.

Julie Steele en Big Data Spain 2013, Madrid
Julie Steele en Big Data Spain 2013, Madrid

— ¿Crees que las compañías de Big Data deben contratar diseñadores?

Las compañías tienen que entender que necesitan estos conocimientos específicos para hacer mejor uso de sus datos.

A veces se piensa en el diseño como algo que se hace en los medios, en la moda, en la publicidad, en las finanzas. Se necesitan personas que se comprometan con los datos y los hagan más inteligentes y aquí se incluyen planificadores de la visualización.

— ¿Existen estudios específicos sobre visualización?

Ahora todas las universidades de Estados Unidos están añadiendo nuevos planes específicos para la visualización y también para la investigación de los datos.

— En BigData Spain 2013 se han presentado muchas novedades tecnológicas de ‘Back-End’, para especialistas e ingenieros. ¿Qué piensa de los retos que propone ‘Big Data’?

A veces los ingenieros y programadores sólo piensan en la tecnología. ‘Big Data’ trata sobre seres humanos, sobre la gente, buscar formas de vivir mejor y tomar mejores decisiones. Para ello, necesitas la mejor información, en el lugar y el momento adecuados. En la mayoría de los casos, son las personas las que toman las decisiones, no las máquinas.

— ¿Cómo crees que los medios de comunicación pueden integrarse mejor en el mundo digital ?

Quizás los medios tiene diferentes silos de información, pueden tener vídeos, animaciones, aplicaciones para móviles, gráficos interactivos… pero están separados. Creo que deben fusionarlo, combinarlo y ofrecer nuevas narrativas fluidas para la web, tabletas, móviles. El futuro de los medios será más interactivo y con equipos más integrados.

— ¿Cuáles son tu herramientas favorita?

Me encanta InDesign, yo soy diseñadora y tengo un pasado impreso, tiene grandes herramientas para hacer gráficos sencillos. Si vas a realizar visualizaciones de datos tienes que utilizar D3, Processing , GGPlot, Tableau o Excel. D3 es una herramienta muy poderosa, pero tienes que tener conocimientos de programación para usarla.

— Los conceptos clásicos o ‘primitivos’ que propones para la visualización—claridad, sencillez, evitar saturación de colores y las gráficas con perspectiva, no complicar las estructuras visuales— están ahora en alza en el campo del diseño web. ¿Ves alguna conexión con lo que se llama ‘Flat Design’?

Sí, estoy de acuerdo. Todo el diseño comparte unas mismas reglas, como pueden ser el ‘Golden Ratio’ o el uso del color. Son reglas universales.

Libro de Julia Steele y Noah Iliinky
Designing Data Visualizations, O’Reilly Media, 2011

— ¿Estás trabajando en un nuevo libro?

Vamos a sacar una segunda edición de mi libro ‘Designing Data Visualizations’ (2011, O´Reilly, co-autora junto con Noah Iliinsky).

— ¿Prepara O’Reilly nuevos libros sobre visualización?

Sí, por supuesto. Estamos preparando un libro sobre el programa de visualización Tableau, con contribuciones de muchos lugares. Estamos ahora con ello.

Si hablamos de formato, quizá el libro no es el mejor para presentar gráficos interactivos, por ello, estamos trabajando en vídeos y formatos digitales para nuevas temáticas sobre visualización de datos.