CHARTS: El diagrama de caja y bigotes de John W. Tukey

Exploratory Data Analysis, John W. Tukey, 1977

John W. Tukey (1915-2000), de la Universidad de Princeton (EEUU), definió en 1970 el diagrama de caja (‘box-plot’ en inglés). Este gráfico se utiliza cuando deseamos explicar cómo se distribuyen una serie de datos cuantitativos. Otras opciones para reflejar distribuciones son los histogramas y las curvas de distribución. En comparación con estos últimas, el gráfico de caja es más sencillo de entender, más claro y, por tanto, hace más rápida la comprensión visual.

 

Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977
Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977

 

Morfología del diagrama de caja

En su forma más simple, el gráfico de caja representa cinco datos estadísticos en una sola dimensión: el valor mínimo, el cuartil inferior (percentil 25), la mediana, la media, el cuartil superior (percentil 75) y el valor máximo.

Los cuartiles son los valores que dividen los datos en cuatro partes iguales o cuartos. Los percentiles, en cambio, dividen los datos en cien partes iguales. De esta forma,  el cuartil inferior (Q1) se corresponde con el percentil 25 y el cuartil superior (Q3) con el percentil 75.

· Caja: La longitud de la caja representa la distancia entre los percentiles 25 y 75: el tramo de la escala que va desde el primer cuartil al tercer cuartil de la distribución (rango intercuartílico o rango intercuartil). Esto incluye el 50 % de las observaciones centrales.
· Punto interior de la caja: Representa la media.
· Línea interior de la caja: Representa la mediana.

 

Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.
Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.

 

· Líneas verticales (bigotes): Representan los valores máximos (corte superior) y mínimos (corte inferior) del conjunto de datos. Sirven como referencia para ubicar las observaciones que están por fuera del 50% central de la distribución. Por tanto, estos diagramas descriptivos son muy valiosos para observar los valores atípicos (‘outliers’) y las dispersiones de los puntos con respecto a los percentiles.

Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.

John Wilder Tukey

Tukey fue un polifacético científico: matemático, químico y estadístico. En 1977 publicó el libro ‘Exploratory Data Analysis’ (‘EDA) en el cual propone una nueva didáctica de la enseñanza de la estadística descriptiva mediante innovadoras herramientas visuales.

 

El termino 'software' fue usado por primera vez por John Wilder Tukey en el año 1957.
El termino ‘software’ fue usado por primera vez por John Wilder Tukey en el año 1957, creador del diagrama de caja.

 

Exploratory Data Analysis , 1977
Exploratory Data Analysis , 1977

Exploratory Data Analysis
John W. Tukey.
1977
Addison-Wesley Publishing Company.
688 pp.

Guía de estilo de gráficos para Tableau, Airef, 2016

Guía de estilo de gráficos para Tableau, Airef

Realización de una guía de estilo para realizar gráficos con el programa Tableau para Airef.
Airef Data
Prodigioso Volcán, 2016

 

Guía de estilo de gráficos para Tableau, Airef
Guía de estilo de gráficos para Tableau, Airef

 

Uso de la tipografía
Uso de la tipografía

 

Uso del color
Uso del color

 

Buenas prácticas en las gráficas de línea
Buenas prácticas en las gráficas de línea

Sobre Airef

La Autoridad Independiente de Responsabilidad Fiscal (AIReF) tiene por objeto velar por la sostenibilidad de las finanzas públicas como vía para asegurar el crecimiento económico y el bienestar de la sociedad española a medio y largo plazo.

Su misión es garantizar el cumplimiento efectivo por las Administraciones Públicas del principio de estabilidad presupuestaria previsto en el artículo 135 de la Constitución Española, mediante la evaluación continua del ciclo presupuestario y del endeudamiento público.

La AIReF dispone de un Equipo profesional de dilatada experiencia que aspira a cumplir los objetivos encomendados, mediante la publicación de Informes, Opiniones y Estudios de manera periódica en su ámbito de responsabilidad.

Knight Ridder Tribune Graphics ’94

Knight Ridder Tribune Graphics

KRT ’94: George Rorick, el “boss” de la infografía en Knight Ridder Tribune (WDC) en uno de sus viajes a Pamplona, propuso comenzar a desarrollar una agencia de gráficos para Europa. Se lllamó CRUINMO (iniciales de Alvaro Moncada, Quique Infante y yo mismo). Antes de terminar la carrera pude hacer unas prácticas de seis meses en la sede central, en Washington DC.

KRT memories
KRT Graphics was my first real experience with a graphic information team. And what a team!

Jane Scholz was the Editor-in-Chief of the Knight Ridder Tribune Information Services and George Rorick, the leading director. He created a sophisticated but simple department to develop infographics for print, television and web. It was 1994. Nobody had talked yet about integrated newsrooms or digital journalism. But KRT had a seminal group of talent people working together to serve all media. They were and still are some of the best information journalists in the USA.

George Rorick led KRT Graphics into new worlds and new dimensions in 1993 with the introduction of three new products:  the European Graphics Service, the Faces in the News caricature service and the News in Motion television service.
George Rorick led KRT Graphics into new worlds and new dimensions in 1993 with the introduction of three new products: the European Graphics Service, the Faces in the News caricature service and the News in Motion television service.

Amazing. Crazy. I always think of George Rorick as a visionary.

I knew KRT from the print pages of the Spanish newspapers that published their graphics. On 1992, Jeff Goertzen moved to Spain to develop a Information Graphic team at el Mundo. Jeff had worked with George in KRT and had a solid background in graphics. I didn’t work at el Mundo yet; I was studying Journalism at the University of Navarra and met Goertzen and Rorick at the first Malofiej awards.

So, in 1994, with a Bachelor of Arts Degree in journalism in my hands, I was ready to work in graphics. Rorick wanted to create an European division of KRT graphics: KRT Europe. I met him and Ole Rode Jensen, talent editor from Denmark, in Washington DC and we started to do the job with the help of all the KRT team.

The overall group was organized on small sub teams: Edition, Research, Illustration and Print Graphics, TV motion Graphics (News in Motion), Web and KRT Europe. I remember Wes Albers, the leading editor and nowadays the deputy editor of McClatchy, Patricia Carr or Brenna Maloney (now graphics editor for the Washington Post).

Ron Coddington, KRT Art Director
Ron Coddington

Bill Pitzer and Bill Baker was in charge of News and Motion. From the infographic team I have to mention Ron Coddington, now deputy managing editor at Chronicle of Higher Education, and Jeff Dionise, now vice president of design at USA Today. They help me a lot with my poor English and information graphic skills. A million thanks to them.

Years later, George Rorick moved to Spain too to lead el Mundo team about 2001. It was great to meet him again and work together.

Not only was KRT a school of journalism and graphics in the States, but also in all the world.

‘End of an Era’, Charles Apples
In 2004, KRT shut down News in Motion.
In 2006, the McClatchy company bought Knight-Ridder. KRT became MCT.
In 2009, MCT ended the European Graphics Service.