CHARTS: El diagrama de caja y bigotes de John W. Tukey

Exploratory Data Analysis, John W. Tukey, 1977

John W. Tukey (1915-2000), de la Universidad de Princeton (EEUU), definió en 1970 el diagrama de caja (‘box-plot’ en inglés). Este gráfico se utiliza cuando deseamos explicar cómo se distribuyen una serie de datos cuantitativos. Otras opciones para reflejar distribuciones son los histogramas y las curvas de distribución. En comparación con estos últimas, el gráfico de caja es más sencillo de entender, más claro y, por tanto, hace más rápida la comprensión visual.

 

Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977
Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977

 

Morfología del diagrama de caja

En su forma más simple, el gráfico de caja representa cinco datos estadísticos en una sola dimensión: el valor mínimo, el cuartil inferior (percentil 25), la mediana, la media, el cuartil superior (percentil 75) y el valor máximo.

Los cuartiles son los valores que dividen los datos en cuatro partes iguales o cuartos. Los percentiles, en cambio, dividen los datos en cien partes iguales. De esta forma,  el cuartil inferior (Q1) se corresponde con el percentil 25 y el cuartil superior (Q3) con el percentil 75.

· Caja: La longitud de la caja representa la distancia entre los percentiles 25 y 75: el tramo de la escala que va desde el primer cuartil al tercer cuartil de la distribución (rango intercuartílico o rango intercuartil). Esto incluye el 50 % de las observaciones centrales.
· Punto interior de la caja: Representa la media.
· Línea interior de la caja: Representa la mediana.

 

Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.
Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.

 

· Líneas verticales (bigotes): Representan los valores máximos (corte superior) y mínimos (corte inferior) del conjunto de datos. Sirven como referencia para ubicar las observaciones que están por fuera del 50% central de la distribución. Por tanto, estos diagramas descriptivos son muy valiosos para observar los valores atípicos (‘outliers’) y las dispersiones de los puntos con respecto a los percentiles.

Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.

John Wilder Tukey

Tukey fue un polifacético científico: matemático, químico y estadístico. En 1977 publicó el libro ‘Exploratory Data Analysis’ (‘EDA) en el cual propone una nueva didáctica de la enseñanza de la estadística descriptiva mediante innovadoras herramientas visuales.

 

El termino 'software' fue usado por primera vez por John Wilder Tukey en el año 1957.
El termino ‘software’ fue usado por primera vez por John Wilder Tukey en el año 1957, creador del diagrama de caja.

 

Exploratory Data Analysis , 1977
Exploratory Data Analysis , 1977

Exploratory Data Analysis
John W. Tukey.
1977
Addison-Wesley Publishing Company.
688 pp.

GRAPHICS: Wolfram MathWorld

Ayer me encontré esta página de matemáticas. Se llama Wolffram MathWorld y su ‘lema es la fuente de matemáticas más extensa de la web’.

Recordé los tiempos del instituto y la lucha constante contra los elementos del álgebra. Pobres libros. Ahora los buscó y cuestan una pasta. El caso que llegué al capítulo de gráficos y descubrí un tesoro. Para resumir, gráficos matemáticos que, como podréis ver, son unos diagramas estupendos para organizar contenidos informativos. Ya lo sé, no estamos descubriendo la pólvora. Ayer disfruté muchas horas repasando las formas y geometrías propuestas por Eric w. Weisstein. Gracias.

VIDEO: A por las tardes del domingo

Gracias por visitar el sitio de Juantxo Cruz

Gracias por visitar el sitio de Juantxo Cruz
Gracias por visitar el sitio de Juantxo Cruz
Con la irrupción de YouTube en la red, el vídeo tomaba cartas en la partida de Internet. Las grandes cadenas norteamericanas se han puesto las pilas y todas tienen ya su servicio de vídeo por subscripción. Todavía está por ver si no les pasa como a aquellos que se fueron con la música a otra parte por llegar tarde y mal. De momento éstos no están haciendo tanto ruido como los otros, poco a poco van cubriéndose bien las espaldas en los temas legales y, pese a que no consiguen pagar toda la factura, van cumpliendo las expectativas previstas. Su póker de damas: ofrecen vídeos en su formato original, sin transformaciones ni adulteraciones. Y, por supuesto, también hay sitio para la publicidad. Repasemos tres casos:

Hace un año, fruto de un acuerdo entre News Corporation y NBC Universal, nació Hulu, con el apoyo de diez anunciantes. Ahora cuenta con 100 patrocinadores, entre ellos la colosal General Electric. Su catálogo online ofrece 1.000 serie de televión y 400 películas y, según Nielsen, lo siguen 6,3 millones de usuarios únicos.
Pese a que desde fuera de EEUU no se puede acceder al servicio por motivos legales sobre los derechos, merece la pena darse una vuelta por este sitio para disfrutar de su diseño y navegación.

Michael Eisner y AOL Time-Warner se hicieron en 2006 con la companía Veoh, distribuidora de vídeo online que funcionaba albergando vídeos de todo tipo hasta que se encontró en 2007 con toda clase de problemas legales acerca del material. En mayo puso el candado a sus accesos desde latinoamérica y los países en vías de desarrollo. Distribuye contenidos de TNT Networks, New Line Cinema, Billboard o Paramount Pictures entre otros muchos.

Joost actualmente está en una fase beta. Desde el pasado septiembre se accede completamente vía web sin tener que instalar software adicional para ejecutar los ficheros y olvidando así la la tecnología ‘peer-to-peer’. Se hizo con los derechos de MTV y VH1 antes que YouTube, que ahora ya no podrá contar con sus vídeos, y ofrece todo tipo de película de terror a través de Flash, con mayor calidad y definición de imagen. Y, por último, ha cambiado su desastrosa navegación y organizado con un poco de coherencia su archivo.