CHARTS: El diagrama de caja y bigotes de John W. Tukey

Exploratory Data Analysis, John W. Tukey, 1977

John W. Tukey (1915-2000), de la Universidad de Princeton (EEUU), definió en 1970 el diagrama de caja (‘box-plot’ en inglés). Este gráfico se utiliza cuando deseamos explicar cómo se distribuyen una serie de datos cuantitativos. Otras opciones para reflejar distribuciones son los histogramas y las curvas de distribución. En comparación con estos últimas, el gráfico de caja es más sencillo de entender, más claro y, por tanto, hace más rápida la comprensión visual.

 

Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977
Gráfico de caja y bigotes de John W. Tukey comparando los puntos más altos de cada estado de EEUU y altitudes de algunos volcanes, 1977

 

Morfología del diagrama de caja

En su forma más simple, el gráfico de caja representa cinco datos estadísticos en una sola dimensión: el valor mínimo, el cuartil inferior (percentil 25), la mediana, la media, el cuartil superior (percentil 75) y el valor máximo.

Los cuartiles son los valores que dividen los datos en cuatro partes iguales o cuartos. Los percentiles, en cambio, dividen los datos en cien partes iguales. De esta forma,  el cuartil inferior (Q1) se corresponde con el percentil 25 y el cuartil superior (Q3) con el percentil 75.

· Caja: La longitud de la caja representa la distancia entre los percentiles 25 y 75: el tramo de la escala que va desde el primer cuartil al tercer cuartil de la distribución (rango intercuartílico o rango intercuartil). Esto incluye el 50 % de las observaciones centrales.
· Punto interior de la caja: Representa la media.
· Línea interior de la caja: Representa la mediana.

 

Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.
Los gráficos de caja muestran un resumen de distribución de datos en muy poco espacio.

 

· Líneas verticales (bigotes): Representan los valores máximos (corte superior) y mínimos (corte inferior) del conjunto de datos. Sirven como referencia para ubicar las observaciones que están por fuera del 50% central de la distribución. Por tanto, estos diagramas descriptivos son muy valiosos para observar los valores atípicos (‘outliers’) y las dispersiones de los puntos con respecto a los percentiles.

Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Evolución de la potencia de salida (kwatts;). Cada gráfico de caja representa un día en concreto.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.
Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.

John Wilder Tukey

Tukey fue un polifacético científico: matemático, químico y estadístico. En 1977 publicó el libro ‘Exploratory Data Analysis’ (‘EDA) en el cual propone una nueva didáctica de la enseñanza de la estadística descriptiva mediante innovadoras herramientas visuales.

 

El termino 'software' fue usado por primera vez por John Wilder Tukey en el año 1957.
El termino ‘software’ fue usado por primera vez por John Wilder Tukey en el año 1957, creador del diagrama de caja.

 

Exploratory Data Analysis , 1977
Exploratory Data Analysis , 1977

Exploratory Data Analysis
John W. Tukey.
1977
Addison-Wesley Publishing Company.
688 pp.

MEDIA: Objetivos perdidos 2008-2009

Gracias por visitar el sitio de Juantxo Cruz

Gracias por visitar el sitio de Juantxo Cruz

General Electric, gigante entre los gigantes, dio a conocer ayer que sus previsiones de beneficio están perdidas este 2008 y tira la toalla para 2009.
Se espera una reestructura para salvar su unidad financiera (GE Capital) y mantener su calificación Triple A.

Beneficios en 2007: 22.200 millones de dólares
Beneficios en 2008: 18.000 millones de dólares (esperaba 21.000)
Beneficios en 2009: 17.000 millones de dólares (previsión)

GE, ‘Imagination at Work’, está presente en más de 100 países y tiene más de 300.000 empleados.

La imagen superior, cuadro con los medios en los que está embarcada GE y, debajo, la cotización durante el último año.

Link:
http://www.genewscenter.com/Content/Detail.asp?ReleaseID=4896&NewsAreaID=2&MenuSearchCategoryID=

PRESS: El negro horizonte de la prensa impresa

Gracias por visitar el sitio de Juantxo Cruz

Este gráfico es pura ciencia ficción. La única realidad es la cifra de ventas de diarios de pago de 1970 a 2007 en Estados Unidos según ‘Editor and Publisher Internacional Yearbook’, que está recogida en la ‘Newspaper Association of America’ (NAA).

Las proyecciones no tienen base científica, se han realizado teniendo en cuenta declaraciones, exposiciones y comentarios sobre el final de la prensa impresa. Por ejemplo, la semana pasada ‘The Christian Science Monitor’ hacía públicos sus planes de cerrar su veterana edición impresa, con más de 100 años de antigüedad, para dejar sólo la versión online y una versión semanal impresa.

‘Time Inc.’ acaba de anunciar los despidos de entre 300 y 700 puestos laborales ó ‘Gannet’ pretende reducir su plantilla en un 10%. Y así hasta el infinito.

Según ‘Crain Communications’, en un escenario positivo, cuando la crisis económica pase, el mercado de la publicidad volverá a recuperarse en prensa (moda, bienes de lujo). Sin embargo, en un escenario muy negativo, los pensadores creativos piensan que la publicidad no volverá jamás. Tras la crisis, la publicidad se irá a los medios electrónicos. Los productos impresos que queden tendrán las audiencias más bajas de su historia.

Según Mark Potts, consultor y blogger, ‘los ingresos de los periódicos online no sobrepasarán a los impresos hasta 2018’. Y esto sólo pasará en algunos diarios, otros no podrán aguantar la pérdida de publicidad en el medio impreso y sostener a la vez una versión digital con pocos ingresos.

Lo que todo el mundo tiene claro es que esta crisis no ha venido mal del todo: cuando se salga, veremos claramente si el desequilibrio del mercado de la publicidad en prensa impresa pone punto final o si se asistimos a una tendencia sin freno. Si se cumple lo segundo, vayan quitando el polvo a las catacumbas.

Circulación en EEUU:
http://www.naa.org/TrendsandNumbers/Total-Paid-Circulation.aspx

Blog de Mark Potts:
http://recoveringjournalist.typepad.com/recovering_journalist/