Para algunas distribuciones/conjuntos de datos, encontrará que necesita más información que las medidas de tendencia central (mediana, media y moda). el matemático John W. Tukey introdujo este tipo de visualización de datos visuales en 1969[1]. Desde entonces, se han descrito varias variaciones del diagrama de caja tradicional.[2]. Dos de los más comunes son los diagramas de caja de ancho variable y los diagramas de caja con muescas.

Según Wikipedia:

En estadística descriptiva, un diagrama de caja o diagrama de caja es un método para representar gráficamente grupos de datos numéricos a través de sus cuartiles. Los diagramas de caja también pueden tener líneas que se extienden verticalmente desde las cajas (bigotes) que indican variabilidad fuera de los cuartiles superior e inferior, de ahí los términos diagrama de caja y bigotes y diagrama de caja y bigotes.

Los diagramas de caja y bigotes son muy eficaces y fáciles de leer. Resume datos de múltiples fuentes y muestra los resultados en un solo gráfico. Los diagramas de caja y bigotes permiten comparar datos de diferentes categorías para una toma de decisiones más sencilla y eficaz.

¿Cómo interpretar los diagramas de caja y bigotes?

Los diagramas de caja y bigotes muestran la distribución de sus datos utilizando cinco datos. En consecuencia, los diagramas de caja muestran la resumen de cinco números:

  • El mínimo (el número más pequeño en el conjunto de datos). El bigote izquierdo muestra el mínimo.
  • El primer cuartil, Q1, es el extremo izquierdo del cuadro (o el extremo derecho del bigote izquierdo)
  • La mediana se muestra como una línea en el centro del cuadro.
  • Tercer cuartil, Q3, que se muestra en el extremo derecho del cuadro (en el extremo izquierdo del bigote derecho)
  • El máximo (el número más grande en el conjunto de datos), que se muestra en el extremo derecho del cuadro.

Diagrama de caja en visualización de conjuntos de datos

¿Cuándo utilizar diagramas de caja y bigotes?

Utilice diagramas de caja y bigotes cuando tenga múltiples conjuntos de datos de fuentes independientes que estén relacionados entre sí de alguna manera. Los ejemplos incluyen puntuaciones de pruebas entre escuelas o aulas, datos de antes y después de un cambio de proceso, datos de diferentes máquinas que producen los mismos productos, etc. El diagrama de caja ocupa menos espacio, lo que resulta útil al comparar distribuciones entre muchos grupos o conjuntos de datos.

Think Insights (1 de octubre de 2023) Diagrama de caja en visualización de conjuntos de datos. Obtenido de https://thinkinsights.net/data/boxplot/.
«Gráfico de caja en visualización de conjuntos de datos.» Think Insights – 1 de octubre de 2023, https://thinkinsights.net/data/boxplot/
Piensa en ideas 29 de agosto de 2017 Gráfico de caja en visualización de conjuntos de datos.visto el 1 de octubre de 2023,<https://thinkinsights.net/data/boxplot/>
Piensa en ideas – Gráfico de caja en visualización de conjuntos de datos. [Internet]. [Accessed October 1, 2023]. Disponible de: https://thinkinsights.net/data/boxplot/
«Gráfico de caja en visualización de conjuntos de datos.» Think Insights – Consultado el 1 de octubre de 2023. https://thinkinsights.net/data/boxplot/
«Gráfico de caja en visualización de conjuntos de datos.» Piensa en ideas [Online]. Disponible: https://thinkinsights.net/data/boxplot/. [Accessed: October 1, 2023]