A gráfico de dispersión muestra la relación entre 2 variables numéricas. A coeficiente de correlación El cálculo mide la fuerza de la relación entre las variables. Para cada punto de datos, trace el valor de su primera variable en el eje X y la segunda variable en el eje Y. Es común proporcionar aún más información usando colores o formas (para mostrar grupos o una tercera variable).

Gráficos de dispersión: visualización de dos variables numéricas diferentes

Al presentar los resultados, podría rodear un grupo interesante de puntos o regiones en el gráfico. Los valores atípicos distorsionan la relación entre las variables. Elimínelas, pero sólo si su ausencia no afecta el análisis de relación entre las dos variables. Rodear los valores atípicos también ayuda a llamar la atención sobre aquellas excepciones/casos interesantes. Los diagramas de dispersión ayudan a identificar valores atípicos, es decir, valores que están anormalmente distantes de la mayoría de los datos. La eliminación de valores atípicos ayuda a mejorar la visión y la inferencia.

Gráficos de dispersión: visualización de dos variables numéricas diferentes

Interpretación de diagramas de dispersión

Compruebe si hay relaciones negativas entre las dos variables en el gráfico. Si ve valores bajos para la primera variable y valores altos de la segunda variable, existe una correlación negativa. En este caso, una línea trazada a través de los puntos de datos tendrá una pendiente hacia abajo, es decir, una línea negativa. pendiente. Examine también el gráfico para detectar una relación positiva entre las variables. Si los valores bajos de la primera variable corresponden a valores bajos de la segunda, y los valores altos de la primera se corresponden con valores altos de la segunda, entonces las variables tienen una correlación positiva. En este caso, una línea trazada a través de los puntos de datos tendrá una pendiente hacia arriba. También inspeccione el gráfico para detectar relaciones entre las variables. No hay relación aparente entre las variables si los puntos de datos se distribuyen aleatoriamente. En este caso, los puntos de datos no tienen correlación o tienen una correlación pequeña y estadísticamente insignificante.

Cuándo utilizar diagramas de dispersión

Los diagramas de dispersión se utilizan cuando se desea mostrar la relación entre dos variables. Un gráfico de dispersión funciona mejor cuando se comparan grandes cantidades de puntos de datos sin tener en cuenta el tiempo. A menudo, los diagramas de dispersión incluirán una línea de tendencia para ayudar a que la relación sea más clara. Además, el tamaño, la forma o el color del punto podrían representar una tercera (o incluso una cuarta variable).

Think Insights (24 de septiembre de 2023) Gráficos de dispersión: visualización de dos variables numéricas diferentes. Obtenido de https://thinkinsights.net/data/scatter-plots/.
«Gráficos de dispersión: visualización de dos variables numéricas diferentes.» Think Insights – 24 de septiembre de 2023, https://thinkinsights.net/data/scatter-plots/
Piensa en ideas 22 de agosto de 2017 Gráficos de dispersión: visualización de dos variables numéricas diferentes.visto el 24 de septiembre de 2023,<https://thinkinsights.net/data/scatter-plots/>
Piensa en ideas – Gráficos de dispersión: visualización de dos variables numéricas diferentes. [Internet]. [Accessed September 24, 2023]. Disponible de: https://thinkinsights.net/data/scatter-plots/
«Gráficos de dispersión: visualización de dos variables numéricas diferentes.» Think Insights – Consultado el 24 de septiembre de 2023. https://thinkinsights.net/data/scatter-plots/
«Gráficos de dispersión: visualización de dos variables numéricas diferentes.» Piensa en ideas [Online]. Disponible: https://thinkinsights.net/data/scatter-plots/. [Accessed: September 24, 2023]