Ir al contenido principal

Diagrama de temas

    • Diagramas de Dispersión

      Diagramas de dispersión

      Un diagrama de dispersión representa visualmente la relación entre dos variables mediante el uso de puntos en un gráfico. Normalmente se traza en dos dimensiones, donde el eje horizontal (el eje x) corresponde a la variable x y el eje vertical (el eje y) corresponde a la variable y. Se coloca un punto para cada ejemplo de datos, donde los valores de ese ejemplo en x e y se intersectan.

      Los diagramas de dispersión son útiles para determinar cómo se correlacionan dos variables numéricas. Por lo tanto, a medida que aumentan los valores de una característica, los valores de otra característica también pueden aumentar; una correlación positiva. O a medida que aumentan los valores de una característica, los valores de otra característica pueden disminuir; una correlación negativa. Por supuesto, también es posible que no haya un patrón discernible de cómo se propagan los puntos, lo que indica que no hay una correlación real entre las variables.

      En la encuesta de videojuegos, los jugadores proporcionaron su edad cuando se inscribieron para obtener una cuenta. Por lo tanto, es posible que esté interesado en estudiar cómo (o si) la edad y el tiempo de juego se correlacionan. Puede ver esto fácilmente usando un diagrama de dispersión, como en la siguiente figura.

      Figura 1. Uso de un diagrama de dispersión para comparar la edad y el tiempo de juego.


      En este caso, no parece haber mucha correlación entre la edad y el tiempo de juego. Los puntos no suben o bajan constantemente a medida que aumenta la edad. Los jugadores más jóvenes no necesariamente juegan durante más tiempo, y viceversa. Incluso si no puede identificar una correlación, sigue siendo útil crear diagramas de dispersión, ya que a menudo es tan importante saber cuándo dos variables no se correlacionan como cuando lo hacen. También puede utilizar diagramas de dispersión como otra forma de detectar valores atípicos, esta vez en relación con alguna otra variable. Entonces, parece que la persona que jugó en esa sesión que duró más de 2 horas lo hizo en su adolescencia.