Ir al contenido principal

Diagrama de temas

    • Diagramas de Violín

      Diagramas de violín

      Un diagrama de violín es un método para mostrar la distribución de un valor numérico a través de la densidad de probabilidad. Es similar a un gráfico de caja en que puede mostrar una estadística de resumen como IQR; pero también puede revelar más sobre dónde los datos tienden a caer dentro del rango de valores. La distribución se calcula utilizando una estimación de densidad de kernel (KDE), que difiere de cómo se calcula una distribución de histograma. La distribución de un KDE se suaviza en curvas, en lugar de representarse como contenedores rectangulares como en un histograma. Esto ayuda a aliviar algunos de los problemas de un histograma, como la dificultad de elegir un buen tamaño de contenedor. Un diagrama de violín recibe su nombre del hecho de que la distribución de KDE se extiende desde ambos lados de la línea de rango, creando una forma que recuerda a un violín. Las áreas más amplias de la distribución indican una mayor probabilidad de que las muestras de datos estén en ese valor, mientras que las áreas más delgadas indican una probabilidad más baja.

      Los diagramas de violín se utilizan con mayor frecuencia para comparar distribuciones entre muestras de datos similares. En la figura, se trazan los tiempos medios de juego durante dos días diferentes, donde cada día es su propio violín.

      Figura 1. Diagramas de violín que comparan la distribución del tiempo de juego para cada día.

      Los horarios de juego para el 2 de enero están muy dispersos; parece que bastantes usuarios tenían sesiones de larga duración, haciendo que el violín se disparara hacia el extremo superior. Además, un tiempo de juego de alrededor de 25 minutos parece tener la probabilidad más alta. El violín para el 3 de enero está menos disperso en general, pero exhibe un grado significativo de variación dentro de esa dispersión. Los tiempos de juego son mucho más propensos a ser de alrededor de 25 minutos y es mucho menos probable que estén ligeramente por encima o por debajo de eso.

      Nota: Los violines se extienden por debajo de 0 minutos debido a cómo se calcula el KDE. Esto no significa que algunos usuarios jugaron por tiempo negativo, solo que hay una probabilidad de que lo hagan, ya que el KDE no es consciente automáticamente de los valores mínimos o máximos posibles. Algunas herramientas de visualización pueden configurar un punto de corte para los violines para que no se extiendan a un territorio improbable.