Al principio del proyecto, es posible que haya utilizado visualizaciones para explorar el conjunto de datos y crear una hipótesis para el modelo. Es posible que también haya utilizado visualizaciones mientras entrenaba y probaba el modelo para evaluar su rendimiento y comprobar que funcione según lo previsto. Las visualizaciones proporcionan un medio eficaz para transmitir patrones en números. Del mismo modo que son útiles para usted durante el desarrollo de un modelo, pueden ser extremadamente útiles para ayudar a su audiencia a comprender los resultados producidos por su modelo de aprendizaje automático.
Algunos tipos de gráficos son más propicios para un público no técnico que otros. Los gráficos de barras y los gráficos de líneas son fáciles de entender, mientras que los mapas de calor y los gráficos de pares pueden ser difíciles de interpretar para un lego. La información de un gráfico también puede dificultar la interpretación, incluso cuando se usa un tipo de gráfico más sencillo. Una cuadrícula de varios gráficos de barras que presenta cuatro o más dimensiones de datos puede convertirse rápidamente en abrumadora para su audiencia. Debe mantener sus visualizaciones lo suficientemente simples como para ser entendidas, pero aun así capaces de comunicar alguna idea importante o contar una historia que valga la pena. Por lo tanto, considerar cómo colocar cada visualización dentro de un contexto general puede hacer que sea más fácil de entender.
Cuando comunique sus resultados en un informe visual o una presentación, también debe:
- Etiquetar los ejes y los títulos de los gráficos con nombres significativos.
- Etiquetar pasos (valores a lo largo de un eje) según sea necesario para identificar valores generales, pero no amontonar el gráfico con demasiados pasos o etiquetas.
- Utilizar leyendas según sea necesario para identificar qué valores se muestran en un gráfico.
- No confiar únicamente en la codificación de colores; cuando deba usarla, use paletas de colores que puedan ser detectadas por personas con daltonismo.
- Evitar agregar detalles o decoración innecesarios que dificulten la legibilidad, como fondos o temas.
Tipos de historias de visualización
Además de los tipos de gráficos fundamentales discutidos anteriormente en el curso, también puede categorizar las visualizaciones según el tipo de historia que le esté contando a su audiencia. Por ejemplo:
- Una visualización de cambio a lo largo del tiempo suele ser un gráfico de líneas que muestra el cambio de hora en el eje X y alguna otra variable que cambia en el eje Y. Este tipo de visualización cuenta una historia sobre cómo la característica que está estudiando se ve afectada por los cambios en los tiempos durante un período determinado. Por ejemplo, el valor de una casa puede aumentar en un período de diez años.
- Una visualización de contraste muestra la diferencia entre dos o más variables. Muchos tipos de gráficos pueden representar el contraste, incluidos los gráficos de líneas con varias líneas, los gráficos de barras con varias barras, etc. Este tipo de visualización cuenta una historia sobre cómo las características relacionadas pueden divergir y qué factores están causando esa divergencia. Por ejemplo, la calificación de los jugadores en la figura anterior contrasta con cada ciudad, así como con cada género.
- Una visualización interseccional muestra dónde se superponen una o más variables entre sí. El tipo más común de visualización interseccional es un diagrama de Venn, donde los círculos se superponen entre sí. Este tipo de visualización cuenta una historia sobre cómo los conceptos pueden incluir características similares, pero también distintas. Por ejemplo, una encuesta podría pedir a los encuestados que elijan sus sabores de helado favoritos, y si se les permite elegir varios sabores, podría usar un diagrama de Venn para mostrar cuántos encuestados seleccionaron solo un sabor específico y cuántos seleccionaron cualquiera de varias combinaciones de sabores.
- Una visualización de factores demuestra cómo las variables latentes (los factores) reveladas a través de técnicas como la reducción de dimensionalidad se relacionan con las variables observadas en los datos. Varios tipos de gráficos pueden conectar factores con variables observadas, incluidos mapas de calor y diagramas de ruta. Este tipo de visualización cuenta una historia sobre cómo una característica latente puede representar varias características observadas, lo que promueve la transparencia y proporciona una mayor comprensión del dominio del problema. Por ejemplo, podría reducir la dimensionalidad del conjunto de datos del Titanic y, a continuación, conectar cada característica latente a varias características originales para ver cómo se tienen en cuenta en las decisiones de supervivencia de un modelo.
Información adicional
Para obtener más información sobre cómo elegir visualizaciones efectivas para una presentación, consulte este sitio.
Para obtener más información sobre los diagramas de Venn y otras visualizaciones interseccionales, consulte este sitio.
Para obtener más información sobre el análisis factorial y las visualizaciones, consulte este sitio.