Ir al contenido principal

Diagrama de temas

    • Interpretabilidad global frente a interpretabilidad local

      Interpretabilidad global frente a interpretabilidad local

      La interpretabilidad global mide los procesos de toma de decisiones del modelo en su conjunto. La interpretabilidad local mide los procesos de toma de decisiones para ejemplos de datos específicos. Ambos se usan a menudo para determinar la importancia de la variable (es decir, característica). Puede usar la interpretabilidad global para determinar cuánto contribuyó cada entidad a un modelo en general, y la capacidad de interpretación local, para determinar cuánto contribuyó cada entidad a la estimación de un ejemplo de datos específico. Su elección de reducir o eliminar variables que considere poco importantes o que sean activamente perjudiciales para un modelo deberá justificarse. Incluso si no toma un enfoque tan directo, la importancia relativa de cada característica casi siempre tendrá un efecto significativo en el modelo resultante y las decisiones que toma.

      En la siguiente ilustración, a la izquierda, una herramienta llamada Shapley Additive Explanations (SHAP) mide la importancia de las variables desde una perspectiva global. A la derecha, una herramienta llamada ELI5 ("explíquenme como si tuviera cinco [años]") mide la importancia de la variable para un solo ejemplo de datos que se ejecuta a través de un clasificador, un ejemplo de interpretabilidad local.


      Figura 1. La interpretabilidad global (izquierda) y local (derecha) se demuestra mediante el uso de gráficas de importancia variable.

      El modelo representado por la gráfica de la izquierda estima el valor de las casas en función de varias características. De acuerdo con esta gráfica, se puede concluir que LSTAT, o el porcentaje de hogares de bajos ingresos en la zona, tiene el mayor impacto en las estimaciones del modelo, con el número de habitaciones (RM) en un segundo distante. El modelo representado por la gráfica de la derecha clasifica a los pasajeros del malogrado RMS Titanic como si hubiesen sobrevivido al desastre o fallecido. Por lo tanto, el modelo concluye que este pasajero en particular habrá sobrevivido (y = 1). La característica que fue más importante en esta decisión específica es el hecho de que el pasajero era mujer. El pasajero que no embarcaba desde Southampton (Embarked=S que falta) también fue algo importante en la decisión del modelo.

      Información adicional

      Para obtener más información sobre la herramienta SHAP para Python®, consulte este sitio.

      Para obtener más información sobre la herramienta ELI5 para Python, consulte este sitio.