Ir al contenido principal

Diagrama de temas

    • Matriz de confusión

      Matriz de confusión

      Una matriz de confusión es un método para visualizar los resultados reales de un problema de clasificación. Le ayuda a examinar más fácilmente las dimensiones de un problema de clasificación, así como a identificar verdaderos positivos/negativos y falsos positivos/negativos dentro de los datos estimados. En una matriz de confusión, el número de estimaciones se compara con el número de valores reales en un formato de tabla. Hay varias maneras de estructurar esta tabla; el siguiente es un ejemplo, utilizando un modelo con dos clases (un clasificador binario).


      Figura 1. Una plantilla de matriz de confusión.


      Recordemos que el ejemplo mencionado anteriormente tiene que ver con la determinación de la presencia de cáncer en pacientes. Después de entrenar el modelo en los datos, hará estimaciones que terminan siendo verdaderas o falsas y negativas o positivas. Conectando esos valores a una matriz de confusión, podría obtener algo como lo siguiente.

      Figura 2. Una matriz de confusión de determinaciones de cáncer.

      Usando una tabla como esta, es mucho más fácil identificar la prevalencia de errores en las decisiones del modelo. Para resumir el ejemplo:

           Determinaron a 513 pacientes correctamente para no tener cáncer (verdaderos negativos).

           Determinaron a 8 pacientes incorrectamente para tener cáncer cuando no lo hicieron realmente (falsos positivos).

           Determinaron incorrectamente que 4 pacientes no tenían cáncer cuando realmente lo tenían (falsos negativos).

           Determinaron correctamente que 17 pacientes tenían cáncer (verdaderos positivos).