Ir al contenido principal

Diagrama de temas

    • Consideraciones al elegir métricas de clasificación

      Consideraciones al elegir métricas de clasificación


      Al entrenar un clasificador, debe evaluar qué tan bien funciona, no solo cuando logra identificar aspectos positivos o negativos, sino también cuando no identifica correctamente los positivos y negativos. Idealmente, cada estimación realizada por el modelo sería correcta. Pero en el mundo real, eso rara vez es posible, por lo que debe ajustar el modelo para hacer compromisos que satisfagan sus necesidades. El modelo se ajusta para garantizar identificaciones correctas donde son esenciales, a expensas de permitir fallos donde se pueden tolerar.

      Por ejemplo, en algunas situaciones, podría ser mejor tener un modelo que garantice que no habrá falsos negativos a expensas de permitir que quizás el 30 % de las estimaciones positivas sean falsas. Probablemente le gustaría que su modelo de aprendizaje automático identificara a cada paciente que tiene cáncer antes de que la enfermedad se vuelva intratable. Consulte las siguientes posibilidades:

      1. El paciente tiene cáncer y el modelo piensa correctamente que sí (verdadero positivo). Los médicos luego realizan procedimientos de diagnóstico para la confirmación. Una vez que se confirma la presencia de la enfermedad, los médicos pueden comenzar el tratamiento temprano, aumentando las posibilidades de supervivencia del paciente.

      2. El paciente no tiene cáncer, pero el modelo piensa incorrectamente que sí (falso positivo). Los médicos luego realizan más procedimientos de diagnóstico para la confirmación. La confirmación falla, por lo que los médicos no toman ninguna otra medida.

      El beneficio del escenario 1 (tratamiento temprano de la enfermedad) supera el costo del escenario 2 (someter innecesariamente a un paciente a procedimientos invasivos). Al optimizar para el escenario 1, aumenta los verdaderos positivos, lo que reduce los falsos negativos. Esto también tiene el efecto desfavorable de aumentar los falsos positivos, pero eso es una compensación aceptable en esta situación.

      En otras situaciones, podría ser mejor optimizar diferentes valores de verdad. Tener varias formas de medir el rendimiento del modelo le ayudará a optimizarlo para una situación determinada.