Selección de algoritmos
Seleccionar el algoritmo correcto para un modelo de aprendizaje automático puede parecer abrumador porque hay numerosos algoritmos de aprendizaje automático supervisados y no supervisados, cada uno empleando su propio enfoque para el proceso de aprendizaje. El algoritmo "correcto" depende de la situación y puede haber más de un algoritmo que resuelva un problema en particular. Incluso los profesionales de IA altamente experimentados pueden no ser capaces de seleccionar inmediatamente el mejor algoritmo para una situación particular sin un poco de experimentación.
Es útil pensar en los algoritmos que podría usar incluso antes de que esté listo para aplicarlos, ya que puede afectar a cómo debe preparar los datos anteriormente en el proceso de ciencia de datos. La asignación de algoritmos a los resultados/tareas que espera es un buen lugar para comenzar, ya que es posible que pueda descartar algunos algoritmos que no se aplican a su situación. Por ejemplo, la regresión logística se usa principalmente para tareas de clasificación, por lo que probablemente decida no entrenar un modelo de regresión logística si necesita predecir temperaturas. Sin embargo, incluso si la tarea deseada está clara, todavía puede haber muchos algoritmos adecuados. ¿Por qué elegir la regresión logística en lugar de un árbol de decisión, por ejemplo? ¿Qué sucede si usa un modelo de Bayes ingenuo en su lugar?
Hay algunos factores que puede buscar que difieren entre los algoritmos que realizan el mismo tipo básico de tarea, incluso cuando se utilizan los mismos conjuntos de datos. Estos factores incluyen:
- Velocidad de entrenamiento. Algunos algoritmos tardan mucho más en entrenar un modelo que otros, incluso cuando se utiliza el mismo conjunto de datos.
- Efectividad del modelo. Algunos algoritmos producen modelos que funcionan mejor que otros en una tarea determinada.
- Requisitos de preparación de datos. Algunos algoritmos requieren más preparación de datos que otros para ser eficaces, o requieren diferentes tipos de preparación.
- Complejidad. Algunos algoritmos, especialmente los de aprendizaje profundo, pueden ser mucho más complejos y difíciles de trabajar que otros.
- Transparencia, explicabilidad o interpretabilidad. Algunos algoritmos son más cerrados o de "caja negra" que otros, lo que significa que es más difícil determinar por qué el modelo tomó una determinada decisión.
- Disponibilidad. Cada biblioteca de programación admite una selección de algoritmos y es posible que algunas bibliotecas no admitan el algoritmo que está buscando.
- Aceptación del usuario. Las personas que en última instancia usarán una solución de IA pueden preferir ciertos algoritmos sobre otros por varias razones, incluidas preocupaciones como la explicabilidad.
Por supuesto, si tiene la capacidad y la habilidad, debe considerar entrenar varios modelos mediante algoritmos diferentes. De esa manera, podrá comparar cada modelo y elegir el que mejor se adapte a sus necesidades.
Información adicional
Para obtener un ejemplo del mundo real que ilustra el problema de la "caja negra", consulte este
sitio.