Sesgo elevado | El punto óptimo | Varianza elevada |
---|---|---|
Puede subajustar el conjunto de entrenamiento | Ajuste muy bueno | Puede sobreajustar el conjunto de entrenamiento |
Más simplista | Solo lo suficientemente complejo | Más complejo |
Es menos probable que sea objeto de influencia por parte de las relaciones reales entre las características y las salidas deseadas. | Hábil para encontrar relaciones verdaderas entre las características y las salidas deseadas, a la vez que no está demasiado influenciado por el ruido. | Es más probable que sea objeto de influencia por parte de las relaciones falsas entre las características y las salidas deseadas ("ruido"). |
Figura 1. Uso del método de retención para crear un conjunto de validación y de prueba.
Es posible que no se necesite un conjunto de validación en todas las situaciones. Por lo general, solo se usa en situaciones en las que hay una configuración para el algoritmo de aprendizaje (hiperparámetros) que puede ajustarse, ya que el ajuste del rendimiento es la razón principal para usar un conjunto de validación. Si usa un conjunto de validación, los porcentajes típicos para dividir los datos son un 60 % de entrenamiento, un 20 % de validación y un 20 % de prueba. Si solo usa un conjunto de entrenamiento y de prueba, las divisiones típicas son entre un 70-80 % de entrenamiento y un 20-30 % de prueba. De cualquier manera, puede ver que la mayoría de los datos se usan normalmente para el entrenamiento con el fin de producir un modelo mejor. Los porcentajes de división de datos dependen de la situación. Los profesionales pueden ajustar las cantidades divididas para producir el mejor resultado.
k
grupos (iteraciones). Un grupo es el conjunto de pruebas. Los grupos restantes conforman el conjunto de entrenamiento. El modelo entrena y luego evalúa su rendimiento. Luego, los grupos rotan: se designa un grupo diferente como conjunto de prueba y el resto se utiliza en el conjunto de entrenamiento. Nuevamente, el modelo entrena y evalúa su rendimiento. Este proceso se repite k
veces. Luego, se calcula el error promedio en todas estas pruebas.k
cantidad de veces, este método requiere tiempo y potencia de procesamiento. Una regla general práctica es establecer k
entre 5 y 10.k
-means, el 10 % de todas las personas en la primera iteración serán zurdas (clase 0) y el 90 % restante de las personas serán diestras (clase 1). Lo mismo ocurre con la segunda iteración, la tercer iteración, etc.: El 10 % de los datos en la iteración será de clase 0 y el 90 % será de clase 1.