Ir al contenido principal

Diagrama de temas

    • Hiperparámetros de CART

      Hiperparámetros de CART

      Los siguientes son algunos de los principales hiperparámetros asociados con CART.


      Hiperparámetro Descripción
      max_depth

      Utilice esto para especificar qué tan “profundo” debe ir el árbol, es decir, el número de nodos de decisión de la raíz a la salida más lejana, que se relaciona con el número de veces que se dividen los datos. Si no especifica una profundidad máxima, CART seguirá dividiendo el conjunto de datos hasta que G (pureza) de todas las salidas sea 0, o hasta que todos los nodos de decisión sean menores que el valor de min_samples_split.

      En su búsqueda por lograr altos niveles de pureza de decisión, los árboles de decisión tienden a ser víctimas del sobreajuste, especialmente cuando el conjunto de datos tiene muchas características. El parámetro max_depth es una forma de regularizar el entrenamiento para evitar el sobreajuste. No hay necesariamente un valor de profundidad ideal para todos los escenarios; debe evaluar el rendimiento del modelo para determinar el valor ideal para su tarea específica.

      min_samples_split Utilice esta opción para especificar cuántas muestras (por ejemplo, ejemplos de datos) son necesarias para dividir un nodo de decisión. Al aumentar este valor, se restringe el modelo porque cada nodo debe contener muchos ejemplos antes de que se pueda dividir. Esto puede ayudar a minimizar el sobreajuste, pero restringir demasiado el modelo puede conducir a un ajuste insuficiente.
      min_samples_leaf Utilícelo para especificar cuántas muestras deben estar en un nodo de salida. Una vez más, aumentar este valor puede reducir el sobreajuste, pero también tiene la oportunidad de conducir a un ajuste insuficiente.

      Nota: Los nombres exactos de los parámetros pueden diferir en función de la biblioteca de programación utilizada; los nombres de la tabla anterior se basan en scikit-learn, la biblioteca principal de aprendizaje automático para Python.