Ir al contenido principal

Diagrama de temas

    • Árbol de decisión

      Árbol de decisión

      Otro algoritmo que puede realizar la clasificación es un árbol de decisión. Un árbol de decisión es una disposición de las declaraciones condicionales y sus conclusiones en una estructura rama-hoja. Considere la siguiente figura, en la que está intentando determinar si un nuevo jugador recomendará o no su videojuego a otros usuarios.

      Figura 1. Un árbol de decisión que determina si un jugador recomendará o no un juego.


      Un árbol de decisión se parece a un diagrama de flujo, donde cada “rama” representa una decisión basada en alguna condición y cada “hoja” representa una salida. Los nodos de decisión reciben la entrada en función de decisiones anteriores hasta que esa rama concreta termina en una hoja.

      En este ejemplo, los rectángulos son los nodos de decisión y los óvalos son los valores de salida. Los valores de salida en este caso son etiquetas de clasificación. Las decisiones son “Sí” o “No”. Cualquier ejemplo de datos (un jugador) debe comenzar en el nodo de decisión raíz (clasificación del jugador). Si el jugador le ha dado al juego una calificación baja, el modelo predice inmediatamente que no lo recomendará. Si el jugador no le da al juego una calificación baja, pasa al siguiente nodo (tiempo de juego). Si han jugado más de 100 minutos en su sesión, el modelo predice que recomendarán el juego. Si el jugador no juega durante tanto tiempo, continúa hasta el nodo de decisión final (edad). Si tienen menos de 24 años, el modelo predice que darán una recomendación. Si tienen menos de 24 años, el modelo predice que no darán una recomendación. En última instancia, cualquier ejemplo de datos que se somete a este árbol de decisión recibirá una clasificación basada en sus características.

      Los árboles de decisión se usan ampliamente en el aprendizaje automático porque son fáciles de entender y no requieren tanta preparación de datos como algunos otros algoritmos. Esto se debe a que la estructura del árbol de decisión será la misma en un conjunto de datos, independientemente de los procedimientos como el escalado o la ingeniería de características que aplique.

      Nota: Los árboles de decisión no solo son capaces de clasificación, sino también de tareas de regresión.