Clasificación multiclase
La clasificación multiclase es el proceso de colocar un ejemplo de datos dentro de una sola clase entre tres o más opciones. Esto difiere de la clasificación de varias etiquetas en que las clases son mutuamente excluyentes. Un ejemplo no puede pertenecer a la clase A, B y C; debe pertenecer a A o B o C.
En el ejemplo de deportes, puede desglosar los partidos en el tipo de deporte que se está jugando:
- Fútbol americano
- Baloncesto
- Béisbol
- Y así sucesivamente...
El juego es fútbol americano o algunos deportes que no lo son; no puede ser ambas cosas. A diferencia de los problemas multietiqueta, los problemas multiclase requieren un enfoque diferente al de combinar clasificadores binarios. Este enfoque se denomina regresión logística multinomial y genera probabilidades para cada clase que suman 1. Por lo tanto, si un equipo anotó 42 puntos totales y jugó durante un tiempo total de 3,5 horas, la salida podría ser:
- 89 % fútbol americano.
- 8 % baloncesto.
- 3 % béisbol.
Así, el algoritmo determina que el juego es de fútbol. Y, como se puede ver, todos los porcentajes suman 1 (100 %).
Nota: También es posible tener un problema multietiqueta y multiclase. Por ejemplo, la categoría 2 en el ejemplo anterior podría incluir vínculos, lo que significaría que hay tres etiquetas posibles para esa clase.