Ir al contenido principal

Diagrama de temas

    • SVM para clasificación lineal

      SVM para clasificación lineal

      Cómo se construye un hiperplano y cómo se aplica a los datos dependen del tipo de problema de aprendizaje automático que está intentando resolver. La figura anterior demostró un hiperplano aplicado a un problema de clasificación lineal; es decir, un problema de clasificación cuyas clases se pueden dividir razonablemente utilizando una línea recta cuando se asignan a un espacio de características.

      En la ilustración siguiente, el gráfico de la izquierda muestra un límite de decisión mediante un algoritmo de clasificación lineal estándar. El límite de decisión en este gráfico hace un buen trabajo al separar ambas clases en el espacio de características, pero se acerca mucho a los ejemplos de datos de borde. Esto probablemente dará lugar a problemas de sobreajuste, ya que los nuevos datos de prueba pueden no generalizarse bien utilizando este modelo. Compare esto con el modelo introducido anteriormente (a la derecha de esta figura), que utiliza SVM. El límite de decisión se traza de tal manera que no solo divide las clases, sino que permanece lo más lejos posible de los ejemplos de borde. Las líneas discontinuas crean los márgenes de separación intersectando los ejemplos de arista.


      Figura 1. Un clasificador lineal sin SVM (izquierda) en comparación con un clasificador lineal con SVM (derecha).


      Ahora, observe lo que sucede cuando se evalúa un nuevo ejemplo de prueba en el modelo.


      Figura 2. Clasificación de un ejemplo de prueba para un modelo sin SVM (izquierda) y un modelo con SVM (derecha).

      Aunque el ejemplo de prueba tiene los mismos valores cuando se conecta a ambos modelos, el modelo con SVM lo clasificó de manera diferente. Por lo tanto, las SVM son útiles en tareas de clasificación en las que los datos de entrenamiento incluyen valores atípicos. Tienden a superar la regresión logística y otros algoritmos de clasificación en este sentido. Sin embargo, cuando se usan SVM, es muy importante escalar los datos, más que en otros algoritmos de clasificación. Si una característica tiene valores mucho más grandes que otra, tendrá una influencia indebida en las distancias que se calculan entre los vectores de soporte y el límite de decisión. La distribución de los puntos de datos es más importante en este caso que el rango de cada característica.

      Nota: Las SVM también pueden resolver problemas de clasificación no lineal, pero una discusión de esto está más allá del ámbito de este curso.

      Información adicional

      Para obtener más información sobre los SVM, consulte este sitio.