Ir al contenido principal

Diagrama de temas

    • Aprendizaje Sin Supervisión

      Aprendizaje sin supervisión


      El aprendizaje sin supervisión es una estrategia de aprendizaje automático en el que el algoritmo no tiene valores conocidos para la etiqueta. En otras palabras, al algoritmo no se le dice explícitamente lo que necesita predecir, ya que esta información no se proporciona como parte de los datos de entrenamiento. Usando el ejemplo de registros de salud, la columna que registra si alguien tiene o no una enfermedad cardíaca no se marcaría como la etiqueta para que el algoritmo prediga.

      En los datos de entrenamiento para el aprendizaje sin supervisión, se siguen proporcionando los ejemplos y las características y el algoritmo debe encontrar elementos comunes en ellos. Normalmente, identifica elementos comunes juntando y agrupando datos similares como parte de su entrenamiento. El algoritmo decide si estos elementos comunes existen o no en nuevos conjuntos de datos para realizar predicciones. Las personas con pesos y niveles de presión arterial más altos podrían correlacionarse, por lo que el algoritmo podría agrupar a estas personas. Estos grupos pueden permitir a los profesionales médicos tomar mejores decisiones sobre a quién examinar o tratar y cómo.

      Debido a que no implica etiquetas como parte del entrenamiento, el aprendizaje sin supervisión puede ser más difícil de implementar de manera efectiva. El aprendizaje sin supervisión basado en la agrupación se utiliza en la investigación genética mediante la agrupación de patrones de ADN para analizar la evolución biológica. En el mundo de los negocios, puede ayudar a agrupar clientes para que una empresa pueda comunicarse con diferentes grupos de clientes de manera más efectiva.

      Figura 1. Entrenar un algoritmo de aprendizaje sin supervisión para identificar patrones.


      Aprendizaje semisupervisado

      El aprendizaje semisupervisado es una combinación de aprendizaje supervisado y sin supervisión. En un conjunto de datos, normalmente tendrá muchos ejemplos sin etiquetar y algunos ejemplos etiquetados. Esta estrategia semisupervisada es particularmente útil en los casos en que el etiquetado de todos los datos llevaría mucho tiempo, o sería prohibitivo en términos de costos o inviable. Etiquetar solo algunos de los datos puede no ser ideal, pero puede mejorar el rendimiento del modelo sobre el aprendizaje sin supervisión estándar. En última instancia, el objetivo es lograr un equilibrio entre la sobrecarga involucrada en el etiquetado de datos y el poder predictivo real del modelo.