Ir al contenido principal

Diagrama de temas

    • Modelos de aprendizaje automático

      Modelos de aprendizaje automático


      Un modelo de aprendizaje automático, llamado con frecuencia simplemente un modelo, es una representación matemática de datos aplicados a un algoritmo. Es un subconjunto de la idea más general de un modelo estadístico. Los modelos estadísticos presentan suposiciones sobre una población con base en los datos de la muestra disponibles. Tenga en cuenta el ejemplo de un conjunto de datos que incluye las edades y alturas de unos pocos cientos de personas. Puede crear un modelo estadístico para observar el patrón general de edad en relación con la altura en el conjunto de datos (la muestra) y, a continuación, extrapolar esa información a un país completo (la población). El modelo puede responder a preguntas como: "¿A qué edad los ciudadanos noruegos suelen dejar de crecer en altura?" o "¿Cuál es la altura habitual de un ciudadano estadounidense entre las edades de 18 y 30 años?". La cantidad y los tipos de preguntas que puede responder un modelo dependen de los datos y de su propia curiosidad.

      Es frecuente pensar en los modelos estadísticos como si se realizaran predicciones, pero no todas las conclusiones que un modelo puede extraer son predictivas en el sentido más estricto de la palabra. Es más preciso referirse a la salida de un modelo como una estimación o una inferencia. Por ejemplo, el modelo podría predecir qué altura tendrá alguien cuando sea mayor. El modelo también podría hacer una estimación no predictiva, como qué altura tiene alguien en este momento, aunque solo sea en función de su edad y nacionalidad. El modelo también podría tomar decisiones proactivas, como sugerir un régimen alimenticio y de ejercicio a alguien con base en su altura y edad.

      Nota: A pesar de estas distinciones, muchas personas todavía utilizan el término "predicción" para referirse a cualquier tipo de estimación o inferencia.

      El modelo de aprendizaje automático es a menudo el "producto" definitivo del proceso de aprendizaje automático: es lo que se crea para realizar realmente la tarea necesaria, sea cual sea.

      El proceso general para crear y utilizar un modelo es el siguiente:


      1. El profesional selecciona un algoritmo a utilizar.

      2. El profesional (o un proceso automatizado) introduce datos en el algoritmo. Esto se denomina datos de entrenamiento o ejemplo de entrenamiento.

      3. El algoritmo genera un modelo con base en los datos de entrenamiento.

      4. El profesional (o un proceso automatizado) introduce en el modelo nuevos datos que no ha visto antes.

      5. El modelo realiza una predicción o decisión con base en estos nuevos datos.


      De forma tal que, un modelo es una implementación de un algoritmo. Es específico de cualquier problema que trate de resolver, pero un algoritmo puede generar muchos tipos de modelos si se le proporcionan datos diferentes o se configura de diferentes maneras.

      El proceso de entrenamiento en el paso 3 es de particular importancia, ya que crea el modelo, en realidad. Aquí es donde el algoritmo hace todo el esfuerzo, tomando sus datos de entrada y realizando muchos cálculos con ellos. El profesional no hace mucho en este momento, pero todo lo que hace antes del entrenamiento (e incluso las cosas que hace después) tendrá un impacto en el éxito de ese entrenamiento. Este es también el punto en el proceso donde la potencia de cómputo se convierte en un factor, ya que incluso cuando se ejecutan en hardware de gama alta, ciertos modelos pueden tardar horas, días o incluso semanas en terminar el entrenamiento. Por lo tanto, prepararse para entrenar un modelo de aprendizaje automático es fundamental para obtener los resultados que desea del proceso.