Ir al contenido principal

Diagrama de temas

    • style="border:1px solid #000000; padding:1%; "

      Pronóstico

      Realizar un pronóstico es una tarea que involucra realizar predicciones sobre eventos futuros con base en el análisis de eventos pasados relevantes. En el aprendizaje automático, el término “pronóstico” normalmente se refiere a un tipo de pronóstico denominado pronóstico de series temporales. El pronóstico de series temporales es en realidad un subconjunto del análisis de regresión porque intenta identificar las relaciones entre las variables continuas. Lo que hace que el pronóstico de series temporales sea distinto de las tareas de regresión típicas es que cada valor sucesivo de una variable independiente se correlaciona directamente con el valor anterior. Esto significa que los datos de entrenamiento deben estar en un formato de serie temporal.

      Considere una tarea en la que desea pronosticar la temperatura del aire justo fuera de un edificio. Tiene varios sensores colocados alrededor del área para que pueda registrar y acceder a los datos meteorológicos de manera eficiente. Si esos datos estuvieran en un formato de serie temporal, podría tener un aspecto similar al siguiente:

      Hora Humedad relativa (%) Valor de punto de rocío (°C) Velocidad del viento (k/h) Temperatura (°C)
      02:00:00 88 25 10 28
      03:00:00 89 24 9 27
      04:00:00 89 24 8 27
      05:00:00 84 22 9 26
      06:00:00 84 22 12 26

      Como puede ver, cada fila es una hora específica (en este caso, la información meteorológica se registró cada hora). Por lo tanto, los datos son secuenciales y los valores de cada característica dependen directamente de esos valores en el pasado. Por lo tanto, cualquier pronóstico sobre las temperaturas futuras debe considerar cada fila histórica de datos como un miembro de una secuencia, en lugar de como una observación independiente. Esto también significa que el orden de filas en un conjunto de datos de serie temporal es importante y los nuevos registros deben seguir este orden si el conjunto de datos va a crecer.

      Nota: Las series temporales pueden seguir cualquier intervalo de tiempo, no solo horas como en este ejemplo.

      El pronóstico es muy popular en campos como la meteorología, las ventas y cualquier otra tarea que requiera predicciones futuras basadas en datos pasados. Hay muchos algoritmos que realizan el pronóstico de series temporales, incluidas las redes neuronales complejas utilizadas en el aprendizaje profundo. Uno de los algoritmos más comunes se denomina media móvil integrada autorregresiva (ARIMA), que opera en series de tiempo univariantes, es decir, una serie temporal con una sola variable utilizada en la predicción. Por lo tanto, en el ejemplo del clima, solo incluiría la columna de tiempo y la columna de temperatura si estuviera tratando de predecir la temperatura.

      El siguiente gráfico muestra el cambio histórico de temperatura para un período de 24 horas como una línea sólida de color azul oscuro, y también pronostica las próximas seis horas como una línea azul claro discontinua.


      Figura 1. Un gráfico de los valores de temperatura pronosticados por un modelo ARIMA.

      Información adicional

      Para obtener más información sobre el pronóstico con ARIMA, consulte este sitio.