Ir al contenido principal

Diagrama de temas

    • Regresión lineal y AA

      Regresión lineal y AA

      La ecuación lineal es un ejemplo sencillo de realizar estimaciones basadas en un conjunto de datos, pero hay formas más eficaces de aplicar la regresión lineal al aprendizaje automático. Es posible que la ecuación lineal no funcione bien o como se esperaba con datos que no se pueden ajustar linealmente. Tampoco tiene en cuenta múltiples predictores, después de todo, la edad de un televisor no es el único factor que influye en cuánto vende. Tiene otros factores como la resolución de pantalla/número de píxeles (1080p, 4K, etc.), la frecuencia de actualización, el tamaño de la pantalla, qué tecnología de panel de visualización utiliza y muchos más. Todo esto contribuye potencialmente al valor del televisor. Por lo tanto, se necesitaría un enfoque diferente para hacer estimaciones de precios para este mismo modelo de televisión, o para predecir para qué se venderá un modelo diferente de televisión en el futuro.

      Las tareas de aprendizaje automático a menudo requieren enfoques algo más complejos para la regresión lineal. En un problema de aprendizaje automático, el objetivo del algoritmo de regresión lineal es encontrar la diferencia entre los datos de entrenamiento de entrada y el ajuste de línea estimativo que genera el modelo. Esta diferencia se denomina error o costo. Cada característica del conjunto de datos, así como cualquier permutación generada por un profesional humano durante el proceso de ingeniería de características, tendrá un parámetro correspondiente θi que el modelo debe resolver. Estos parámetros son lo que el modelo "aprende".

      Nota: El símbolo θ es la letra griega theta.

      Un modelo lineal básico en el aprendizaje automático se puede expresar como:


      Donde:

           ŷ es la variable que está intentando estimar (la variable dependiente).

           θ0 es la intersección (equivalente a b en la ecuación lineal).

           θ1 es un parámetro del modelo (equivalente a m en la ecuación lineal).

           - x es la variable independiente de interés: las características que extraería y pasaría al modelo.


      Nota: Recuerde, ŷ (pronunciado "y-hat") se utiliza a menudo para significar una estimación de un modelo.

      Con el ejemplo de precio de TV, se entrena el modelo en datos históricos con varias características. Puede construir un modelo lineal basado en una o varias de estas características. Por motivos de simplicidad, desea comenzar asignando una sola característica: durante cuánto tiempo se ha vendido el televisor. Esto se puede conectar a la fórmula como:


      Al asignar esta función lineal a más características, puede comparar qué tan bien se ajustan esas funciones a una línea recta. Si la línea se ajusta relativamente de forma recta a través de los datos, esa característica particular tiene una fuerte correlación con la variable de predicción.

      La regresión lineal se utiliza comúnmente en el aprendizaje supervisado para estimar valores numéricos (las variables dependientes) que aumentan o disminuyen en función de varias características (las variables independientes).