R2
)- n
es el tamaño del conjunto de entrenamiento, es decir, el número total de ejemplos.- yi
es el valor real de una variable.- ŷi
es el valor estimado de la variable.- J(θ)
es la función de costo en sí.y
e ŷ
) sin tener en cuenta el signo (es decir, positivo o negativo) de esos valores. Una ventaja de MAE sobre MSE es que MSE tiende a minimizar los errores que son mucho menos de 1, mientras que también exagera los errores que son mucho mayores de 1; MAE no es tan susceptible a esto. Sin embargo, MSE se prefiere a menudo porque es diferenciable (una derivada existe para todos los valores en la función) y hace juego lo que la ecuación linear está minimizando.
R2
se utiliza comúnmente como un método de puntuación para evaluar el rendimiento de un modelo de regresión. R2
suele estar entre 0 y 1. Si la línea de regresión fuera capaz de pasar perfectamente por cada punto de datos, el R2
sería 1; por otro lado, si la línea no pasa a través de más puntos, R2
disminuye, ya que se vuelve cada vez menos capaz de explicar la varianza. Por ejemplo, un R2
de 0,76 indica que el 76 % de la varianza en la variable objetivo (es decir, la etiqueta que está tratando de estimar) es explicable por el modelo. El otro 24 % no puede ser explicado por el modelo.R2
suele ser positivo, también puede ser negativo. Esto sucede cuando el modelo realmente tiene un rendimiento peor que la línea de base (es decir, el azar), que puede ser el resultado de que el modelo aprenda los patrones incorrectos en los datos. A pesar de usar en sus cálculos operaciones para obtener el cuadrado, la definición más común de R2
resta esas operaciones de 1, que es lo que puede conducir a una salida negativa.R2
no siempre implica un modelo más hábil y viceversa. Un modelo con un valor bajo de R2
puede tener una mejor potencia de estimación que un modelo con un valor de R2
alto. Incluso si el R2
cambia drásticamente de un modelo a otro, el error de estimación puede seguir siendo exactamente el mismo. Esto se debe a que una fuerte conexión entre variables no siempre implica que una variable tenga una fuerte causalidad con otra. Por lo tanto, en general es preferible minimizar una función de costo como MSE, en lugar de intentar optimizar R2
.R2
) con el coeficiente de correlación (R
). Como era de esperar, el primero toma el segundo y lo multiplica por sí mismo. Mientras que las medidas de R2
explicaron la varianza, R
mide las relaciones lineales entre las variables.-------------------------------------------------------------------------------------------------------------------------------------------------------------
R2
de los cuatro modelos que creó en el tema anterior.R2
se muestra para cada modelo. Cuanto mayor sea la puntuación de R2
, mejor. La tabla se ordena por la puntuación de R2
más alta. El modelo de lazo tiene la puntuación más alta, pero los modelos de red elástica y cresta están cerca.DataFrame
.target
).LSTAT
(porcentaje de hogares de bajos ingresos) con las predicciones del valor medio de las viviendas en los nuevos datos.-------------------------------------------------------------------------------------------------------------------------------------------------------------