Ir al contenido principal

Diagrama de temas

    • Evaluación de modelos de regresión

      Evaluación de modelos de regresión


      Archivo de datos

      /home/student/ITSAI/Regression/data/boston_newdata.csv

      Antes de empezar

      Regression-Boston.ipynb está abierto en Jupyter Notebook.
      Nota: Si cerró Jupyter Notebook desde que completó la actividad anterior, deberá reiniciar Jupyter Notebook y volver a abrir el archivo. Para asegurarse de que todos los objetos y la salida de Python están en el estado correcto para comenzar esta actividad:

      Seleccione Kernel→Reiniciar & y Borrar salida.
      Seleccione Reiniciar y borrar todas las salidas.
      Desplácese hacia abajo y seleccione la celda con la etiqueta Comparar métricas de evaluación para cada modelo.
      Seleccione Celda→ Ejecutar todo lo anterior.

      Escenario

      Ahora que regularizó los modelos de regresión, desea evaluar su rendimiento. Utilizará tres métricas diferentes para evaluar los modelos. Una vez que haya evaluado los modelos, deberá elegir el que mejor funcione y lo usará para realizar predicciones sobre nuevos datos que el modelo aún no vio.


      -------------------------------------------------------------------------------------------------------------------------------------------------------------

      1. Compare las métricas de evaluación para cada modelo.
      1. Desplácese hacia abajo y vea la celda titulada Comparar las métricas de evaluación para cada modelo y examine la lista de código que aparece debajo de ella.

      Este código comparará las puntuaciones de R2 de los cuatro modelos que creó en el tema anterior.

      2. Ejecute la celda de código.

      3. Examine el resultado.

      La puntuación de R2 se muestra para cada modelo. Cuanto mayor sea la puntuación de R2, mejor. La tabla se ordena por la puntuación de R2 más alta. El modelo de lazo tiene la puntuación más alta, pero los modelos de red elástica y cresta están cerca.

      4. En la siguiente celda de código, examine el código.

      Este código comparará las puntuaciones de error absoluto medio (EAM) de los cuatro modelos.

      5. Ejecute la celda de código.

      6. Examine el resultado.

      La puntuación EAM se muestra para cada modelo. Para EAM, las puntuaciones más bajas son mejores. El modelo de lazo tiene la puntuación más baja, pero el modelo de red elástica está cerca.

      7. En la siguiente celda de código, examine el código.

      Este código comparará las puntuaciones de error cuadrático medio (ECM) de los cuatro modelos.

      8. Ejecute la celda de código.

      9. Examine el resultado.

      La puntuación ECM se muestra para cada modelo. Como con EAM, las puntuaciones más bajas de ECM son mejores. El modelo de lazo, nuevamente, vuelve a tener la puntuación más baja.

      ------------------------------------------------------------------------------------------------------------------------------------------------------------------------
      2. Realice predicciones sobre los nuevos datos con el modelo de lazo.
      1. Desplácese hacia abajo y vea la celda titulada Realizar predicciones en los nuevos datos con el modelo de lazo y examine la lista de código debajo de ella.

      Este código cargará el archivo boston_newdata.csv en un archivo DataFrame.

      2. Ejecute la celda de código.

      3. Examine el resultado.

      50 registros se cargan desde boston_newdata.csv. Recuerde que se trata de un conjunto de datos nuevos, independiente de los conjuntos de entrenamiento y validación. Este conjunto no incluye valores de etiqueta (target).

      4. En la siguiente celda de código, examine el código.

      Este código utilizará los nuevos datos y el modelo de lazo para predecir el objetivo (el valor medio en miles de dólares) para cada casa.

      5. Ejecute la celda de código.

      6. Examine el resultado.

      El modelo de lazo predijo el valor medio de cada casa en miles de dólares.

      ------------------------------------------------------------------------------------------------------------------------------------------------------------------------
      3. Diagrame una línea de mejor opción para las nuevas predicciones de datos.
      1. Desplácese hacia abajo y vea la celda titulada Diagramar una línea de mejor opción para las nuevas predicciones de datos y examine la lista de código que se muestra debajo de ella.

      Este código diagramará una línea de mejor opción comparando LSTAT (porcentaje de hogares de bajos ingresos) con las predicciones del valor medio de las viviendas en los nuevos datos.

      2. Ejecute la celda de código.

      3. Examine el resultado.

      Como era de esperar, el porcentaje de hogares de bajos ingresos se correlaciona negativamente con el valor de una casa según lo predicho por el modelo. En otras palabras, el modelo predijo que las áreas con muchos hogares de bajos ingresos suelen tener casas menos valiosas y viceversa.

      -------------------------------------------------------------------------------------------------------------------------------------------------------------

      4. Cierre este kernel de Jupyter Notebook y la máquina virtual.
      1. En Firefox, seleccione la pestaña Regression-Boston.ipynb.
      2. En el menú, seleccione Kernel→Cerrar.
      3. En el cuadro  de diálogo ¿Cerrar kernel?, seleccione Cerrar.
      4. Cierre Firefox.
      5. Cierre la ventana Terminal que ejecuta el programa Jupyter Notebook.
      6. En el menú VirtualBox VM en la parte superior de la pantalla, seleccione Equipo→Apagar ACPI y, si es necesario, seleccione Apagar. Compruebe que la ventana de la VM se cierre.
      7. Cierre la ventana Oracle VM VirtualBox Manager.