Ir al contenido principal

Diagrama de temas

    • Entrenamiento y ajuste de modelos de regresión logística

      Entrenamiento y ajuste de modelos de regresión logística

      Teniendo en cuenta lo que sabe sobre el conjunto de datos hasta el momento, ¿qué características cree que podrían influir en las tasas de supervivencia?

      Las respuestas pueden variar. El nivel socioeconómico de un pasajero (Pclass y Fare) puede correlacionarse con la forma en que se priorizó el rescate de ese pasajero en comparación con otros. Age podría también ser un factor, ya que los pasajeros mayores pueden haber sido más lentos para huir del peligro. SibSp, Parch o SizeOfFamily también podrían influir en las tasas de supervivencia, ya que los pasajeros que viajaron solos pueden no haber recibido la misma cantidad de ayuda durante los intentos de rescate que los que viajaron con sus seres queridos. Dada la directiva de "las mujeres y los niños primero", SexEncoding también podría influir en la tasa de supervivencia.


      Resumen

      ¿Qué tipo de datos con los que podría estar interesado en trabajar sería útil para la clasificación?

      Las respuestas variarán. La clasificación se puede aplicar a muchos casos de uso, incluidos, entre otros: la identificación de documentos y otros objetos falsificados; el diagnóstico de enfermedades en pacientes dados sus antecedentes médicos; predecir cuándo fallarán los dispositivos electrónicos dadas ciertas condiciones; determinar qué productos sugerir a los clientes en función de su historial de compras; y así sucesivamente.

      Dados los conjuntos de datos que le interesan y los problemas de clasificación que está intentando resolver, ¿qué métricas de evaluación cree que serían más útiles para ajustar un modelo de clasificación?

      Las respuestas variarán. Esto dependerá de los datos y del dominio del problema. La precisión es quizás la métrica más simple y común, pero a menudo es engañosa y arrulla a las personas en un falso optimismo sobre su modelo. Aun así, para algunos problemas, la precisión puede ser lo suficientemente buena. Los modelos entrenados en conjuntos de datos desequilibrados pueden estar mejor con métricas como la precisión y la recuperación, especialmente en aplicaciones críticas como la atención médica, donde la elección de la métrica puede necesitar alinearse con preocupaciones éticas altamente confidenciales. No hay una métrica objetivamente “mejor” para usar en todos los casos, por lo que generalmente se reduce al juicio del profesional.


      Resumen

      ¿Qué tipo de datos con los que podría estar interesado en trabajar sería útil para la regresión?

      Las respuestas variarán. La regresión se puede aplicar a muchos casos de uso, incluidos, entre otros: predecir los precios del mercado de valores; predecir la puntuación final de un juego; identificar la dosis correcta del medicamento o el nivel de tratamiento para un paciente dado su historial médico; la previsión de las condiciones atmosféricas que podrían indicar cambios en el tiempo o el clima; y así sucesivamente.

      Dados los conjuntos de datos que le interesan y los problemas de clasificación que está intentando resolver, ¿qué métricas de evaluación cree que serían más útiles para ajustar un modelo de regresión?

      Las respuestas variarán, pero en su mayor parte, métricas como MSE y MAE son la forma preferida de identificar el costo de un modelo de regresión. Algunos estudiantes pueden preferir obtener la versión raíz de MSE para que los resultados sean más interpretables. Otros estudiantes pueden confiar en R2 a pesar de ser menos ideal, ya que es la métrica de puntuación predeterminada en muchas herramientas de ciencia de datos y el resultado es relativamente fácil de interpretar.