Ir al contenido principal

Diagrama de temas

    • Regresión logística

      Regresión logística


      La regresión logística es un tipo de análisis de regresión en el que la salida es una probabilidad de clasificación entre 0 y 1. El análisis de regresión es la técnica de identificación de las relaciones entre variables. La regresión logística es uno de los algoritmos de aprendizaje automático más comunes que se usan en la clasificación porque puede producir resultados con relativa rapidez en conjuntos de datos más grandes.

      El término regresión logística puede ser algo confuso. Aunque, desde el punto de vista técnico, es un tipo de análisis de regresión, la regresión logística se utiliza con más frecuencia para tareas de clasificación. Cuando los profesionales de la ciencia de datos y el aprendizaje automático usan el término general "regresión", por lo general, se refieren a la tarea de estimar las relaciones entre las variables continuas y generar una estimación que también es un valor continuo. Por ejemplo, predecir el valor monetario de una casa es un tipo de tarea de regresión: no está poniendo nada en categorías. Un algoritmo como la regresión lineal se puede utilizar para resolver este problema porque genera valores continuos. Por otro lado, la regresión logística se puede utilizar para colocar los datos en categorías, por lo que normalmente se trata como una tarea de clasificación.

      El valor que genera un algoritmo de regresión logística se denomina función logística. Este es un tipo de función sigmoidea porque tiene forma de S, como se muestra aquí.

      Figura 1. Una función sigmoidea empleada en la regresión logística.


      En la situación que se muestra en el gráfico, trata de predecir si alguien recomendará o no un nuevo videojuego a otras personas después de haberlo jugado. Una de las características que determina esto es la "calificación del jugador", que el jugador proporciona como parte de una encuesta de fin de juego. Observe que la función es capaz de ajustarse al valor atípico en la parte superior derecha, y que al hacerlo, toma una forma de S. Si la función fuera una línea recta (como en la regresión lineal), no sería capaz de ajustar este valor atípico de manera limpia.

      La función logística se puede expresar como la siguiente ecuación:


      Donde:


      - t es la estimación entre infinito negativo e infinito positivo.

      - e es la base natural del logaritmo.

      El valor de estimación (es decir, el valor estimado por la función logística) está entre 0 y 1. La meta de la función logística es estimar los parámetros del modelo, los valores que el modelo "aprende" para mejorar sus capacidades de toma de decisiones.

      Información adicional

      Para obtener más información sobre la regresión logística, consulte este sitio.