La regresión lineal y la regresión logística son dos procesos de aprendizaje automático que los programadores utilizan para desarrollar sistemas interactivos y reactivos. Las líneas de regresión pueden calcularse para mostrar la relación predictiva entre una entrada arbitraria y un resultado deseado. La regresión logística, por su parte, puede utilizarse para analizar problemas de clasificación.
En este artículo, exploramos qué son los modelos de regresión lineal y logística, cómo calcular ambos tipos de regresión y cuándo convertir la regresión lineal en logística.
¿Qué es la regresión lineal?
Un modelo de regresión lineal se crea utilizando métodos estadísticos para predecir la relación entre una variable dependiente y una variable independiente, que da lugar a una respuesta escalar. La relación entre las variables permite obtener información sobre una muestra o población. Cuando un modelo de regresión lineal incluye sólo una variable causal o independiente, sigue siendo una regresión lineal simple.
Cuando un modelo contiene múltiples variables explicativas, el proceso se convierte en una regresión lineal múltiple. En términos matemáticos, la regresión lineal se expresa como una ecuación lineal, donde una variable dependiente es una función de una variable independiente. Al calcular la regresión lineal simple, esta ecuación se muestra como una línea que representa los cambios en las variables.
Relacionado: Regresión lineal: Una guía definitiva
¿Qué es la regresión logística?
La regresión logística utiliza la regresión lineal para calcular resultados de aprendizaje automático que sólo tienen dos resultados, lo que convierte a este modelo de regresión en un método de análisis binario. Predice la probabilidad de un resultado y es esencial en el aprendizaje automático supervisado. A diferencia de un modelo de regresión lineal, un modelo de regresión logística utiliza un conjunto de variables independientes para determinar la probabilidad de que se produzca un cambio o un evento.
Este proceso da como resultado dos variables dependientes porque estos valores permanecen constantes o sólo pueden cambiar según la influencia de las variables independientes. Al calcular este modelo de regresión, las variables independientes pueden ser continuas y representar valores infinitos, variables discretas ordinales y finitas en orden de clasificación o variables discretas nominales y finitas sin orden de clasificación.
Relacionado: Relacionado: Análisis de regresión: Qué es y cómo utilizarlo
Cálculo de la regresión lineal frente a la logística
Tanto los modelos de regresión lineal como los de regresión logística son necesarios para el análisis de regresión en una serie de aplicaciones. Además, la regresión logística se basa en la línea de regresión que se deriva de un modelo lineal para obtener sus resultados binarios. Sin embargo, existen algunas diferencias a la hora de calcular los dos valores. Utilice los siguientes pasos para calcular la regresión lineal y la regresión logística y vea cómo los dos modelos se correlacionan entre sí:
Cómo calcular la regresión lineal
Como los modelos de regresión lineal utilizan líneas para representar la tasa de cambio y las relaciones estadísticas entre las entradas y las salidas, este modelo utiliza una ecuación lineal. Para derivar los valores de la regresión lineal, se puede utilizar la fórmula
Y(x) = mx + C
En la fórmula, «Y» es una variable dependiente y una función de «x,» que representa la variable independiente o explicativa. Puede utilizar los siguientes pasos para aplicar la fórmula para calcular la regresión lineal:
- Determinar los valores de entrada para x. Al construir el modelo de regresión lineal, deje que x represente el valor de entrada. Por ejemplo, si un desarrollador de software quiere un determinado resultado (Y en la ecuación), utiliza la variable x para representar el valor de entrada, como la introducción de un código específico que indica a un sistema que debe generar un resultado funcional.
- Asigne el gradiente al valor m. El valor del gradiente representa la pendiente de la línea del modelo de regresión y mide la velocidad a la que cambia la variable dependiente en función de la variable independiente.
- Sustituye la constante por C. La variable C es el valor constante en su algoritmo que permanece igual a lo largo del modelo de regresión lineal. En el aprendizaje automático, una constante puede ser los valores predictivos que los programadores utilizan para obtener resultados al calcular la regresión lineal con diferentes entradas.
- Calcula la ecuación de regresión lineal. Una vez que tienes tus variables y valores predictivos, puedes calcular toda la ecuación para encontrar el modelo de regresión lineal, que te da una línea recta. Con esta información, los programadores que desarrollan y diseñan sistemas de aprendizaje automático pueden analizar la funcionalidad, la activación y la eficacia del aprendizaje supervisado de diversas redes de inteligencia artificial.
Relacionado: Análisis de Regresión Múltiple: Definición y cómo calcularlo
Cómo calcular modelos de regresión logística
La regresión logística se centra en determinar un umbral de probabilidad que dicta un rango razonable en el que pueden aparecer las variables dependientes. Dado que el análisis de regresión logística ofrece resultados binarios, la ecuación para calcular este valor difiere de las ecuaciones de regresión lineal y de los procesos de cálculo.
Se puede aplicar la ecuación sigmoidea para calcular la regresión logística:
S(x) = 1 / (1 + e-x)
En esta fórmula, x representa el valor de entrada, y la variable S es una función de x. El valor e representa el valor del error de predicción que el método de los cuadrados medios de la regresión lineal utiliza para determinar la precisión del análisis predictivo. Para calcular la regresión logística a partir de un modelo de regresión lineal, utilice los siguientes pasos para aplicar la fórmula:
- Utiliza la recta de regresión del modelo lineal. Cuando se calcula una línea de regresión, se puede convertir este valor predictivo en un modelo de regresión logística que proporciona un resultado probable entre cero y uno.
- Asigna los valores de la regresión lineal a la función sigmoidea. Utilizando el valor de x y el error residual (e) de su modelo de regresión lineal, introduzca estos valores en la ecuación sigmoidea.
- Convierte el valor sigmoide en un uno o un cero. Una vez que obtenga el valor de la regresión logística a partir de la función sigmoidea, puede convertir este valor en un uno o un cero, dependiendo de dónde aparezca el valor en la curva S. Por ejemplo, si la regresión logística da como resultado un valor de 0,78, puede convertirlo en un uno para representar el valor discreto más cercano.
Relacionado: Regresión Logística vs. Regresión Lineal: ¿Cuál es la diferencia?
Cuándo convertir la regresión lineal en logística
La conversión de un modelo lineal a uno de regresión logística puede ser necesaria cuando se aplica la clasificación binaria a un conjunto de datos de muestra. La clasificación binaria se produce cuando se crea un parámetro para clasificar los datos de la muestra en dos categorías distintas. En el aprendizaje automático supervisado, convertir la regresión lineal en regresión logística es necesario para resolver problemas de clasificación cuando se analiza el error residual de una línea de regresión. Considere varios casos más en los que es aplicable convertir la regresión lineal a logística:
- Evaluar la proporción de los beneficios con respecto a las pérdidas en las ventas
- Analizar los efectos en los síntomas durante los estudios farmacéuticos
- Medición de las tasas de abandono de clientes en marketing