La regresión lineal es un método para evaluar la conexión entre dos variables. La regresión lineal es un proceso estadístico que se utiliza en el trabajo estadístico cotidiano. Entender la regresión lineal y sus aplicaciones puede ser un paso sabio en tu carrera, pero requiere investigación y práctica. Este artículo le proporcionará una mejor comprensión de este proceso estadístico.
En este artículo, hablamos de lo que es la regresión lineal, sus principales aplicaciones, la ecuación de regresión lineal, los valores atípicos en la regresión lineal y proporcionamos un ejemplo de regresión lineal.
¿Qué es la regresión lineal?
Encontrar una relación lineal entre dos variables se llama regresión lineal. Mediante la regresión lineal, se puede predecir una variable a partir del valor de otra. La variable dependiente o de respuesta es lo que se predice, mientras que la variable independiente o explicativa es lo que se conoce.
Hay dos tipos principales de regresión lineal:
- Regresión lineal simple: Utiliza una única variable independiente para intentar predecir el resultado de una variable dependiente
- Regresión lineal múltiple : utiliza dos o más variables independientes para intentar predecir el resultado de una variable dependiente
Al realizar una regresión lineal simple, usted' está haciendo ciertas suposiciones sobre los datos disponibles. Éstas son:
-
Homogeneidad de la varianza: el tamaño del error predicho no es significativamente diferente en todos los valores de la variable independiente
-
Independencia de la observación: Todas las observaciones del conjunto de datos se han recogido mediante métodos de muestreo estadísticamente válidos, sin relaciones ocultas entre ellas.
-
Normalidad: hay una distribución normal de los datos
-
Una relación lineal entre variables: La regresión lineal supone que existe una relación lineal entre las variables independiente y dependiente, lo que significa que la línea que pasa por los puntos de datos es recta
Relacionado: Regresión logística frente a regresión lineal: ¿Cuál es la diferencia?
Aplicaciones de la regresión lineal
La regresión lineal se utiliza en múltiples campos y tiene muchos usos prácticos. Se utiliza principalmente de dos maneras:
- Si el objetivo de su uso es predecir la evolución de una variable o reducir el margen de error, se suele utilizar para comparar un modelo predictivo con un conjunto de datos observados que contiene valores de respuesta y variables explicativas. Si, después de crear el modelo, se determinan los valores de las variables explicativas adicionales sin los correspondientes valores de respuesta, el modelo predictivo se suele utilizar para hacer una predicción.
- Si el propósito de utilizar la regresión lineal es mostrar la variación en la variable de respuesta que la variación en las variables explicativas puede causar, se puede analizar para determinar la fuerza de la relación entre las variables explicativas y las de respuesta. A menudo se utiliza de este modo para determinar si algunas variables explicativas y de respuesta no tienen una relación lineal entre sí.
Los campos que más utilizan la regresión lineal son:
-
Estadísticas: Tiene su origen en la estadística y se utiliza en la modelización estadística para mostrar las relaciones entre las variables dependientes e independientes de diversos conjuntos de datos
-
Aprendizaje automático: este campo relativamente nuevo también utiliza la regresión lineal, principalmente para la elaboración de modelos predictivos, con el fin último de limitar al máximo el margen de error de un modelo
-
Finanzas: Los profesionales de las finanzas analizan la relación lineal entre los precios de las materias primas y los precios de las acciones de las empresas que comercian con esas materias primas respectivas
-
Ventas: Los profesionales de las ventas analizan la relación entre diferentes variables en un intento de predecir las ventas futuras
Relacionado: Ecuaciones lineales y no lineales: Entendiendo las diferencias clave
Ecuación de regresión lineal
La ecuación de la regresión lineal simple es:
Y = a + bX + u
La ecuación de la regresión lineal múltiple es:
Y = a + b1 x 1 + b2 x 2 + b3 x 3 + … + b + u
Dónde:
Y = variable dependiente (o de respuesta)
X = variable independiente (o explicativa)
b = pendiente (o inclinación de la línea gráfica)
a = intercepción (o donde la línea se cruza con un eje)
u = residuo de regresión (o la distancia vertical entre un punto de datos y la línea de regresión)
Relacionado: Análisis de regresión múltiple: Definición y cómo calcularlo
¿Qué es la técnica de regresión por mínimos cuadrados?
La técnica de regresión por mínimos cuadrados es un tipo de análisis de regresión cuyo objetivo es determinar la línea de mejor ajuste para un conjunto de datos, que se refiere a una línea que pasa por un gráfico de dispersión de puntos de datos que muestra mejor la relación entre los respectivos puntos. Se suele utilizar en un análisis de regresión lineal para determinar la ecuación geométrica de la línea respectiva. El análisis de regresión simple produce una línea recta, mientras que una regresión con múltiples variables puede producir una línea curva.
Valores atípicos en la regresión lineal
Los valores atípicos estadísticos son puntos de datos que difieren significativamente de otras observaciones. Pueden estar causados por una variabilidad anormal en el conjunto de datos, pero también pueden indicar que se ha producido un error en alguna parte del cálculo. Pueden influir significativamente en los resultados, por lo que determinar correctamente su origen es crucial para la precisión de la regresión.
Las dos formas principales de detectar los valores atípicos al desarrollar modelos de regresión lineal son:
- Distancia de Mahalanobis: Consiste en medir la distancia entre un punto elegido (P) y una distribución (D). Su objetivo es medir la distancia entre P y la media de D, calculada en número de desviaciones estándar.
- Apalancamiento: Utilizado a menudo en el análisis de regresión, el apalancamiento es una forma de medir la distancia entre los valores de la variable independiente de una observación y otras observaciones.
Relacionado** : [ ¿Qué le dice el análisis de regresión?**](https://www.indeed.com/career-advice/career-development/what-does-regression-analysis-tell-you)
Ejemplo de regresión lineal
Considere este ejemplo de regresión lineal simple:
Puede utilizar la regresión lineal para determinar la relación entre la edad de un coche determinado y su precio de venta previsto. Por regla general, el precio de un coche disminuye gradualmente a medida que envejece, lo que significa que existe una relación negativa entre el precio del coche (Y) y su edad (X). Analizando la relación entre la edad del coche y su precio en años anteriores, podemos crear un modelo y predecir cómo cambiará el precio en los próximos años.