Qué es la regresión lineal simple y cómo funciona

Abadía de Senanque en Provenza con campos de lavanda

Los modelos de regresión lineal se utilizan para mostrar o predecir la relación entre dos variables o factores. El factor que se predice (el factor que resuelve la ecuación ) se llama variable dependiente. Los factores que se utilizan para predecir el valor de la variable dependiente se denominan variables independientes.

Los buenos datos no siempre cuentan la historia completa. El análisis de regresión se usa comúnmente en la investigación, ya que establece que existe una correlación entre las variables. Pero la correlación no es lo mismo que la causalidad. Incluso una línea en una regresión lineal simple que se ajusta bien a los puntos de datos, puede no decir algo definitivo sobre una relación de causa y efecto.

En regresión lineal simple, cada observación consta de dos valores. Un valor es para la variable dependiente y un valor es para la variable independiente.

  • Análisis de regresión lineal simple: la forma más simple de análisis de regresión se utiliza en una variable dependiente y una variable independiente. 
  • En este modelo simple, una línea recta aproxima la relación entre la variable dependiente y la variable independiente.
  • análisis de regresión múltiple: cuando se usan dos o más variables independientes en el análisis de regresión, el modelo ya no es lineal simple.

modelo de regresión lineal simple

El modelo de regresión lineal simple se representa así: y = ( β 0 + β 1 + Ε

Por convención matemática, los dos factores que están involucrados en un análisis de regresión lineal simple se designan x e y . la ecuación que describe la forma y se relaciona con x se conoce como el modelo de regresión . El modelo de regresión lineal también contiene un término de error representado por Ε , o la letra griega épsilon. El término de error se usa para explicar la variabilidad en y que no puede explicarse por la relación lineal entre x e y . También hay parámetros que representan la población estudiada.Estos parámetros del modelo están representados por ( β 0+ β 1 x ).

La ecuación de regresión lineal simple se representa así: Ε ( y ) = ( β 0 + β 1 x ).

La ecuación de regresión lineal simple se representa gráficamente como una línea recta.

( β 0 es la intersección y de la línea de regresión.

β 1 es la pendiente.

Ε ( y ) es el valor medio o esperado de y para un valor dado de x .

Una línea de regresión puede mostrar una relación lineal positiva, una relación lineal negativa o ninguna relación. Si la línea graficada en una regresión lineal simple es plana (no inclinada), no hay relación entre las dos variables. si la línea de regresión se inclina hacia arriba con el extremo inferior de la línea en la intersección y (eje) del gráfico, y el extremo superior de la línea se extiende hacia arriba en el campo del gráfico, lejos de la intersección x (eje) existe una relación lineal positiva . si la línea de regresión se inclina hacia abajo con el extremo superior de la línea en la intersección y (eje) del gráfico, y el extremo inferior de la línea se extiende hacia abajo en el campo del gráfico, hacia la intersección x (eje) existe una relación lineal negativa.

ecuación de regresión lineal estimada

Si se conocieran los parámetros de la población, la ecuación de regresión lineal simple (que se muestra a continuación) podría usarse para calcular el valor medio de y para un valor conocido de x .

Ε ( y ) = ( β 0 + β 1 x ).

sin embargo, en la práctica, los valores de los parámetros no se conocen, por lo que deben estimarse utilizando datos de una muestra de la población. Los parámetros de la población se estiman utilizando estadísticas de muestra. las estadísticas de muestra están representadas por b 0 + b 1. cuando las estadísticas de muestra se sustituyen por los parámetros de la población, se forma la ecuación de regresión estimada.

La ecuación de regresión estimada se muestra a continuación.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) se pronuncia y hat .

El gráfico de la ecuación de regresión simple estimada se llama línea de regresión estimada.

la b 0 es la intersección y.

el b 1 es la pendiente.

la ŷ ) es el valor estimado de y para un valor dado de x .

nota importante: el análisis de regresión no se utiliza para interpretar las relaciones de causa y efecto entre variables. Sin embargo, el análisis de regresión puede indicar cómo se relacionan las variables o en qué medida las variables están asociadas entre sí. Al hacerlo, el análisis de regresión tiende a establecer relaciones sobresalientes que justifiquen que un investigador conocedor eche un vistazo más de cerca.

también conocido como: regresión bivariada, análisis de regresión

ejemplos:  el método de mínimos cuadrados es un procedimiento estadístico para utilizar datos de muestra para encontrar el valor de la ecuación de regresión estimada. el método de mínimos cuadrados fue propuesto por carl friedrich gauss, quien nació en el año 1777 y murió en 1855. el método de mínimos cuadrados todavía se usa ampliamente.

fuentes:

anderson, dr, sweeney, dj y williams, ta (2003). fundamentos de las estadísticas de negocios y economía (3ª ed.) mason, ohio: southwestern, thompson learning.

______. (2010) explicado: análisis de regresión. mit noticias.

mcintyre, l. (1994) utilizando datos de cigarrillos para una introducción a la regresión múltiple. revista de educación estadística, 2 (1).

mendenhall, w., y sincich, t. (1992) estadísticas de ingeniería y ciencias (3ª ed.), nueva york, ny: dellen publishing co.

panchenko, d. 18.443 estadísticas para aplicaciones, otoño de 2006, sección 14, regresión lineal simple. (instituto de tecnología de massachusetts: mit opencourseware)