Conceptos básicos de regresión para análisis de negocios

Abadía de Senanque en Provenza con campos de lavanda

Tabla de contenido

  • variables
  • covarianza
  • coeficiente de correlación
  • ecuación de regresión
  • regresiones en excel
  • interpretación
  • la línea de fondo

si alguna vez se ha preguntado cómo se relacionan dos o más datos entre sí (por ejemplo, cómo el pib se ve afectado por los cambios en el desempleo y la inflación), o si alguna vez su jefe le ha pedido que cree un pronóstico o analice predicciones basadas sobre las relaciones entre variables, entonces aprender el análisis de regresión bien valdría su tiempo.

en este artículo, aprenderá los conceptos básicos de la regresión lineal simple, a veces llamada ‘mínimos cuadrados ordinarios’ o regresión de ols, una herramienta comúnmente utilizada en pronósticos y análisis financieros. Comenzaremos aprendiendo los principios básicos de la regresión, primero aprendiendo sobre la covarianza y la correlación, y luego pasando a construir e interpretar una salida de regresión. software comercial popular como microsoft excel puede hacer todos los cálculos y resultados de regresión por usted, pero aún es importante aprender la mecánica subyacente.

conclusiones clave

  • La regresión lineal simple se usa comúnmente en pronósticos y análisis financieros, por ejemplo, para que una compañía sepa cómo un cambio en el pib podría afectar las ventas.
  • Microsoft Excel y otro software pueden hacer todos los cálculos, pero es bueno saber cómo funciona la mecánica de la regresión lineal simple.

variables

En el corazón de un modelo de regresión está la relación entre dos variables diferentes, llamadas variables dependientes e independientes. por ejemplo, suponga que desea pronosticar las ventas de su empresa y ha llegado a la conclusión de que las ventas de su empresa suben y bajan según los cambios en el pib.

las ventas que pronostica serían la variable dependiente porque su valor “depende” del valor de gdp y el gdp sería la variable independiente. entonces necesitaría determinar la fuerza de la relación entre estas dos variables para pronosticar las ventas. si el pib aumenta / disminuye en un 1%, ¿cuánto aumentarán o disminuirán sus ventas?

covarianza

Cov(X,y)=(XnorteXtu)(ynorteytu)norte\ begin {alineado} y cov (x, y) = \ sum \ frac {(x_n – x_u) (y_n – y_u)} {n} \\ \ end {alineado}c o v ( x , y ) = norte( xnxu) ( ynyu)

La fórmula para calcular la relación entre dos variables se llama covarianza. Este cálculo le muestra la dirección de la relación. Si una variable aumenta y la otra variable tiende a aumentar también, la covarianza sería positiva. Si una variable sube y la otra tiende a bajar, entonces la covarianza sería negativa.

El número real que obtienes al calcular esto puede ser difícil de interpretar porque no está estandarizado. una covarianza de cinco, por ejemplo, puede interpretarse como una relación positiva, pero solo se puede decir que la fuerza de la relación es más fuerte que si el número fuera cuatro o más débil que si el número fuera seis.

coeficiente de correlación

Corrmiluntyoonorte=ρXy=CovXysXsy\ begin {alineado} y correlación = \ rho_ {xy} = \ frac {cov_ {xy}} {s_x s_y} \\ \ end {alineado}c o r r e l a t i o n = ρx y=sxsyc o vx y

necesitamos estandarizar la covarianza para permitirnos interpretarla mejor y usarla en el pronóstico, y el resultado es el cálculo de la correlación. El cálculo de la correlación simplemente toma la covarianza y la divide por el producto de la desviación estándar de las dos variables. esto unirá la correlación entre un valor de -1 y +1.

Una correlación de +1 puede interpretarse para sugerir que ambas variables se mueven perfectamente positivamente entre sí y un -1 implica que están perfectamente correlacionadas negativamente. en nuestro ejemplo anterior, si la correlación es +1 y el pib aumenta en un 1%, las ventas aumentarían en un 1%. si la correlación es -1, un aumento del 1% en el pib daría como resultado una disminución del 1% en las ventas, exactamente lo contrario.

ecuación de regresión

ahora que sabemos cómo se calcula la relación relativa entre las dos variables, podemos desarrollar una ecuación de regresión para pronosticar o predecir la variable que deseamos. A continuación se muestra la fórmula para una regresión lineal simple. la “y” es el valor que estamos tratando de pronosticar, la “b” es la pendiente de la línea de regresión, la “x” es el valor de nuestro valor independiente y la “a” representa la intersección en y. La ecuación de regresión simplemente describe la relación entre la variable dependiente (y) y la variable independiente (x).

y=siX+un\ begin {alineado} & y = bx + a \\ \ end {alineado}y = b x + una

la intersección, o “a”, es el valor de y (variable dependiente) si el valor de x (variable independiente) es cero y, por lo tanto, a veces simplemente se denomina “constante”. así que si no hubiera cambios en el pib, su empresa aún haría algunas ventas. este valor, cuando el cambio en gdp es cero, es la intercepción. Eche un vistazo al gráfico a continuación para ver una representación gráfica de una ecuación de regresión. en este gráfico, solo hay cinco puntos de datos representados por los cinco puntos en el gráfico. La regresión lineal intenta estimar una línea que mejor se ajusta a los datos (una línea de mejor ajuste) y la ecuación de esa línea da como resultado la ecuación de regresión.

regresiones en excel

ahora que comprende algunos de los antecedentes que se incluyen en un análisis de regresión, hagamos un ejemplo simple usando las herramientas de regresión de excel. nos basaremos en el ejemplo anterior de tratar de pronosticar las ventas del próximo año en función de los cambios en el pib. La siguiente tabla enumera algunos puntos de datos artificiales, pero estos números pueden ser fácilmente accesibles en la vida real.

añoventaspib
20151001,00%
20162501,90%
20172752,40%
20182002,60%
20193002,90%

simplemente mirando la tabla, puede ver que habrá una correlación positiva entre ventas y pib. ambos tienden a subir juntos. Con Excel, todo lo que tiene que hacer es hacer clic en el menú desplegable de herramientas , seleccionar el análisis de datos  y desde allí elegir la regresión . el cuadro emergente es fácil de completar desde allí; su rango de entrada y es su columna de “ventas” y su rango de entrada x es el cambio en la columna de pib; elija el rango de salida para el lugar donde desea que se muestren los datos en su hoja de cálculo y presione OK. debería ver algo similar a lo que se muestra en la tabla a continuación:

                                            coeficientes estadísticos de regresión

r múltiple0.8292243interceptar34,58409
 

R Plaza

 

0.687613pib88.15552

 

r cuadrado ajustado

 

0.583484 

 

Error estándar51.021807 

observaciones5 5 

 

interpretación

Los principales resultados que debe tener en cuenta para la regresión lineal simple son el r cuadrado, la intersección (constante) y el coeficiente beta (b) de gdp. El número r cuadrado en este ejemplo es 68.7%. Esto muestra cuán bien nuestro modelo predice o pronostica las ventas futuras, lo que sugiere que las variables explicativas en el modelo predijeron el 68.7% de la variación en la variable dependiente. a continuación, tenemos una intersección de 34.58, que nos dice que si el cambio en el pib se pronosticara en cero, nuestras ventas serían de aproximadamente 35 unidades. y finalmente, el gdp beta o coeficiente de correlación de 88.15 nos dice que si el pib aumenta en un 1%, las ventas probablemente aumentarán en aproximadamente 88 unidades.

la línea de fondo

Entonces, ¿cómo utilizaría este modelo simple en su negocio? bueno, si su investigación lo lleva a creer que el próximo cambio de pib será un cierto porcentaje, puede conectar ese porcentaje al modelo y generar un pronóstico de ventas. Esto puede ayudarlo a desarrollar un plan y presupuesto más objetivo para el próximo año.

Por supuesto, esto es solo una regresión simple y hay modelos que puede construir que utilizan varias variables independientes llamadas regresiones lineales múltiples. pero las regresiones lineales múltiples son más complicadas y tienen varios problemas que necesitarían otro artículo para discutir.