Capítulo 5
Correlación y Regresión Lineal
Modelar relaciones entre variables de negocio internacional
🎯 Objetivos de aprendizaje
  1. Calcular e interpretar el coeficiente de correlación de Pearson $r$.
  2. Estimar los parámetros de la recta de regresión mínimo-cuadrática.
  3. Interpretar $R^2$ como medida de ajuste del modelo.
  4. Realizar predicciones con intervalo de confianza.
  5. Diagnosticar los supuestos de la regresión (normalidad, homocedasticidad, VIF, Durbin-Watson).

1. Correlación de Pearson

Coeficiente de correlación de Pearson
$$r = \frac{\displaystyle\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\displaystyle\sum_{i=1}^n (x_i-\bar{x})^2 \cdot \sum_{i=1}^n (y_i-\bar{y})^2}}$$

$r \in [-1, 1]$. Mide la fuerza y dirección de la relación lineal. No implica causalidad.

Valor de |r|InterpretaciónEjemplo de negocio
0.00 – 0.20Nula o despreciablePrecio del café y tasa de desempleo de Suiza
0.20 – 0.40DébilPublicidad y ventas en mercados saturados
0.40 – 0.70ModeradaPIB per cápita y exportaciones de servicios
0.70 – 0.90FuerteTipo de cambio y exportaciones manufactureras
0.90 – 1.00Muy fuerteCantidad producida y costo variable total

2. Regresión Lineal Simple

Modelo de regresión lineal simple
$$\hat{Y} = b_0 + b_1\,X$$ $$b_1 = \frac{\displaystyle\sum(x_i-\bar{x})(y_i-\bar{y})}{\displaystyle\sum(x_i-\bar{x})^2} = r\cdot\frac{s_y}{s_x} \qquad b_0 = \bar{y} - b_1\bar{x}$$

$b_1$ = cambio esperado en $Y$ por cada unidad adicional de $X$ (ceteris paribus).

📈 Explorador de Regresión — Dibuja tus datos ⚡ Interactivo

Haz clic en el área de graficación para añadir puntos. Clic derecho para eliminar el punto más cercano. La recta de regresión se actualiza en tiempo real.

n
0
Correlación r
R² (ajuste)
Intercepto b₀
Pendiente b₁
Ecuación

Predicción puntual

Ŷ predicho
IC inferior
IC superior

3. Diagnóstico de Supuestos

SupuestoTest formalUmbral / reglaSi se viola…
Normalidad de residuosShapiro-Wilk$p > 0.05$ → no se rechaza normalidadTransformar $Y$ o usar regresión robusta
HomocedasticidadBreusch-Pagan: $BP = n \cdot R^2_{aux} \sim \chi^2_{(k)}$$p > 0.05$Errores estándar robustos (Huber-White) o WLS
IndependenciaDurbin-Watson $DW \approx 2(1-\hat\rho)$$1.5 \leq DW \leq 2.5$Incluir $Y_{t-1}$ o modelos ARIMA
No multicolinealidad$\text{VIF}_j = 1/(1-R_j^2)$VIF $< 5$ (aceptable), $< 10$ (tolerable)Eliminar variable, índice compuesto, Ridge
🔬 Diagnóstico de Residuos — Gráfico interactivo ⚡ Interactivo

Selecciona el tipo de gráfico de diagnóstico. Se usan los datos del explorador de regresión.

📋 Calculador de Tests de Supuestos ⚡ Interactivo

Ingresa tu estadístico observado y el test calcula el resultado.

Test de Durbin-Watson

VIF — Multicolinealidad

R² = 0.30
📝 Resumen del capítulo
  • La correlación de Pearson $r$ mide la fuerza de la relación lineal; nunca implica causalidad.
  • La regresión $\hat{Y}=b_0+b_1 X$ minimiza la suma de cuadrados de los residuos.
  • $R^2$ mide la proporción de varianza de $Y$ explicada por el modelo.
  • El diagnóstico de supuestos valida si los intervalos de confianza y los valores-$p$ son fiables.
  • La multicolinealidad (VIF) es el problema más frecuente en datos de negocios internacionales.