Capítulo 5
Correlación y Regresión Lineal
Modelar relaciones entre variables de negocio internacional
🎯 Objetivos de aprendizaje
- Calcular e interpretar el coeficiente de correlación de Pearson $r$.
- Estimar los parámetros de la recta de regresión mínimo-cuadrática.
- Interpretar $R^2$ como medida de ajuste del modelo.
- Realizar predicciones con intervalo de confianza.
- Diagnosticar los supuestos de la regresión (normalidad, homocedasticidad, VIF, Durbin-Watson).
1. Correlación de Pearson
Coeficiente de correlación de Pearson
$$r = \frac{\displaystyle\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\displaystyle\sum_{i=1}^n (x_i-\bar{x})^2 \cdot \sum_{i=1}^n (y_i-\bar{y})^2}}$$
$r \in [-1, 1]$. Mide la fuerza y dirección de la relación lineal. No implica causalidad.
| Valor de |r| | Interpretación | Ejemplo de negocio |
|---|---|---|
| 0.00 – 0.20 | Nula o despreciable | Precio del café y tasa de desempleo de Suiza |
| 0.20 – 0.40 | Débil | Publicidad y ventas en mercados saturados |
| 0.40 – 0.70 | Moderada | PIB per cápita y exportaciones de servicios |
| 0.70 – 0.90 | Fuerte | Tipo de cambio y exportaciones manufactureras |
| 0.90 – 1.00 | Muy fuerte | Cantidad producida y costo variable total |
2. Regresión Lineal Simple
Modelo de regresión lineal simple
$$\hat{Y} = b_0 + b_1\,X$$
$$b_1 = \frac{\displaystyle\sum(x_i-\bar{x})(y_i-\bar{y})}{\displaystyle\sum(x_i-\bar{x})^2} = r\cdot\frac{s_y}{s_x} \qquad b_0 = \bar{y} - b_1\bar{x}$$
$b_1$ = cambio esperado en $Y$ por cada unidad adicional de $X$ (ceteris paribus).
📈 Explorador de Regresión — Dibuja tus datos
⚡ Interactivo
Haz clic en el área de graficación para añadir puntos. Clic derecho para eliminar el punto más cercano. La recta de regresión se actualiza en tiempo real.
n
0
Correlación r
—
R² (ajuste)
—
Intercepto b₀
—
Pendiente b₁
—
Ecuación
Predicción puntual
Ŷ predicho
—
IC inferior
—
IC superior
—
3. Diagnóstico de Supuestos
| Supuesto | Test formal | Umbral / regla | Si se viola… |
|---|---|---|---|
| Normalidad de residuos | Shapiro-Wilk | $p > 0.05$ → no se rechaza normalidad | Transformar $Y$ o usar regresión robusta |
| Homocedasticidad | Breusch-Pagan: $BP = n \cdot R^2_{aux} \sim \chi^2_{(k)}$ | $p > 0.05$ | Errores estándar robustos (Huber-White) o WLS |
| Independencia | Durbin-Watson $DW \approx 2(1-\hat\rho)$ | $1.5 \leq DW \leq 2.5$ | Incluir $Y_{t-1}$ o modelos ARIMA |
| No multicolinealidad | $\text{VIF}_j = 1/(1-R_j^2)$ | VIF $< 5$ (aceptable), $< 10$ (tolerable) | Eliminar variable, índice compuesto, Ridge |
🔬 Diagnóstico de Residuos — Gráfico interactivo
⚡ Interactivo
Selecciona el tipo de gráfico de diagnóstico. Se usan los datos del explorador de regresión.
📋 Calculador de Tests de Supuestos
⚡ Interactivo
Ingresa tu estadístico observado y el test calcula el resultado.
Test de Durbin-Watson
VIF — Multicolinealidad
R² = 0.30
📝 Resumen del capítulo
- La correlación de Pearson $r$ mide la fuerza de la relación lineal; nunca implica causalidad.
- La regresión $\hat{Y}=b_0+b_1 X$ minimiza la suma de cuadrados de los residuos.
- $R^2$ mide la proporción de varianza de $Y$ explicada por el modelo.
- El diagnóstico de supuestos valida si los intervalos de confianza y los valores-$p$ son fiables.
- La multicolinealidad (VIF) es el problema más frecuente en datos de negocios internacionales.