Capítulo 1
Estadística Descriptiva
Resumir y comunicar datos de negocios internacionales
🎯 Objetivos de aprendizaje
  1. Calcular e interpretar medidas de centralidad: media, mediana y moda.
  2. Calcular e interpretar medidas de dispersión: desviación estándar, varianza, rango y coeficiente de variación.
  3. Construir e interpretar histogramas, diagramas de caja y tablas de frecuencia.
  4. Identificar distribuciones sesgadas y sus implicaciones gerenciales.
  5. Aplicar la estadística descriptiva a datos de exportaciones, precios y calidad.

1. Medidas de Centralidad

Media aritmética
$$\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$

La media es sensible a valores extremos (outliers). En distribuciones muy asimétricas, puede no representar bien al «típico».

Mediana y Moda

Mediana: valor central cuando los datos están ordenados. Robusta ante outliers.
Moda: valor que aparece con mayor frecuencia. Útil para variables categóricas y discretas.

Concepto clave — Regla de las tres M
  • Distribución simétrica: Media ≈ Mediana ≈ Moda
  • Sesgo positivo (derecho): Moda < Mediana < Media — ingresos, precios de commodities
  • Sesgo negativo (izquierdo): Media < Mediana < Moda — tiempos de proceso con límite superior

2. Medidas de Dispersión

Desviación estándar muestral y Coeficiente de Variación
$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}} \qquad \text{CV} = \frac{s}{\bar{x}} \times 100\%$$

El CV permite comparar la dispersión entre variables con distintas unidades o escalas (ej.: tipo de cambio vs. precio de commodity).

MedidaFórmulaInterpretación gerencial
Rango$R = x_{\max} - x_{\min}$Amplitud total; muy sensible a outliers
RIC$Q_3 - Q_1$Rango del 50% central; robusto ante outliers
Varianza$s^2$Unidades al cuadrado; se usa internamente en cálculos
Desv. estándar$s$Dispersión en las mismas unidades que $\bar{x}$
CV$s/\bar{x}\times100\%$Dispersión relativa; permite comparar variables distintas
🧮 Calculador de Estadística Descriptiva ⚡ Interactivo

Ingresa tus datos separados por comas (o espacios) y obtén todas las medidas al instante. Prueba con el ejemplo o pega tus propios datos de exportaciones, precios o tiempos.

n
Media x̄
Mediana
Moda
Desv. est. s
Varianza s²
CV
Mín
Máx
Rango
Q1
Q3
RIC
Asimetría
Curtosis

3. Visualización de Datos

📊 Histograma Interactivo ⚡ Interactivo

Usa los mismos datos del calculador. Ajusta el número de intervalos (clases) para explorar la distribución.

7 clases
📦 Diagrama de Caja (Box Plot) ⚡ Interactivo

El diagrama de caja muestra la distribución a través de los cinco números resumen: Mín, Q1, Mediana, Q3, Máx. Los puntos fuera de los bigotes son valores atípicos.

4. Tabla de Frecuencias

Una tabla de frecuencias organiza los datos en clases (intervalos) y muestra las frecuencias absoluta, relativa y acumulada. Es la base del histograma y permite identificar la clase modal rápidamente.

📌 Regla de Sturges para el número de clases
$$k = 1 + 3{,}322 \cdot \log_{10}(n)$$

Para $n = 20$ datos: $k \approx 1 + 3.322 \times \log_{10}(20) \approx 1 + 4.3 = 5$ o 6 clases. Es un punto de partida; el juicio visual prevalece.

📝 Resumen del capítulo
  • La media es la medida de centralidad más usada, pero sensible a outliers; la mediana es más robusta.
  • La desviación estándar mide dispersión en las mismas unidades que los datos; el CV permite comparar entre variables con escalas distintas.
  • El histograma revela la forma de la distribución: simétrica, sesgada o bimodal.
  • El diagrama de caja (box plot) identifica outliers y permite comparar grupos de manera visual.
  • La asimetría y la curtosis cuantifican la forma más allá del histograma visual.