- Calcular e interpretar medidas de centralidad: media, mediana y moda.
- Calcular e interpretar medidas de dispersión: desviación estándar, varianza, rango y coeficiente de variación.
- Construir e interpretar histogramas, diagramas de caja y tablas de frecuencia.
- Identificar distribuciones sesgadas y sus implicaciones gerenciales.
- Aplicar la estadística descriptiva a datos de exportaciones, precios y calidad.
1. Medidas de Centralidad
La media es sensible a valores extremos (outliers). En distribuciones muy asimétricas, puede no representar bien al «típico».
Mediana: valor central cuando los datos están ordenados. Robusta ante outliers.
Moda: valor que aparece con mayor frecuencia. Útil para variables categóricas y discretas.
- Distribución simétrica: Media ≈ Mediana ≈ Moda
- Sesgo positivo (derecho): Moda < Mediana < Media — ingresos, precios de commodities
- Sesgo negativo (izquierdo): Media < Mediana < Moda — tiempos de proceso con límite superior
2. Medidas de Dispersión
El CV permite comparar la dispersión entre variables con distintas unidades o escalas (ej.: tipo de cambio vs. precio de commodity).
| Medida | Fórmula | Interpretación gerencial |
|---|---|---|
| Rango | $R = x_{\max} - x_{\min}$ | Amplitud total; muy sensible a outliers |
| RIC | $Q_3 - Q_1$ | Rango del 50% central; robusto ante outliers |
| Varianza | $s^2$ | Unidades al cuadrado; se usa internamente en cálculos |
| Desv. estándar | $s$ | Dispersión en las mismas unidades que $\bar{x}$ |
| CV | $s/\bar{x}\times100\%$ | Dispersión relativa; permite comparar variables distintas |
Ingresa tus datos separados por comas (o espacios) y obtén todas las medidas al instante. Prueba con el ejemplo o pega tus propios datos de exportaciones, precios o tiempos.
3. Visualización de Datos
Usa los mismos datos del calculador. Ajusta el número de intervalos (clases) para explorar la distribución.
El diagrama de caja muestra la distribución a través de los cinco números resumen: Mín, Q1, Mediana, Q3, Máx. Los puntos fuera de los bigotes son valores atípicos.
4. Tabla de Frecuencias
Una tabla de frecuencias organiza los datos en clases (intervalos) y muestra las frecuencias absoluta, relativa y acumulada. Es la base del histograma y permite identificar la clase modal rápidamente.
Para $n = 20$ datos: $k \approx 1 + 3.322 \times \log_{10}(20) \approx 1 + 4.3 = 5$ o 6 clases. Es un punto de partida; el juicio visual prevalece.
- La media es la medida de centralidad más usada, pero sensible a outliers; la mediana es más robusta.
- La desviación estándar mide dispersión en las mismas unidades que los datos; el CV permite comparar entre variables con escalas distintas.
- El histograma revela la forma de la distribución: simétrica, sesgada o bimodal.
- El diagrama de caja (box plot) identifica outliers y permite comparar grupos de manera visual.
- La asimetría y la curtosis cuantifican la forma más allá del histograma visual.