
La función de distribución es un concepto central en probabilidad y estadística que permite describir, de manera compacta, la probabilidad de que una variable aleatoria tome valores por debajo de un umbral dado. En su forma más común, la Función de Distribución Acumulada o CDF (por sus siglas en inglés) resume todo el comportamiento probabilístico de X. Esta guía aborda la Función de Distribución desde su definición formal hasta sus aplicaciones prácticas, con ejemplos claros y secciones diferenciadas para entender tanto variables discretas como continuas.
Qué es la Función de Distribución y por qué es tan importante
La Función de Distribución F_X(x) de una variable aleatoria X describe la probabilidad de que X sea menor o igual a x. Es decir,
F_X(x) = P(X ≤ x).
Esta función encapsula toda la información de la comportamiento probabilístico de una variable. Con ella se pueden derivar otras medidas, como la probabilidad de rangos específicos, percentiles, mediana y cuantiles, además de servir como base para métodos de inferencia estadística y simulaciones.
La Función de Distribución posee propiedades esenciales que permiten su uso eficaz en teoría y práctica:
- Monotonía no decreciente: F_X(x) es una función no decreciente; si x1 ≤ x2, entonces F_X(x1) ≤ F_X(x2).
- Rango entre 0 y 1: 0 ≤ F_X(x) ≤ 1 para todo x real.
- Comportamiento en los extremos: lim_{x→−∞} F_X(x) = 0 y lim_{x→∞} F_X(x) = 1.
- Continuidad: la función es continua desde la derecha (right-continuous); puede presentar saltos si la distribución es discreta.
- Representación para variables discretas y continuas: para una distribución discreta, F_X es una función escalonada; para una distribución continua, F_X suele ser continua y suave si la densidad existe.
Dependiendo de la naturaleza de la variable aleatoria, la función de distribución adopta diferentes formas y métodos de cálculo.
En el caso discreto, X toma valores aislados {x1, x2, …}. La Función de Distribución se obtiene como la suma de las probabilidades acumuladas:
F_X(x) = P(X ≤ x) = ∑_{x_i ≤ x} P(X = x_i).
La gráfica resulta en una curva escalonada que se mantiene constante entre valores posibles de X y da saltos en cada valor que puede tomar la variable.
Si X puede tomar cualquier valor en un intervalo, la Función de Distribución se define como la integral de la densidad de probabilidad f_X:
F_X(x) = ∫_{−∞}^x f_X(t) dt.
La densidad f_X(t) debe satisfacer ∫_{−∞}^∞ f_X(t) dt = 1. En este caso, F_X es continua y, en muchos casos, estrictamente creciente.
A continuación se presentan algunas de las distribuciones más utilizadas en estadística, junto con sus funciones de distribución respectivas y formulas clave para su cálculo.
Para una variable X ~ Uniform(a, b), la Función de Distribución es:
F_X(x) =
0, si x ≤ a;
(x − a) / (b − a), si a < x < b;
1, si x ≥ b.
Es una de las distribuciones más simples y sirve como base para simulaciones y pruebas de hipótesis. Su densidad es constante en [a, b].
Para X ~ N(μ, σ^2), la Función de Distribución es la función de distribución estándar evaluada en (x − μ)/σ, es decir:
F_X(x) = Φ((x − μ)/σ).
La curva característica es simétrica y su forma determina muchos resultados en estadística. La función Φ se aproxima mediante tablas o métodos numéricos cuando se requieren cálculos prácticos.
Para X ~ Exp(λ), la Función de Distribución es:
F_X(x) = 0 para x < 0; 1 − e^(−λx) para x ≥ 0.
Se utiliza para modelar tiempos entre eventos en procesos de Poisson y en análisis de confiabilidad.
Para X ~ Binomial(n, p), la Función de Distribución se expresa como la probabilidad acumulada de hasta k éxitos:
F_X(k) = P(X ≤ k) = ∑_{i=0}^k C(n, i) p^i (1 − p)^{n − i}.
Se emplea en conteo de éxitos en un número fijo de ensayos independientes con la misma probabilidad de éxito.
Para X ~ Poisson(λ), la Función de Distribución es:
F_X(k) = ∑_{i=0}^k e^(−λ) λ^i / i!.
Modelo de ocurrencias raras y eventos discretos en intervalos de tiempo o espacio; útil en telecomunicaciones, biología y fiabilidad.
La metodología para calcular la Función de Distribución varía según el tipo de distribución:
- Discreta: se suman las probabilidades hasta el valor deseado. Si las probabilidades no se expresan en closed form, se evalúan numéricamente.
- Continua: se integra la densidad de probabilidad. En muchos casos no hay una expresión cerrada, y se utiliza software estadístico o tablas estándar.
En aplicaciones reales, la Función de Distribución se utiliza para calcular probabilidades de rangos, percentiles y para construir intervalos de confianza basados en la distribución subyacente.
La inversa de la Función de Distribución se denota F_X^{-1} o cuantil. Si 0 < p < 1, el cuantil de orden p se define como:
Q(p) = F_X^{-1}(p) = inf{x : F_X(x) ≥ p}.
Los quantiles permiten determinar puntos de corte para intervalos de confianza y para estandarizar valores de diferentes distribuciones. En distribuciones continuas, si F_X es estrictamente creciente, la inversa existe y es única.
La Función de Distribución tiene aplicaciones amplias en ciencia, ingeniería, finanzas y economía:
- Estimación de probabilidades: determinar P(a ≤ X ≤ b) como F_X(b) − F_X(a).
- Identificación de percentiles y límites de confianza para decisiones basadas en riesgo.
- Pruebas de hipótesis y p-values: usar la distribución de la estadística de prueba para evaluar significancia.
- Aproximaciones y simulaciones: generar valores aleatorios mediante transformaciones de uniformes y la inversa de la Función de Distribución.
- Modelos de riesgo y cola pesada: análisis de eventos extremos mediante funciones de distribución adecuadas.
Para obtener resultados fiables, considere estas recomendaciones al manejar la Función de Distribución:
- Verifique la consistencia: F_X(x) debe respetar las propiedades básicas (0 ≤ F_X(x) ≤ 1, no decreasing).
- Distinga entre CDF y PDF: no confunda la Función de Distribución con su densidad; la primera es acumulativa, la segunda es la tasa de probabilidad en un punto.
- Uso de tablas y funciones numéricas: para distribuciones como la normal, utilice tablas de CDF Φ o funciones numéricas en software (R, Python, Matlab).
- Precisión numérica: en intervalos muy cercanos a valores de salto (discretos) o en extremos, preste atención a la precisión de las calculadoras y librerías.
- Comprobación por simulación: valide la modelización generando muestras aleatorias y comparando la distribución empírica con la teórica.
Entre los errores habituales figuran:
- Confundir la Función de Distribución con la densidad de probabilidad. La CDF es acumulativa y proporciona probabilidades de rangos, mientras que la densidad describe la probabilidad por unidad en un punto.
- Ignorar que la CDF puede ser discontinua para distribuciones discretas, lo que implica saltos en la gráfica.
- Asumir que la inversa existe para todas las distribuciones. En casos con CDF no estrictamente creciente, la inversa puede no ser única.
- No distinguir entre probabilidades absolutas y condicionales al trabajar con intervalos y percentiles.
Interpretar correctamente la Función de Distribución ayuda a tomar decisiones informadas en análisis de datos. Por ejemplo, al analizar tiempos de espera en un servicio, la CDF en un punto x indica qué fracción de clientes espera no más de x minutos. En control de calidad, la CDF permite estimar qué proporción de productos está por debajo de un umbral de tolerancia. En finanzas, la distribución de rendimientos de una cartera puede modelarse con una CDF para calcular riesgos y probabilidades de pérdidas.
La elección de una distribución para la Función de Distribución depende de la naturaleza de los datos y del fenómeno a modelar. Algunas guías rápidas:
- Datos de tiempos entre eventos: distribución exponencial o gamma, con su respectiva Función de Distribución y propiedades.
- Datos de conteos: binomial o Poisson, según el número de ensayos y la tasa de ocurrencia.
- Datos continuos con simetría: distribución normal, ideal para inferencia y pruebas de hipótesis.
- Datos entre límites fijos: distribución uniforme puede servir como modelo de referencia o para generar muestras sintéticas.
La Función de Distribución es una herramienta poderosa para entender y manipular probabilidades. A través de F_X(x) se obtienen probabilidades de rangos, cuantiles y se facilita la comparación entre diferentes modelos. Su estudio abarca variaciones para variables discretas y continuas, con ejemplos prácticos que van desde la vida cotidiana hasta aplicaciones técnicas complejas.
¿Qué indica exactamente F_X(x) para un valor dado x?
Indica la probabilidad de que la variable X sea menor o igual a x, es decir, la parte acumulada de la distribución hasta ese punto.
¿Qué diferencia hay entre la Función de Distribución y la función de densidad?
La PDF, f_X(x), describe la densidad de probabilidad en un punto y se integra para obtener la F_X, que es la probabilidad acumulada. En distribuciones continuas, F_X(x) es la integral de la densidad; en discretas, F_X(x) es la suma de probabilidades de valores inferiores o iguales a x.
¿Cómo se obtiene la inversa de la Función de Distribución?
La inversa F_X^{-1}(p) da el cuantil de orden p. Si la CDF es continua y estrictamente creciente, existe una inversa única. En distribuciones con saltos, la inversa puede ser no única, y a veces se utiliza la definición de cuantil como inf{x : F_X(x) ≥ p}.
Entender y poder aplicar la Función de Distribución es fundamental para cualquier profesional que trabaje con datos. Desde la interpretación de resultados hasta la toma de decisiones basada en probabilidades, la CDF y sus variaciones permiten traducir incertidumbre en información accionable. Ya sea que trabajes con variables discretas, continuas o con modelos mixtos, dominar la Función de Distribución te permitirá modelar, comparar y comunicar de forma clara las probabilidades asociadas a cualquier fenómeno aleatorio.