Concepto
La mediana, junto con las medias (aritmética, geométrica y armónica), y la moda es una de las medidas de posición central de mayor relevancia. Las medidas de posición central permiten situar la distribución de frecuencias, es decir, fijan el comportamiento global de una variable a partir de los valores individuales recogidos en dicha distribución.
En particular, la mediana se define como aquel valor que divide la distribución de frecuencias de forma que el número de ellas que quedan a su izquierda es igual al número de las que quedan a su derecha, siempre y cuando los valores de la variable estén ordenados de menor a mayor.
Cálculo
Para el cálculo de la mediana es necesario distinguir entre distribuciones no agrupadas en intervalos y distribuciones agrupadas en intervalos:
1) Distribuciones no agrupadas en intervalos. Es necesario hacer distinción entre las distribuciones con un número total de datos (N) par o impar:
a) Si el número total de datos es impar, la definición proporciona siempre un único valor, ya que denominando k al número de observaciones inferiores y superiores a la mediana resulta que:
Siendo la mediana el valor que ocupa el lugar k+1 de la distribución.
b) Si el número de observaciones es par, habrá dos valores medianos: el que ocupa el lugar k+1 = N/2 y el que ocupa el lugar k+2 = N/2+1, puesto que:
En este caso, se conviene en tomar como valor mediano la media aritmética de ambos. No obstante, esto no es sino un convenio. Perfectamente podría tomarse como mediana uno u otro.
2) Distribuciones agrupadas en intervalos. En el caso en que la distribución se encontrase agrupada en intervalos, no se tendrá un valor mediano sino un intervalo mediano. Una vez establecido dicho intervalo mediano, hay que determinar un valor dentro de él que se corresponda con la mediana, valor que no se puede calcular de forma exacta puesto que se desconocen los diferentes valores que toma la variable en cada uno de los intervalos. Existen varios criterios para aproximar el valor mediano:
a) Si se asigna a un punto, se puede considerar que la mediana es cualquier valor del intervalo, exceptuando el valor del extremo inicial del intervalo, Li-1, puesto que los intervalos se consideran abiertos por la izquierda y cerrados por la derecha. Este criterio está basado en que nada conocemos de lo que ocurre dentro del intervalo.
b) Si no se asigna a un punto, sino que se considera que todos los valores del intervalo están distribuidos de manera uniforme dentro de él, se puede aproximar la mediana de la forma siguiente:
— Número de datos impar: Como se ha visto en distribuciones no agrupadas en intervalos, si el número de datos es impar la mediana es aquel valor de la variable, supuesta una ordenación de menor a mayor, que ocupa el lugar:
— Siguiendo este mismo criterio, el intervalo mediano será aquel que contenga la frecuencia (N+1)/2. Si el intervalo mediano es Li-1 - Li y se observa el histograma acumulativo de frecuencias se tiene:
Evidentemente, Me = Li-1 + m y m se determina mediante la siguiente regla de tres simple: si en ci se tienen ni frecuencias, en m se tendrán frecuencias, con lo que:
Y la mediana adopta la siguiente expresión:
Siendo ci la amplitud del intervalo y Ni-1 las frecuencias acumuladas hasta el (i-1)-ésimo intervalo.
— Número de datos par: En este caso se dispone de dos valores medianos, que son los que ocupan las posiciones k+1 = N/2 y k+2 = N/2+1.
Si ambos valores están en el mismo intervalo Li-1 - Li (intervalo mediano) se tiene que:
pudiéndose tomar como mediana cualquiera de ellos o la media de ambos:
Resultando, en este último caso, la misma expresión que la obtenida para el caso de que la frecuencia total sea impar.
Si los dos valores medianos se encuentran en distintos intervalos, se procedería de forma análoga.
Propiedades
La mediana, como medida de posición central, resulta de gran utilidad en los casos siguientes:
- 1) Cuando existan valores anormalmente bajos o elevados. La mediana es menos sensible que la media aritmética a estos valores extremos porque en su determinación no intervienen todos los valores de la variable sino los que ocupan las posiciones centrales.
- 2) Cuando en las distribuciones agrupadas en intervalos el primero sea del tipo "menor que" o el último del tipo "mayor que", siempre y cuando ninguno de estos intervalos sea el intervalo mediano.
- 3) Cuando se analizan variables cualitativas que vienen dadas en escala ordinal. En este caso, no se puede determinar la media aritmética, siendo la mediana la medida de tendencia central más representativa.
Mediana de una distribución de probabilidad
Igual que se ha definido la mediana para una distribución de frecuencias, se puede definir para una distribución de probabilidad. En este caso, de forma general, y considerando a X como una variable aleatoria, se define mediana como aquel valor que verifica simultáneamente la siguiente doble condición:
Si bien el cumplimiento de una implica el de la otra.
Recuerde que...
- • Para el cálculo de la mediana es necesario distinguir entre distribuciones no agrupadas en intervalos y distribuciones agrupadas en intervalos.
- • La mediana, junto con las medias (aritmética, geométrica y armónica), y la moda es una de las medidas de posición central de mayor relevancia.
- • La mediana resulta de gran utilidad: cuando existan valores anormalmente bajos o elevados, cuando en las distribuciones agrupadas en intervalos el primero sea del tipo "menor que" o el último del tipo "mayor que", siempre y cuando ninguno de estos intervalos sea el intervalo mediano, y cuando se analizan variables cualitativas que vienen dadas en escala ordinal.
- • Igual que se ha definido la mediana para una distribución de frecuencias, se puede definir para una distribución de probabilidad.