Concepto
Medida de posición de una distribución de frecuencias de una población a la que caracterizan. Son los valores que dividen a la distribución en 100 partes iguales, cada una contiene el 1 % de las observaciones.
Si hablamos del percentil de orden α, se denota por Pα, y representa el porcentaje de la población en estudio que tiene un valor inferior a α%.
También se llaman centiles. En una distribución total hay 99 percentiles.
Se cumple que:
Mediana = 2º cuartil = 5º decil = 50º Percentil (Me = C2 = D5 = P50).
Luego, si hablamos del Percentil 75 (P75), será un valor de la variable, o dentro del rango de los valores de la variable, que deja por debajo de él al menos el 75 % de los datos de la distribución.
Cálculo
Se procede de forma distinta según sea una variable discreta o continua.
Variable discreta
Sea una distribución discreta con N observaciones, ordenados los datos de menor a mayor según su valor, y donde Ni representa la frecuencia absoluta acumulada de orden i-ésimo, entonces, si queremos calcular el percentil α-ésimo (Pα), procedemos:
- a) Se calcula (α/100)*N.
- b) En las frecuencias absolutas acumuladas se busca el Ni > (α/100)*N, dos posibilidades:
- - Si se cumple la igualdad, algún valor de Ni vale (α/100)*N, entonces, el valor de Pα es la media aritmética entre los valores de x correspondientes a Ni (xi) y a Ni+1 (xi+1), es decir, (xi + xi+1)/2.
- - Si no, el percentil será el xi correspondiente al primer valor de Ni estrictamente mayor que (α/100)*N.
Variable continua o discreta agrupada en intervalos
Sea una distribución con N observaciones, ordenados los de menor a mayor según su valor, de variable continua o discreta agrupada en intervalos de la forma (Li-1, Li], con amplitud ci, donde Ni representa la frecuencia absoluta acumulada de orden i-ésimo, entonces, si queremos calcular el percentil α-ésimo (Pα), procedemos así:
- a) Se calcula (α/100)*N.
- b) Determinación del intervalo correspondiente al percentil α-ésimo, que será aquel que presenta la primera frecuencia acumulada (Ni) mayor que (α/100)*N, dos posibilidades:
- - Si coincidiese exactamente con (α/100)*N, P es el extremo superior del intervalo: Pα = Li.
- - Si no, y suponiendo que los valores de la variable están uniformemente distribuidos dentro del intervalo mediano, para calcular el valor de percentil se aplica la siguiente fórmula:
Donde:
Li-1 = Límite superior del intervalo mediano.
N = Número de observaciones total.
ni = Frecuencia absoluta correspondiente al intervalo i-ésimo.
Ni-1 = Frecuencia absoluta acumulada correspondiente al intervalo (i-1)-ésimo.
Ci = Amplitud del intervalo i-ésimo.
Ejemplos
1. Dados los siguientes datos, calcular percentil 45 (P45):
0, 10, 10, 40, 30, 20, 30, 30, 20, 20, 30, 10, 20, 20,10.
Construimos la tabla de distribución de frecuencias:
xi | ni | Ni |
0 | 1 | 1 |
10 | 4 | 5 |
20 | 5 | 10 |
30 | 4 | 14 |
40 | 1 | 15 |
| N = 15 | |
Donde:
Xi = Valor i-ésimo de la varible.
ni = Frecuencia absoluta del valor xi.
Ni= Frecuencia absoluta acumulada de valor xi.
Calculamos:
(α/100)*N = (45/100)*15 = 6,75
Comparamos el resultado con la frecuencia absoluta acumulada (Ni), luego:
N3 = 10 > 6,75.
Por lo tanto, el percentil 45 vale P45 = x3 = 20.
Solución: P45 = 20.
2. Sea la distribución de frecuencias siguiente:
(Li-1, Li] | ci | ni | Ni |
[0, 10] | 10 | 7 | 7 |
(10, 20] | 10 | 5 | 12 |
(20, 25] | 5 | 11 | 23 |
(25, 32] | 7 | 4 | 27 |
(32, 50] | 18 | 23 | 50 |
| | N = 50 | |
Se pide dar el valor del percentil 52 (P52).
Identificamos el intervalo correspondiente a ese percentil:
Primero calculamos:
(α/100)*N = (52/100)*50 = 26.
Y comparamos el resultado con la frecuencia absoluta acumulada (Ni), luego:
N4 = 27 > 26.
Así, (25,32] es el intervalo correspondiente al P52.
Por lo tanto, el percentil 52 vale:
Solución: P52 = 30,25.
Recuerde que...
- • El percentil es una medida de posición de una distribución de frecuencias de una población a la que caracterizan.
- • Se calcula de forma distinta según sea la variable discreta o continua.