Campos que abarca la estadística
Lo primero que se ha de poner de manifiesto es que la definición de un término tan amplio no es obvia, ni mucho menos sencilla. Y es que la estadística comprende desde los artificios descriptivos más elementales, que puede comprender cualquier persona, hasta procedimientos matemáticos de extrema complejidad que solo pueden ser del dominio de los más expertos teóricos en la materia.
Sin llegar a estas complejidades extremas, con un elevado grado de generalidad, los campos que abarca la estadística son la descripción, resumen e interpretación de observaciones, el cálculo de probabilidades y la inferencia estadística, campos que en absoluto conforman compartimentos estancos sino que, más bien, se solapan y se complementan.
Dicho lo anterior, el término "estadística" deriva de la palabra "estadista", que a su vez procede del latín "status" (postura, posición, más genéricamente, la situación política y social, el Estado). De los términos "status" y "estadista" surgió el vocablo "estadística", en su primera acepción, como enumeración de las cosas relevantes del Estado, es decir, como exteriorización cuantitativa de las cosas del Estado. Pues bien, dicha ligazón a las cosas del Estado fue ampliándose a las cosas de cualquier empresa, entidad, incluso individuo, sea cual sea el campo de actuación de interés, y ello debido al desarrollo que ha venido experimentando la sociedad, que en el momento actual se encuentra irremisiblemente inmersa en un mundo de cifras (basta hojear cualquier periódico para darse cuenta de la anterior aseveración).
Estadística descriptiva
La estadística no se ha quedado en una simple labor de enumeración, de generación de estadísticas, sino que ha ampliado su campo de actuación enormemente. En primer lugar, si bien la labor de confeccionar estadísticas resulta impagable, también es cierto que a efectos prácticos su utilización resulta inabordable si no se ordena, resume e interpreta la información que contienen. Pues bien, de estas tres labores básicas, entre otras, se ocupa la "estadística descriptiva".
Así, la "estadística descriptiva" permite superar la etapa de enumeración, ordenando la información acerca del fenómeno que se esté estudiando en una tabla, denominada distribución de frecuencias, en la que en la primera columna figuran los valores que toma tal fenómeno y en la segunda la frecuencia con la que dicho fenómeno toma dichos valores. Una vez ordenada convenientemente la información en una distribución o tabla de frecuencias, procede el resumen, síntesis, de tal información. Es decir, el cálculo de un promedio que represente los valores y frecuencias contenidos en la tabla de frecuencias, la variabilidad de dichos valores en torno a este promedio, etc. Nótese que con dicho promedio y una medida de variabilidad, tan solo dos medidas, ya se puede obtener un resumen bastante bueno del comportamiento de la variable estadística estudiada. Igualmente, se puede proceder al estudio del comportamiento de dicha variable en el tiempo (elaborando una serie temporal o una serie de números índice), o en el espacio.
De mayor interés resulta el estudio conjunto de dos variables estadísticas para observar si determinados valores de una coinciden con determinados valores de la otra. Es decir, para observar "coincidencias". Y es que si dichas coincidencias no son espurias nos podemos plantear si el comportamiento de una de las variables viene determinado por el comportamiento de la otra. Si esto es así, esta labor será de gran utilidad a efectos predictivos. Pues bien, la estadística descriptiva permitirá establecer, mediante los métodos de regresión, la estructura de dependencia de una variable respecto de otra y la intensidad de dicha dependencia. Evidentemente, la relación observada entre ambas variables es únicamente una relación estadística, pero servirá de pista para los teóricos del campo de la ciencia en el que se encuentren ubicadas dichas variables para determinar si existe causalidad en dicha relación. Estos son tan solo algunos ejemplos de las labores de las que se ocupa la Estadística descriptiva; pero hay más: análisis de datos cualitativos, análisis de la concentración de la masa total de una variable, análisis demográficos, etc. Como ha podido verse, ordenación, síntesis y análisis e interpretación de la información.
Cálculo de probabilidades e inferencia estadística
La segunda pata de la estadística es el "cálculo de probabilidades". A primera vista, uno se puede preguntar qué tiene que ver un concepto como el probabilístico con las labores de la Estadística descriptiva mencionadas anteriormente. La respuesta es que, por extraño que parezca, el cálculo de probabilidades ha permitido una transformación de tal calibre de la ciencia estadística que la ha hecho transitar desde la mera descripción de la realidad a la modelización de la misma utilizando como herramienta los métodos del análisis matemático. En otros términos, el "cálculo de probabilidades" es un instrumento que permite pasar de la "estadística descriptiva" a la "estadística matemática o inferencia estadística". El "cálculo de probabilidades" se ocupa del estudio y modelado de los fenómenos aleatorios, es decir, de aquellos fenómenos que al producirse en unas condiciones determinadas dadas producen uno de varios resultados sin que de antemano se sepa cuál va a ocurrir.
La fusión de la "estadística descriptiva" y el "cálculo de probabilidades" ha dado lugar a una rama floreciente de la disciplina estadística denominada "inferencia estadística", que permite hacer generalizaciones (inferir) desde lo concreto a lo general; desde unos pocos datos de la población objeto de estudio a la población al completo. Sin embargo, dichas inferencias o generalizaciones no son, ni mucho menos, exactas, sino que están sujetas a determinados riesgos que se miden en términos de probabilidad (y esto completa el puzzle).
Un ejemplo aclarará estas ideas. Supóngase que se desea estimar la altura media de los ciudadanos españoles. Resulta evidente que no podemos investigar a cada uno de los ya casi cuarenta y seis millones de residentes en España para preguntarles su altura y, posteriormente, configurar su altura media (el parámetro objeto de investigación). Por ello, en la práctica, se suele realizar una "biopsia" de la población objeto de estudio (alturas de los españoles), biopsia que recibe el nombre de muestra y que deberá ser lo más representativa posible de la población de la cual ha sido extraída. Esta muestra tiene carácter aleatorio, lo que ya la liga inexcusablemente con el cálculo de probabilidades. En la muestra, es decir, en el conjunto de alturas que se han medido, trabajará la Estadística descriptiva, describiendo, entre otras cosas, el promedio de las alturas de la muestra. La Inferencia estadística será la encargada de elevar el resultado obtenido a escala poblacional (para toda España), o de elaborar un intervalo de confianza en el cual se encuentre comprendida la altura media de los españoles (por ejemplo, entre 175 cm. y 178 cm.) y para ello utilizará la teoría de la estimación y de la contrastación. Por ejemplo, nos dirá cual es el mejor estimador para nuestro caso particular (en el caso que nos ocupa nos indicará que el mejor estimador es la media aritmética de las observaciones contenidas en la muestra), nos informará sobre como construir un intervalo de confianza, nos facilitará contrastes acerca de si el parámetro objeto de interés toma un determinado valor u otro (u otros) alternativo, etc.
Sin embargo la realización de inferencias no está exenta de riesgos, y ahí es donde juega un papel clave el "cálculo de probabilidades", ya que dichos riesgos se miden en términos de probabilidad. En el ejemplo que venimos arrastrando, las técnicas probabilísticas nos informarán, por ejemplo, de la probabilidad de que para un tamaño muestral como el utilizado, el estimador (la media aritmética de la muestra) y el verdadero valor del parámetro estén distanciados en más de una determinada cantidad de centímetros.
Por tanto, el tridente estadística descriptiva-cálculo de probabilidades-inferencia estadística nos permitirá tomar decisiones en ambientes de incertidumbre, midiéndose dicha incertidumbre en términos de probabilidad. Y esto resulta de una gran ayuda en el análisis y desarrollo de la mayor parte de los problemas de carácter científico.
Recuerde que...
- • La "estadística descriptiva" permite superar la etapa de enumeración, ordenando la información acerca del fenómeno que se esté estudiando en una tabla, denominada distribución de frecuencias, en la que en la primera columna figuran los valores que toma tal fenómeno y en la segunda la frecuencia con la que dicho fenómeno toma dichos valores.
- • El "cálculo de probabilidades" es un instrumento que permite pasar de la "estadística descriptiva" a la "estadística matemática o inferencia estadística".
- • El "cálculo de probabilidades" se ocupa del estudio y modelado de los fenómenos aleatorios, es decir, de aquellos fenómenos que al producirse en unas condiciones determinadas dadas producen uno de varios resultados sin que de antemano se sepa cuál va a ocurrir.
- • La fusión de la "estadística descriptiva" y el "cálculo de probabilidades" ha dado lugar a una rama de la disciplina estadística denominada "inferencia estadística", que permite hacer generalizaciones (inferir) desde lo concreto a lo general.
- • El tridente estadística descriptiva-cálculo de probabilidades-inferencia estadística nos permitirá tomar decisiones en ambientes de incertidumbre, midiéndose dicha incertidumbre en términos de probabilidad.