Concepto
El término cointegración se refiere a la existencia de relaciones lineales estables entre series temporales no estacionarias.
No estacionariedad
Intuitivamente se dice que una serie temporal no es estacionaria cuando no es estable, bien alrededor de una media constante o alrededor de una tendencia lineal. La no estacionariedad se traduce en un aumento de la varianza o variabilidad de la serie al aumentar el horizonte temporal, de tal forma que resulta imposible establecer predicciones a largo plazo sobre donde estará una serie no estacionaria. En el gráfico inferior se pueden observar ejemplos de series estacionaria y no estacionaria para ambos casos (sin tendencia y con tendencia).
Como se puede observar, la evolución de las series no estacionarias es mucho más errática que la de las series estacionarias. En la terminología de series temporales, cuando una serie es no estacionaria, se dice que tiene una raíz unitaria ya que, si se modeliza la serie mediante un modelo ARMA de series temporales, este modelo tendrá, como mínimo, una raíz con valor uno en el polinomio autorregresivo.
En muchas ocasiones resulta difícil distinguir a partir de gráficos si una serie es estacionaria o, por el contrario, tiene una, o más, raíces unitarias. Para ayudar a decidir sobre el carácter estacionario o no de series, se han diseñado contrastes específicos para la detección de raíces unitarias (el más usado es el contraste ADF). Sin entrar en detalles técnicos, hay que señalar que estos contrastes de raíz unitaria tienen como hipótesis nula la no estacionariedad, o existencia de raíz unitaria, de tal forma que, si se acepta la hipótesis nula, se supone que la serie es no estacionaria (tiene una raíz unitaria), mientras que si la evidencia muestral rechaza la hipótesis nula se cree que la serie es estacionaria (bien alrededor de una media o de una tendencia lineal). En la terminología de series temporales, también se conoce a las series no estacionarias con una raíz unitaria como series integradas de orden 1 o I(1) mientras que a las series estacionarias se les suele denominar I(0). Utilizando esta terminología, los contrastes de raíz unitaria suponen en la hipótesis nula que la serie es I(1) mientras que, si se rechaza la hipótesis nula, se supone que la serie es I(0).
Si una serie es I(1), o no estacionaria, se puede transformar en I(0), o estacionaria, tomando diferencias. La operación de diferenciar una serie consiste, simplemente, en restar a cada valor de la serie el anterior, es decir, la serie diferenciada se puede calcular como ▵Yt = Yt - Yt-1 de tal forma que la serie en diferencias ▵Yt mide los crecimientos de la serie original Yt en cada período respecto al anterior. En la parte superior derecha del gráfico anterior se representa la serie no estacionaria diferenciada y, como se puede comprobar, al tomar diferencias la serie se ha transformado en estacionaria, es decir, si Yt era I(1) entonces ▵Yt es I(0).
Regresiones espurias
Uno de los problemas principales de trabajar con series I(1), o no estacionarias, es que puede que la teoría de la regresión deje de ser válida. Si tenemos dos series I(1), por ejemplo Yt y Xt, sin relación alguna entre ellas, y realizamos una regresión de Yt sobre Xt, probablemente el estadístico t del contraste de significatividad de la variable Xt indique que esta variable ayuda a explicar la variable Yt cuando no debería ser así. A estas regresiones se les suele denominar como regresiones espurias indicando que, en realidad, las relaciones presuntamente significativas que se obtienen entre estas series son ficticias ya que la teoría de la regresión habitual no es válida en este contexto. En el gráfico inferior se muestra un ejemplo de regresión entre series I(1) no estacionarias:
Al realizar la regresión entre las series no estacionarias de la parte superior izquierda del gráfico la ecuación estimada fue la siguiente:
Yt = 31.75 - 0.45Xt + et
(178.48) (24.20)
Debajo de cada coeficiente se muestra, entre paréntesis, el valor del estadístico t para contrastar la significatividad individual de cada parámetro. Sus valores, mucho mayores que los valores críticos al 95 % que están en torno a 2, indican que los coeficientes de regresión son claramente significativos y que, en apariencia, la variable Xt influye sobre la variable Yt cuando en realidad no hay ninguna relación entre ellas.
Si se examinan los residuos et de esta regresión en la parte inferior izquierda del gráfico se puede apreciar que, claramente, estos residuos no son estacionarios lo cual es un indicio evidente de que la regresión es espuria y que la inferencia estadística habitual no es válida en este caso.
Una manera de resolver este problema es transformar previamente a las series en estacionarias, o I(0), tomando diferencias y, posteriormente, hacer la regresión entre las variables diferenciadas. En la parte superior derecha del gráfico se muestran las series diferenciadas cuya evolución muestra que ambas son claramente estacionarias. Al realizar una regresión entre ambas se obtiene la siguiente ecuación de regresión estimada:
▵Yt = 0.008 - 0.013▵Xt + et
(0.48) (0.84)
En este caso, al haber transformado previamente las variables en estacionarias tomando diferencias, los resultados de la regresión muestran que la variable ▵Xt no es significativa tal y como debería ocurrir. Los residuos de esta regresión se muestran en la parte inferior derecha del gráfico. La evolución de estos residuos, claramente estacionaria, indica que la teoría de la regresión es válida entre estas variables.
Cointegración
A pesar de lo señalado en el apartado anterior, en algunas ocasiones las regresiones realizadas entre variables I(1) no estacionarias pueden ser válidas si las series están cointegradas. Técnicamente, se dice que dos o más variables I(1) están cointegradas si existe una combinación lineal de ellas que resulta ser estacionaria o I(0). En ese caso, precisamente la combinación lineal vendría dada por la regresión entre dichas variables (por ello la regresión sería adecuada) y los residuos de dicha regresión serían estacionarios. En el siguiente gráfico se muestra la evolución de dos series I(1) cointegradas así como los residuos de la regresión entre ambas en la parte inferior.
Aunque la evolución de las series muestra que, claramente, ambas no son estacionarias, parece que la evolución a largo plazo de ambas es similar (por ello, precisamente, están cointegradas). Si se compara esta evolución con la de las series no estacionarias del gráfico anterior, puede comprobarse que, efectivamente, en el caso previo además de no ser estacionarias no parecía existir ninguna evolución a largo plazo similar entre ambas (por ello estaban no cointegradas). Si realizamos ahora una regresión entre las variables no estacionarias y cointegradas los resultados son los siguientes:
Yt = 4.01 - 0.51Xt + et
(76.26) (92.36)
Como se puede comprobar, la variable Xt es claramente significativa indicando que hay una relación lineal estable entre ellas y, si se examinan los residuos de la regresión, claramente estacionarios, puede comprobarse que esta relación no es espuria como ocurría anteriormente. De hecho los contrastes formales de cointegración (por ejemplo, el de Engle-Granger) intentan detectar si los residuos de la regresión de cointegración entre variables I(1) son estacionarios o no y, si realmente lo son, hay una relación lineal de largo plazo estable entre las variables mientras que, si no lo son, la regresión es espuria. La hipótesis nula de este contraste es la no estacionariedad de los residuos de tal forma que, si se rechaza la nula, hay evidencia de cointegración mientras que, si se acepta la nula, la regresión es espuria.
Cuando hay más de dos variables I(1) en el análisis podrían existir más de una relación de cointegración por lo cual el análisis debería de extenderse al marco de modelización multivariante de series temporales. La metodología de Johansen permite detectar, utilizando técnicas de máxima verosimilitud, el número r de relaciones de cointegración existente entre un número m de variables I(1). Dicho número r, denominado rango de cointegración, puede oscilar entre r = 0,1,2,... hasta m-1. Una vez detectado el número r de relaciones de cointegración, utilizando contrastes como el de la traza o máximo autovalor, pueden detectarse los coeficientes de las relaciones lineales entre ellas en el marco de modelos VEC multivariantes. Aunque los detalles técnicos son relativamente complejos, la idea es similar, aunque más general, que el caso visto anteriormente con dos variables.
Modelización de series no estacionarias
A modo de resumen metodológico, los principales pasos a seguir para establecer modelos entre series temporales posiblemente no estacionarias son los siguientes:
- 1. Comprobar si las series son I(1), no estacionarias, o I(0) estacionarias utilizando instrumentos gráficos y contrastes de raíces unitarias.
- 2. Si las series son I(0) las técnicas habituales de regresión son válidas y no hay que realizar modificaciones de las variables.
- 3. Si las series son I(1) hay que comprobar si están cointegradas o no. En el primer caso, si los contrastes de cointegración detectan que, efectivamente, las series están cointegradas, se puede trabajar directamente con ellas y estimar regresiones o, con carácter más general, modelos VEC cuando haya más de dos series implicadas. Si, por el contrario, no hay relaciones de cointegración entre las variables, hay que transformarlas tomando diferencias para que sean I(0) y, posteriormente, realizar regresiones u otro tipo de estimaciones entre ellas.
Recuerde que...
- • La no estacionariedad se traduce en un aumento de la varianza o variabilidad de la serie al aumentar el horizonte temporal.
- • Resulta imposible establecer predicciones a largo plazo sobre donde estará una serie no estacionaria.
- • Modelización de series no estacionarias: si son estacionarias o no, si las técnicas son válidas y no hay que realizar modificaciones en las variables y comprobar si están cointegradas o no.