Concepto
El método de variables instrumentales es un procedimiento de estimación de modelos econométricos en los que los regresores están correlacionados con las perturbaciones del modelo (a este tipo de regresores se les denomina endógenos). En un modelo con regresores endógenos los métodos habituales de estimación basados en mínimos cuadrados, como MCO y MCG, son inconsistentes y, por lo tanto, se necesita utilizar un procedimiento alternativo basado en la utilización de variables con información similar a la contenida en los regresores endógenos pero no correlacionadas con el término de perturbación. A este tipo de variables se les denomina variables instrumentales o instrumentos.
Método de estimación por variables instrumentales
Para estudiar en qué contextos puede aparecer el problema de regresores endógenos, supongamos que un analista del mercado de trabajo quiere estudiar la relación entre el salario (wi) y los años de educación recibida, para lo cual especifica el siguiente sencillo modelo econométrico:
ln(wi) = β0+β1 Educi + ui
En este modelo simplificado el parámetro β1 es una semielasticidad: indica en qué porcentaje cambiaría el salario por cada año adicional de educación (previsiblemente su signo sería positivo). La perturbación ui recoge aquellos efectos que influyen sobre el salario y que no están contenidos en la variable educación; si entre estos efectos estuviera, por ejemplo, la destreza individual y esta variable estuviera correlacionada con la educación, entonces la variable Educi sería un regresor endógeno y la estimación mínimo-cuadrática del parámetro β1 estará sesgada al alza indicando el efecto conjunto de la educación y la destreza individual sobre el salario.
Para estimar el parámetro β1, evitando el sesgo de endogeneidad, una posibilidad es buscar una variable instrumento para la educación que cumpla las siguientes condiciones:
- 1. Que esté incorrelacionada con la perturbación ui del modelo. En nuestro caso, ello exigiría que la variable instrumento estuviera incorrelacionada con la destreza individual. Si no se cumple esta condición el estimador por variables instrumentales no sería consistente (habría un sesgo de endogeneidad que no disminuiría al aumentar el tamaño muestral).
- 2. Que tenga una correlación alta con el regresor endógeno, en nuestro caso, con la variable educación. La eficiencia del estimador por variables instrumentales está directamente relacionada con la correlación entre ambas variables.
Para el modelo de nuestro ejemplo, una opción a veces utilizada en la literatura del mercado de trabajo consiste en utilizar la variable educación de la madre (mothereduc) como variable instrumento. Previsiblemente la educación de la madre estará correlacionada con la variable educación aunque es más discutible que la variable mothereduc esté incorrelacionada con la destreza individual y, por lo tanto, con la perturbación ui del modelo. El problema, por otra parte, habitual en el contexto de variables instrumentales, es que, al ser la variable ui no observable, no es posible contrastar empíricamente la condición de incorrelación entre el instrumento y la perturbación y dicha condición es crítica para que el estimador por variables instrumentales sea consistente. Esta condición, habitualmente, ha de establecerse basada en razonamientos económicos o intuitivos.
Para expresar las ecuaciones del estimador por variables instrumentales vamos a denotar como yia la variable dependiente (logaritmo del salario), xial regresor endógeno y como zi al instrumento escogido. En este caso, las ecuaciones del estimador por mínimos cuadrados ordinarios (MCO) vienen dadas por :
o, en forma matricial:
Por otro lado, las ecuaciones por variables instrumentales vienen dadas por:
En nuestro ejemplo, las ecuaciones del estimador VI desarrolladas serían:
Adicionalmente, la matriz de varianzas asintótica del estimador por variables instrumentales se puede obtener a partir de la expresión matricial:
El parámetro representa, como es habitual, la varianza de las perturbaciones del modelo. Una vez calculada una estimación de esta matriz de varianzas, se pueden realizar contrastes de hipótesis y construir intervalos de confianza en la forma habitual para los parámetros β del modelo.
Afortunadamente, la práctica totalidad del software econométrico actual incluye la posibilidad de estimar por variables instrumentales por lo que el analista únicamente debe preocuparse por escoger instrumentos adecuados que cumplan las dos condiciones exigidas anteriormente.
Mínimos cuadrados en dos etapas (MC2E)
En algunas ocasiones, puede existir más de un instrumento válido, en el sentido de que cumpla las dos condiciones, para un mismo regresor endógeno. En este caso, siempre que todos los instrumentos cumplan la condición de incorrelación con las perturbaciones, cualquier combinación lineal de instrumentos sería válida para estimar por variables instrumentales. En este sentido se dice que el estimador por variables instrumentales no es único sino que existen tantos estimadores por variables instrumentales como posibles instrumentos o combinaciones lineales de ellos.
Una opción, utilizada habitualmente para mejorar la eficiencia del estimador (en el sentido de minimizar la varianza), es calcular el estimador por variables instrumentales a través de dos conjuntos de regresiones:
- 1. Una regresión inicial por cada regresor endógeno del modelo, como variable dependiente, sobre el conjunto de todos los instrumentos disponibles como variables independientes. Lógicamente, el conjunto de instrumentos debe ser mayor o igual que el número de regresores endógenos.
- 2. Una regresión final posterior donde se sustituyen directamente los regresores endógenos por las estimaciones de cada uno obtenidas en las regresiones anteriores. Como consecuencia, se sustituye como variable independiente a cada regresor endógeno por la combinación lineal óptima obtenida a partir del conjunto de instrumentos.
Al estimador obtenido se le denomina estimador por mínimos cuadrados en dos etapas y puede demostrarse que es el estimador de menor varianza de todos los posibles estimadores por variables instrumentales (obtenidos con ese conjunto de instrumentos). Por supuesto, la validez de esta estimación está condicionada por el cumplimiento de la condición de incorrelación entre cada instrumento y las perturbaciones del modelo.
A modo de ejemplo, imaginemos que un analista económico quiere estimar la función de consumo y especifica la siguiente ecuación dinámica en la que existe autocorrelación, generada por un AR(1), en las perturbaciones:
Ct = β0 + β1Yt + β2Ct - 1 + u t
ut = put-1 + εt
La variable Yt es la renta mientras que la verdadera innovación (ruido blanco) del modelo es εt, por lo que la perturbación utde la ecuación de consumo presenta autocorrelación y, como consecuencia, ut está correlacionada con el regresor Ct-1 (es un regresor endógeno). Los posibles instrumentos de Ct-1 pueden ser retardos de la variable renta ya que cumplen las dos condiciones exigidas:
- a) Si la renta no está correlacionada con uttampoco deberían estarlo sus retardos.
- b) Los retardos de la renta deben estar correlacionados con la variable
Ct-1.
Si escogemos Yt-1 e Yt-2 como instrumentos del regresor endógeno Ct-1, el estimador MC2E consistiría en realizar los siguientes pasos:
- 2. Aplicar MCO al modelo inicial, donde se sustituye el regresor endógeno por su estimación en la regresión previa:
Si las hipótesis sobre el comportamiento de la renta son correctas, la estimación del parámetro β2 en la última regresión será consistente aunque haya autocorrelación en las perturbaciones. Además, dentro de todos los posibles estimadores por variables instrumentales obtenidos combinando los instrumentos Yt-1 e Yt-2, el estimador MC2E será el más eficiente.
Para terminar, es importante señalar que este método de estimación (MC2E) resulta especialmente útil cuando se estiman modelos multiecuacionales con varias ecuaciones y variables dependientes a la vez. En estos casos, resulta habitual la disponibilidad de varios instrumentos y, por lo tanto, es fácil la obtención del estimador MC2E.
Recuerde que...
- • Existen tantos estimadores por variables instrumentales como posibles instrumentos o combinaciones lineales de ellos.