Viés de Atenuação
Esse é um desses posts curtos e simples, mas legalzinho. Surgiu de uma conversa minha com o Pedro e alguns de vocês já devem saber. É bem simples: suponha que você acha que na sua regressão x afeta y. O catch: você observa x com um erro, que é independente de x e do erro da regressão. A sua regressão vai sofrer com viés de atenuação. O parâmetro estimado vai ficar mais pŕoximo de zero, independente se ele é positivo ou negativo.
Como de praxe, começamos com uma simulação. Vou fazer uma regressão besta. A variável y vai ser , mil observações. Eu vou adicionar um erro ao x - chame essa nova variável de e fazer uma regressão y em .
Vamos ver a distribuição dos coeficientes:
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
A moda está em 0.5. Por que? Bom, considere o estimador que estamos usando:
Note que a média de é zero. Substitua pelo modelo verdadeiro:
Agora, veja que embaixo temos basicamente a variância de e em cima a variância de de . E como portanto . Então, o coeficiente está abaixo de 1. Veja que podemos trabalhar com o caso geral que ao invés de 1 temos . Veja que como eu coloquei tudo a normal padrão, e , então a conta acima dá 1/2.
Curiosamente tem uma solução super simples: variáveis instrumentais. Você pode usar qualquer variável relacionada a , até outra copia com erros, desde que não seja a mesma variável. Eu vou criar uma variável nova, z, para servir como instrumento:
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Esse é um uso bem legal de IV. Quem quiser referências: Eu imagino que quase todo livro de econometria básica deve ter isso. O Stock & Watson e Wooldridge muito provavelmente tem. O livro do Hayashi tem.