Prévia do material em texto
Tópico 15 – Modelos de Cortes Transversais ao Longo do Tempo Método Simples de Dados em Painel Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 13). Modelos de Efeitos Fixos Como 𝑎𝑖 é constante em 𝑡, podemos tirar a diferença dos dados entre os dois anos: 𝑦𝑖1 = 𝛽0 + 𝛽1𝑥𝑖1 + 𝑎𝑖 + 𝑢𝑖1 𝑡 = 1 𝑦𝑖2 = 𝛽0 + 𝛿0 + 𝛽1𝑥𝑖2 + 𝑎𝑖 + 𝑢𝑖2 𝑡 = 2 Subtraindo a segunda equação da primeira: 𝑦𝑖2 − 𝑦𝑖1 = 𝛿0 + 𝛽1 𝑥𝑖2 − 𝑥𝑖1 + 𝑢𝑖2 − 𝑢𝑖1 Ou ∆𝑦𝑖 = 𝛿0 + 𝛽1∆𝑥𝑖 + ∆𝑢𝑖 O efeito não observado, 𝑎𝑖, foi “descartado pela diferenciação”. O intercepto é, na realidade a mudança no intercepto de 𝑡 = 1 para 𝑡 = 2. Equação em primeiras diferenças: 𝐶𝑜𝑣 ∆𝑥𝑖 , ∆𝑢𝑖 = 0 em ambos os períodos 𝑡 = 1 e 𝑡 = 2. Exogneidade estrita. 𝛽1 é o estimador em primeiras diferenças. Modelos de Efeitos Fixos Equação de Primeiras Diferenças: ∆𝑦𝑖 = 𝛿0 + 𝛽1∆𝑥𝑖 + ∆𝑢𝑖 Onde ∆ representa a mudança de 𝑡 = 1 para 𝑡 = 2. O efeito não observado 𝑎𝑖 não aparece nesta equação, ele foi “descartado pela diferenciação”. Além disso, o intercepto passa a ser a mudança no intercepto de 𝑡 = 1 para 𝑡 = 2. Esta equação chamamos de Equação de Primeiras Diferenças. Ela é apenas uma equação única de corte transversal, mas cada variável é diferencia ao longo do tempo. Modelos de Efeitos Fixos Os pressupostos mais importantes são: Primeiro: ∆𝑢𝑖 não está correlacionada com a variável explicativa (∆𝑥𝑖) em ambos os períodos de tempo. Segundo: ∆𝑥𝑖 deve ter alguma variação ao longo de i. Terceira: satisfazer a hipótese de homocedasticidade. Modelos de Efeitos Fixos Custos em utilizar dados em painel: Primeiro: os conjuntos de dados em painel são mais difíceis de coletar do que um corte transversal, especialmente de indivíduos. Segundo: mesmo que tenhamos coletado um conjunto de dados em painel, a diferenciação utilizada para eliminar 𝑎𝑖 pode reduzir bastante a variação nas variável explicativas. Embora 𝑥𝑖𝑡 frequentemente tenha variação substancial no corte transversal para cada 𝑡 , ∆𝑥𝑖 pode não ter muita variação. Pequenas variações em ∆𝑥𝑖 podem levar a grande erros- padrão de መ𝛽1 quando estimamos pela equação de primeira diferenças por MQO. Diferenciação com mais de dois períodos de tempo Também podemos usar a diferenciação com mais de dois períodos de tempo. Suponha que temos 𝑁 indivíduos e 𝑇 = 3 períodos de tempo para cada indivíduo. Um modelo genérico de efeitos fixos é: 𝑦𝑖𝑡 = 𝛿1 + 𝛿2𝑑2𝑡 + 𝛿3𝑑3𝑡 + 𝛽1 𝑥𝑖𝑡1 +⋯+ 𝛽𝑘 𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡 𝑡 = 1,2,3 (o número de observações é portanto 3𝑁. ) O intercepto do primeiro período é 𝛿1, do segundo período é 𝛿1 + 𝛿2, e assim por diante. Se o efeito não observado 𝑎𝑖 for correlacionado com qualquer das variáveis explicativas, o uso do MQO agrupado nos três anos de dados resultará em estimativas viesadas e inconsistentes. Hipótese crucial: 𝐶𝑜𝑣 𝑥𝑖𝑡𝑗 , 𝑢𝑖𝑠 = 0, ∀𝑡, 𝑠 𝑒 𝑗 → Variáveis explicativas são estritamente exógenas após retirarmos o efeito não observado 𝑎𝑖. Tópico 15 – Métodos avançados de Dados em Painel Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 14). Dados em Painel Método para controle de alguns tipos de variáveis omitidas sem observá-las de fato. Controle da regressão por características não observáveis, isto é, a heterogeneidade dos indivíduos é controlada. Exemplo: quais são os efeitos dos impostos sobre bebidas alcoólicas e das leis que punem os motoristas embriagados pelas mortes no trânsito? A base de dados de painel nos permite controlar variáveis não observadas que diferem de um Estado para o outro, tais como atitudes culturais predominantes quanto a beber e dirigir, mas que não variam ao longo do tempo. Ela também permite controlar variáveis que se alteram ao longo do tempo, como melhorias na segurança de carros novos, mas que não variam entre os estados. Métodos avançados de Dados em Painel Efeitos fixos: de modo semelhante ao método de primeiras diferenças, seu estimador é obtido por uma transformação que remove o efeito não observado 𝑎𝑖. Efeitos aleatórios: o estimador é usado quando o efeito não observado não é correlacionado com todas as variáveis explicativas. Em ambos, pode-se pensar em uma especificação estática ou dinâmica. O modelo de regressão com efeitos fixos Embora o intercepto possa diferir entre os indivíduos, o intercepto de cada indivíduo não varia com o tempo (ele é invariante no tempo). A primeira diferença é apenas uma de muitas maneiras de eliminar o efeito fixo, 𝑎𝑖 . Um método alternativo que funciona melhor sob certas hipóteses é chamado transformação de efeitos fixos. A regressão com efeitos fixos é um método para controlar variáveis omitidas em dados de painel quando elas variam entre entidades (estados), mas não ao longo do tempo. Estimação de Efeitos Fixos Efeitos Fixos: 𝑦𝑖𝑡 = 𝛽1𝑥𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 , 𝑡 = 1,2,… , 𝑇 (1) Onde 𝑎i é uma variável não observada que varia entre os Estados, mas não ao longo do tempo. Para cada 𝑖, calcule a média desta equação em 𝑡: ഥ𝑦𝑖 = 𝛽1 ҧ𝑥𝑖 + 𝑎𝑖 + ത𝑢𝑖 𝑡 = 1,2,… , 𝑇 (2) Como 𝑎𝑖 é fixo ao longo do tempo, ele aparece nas duas equações. Estimação de Efeitos Fixos Subtraindo a segunda equação da primeira, para cada 𝑡 , ficamos com: 𝑦𝑖𝑡 − ത𝑦𝑖 = 𝛽1 𝑥𝑖𝑡 − ҧ𝑥𝑖 + 𝑢𝑖𝑡 − ത𝑢𝑖, 𝑡 = 1,2,… , 𝑇 (3) Ou: ሷ𝑦𝑖𝑡 = 𝛽1 ሷ𝑥𝑖𝑡 + ሷ𝑢𝑖𝑡 , 𝑡 = 1, 2, . . 𝑇 Os dados em (3) são os dados centrados na média. A transformação de efeitos fixos também é chamada de transformação intragrupo. Devemos estimar (3) pelo MQO agrupado. Um estimador MQO agrupado que seja baseado em variáveis temporais reduzidas é chamado de estimador de efeitos fixos ou estimador intragrupo. Estimação de Efeitos Fixos A adição de mais variáveis explicativas à equação pode ser representado como: 𝑦𝑖𝑡 = 𝛽1𝑥𝑖𝑡1 +⋯+ 𝛽𝑘𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡, 𝑡 = 1, 2, . . 𝑇 (4) O modelo: ത𝑦𝑖𝑡 = 𝛽1 ҧ𝑥𝑖1 +⋯+ 𝛽𝑘 ҧ𝑥𝑖𝑘 + 𝑎𝑖 + ഥ𝑢𝑖 , 𝑡 = 1, 2, . . 𝑇 (5) Simplesmente usamos a centralização na média de cada variável explicativa. Em seguida, fazemos uma regressão pelo MQO agrupado utilizando todas as variáveis que sofreram centralização na média. Comando no Stata: xtreg Estimação de Efeitos Fixos A equação de centralização na média geral para cada 𝑖 é: ሷ𝑦𝑖𝑡 = 𝛽1 ሷ𝑥𝑖𝑡1 +⋯+ 𝛽𝑘 ሷ𝑥𝑖𝑡𝑘 + ሷ𝑢𝑖𝑡 𝑡 = 1, 2, . . 𝑇 (6) Sob uma hipótese de exogeneidade estrita das variáveis explicativas, o estimador de efeitos fixos é não viesado: de certa forma, o erro idiossincrático 𝑢𝑖𝑡 deve ser não correlacionado com cada variável explicativa ao longo de todos os períodos de tempo. Efeitos Fixos com painéis não balanceados Painel não balanceado: alguns anos não são observados para pelo menos uma das cross-sections. São aplicáveis a painéis não balanceados, mas temos de assumir que: As razões pelas quais alguns períodos de tempo são missing não são sistematicamente relacionada aos erros idiossincráticos (usado para descrever erro de dados em painel que ambas as mudanças ao longo do tempo e/ou em todas as unidades - indivíduos, empresas, cidades, etc. - podem ocorrer. Efeitos Aleatórios A especificação do modelo de efeitos aleatórios trata os efeitos específico individuais como variáveis aleatórias. Se requisito não é atendido, resultados são enviesados. Propõe diferentes termos de intercepto para cada observação, contudo, interceptos fixos ao longo do tempo Neste modelo,supõe-se que não há correlação entre os efeitos individuais e as demais variáveis aleatórias. A sua estimação se daria através da utilização dos mínimos quadrados generalizados (GLS). Efeitos Aleatórios Modelos de efeitos aleatórios O modelo: 𝑦𝑖𝑡 = 𝛽0 + 𝛽1𝑥𝑖𝑡1 +⋯+ 𝛽𝑘𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡 𝑡 = 1, 2, . . 𝑇 (7) Em que, o efeito não observado 𝑎𝑖 está não correlacionado com cada regressor em qualquer período de tempo. 𝐶𝑜𝑣 𝑥𝑖𝑗 , 𝑎𝑖 = 0, 𝑡 = 1,2,… , 𝑇; 𝑗 = 1,2,… , 𝑘 (8) Temos então o modelo de efeitos aleatórios, que requer todas as hipóteses de efeitos fixos, além de que 𝑎𝑖 deve ser independente de todas as variáveis explicativas em todos os períodos. Efeitos Aleatórios Como estimar 𝛽? 𝛽 pode ser estimado de forma consistente, utilizando uma única secção transversal. Mas isso ignora muita informação útil para os outros períodos de tempo. Se corremos ao MQO utilizando um MQO agrupado (pooled), também pode obter estimadores consistentes. Mas ignora uma característica fundamental do o modelo: o termo de erro composto é correlacionados em série (𝑣𝑖𝑡 = 𝑎𝑖 + 𝑢𝑖𝑡). Portanto, a melhor maneira é usar MQG. Efeitos Fixo e Aleatórios Algumas hipóteses: Para cada 𝑡, o valor esperado do erro idiossincrático, dadas as variáveis explicativas em todos os períodos de tempo e o efeito não observado, é zero: 𝐸 𝑢𝑖𝑡 𝑋𝑖 , 𝑎𝑖 = 0 → exogeneidade estrita. Como estamos subtraindo somente uma fração das médias temporais, agora podemos permitir variáveis explicativas constantes no tempo. 𝑉𝑎𝑟 𝑢𝑖𝑡|𝑋𝑖 , 𝑎𝑖 = 𝑉𝑎𝑟 𝑢𝑖𝑡 = 𝜎𝑢 2 para todo 𝑡 = 1,… , 𝑇. Valor esperado de 𝑎𝑖dadas todas as variáveis explicativas, é constante : 𝐸 𝑎𝑖 𝑋𝑖 = 𝛽0. Essa hipótese que elimina a correlação entre efeito não observado e as variáveis explicativas, e é a principal distinção entre os efeitos fixos e efeitos aleatórios. Efeitos Aleatórios Portanto, a melhor maneira é usar MQG: 𝜆 = 1 − 𝜎𝑢 2 𝜎𝑢 2 + 𝑇𝜎𝑎 2 1 2 A equação é transformada: 𝑦𝑖𝑡 − 𝜆ത𝑦𝑖 = 𝛽0 1 − 𝜆 + 𝛽1 𝑥𝑖𝑡1 − 𝜆 ҧ𝑥𝑖𝑡 +⋯+ 𝛽𝑘 𝑥𝑖𝑡𝑘 − 𝜆 ҧ𝑥𝑖𝑘 + (𝑣𝑖𝑡 − 𝜆 ҧ𝑣𝑖) Trata-se de dados de corte na média em cada variável. Permite variáveis explicativa que são constantes ao longo do tempo. A transformação de EA subtrai uma fração da média temporal e do número de períodos T (envolve dados quase reduzidos em cada variável). Qual modelo usar? Teste de Hausman: Ferramenta para avaliar qual o modelo mais apropriado de efeitos não observados (efeitos fixos ou aleatórios). Modelos de efeitos fixos e aleatórios são consistentes se são especificados corretamente. Porém, algumas violações causam inconsistência nos modelos de efeitos aleatórios: – Se variáveis X’s estão correlacionadas com erro aleatório. A diferença entre o modelo de efeitos fixos e o de efeitos aleatórios é que no primeiro a correlação entre os regressores e os efeitos específicos (heterogeneidades individuais) é diferente de zero, enquanto que no segundo é igual a zero. Teste de Hausman Teste de Hausman: 𝐻0: 𝐶𝑜𝑟 𝑋𝑖𝑡 , 𝑎𝑖 = 0 → Efeito aleatório 𝐻1: 𝐶𝑜𝑟 𝑋𝑖𝑡 , 𝑎𝑖 ≠ 0 → Efeito fixo 𝐻0 → significa que as estimativas de ambos modelos são iguais, porém o modelo de efeitos aleatórios produz estimativas mais eficientes dado que utiliza o método de MQG. 𝐻1 → significa que o modelo de efeitos aleatórios é inconsistente e o de efeitos fixos é consistente. Se a hipótese nula for rejeitada → os efeitos aleatórios provavelmente estão correlacionados com um ou mais regressores. Nesse caso, o modelo de efeitos fixos é preferível aos de efeitos aleatórios. Teste BP e Chow Teste BP (Breusch-Pagan): examinar se os efeitos não observados são relevantes ao modelo. 𝐻0: ausência de efeito não observado. 𝐻1:presença de efeito não observado. Teste de Chow no sentido de corroborar a escolha entre os modelo de efeitos fixos e o modelo pooled. Teste para escolher entre efeito fixo e pooled 𝐻𝑜: modelo pooled. 𝐻1: modelo de efeitos fixos. Exercícios 1. Qual a diferença da estimação de Mínimos Quadrados Agrupados para a estimação de Efeitos Fixos? E de Efeitos aleatórios? Explique e mostre as hipóteses de identificação necessárias. 2. Dê um exemplo utilizando métodos de análise em painel para a avaliação de políticas públicas. Explique. Diferenciação com mais de dois períodos de tempo Hipótese do MQO agrupado usando Primeiras Diferenças: Hipótese PD.1: modelo linear. Para cada 𝑖 , o modelo é: 𝑦𝑖𝑡 = 𝛽1𝑥𝑖𝑡1 +⋯+ 𝛽𝑘𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡, 𝑡 = 1,… , 𝑇. Em que os𝛽𝑗 são os parâmetros s serem estimados e 𝑎𝑖 é o efeito não observado. Hipótese PD.2: temos uma amostra aleatória do corte transversal. Hipótese PD.3: cada variável explicativa muda ao longo do tempo (para pelo menos algum 𝑖), e não existem relações lineares perfeitas entre as variáveis explicativas. Diferenciação com mais de dois períodos de tempo Hipótese PD.4: Para cada 𝑡 , o valor esperado do erro idiossincrático, dadas as variáveis explicativas em todos os períodos de tempos e os efeitos não observados é zero: 𝐸 𝑢𝑖𝑡 𝑋𝑖 , 𝑎𝑖 = 0 Isso equivale, muitas vezes dizemos que a 𝑥𝑖𝑡𝑗 são estritamente exógena condicionada ao efeito não observado. Hipótese PD.5: a variância dos erros diferenciados, condicional a todas as variáveis explicativas é constante: 𝑉𝑎𝑟 ∆𝑢𝑖𝑡 𝑋𝑖) = 𝜎 2, t = 2,… , T (homocedasticidade) Diferenciação com mais de dois períodos de tempo Hipótese PD.6: Para todo 𝑡 ≠ 𝑠 , as diferenças nos erros idiossincráticos são não correlacionadas (condicionais a todas as variáveis explicativas): 𝐶𝑜𝑣 ∆𝑢𝑖𝑡 ∆𝑢𝑖𝑠 𝑋𝑖 = 0, 𝑡 ≠ 𝑠. Sob PD.1-6 → estimadores PD são os melhores estimadores lineares. Hipótese PD.7: condicional a 𝑋𝑖 , o ∆𝑢𝑖𝑡 são variáveis aleatórias normais independentes e identicamente distribuídas. Sob PD.1-7 → estimadores PD são normalmente distribuídos, e as estatísticas 𝑡 e F do MQO agrupado das diferenças têm distribuições 𝑡 e 𝐹 exatas. Sem PD7 → pode-se recorrer às aproximações assintóticas habituais. Hipóteses para Efeitos Fixos Hipóteses para Efeitos Fixos: EF.1: Para cada 𝑖, o modelo é: 𝑦𝑖𝑡 = 𝛽1𝑥𝑖𝑡1 +⋯+ 𝛽𝑘𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡 , 𝑡 = 1,… , 𝑇. Em que os𝛽𝑗 são os parâmetros s serem estimados e 𝒂𝒊 é o efeito não observado. EF.2 : Temos uma amostra aleatória na dimensão corte transversal. EF.3: Cada variável explicativa muda ao longo do tempo (para ao menos algum 𝑖), e não há relações lineares perfeitas entre as variáveis explicativas. EF.4: Para cada 𝑡, o valor esperado do erro idiossincrático, dadas as variáveis explicativas em todos os períodos de tempo e o efeito não observado, é zero: 𝐸 𝑢𝑖𝑡 𝑋𝑖 , 𝑎𝑖 = 0 Hipóteses para Efeitos Fixos EF.5: 𝑉𝑎𝑟 𝑢𝑖𝑡|𝑋𝑖 , 𝑎𝑖 = 𝑉𝑎𝑟 𝑢𝑖𝑡 = 𝜎𝑢 2 para todo 𝑡 = 1,… , 𝑇. EF.6: 𝐶𝑜𝑣 𝑢𝑖𝑡 𝑢𝑖𝑠 𝑋𝑖 , 𝑎𝑖 = 0 Sob as Hipóteses EF.1 a EF.6, o estimador de efeitos fixos dos 𝛽𝑗 é o melhor estimador linear não viesado. EF.7: 𝑢| 𝑋𝑖 , 𝑎𝑖 → 𝑁(0, 𝜎𝑢 2) - condicional a 𝑋𝑖 , o 𝑢𝑖𝑡 são variáveis aleatórias normais independentes e identicamente distribuídas. Hipótese para Efeitos Aleatórios Hipótese para Efeitos Aleatórios As hipóteses ideais do efeitos aleatório são: EF.1, EF.2, EF.4, EF.5 e EF.6. Como estamos subtraindo somente uma fração das médias temporais, agora podemos permitir variáveis explicativas constantes no tempo. Portanto, o EF.3 é substituído por : EA.3: Não existem relações lineares perfeitos entre as variáveis explicativas. EA.4: Em adição ao EF.4, o valor esperado de 𝑎𝑖dadas todas as variáveis explicativas, é constante : 𝐸 𝑎𝑖 𝑋𝑖 =𝛽0 . Essa hipótese que elimina a correlação entre efeito não observado e as variáveis explicativas, e é a principal distinção entre os efeitos fixos e efeitos aleatórios.