Apontamentos de Econometria II Aula 1 Importância dos Dados Temporais Em Econometria I, os modelos económicos assumiam que as observações/dados eram de natureza seccional (cross-sectional): indivíduos, famílias, países, empresas, ... observadas num único/restrito período de tempo. A amostra era tratada com sendo aleatória, i.e., não correlação entre as observações. Quem trabalha na banca, seguros, empresas publicas, finança, organizações nacionais e internacionais, ... muitas das vezes (ou a maior parte do tempo) estuda modelos com variáveis que se observam ao longo do tempo. PIB real • O produto (PIB), a quantidade/variável que normalmente usada para caracterizar o ciclo económico de uma Economia. Aula 2 Alguns Conceitos • Uma time series/serie temporal/sucessão cronológica em IR é uma função real em que para cada período de tempo t fixo, Yt é uma variável aleatória que ocorre sequencial e ordenadamente no tempo. • Na prática, observamos uma sequência de valores reais ao longo do tempo. Deixa de ser uma sequência de variáveis aleatórias para passar a ser uma sequência de valores reais. • Algumas variáveis flutuam de uma forma estável em torno de um valor médio (estacionárias, p.e. growth) e outras não, porque tendem a “explodir” no tempo (não estacionárias, p.e. PIB). • Porque a analise da regressão com estes dois tipos de dados é diferente, precisamos de os distinguir começando o semestre assumindo estacionaridade de todas as variáveis do modelo (na Parte2 vemos a não estacionaridade). • Frequência dos dados: Anual, Trimestral, Mensal, Semanal, Diária, ... • Dimensão da amostra (período amostral) T: Os dados são observados de t = 1 até t = T i.e. t = 1,2,...,T o qual está associado ao período correspondente. Por exemplo, de 1947Q2 a 2019Q3 (T = 290) • Ao contrário dos dados seccionais, podemos “brincar” com os dados em função do que o modelo económico sugere na sua dimensão temporal. Por exemplo, o produto (RGDP). o Lags (desfasamentos) Exemplo: RGDPt−1, RGDPt−4, ... o Leads Exemplo: RGDPt+1 ... o Variações absolutas (primeiras diferenças/first differences) Exemplo: △RGDPt =RGDPt−RGDPt−1 variação em cadeia △RGDPt =RGDPt−RGDPt−4 variação homóloga o Variações relativas (percentuais) Exemplo: △ log(RGDPt ) = log(RGDPt ) − log(RGDPt−1) Aula 3 Cov (yt, yt-1) • Variância de y em tempos diferentes na amostra. • l= 1 => 1 trimestre (em cadeia). • Covariância é uma função de l, depende de l. Os dados em Econometria II não tem Cov = 0 ¹ Econometria I A (auto)covariância Cov (Yt,Yt-l) = Cov (Yt,Yt+l) = Γ(l) é uma função do desfasamento l. • Cov(Yt,Yt+l) = 0 => Em Econometria II isto não se verifica A memória existe e dissipa-se no tempo: Γ(l) → 0 quando l → ∞. Para uma série temporal observada, estima-se Γ(l) pela (auto)covariância amostral e Corr(Yt,Yt-l) por Do file – PIB em termos reais - TS1 Twoway (tsline GDPC1) -> Gráfico gen y = GDPC1 • Nome para GDPC 1. gen f1y = F.y • PIB em t+1. • Valor do PIB no período seguinte (trimestre seguinte). • Dá a coluna com o PIB do trimestre seguinte. • Importante: Algumas decisões económicas baseiam-se em como vamos estar no futuro. gen l1y = L.y • O PIB em t-1. • O PIB no trimestre anterior (em coluna). genl4y = L4.y • PIB no ano anterior no mesmo trimestre. • 4 trimestres = 1 ano. l –> desfasamento temporal que estou a analisar gen d1y = D.y • Variações absolutas do PIB (nas mesmas unidades do que o PIB). • Variação em cadeia (em relação ao trimestre anterior). gen 4y = y – l4y • Variação homóloga do PIB em unidades (dólares). • Linha 27 (gen d4y_ = S4.y) faz o mesmo. ac y • Gráfico (autocorrelação). • Horizontal -> e • A correlação com 1 ano de afastamento temporal é maior do que a correlação com 5 anos de afastamento temporal. ac rd1lypp • Em cadeia. • Zona Sombreada – Teste de Hipóteses: o H0: Autocorrelação (l) = 0; H1: Autocorrelação (l) ¹ 0 o Aceito H0 quando a bola (estimativa da autocorrelação) está dentro da zona sombreada. l1 -> Há correlação entre o crescimento económico em cadeia com 1 trimestre de desfasamento. l 2 -> Também há correlação, a partir daí deixa de haver. ac rd4lypp • Homólogo. • Há uma correlação entre o crescimento deste ano e do ano anterior. • Há uma correlação entre o crescimento quando se varia 1 ano (4 trimestres) maior do que quando se varia 1 trimestre. gen rd1y = (y – l1y) / l1y • Linha 33 (rd1ypp = rd1y*100) é igual só que em %. • Variação percentual em cadeia (trimestre a trimestre) em relação ao período (trimestre) anterior. gen rd4y = (y – l4y) / l4y • Variação percentual em relação ao ano anterior. • Variação percentual homóloga (em relação ao mesmo trimestre do ano anterior). gen rd1lyoo = D.ly*100 • Variação do log do PIB. gen rd1y = rd1y*100 • Variação em percentagem. gen rd4lypp = (ly – LY.ly)*100 • Variações em percentagem em relação ao mesmo trimestre do anterior. • Variação do log do PIB. Aula 4 O Modelo ... O modelo de regressão linear múltipla é escrito exatamente da mesma maneira que em Econometria I. Para distinguir de dados seccionais, fazemos a troca de i por t e de n por T: ® K – número de Betas no modelo ® Variáveis x’s - regressores Diferente de Econometria I Aspetos distintos dos dados seccionais: • A ordem da observação t é importante. Não se pode alterar a posição da observação porque respeita a evolução temporal! • A teoria económica ou o próprio investigador estabelece o tipo de especificação no modelo. Alguns exemplos: 1. Existe apenas um único regressor (x) mas com vários desfasamentos. 2. A própria variável dependente (y) na lista de regressores => Ex: o output gap e um país é explicado pelo output gap desse mesmo país no período anterior. 3. A própria variável dependente (y) desfasada e o próprio x desfasado na lista de regressores. 4. A própria variável temporal (t) está incluído na lista de regressores. • Os erros do modelo ut podem ter autocorrelação (reparar no “podem” - no MRLM, os erros têm um papel diferente das variáveis dependente e independentes que são económicas e observadas e, portanto certamente autocorrelacionadas. Mais detalhes ao longo do semestre). Modelos WN e MA (White Noise e Moving Average) Modelos que incorporam autocorrelação na variável. Para identificarmos o modelo para dados sem autocorrelação (a la Gauss Markov de Econometria I) e porque é a base dos modelos com autocorrelação MA e AR, começo com o Ruido Branco (White Noise). Denomine-se εt por Ruído Branco (white noise) o processo em que E(εt)=0; V(εt)=σε2 <∞ e Γ(l)=0 para todo l: εt ∼ wn (0, σε2). Pode-se assumir para simplificar uma distribuição normal estandardizada. O processo médias móveis de 1º ordem, MA1, ut satisfaz Modelo AR (Auto regressive) O processo autorregressivo de ordem 1, AR (1), sem termo independente, ut satisfaz ® Modelo autorregressivo porque, como o próprio nome indica, é uma auto regressão, uma vez que aparece a própria variável u com um desfasamento. ® ρ é o parâmetro do modelo do erro, mede a correlação dos erros. Para que este processo seja estacionário e de memória que se dissipa, |ρ| < 1. Neste caso, ® A correlação neste modelo nunca é zero, caso l = 0, Corr (ut,ut−l) = 0 logo ρ = 0 e assim faria com que voltássemos a ter um ruído branco => Exemplo: Expressão 5 se ρ = 0, fica ut = εt. ® Nunca é zero a autovariância no modelo AR, independentemente do desfasamento. Tal como acontece para o MA, Corr (ut,ut−l) = ρl → 0 quando l → ∞ mas a forma como oscila para chegar a zero depende se ρ > 0 ou ρ < 0. O modelo AR(p), sem termo independente é ® Quando o l aumenta, o afastamento temporal é maior. ® À medida que aumenta o l, a memória vai desaparecendo (ρl) => a correlação vai diminuindo. ® À medida que o ρ aumenta, o decaimento é mais lento. Formulas do OLS (Ordinary Linear Square) – Estimador pelo Método Mínimo Quadrados Mínimos Quadrados Sem Ponderação - Standard Mesmo com dados temporais e assumindo estacionaridade e as hipóteses de Gauss-Markov, nomeadamente a não autocorrelação dos erros, para todo t ¹ s, podemos usar as fórmulas usuais do OLS aprendidos em Econometria I (estimador, variâncias e covariâncias, testes t e F, R quadrado, ...) para estimar o modelo Mas em modelos com time series os erros podem estar autocorrelacionados, e a hipótese Gauss-Markov não é válida. Este fenómeno também pode ser consequência de uma má especificação (por exemplo, a omissão de yt−1 como regressor ou lags nos x’s). Ou seja, os resultados de Econometria I podem não ser válidos! Curva de Phillips Em teoria, + desemprego => - inflação e – desempego => + inflação devido às pressões salariais que levam ao crescimento económico e consequentemente ao aumento da inflação. Nível de significância necessita de ser 10%, porque a 5% não se verifica a curva de Phillips. NOTA: É necessário indicar no Stata que os dados são temporais, se não o Stata assume que são sectoriais. Do file – Curva de Phillips - TS1 tsset year, yearly • Tsset - Time series setting • Time variable: year • Delta: 1 year (yearly) Linha 51 twoway (tsline inf) (tsline unem) • Gráfico da inflação e do desemprego • Curva de Phillips verifica-se até 1973/74 • 1970-1973– choques petrolíferos, crise económica levou ao aumento do desemprego (quase chegou aos 2pp) => inflação e desemprego aumentam => curva de Phillips deixa de se verificar Linha 52 twoway (tsline inf) (tsline unem) if year<1974 – 1º metade verifica-se. Linha 53 twoway (tsline inf) (tsline unem) if year>1973 – na sub sample, já não é tão significativo. Diferença entre tsline e scatter plot • Time series line • Scatter plot (pares ordenados entre x e y) Linha 54 twoway (scatter inf unem) • Não é possível traçar uma linha de correlação negativa Linha 55 twoway (scatter inf unem) if year<1974 • Já é possível Linha 58 regress inf unem • H0: inflação não responde ao desemprego; H1: Inflação responde ao desemprego • P value > ao nível de significância de 10% => Eu não rejeito H0, ou seja, eu aceito H0 Linha 59 regress inf unem if year<1974 • Subsample – restrinjo à primeira metade do período – P value < nível de significância de 10%. • Por mais 1 pp no desemprego, a taxa de inflação decresce 0,78 pp. • Termo independente dá-nos o valor esperado do y quando o x=0. • Espera-se que a inflação atinga 6pp quando a o desemprego é 0?? (cons). Linha 60 regress inf unem if year>1973 • Stag inflation period. • O desemprego variou, não em resposta à inflação, mas sim aos choques petrolíferos. Aula 5 Heterocedasticidade de Econ I => Se há heterocedasticidade a solução é a estimação de Mínimo Quadrados mantendo os SE Robustos. Roadmap Vamos admitir que no modelo possa haver autocorrelacão nos erros. O que significa isso para as hipóteses Gauss-Markov? Que consequências implica para o OLS? Como se pode testar esse pressuposto? Se houver evidência disso, como o resolver? Este o roadmap dos próximos slides (similar ao caso de hétero de Econ1). Consideremos um esquema de autocorrelação nos erros tal que para algum t ¹ s. Por exemplo, seguir um processo MA ou AR. ® A covariância entre 2 ou mais erros do modelo é ¹ 0, isto é, 2 ou mais erros do modelo estão correlacionados, é violada a hipótese de Gauss-Markov. Autocorrelação nos Erros Para ilustrar, vejamos ut AR (1) homocedástico. A matriz de variâncias e covariâncias dos erros ΩT ×T = V (u|X) é ® Diagonal principal: variâncias do erro ® Fora da diagonal principal: covariâncias do erro Notar que isto viola a hipótese Gauss-Markov porque fora da diagonal principal teríamos 0’s. Mesmo que as restantes hipóteses G-M permaneçam válidas, o OLS apesar de centrado (e, consequentemente, consistente), não é BLUE e os testes habituais não são válidos, mesmo assintoticamente. ® Apesar de o estimador ser centrado e consistente, já não é BLUE, isto é, o mais eficiente (menor variância). ® A partir do momento em que estamos a usar o Standard Errors do estimador OLS com a fórmula usual e essa fórmula está errada => os testes habituais deixam de ser válidos bem como os intervalos de confiança. Estas são as consequências de ignorar a existência de erros autocorrelacionados no modelo. Consequências para o OLS O OLS deixa de ser BLUE, o mais eficiente (há outro estimador mais eficiente, como veremos mais tarde). Mas mais importante na prática, estaremos a fazer mal os testes com o OLS porque usaremos fórmulas erradas. Para o teste t, o denominador o SE do OLS (raiz quadrada da variância estimada do OLS). No MRLS e sob ut do tipo AR (1) estacionário, |ρ| < 1, Logo, usar a expressão usual de G-M está errado! Se o SE está errado então também estará o rácio-t e podemos errar na decisão da significância do(s) regressor(es)! Idem para testes-F e intervalos de confiança! Testar a não autocorrelação dos Erros Para sabermos se temos ou não a violação da hipótese G-M e se, com isso, precisamos de mudar alguma coisa na estimação e testes no modelo, temos de recorrer a testes. Consideremos o modelo AR (1) estacionário, que é parcimonioso mas ao mesmo tempo cobre os casos de não autocorrelação (i.e. ρ = 0) e de autocorrelação (i.e. ρ ¹ 0 e |ρ| < 1) dos erros O mais simples (mas não o melhor) é fazer um teste t a ρ (H0: ρ = 0 versus H1: ρ ¹ 0) no modelo onde ût são os resíduos OLS e Teste Durbin-Watson (DW) A estatística de teste DW é Notas: • O teste é a um AR (1) e não se aplica a modelos dinâmicos (i.e., não pode incluir na lista de regressores o próprio y desfasado). • A DW varia entre 0 e 4 (logo, não é um teste standard) e a sua distribuição não é standard e depende de T e de k, isto é, do número de observações e de betas do modelo. Ver os valores críticos dL (lower bond) e dU (upper bond) no livro ou num site. o dL e dU dependem do número de observações e de betas. o DW tabela • A regra de decisão inclui uma região inconclusiva (nada se pode concluir). Quando nada se conclui com o teste DW, podemos usar o teste AR (1) assimptótico, sob H0: ρ = 0. Para testar um AR (1) em modelos dinâmicos pode-se usar os testes h-Durbin e h-Durbin alternativo. Regra Decisão DW ® Quando p = 1, o valor da DW é 0. o Entre 0 e dl, rejeita-se H0 porque há correlação positiva (ρ > 0). ® Quando p = - 1, o valor da DW é 4. o Entre 4-dl e 4, rejeita-se H0 porque há correlação negativa (ρ < 0). ® Quando p = 0, o valor da DW é 2. o H0: Os erros não estão correlacionados; => não se rejeita H0 quando a estatística de DW apresenta valores perto de 0, isto é, entre du e 4 – du (du e 4-du são valores críticos da tabela). ® Entre dl e du e 4-du e 4-dl, nada se pode concluir (região inconclusiva). Teste Breusch-Godfrey (BG) Testes à autocorrelação dos erros de ordem superior (não restrita a AR (1)). Para erros AR(p), consideremos a regressão auxiliar de teste Como H0: ρ1 = ... = ρp = 0, podemos usar um teste F (significância conjunta de ût-1, ..., ût-p). Alternativamente, pode-se usar a estatística de Breusch-Godfrey (T − p) R2, onde o R2 é da regressão anterior, e que assimptoticante é distribuída como χ2p. O teste Box-Pierce e Lyung-Box são procedimentos alternativos aos anteriores. Do file – Curva de Phillips - TS1 Linha 63 estat dwatson • Estatística de Durbin-Watson. • Necessário correr a linha 49 para que o Stata resolva a estatística de DW porque por default o stata assume que são dados seccionais. • Tabela • K=1* (* não estou a incluir o termo independente) que é a taxa de desemprego (variável independente) e t = 48 • DL: 1.503 • DU:1.585 Linha 64 estat bgodfrey • Estatística BG. • Somente os p-values, não são necessário os valores críticos. Linha 66 predict uhat, resid • Resíduos dos MQ • Modelos com resíduos normalmente não se põe termos independentes Linha 67 pac uhat • Estimador parcial Linha 68 gen l1uhat=L1.uhat Linha 69 gen l2uhat=L2.uhat Linha 70 gen l3uhat=L3.uhat Linha 71 regress uhat l1uhat, nocons • Econ I – tiramos a constante porque o valor esperado da média amostral é zero.(?) Linha 72 display 1-0.8027005/2 Linha 73 regress uhat l1uhat l2uhat l3uhat unem • 3 lags de resíduo => vou testar um AR (3) • Estimar o modelo com variável dependente- o resíduo (uhat) Linha 74 test (l1uhat l2uhat l3uhat) • Teste à significância conjunta do que está dentro dos parenteses => teste F da BG com AR(3) Linha 75 display sqrt(49)*0.5729695** • Teste AR (1) assimptótico, usado quando o teste DW é inconclusivo => **(DW alternativo) • Resultado=4, está à direita de 1,96, logo rejeitamos H0. Há autocorrelação dos erros. Linha 77 regress inf unem • Output errado, os SE são usuais o Ou corrigo as fórmulas dos SE uma vez que há hetero => SERobustos o Ou arranjo outra forma de estimar os betas uma vez que há hetero =>MQPonderados Comparação da linha 77 e 80 • O Beta é igual porque continuamos a usar os MQ Linha 78 ac uhat Linha 79 pac uhat Linha 80 newey inf unem, lag(1) • Os coeficientes não mudam porque continua a ser usado o mesmo método de estimação, no entanto corrigido (SERobustos, novo t, novo p-value, novo intervalo de confiança) • Regressão com Newey West SE e o devido m identificado [lag(1)] • O output obtido na linha 77 corrigido Linha 81 newey inf unem, lag(3) • Preferível usar a linha 81 do que a 80 porque apresenta mais desfasamentos Aula 6 Fórmula de Newey-West (está nos apontamentos, formula 41) é baseada na fórmula 18 (não é a formula 18 porque temos uma entidade que não se conhece – ómega) Formula 41 • M => lags • St estimado => Autocovariâncias amostrais dos resíduos Existem 2 soluções para quando existe autocorrelação dos erros: o Manter a estimação dos betas por OLS mas corrigir os SE’s => usar os SE’s de NeweyWest (melhor solução, porque os betas continuam a ser centrados e consistentes); o Abdicar do OLS e usar os GLS e FGLS. V( OLS ) sob autocorrelação Esta deve ser a solução quando há autocorrelação dos erros: Manter a estimação dos betas por OLS mas corrigir a expressão das suas variâncias-covariâncias pela fórmula de NeweyWest para tornar a inferência correta (corrigir os SE’s). Vimos antes que se os erros seguem um AR(1), Se adivinhássemos que os erros eram mesmo um AR(1) então a V( OLS ) robusta a AR(1) era a da expressão anterior substituindo os parâmetros ρ e σ2u pelas suas estimativas. ® Ou seja, se não há autocorrelação nos erros usa-se ® Se há autocorrelação nos erros usa-se a fórmula (18) que dará SE’s corretos. . SE’s do OLS de Newey-West robustos a autocorrelação Obviamente, assumir que os erros são AR (1) é um tiro no escuro e se não for assim então continua errada a fórmula da matriz! Portanto, importa definir s.e.’s robustos do OLS sem impor um modelo apriori (robusto a qualquer modelo para os erros). Wooldridge (2003) propôs um método, mas deve-se a Newey and West (1987) uma fórmula geral robusta a autocorrelação mas também de heterocedasticidade para do estimador OLS. A raíz quadrada de e o desvio padrão de robusto a autocorrelação. É com este SE que se devem fazer os testes quando há autocorrelação dos erros. A formula de NW robusta para V( OLS ) é complicada e pode-se ver a sua expressão nos apontamentos ou livro. Esta fórmula tem um kernel e um parâmetro de truncagem (fixed bandwidth) sobre os quais não nos debruçaremos. Aula 7 – 16/10/2020 Procedimentos Iterativos Como indicado atrás, esta não deve ser a principal solução quando há autocorrelação dos erros (deve ser os SE do OLS robustos). De qualquer modo, é pertinente conhecermos um novo estimador (diferente do OLS) e que é mais eficiente do que o OLS quando há autocorrelação. A ideia é semelhante ao caso da heterocedasticidade de Econometria I (o WLS é mais eficiente do que o OLS sob hetero). O modelo tem autocorrelação e transformamo-lo (quasidiferenças) de modo a passar a ser definido com variáveis transformadas com erros GaussMarkov. Ilustro com um exemplo: Método de Cochrane-Orcutt O MRLM com erros AR (1), ut = ρut−1 + εt, é equivalente ao modelo (transformado) onde εt é não autocorrelacionado. ® εt é um ruído branco ® Quase-diferença porque em yt – ρyt - 1 não sabemos o valor de ρ. Se ρ = 1, então seria uma diferença (yt – yt – 1). Se ρ fosse conhecido, tomava-se o seu valor e aplicava-se o princípio dos mínimos quadrados (teríamos o GLS – General Linear Square). Mas ρ não é conhecido, tem de ser estimado. Mas depende dos resíduos e estes por sua vez dos parâmetros estimados ... ... é um “loop”! Método de Cochrane-Orcutt - Iterações Procedimento a dois passos - estimar sucessivamente ρ (e β) com novas séries de resíduos até à iteração na qual a variação de custa da última iteração para é negligenciável. O estimador FGLS é pois obtido à : • Se conhecesse o ρ era GLS, mas como não conheço é o FGLS. • Mais eficiente será o melhor ρ possível. • Se o ≥ 1, não uso este método porque não conseguirei fazer esta convergência. Estimadores GLS e FGLS Este slide é apenas telegráfico. Para uma qualquer matriz Ω conhecida, o estimador eficiente é o estimador GLS (generalized LS). Na prática, esta matriz Ω não se conhece e tem de ser estimada. O estimador passa a ser o FGLS (feasible) • Não se aconselha esta solução porque é difícil estimar com qualidade a matriz ómega. Se nos enganarmos, a fórmula do estimador fica errada. Nota: Se os erros não estiverem autocorrelacionados, os SE do NW são iguais aos Usuais. Do file – Curva de Phillips - TS1 Linha 83 regress inf unem • estimação de MQ Usuais Linha 84 e 85 dão a estimação eficiente quando os erros são autocorrelacionados. Linha 84 prais inf unem • Muda os coeficientes uma vez que é outro método de estimação (variáveis com * quasi-diferenças) • Muda os SE => estimador mais eficiente (menor variância => menor desvio padrão estimado => menor SE) Os SE’s devem ser menores porque este modelo é mais eficiente. Linha 85 prais inf unem, corc • Corc => Cochrane-Orcutt, não usa a primeira observação Diferença entre a linha 84 e 85 Linha 84, procedimento prais => há uma maneira de obter um valor para a primeira observação VS Linha 85, Procedimento Cochrane-Orcutt => põe no lixo a primeira observação (48). Dá algo muito parecido. Ou seja, no procedimento prais na linha 84 faz quasi-diferenças a partir da observação 49 A 48 não é uma quasi-diferença. Em termos teóricos, menos uma observação é uma estimação menos eficiente.