capitulo09 - econometria 1

29
Problemas Adicionais de Especicaªo e de Dados Aula 25 Prof. MoisØs A. Resende Filho Introduªo Econometria (ECO 132497) 16 de junho de 2014 MoisØs Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 1 / 29

description

curso econometria 1 professor moises resende filho. para graduacao em economia

Transcript of capitulo09 - econometria 1

Page 1: capitulo09 - econometria 1

Problemas Adicionais de Especificação e de DadosAula 25

Prof. Moisés A. Resende Filho

Introdução à Econometria (ECO 132497)

16 de junho de 2014

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 1 / 29

Page 2: capitulo09 - econometria 1

Especificação errada da forma funcional

• Má especificação ou especificação errada da forma funcional: omodelo não explica adequadamente a relação entre as variáveisexplicativas e a variável dependente.

Possibilidades:

• Utilizar o log de variáveis explicativas (log(xj )) ou log da variáveldependente (log(y)) ou log de ambas.• Utilizar o quadrado ou cubo de variáveis explicativas (x2j ,x3j , j = 1, ..., k).• Utilizar interações de xj (p.ex., xjxl , l , j = 1, ..., k; l 6= j).

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 2 / 29

Page 3: capitulo09 - econometria 1

Especificação errada da forma funcional

Como saber se estamos utilizando a forma funcional correta domodelo?

• Tome por base a teoria econômica e/ou trabalhos anteriores.• Reflita: faz mais sentido xj afetar y em termos percentuais (use log(xj ))ou em termos absolutos (use xj )?• Reflita: faz mais sentido a derivada com respeito a xj ser constante(isto é, ∂E (y |x)

∂xj= βj

)ou variar com xj

(isto é, ∂E (y |x)

∂xj= βj + 2βj+1xj

)ou variar com o nível de uma outra variável explicativaxk(isto é, ∂E (y |x)

∂xj= βj+1xk

)?

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 3 / 29

Page 4: capitulo09 - econometria 1

Especificação errada da forma funcional

Podemos ainda utilizar testes de exclusão de variáveis (por exemplo,H0 : βj = 0 ou βj+1 = 0).

• Problema: pode ser tedioso testar todas as possibilidades possíveis deexcluir ou adicionar variáveis, interações enter variáveis, utilizar log ouvariáveis ao quadrado.

Uma alternativa é utilizar testes de especificação, por exemplo, oteste de espericicação RESET de Ramsey (1969).

RAMSEY, J.B. Tests for specification errors in classical linear least-squaresanalysis. Journal of the Royal Statistical Association, Série B, v. 71,p.350-371, 1969.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 4 / 29

Page 5: capitulo09 - econometria 1

Teste RESET

• A idéia do teste RESET é que se o modelo satisfaz E (u|x) = 0, então,nenhuma função das variáveis explicativa adicionada ao modelo deve sersignificante.• Para tanto, inclui-se o quadrado e ordem maiores dos valores ajustadosde y (y2, y3) na regressão

y = β0 + β1x1 + · · ·+ βkxk + δ1y2 + δ2y3 + u

e teste a hipótese conjunta de exclusão H0 : δ1 = δ1 = 0, comF = F = (SQRr−SQRir )/2

SQRir/(n−k−1) ∼ F2,n−2−1 ou LM = nR2ir ∼ χ22.• A rejeiçãode H0 é evidência de má especificação da forma funcional domodelo.• Limitação: não informa nada sobre a origem da má especificação domodelo.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 5 / 29

Page 6: capitulo09 - econometria 1

No Stata: digite na janela de comandos

ssc install estout, replacessc install bcuse

*Carrega a base de dados a ser utilizada (WAGE1.RAW)bcuse hprice1, clear

*Deleta séries desnecessáriasdrop assess lassess*Traduz os nomes da variáveis para o portuguêsrename price precorename lotsize tamterrrename sqrft arquadrename bdrms qtdormrename lprice lprecorename llotsize ltamterrrename lsqrft larquad

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 6 / 29

Page 7: capitulo09 - econometria 1

No Stata: digite na janela de comandos

*Estima preco = β0 + β1tamterr + β2arquad + β3qtdorm+ uqui reg preco tamterr arquad qtdormpredict yhat1, xbgen qyhat1=yhat1^2gen tyhat1=yhat1^3qui reg preco tamterr arquad qtdorm qyhat1 tyhat1test qyhat1 tyhat1

            Prob > F =    0.0120       F(  2,    82) =    4.67

( 2)  tyhat1 = 0( 1) qyhat1 = 0

• Portanto, rejeitamos H0 : δ1 = δ1 = 0 ao nível de 5%, em favorde que há evidência de má especificação do modelo.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 7 / 29

Page 8: capitulo09 - econometria 1

No Stata: digite na janela de comandos

*Estima lpreco = β0 + β1ltamterr + β2larquad + β3qtdorm+ uqui reg lpreco ltamterr larquad qtdormpredict yhat2, xbgen qyhat2=yhat2^2gen tyhat2=yhat2^3qui reg lpreco ltamterr larquad qtdorm qyhat2 tyhat2test qyhat2 tyhat2

            Prob > F =    0.0831       F(  2,    82) =    2.57

( 2)  tyhat2 = 0( 1) qyhat2 = 0

• Não rejeitamos H0 : δ1 = δ1 = 0 ao nível de 5%, ou seja, não háevidência de má especificação do modelo.• A especificação log-log do modelo de preços hedônicos épreferível a especificação lin-lin.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 8 / 29

Page 9: capitulo09 - econometria 1

Teste de modelos não aninhados

• Teste de Davidson-MacKinnon (1981)DAVIDSON, R.; MacKINNON, J.G. Several tests of model specificaion inthe presence of altenative hypotheses. Econometrica, v. 49, p. 781-793,1081.• Passo 1: estime por MQO o modelo

log(preco) = β0 + β1ltamterr + β2larquad + β3qtdorm+ u (1)

e armazene y = lpreco.• Passo 2: estime por MQO o modelo

preco = β0 + β1tamterr + β2arquad + β3qtdorm+ θ1y + u (2)

e teste pelo teste t bicauldal H0 : θ1 = 0 (o modelo 1 é preferível).• Passo 3: efetue os passos 1 e 2 para o modelopreco = β0 + β1ltamterr + β2larquad + β3lqtdorm+ u.• Limitação: o teste de Davidson-MacKinnon (1981) pode não rejeitarnenhum dos modelos ou rejeitar ambos.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 9 / 29

Page 10: capitulo09 - econometria 1

Variáveis proxy

• Má especificação do modelo devido a omissão de um ou mais xj =>viés e inconsistência de MQO devido a omissão de variável (violação deRLM.4).• Considere o modelo populacional

y = β0 + β1x1 + β2x2 + β3x∗3 + u

onde a variável x∗3 é não observada, mas há uma variável proxy x3observada.• Escreva x∗3 como uma função linear de x3 e de um erro, v3

x∗3 = δ0 + δ3x3 + v3

tal que, reconhece-se que x∗3 não é perfeitamente relacionada com x3 eE (v3|x3) = 0.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 10 / 29

Page 11: capitulo09 - econometria 1

Variáveis proxy

Suposições necessária para que o método da variável proxyfuncione:

1 A variável proxy é "só uma proxy"da variável omitida e,portanto, não deveria ser incluída no modelo se x∗ estivessedisponível. Ou a variável proxy é não correlacionada com o erro domodelo populacional,

Cov(x3, u) = 0.

2 A variável proxy é uma "boa"proxy da variável omitida, tal queo uso de variáveis adicionais não auxilia a explicar a variávelomitida

E (x∗3 |x1, x2, x3) = E (x∗3 |x3)por exemplo, se x∗3 = δ0 + δ1x1 + δ2x2 + δ3x3 + v3, então, deve serverdade que δ1 = δ2 = 0 (suposição mais improvável de ocorrer naprática).

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 11 / 29

Page 12: capitulo09 - econometria 1

Variáveis proxy

• Se a variável proxy x3 satisfaz as duas condições para ser uma variávelproxy de x∗3 , pluga-se x

∗3 = δ0 + δ3x3 + v3 no modelo de regressão

populacional:

y = β0 + β1x1 + β2x2 + β3x∗3 + u

= β0 + β1x1 + β2x2 + β3(δ0 + δ3x3 + v3) + u

= (β0 + β3δ0)︸ ︷︷ ︸+β1x1 + β2x2 + β3δ3︸︷︷︸ x3 + (u + β3v3)︸ ︷︷ ︸y ≡ α0 + β1x1 + β2x2 + α3x3 + e (3)

onde α0 ≡ β0 + β3δ0, α3 ≡ β3δ3 e e ≡ u + β3v3.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 12 / 29

Page 13: capitulo09 - econometria 1

Variáveis proxy

• Sob as suposições 1 e 2 acerca de x3, u e v3,

E (e) = 0, Cov(x1, e) = 0, Cov(x2, e) = 0, Cov(x3, e)

o que é suficiente para garantir que os estimadores MQO do modelo

y = α0 + β1x1 + β2x2 + α3x3 + e

são estimadores consistentes de α0 ≡ (β0 + β3δ0), β1, β2 e α3 ≡ β3δ3, ouseja, estimar este modelo por MQO constitui a solução plugada doproblema de variável omitida.• Em geral, não será possível estimar β0 ou β3, mas apenas β1 e β2.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 13 / 29

Page 14: capitulo09 - econometria 1

Exemplo

• EXEMPLO: Habilidade do indivíduo (habil) na "equação do salário"

lsalario = β0 + β1educ + β2exper + β3habil + u

• Assuma que incluindo habil no modelo, assegura RLM.1 a RLM.4,garantindo que os estimadores MQO de βj , j = 0, 1, .., 3 são não-viesadose consistentes.• Questão: na prática, habil é não observável.• Se habil é omitida, como Cov(educ , habil) 6= 0, entãoE (u|educ , exper) 6= 0, fazendo com que os estimadores MQO deβj , j = 0, 1, .., 3 deixem de ser não-viesados e consistente.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 14 / 29

Page 15: capitulo09 - econometria 1

Exemplo

• Suponha que utilizemos a variável pontuação de QI como proxy parahabil , admitindo as seguinte hipóteses:1. QI não precisa estar na regressão se habil estivesse disponível.2. QI é uma boa proxy para habil tal que em

habil = δ0 + δ1educ + δ2exper + δ3QI + v3

δ1 = δ2 = 0.• É possível mostrar que, incluindo QI como proxy para habil , ou seja,estimando

lsalario ≡ α0 + β1x1 + β2x2 + α3QI + e

onde α0 ≡ β0 + β3δ0, α3 ≡ δ3x3 e e ≡ u + β3v3, a estimativa MQO β1deβ1 seria tal que a probabilidade limite de β1 é

β1 + β3δ1

• Espera-se que a inconsistência, β3δ1, seja menor com a inclusão davariável proxy QI do que sem a inclusão desta.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 15 / 29

Page 16: capitulo09 - econometria 1

No Stata: digite na janela de comandos

ssc install estout, replacessc install bcuse

*Carrega a base de dados a ser utilizada (WAGE1.RAW)bcuse wage2, clear

*Deleta séries desnecessáriasdrop wage hours KWW age sibs brthord meduc feduc*Traduz os nomes da variáveis para o portuguêsrename lwage lsalariorename tenure permrename married casadorename south sulistarename urban urbanorename black negrorename IQ QI

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 16 / 29

Page 17: capitulo09 - econometria 1

No Stata: digite na janela de comandos

*Estima o modeloqui reg lsalario edu exper perm casado sulista urbano negro, robusteststo modelo1qui reg lsalario edu exper perm casado sulista urbano negro QI, robusteststo modelo2esttab modelo1 modelo2, star(* 0.10 ** 0.05 *** 0.01) se label

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 17 / 29

Page 18: capitulo09 - econometria 1

* p<0.10, ** p<0.05, *** p<0.01Standard errors in parentheses

Observations           935             935

(0.113) (0.121)Constant         5.395***        5.176***

(0.000956)QI                       0.00356***

(0.0367) (0.0376)negro        ­0.188***       ­0.143***

(0.0271) (0.0267)urbano         0.184***        0.182***

(0.0274) (0.0277)sulista       ­0.0909***      ­0.0802***

(0.0397) (0.0391)casado         0.199***        0.200***

(0.00254) (0.00254)perm        0.0117***       0.0114***

(0.00324) (0.00324)exper        0.0140***       0.0141***

(0.00641) (0.00727)educ        0.0654***       0.0544***

                         lsalario        lsalario                              (1)             (2)

A variável QI tem efeito positivo e significante, tal que para cada 10pontos a mais de QI há um aumento de 3,6% no salário estimado.O efeito da escolaridade (edu) sobre o salário diminui de 6,5% para5,4% com a inclusão da variável proxy QI , como esperado.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 18 / 29

Page 19: capitulo09 - econometria 1

Erros de medida na variável dependente

• Considere que estamos interessado no modelo populacional

y ∗ = β0 + β1x1 + β2x2 + ...+ βxk + u

mas y ∗ é não observável.• Por exemplo, y ∗ é o montante poupado por família por ano, masobservamos y que é o montande poupado informado pela família, tal que aamostra é

{(yi , xi1, xi2, ..., xik ) : i = 1, 2, ..., n}e não, como idealizado,

{(y ∗i , xi1, xi2, ..., xik ) : i = 1, 2, ..., n}

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 19 / 29

Page 20: capitulo09 - econometria 1

Erros de medida na variável dependente

• Defina o erro de medida (e0) como a diferença entre o valor observadoe valor real da variável

e0 = y − y ∗

• Substituindo y ∗ = y − e0 em y ∗ = β0 + β1x1 + β2x2 + ...+ βxk + u,obtem-se

y = β0 + β1x1 + β2x2 + ...+ βxk + (u + e0)

onde (u + e0) passa a ser o erro do modelo.• RLM.4 garante que u é não correlacionado com cada xj , tal que seadicionalmente assumirmos que e0 é não correlacionada com cada xj ,então (u + e0) também será não correlacionada com cada xj .

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 20 / 29

Page 21: capitulo09 - econometria 1

Erros de medida na variável dependente

• A suposição crucial para estimadores MQO consistentes é que o erro demedida em y é não correlacionado com cada variável explicativa xjdo modelo.• Se assumirmos ainda que E (e0) = 0 e Cov(u, e0) = 0 faz com que

Var(u + e0) = σ2u + σ20 > σ2u

• Em suma, erro de medida em y aumenta a variância do erro domodelo.• Contra-exemplo: considere x1 = renda no modelo de poupança e quefamílias de maior renda tendem a reportar um montante poupadomaior, ou seja, Cov(e0, renda) > 0. Neste caso os estimadores MQO dosβj passam a ser todos inconsistente.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 21 / 29

Page 22: capitulo09 - econometria 1

Erros de medida na variável dependente - umcontra-exemplo

log(produc∗) = β0 + β1grant + u, (4)

onde produc∗ é produtividade do trabalhador e grant é uma variáveldicotômica que recebe 1 se a empresa recebe recursos subvencionados paratreinar os seus trabalhadores.• O erro de medida é multiplicativo, tal que, em logs,

log(produc) = log(produc∗) + e0, (5)

onde produc é a produtividade do trabalhador reportada pela empresa esubstituindo (4) em (5): log(produc) = β0 + β1grant + u + e0︸ ︷︷ ︸.• Se empresas que recebem subvenção reportam maior produtividade queo real (em resposta a pressão para justificar o recebimento da subvenção),então Cov(grant, e0) > 0, e uma regressão MQO superestima β1, o efeitodo programa de subvenção.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 22 / 29

Page 23: capitulo09 - econometria 1

Erros de medida em uma variável independente

• Considere o caso do modelo de regressão simples

y = β0 + β1x∗1 + u

onde e1 = x1 − x∗1 ou x1 = x∗1 + e1.• Substituindo x∗1 = (x1 − e1) no modelo populacional obtém-se omodelo com as variáveis observáveis

y = β0 + β1x1 + (u − β1e1)︸ ︷︷ ︸• Se Cov(x1, e1) = 0, ou erro de medida em x1 é não correlacionadocom x1, então estimadores MQO são consistentes, masVar(u − β1e1) = var(u) + β21var(e1)− 2β1Cov(u, e1) > σ2u , seCov(u, e1) = 0.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 23 / 29

Page 24: capitulo09 - econometria 1

Erros de medida em uma variável independente

• Mas sob a suposição de erro clássico nas variáveis (CEV) que é

Cov(x∗1 , e1) = 0

ou seja, o erro de medida é não correlacionado com os valores reaisda variável explicativa e E (e1) = 0.

Cov(x1, e1) = E [(x1 − E (x1))(e1 − E (e1))]= E (x1e1), pois E (e1) = 0

= E (x∗1 e1) + E (e21 ), pois x1 = (x

∗1 + e1)

= Var(e1) = σ2e1 , pois E (e1) = 0

eVar(x1) = Var(x∗1 + e1) = Var(x

∗1 ) + Var(e1) = σ2x ∗1 + σ2e1

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 24 / 29

Page 25: capitulo09 - econometria 1

Erros de medida em uma variável explicativa

• Questão chave: qual é a covariância entre x1 e o erro do modeloy = β0 + β1x1 + (u − β1e1︸ ︷︷ ︸)?Cov(x1, u − β1e1) = E [(x1 − E (x1))((u − β1e1)− E (u − β1e1))]

= Cov(x1, u)− β1Cov(x1, e1)

= −β1σ2e1 < 0

pois Cov(x1, u) = 0 (decorrente de RLM.4) e Cov(x1, e1) = σ2e1 (videdemonstração no slide anterior).

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 25 / 29

Page 26: capitulo09 - econometria 1

Erros de medida em uma variável explicativa

• É possível mostrar que a inconsistência de MQO sob a suposição deCEV é

plim(β1) = β1 +Cov(x1, u − β1e1)

Var(x1)

= β1 −β1σ

2e1

σ2x ∗1+ σ2e1

= β1

(1−

σ2e1σ2x ∗1

+ σ2e1

)

= β1

(σ2x ∗1

σ2x ∗1+ σ2e1

)

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 26 / 29

Page 27: capitulo09 - econometria 1

Erros de medida em uma variável explicativa

• O termo multiplicando β1,

σ2x ∗1σ2x ∗1

+ σ2e1

é menor que um se há erro de medida, ou seja, se σ2e1 > 0.

• Quanto maior for σ2e1 mais próximo de zero seráσ2x∗1

σ2x∗1+σ2e1

e, com isto,∣∣plim(β1)∣∣ < |β1|que é chamado de viés de atenuação, pois o estimador MQO geraestimativas muito mais próximas de zero que β1.• Por exemplo, se β1 > 0, então

plim(β1) < β1

tal que β1 de MQO subestima o efeito de x∗1 em y , ou seja, apresenta um

viés assintótico para zero.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 27 / 29

Page 28: capitulo09 - econometria 1

Erros de medida em uma variável explicativa

• O mesmo ocorre quando adicionamos mais variáveis ao modelo, porexemplo,

y = β0 + β1x∗1 + β2x2 + β3x3 + u

x1 = x∗1 + e1

onde u e e1 são não correlacionados entre si e não correlacionados comcada x∗1 , x2 e x3.• O estimador MQO de β1 da varíavel mensurada com erro terá um viésassintótico no sentido de zero (viés assintótico atenuador).• Os estimadores MQO dos coeficientes das variáveis mensuradas sem erro(β2 e β3) também serão assintoticamente viesados, mas o sentido doviés é desconhecido.• O viés de atenuação depende criticamente da suposição de erroclássico nas variáveis (CEV)

Cov(x∗1 , e1) = 0.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 28 / 29

Page 29: capitulo09 - econometria 1

Erros de medida em uma variável explicativa

EXEMPLO: Erro de medida em educ• Alguns autores têm alegado que o modelo padrão da regressãolog(wage), sistematicamente subestima o retorno da escolaridade devidoao viés de atenuação.• Esses autores tem em mente que

educ = educ∗ + e1Cov(educ∗, e1) = 0 (CEV)

onde educ∗ é o nível verdadeiro de escolaridade do indivíduo e educ é onível reportado de escolaridade pelo indivíduo.• É plausível supor que Cov(educ∗, e1) = 0?• Se pessoas de mais baixo grau de escolaridade tendem a reportarvalores maiores de escolaridade Cov(educ∗, e1) < 0, o que viola asuposição de erro clássico nas variáveis (CEV) e, assim, nada pode serdito sobre o sentido do viés assintótico de MQO.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 9) 16/06/2014 29 / 29