capitulo07dummy02

download capitulo07dummy02

of 27

Transcript of capitulo07dummy02

  • 7/24/2019 capitulo07dummy02

    1/27

    Regresso Linear Mltipla: informaes qualitativas evariveis binrias, dicotmicas ou "dummy"- Parte 2

    Aula 21

    Prof. Moiss A. Resende Filho

    Introduo Econometria (ECO 132497)

    02 de junho de 2014

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 1 / 27

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    2/27

    Categorias mltiplas

    Considere o modelo

    log(salarioh) =0+0feminino+1casado+1educ+

    +2exper+3exper2 +4perm+5perm

    2 + u (1)

    onde a varivel binria femininorecebe o valor um se o indivduo dosexo feminino e zero, caso contrrio; e a varivel binria casado recebe ovalor um se o indivduo casado e zero, caso contrrio. Qual a categoria base desse modelo?

    Fazendofeminino=casado=0, obtm-se a categoria base:"homem solteiro".

    Vamos estimar esse modelo no Stata.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 2 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    3/27

    No Stata: digite na janela de comandos

    ssc install bcuse

    bcuse wage1, clear

    drop wage nonwhite numdep smsa northcen south west construc ndurman trcommpu

    trade services profserv profocc clerocc servocc

    *Traduz os nomes da variveis para o portugus

    rename female femininorename tenure perm

    rename married casado

    rename lwage lsalarioh

    rename tenursq permsq

    *Estima o modelo (1)reg lsalarioh feminino casado educ exper expersq perm permsq

    eststo modelo1

    esttab modelo1, star(* 0.10 ** 0.05 *** 0.01) se r2 ar2 label

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 3 / 27

    http://goforward/http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    4/27

    Resultados

    *

  • 7/24/2019 capitulo07dummy02

    5/27

    Problema

    Considere o modelo

    log(salarioh) =0+0feminino+1casado+1educ+

    +2exper+3exper2 +4perm+5perm

    2 + u

    Assumindo RLM.4 (mdia condicional zero),E(ujfeminino, casado, educ, ...) =0, temos que: E(log(salarioh)jfeminino=1, casado=1, educ, ...) E(log(salarioh)jfeminino=1, casado=0, educ, ...) =1 E(log(salarioh)jfeminino=0, casado=

    1, educ, ...) E(log(salarioh)jfeminino=0, casado=0, educ, ...) =1 A especicao do modelo impe que o prmio do casamento seja omesmo (1) para homens e mulheres. Como dar maior exibilidade ao modelo?

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 5 / 27

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    6/27

    Soluo

    Alternativa 1: utilize as interaes entre femininoe casado, o que gera

    quatro categorias:"homens solteiros"(hsolteiros).

    "homens casados"(hcasados).

    "mulheres solteiras"(msolteiras).

    "mulheres casadas"(mcasadas).

    Por exemplo, dena a categoria "homens solteiros"(hsolteiros) como acategoria base e gere trs variveis binrias para as outras categorias. A especicao do modelo que permite prmios diferentes para o

    casamento segundo o gnero

    log(salarioh) = 0+0hcasados+1mcasadas+2msolteiras+

    +1educ+2exper+3exper2 +4perm+5perm

    2 + u (2)

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 6 / 27

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    7/27

    No Stata: digite na janela de comandos

    ssc install bcuse

    bcuse wage1, clear

    drop wage nonwhite numdep smsa northcen south west construc ndurman trcommpu

    trade services profserv profocc clerocc servocc

    rename female feminino

    rename tenure permrename married casado

    rename lwage lsalarioh

    rename tenursq permsq

    *Gera as variveis binrias

    gen hcasados=(1-feminino)*casadogen hsolteiros=(1-feminino)*(1-casado)

    gen msolteiras=feminino*(1-casado)

    gen mcasadas=feminino*casado

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 7 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    8/27

    No Stata: digite na janela de comandos

    *Estima o modelo (2)

    reg lsalarioh hcasados mcasadas msolteiras educ exper expersq perm permsqeststo modelo1

    esttab modelo1, star(* 0.10 ** 0.05 *** 0.01) se label

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 8 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    9/27

    Resultados e interpretao

    * p

  • 7/24/2019 capitulo07dummy02

    10/27

    Resultados e interpretao

    log(salarioh) =0.321+0.213hcasados 0.198mcasadas0.110msolteiras+0.079educ+0.027exper 0.00053exper

    2++0.029perm 0.0005perm2

    Categoria base: homens solteiros.

    A estimativa do prmio do casamento para os homens 21,3% ou,exatamente, (exp(0.213) 1) 100=23, 738%. Estima-se que mulheres casadas recebam 19,8% a menos que homenssolteiros ou, exatamente,(exp(0.198) 1) 100=21, 896%. Estima-se que mulheres solteiras recebam 11% a menos que homenssolteiros ou, exatamente, (exp(0.110) 1) 100=11, 628%. A estimativa do prmio do casamento para mulheres (0.198 (0.110)) 100=8, 8% ou, exatamente,(21.896 11.628) =10.268% a menos.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 10 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    11/27

    Resultados e interpretao

    log(salarioh) =0.321+0.213hcasados 0.198mcasadas

    0.110msolteiras+0.079educ+0.027exper 0.00053exper2++0.029perm 0.0005perm2

    Para testar se o prmio do casamento para mulheres signicante,

    utilize ep(b1b2) = dVar(b1) +dVar(b2) 2dCov(b1,b2)1/2

    . Alternativa, poder-se-ia especicar o modelo com mulheres solteirascomo categoria base e efetuar um teste tpara o coeciente da varivelmcasadas, no modelo

    log(salarioh) = 0+0hcasados+1mcasadas+2hsolteiros+

    +1educ+2exper+3exper2 +4perm+5perm

    2 + u

    Regra: se existem ggrupos ou categorias, inclui-se (g 1) variveis

    dummyde intercepto no modelo.Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 11 / 27

    http://goforward/http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    12/27

    Interao entre dummies

    Alternativa 2: equivalentemente, estime o modelo

    \log(salarioh) = 0.321(0.100)

    0.110(0.56)

    feminino+ 0.213(0.055)

    casado

    0.301(0.072)

    feminino casado+b1educ+b2exper+b3exper2 +b4perm+5perm2

    Fazendo feminino=casado=0, obtem-se a equao para a categoriabase, no caso, "homens solteiros". Como antes, estima-se que homens casados ganham,aproximadamente, 21.3% a mais que os homens solteiros.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 12 / 27

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    13/27

    Interao entre dummies

    \log(salarioh) = 0.321(0.100)

    0.110(0.56)

    feminino+ 0.213(0.055)

    casado

    0.301(0.072)

    feminino casado+b1educ+b2exper+b3exper2 +b4perm+5perm2

    Ainda, como antes:

    Mulheres casadas recebem 19,8%

    ((0.110+0.213 0.301) 100=19.8 ) a menos que homens solteiros. Mulheres solteiras recebem 11%a menos que homens solteiros. A estimativa do prmio do casamento para mulheres (0.198 (0.110)) 100=8.8%.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 13 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    14/27

    Inclinaes diferentes

    At aqui, as especicao do modelo s permitiam diferentes interceptospara diferentes grupos.

    Utilizando a interao entre variveis explicativas e variveisdummypossibilita diferentes inclinaes no modelo de regresso. Considere o modelo de regresso

    log(salarioh) = (0+0feminino)+(1+1feminino) educ+ u

    = 0+0feminino+1educ+1feminino educ+ u(3)

    Para homens: E[log(salarioh)jfeminino=0, educ] =0+1educ Para mulheres:E[log(salarioh)jfeminino=1, educ] =(0+0)+(1+1) educ

    Hipteses testveis:H0 :1 =0 (teste t), o efeito ceteris paribusda educao o mesmopara homens e mulheres;

    H0 :0 =1 =0 (teste F), salrios mdios so iguais para homens emulheres (discriminao inexistente);

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 14 / 27

    http://goforward/http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    15/27

    Diferentes retornos educao para mulheres e homens

    Modelo economtrico

    log(salarioh

    ) = 0+0feminino

    +1educ

    +1feminino

    educ

    +u

    Em (b): fazendo 0+1educ=(0+0)+(1+1) educ, obtm-se

    educ=

    0

    1 .Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 15 / 27

    http://find/
  • 7/24/2019 capitulo07dummy02

    16/27

    Incorporando informao ordinal

    Suponha que desejssemos estimar o efeito da qualidade da dvida do

    governo municipal (CR) sobre a taxa de juros paga pelos ttulosmunicipais (TTM). Considere um esquema que classica a qualidade da dvida dogovernosegundo uma escala ordinal, tal que: CR2 f0, 1, 2, 3, 4g, ondeCR=0 (pior qualidade) e 4 (mais alta qualidade). Uma possvel especicao do modelo

    TTM= 0+1CR+ outros fatores (4)

    onde 1 mede a mudana percentual em TTM quanto CRaumenta em

    uma unidades, ou seja, quando a dvida do governo sobe para a classeimediatamente superior. Limitao: impede que a variao em TTMpossa ser diferente entreclasses.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 16 / 27

    I d i f di l

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    17/27

    Incorporando informao ordinal

    A especicao alternativa que permite que a variao em TTM possaser diferente entre classe

    TTM= 0+1CR1+2CR2+3CR3+4CR4+ outrosfatores (5)

    onde CR1 =1 se CR=1, caso contrrio, CR1 =0; CR2 =1 se CR=2 ,caso contrrio, CR2 =0; CR3 =1 se CR=3, caso contrrio, CR3 =0;CR4 =1 se CR=4, caso contrrio, CR4 =0. j,j=1, .., 4 a diferena em TTMde um municpio com classicaoCR= jem relao ao municpio com CR=0 (categoria base).

    Para testar o modelo restrito (4) onde as trs restries sobH0 :2 =21, 3 =31, 4 =41 esto impostas contra o modeloirrestrito(5), efetua-se um teste F.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 17 / 27

    Dif d

    http://goforward/http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    18/27

    Diferenas da regresso entre grupos

    Objetivo: testar se duas populaes ou grupos seguem a mesma funode regresso. Considere o modelo restrito

    aumfGPA= 0+1SAT+2emperc+3tothrs+ u (6)

    onde, para atletas, aumfGPA nota mdia nal em curso superior; SAT a nota de ingresso no curso superior; emperc o percentil de classicaono curso mdio; tothrs o total de horas do curso superior.

    O modelo o mesmo para homens e mulheres?

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 18 / 27

    Dif d

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    19/27

    Diferenas da regresso entre grupos

    Especique o modelo irrestrito

    aumfGPA = 0+0feminino+1SAT+1feminino SAT++2emperc+2feminino emperc+3tothrs+

    +3tothrs feminino+ u (7)

    onde a varivel binria feminino recebe um se o indivduo do sexo

    feminino e zero, caso contrrio. Qual a categoria base desse modelo? A hiptese de que o modelo que explica aumfGPA o mesmo parahomens e mulheres

    H0 :0 =1 =2 =3 =0 (8)

    F = (R2ir R

    2r)/(k+1)

    (1 R2ir)/(n 2 (k+1))F(k+1),(n2(k+1))

    em que k o nmero de variveis no modelorestrito.Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 19 / 27

    N St t di it j l d d

    http://find/
  • 7/24/2019 capitulo07dummy02

    20/27

    No Stata: digite na janela de comandos

    ssc install bcuse

    bcuse gpa3, clear*Elimina as observaes referentes ao primeiro semestre (fall, term=1)drop if term

  • 7/24/2019 capitulo07dummy02

    21/27

    No Stata: digite na janela de comando

    *Executa um teste F indireto*Passo 1: Estima o modelo irrestrito e armazena SQRire g.l.reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs

    scalar r2_ir = e(r2)

    scalar gl_ir = e(df_r)

    * Passo 2: Estima o modelo restrito e armazena SQRr e g.l.

    reg aumfGPA sat emperc tothrsscalar r2_r = e(r2)

    scalar gl_r = e(df_r)

    scalar q = gl_r - gl_ir

    *Calcula a estatstica F

    scalar Festatistica = ((r2_ir - r2_r)/q)/((1-r2_ir)/gl_ir)*Obtm o F crtico a 5%, p-valor e lista tudoscalar Fcrit5 = invFtail(q,gl_ir,.05)

    scalar pvalor = Ftail(q,gl_ir,Festatistica)

    scalar list r2_ir r2_r gl_r gl_ir q Festatistica pvalor Fcrit5

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 21 / 27

    Resultados e interpretao

    http://find/http://goback/
  • 7/24/2019 capitulo07dummy02

    22/27

    Resultados e interpretao

    _cons 1.480812 .2073336 7.14 0.000 1.073067 1.888557 femtothrs -.0001158 .0016277 -0.07 0.943 -.0033169 .0030852 tothrs .0023441 .0008624 2.72 0.007 .0006482 .0040401 fememperc -.0005498 .0031617 -0.17 0.862 -.0067676 .0056681 emperc -.0084516 .0013704 -6.17 0.000 -.0111465 -.0057566

    femSAT .0007506 .0003852 1.95 0.052 -6.88e-06 .0015081 sat .0010516 .0001811 5.81 0.000 .0006955 .0014078 feminino -.3534862 .4105293 -0.86 0.390 -1.160838 .4538659

    aumfGPA Coef. Std. Err. t P>|t| [95% Conf. Interval]

    Total 131.893686 365 .361352564 Root MSE = .46783 Adj R-squared = 0.3943

    Residual 78.3545051 358 .218867333 R-squared = 0.4059 Model 53.5391809 7 7.64845442 Prob > F = 0.0000

    F( 7, 358) = 34.95

    Source SS df MS Number of obs = 366

    . reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs

    Nenhum dos termos envolvendo a varivel dummy feminino

    estatisticamente, individualmente signicante a 5%. Como F =

    (R2irR2r)/(k+1)

    (1R2ir)/(n2(k+1))= (0.405926790.35163639)/4(10.40592679)/358 =8.1791 >

    F5%;4,358 =2.40, ento, rejeita-se H0 :0 =1 =2 =3 =0. A varivel dummy e suas interaes so conjuntamentesignicantes.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 22 / 27

    No Stata: digite na janela de comando

    http://find/
  • 7/24/2019 capitulo07dummy02

    23/27

    No Stata: digite na janela de comando

    *Executa o teste F direto da hiptese conjunta

    H0 :0 =1 =2 =3 =0quietly reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs

    test feminino femSAT fememperc femtothrs

    Prob > F = 0.0000 F( 4, 358) = 8.18

    ( 4) femtothrs = 0( 3) fememperc = 0( 2) femSAT = 0( 1) feminino = 0

    . test feminino femSAT fememperc femtothrs

    A varivel dummy femininoe suas interaes so conjuntamentesignicantes. Ou,os modelos para homens e mulheres so diferentes.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 23 / 27

    Teste de Chow: equivalente a abordagem anterior

    http://find/
  • 7/24/2019 capitulo07dummy02

    24/27

    Teste de Chow: equivalente a abordagem anterior

    Passo 1: estime, separadamente, para a categoria (homens emulheres) o modelo

    aumfGPA= 0+1SAT+2emperc+3tothrs+ u

    e com base em SQRh e SQRm , calcule a SQRdo modelo irrestrito,SQRir =SQRh+ SQRm .

    Passo 2: estime, para todos os dados juntos, o modeloaumfGPA= 0+1SAT+2emperc+3tothrs+ u

    obtendo a SQRdo modelo restrito, SQRp. Passo 3: calcule a estatstica do teste

    bF =(SQRp(SQRh+ SQRm ))/(k+1)(SQRh+ SQRm )/(n 2 (k+1))

    F(k+1),(n2(k+1))

    e efetue o teste.

    Como todo teste F, s vlido sob homocedasticidade.Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 24 / 27

    No Stata: digite na janela de comandos

    http://find/
  • 7/24/2019 capitulo07dummy02

    25/27

    No Stata: digite na janela de comandos

    ssc install bcuse

    bcuse gpa3, clear

    *Elimina as obseraes referentes ao primeiro semestre (fall, term=1)drop if term

  • 7/24/2019 capitulo07dummy02

    26/27

    No Stata: digite na janela de comando

    * Passo 1B: Estima o modelo para homensreg aumfGPA sat emperc tothrs if feminino==0

    scalar sqr_h = e(rss)

    scalar gl_h = e(df_r)

    scalar sqr_ir = sqr_m + sqr_h

    scalar gl_ir = gl_m+gl_h

    * Passo 2: Estima o modelo com dados para homens e mulheresreg aumfGPA sat emperc tothrsscalar sqr_p = e(rss)

    scalar gl_p = e(df_r)

    scalar q = gl_p - gl_ir

    *Calcula a estatstica F, obtm o F crtico a 5%, p-valor e lista tudoscalar Festatistica = ((sqr_p - sqr_ir)/q)/(sqr_ir/gl_ir)

    scalar Fcrit5 = invFtail(q,gl_ir,.05)

    scalar pvalor = Ftail(q,gl_ir,Festatistica)

    scalar list sqr_p sqr_ir gl_ir q Festatistica pvalor Fcrit5

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 26 / 27

    Resultados e discusso

    http://find/
  • 7/24/2019 capitulo07dummy02

    27/27

    Resultados e discusso

    Fcrit5 = 2.3968824 pvalor = 2.545e-06Festatistica = 8.1791117

    q = 4 gl_ir = 358 sqr_ir = 78.354505 sqr_p = 85.515067. scalar list sqr_p sqr_ir gl_ir q Festatistica pvalor Fcrit5

    Os modelos para mulheres e homens so diferentes. Limitao: se H0 rejeitada no se sabe se devido a diferenas nos

    interceptos, inclinaes ou nos dois.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 02/06/2014 27 / 27

    http://find/