Post on 09-Feb-2019
TópicosTópicos emem EconometriaEconometria II
Aula 1/7/2013Aula 1/7/2013
1
ModeloModelo TobitTobit paraparasoluçãosolução de cantode canto
©
ExemplosExemplosSoluções de canto
1. Quantidade de dinheiro doado paracaridade: muitas pessoas não fazem este tipode doação. Uma parcela expressiva dos dados será igual a zero.dados será igual a zero.
2. Horas trabalhadas pelas mulheres: muitasmulheres não trabalham. Uma fraçãosignificativa tem horas de trabalho igual a zero.
Modelo Tobit é usado para modelar estassituações
2
Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina
• Suponha que queremos estimar o efeitoda educação x nas horas trabalhadas de mulheres casadas y.
• O modelo tobit é escrito a partir de umavariável latente y*, que é parcialmenteobservada pelo pesquisador:
y*=β0+β1x+u e u~N(0,σ2)
3
Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina
• Se y* é positiva, y* é igual ao total de horastrabalhadas : y.
• Se y* é negativo, as horas trabalhadas, y, • Se y* é negativo, as horas trabalhadas, y, se igualam a zero.
• Por hipótese, u é normalmente distribuído.
4
Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina
O modelo pode ser escrito como:
yi*=β0+β1xi+ui …………………..(1)
tal que
Horas trabalhadas
tal que
yi=yi* if yi*>0
yi=0 if yi*≤0
e
ui~N(0,σ2)
5
O subscrito i denota a i-ésima
observação. A equação (1)
satisfaz as hipóteses do modelo
linear clássico.
Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina
• A variável, y*, pode ser negativa, mas se negativa, horas trabalhadas são iguais a zero.
• O modelo Tobit considera o fato de quemuitas mulheres não trabalham, logo, horas trabalhadas são iguais a zero paramuitas.
7
ProcedimentoProcedimento de de estimaçãoestimação
• Estimação por Máxima Verossimilhança.
• Se horas trabalhadas são positivas (i.e., para as mulheres que estão trabalhando), yi*=yi, ou seja
ui= yi- β0+β1xi
A função de verossimilhança para uma mulherA função de verossimilhança para uma mulherque trabalha é dada pela função de densidadeda normal:
8
)(1
2
11
2
1 10
)(
)(2
1
2
)(
2
10
2102
210
σ
ββφ
σπσπσ
σ
ββφ
σ
ββ
σ
ββ
ii
xy
xyxy
i
xyeeL
ii
iiii −−===
−−
−−−
−−−
444 3444 21
ProcedimentoProcedimento de de estimaçãoestimação
• Se o total de horas de trabalho é igual a zero (i.e., paramulheres que não trabalham), sabemos que y*≤0.
• Neste caso, a contribuição para a verossimilhança é dada pela probabilidade de que y*≤0:
9
)(1
)(
)(
))((
)0()0(
10
10
10
10
10
*
σ
ββσ
ββσ
ββ
σ
ββ
ββ
i
i
ii
ii
iiii
x
x
xuP
xuP
uxPyPL
+Φ−=
+−Φ=
+−≤=
+−≤=
≤++=≤=
Função de verossimilhançaFunção de verossimilhança
0y if )(1
0y if )(1
i
10
i
10
≤+
Φ−=
>−−
=
σ
ββ
σ
ββφ
σ
i
i
ii
i
xL
e
xyL
• Se Di é uma variável binária que assume o valor 1 quandoyi>0. A contribuição de cada observação para a verossimilhança pode ser escrita da seguinte forma:
10
σ
ii D
i
D
iii
xxyL
−
+Φ−
−−=
1
1010 )(1)(1
σ
ββ
σ
ββφ
σ
FunçaFunça de verossimilhançade verossimilhança• A função de verossimilhança, L, é obtida
multiplicando todas as contribuições a verossimilhança de todas as observações:
∏=n
iLL 10 ),,( σββ
• Os valores de β0,β1 e σ que maximizam a função de verossimilhança são as estimativasTobit dos parâmetros do modelo.
• Maximiza o Log(L).
11
∏=
=i
iLL1
10 ),,( σββ
ExemploExemplo
• Banco de dados: Mroz.dta
• Iremos estimar uma equação das horas de trabalho das mulheres casadas usando o modelo Tobit model.
• Variáveis incluídas no modelo: • Variáveis incluídas no modelo: • Nwifeinc: renda do trabalho do cônjuge
• Educ: escolaridade
• Exper e expersq: experiência no mercado de trabalho
• Age: idade
• Kidslt6: filhos com menos de 6 anos
• kidsge6: filhos com mais de 6 e menos de 18 anos.
12
MQO e MQO e TobitTobit
• As estimativas dos coeficientes Tobit tem o mesmo sinal dos estimados por MQO.
• As estimativas Tobit são maiores que MQO contudo isto não é o efeito marginal direto pois dependerá do valor de x.pois dependerá do valor de x.
• Temos que considerar as estimativas dos efeitos marginais.
• Com relação à significância, os resultados são bem parecidos.
14
EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))
• Os parâmetros estimados βj medem o efeito de xj em y*.
• Contudo, na solução de canto, estamos• Contudo, na solução de canto, estamosinteressados no efeito de xj sobre y.
• Devemos estimar o efeito sobre o valor esperado de y.
15
EfeitosEfeitos parciaisparciais((efeitosefeitos marginaismarginais))
• A esperança de y dado x é dada por:zero
E(y|x)=P(y>0)E(y|y>0,x)
+P(y=0)E(0|y=0,x)
=P(y>0)E(y|y>0,x) …………..(1)
16
EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))
• Vamos computar E(y|y>0,x).
)),(|(
),0|(),0|( 1010
xxuuEx
xuxuxExyyE
ββββ
ββββ
+−>++=
>++++=>
17
),|(
),|(
)),(|(
1010
1010
1010
xxuu
Ex
xxuu
Ex
xxuuEx
σ
ββ
σσσββ
σ
ββ
σσσββ
ββββ
+−>++=
+−>++=
+−>++=
EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))
• Se v é uma variável com distribuiçãonormal padrão e c é uma constante, podemos usar a seguinte propriedade dadistribuição normal padrão:distribuição normal padrão:
18
)(1
)()|(
c
ccvvE
Φ−=>
φ
EfeitosEfeitos parciaisparciais((efeitosefeitos marginaismarginais))
• No nosso caso, c=-(β0+β1x). (a esperançatambém é condicionada em x, que tratamoscomo sendo constante).
• Logo, temos que:ββ xuu +
cv
19
)(
)(
)(1
)(
),|(),0|(
10
10
10
10
10
10
1010
σ
ββσ
ββφ
σββ
σ
ββσ
ββφ
σββ
σ
ββ
σσσββ
x
x
x
x
x
x
xxuu
ExxyyE
+Φ
+
++=
+−Φ−
+−
++=
+−>++=>
Razão inversa de MillsRazão inversa de Mills
)(
)(
10
10
10 x
x
x+
Φ
+
++=
σ
ββσ
ββφ
σββ
Este termo é
denominado de razão
inversa de Mills λ(.)
20
)(/)()(
)2.....().........(
)(
10
10
ccc
onde
xx
Φ≡
+++=
Φ
φλ
σ
ββλββ
σ
Agora temos que calcular a Agora temos que calcular a P(y>0|x)P(y>0|x)
),(
)),((
)|0()|0(
10
10
10
ββ
ββ
ββ
xxu
P
xxuP
xuxPxyP
+−>=
+−>=
>++=>
21
)3..(..........).........(
)(1
),(
10
10
10
σ
ββσ
ββσ
ββ
σ
x
x
xxu
P
+Φ=
+−Φ−=
+−>=
Distribuição
normal é
simétrica
Esperança condicionadaEsperança condicionada
• Inserindo (2) e (3) em (1), temos que:
E(y|x)=P(y>0)E(y|y>0,x)
22
)4....()()()|( 1010
10
+++
+Φ=
σ
ββλββ
σ
ββ xx
xxyE
Efeito marginalEfeito marginal
• Logo, existem duas formas de computar o efeito parcial de x sobre a esperançacondicional de y:
)()(1),0|(
.1 101010 ββλ
ββββλβ
xxxxyyE
+
+++
−=>∂
23
O efeito de x sobre as horas
de trabalho daqueles que
estão trabalhando.
O efeito total de x nas
horas trabalhadas.
)()|(
.2
)()(1),0|(
.1
101
1010101
σ
βββ
σ
ββλ
σ
ββ
σ
ββλβ
x
x
xyE
xxx
x
xyyE
+Φ=
∂
∂
++
++−=
∂
>∂
Efeito marginalEfeito marginal
• Ambos efeitos parciais dependem de x. Logo, eles diferem para as observaçõesdiferentes dos dados.
• Contudo, precisamos saber o efeito total ao• Contudo, precisamos saber o efeito total aoinvés do efeito específico para umaobservação do dado.
• Da mesma forma que nos modelos Probit e logit models, existem duas formas de computar o efeito parcial total:
24
Efeito marginal totalEfeito marginal total
• Efeito parcial na média: coloca a médiadas variáveis explicativas (PEA).
• Média do efeito parcial (APE): computa o efeito parcial para cada indivíduo no banco de dados e depois tira a médiadestes efeitos individuais.
25
ExemploExemplo
• Banco de dados Mroz.dta
1. Computar o efeito da educação nas horastrabalhadas daqueles que já estãotrabalhando:
xyyE >∂ ),0|(
2. Computar o efeito da educação nas horastrabalhadas totais:
26
educ
xyyE
∂
>∂ ),0|(
educ
yE
∂
∂ )x|(
Modelo 1: Tobit, usando as observações 1-753
Variável dependente: hours
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 965,305 446,413 2,1624 0,03059 **
kidslt6 -894,022 111,817 -7,9954 <0,00001 ***
kidsge6 -16,218 38,6407 -0,4197 0,67470
age -54,405 7,41562 -7,3365 <0,00001 ***
educ 80,6456 21,5778 3,7374 0,00019 ***
nwifeinc -8,81424 4,45887 -1,9768 0,04807 **
expersq -1,86416 0,537577 -3,4677 0,00052 ***
exper 131,564 17,2699 7,6181 <0,00001 ***
27
Qui-quadrado(7) 254,9067 p-valor 2,50e-51
Log da verossimilhança -3819,095 Critério de Akaike 7656,189
Critério de Schwarz 7697,806 Critério Hannan-Quinn 7672,222
sigma = 1122,02 (40,4325)
Observações censuradas à esquerda: 325
Observações censuradas à direita: 0
Teste da normalidade dos resíduos -
Hipótese nula: o erro tem distribuição Normal
Estatística de teste: Qui-quadrado(2) = 5,62698
com p-valor = 0,0599952
0000 right-censored observations 444422228888 uncensored observations Obs. summary: 333322225555 left-censored observations at hours<=0000 /sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777 _cons 999966665555....3333000055553333 444444446666....4444333355558888 2222....11116666 0000....000033331111 88888888....88888888555522228888 1111888844441111....777722225555 kidsge6 ----11116666....222211118888 33338888....66664444111133336666 ----0000....44442222 0000....666677775555 ----99992222....00007777666677775555 55559999....66664444000077775555 kidslt6 ----888899994444....0000222211117777 111111111111....8888777777779999 ----7777....99999999 0000....000000000000 ----1111111111113333....666655555555 ----666677774444....3333888888887777 age ----55554444....44440000555500001111 7777....444411118888444499996666 ----7777....33333333 0000....000000000000 ----66668888....99996666888866662222 ----33339999....8888444411114444 expersq ----1111....888866664444111155558888 ....5555333377776666666611115555 ----3333....44447777 0000....000000001111 ----2222....999911119999666666667777 ----....8888000088886666444477779999 exper 111133331111....5555666644443333 11117777....22227777999933338888 7777....66661111 0000....000000000000 99997777....66664444222233331111 111166665555....4444888866663333 educ 88880000....66664444555566661111 22221111....55558888333322222222 3333....77774444 0000....000000000000 33338888....22227777444455553333 111122223333....0000111166667777 nwifeinc ----8888....888811114444222244443333 4444....444455559999000099996666 ----1111....99998888 0000....000044448888 ----11117777....55556666888811111111 ----....0000666600003333777722224444 hours Coef. Std. Err. t P>|t| [95% Conf. Interval]
Log likelihood = ----3333888811119999....0000999944446666 Pseudo R2 = 0000....0000333344443333 Prob > chi2 = 0000....0000000000000000 LR chi2(7777) = 222277771111....55559999Tobit regression Number of obs = 777755553333
. tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6, ll(0)
28 partial 777755553333 33334444....22227777555511117777 0000 33334444....22227777555511117777 33334444....22227777555511117777 Variable Obs Mean Std. Dev. Min Max
. su partial
. gen partial=_b[educ]*(1-lambda*(avxbsig+lambda))
. gen lambda=normalden(avxbsig)/normal(avxbsig)
. gen avxbsig=avxbeta/_b[/sigma]
. egen avxbeta=mean(xbeta)
. predict xbeta, xb
. *****************************
. *manually *
. *on hours for working women *
. *at average of educ *
. *Compute the Partial effect *
. *****************************
0000 right-censored observations
Efeito parcial usando
a média das
variáveis:
manualmente.
/sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777 _cons 999966665555....3333000055553333 444444446666....4444333355558888 2222....11116666 0000....000033331111 88888888....88888888555522228888 1111888844441111....777722225555 kidsge6 ----11116666....222211118888 33338888....66664444111133336666 ----0000....44442222 0000....666677775555 ----99992222....00007777666677775555 55559999....66664444000077775555 kidslt6 ----888899994444....0000222211117777 111111111111....8888777777779999 ----7777....99999999 0000....000000000000 ----1111111111113333....666655555555 ----666677774444....3333888888887777 age ----55554444....44440000555500001111 7777....444411118888444499996666 ----7777....33333333 0000....000000000000 ----66668888....99996666888866662222 ----33339999....8888444411114444 expersq ----1111....888866664444111155558888 ....5555333377776666666611115555 ----3333....44447777 0000....000000001111 ----2222....999911119999666666667777 ----....8888000088886666444477779999 exper 111133331111....5555666644443333 11117777....22227777999933338888 7777....66661111 0000....000000000000 99997777....66664444222233331111 111166665555....4444888866663333 educ 88880000....66664444555566661111 22221111....55558888333322222222 3333....77774444 0000....000000000000 33338888....22227777444455553333 111122223333....0000111166667777 nwifeinc ----8888....888811114444222244443333 4444....444455559999000099996666 ----1111....99998888 0000....000044448888 ----11117777....55556666888811111111 ----....0000666600003333777722224444 hours Coef. Std. Err. t P>|t| [95% Conf. Interval]
Log likelihood = ----3333888811119999....0000999944446666 Pseudo R2 = 0000....0000333344443333 Prob > chi2 = 0000....0000000000000000 LR chi2(7777) = 222277771111....55559999Tobit regression Number of obs = 777755553333
. tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6, ll(0)
29
0000 right-censored observations 444422228888 uncensored observations Obs. summary: 333322225555 left-censored observations at hours<=0000 /sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777
educ 33334444....22227777555511117777 9999....11111111777700008888 3333....77776666 0000....000000000000 11116666....444400006666 55552222....1111444444443333 11112222....2222888866669999 variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X = 1111000011112222....0000333322227777 y = E(hours|hours>0) (predict, e(0,.))Marginal effects after tobit
. mfx, predict(e(0,.)) varlist(educ)
. ***********************************
. * for working women automatically *
. * at average of educ on hours *
. * Compute the partial effect *
. ***********************************
Efeito parcial na
média (mulheres
trabalhando)
partial_all 777755553333 44448888....77773333444400009999 0000 44448888....77773333444400009999 44448888....77773333444400009999 Variable Obs Mean Std. Dev. Min Max
. su partial_all
. gen partial_all=_b[educ]*normal(avxbsig)
.
. *****************************************
. *manually *
. *of education for the entire observation*
. *Compute the Partial effect at average *
. *****************************************
. Efeito parcial na média
de todas as
observações
30
partial_all 777755553333 44448888....77773333444400009999 0000 44448888....77773333444400009999 44448888....77773333444400009999
educ 44448888....77773333444400009999 11112222....999966663333 3333....77776666 0000....000000000000 22223333....3333222266663333 77774444....1111444411119999 11112222....2222888866669999 variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X = 666611111111....55557777000077778888 y = E(hours*|hours>0) (predict, ystar(0,.))Marginal effects after tobit
. mfx, predict(ystar(0,.)) varlist(educ)
.
. *****************************************
. *automatically *
. *of education for the entire observation*
. *Compute the Partial effect at average *
. *****************************************
Efeito parcial na média
de todas as
observações