Econometria)Modelos Escolha Qualitativa
-
Upload
mariapsr8296 -
Category
Documents
-
view
46 -
download
1
description
Transcript of Econometria)Modelos Escolha Qualitativa
-
ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
-
Modelos de Escolha Qualitativa
Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.
Rio de Janeiro. Elsevier- Campus, 2006
-
Modelos de escolha qualitativa
Varivel dependente: binria
Varivel independente: mtricas ou binrias
Exemplos:
Probabilidade de falncia
Probabilidade de sinistro
Probabilidade de aderir a segmento diferenciado de governana corporativa
Probabilidade de abrir capital
-
Modelos de escolha qualitativa
Quando Y quantitativo, atravs dos modelos de regresso linear estimamos o valor esperado ou
valor mdio, dados os valores das variveis
independentes
Quando Y qualitativo, o objetivo encontrar a probabilidade de que algo acontea
Modelos de Probabilidade
),...,,( 21 kiiii XXXYE
-
O que vamos estudar:
Como estimar modelos de escolha qualitativa? Podemos usar MQO?
H problemas especiais de inferncia?
Como medir a qualidade do ajustamento? Podemos usar o R2?
Como interpretar os coeficientes do modelo?
-
O que no vamos estudar...
... mas so extenses do assunto:
Dados contveis ou eventos raros como varivel dependente = processos de probabilidade de Poisson. ex.: no. de artigos
publicados por um docente, no. de patentes registradas por uma
empresa, etc...
Modelos logit e probit ordinais. Ex.: quando a varivel dependente nvel de escolaridade, ou variveis em termos de escala do tipo
Likert (concordo totalmente a discordo totalmente)
Modelos logit e probit multinomiais: quando a varivel de resposta tem mais de duas categorias mas no so ordenadas ou
hierarquizadas.
Modelos de durao: ex.: o que determina a durao de uma lmpada; a sobrevivncia de micro-empresas. Esses casos so
tratados em Anlise de Sobrevivncia.
-
Modelos de Escolha Qualitativa
H trs abordagens para formular um modelo probabilstico para uma varivel de escolha
binria:
O modelo de probabilidade linear
O modelo logit
O modelo probit
-
Modelo de Probabilidade Linear
iii uXY 21
1 = tem casa prpria
0 = c. c.
Renda familiar
um modelo linear de probabilidade porque:
iiii XYXYE |1Pr
-
Modelo de Probabilidade Linear
Supondo E(ui)=0, para obter estimadores no tendenciosos. A varincia de Yi tem a seguinte distribuio
de probabilidade:
Yi Prob.
0 1 Pi
1 Pi
Total 1
Se Pi = probabilidade de que Yi = 1
Dist. de Probabilidade Binomial
(np ; np(1-p))
1)|(0 ii XYE
Podemos usar MQO?
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
1. Ausncia de normalidade dos termos de erro ui. Porque
assim como Yi, ui tambm assumem dois valores:
Yi ui Prob.
Qdo. Yi = 1 1 1 2Xi Pi
Qdo. Yi = 0 1 2Xi 1 - Pi
iii XYu 21
Tambm segue distribuio binomial
=> ui no se distribuem normalmente
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
Entretanto, lembre que a medida que o tamanho da amostra aumenta a distribuio binomial
converge para a Normal.
Portanto, no caso de grandes amostras, a inferncia estatstica dos modelos de
probabilidade linear segue os procedimentos
habituais de MQO sob premissa de normalidade.
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
2. Varincias heterocedsticas dos termos de erro.
Como ui segue distribuio binomial com mdia Pi e varincia igual a Pi(1-Pi), vemos que a varincia depende da mdia
A varincia de ui depende, em ltima instncia, dos valores de X e, portanto, no homocedstica.
Estimadores de MQO no tendenciosos, porm no so eficientes.
Soluo: mnimos quadrados ponderados (MQP)
iiii
iii
XXYEP
PPu
21)|(
)1()var(
iiii
i
i
i
i
ii
i
PXXw
w
u
w
X
ww
Y
1P )|E(Y1)|E(Y onde iii
21
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
3. Impossibilildade de satisfazer 0 E(Yi | Xi) 1
Problema real da estimativa por MQO!!!
No h como garantir que se situe entre 0 e 1.
Duas formas de agir:
Calcular os e os que forem < 0 considerar = 0 e os que forem > 1 considerar = 1
Usar tcnica que garanta que as probabilidades condicionais de Yi se situem entre 0 e 1 (logit e
probit)
iY
iY
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
4. O valor de R2 como medida da qualidade do
ajustamento questionvel
X
Yest.
1
R2 estar muito abaixo de 1
(em geral entre 0,2 e 0,6)
Do ponto de vista lgico o Modelo de Probabilidade Linear pressupe que
Pi = E(Y = 1| X) aumenta linearmente com X, isto , o efeito marginal ou
incremental de X permanece constante.
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
No exemplo da amostra de 40 famlias e os dados de renda e casa prpria (Gujarati, Cap. 15) temos:
Quando X aumenta uma unidade (US$ 1.000) a prob. de ter casa prpria aumenta sempre na mesma quantia de
0,10.
Independe da renda ser US$8.000, US$10.000 ou US$22.000
O que seria esperado?
Que a nveis muito baixos ou muito altos a probabilidade de ter casa prpria no fosse to afetada.
ii XY 1021,09457,0
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
Precisamos de um modelo de probabilidade que tenha duas caractersticas:
1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta
mas nunca sai da faixa 0 1
2. A relao entre Pi e Xi no linear, se aproxima de
zero a taxas cada vez menores medida que Xi se
reduz, e se aproxima de 1 a taxas cada vez menores
medida que Xi aumenta muito.
-
Modelo de probabilidade linear
Problemas na utilizao de MQO
Precisamos de uma curva sigmide, ou em S, semelhante a FDA de uma v.a.:
Em geral so escolhidos os modelos (1) logstico e (2) normal, o primeiro dando origem ao modelo
logit e o sengundo ao probit (ou normit).
X0
1 FDA
-
Modelo Logit
O modelo de probabilidade linear no caso da casa prpria era:
A Funo de Distribuio Logstica
iiii XXYEP 21)|1(
)( 211
1)|1(
iXiii eXYEP
-
Modelo Logit
Resumindo e chamando Zi = 1 + 2Xi teremos:
Problema: Pi no linear em X e em => no podemos usar MQO
Soluo: linearizar
10
11
1
1 quando
01
1 quando
11
1
i
ii
ii
Z
Z
Zi
P
e
PZ
ePZ
e
e
eP
-
Modelo Logit
i
i
i
i
Z
Z
Z
Z
i
i e
e
e
e
P
P
1
11
1iZi
Z
Z
i
eP
e
eP
1
11
111
A razo de chances a favor da
posse da casa prpria.
Pi = 0,8 => h 4 chances contra 1
a favor de a famlia possuir casa
prpria.
i
i
ii
i
i
ii
XP
PL
ZP
PL
211
ln
1ln
Tirando o logaritmo:
Denominado Logit
-
Modelo Logit - Caractersticas
1. Quando passa de 0 a 1 (isto , quando Z varia de - a +), o logit L varia de - a +. As probabilidades so limitadas entre 0 e 1, os logits no.
2. Embora L seja linear em X as probabilidades no o so.
3. Podemos incluir quantos regressores forem necessrios.
4. O coeficiente angular mede a variao de L em resposta
a uma unidade de variao em X, isto , nos diz o
quanto o logaritmo das chances favorveis ao evento de
interesse variam em resposta a uma unidade de variao
na varivel independente.
5. O intercepto d as chances favorveis quando a varivel
independente igual a zero. Como na regresso linear
pode no ter sentido prtico.
-
Modelo Logit - Caractersticas
6. Se quisermos no as chances favorveis ao
evento de interesse mas a prpria probabilidade
do evento isso pode ser feito pela expresso:
7. A relao linear no entre Pi e Xi, e sim entre o
logaritmo da razo de chances e Xi.
Z
Z
Zi e
e
eP
11
1
-
Modelo Logit - Estimao
1. Dados em nvel individual
A estimativa por MQO invivel
Imagine Pi = 1 se a famlia tem casa prpria
Pi = 0 c.c.
Ao calcular os logits para estimar o modelo
Ao invs de MQO usar Mxima Verossimilhana para estimar os parmetros
ii
i
ii uX
P
PL
21
1ln
c.c. 1
0ln
prpria casa temfamlia a se 0
1ln
i
i
L
L
Expresses no
fazem sentido
-
Modelo Logit Dados Agrupados - Estimao
1. Dados agrupados ou replicados
Com os Pi possvel obter os logits estimados
Podemos usar MQO?
No!!
X
US$ mil
Ni ni
6 40 8
8 50 12
10 60 18
... ... ...
relativa frequncia a
i
ii
N
nP
-
Modelo Logit Dados Agrupados - Estimao
possvel demonstrar que, se Ni for suficientemente grande e cada observao em
uma dada classe de renda Xi se distribui
independentemente como uma varivel binomial,
ento:
Usar MQP
Estimativa da varincia:
)1(
1,0~
iii
iPPN
Nu
)1(
1 2
iii PPN
-
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
1. Para cada nvel de renda:
2. Para cada nvel de renda obter o logit:
i
i
N
nP
i
ii
P
PL
1
ln
-
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
3. Transformamos:
ado transformerro de termo
ado transform
ado transform
)1(
:onde
em
1ln
*
*
*
21
*
21
21
i
ii
ii
iiii
iiii
iiiiiii
ii
i
ii
v
XX
LL
PPNw
vXwL
uwXwwLw
uXP
PL
-
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
4. Estimamos por MQO sem intercepto.
5. Avaliar coeficiente pelos mtodos tradicionais de
intervalo de confiana ou teste de hipteses.
Lembrando que as concluses sero vlidas se as
amostras forem grandes.
Exemplo da casa prpria com dados agrupados na pag.
485 do Gujarati.
-
Modelo Logit Dados Agrupados - Interpretao
Interpretao do logit: para uma unidade (US$1000) de aumento na renda o logaritmo ponderado das chances favorveis posse da casa
prpria aumenta em 0,08 unidade.
Interpretao das chances: tomando o antilogaritmo do logit estimado, obtemos Pi / (1 Pi), isto , a razo de chances.
9642,0
)56675,14()43619,14(
)00539,0()11046,0(
07862,059474,1
2
**
R
t
ep
XwL iii
*
*
07862,059474,1
07862,059474,1
1
ii
ii
Xw
Xw
i
i
ee
eP
P
-
Modelo Logit Dados Agrupados - Interpretao
e0,07862 = 1,0817
Para cada unidade de aumento da renda ponderada, as chances ponderadas favorveis a posse da casa prpria aumentam em cerca
de 8,17%.
*
*
07862,059474,1
07862,059474,1
1
ii
ii
Xw
Xw
i
i
ee
eP
P
Se tomarmos o anti-logaritmo do j-simo coeficiente angular, subtramos 1 dele
e multiplicamos o resultado por 100, obtemos a variao percentual das chances
em favor de um aumento de uma unidade no j-simo regressor.
-
Modelo Logit Dados Agrupados - Interpretao
Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria
se a renda X = 20 (US$20.000).
02226,0
09311,0
6506,8307862,01825,459474,1
6506,83
1825,4
07862,059474,1
*
*
*
*
**
i
ii
i
i
i
i
iii
w
LL
L
L
X
w
XwL
-
Modelo Logit Dados Agrupados - Interpretao
Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria
se a renda X = 20 (US$20.000).
4944,01
0225,11
Portanto,
1
ln02226,0
02226,0
02226,0
02226,0
02226,0
*
e
eP
eP
P
P
P
w
LL
i
i
i
i
i
i
ii
Dada a renda de US$20.000, a
probabilidade de que a famlia tenha
uma casa prpria de cerca de 49%.
-
Modelo Logit Dados Agrupados - Interpretao
Clculo da variao da probabilidade: envolve no apenas 2, mas tambm o nvel de probabilidade em relao ao qual a variao medida.
Para o nvel de renda de US$20.000 teremos dP/dX = 0,01965
)1(2 iii
PPdX
dP
-
Modelo Logit Dados No Agrupados
Como Yi = 1 ou 0, nestes casos, teremos que recorrer a procedimentos de estimao no lineares usando o mtodo da mxima verossimilhana.
um mtodo para grandes amostras, e os erros-padro estimados so assintticos
Ao invs da estatstica t usamos a estatstica z.
O R2 no adequado como medida de ajustamento. O Eviews apresenta o R2 de McFadden que tambm
varia entre 0 e 1.
Outra medida de ajustamento o Count R2.
-
Modelo Logit Dados No Agrupados
Fvero et. al. apresentam outras medidas de ajustamento:
Pseudo R2
Cox & Snell R2
Nagelkerke R2
Teste qui-quadrado: para avaliar se h diferenas significativas entre o esperado e o observado
Hosmer Lemeshow Goodness of fit Test: outra medida do poder preditivo do modelo
-
Modelo Logit Dados No Agrupados
Para testar a significncia do modelo como um todo o equivalente ao teste F da regresso
mltipla a estatstica da razo de
verossimilhana. Esta estatstica segue a
distribuio qui-quadrado com g.l. igual ao no. de
variveis explanatrias (o intercepto no conta).
-
Modelo Logit Dados No Agrupados -Interpretao
Gujarati usa um exemplo sobre previso de notas de alunos, com Y =1 se a nota A e Y = 0 c.c.
GPA = pontuao mdia; TUCE = pontuao no incio do curso; PSI = 1 se utilizado novo mtodo de ensino.
O modelo e os resultados foram:
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
-
Modelo Logit Dados No Agrupados -Interpretao
Os regressores em conjunto tem impacto positivo sobre a nota final pois LR = 15,40 cujo valor p de cerca de 0,0015, muito pequeno.
As trs variveis tm efeito positivo sobre o logit embora TUCE seja no significativo.
O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na nota mdia o logit estimado aumenta, em mdia cerca de 2,83 un.
A interpretao em relao s chances faz-se tomando o antilogaritmo dos coeficientes. Ex.: o antilog. de PSI 10,7897 (e2,3786). Estudantes submetidos ao novo mtodo de ensino tm cerca de dez vezes mais chances de tirar uma nota A.
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
-
Modelo Logit Dados No Agrupados -Interpretao
Para obter a probabilidade de um estudante ter nota A, observa-se os dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o
logit estimado. Ex.: logit estimado igual a 0,8178
Para obter a probabilidade usa-se a expresso:
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
6937,01
1
11
1
8178,0
eP
e
e
eP
i
Z
Z
Zi
A probabilidade estimada do estudante tirar
nota A aproximadamente 69%.
Como o observado foi Y = 1 para este estudante
podemos assumir que a previso est prxima.
-
Modelo Probit
Utiliza ao invs da funo logstica acumulada a funo de distribuio acumulada (FDA) da
normal.
Para o exemplo da casa prpria:
0 2
2
2
)(
22
1)(
XX
eXF
)()()|1( 2121 iiii XFXZPXYPP
-
Modelo Probit Dados Agrupados -Interpretao
Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846
Para conhecer o efeito de uma variao unitria em X sobre a probabilidade de Y = 1, isto , ter casa prpria
derivamos a equao anterior e:
Onde a funo de densidade de probabilidade normal padro em
Portanto, essa avaliao depender do valor de X
221 )( ii
i XfdX
dP
)( 21 iXf
iX21
-
Modelo Probit Dados Agrupados -Interpretao
Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846
Para X = 6 teremos na funo de densidade normal f[-1,0166+0,04846(6)] = f(-0,72548).
Para Z = -0,72548 a densidade normal de cerca de 0,3066, que multiplicado por 2 , dar 0,01485.
Ou seja, partindo de um nvel de renda de US$6.000, quando a renda aumenta US$1.000 a probabilidade de
uma famlia ter casa prpria aumenta em 1,4%.
-
Efeito marginal de uma variao unitria de um
regressor nos vrios modelos de regressoModelo de Regresso
Linear
O coeficiente angular mede a variao do valor
mdio do regressando para uma variao unitria no
valor de um regressor, mantidas constantes as
demais variveis.
Modelo de Probabilidade
Linear
O coeficiente angular mede diretamente a variao
da probabilidade de ocorrncia de um evento em
consequncia de uma variao unitria no valor de
um regressor, tudo o mais constante.
Modelo Logit O coeficiente angular nos d a variao no logaritmo
das chances dada uma variao unitria de um
regressor. Entretanto, a taxa de variao na
probabilidade de ocorrncia do evento dada por
jPi(1-Pi), onde j o coeficiente do j-simo regressor e a avaliao de Pi leva em conta todas as variveis
do modelo.
Modelo Probit A taxa de variao da probabilidade mais
complicada. Dada por jf(Zi), onde f(Zi) a funo de densidade da normal padro e Zi = 1+2X2i+...+kXki, ou seja, o modelo de regresso usado na anlise.
-
Entre os modelos logit e probit, qual o
prefervel?
Na maioria das aplicaes so bastante parecidos
A distribuio logstica tem caudas mais gordas => a prob. condicional Pi aproxima-se de 0 ou 1
mais lentamente
Logit mais simples para interpretar!!
Os coeficientes dos dois modelos no podem ser comparados diretamente. Embora a distribuio
logstica padro e a normal padro tenham ambas
mdia zero, suas varincias so diferentes.
-
Modelo Tobit
No exemplo da casa prpria, se estivssemos interessados no na probabilidade da famlia ter casa prpria, mas sim na relao entre o montante gasto para adquiri-la em relao a variveis scio-econmicas.
Dilema: se a famlia no tem casa prpria no h dados sobre o montante gasto!!
Amostra censurada: quando em parte da amostra s temos informaes sobre os regressores, mas no sobre o regressando.
Tambm denominados modelos de regresso com varivel dependente limitada
-
Modelo Tobit - Estimao
Podemos estimar a regresso usando apenas a parte da amostra para a qual temos dados da
varivel dependente?
No! Os estimadores seriam tendenciosos e inconsistentes.
Soluo: mtodo da mxima verossimilhana
Exemplo: pag. 498 Gujarati modelo dos casos extraconjugais de Ray Fair
c. c. 0
0 LD se 21
iii uXY