Econometria)Modelos Escolha Qualitativa

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.

Modelos de Escolha Qualitativa

Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.

Rio de Janeiro. Elsevier- Campus, 2006

Modelos de escolha qualitativa

Varivel dependente: binria

Varivel independente: mtricas ou binrias

Exemplos:

Probabilidade de falncia

Probabilidade de sinistro

Probabilidade de aderir a segmento diferenciado de governana corporativa

Probabilidade de abrir capital

Modelos de escolha qualitativa

Quando Y quantitativo, atravs dos modelos de regresso linear estimamos o valor esperado ou

valor mdio, dados os valores das variveis

independentes

Quando Y qualitativo, o objetivo encontrar a probabilidade de que algo acontea

Modelos de Probabilidade

),...,,( 21 kiiii XXXYE

O que vamos estudar:

Como estimar modelos de escolha qualitativa? Podemos usar MQO?

H problemas especiais de inferncia?

Como medir a qualidade do ajustamento? Podemos usar o R2?

Como interpretar os coeficientes do modelo?

O que no vamos estudar...

... mas so extenses do assunto:

Dados contveis ou eventos raros como varivel dependente = processos de probabilidade de Poisson. ex.: no. de artigos

publicados por um docente, no. de patentes registradas por uma

empresa, etc...

Modelos logit e probit ordinais. Ex.: quando a varivel dependente nvel de escolaridade, ou variveis em termos de escala do tipo

Likert (concordo totalmente a discordo totalmente)

Modelos logit e probit multinomiais: quando a varivel de resposta tem mais de duas categorias mas no so ordenadas ou

hierarquizadas.

Modelos de durao: ex.: o que determina a durao de uma lmpada; a sobrevivncia de micro-empresas. Esses casos so

tratados em Anlise de Sobrevivncia.

Modelos de Escolha Qualitativa

H trs abordagens para formular um modelo probabilstico para uma varivel de escolha

binria:

O modelo de probabilidade linear

O modelo logit

O modelo probit

Modelo de Probabilidade Linear

iii uXY 21

1 = tem casa prpria

0 = c. c.

Renda familiar

um modelo linear de probabilidade porque:

iiii XYXYE |1Pr

Modelo de Probabilidade Linear

Supondo E(ui)=0, para obter estimadores no tendenciosos. A varincia de Yi tem a seguinte distribuio

de probabilidade:

Yi Prob.

0 1 Pi

1 Pi

Total 1

Se Pi = probabilidade de que Yi = 1

Dist. de Probabilidade Binomial

(np ; np(1-p))

1)|(0 ii XYE

Podemos usar MQO?

Modelo de probabilidade linear

Problemas na utilizao de MQO

1. Ausncia de normalidade dos termos de erro ui. Porque

assim como Yi, ui tambm assumem dois valores:

Yi ui Prob.

Qdo. Yi = 1 1 1 2Xi Pi

Qdo. Yi = 0 1 2Xi 1 - Pi

iii XYu 21

Tambm segue distribuio binomial

=> ui no se distribuem normalmente



Entretanto, lembre que a medida que o tamanho da amostra aumenta a distribuio binomial

converge para a Normal.

Portanto, no caso de grandes amostras, a inferncia estatstica dos modelos de

probabilidade linear segue os procedimentos

habituais de MQO sob premissa de normalidade.



2. Varincias heterocedsticas dos termos de erro.

Como ui segue distribuio binomial com mdia Pi e varincia igual a Pi(1-Pi), vemos que a varincia depende da mdia

A varincia de ui depende, em ltima instncia, dos valores de X e, portanto, no homocedstica.

Estimadores de MQO no tendenciosos, porm no so eficientes.

Soluo: mnimos quadrados ponderados (MQP)

iiii

iii

XXYEP

PPu

21)|(

)1()var(

iiii

i

i

i

i

ii

i

PXXw

w

u

w

X

ww

Y

1P )|E(Y1)|E(Y onde iii

21



3. Impossibilildade de satisfazer 0 E(Yi | Xi) 1

Problema real da estimativa por MQO!!!

No h como garantir que se situe entre 0 e 1.

Duas formas de agir:

Calcular os e os que forem < 0 considerar = 0 e os que forem > 1 considerar = 1

Usar tcnica que garanta que as probabilidades condicionais de Yi se situem entre 0 e 1 (logit e

probit)

iY

iY



4. O valor de R2 como medida da qualidade do

ajustamento questionvel

X

Yest.

1

R2 estar muito abaixo de 1

(em geral entre 0,2 e 0,6)

Do ponto de vista lgico o Modelo de Probabilidade Linear pressupe que

Pi = E(Y = 1| X) aumenta linearmente com X, isto , o efeito marginal ou

incremental de X permanece constante.



No exemplo da amostra de 40 famlias e os dados de renda e casa prpria (Gujarati, Cap. 15) temos:

Quando X aumenta uma unidade (US$ 1.000) a prob. de ter casa prpria aumenta sempre na mesma quantia de

0,10.

Independe da renda ser US$8.000, US$10.000 ou US$22.000

O que seria esperado?

Que a nveis muito baixos ou muito altos a probabilidade de ter casa prpria no fosse to afetada.

ii XY 1021,09457,0



Precisamos de um modelo de probabilidade que tenha duas caractersticas:

1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta

mas nunca sai da faixa 0 1

2. A relao entre Pi e Xi no linear, se aproxima de

zero a taxas cada vez menores medida que Xi se

reduz, e se aproxima de 1 a taxas cada vez menores

medida que Xi aumenta muito.



Precisamos de uma curva sigmide, ou em S, semelhante a FDA de uma v.a.:

Em geral so escolhidos os modelos (1) logstico e (2) normal, o primeiro dando origem ao modelo

logit e o sengundo ao probit (ou normit).

X0

1 FDA

Modelo Logit

O modelo de probabilidade linear no caso da casa prpria era:

A Funo de Distribuio Logstica

iiii XXYEP 21)|1(

)( 211

1)|1(

iXiii eXYEP

Modelo Logit

Resumindo e chamando Zi = 1 + 2Xi teremos:

Problema: Pi no linear em X e em => no podemos usar MQO

Soluo: linearizar

10

11

1

1 quando

01

1 quando

11

1

i

ii

ii

Z

Z

Zi

P

e

PZ

ePZ

e

e

eP

Modelo Logit

i

i

i

i

Z

Z

Z

Z

i

i e

e

e

e

P

P

1

11

1iZi

Z

Z

i

eP

e

eP

1

11

111

A razo de chances a favor da

posse da casa prpria.

Pi = 0,8 => h 4 chances contra 1

a favor de a famlia possuir casa

prpria.

i

i

ii

i

i

ii

XP

PL

ZP

PL

211

ln

1ln

Tirando o logaritmo:

Denominado Logit

Modelo Logit - Caractersticas

1. Quando passa de 0 a 1 (isto , quando Z varia de - a +), o logit L varia de - a +. As probabilidades so limitadas entre 0 e 1, os logits no.

2. Embora L seja linear em X as probabilidades no o so.

3. Podemos incluir quantos regressores forem necessrios.

4. O coeficiente angular mede a variao de L em resposta

a uma unidade de variao em X, isto , nos diz o

quanto o logaritmo das chances favorveis ao evento de

interesse variam em resposta a uma unidade de variao

na varivel independente.

5. O intercepto d as chances favorveis quando a varivel

independente igual a zero. Como na regresso linear

pode no ter sentido prtico.

Modelo Logit - Caractersticas

6. Se quisermos no as chances favorveis ao

evento de interesse mas a prpria probabilidade

do evento isso pode ser feito pela expresso:

7. A relao linear no entre Pi e Xi, e sim entre o

logaritmo da razo de chances e Xi.

Z

Z

Zi e

e

eP

11

1

Modelo Logit - Estimao

1. Dados em nvel individual

A estimativa por MQO invivel

Imagine Pi = 1 se a famlia tem casa prpria

Pi = 0 c.c.

Ao calcular os logits para estimar o modelo

Ao invs de MQO usar Mxima Verossimilhana para estimar os parmetros

ii

i

ii uX

P

PL

21

1ln

c.c. 1

0ln

prpria casa temfamlia a se 0

1ln

i

i

L

L

Expresses no

fazem sentido

Modelo Logit Dados Agrupados - Estimao

1. Dados agrupados ou replicados

Com os Pi possvel obter os logits estimados

Podemos usar MQO?

No!!

X

US$ mil

Ni ni

6 40 8

8 50 12

10 60 18

... ... ...

relativa frequncia a

i

ii

N

nP


possvel demonstrar que, se Ni for suficientemente grande e cada observao em

uma dada classe de renda Xi se distribui

independentemente como uma varivel binomial,

ento:

Usar MQP

Estimativa da varincia:

)1(

1,0~

iii

iPPN

Nu

)1(

1 2

iii PPN


Etapas para estimao da regresso logit:

1. Para cada nvel de renda:

2. Para cada nvel de renda obter o logit:

i

i

N

nP

i

ii

P

PL

1

ln



3. Transformamos:

ado transformerro de termo

ado transform

ado transform

)1(

:onde

em

1ln

*

*

*

21

*

21

21

i

ii

ii

iiii

iiii

iiiiiii

ii

i

ii

v

XX

LL

PPNw

vXwL

uwXwwLw

uXP

PL



4. Estimamos por MQO sem intercepto.

5. Avaliar coeficiente pelos mtodos tradicionais de

intervalo de confiana ou teste de hipteses.

Lembrando que as concluses sero vlidas se as

amostras forem grandes.

Exemplo da casa prpria com dados agrupados na pag.

485 do Gujarati.

Modelo Logit Dados Agrupados - Interpretao

Interpretao do logit: para uma unidade (US$1000) de aumento na renda o logaritmo ponderado das chances favorveis posse da casa

prpria aumenta em 0,08 unidade.

Interpretao das chances: tomando o antilogaritmo do logit estimado, obtemos Pi / (1 Pi), isto , a razo de chances.

9642,0

)56675,14()43619,14(

)00539,0()11046,0(

07862,059474,1

2

**

R

t

ep

XwL iii

*

*

07862,059474,1

07862,059474,1

1

ii

ii

Xw

Xw

i

i

ee

eP

P


e0,07862 = 1,0817

Para cada unidade de aumento da renda ponderada, as chances ponderadas favorveis a posse da casa prpria aumentam em cerca

de 8,17%.

*

*

07862,059474,1

07862,059474,1

1

ii

ii

Xw

Xw

i

i

ee

eP

P

Se tomarmos o anti-logaritmo do j-simo coeficiente angular, subtramos 1 dele

e multiplicamos o resultado por 100, obtemos a variao percentual das chances

em favor de um aumento de uma unidade no j-simo regressor.


Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria

se a renda X = 20 (US$20.000).

02226,0

09311,0

6506,8307862,01825,459474,1

6506,83

1825,4

07862,059474,1

*

*

*

*

**

i

ii

i

i

i

i

iii

w

LL

L

L

X

w

XwL


Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria

se a renda X = 20 (US$20.000).

4944,01

0225,11

Portanto,

1

ln02226,0

02226,0

02226,0

02226,0

02226,0

*

e

eP

eP

P

P

P

w

LL

i

i

i

i

i

i

ii

Dada a renda de US$20.000, a

probabilidade de que a famlia tenha

uma casa prpria de cerca de 49%.


Clculo da variao da probabilidade: envolve no apenas 2, mas tambm o nvel de probabilidade em relao ao qual a variao medida.

Para o nvel de renda de US$20.000 teremos dP/dX = 0,01965

)1(2 iii

PPdX

dP

Modelo Logit Dados No Agrupados

Como Yi = 1 ou 0, nestes casos, teremos que recorrer a procedimentos de estimao no lineares usando o mtodo da mxima verossimilhana.

um mtodo para grandes amostras, e os erros-padro estimados so assintticos

Ao invs da estatstica t usamos a estatstica z.

O R2 no adequado como medida de ajustamento. O Eviews apresenta o R2 de McFadden que tambm

varia entre 0 e 1.

Outra medida de ajustamento o Count R2.


Fvero et. al. apresentam outras medidas de ajustamento:

Pseudo R2

Cox & Snell R2

Nagelkerke R2

Teste qui-quadrado: para avaliar se h diferenas significativas entre o esperado e o observado

Hosmer Lemeshow Goodness of fit Test: outra medida do poder preditivo do modelo


Para testar a significncia do modelo como um todo o equivalente ao teste F da regresso

mltipla a estatstica da razo de

verossimilhana. Esta estatstica segue a

distribuio qui-quadrado com g.l. igual ao no. de

variveis explanatrias (o intercepto no conta).

Modelo Logit Dados No Agrupados -Interpretao

Gujarati usa um exemplo sobre previso de notas de alunos, com Y =1 se a nota A e Y = 0 c.c.

GPA = pontuao mdia; TUCE = pontuao no incio do curso; PSI = 1 se utilizado novo mtodo de ensino.

O modelo e os resultados foram:

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321

dfcLRstatistiMcFaddenR

valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii


Os regressores em conjunto tem impacto positivo sobre a nota final pois LR = 15,40 cujo valor p de cerca de 0,0015, muito pequeno.

As trs variveis tm efeito positivo sobre o logit embora TUCE seja no significativo.

O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na nota mdia o logit estimado aumenta, em mdia cerca de 2,83 un.

A interpretao em relao s chances faz-se tomando o antilogaritmo dos coeficientes. Ex.: o antilog. de PSI 10,7897 (e2,3786). Estudantes submetidos ao novo mtodo de ensino tm cerca de dez vezes mais chances de tirar uma nota A.

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321


valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii


Para obter a probabilidade de um estudante ter nota A, observa-se os dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o

logit estimado. Ex.: logit estimado igual a 0,8178

Para obter a probabilidade usa-se a expresso:

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321


valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii

6937,01

1

11

1

8178,0

eP

e

e

eP

i

Z

Z

Zi

A probabilidade estimada do estudante tirar

nota A aproximadamente 69%.

Como o observado foi Y = 1 para este estudante

podemos assumir que a previso est prxima.

Modelo Probit

Utiliza ao invs da funo logstica acumulada a funo de distribuio acumulada (FDA) da

normal.

Para o exemplo da casa prpria:

0 2

2

2

)(

22

1)(

XX

eXF

)()()|1( 2121 iiii XFXZPXYPP

Modelo Probit Dados Agrupados -Interpretao

Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846

Para conhecer o efeito de uma variao unitria em X sobre a probabilidade de Y = 1, isto , ter casa prpria

derivamos a equao anterior e:

Onde a funo de densidade de probabilidade normal padro em

Portanto, essa avaliao depender do valor de X

221 )( ii

i XfdX

dP

)( 21 iXf

iX21

Modelo Probit Dados Agrupados -Interpretao

Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846

Para X = 6 teremos na funo de densidade normal f[-1,0166+0,04846(6)] = f(-0,72548).

Para Z = -0,72548 a densidade normal de cerca de 0,3066, que multiplicado por 2 , dar 0,01485.

Ou seja, partindo de um nvel de renda de US$6.000, quando a renda aumenta US$1.000 a probabilidade de

uma famlia ter casa prpria aumenta em 1,4%.

Efeito marginal de uma variao unitria de um

regressor nos vrios modelos de regressoModelo de Regresso

Linear

O coeficiente angular mede a variao do valor

mdio do regressando para uma variao unitria no

valor de um regressor, mantidas constantes as

demais variveis.

Modelo de Probabilidade

Linear

O coeficiente angular mede diretamente a variao

da probabilidade de ocorrncia de um evento em

consequncia de uma variao unitria no valor de

um regressor, tudo o mais constante.

Modelo Logit O coeficiente angular nos d a variao no logaritmo

das chances dada uma variao unitria de um

regressor. Entretanto, a taxa de variao na

probabilidade de ocorrncia do evento dada por

jPi(1-Pi), onde j o coeficiente do j-simo regressor e a avaliao de Pi leva em conta todas as variveis

do modelo.

Modelo Probit A taxa de variao da probabilidade mais

complicada. Dada por jf(Zi), onde f(Zi) a funo de densidade da normal padro e Zi = 1+2X2i+...+kXki, ou seja, o modelo de regresso usado na anlise.

Entre os modelos logit e probit, qual o

prefervel?

Na maioria das aplicaes so bastante parecidos

A distribuio logstica tem caudas mais gordas => a prob. condicional Pi aproxima-se de 0 ou 1

mais lentamente

Logit mais simples para interpretar!!

Os coeficientes dos dois modelos no podem ser comparados diretamente. Embora a distribuio

logstica padro e a normal padro tenham ambas

mdia zero, suas varincias so diferentes.

Modelo Tobit

No exemplo da casa prpria, se estivssemos interessados no na probabilidade da famlia ter casa prpria, mas sim na relao entre o montante gasto para adquiri-la em relao a variveis scio-econmicas.

Dilema: se a famlia no tem casa prpria no h dados sobre o montante gasto!!

Amostra censurada: quando em parte da amostra s temos informaes sobre os regressores, mas no sobre o regressando.

Tambm denominados modelos de regresso com varivel dependente limitada

Modelo Tobit - Estimao

Podemos estimar a regresso usando apenas a parte da amostra para a qual temos dados da

varivel dependente?

No! Os estimadores seriam tendenciosos e inconsistentes.

Soluo: mtodo da mxima verossimilhana

Exemplo: pag. 498 Gujarati modelo dos casos extraconjugais de Ray Fair

c. c. 0

0 LD se 21

iii uXY

Econometria)Modelos Escolha Qualitativa

Documents

Transcript of Econometria)Modelos Escolha Qualitativa