Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

29
Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1

Transcript of Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Page 1: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

1

Regressão com uma variável dependente Binária

Capítulo 9 – Stock e Watson. Econometria.

Page 2: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

2

Modelo de Variáveis discretas

P(y = 1|x) = G(b0 + xb)

y* = b0 + xb + u, y = max(0,y*)

Page 3: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

3

Variáveis dependentes Binárias

Modelo de probabilidade linear era escrito da seguinte forma: P(y = 1|x) = b0 + xb

Page 4: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

4

Modelo de Probabilidade Linear

Variável dependente é binária ao invés de contínua.

Como a variável dependente é binária, a função de regressão é a probabilidade da variável dependente ser igual a 1, dado X.

Coeficiente: mede a variação na probabilidade de que y=1.

Page 5: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

5

Variáveis dependentes Binárias

Problema: valores preditos não estão no limite 0 e 1

Uma alternativa é modelar a probabilidade como uma função, G(b0 + xb), onde 0<G(z)<1

Page 6: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

6

Modelo Probit

Uma escolha para G(z) é a função de distribuição acumulada de uma normal padrão (cdf) G(z) = F(z) ≡ ∫f(v)dv, onde f(z) é a normal padrão, f(z) = (2p)-1/2exp(-z2/2) Este caso refere-se ao modelo probit Como é um modelo não linear, não pode ser estimado pelos métodos usuais Estimação de Máxima Verossimilhança

Page 7: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

7

Modelo Logit

Outra escolha para G(z) é uma função logística, função de distribuição padrão de uma variável aleatória logística G(z) = exp(z)/[1 + exp(z)] = L(z) Este caso é referido como modelo logit ou regressão logística. Ambas funções crescem com z, e rapidamente em torno de 0

Page 8: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

8

Probits e Logits

Probit e logit são não lineares – EMV Não há razão para preferir um ou outro modelo Tradicionalmente, as pessoas usam mais o logit, principalmente porque a função logística é mais facilmente computada Atualmente, probit também é facilmente computado com os pacotes econométricos.

Page 9: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

9

Interpretação do logit e do probit (em particular vs MPL)

Em geral estamos preocupados com o efeito de x em P(y = 1|x), ∂p/ ∂x

Para o caso linear, isto é facilmente computável pelo coeficiente de x

Para os modelos probit e logit não lineares, isto é mais complicado:

∂p/ ∂xj = g(b0 +xb)bj, onde g(z) é dG/dz

Page 10: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

10

Interpretação

Claramente, não podemos comparar os coeficientes entre os três modelos.

Podemos comparar o sinal e a significância (estatística t padrão) dos coeficientes

Para comparar a magnitude dos efeitos, teremos que calcular as derivadas, na média.

Page 11: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

11

Teste da razão de verossimilhança

Enquanto no MPL usamos a F ou LM para testar restrições de exclusão, agora usamos um novo tipo de teste.

EMV produz o log da verossimilhança L Da mesma forma que o teste F, estimamos o modelo restrito e irrestrito, e construímos a seguinte estatística:

LR = 2(Lir – Lr) ~ c2q

Page 12: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

12

Ajuste

Não podemos usar R2 para julgar o ajuste Uma possibilidade é o pseudo R2 baseado no log da verossimilhança e definido como 1 – Lur/Lr

Também podemos olhar para a % predita de forma correta

Page 13: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

13

Outros exemplos de variáveis dependentes limitadas

Page 14: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

14

Modelos de regressão censurada ou truncada

A variável dependente é censurada acima ou abaixo de determinado limite.

Exemplo: dados de compra de automóveis. Despesas positivas para compras positivas, despesas nulas para quem não comprou.

Há dados de compradores e vendedores.

Page 15: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

15

Modelos de seleção amostral

Quando não existem dados para um determinada parte da população importante de ser analisada.

Informações indisponíveis acima ou abaixo de um determinado limite.

Problema da amostra.

Page 16: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

16

Dados de contagem

A variável dependente é um número de contagem.

Exemplo: número de refeições em um restaurante.

Regressão de Poisson e binomial negativo.

Page 17: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

17

Probit ordenado

Categorias qualitativas mutuamente exclusivas possuem uma ordem natural.

Exemplo: obtenção de diploma.

Page 18: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Alguns exemplosArtigo: Corbi e Menezes-Filho (2006). Os determinantes empíricos da felicidade no Brasil. REP, vol. 26, n. 4, out-dez.

Investigar os determinantes empíricos da felicidade no Brasil através de uma base de dados ainda pouco utilizada no país, o World Values Survey (Pesquisa Mundial de Valores).

Analisar a associação de algumas variáveis sócioeconômicas, tais como renda, desemprego, educação, sexo, estado civil e idade, com a felicidade dos indivíduos. A renda e o desemprego serão examinados de forma a compreendermos de que maneira eles podem influir no nível de felicidade dos indivíduos.

Page 19: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Medida de Felicidade

O modelo de probit ordenado é um modelo multinomial, e sua variável dependente assume valores que estabelecem um certo ordenamento dos dados, não de forma linear, mas sim de forma a ranquear os possíveis resultados.

A variável latente F associa números às respostas individuais, da seguinte forma: 1 para “infeliz”, 2 para não “muito feliz”, 3 para “feliz” e 4 para “muito feliz”.

Page 20: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.
Page 21: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.
Page 22: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.
Page 23: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Multinomial: exemplo

A variável dependente assume múltiplos valores qualitativos que não são ordenados.

Exemplo: meio de transporte escolhido por uma pessoa.

Probit multinomial ou logit multinomial.

Page 24: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Banco de dados

Várias marcas de um produto estão no mercado.

Iremos explicar as escolhas dos consumidores por estas marcas considerando as seguintes variáveis explicativas: sexo (female) e idade (age).

Por exemplo, há um estudo que afirma que as mulheres escolhem mais cameras digitas Kodak e que homens preferem Canon.

Page 25: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

describe Contains data from mlogit.dta obs: 735 brand choices vars: 3 19 Jan 2006 09:43 size: 5,145 (99.4% of memory free) (_dta has notes) ------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------- brand byte %9.0g female byte %8.0g age byte %9.0g ------------------------------------------------------------------------------- Sorted by: age

Page 26: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

mlogit brand female age, base(1)Iteration 0: log likelihood = -795.89581Iteration 1: log likelihood = -709.10396Iteration 2: log likelihood = -703.08391Iteration 3: log likelihood = -702.97081Iteration 4: log likelihood = -702.9707Multinomial logistic regression Number of obs = 735 LR chi2(4) = 185.85 Prob > chi2 = 0.0000Log likelihood = -702.9707 Pseudo R2 = 0.1168------------------------------------------------------------------------------ brand | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+----------------------------------------------------------------2 | female | .5238143 .1942466 2.70 0.007 .143098 .9045307 age | .3682065 .0550031 6.69 0.000 .2604024 .4760106 _cons | -11.77466 1.77461 -6.64 0.000 -15.25283 -8.296483-------------+----------------------------------------------------------------3 | female | .4659414 .2260895 2.06 0.039 .022814 .9090688 age | .6859082 .0626265 10.95 0.000 .5631626 .8086539 _cons | -22.7214 2.058027 -11.04 0.000 -26.75505 -18.68774------------------------------------------------------------------------------(brand==1 is the base outcome)git brand female age, base(1)

Page 27: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

Alguns resultados

Para a mudança de uma unidade da variável idade, o log da razão entre as duas probabilidades, P(brand=2)/P(brand=1), irá aumentar em 0.368 e o log da razão das duas probabilidades P(brand=3)/P(brand=1) irá aumentar em 0.686.

Podemos dizer que, em geral, as pessoas mais velhas irão preferir brand 2 ou 3.

Page 28: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

A razão entre a probabilidade de escolher uma categoria e a probabilidade de escolher a categoria de referência é denominada de risco relativo (odds).

Os resultados podem ser interpretados em termos de risco relativo.

Podemos dizer que para mudança de uma unidade da idade, esperamos que o risco relativo de escolher brand 2 ao invés de brand 1 aumente de exp(.3682) = 1.45. O risco relativo é maior para pessoas mais velhas.

Para a variável female, a razão do risco relativo de escolher brand 2 ao invés de 1 para mulheres e homens é exp(.5238) = 1.69.

Page 29: Regressão com uma variável dependente Binária Capítulo 9 – Stock e Watson. Econometria. 1.

line p1 age if female ==0 || line p1 age if female==1, legend(order(1 "male" 2 "female"))0

.2.4

.6.8

1Pr(brand==1)

25 30 35 40age

male female