Post on 10-Aug-2015
Métodos Quantitativos II Mestrado em Economia Aplicada
Faculdade de Economia e Administração
Prof. Rogério Silva de Mattos
ECONOMETRIA CLÁSSICA
Notas de Aula
1. INTRODUÇÃO
1.1 OBJETIVOS
Modelos econométricos
Mensuração
Verificação de teorias
Previsão
1.2 VISÕES DA ECONOMETRIA
Escola Clássica
Escola Inglesa
1.3 VISÃO ESTATÍSTICA
Modelo Populacional ↔ Modelo Gerador dos Dados (MGD)
Modelo Probabilístico ↔ Modelo Gerador dos Dados (MGD)
2. MODELO DE REGRESSÃO MÚLTIPLA
2.1 MODELO LINEAR GAUSSIANO (versão básica)
MGD: ikikii XbXbbY 221
Y variável dependente;
kXX ,,2 variáveis independentes ou explicativas;
j
ij
X
YEb
)( ou coeficiente de sensibilidade de Y em relação à Xj;
kikii XbXbbYE 221)( é a média de Y e representa um hiperplano
que corta o espaço euclidiano Rk;
Hipóteses Básicas
1. Y é uma função linear de kXX ,,2 ;
2. kXX ,,2 são variáveis não-estocásticas;
3. Cada jX não é uma função linear das demais sX ,
;,,1, , ksjsj ;
4. 0)( iE ;
5. 2)( iVar e ;0)( jiE ;,1, , njiji ;
6. ),0(~ 2Ni )),((~ 2
ii YENY .
Observações
Modelo linear vem da área de planejamento de experimentos, daí a
hipótese 2 que diz que cada Xj não é variável aleatória;
Hipótese 3, implica que cada jX não é combinação linear das
demais variáveis explicativas;
Hipóteses 4, 5, e 6 dizem respeito ao termo de erro aleatório i , que
apresenta as seguintes características: média nula (hip. 4);
homocedástico, pois possui variância constante (hip. 5);
não autocorrelacionado com os demais j (hip. 5);
distribuição normal (hip. 6), logo Yi também é normal com média
)( iYE e variância 2 ;
2.2 REPRESENTAÇÃO MATRICIAL
Assumindo n observações para Y, X2,...,Xk
MGD: XbY
onde:
n
n
Y
Y
Y 1
1
knn
k
kn
XX
XX
X
2
121
1
1
k
k
b
b
b 1
1
n
n1
1
XbYE )( .
Hipóteses Básicas Re-escritas
1. Vetor Y é função linear dos vetores colunas da matriz X;
2. X é uma matriz não-estocástica;
3. X possui posto completo igual a k;
4. 0)(E , onde 0 é um vetor n×1 de elementos nulos;
5. IEVar 2)()( , onde I é uma matriz identidade n×n;
6. ),0(~ 2IMN ),(~ 2IXbMNY ;
Observações
As hipóteses correspondem às anteriores para a versão não-
matricial;
Hipótese 3 implica que cada coluna de X não é uma combinação
linear exata das k-1 colunas restantes;
Hipóteses 4-6 dizem respeito ao vetor de erros aleatórios ;
Hipótese 6 diz que vetor segue uma distribuição normal
multivariada com vetor de médias 0 e matriz de variância-
covariância I2 ;
Hipótese 6 também diz que vetor Y segue uma distribuição
normal multivariada com vetor de médias Xb e matriz de
variância-covariância I2 ;
2.3 ESTIMADOR DE MÍNIMOS QUADRADOS ORDINÁRIOS
Conceitos
Modelo Amostral: ikikii XbXbbY ˆˆˆˆ221
Preditor Linear: kikii XbXbbY ˆˆˆˆ221
Resíduo: kikii
iii
XbXbbY
YY
ˆˆˆ
ˆˆ
221
Representação Matricial
Modelo Amostral: ˆbXY
Preditor Linear: bXY ˆˆ
Resíduo: bXYYY ˆˆˆ
onde:
n
n
Y
Y
Y
ˆ
ˆ
ˆ1
1
k
k
b
b
b
ˆ
ˆ
ˆ1
1
n
n
ˆ
ˆ
ˆ
1
1
Problema: A partir de n observações amostrais, achar estimadores kbb ˆ,,ˆ1
de boa qualidade para kbb ,,1 ;
Solução: Minimizar a soma dos quadrados dos resíduos n
i
i
1
ˆ para b , ou
seja, minimizar ˆˆ para b . Assim, encontra-se o estimador de mínimos
quadrados ordinários (EMQO):
YXXXb 1)(ˆ
Prova
Como se tem de minimizar uma função de b , usa-se as regras de
determinação de valores mínimos de funções diferenciáveis de várias
variáveis. Ou seja, acha-se as derivadas parciais da função, iguala-se estas
a zero e resolve-se o sistema resultante. Os passos são os seguintes:
1. XbXbYXbYY
XbXbYXbYXbYYbXYXbYbXYbXY
2
ˆ)ˆ)(ˆ()ˆ()ˆ(ˆˆ
2. Condição de 1ª. Ordem: 0ˆ22ˆ
ˆˆbXXYX
b
3. YXXXb 1)(ˆ EMQO para b.
4. Condição de 2ª. Ordem: )(2)ˆ(
ˆˆ2
2
kkXX
b definida positiva*
* Como X tem posto k, segue que a matriz quadrada X’X de ordem k×k também
apresenta posto k e, logo, é não singular. Sendo não singular, possui inversa. Além
disso, X’X é definida positiva ( 0 ,0 zXzXz ; veja-se, por exemplo, JD, 1988:
p. 484). Logo, b é ponto de mínimo absoluto para ˆˆ .
Nota: Derivação Vetorial
Seja a um vetor k 1 de constantes, A uma matriz k k de constantes e
b um vetor k 1 de variáveis. Então:
ab
ab
b
ba )()(
Abb
Abb2
)(
Exemplo: Vendas trimestrais de automóveis nos EUA (1959.I-1988.I).
MGD: ttttt CPIbRbYPbbS 4321
onde:
S = consumo pessoal de automóveis novos em US$ bilhões;
YP = renda pessoal em US$ bilhões;
R = taxa de juros trimestral (de título do Tesouro Americano);
CPI = índice de preços ao consumidor para novos carros (1983=100)
Modelo Empírico: tttt CPIRYPS 654,0586,10391,07,35ˆ
2.4 MÉDIA E VARIÂNCIA DOS EMQO
Resultado (R1): XXXbb 1)(ˆ
Prova:
XXXbXbXXXYXXXb 111 )()()()(ˆ .
Do que segue que XXXbb 1)(ˆ .
Média
0)()()()ˆ()ˆ( 11 EXXXXXXEbbEbViés ;
bbE )ˆ( .
Variância
R2: 12 )()ˆ( XXbVar
Prova
12
121
11
11
)(
)()()(
)()()(
])()[()ˆ(
XX
XXXIXXX
XXXEXXX
XXXXXXEbVar
2.5 PROPRIEDADES DOS EMQO
Eficiência
Eficiência Restrita: dadas as hipóteses 1-5, o EMQO é o mais
eficiente (não enviesado e com variância mínima) dentro da
classe dos estimadores lineares de b; ou seja, o EMQO é o
Melhor Estimador Linear Não Enviesado (MELNE) de b.
Nota: Um estimador linear é aquele que pode ser escrito como MYb~
, onde M é
uma matriz k n.
Prova (Teorema de Gauss Markov):
A prova só usa hipóteses 1-5. Sejam XXXA 1)( e C matrizes,
ambas de ordem k n. Por R1, Abb , e por R2, AAbVar 2)ˆ( .
Seja também YCAb )(~
um estimador linear alternativo de b.
Então, pode-se escrever )()())((~
CAXbCAXbCAb . Para
b~
ser não enviesado, ele tem de satisfazer:
bbCXICXbbCXbAXbbE )()~
( .
Logo, é preciso que 0CX . Supondo 0CX , então )()~
( CAbb
de modo que ])~
)(~
[()~
( bbbbEbVar pode ser desenvolvida como:
))((
))(()(])'()[()~
(
2 CACA
CAECACACAEbVar
Mas,
CCXX
CCCXXXXXCXXX
CCCAACAACACA
1
111
)(
)()()(
))((
Pois 0''CXCX . Então:
CCbVarCCXXbVar 212 )ˆ(])[()~
(
Nota: Resultados de álgebra matricial garantem que CC é semidefinida positiva. Será
0CC somente quando C = 0. Mas, neste caso bb ˆ~; logo, não pode haver outro
estimador linear, diferente do EMQO, que seja mais eficiente (não-enviesado e com
variância mínima).
Eficiência Irrestrita: Quando vale também a hipótese 6 (erros
normalmente distribuídos), o EMQO é o mais eficiente dentre todos
os estimadores (lineares e não-lineares). A prova envolve mostrar
que no caso de normalidade dos erros o EMQO é equivalente ao
Estimador de Máxima Verossimilhança (EMV).
Consistência
EMQO é consistente para b, ou seja, bbp )ˆlim( ;
Prova: Dadas as hipóteses 1-5 e R1, segue que:
n
Xp
n
XXb
n
X
n
XXpb
XXXpb
XXXbpbp
lim'
lim
])lim[(
))(lim()ˆlim(
1
1
1
1
Dado que X é não estocástica (hip. 2), segue que:
1)()(lim
kEXXE
n
Xp 0
Logo:
bbp )ˆlim(
Normalidade Assintótica (Propriedade MUITO IMPORTANTE!)
Quando n , )1,0(/)ˆ( ˆ Nbbjbjj ;
Ou seja, em amostras grandes, podemos aproximar a distribuição
de jb como uma normal, isto é: para n grande, ),(~ˆ 2ˆjbjj bNb ;
Logo, se a amostra é grande, não precisamos da hipótese 6.
Qualquer que seja a distribuição de i , podemos aplicar a teoria da
normal para o EMQO e os procedimentos de testes de hipótese;
2.6 QUALIDADE DO AJUSTAMENTO
Como avaliar se o modelo está aderindo bem aos dados ou não?
Estatísticas descritivas: 2R , 2R , Critério de Informação de Akaike (AIC)
e Critério de Schwarz (SC)
2
R
Mede o grau de ajustamento do modelo aos dados;
YYi = ii YY ˆ + YYi
ˆ
Desvio
Total
Desvio Não-
explicado
Desvio
Explicado
Elevando ao quadrado e agregando para todas as observações:
n
i
i YY1
2)(
= n
i
ii YY1
2)ˆ(
+ n
i
i YY1
2)ˆ(
Variação
Total
Variação
Não-
explicada
Variação
Explicada
Matricialmente: yyyy ˆˆˆˆ
onde: YYyn 1
YYyn
ˆˆ1
YYn
ˆˆ1
Grau de ajustamento
yy
yyR
ˆˆ2 ou yy
Rˆˆ
12
Propriedades
]1,0[2R ;
Bom ajustamento 12R ; Fraco ajustamento 02R ;
2R tende a aumentar sempre com novas variáveis explicativas;
2R nunca diminui com novas variáveis explicativas
2
R ou 2
R - ajustado
Corrige limitação do grau de ajustamento 2R
)(
)1(ˆˆ12
kn
n
yyR
Propriedades
22 RR se k = 1;
22 RR se k > 1;
2R pode diminuir se incluo variáveis pouco explicativas;
2R pode ser negativo;
Critério de Informação de Akaike – AIC
n
k
nAIC
2ˆˆlog
Propriedades
AIC ;
Quanto menor AIC, melhor o ajustamento;
AIC penaliza bem mais que o 2R a presença de variáveis
irrelevantes;
AIC valoriza mais a parcimônia.
Critério de Schwarz – SC
n
nk
nSC
logˆˆlog
Propriedades
SC ;
Quanto menor SC, melhor o ajustamento;
SC penaliza bem mais que o 2R a presença de variáveis irrelevantes;
SC também valoriza mais a parcimônia do que o AIC, penalizando
mais ainda o número de parâmetros/variáveis no modelo.
2.7 VARIÂNCIA RESIDUAL DA REGRESSÃO
)(2
iVar também é um parâmetro desconhecido do MGD;
Caminho natural de estimá-lo seria:
nn
n
i
i ˆˆˆ
ˆ 1
2
2
Problema: 2ˆ é um estimador enviesado de 2 ;
Solução: usa-se um corretor de viés que redunda em:
knknS
n
i
i ˆˆˆ
1
2
2
S 2
é a chamada variância residual e será usada em vários contextos,
por exemplo, o R 2 - ajustado pode ser escrito como:
2
22 1
YS
SR , onde:
1
)(1
2
2
n
YY
S
n
i
i
Y
S 2
também é usada para se estimar a matriz de variância-covariância
dos EMQO:
122
ˆ )( XXSSb
Exemplo: Consumo Anual Brasil 1960-2004
MGD: ttttt NEbIbGRbYbbCO 54321
Saída (Compactada) do Eviews Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45
Variable Coefficient Std. Error
Constante 23372214 9915664. Y 0.836903 0.031319
GR -0.789323 0.067470 I -0.737619 0.119547
NE -0.764959 0.105569
R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252
Nota: Dados anuais referentes ao Brasil; CO = consumo das famílias; Y = renda disponível das famílias; GR = gastos do governo; I = investimento direto; NE = Exportações líquidas
Observações
A coluna correspondente a “Std. Error” refere-se a:
2ˆ
1
ˆ bk
bSdiags
O modelo empírico é dado por:
tttt NEIGRYCO 765,0738,0789,0837,0214.372.23
2.8 RESULTADOS IMPORTANTES
Supondo que valem todas as hipóteses, inclusive a 6, de normalidade
dos erros :
R3. 22 ~/ˆˆkn ;
R4. 222 ~/)( knSkn ;
R5. ),0(~)ˆ( 2
jjj VNbb , onde jV é o j-ésimo elemento da diagonal
principal de 1)( XX ;
R6. 22 /)( Skn e )ˆ( jj bb são independentes;
R7. De R4-R6, segue que: kn
j
jjt
VS
bb~
)ˆ(
Prova: De R5, segue que )1,0(~/)ˆ( NVbb jjj . Agora
computando:
2
2
)(
)()ˆ(
kn
Skn
V
bb
j
jj ,
temos uma VA N(0,1) dividida pela raíz quadrada de uma VA 2
kn (dividida, por sua vez, por n k), ambas independentes, o que
resulta numa VA tn-k. Fazendo as simplificações necessárias,
obtém-se o resultado R7.
2.9 ESTIMAÇÃO INTERVALAR
Objetivo: achar intervalos de confiança para bj;
Em geral, usa-se intervalos bilaterais;
Critério: 1)ˆˆ( jHjjL bbbP ;
Ljb ,ˆ = limite inferior
Hjb ,ˆ = limite superior
1 = nível de confiança
Solução:
jbknjLj stbb ˆ,2/1,ˆˆ
jbknjHj stbb ˆ,2/1,ˆˆ
Prova: Defina jbVSs
jˆ . Então, usando R7, podemos escrever:
1ˆ
,2/1
ˆ
,2/1 kn
b
jj
kn ts
bbtP
j
1ˆˆ,2/1ˆ,2/1
jj bknjjbkn stbbstP
Multiplicando todos os componentes da tripla desigualdade por -1:
1ˆˆ,2/1ˆ,2/1
jj bknjjbkn stbbstP
e somando jb aos três componentes:
1ˆˆˆ,2/1ˆ,2/1
jj bknjjbknj stbbstbP
2.10 TESTES DE SIGNIFICÂNCIA DE PARÂMETROS E VARIÁVEIS
MGD: ikikii XbXbbY 221
Exemplos de hipóteses de interesse:
H0: b1 = 0 (E(Y) atravessa a origem do espaço Rk);
H1: b1 0 (E(Y) não atravessa a origem do espaço Rk);
H0: b2 = 0 (variações em X2 não explicam variações em Y);
H1: b2 0 (variações em X2 explicam variações em Y);
H0: b3 = 1 (variações em X3 produzem variações idênticas em Y);
H1: b3 1 (variações em X3 não produzem vars. idênticas em Y);
Conceitos e definições
= nível de significância = P(Erro Tipo I) = P(Rejeitar H0|H0 é V);
= P(Erro Tipo II) = P(Não Rejeitar H0|H0 é F);
Poder do teste = 1 - ;
Representação Geral H0: bj = b0j ; H1: bj b0j
Caso típico em econometria: b0j = 0;
Por R7, segue que knbjj tSbbj
~)ˆ( ˆ,0 ou knbtSb
j
~ˆˆ (caso b0j= 0);
Procedimentos do teste t (típico)
1. Enunciado das hipóteses: H0: bj = 0 ; H1: bj 0
2. Escolha de = nível de significância;
3. Cálculo de j
j
b
j
b S
bt
ˆ
ˆ
ˆ
4. Aplicação da regra de decisão pelo valor de prova (p-value):
Se ) || ( ˆjbkn tTP Não rejeito H0;
Se ) || ( ˆjbkn tTP Rejeito H0;
Exemplo: Consumo Anual Brasil 1960-2004
MGD: ttttt NEbIbGRbYbbCO 54321
Saída (Compactada) do EViews
Dependent Variable: CO
Method: Least Squares
Date: 06/24/05 Time: 11:01
Sample: 1960 2004
Included observations: 45
Variable Coefficient Std. Error t-Statistic Prob.
C 23372214 9915664. 2.357100 0.0234
Y 0.836903 0.031319 26.72190 0.0000
GR -0.789323 0.067470 -11.69886 0.0000
I -0.737619 0.119547 -6.170097 0.0000
NE -0.764959 0.105569 -7.246070 0.0000
R-squared 0.994985 Mean dependent var 8.19E+08
Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08
S.E. of regression 24391210 Akaike info criterion 36.96178
Sum squared resid 2.38E+16 Schwarz criterion 37.16252
2.12 TESTE F (SIGNIFICÂNCIA GERAL DA REGRESSÃO)
H0: 032 kbbb (nenhuma Xj explica variações em Y);
H1: pelo menos um 0jb (pelo menos uma Xj explica variações em
Y);
j = 2...,k-1;
Suponha válidas as hipóteses 1 a 6 e considere H0 verdadeira:
R8. 2
1
2
****
22
1
2 ~ˆˆˆˆ)ˆ( k
n
i i bxxbyyYY , onde **)1(
* XXxkn
é a matriz X em forma de desvios em relação à média com a primeira
coluna (referente à constante) excluída.
Prova: Ver [VA: pp. 59-60];
R9. knkF
kn
kyy,1~
)/(ˆˆ
)1/(ˆˆ
Prova Combinando R3 com R8:
knkFS
kyy
kn
Skn
k
yy,122
2
2~
)1/(ˆˆ
)(
)(
)1(
ˆˆ
Estatística de Teste:
)/(
)1/(
)/(ˆˆ
)1/(ˆˆ
knExplicadaNãoVariação
kExplicadaVariação
kn
kyyF
Regra de decisão pelo valor de prova:
o Dado uma escolha de :
Se )( ,1 FFP knk Não rejeito H0;
Se )( ,1 FFP knk Rejeito H0;
2.13 MULTICOLINEARIDADE
Caso 1: Modelo com 1 var. dependente e 2 vars. independentes:
iiii XbXbbY 33221
É fácil verificar que o EMQO neste caso seria:
2
32
2
3
2
2
323
2
32
2)())((
))(()(ˆ
iiii
iiiiiii
xxxx
xxyxxyxb
2
32
2
3
2
2
322
2
23
3)())((
))(()(ˆ
iiii
iiiiiii
xxxx
xxyxxyxb
33221ˆˆˆ XbXbYb
Colinearidade Perfeita
Coeficiente de correlação linear entre X2 e X3:
112
3
2
2
32
23
ii
ii
xx
xxr
Se 32 XX , com 0 (violação da hipótese 2):
o Os numeradores de 2b e 3b são iguais a 0;
o 12
23r 0)())(( 2
32
2
3
2
2 iiii xxxx
Logo, com 00ˆˆ32 bb , é impossível computar os EMQO 321
ˆ,ˆ,ˆ bbb .
Alta mas não perfeita colinearidade
É possível computar EMQO, pois hip. 2 não é violada;
Sejam as variâncias estimadas dos EMQO, (obtidas como os 2
últimos elementos da diagonal principal de 122
ˆ )( XXSSb
):
)1( 2
232
22ˆ2 rx
SS
ib
)1( 2
233
22ˆ3 rx
SS
ib
Seja 12
23r , mas considere que:
12
23r 2b
S e 3b
S
Logo:
12
23r 02b
t e 03b
t
Conseqüências da Multicolinearidade
Estatísticas t podem ficar artificialmente muito baixas;
Inclusive, é possível acontecer 12R com 02b
t e 03b
t , o que é
contraditório;
Soluções Alternativas
Retira-se uma das variáveis do modelo;
Trabalha-se com variáveis em diferenças:
o Exemplo:
Modelo de interesse: tttt WbYbbC 321
Se Yt e Wt muito correlacionadas, usa-se:
)()()( 113121 tttttttt WWbYYbCC
Caso 2: Modelo com 1 var. dependente e k-1 vars. independentes:
Multicolinearidade Perfeita
ikikii XbXbbY 221
Neste caso, não pode acontecer por exemplo:
kikii XXX 332
Ou seja, uma variável explicativa não pode ser linearmente
dependente das demais.
Alta mas não perfeita Multicolinearidade
Por exemplo, pode acontecer:
kikii XXX 332
Uma variável explicativa é “quase” linearmente dependente das
demais.
2.14 ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA (EMV)
Pela hipótese 6: )),((~ 2
ii YENY ;
Função densidade:
2
2
221
2 2
)(exp
2
1)( kikii
i
XbXbbYYf
Função de verossimilhança:
2
1
2
2212
2
1
2
1
2
)(exp
2
1
)(),,,(
n
i kikii
n
n
i
ik
XbXbbY
YfbbL
Em forma matricial:
2
2
2
2
2
)()(exp
2
1),(
XbYXbYbL
n
Log-verosssimilhança:
2
22
2
)(ln
22ln
2),(
XbXbYXbYXbYYnnb
Maximizando a log-verossimilhança
Condição de 1ª. Ordem:
0)~
22(2
12
bXXYXb
YXXXb 1)(
~
0~2
~~
~2 422
n
n
~~~ 2
onde: bXY~~
Condição de 2ª. Ordem: garante que o EVM de b e 2 é máximo
global (ver JD: p. 146).
Logo, o EMV de b (b~
) é o mesmo que o EMQO ( b ); e o EMV de 2 ( 2~ ) difere do usado antes para 2 ( 2S ) apenas no denominador;
Propriedades do EMV para pequenas amostras
b~
é não enviesado para b;
2~ é enviesado para 2 ;
A variância de b~
atinge o limite mínimo de Cramer-Rao, logo b~
é
também eficiente;
Propriedades do EMV para grandes amostras
b~
e 2~ são consistentes;
b~
apresenta normalidade assintótica;
Conclusão
Sob hipótese 6 de normalidade dos erros, EMQO e EMV são
equivalentes e portanto constituem o melhor estimador de b dentre os
estimadores lineares e os não-lineares.
2.15 PREVISÃO
Objetivo: acertar um valor de Y condicional a valores particulares de
kXX ,,2 ;
Previsão Pontual
Seja ]1[ 2 kfff XXx , então:
bxXbXbbY fkfkffˆˆˆˆˆ
221
o Previsão dentro da amostra:
nibxYY
XXxx
iif
kiiif
,,1 ˆˆˆ
]1[ 2
o Previsão fora da amostra:
iobxYY
XXxx
f
kf
ˆˆˆ
]1[
00
0200
Pelo T. Gauss-Markov:
o b é o melhor estimador linear de b;
o Logo, fY é um preditor ótimo de Yf;
Erro de previsão: fff YYe ˆ ;
o Note que: )()ˆ()ˆ( ffff YEbxbExYE ;
o Logo: ;0)ˆ()()ˆ()( fffff YEYEYYEeE
o Ou seja fY é um previsor não enviesado de fY .
Variância do erro de previsão: 2)( ffeVar
])(1[
)()ˆ(
])ˆ)(ˆ([))ˆ(()(
))ˆ(()ˆ(
12
1222
2
2
ff
ffff
ffff
fffff
xXXx
xXXxxbVarx
xbbbbxEbbxVarVar
bbxVarYYVar
Estimação da Variância do erro de previsão:
))(1( 122
fff xXXxSS
Resultados de interesse
Sejam válidas hips. 1-6. Considere os seguintes resultados:
R10. );1,0(~)ˆ( NeYY fffff
R11. 222 ~)( knffSkn ;
R12. fff YY )ˆ( e 22)( ffSkn são independentes;
R13. kn
f
fft
S
YY~
ˆ
Prova
Por R10, R11 e R12, segue que a razão:
kn
f
f
f
f
f
fft
S
YY
kn
SknYY~
ˆ
)(
)(ˆ
2
2
,
Fazendo-se as simplificações necessárias, temos o resultado R13.
Previsão Intervalar
Objetivo: Achar intervalo de confiança para fY de acordo com o
critério 1)ˆˆ( fHffL YYYP ;
Solução:
fknffH
fknffL
StYY
StYY
,2/1
,2/1
ˆˆ
ˆˆ
Prova
Usando R13, verificamos que:
1)ˆ
( ,2/1,2/1 kn
f
ff
kn tS
YYtP
De onde é imediato que, após manipulações algébricas simples:
1)ˆˆ( ,2/1,2/1 fknfffknf StYYStYP
Isto é:
1)ˆˆ( fHffL YYYP
Exemplo: Previsão do Consumo Anual Brasil 2005-2010
Modelo Econométrico:
tttt NEIGRYCO 781,0606,0686,0789,0820.589.29
ANO CÔL CÔ CÔH Y G I NE
2005 1046 1087 1128 1848 157 364 94
2006 1073 1114 1155 1907 165 382 97
2007 1095 1136 1177 1958 173 401 99
2008 1114 1156 1197 2008 182 421 101
2009 1132 1174 1215 2055 191 442 102
2010 1148 1190 1233 2102 201 464 102
Nota: Valores em R$ bilhões
3. USOS E EXTENSÕES DO MODELO DE REGRESSÃO MÚLTIPLA
3.1 COEFICIENTES PADRONIZADOS
Os coeficientes do MGD linear não podem ser comparados entre si;
Suas magnitudes dependem da escala de medida das variáveis
explicativas;
Solução: modelo com as variáveis padronizadas, isto é:
i
X
kkik
X
i
Y
i eS
XXb
S
XXb
S
YY
k
*22*
2
2
Relação entre coeficientes originais e padronizados:
Y
X
jjS
Sbb
j* j = 2,...,k.
Coeficientes padronizados são a-dimensionais, isto é, não possuem
uma unidade particular de medida;
A comparação entre coeficientes padronizados é possível porque
agora todas as variáveis apresentam a mesma média e variância;
3.2 ELASTICIDADES
Muito usada em microeconomia, a elasticidade mede a variação
relativa na variável dependente dada uma variação relativa numa
variável independente (com as demais constantes);
)()(
)(
i
ji
j
i
ji
ji
ij
YE
Xb
YE
X
X
YEE
No modelo linear, a elasticidade estimada é obtida como:
i
ji
jjiY
XbE
ˆˆˆ
Elasticidades no ponto médio:
Y
XbE
j
jjˆˆ
No caso do modelo log-log (todas as variáveis são medidas em
logaritmos), a elasticidade é constante para todo i = 1,...,n.
3.3 MODELOS NÃO-LINEARES
Modelo Linear: ikikii XbXbbY 221
Modelo Não-Linear: qualquer modelo que não é linear.
),,,( 2 ikiii XXFY
Modelos não-lineares intrinsecamente lineares (MNLIL):
o São lineares nos parâmetros ou ;
o Podem ser transformados em lineares nos parâmetros;
Modelos não-lineares intrinsecamente não-lineares (MNLINL):
o não podem ser transformados em lineares nos parâmetros.
Modelos intrinsecamente lineares
Modelo polinomial: i
k
ikiii XbXbXbbY 12
321
Modelo multiplicativo: *
212
i
b
ki
b
ikXXbY
Modelo log-log: ikikii XbXbbY lnlnln 221
o Note-se que o modelo log-log deriva do modelo
multiplicativo, porque:
11 lnbb 22 bb kk bb *ln ii
Modelo exponencial: )exp( 221 kikii XbXbbY
Modelo log-lin: lnln 221 kikii XbXbbY
Modelo recíproco: ikiki
iXbXbb
Y221
1
o Que pode ser transformado em:
kiki
i
XbXbbY
221
1
Modelo lin-log: ikikii XbXbbY lnln 221
Modelo interativo: iiiiii XXbXbXbbY )( 32433221
3.4 TESTE F PARA SIGNIFICÂNCIA DE BLOCOS DE VARIÁVEIS
Considere o MGD: iiiiii XbXbXbXbbY 554433221 ;
Teste de Hipótese:
o H0: 054 bb (X4 e X5 não são significativas);
o H1: 04b e/ou 05b (X4 e/ou X5 é/são significativa(s));
Definições:
o Modelo irrestrito (IR): iiiiii XbXbXbXbbY 554433221
o Modelo restrito(R): iiii XbXbbY 33221
o SQT = Soma dos Quadrados Totais = yyYYi
2)( ;
o SQE = Soma dos Quadrados Explicados: yyYYiˆˆ)ˆ( 2 ;
o SQR = Soma dos Quadrados dos Resíduos: ˆˆˆ 2
i ;
Estatística de Teste:
IRRIR knkk
IRIR
RIRRIR FknSQR
kkSQESQEF ,~
)(
)/()(
Regra de decisão pelo valor de prova:
o Dado uma escolha de :
Se )( , FFPIRRIR knkk Não rejeito H0;
Se )( , FFPIRRIR knkk Rejeito H0;
Exemplo: Modelo consumo vs renda e tendência quadrática
MGD: 2
4321 tbtbYbbC tt
H0: ;043 bb (termo de tendência não é significativo)
H1: 03b e/ou 04b (termo de tendência é significativo)
Implementação do teste com = 5%;
Usando-se n = 15 observações anuais, estimou-se:
Modelo irrestrito: 2
)43,1()59,1()35,6()56,16(
32,01,177,01,2ˆ ttYC tt
o 10,965.65IRSQE ;
o 17,77IRSQR ;
o 4IRk ;
Modelo restrito: tt YC)49,7()31,17(
77,03,2ˆ
o 24,898.65RSQE ;
o 2Rk
765,4)415(17,77
)24/()24,6589810,65965(F
0323,0)765,4( 11,2FP Rejeitamos H0 a 5% de significância
Caso Geral do Teste F para bloco de variáveis
MGD: ikikii XbXbbY 221
Divida o conjunto {X2,...,Xk} em 2 grupos, sendo um deles formado
por q < k 1 variáveis a serem testadas;
Agrupe as variáveis a serem testadas no final do MGD, re-
escrevendo-o como segue:
ikikiqkqkiqkqkii XbXbXbXbbY ,11,221
H0: 01 kqk bb ( kqk XX ,,1 são não-significativas);
H1: pelo menos um 0sb (pelo menos uma Xs, s = k q + 1,...,k, é
significativa);
Escolha um valor para ;
Estime os modelos irrestrito e restrito;
Compute:
)(
)/()(
IRIR
RIRRIR
knSQR
kkSQESQEF ;
Aplique a regra de decisão:
o Se )( , FFPIRRIR knkk Não rejeito H0;
o Se )( , FFPIRRIR knkk Rejeito H0;
Nota: modernos softwares econométricos, como o Eviews, implementam automaticamente
esse procedimento, sendo necessário informar apenas o grupo de q variáveis a serem
testadas em bloco;
3.5 VARIÁVEIS DUMMY
Variáveis qualitativas: que refletem estado, situação, classe, etc., ou
seja, eventos qualitativos que não podem ser medidos
numericamente;
Variável dummy: variável binária (assume valor 0 ou 1) usada para
representar, num modelo quantitativo/matemático como o MGD, as
influências de eventos qualitativos;
Variáveis dummy podem ser usadas no papel de dependente ou
independente num modelo econométrico. Veremos por ora só o
caso de variáveis dummy independentes;
Regressão com uma variável dummy
MGD: iii DbbY 21
Yi é uma variável quantitativa;
Di é uma variável dummy (qualitativa) que assume só valores 0 ou 1;
Exemplo: Estudo americano em escola secundária
n = 20 professores pesquisados;
Yi = renda do i ésimo professor;
Di = sexo do i ésimo professor (1 homem; 0 mulher);
Interpretação do MGD:
1)0|( bDYE ii é o salário médio/esperado de uma professora;
21)1|( bbDYE ii é o salário médio/esperado de um professor;
Modelo empírico: ii DY)7,2()15.3(
5,12,21ˆ
2,21ˆ)0(|ˆ1bDY ii ;
7,225,12,21ˆˆ)1(|ˆ21 bbDY ii ;
Hipótese de interesse: H0: 02b (não há discriminação sexual);
Regressão com duas variáveis dummy
MGD: iRiSii DbDbbY 321
Exemplo: Estudo americano em escola secundária (continuação)
n = 20 professores pesquisados;
Yi = renda do i ésimo professor;
DSi = sexo do i ésimo professor (1 homem; 0 mulher);
DRi = raça do i ésimo professor (1 branco(a) ; 0 negro(a));
Sexo\Raça Branco (B) Negro (N)
Homem (H) DS = DR = 1 DS=1, DR = 0
Mulher(M) DS = 0, DR = 1 DS = DR =0
Interpretação do MGD:
o 1)0|( bDDYE RiSii : sal. médio/esperado da M.N.;
o 21)0,1|( bbDDYE RiSii : sal. médio/esperado do H.N.;
o 31)1,0|( bbDDYE RiSii : sal. médio/esperado de uma M.B.;
o 321)1|( bbbDDYE RiSii : sal. médio/esperado do H.B.;
Modelo empírico: RiSii DDY)01,1()14,3()74,3(
74,003,12,19ˆ
o 2,19)0(|ˆRiSii DDY ;
o 23,2003,12,19)0,1(|ˆRiSii DDY ;
o 94,1974,02,19)1,0(|ˆRiSii DDY ;
o 97,2074,003,12,19)1(|ˆRiSii DDY ;
Nota: a rigor, não se somaria o coeficiente estimado 74,0ˆ3b porque ele se não
mostrou diferente de zero a 5% de significância. Apenas para fins ilustrativos é que
o incluímos;
Hipóteses de interesse:
o H0: 02b (não há discriminação sexual);
o H0: 03b (não há discriminação racial);
o H0: 032 bb (não há discriminação de qualquer tipo);
Regressão com 1 variável dummy e 1 variável quantitativa
MGD: iiii XbDbbY 321
Exemplo: Estudo americano em escola secundária (continuação)
n = 20 professores pesquisados;
Yi = renda do i ésimo professor;
Di = sexo do i ésimo professor (1 homem; 0 mulher);
Xi = número de anos de serviço do i-ésimo professor.
Interpretação do MGD:
o iiii XbbXDYE 31),0|( : salário médio/esperado da
professora como função do número de anos de serviço.;
o iiii XbbbXDYE 321 )(),1|( : salário médio/esperado do
professor como função do número de anos de serviço;
Modelo empírico: iii XDY)15,3()77,2()19,3(
53,012,15,19ˆ
o iiii XXDY 53,05,19),0(|ˆ ;
o iiii XXDY 53,067,20),1(|ˆ ;
Hipótese de interesse:
o H0: 02b (não há diferença, entre homens e mulheres, na
relação entre salário recebido e anos de serviço );
Variáveis dummy sazonais
MGD1: ttssttt DbDbDbaY ,112211
1,...,1 outro
0
1sj
jtD jt
s = comprimento do período sazonal:
s = 2 (semestral) s = 6 (bimestral)
s = 3 (quadrimestral) s = 12 (mensal)
s = 4 (trimestral)
bj = fator sazonal do j ésimo mês, bimestre, etc. (j = 1,...,s 1);
usa se só s-1 dummies p/evitar colinearidade perfeita c/a constante;
Normalização dos fatores sazonais
MGD2: 0
1
2211
s
j j
tststtt
b
DbDbDbaY
Verifica se que este modelo pode ser re escrito como:
MGD2: ttssttt DbDbDbaY *
,11
*
12
*
11
o Onde: 1,...,1
outro
0
1
1* sjst
jt
D jt
Exemplo: Sazonalidade trimestral (s=4); MGD: XbY , ]1[ DX n .
MGD1: tj jtjt DbaY3
1 MGD2: tj jtjt DbaY
3
1
*
0 0 0
1 0 0
0 1 0
0 0 1
0 0 0
1 0 0
0 1 0
0 0 1
321
D
DDD
111
100
010
001
111
100
010
001
*
3
*
2
*
1
D
DDD
4. VIOLAÇÃO DE HIPÓTESES BÁSICAS
4.1 AUTOCORRELAÇÃO SERIAL DOS ERROS
Violação da hipótese 5 ( 0),(),(),( jijiji CovCorE , i j);
Caso Geral
MGD: 0),(
221
ji
ikikii
uuCor
uXbXbbY para algum j i
Caso de Séries de Tempo
MGD: 0),(),(
221
jttjtt
tktktt
uuEuuCor
uXbXbbY j = 1, 2, ...
0),( jtt uuCor é chamada autocorrelação serial de j-ésima ordem;
Autocorrelação Serial de 1ª. Ordem (ACS1)
MGD: 0),( 1
221
tt
tktktt
uuCor
uXbXbbY
Razões para haver ACS1
o Inércia típica das variáveis econômicas;
o Variáves explicativas excluídas do MGD considerado:
MGD: tttt XbXbbY 33221
MGD considerado: ttt uXbbY 221
o Forma funcional incorreta:
MGD: tttt XbXbbY 2
321
MGD considerado: ttt uXbbY 21
o Defasagens excluídas:
MGD: ttttt YbXbXbbY 141,23221
MGD considerado: ttt uXbbY 221
Conseqüências da ACS1:
Propriedades do EMQO:
o b continua não enviesado para b;
o b (EMQO) não é mais o MELNE para b, logo é ineficiente;
Variância residual enviesada:
o )(ˆ 22 knuS t em geral subestima 2 ;
o Elementos de )(b
Sdiag ficam, em geral, subestimados;
o 2R e 2R ficam, em geral, superestimados;
o Estatísticas jj bjb
Sbt ˆˆˆ (j = 1,...,k) ficam, em geral,
superestimadas;
o Estatística F fica superestimada;
o Critérios de informação AIC e SC ficam em geral
subestimados;
Matriz de var-covar dos parâmetros:
o Com ACS1: ),,()()ˆ( ,1
12 tt xxCXXbVar ;
o ),( 1tt uuCor ;
o Computadores tipicamente reportam resultados calculados
com base na ausência de ACS1, isto é: 122
ˆ )( XXSSb
;
Verificando a presença/ausência de ACS1
Graficamente:
Termo de Erro com ACS1 Termo de erro Sem ACS1
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49
0 0
Teste de Durbin-Watson
o Assuma que:
o MGD: 2
1
1
221
)(,0)(;0)( tttt
ttt
tktktt
VarECor
uu
uXbXbbY
o Onde ttt uu 1 é chamado processo AR(1) e
),( 1tt uuCor ;
o H0: 0 ; H1: 0 ;
o Estatística DW: )ˆ1(2
ˆ
)ˆˆ(
1
2
2
2
1
nn
t
t
n
t
tt
u
uu
DW
o Onde 2
112ˆˆˆˆ
t
n
ttt
n
t uuu ;
o Note-se que:
1ˆ 0DW
1ˆ0 20 DW
0ˆ 2DW
0ˆ1 42 DW
1ˆ 4DW
o Regra de decisão
Se Decidir
LdDW0 Rejeitar H0 (há ACS1 +)
UL dDWd Não decidir
UU dDWd 4 Não Rejeitar H0
LU dDWd 44 Não decidir
44 DWdL Rejeitar H0 (há ACS1 )
o Onde [dL,dU] = f (n,k’, );
Exemplo: Consumo Anual Brasil 1960 2004 Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45
Variable Coefficient Std. Error t-Statistic Prob.
C 23372214 9915664. 2.357100 0.0234 Y 0.836903 0.031319 26.72190 0.0000
GR -0.789323 0.067470 -11.69886 0.0000 I -0.737619 0.119547 -6.170097 0.0000
NE -0.764959 0.105569 -7.246070 0.0000
R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252 Log likelihood -826.6401 F-statistic 1983.966 Durbin-Watson stat 0.395263 Prob(F-statistic) 0.000000
o Considerando n = 45, k’ = 4 e = 0,05, dL=1,34 dU=1,72
Teste de Ljung Box (também para ACS de ordens maiores)
o H0: 021 m ; H1: pelo menos um 0j (j=1,...,m)
o Estatística de Ljung Box:
2
1
2
~ˆ
)2( m
am
j
j
LBjn
nnQ
Exemplo: Consumo Anual Brasil 1960 2004
Date: 06/06/06 Time: 10:58 Sample: 1970 2004 Included observations: 35
Autocorrelation Partial Correlation J AC
( j)
PAC Q-Stat (LB)
Prob
. |****** . |****** 1 0.725 0.725 20.017 0.000 . |**** . | . 2 0.525 -0.002 30.812 0.000 . |*** . *| . 3 0.345 -0.072 35.634 0.000 . |**. . | . 4 0.209 -0.034 37.451 0.000 . |* . . |* . 5 0.160 0.087 38.561 0.000
Estimador de Mínimos Quadrados Generalizados (EMQG)
MGD: 2
1
1
221
)(,0)(;0)( tttt
ttt
tktktt
VarECor
uu
uXbXbbY
Equação de diferenças generalizadas (EDG):
tktktt XbXbbY **
22
*
1
*
o Onde 1
*
ttt YYY , 1,
*
tjjtjt XXX e 1ttt uu ;
Então, estima se a EDG por MQO, obtendo se )ˆ,,ˆ,ˆ(ˆ2
*
1
*
kbbbb ;
o )1(ˆˆ *
11 bb ;
o Primeira observação: 2
1
*
1 1YY , 2
1
*
1 1jj XX
Representação matricial
MGD: uXbY ,
Note que 2)()( uuEuVar , porque há ACS1;
o Onde
1
1
1
1
331
32
2
12
nnn
n
n
n
nn;
Agora, seja a seguinte matriz:
21000
0100
010
001
nnH
o Pré multiplicando o MGD por essa matriz: HuHXbHY ;
o Seja Hu . Então, minimizando se uHHuiˆˆˆˆˆ 2 , tém se o
EMQG:
YXXXb 111 ) (~
o Note se que HH1 ;
o b~
é eficiente, consistente e normalmente distribuído
assintóticamente;
Estimação de ˆ (Método de Cochrane Orcutt ou CORC):
1. Estima se o MGD por MQO e obtém se )1(ˆ
tu ;
2. Estima se: ttt vuu ),1(1),1(),1(ˆˆˆˆ ;
3. Usa se ˆ para estimar EDG: tktktt XbXbbY ˆˆˆˆ **
22
*
1
* ;
4. Computa se: ktkttt XbXbbYu ˆˆˆˆ
221),2( ;
5. Repete se passos 2, 3 e 4 iterativamente até que:
0|ˆˆ| 1 (onde indica iteração);
Exemplo: Consumo Anual Brasil 1960 2004
Dependent Variable: CO
Sample (adjusted): 1971 2004
Included observations: 34 after adjustments
Convergence achieved after 22 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 1.22E+08 54126485 2.257963 0.0319
Y 0.769876 0.043924 17.52743 0.0000
GR -0.679646 0.062333 -10.90354 0.0000
I -0.828333 0.074674 -11.09262 0.0000
NE -0.932487 0.087990 -10.59761 0.0000
AR(1) 0.865912 0.070015 12.36746 0.0000
R-squared 0.997571 Mean dependent var 7.49E+08
Adjusted R-squared 0.997138 S.D. dependent var 1.75E+08
S.E. of regression 9368116. Akaike info criterion 35.10231
Sum squared resid 2.46E+15 Schwarz criterion 35.37167
Log likelihood -590.7392 F-statistic 2300.268
Durbin-Watson stat 2.156901 Prob(F-statistic) 0.000000
Estatística Q de Ljung Box
Date: 06/07/06 Time: 15:20
Sample: 1971 2004
Autocorrelation Partial Correlation J AC PAC Q-Stat Prob
. *| . . *| . 1 -0.094 -0.094 0.3309
. |* . . |* . 2 0.087 0.079 0.6192 0.431
. *| . . *| . 3 -0.110 -0.097 1.0987 0.577
. | . . | . 4 -0.016 -0.041 1.1097 0.775 . |* . . |* . 5 0.112 0.127 1.6421 0.801
4.2 HETEROCEDASTICIDADE
Violação da hipótese 5 ( 2)( iVar , i ; ou IEVar 2)()( );
Caso Geral
MGD: 2
221
)( ii
ikikii
uVar
uXbXbbY
Caso de Séries de Tempo
MGD: 2
221
)( tt
tktktt
uVar
uXbXbbY
Exemplo Gráfico: Caso de 1 variável explicativa X
Atualmente, heterocedasticidade ocorre em dados temporais e de
seção cruzada (cross section);
Consequências da Heterocedasticidade
Propriedades do EMQO:
o b continua não enviesado para b;
o b (EMQO) não é mais o MELNE para b, logo é ineficiente;
Variância residual enviesada:
o )(ˆ2
1
2 knuS i
n
i é um estimador enviesado de sigma2i;
o Elementos de )(b
Sdiag ficam enviesados;
o 2R e 2R ficam enviesados;
o Estatísticas jj bjb
Sbt ˆˆˆ (j = 1,...,k) ficam enviesadas;
o Estatística F fica enviesada;
o Critérios de informação AIC e SC ficam enviesados;
Matriz de var-covar dos parâmetros:
o Sob heterocedasticidade: ΜbVar 2)ˆ( , onde 1)( XXΜ ;
o Computadores tipicamente reportam resultados calculados
com base na ausência de heterocedasticidade, isto é: 122
ˆ )( XXSSb
;
Mínimos Quadrados Ponderados (MQP)
É um caso particular do EMQG;
MGD: 2
221
)( ii
ikikii
uVar
uXbXbbY
Supondo 2
i conhecida, transforma se o MGD segundo:
i
i
i
ki
k
i
i
ii
i uXb
Xbb
Y2
21
1
o Isto é: ikikiii XbXbWbY **
221
* ;
o No novo modelo, o termo iii u é homocedástico;
Prova: 11
)(2
2
2
i
i
i
ii
i
i uVaru
VarVar
Estima se o modelo transformado por EMQO.
Representação Matricial do EMQP
MGD: uXbY ,
Note que 2)()( uuEuVar , onde :
2
2
3
2
2
2
1
2
000
000
000
000
n
nn
;
Agora, seja a seguinte matriz:
n
nnH
100
01
0
001
2
1
;
o Pré multiplicando o MGD por essa matriz: HuHXbHY ;
o Seja Hu . Então, minimizando se uHHuiˆˆˆˆˆ 2 , tém se o
EMQP:
YXXXb 111 ) (~
o Note se que HH12 )( ;
o b~
é eficiente, consistente e normalmente distribuído
assintóticamente;
Quando 2
i é desconhecida
Assume se que é uma função das variáveis do modelo:
),,,()( 1
2
kiiiiii XXYcZcZuVar
Onde c é uma constante não nula.
Transforma se o MGD conforme:
i
i
i
ki
k
i
i
ii
i
Z
u
Z
Xb
Z
Xb
Zb
Z
Y2
21
1
É fácil verificar que:
cZ
cZuVar
ZZ
uVar
i
i
i
ii
i 1
Logo, no MGD transformado o termo de erro é homocedástico.
Exemplos de funções Zi que podem ser usadas:
o ii YZ ;
o jii XZ ;
o 2
jii XZ ;
o kikiii XcXcXcZ 2211 ;
Exemplo: Consumo Anual Brasil 1970 2004
Mínimos Quadrados Ponderados: Assumindo que Var(ut)=c.Yt
Dependent Variable: CO/SQR(Y)
Method: Least Squares
Date: 06/12/06 Time: 15:01
Sample (adjusted): 1970 2004
Included observations: 35 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
1/SQR(Y) 42489845 11564215 3.674252 0.0009
SQR(Y) 0.794932 0.032469 24.48296 0.0000
GR/SQR(Y) -0.664485 0.076533 -8.682316 0.0000
I/SQR(Y) -0.690385 0.115316 -5.986888 0.0000
NE/SQR(Y) -0.705055 0.110605 -6.374556 0.0000
R-squared 0.956610 Mean dependent var 21405.12
Adjusted R-squared 0.950824 S.D. dependent var 2459.812
S.E. of regression 545.4779 Akaike info criterion 15.57277
Sum squared resid 8926386. Schwarz criterion 15.79496
Log likelihood -267.5234 Durbin-Watson stat 0.336312
Verificando a Presença de Heterocedasticidade
Graficamente
Plotar ii X 2 , ii X 3 , ..., kii X ;
Plotar ii X 2
2 , ii X 3
2 , ..., kii X2 ;
Plotar tt ou tt
2 .
Teste de White
H0: não há heterocedasticidade;
Estatística de teste: 22 ~ q
a
nR , onde 1]2)1([ kkq ;
o O cômputo dessa estatística de teste envolve regredir os
quadrados dos resíduos de um MGD estimado por MQO
contra um conjunto V de variáveis formado por:
Todas as variáveis explicativas não redundantes;
Os quadrados dessas variáveis;
Os produtos cruzados entre si dessas variáveis;
Regra de Decisão
o Se )( 22 nRP q Não Rejeite H0;
o Se )( 22 nRP q Rejeite H0.
Ilustração do teste de White:
o MGD: iiii XbXbbY 33221 ;
o Estime por MQO e compute: iiii XbXbbY 33221ˆˆˆˆ ;
o Estime por MQO a regressão:
iiiiiiii wXXcXcXcXaXaa )(ˆ324
2
33
2
2233221
2 ;
o Compute )ˆˆˆˆ(1222 wwR para essa regressão;
o Compute a estatística de teste 2nR
o Escolha e aplique a regra de decisão.
Exemplo: Consumo Anual Brasil 1960 2004
Dependent Variable: CO
Method: Least Squares
Date: 06/24/05 Time: 11:01
Sample: 1960 2004
Included observations: 45
Variable Coefficient Std. Error t-Statistic Prob.
C 23372214 9915664. 2.357100 0.0234
Y 0.836903 0.031319 26.72190 0.0000
GR -0.789323 0.067470 -11.69886 0.0000
I -0.737619 0.119547 -6.170097 0.0000
NE -0.764959 0.105569 -7.246070 0.0000
R-squared 0.994985 Mean dependent var 8.19E+08
Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08
S.E. of regression 24391210 Akaike info criterion 36.96178
Sum squared resid 2.38E+16 Schwarz criterion 37.16252
Log likelihood -826.6401 F-statistic 1983.966
Durbin-Watson stat 0.395263 Prob(F-statistic) 0.000000
Exemplo: Consumo Anual Brasil 1960 2004
(Continuação)
Teste de Heterocedasticidade de White
White Heteroskedasticity Test:
F-statistic 16.41214 Prob. F(14,20) 0.000000
Obs*R-squared 32.19742 Prob. Chi-Square(14) 0.003755
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/12/06 Time: 14:57
Sample (adjusted): 1970 2004
Included observations: 35 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 3.22E+15 1.03E+15 3.118874 0.0054
Y -25802647 9318834. -2.768871 0.0118
Y^2 0.025064 0.009505 2.636992 0.0158
Y*GR -0.103383 0.038220 -2.704923 0.0136
Y*I -0.088866 0.047901 -1.855195 0.0784
Y*NE 0.067251 0.040232 1.671590 0.1102
GR 72030518 25197051 2.858688 0.0097
GR^2 0.134210 0.048908 2.744141 0.0125
GR*I 0.098590 0.089595 1.100397 0.2842
GR*NE -0.162626 0.113055 -1.438473 0.1658
I 68674186 35064179 1.958528 0.0643
I^2 0.043314 0.067828 0.638594 0.5303
I*NE 0.109893 0.141270 0.777892 0.4457
NE -89816669 21962399 -4.089565 0.0006
NE^2 -0.138321 0.103752 -1.333191 0.1975
R-squared 0.919926 Mean dependent var 4.78E+14
Adjusted R-squared 0.863875 S.D. dependent var 9.91E+14
S.E. of regression 3.66E+14 Akaike info criterion 70.20062
Sum squared resid 2.67E+30 Schwarz criterion 70.86719
Log likelihood -1213.511 F-statistic 16.41214
Durbin-Watson stat 2.029315 Prob(F-statistic) 0.000000
4.3 VARIÁVEIS INDEPENDENTES ESTOCÁSTICAS
Estudaremos este assunto com base na regressão simples:
MGD: iii bXaY
Violação da hipótese 2, isto é: iX é estocástica (é uma V.A.);
Situações em que X é uma V.A.:
o Erro de medida nas variáveis independentes;
o Variáveis independentes também dependem da dependente;
o Variável dependente defasada entre as independentes;
Nesses casos, é possível que 0),( ,XiiXCov e, se isso ocorre,
EMQO é enviesado e inconsistente:
Prova
o Seja a seguinte “forma em desvios”do MGD: iii ebxy ; onde
YYy ii , XXx ii e iie . Neste caso, o EMQO
para b é dado por:
222
)(ˆ
i
ii
i
iii
i
ii
x
exb
x
ebxx
x
yxb
o Computando o E(,) em ambos os lados: 2
)ˆ(i
ii
x
exEbbE
o Nada garante que bbE )ˆ( porque
][][][ 22
iiiiii xEexExexE . No entanto, aplicando o operador
plim(,) em ambos os lados:
2
,
22 lim
limlim)lim()ˆlim(
X
X
i
ii
i
iib
nxp
nexpb
x
expbpbp
o Fica claro que tudo depende de ,),( XiiXCov :
Se 0,X , então b é consistente para b (embora não
se possa determinar se é enviesado ou não);
Se 0,X , isto significa que b é inconsistente para b
(e, em decorrência, também enviesado para b);
Mínimos Quadrados de Variáveis Instrumentais (MQVI)
Seja X estocástica e 0),( ,eXiiXCov . Como estimar b já que
MQO é inconsistente neste caso?
Definição de instrumento: Seja Z uma V.A. tal que:
o 0lim ,ZX
ii
n
zxp ;
o 0lim ,Z
ii
n
ezp ;
o onde XXx ii e ZZz ii .
Então, o estimador MQVI dado por:ii
ii
zx
yzb~
é consistente para b;
Prova
o Novamente, seja o MGD em forma de desvio: iii ebxy .
Então, o EMQVI pode ser desenvolvido como:
o
ii
ii
ii
iiii
ii
iiii
ii
iii
ii
ii
zx
ezb
zx
ezzxb
zx
ezzbx
zx
ebxz
zx
yzb
)()(~
o Aplicando plim(,) a ambos os lados:
o bbnzxp
nezpbpbp
ZX
Z
ii
ii
,
,
lim
lim)lim()
~lim(
Caso Geral
MGD: ikikii XbXbbY 221
X2i,...,Xki são todas estocásticas;
Cada Xji (j = 2,...,k) é correlacionada com o termo de erro i;
Aplicar o MQVI neste caso envolve usar um instrumento para cada
variável independente; ii XZ 22 ,..., kiki XZ .
E usar o estimador geral de MQVI:
YZXZb 1)(~
Onde Z é a matrix n k de instrumentos para a matriz X;
5. INTRODUÇÃO A SISTEMAS DE EQUAÇÕES SIMULTÂNEAS
Trigve Haavelmo
(1911-1999)
Economista Norueguês
Premio Nobel de Economia de 1989
Abordagem probabilística em econometria
Sistemas de equações simultâneas
Objetivo: introduzir mais variáveis dependentes no MGD;
MGD: iiiii
iiiii
XXYbbY
XXYbbY
2222121121202
1212111212101
Terminologia:
o Y variáveis endógenas;
o X variáveis exógenas;
o b coeficientes das endógenas;
o coeficientes das exógenas
o Variáveis pré determinadas:
Exógenas;
Endógenas defasadas;
Média: iiii
iiii
XXYbbYE
XXYbbYE
222121121202
212111212101
)(
)(
Modelo Amostral: iiiii
iiiii
XXYbbY
XXYbbY
2222121121202
1212111212101
ˆˆˆˆˆ
ˆˆˆˆˆ
Preditor linear: iiii
iiii
XXYbbY
XXYbbY
222121121202
212111212101
ˆˆˆˆˆ
ˆˆˆˆˆ
Forma Estrutural x Forma Reduzida
Forma Estrutural: endógenas como função de endógenas e
pré determinadas;
MGD(FE): iiii
iiii
XYbbY
XYbbY
2121121202
1111212101
Forma Reduzida: endógenas como função de pré determinadas;
MGD(FR): iii
iii
wXY
wXY
2121202
1111101
Relação entre parâmetros da FE e da FR;
2112
21212
2112
1212
1
2112
21112121
2112
10212020
2112
11211211
2112
201210
10
1
1
11
11
bb
bw
bb
bw
bb
b
bb
bbb
bb
b
bb
bbb
iii
ii
i
Problema da Identificação
Definição: Em um SES uma equação está identificada quando é
possível obter se estimativas numéricas dos parâmetros estruturais a
partir de estimativas dos parâmetros da forma reduzida;
Status de identificação:
o Equação não identificada: não é possível;
o Equação identificada exatamente: obtém se uma única
estimativa dos parâmetros estruturais;
o Equação sobre identificada: obtém se mais de uma
estimativa dos parâmetros estruturais;
Sistema Identificado: quando todas as equações do SES estão
identificadas (exatamente ou sobreidentificadas);
Condição de Ordem (necessária) para identificação
Regra: Em um SES com M equações simultâneas, uma equação
estará identificada se o número de varáveis pré determinadas
excluídas da equação (K k) for maior ou igual ao número de
endógenas incluídas na equação (m) menos um ( 1mkK );
Exemplo: MGD:
(3)
(2)
(1)
3131303
2222121121202
1212212101
iii
iiiii
iiii
YbbY
XXYbbY
XYbbY
Equação M = 3 K = 2 Status
(1) m = 2 k = 1 K k = 1 = m 1 = 1: identificada exatamente
(2) m = 2 k = 2 K k = 0 < m 1 = 1: não identificada
(3) m = 2 k = 0 K k = 2 > m 1 = 1: sobre identificada
Condição de Posto (suficiente) para identificação
Regra: Em um SES com M equações em M variáveis endógenas,
uma equação é identificada se e somente se no mínimo um
determinante não nulo de ordem (M 1) (M 1) puder ser construído
a partir dos coeficientes das variáveis (endógenas e
pré determinadas) excluídas daquela equação particular mas
incluídas em outras equações do modelo;
Ilustração
iiiii
iiiii
iiiii
iiiii
XYbYbbY
XXYbbY
XXYbbY
XYbYbbY
4343242141404
3232131131303
2222121323202
1111313212101
Pela condição de ordem verifica se que:
Equação M = 4 K = 3 Status
(1) m = 3 k = 1 K k = 2 = m 1 = 2: identificada exatamente
(2) m = 2 k = 2 K k = 1 = m 1 = 1: identificada exatamente
(3) m = 2 k = 2 K k = 1 = m 1 = 1: identificada exatamente
(4) m = 3 k = 1 K k = 2 = m 1 = 2: identificada exatamente
Tabela de Coeficientes do Sistema
Eq. 1 Y1 Y2 Y3 Y4 X1 X2 X3
(1) b10 1 b12 b13 0 11 0 0
(2) b20 0 1 b23 0 21 22 0
(3) b30 b31 0 1 0 31 32 0
(4) b40 b41 b42 0 1 0 0 43
Pela condição de Posto:
o Equação (1):
43
32
22
01
00
00
A
Det(A) = 0, logo eq. (1) não está identificada;
o Equação (2):
4341
31
1
00
001
b
bA
Det(A) = 0, logo eq. (2) não está identificada;
o Equação (3):
4342
12
1
001
00
b
b
A
Det(A) = 0, logo eq. (3) não está identificada;
o Equação (4):
3231
222123
1113
1
0
b
b
A
o Det(A) 0, logo eq. (4) está identificada;
Procedimentos para aplicar a condição de posto
Passo 1: re escrever o SES com todas as variáveis e parâmetros do
lado esquerdo e só os erros aleatórios do lado direito;
Passo 2: montar a tabela de coeficientes do sistema;
Passo 3: construir para cada equação a matriz A respectiva (a partir
dos coeficientes nulos da linha correspondente à equação em
análise);
Regra Geral de Identificação
K k > m 1
Posto de A = M 1
Eq. Sobre identificada
K k m 1
Posto de A < M 1
Eq. Sub identificada
K k = m 1
Posto de A = M 1
Eq. Exatam. identificiada
K k < m 1
Eq. Não identificada
(Posto de A < M 1)
Problema da simultaneidade
MGD: iiiii
iiiii
XXYbbY
XXYbbY
2222121121202
1212111212101
Simultaneidade: quando há causalidade bidirecional entre
endógenas;
Problema: correlação da endógena do lado direito com o termo de
erro;
No MGD acima: 0),( 12 iiYCor e 0),( 21 iiYCor , logo:
o EMQO é inconsistente para estimar parâmetros das duas
equações;
Quando não há simultaneidade, é possível usar EMQO, desde que as
hipóteses básicas do SES sejam satisfeitas;
Estimação de SES
MGD:
MikiMkiMiMMMiMMMii
ikikigigii
ikikigigii
XXYbYbbY
XXYbYbbY
XXYbYbbY
11,11,110
221212121202
111111212101
Hipóteses Básicas:
o Relação linear entre as variáveis;
o Xjis são não estocásticas, j = 1,...,k;
o 0)( riE , 2)( rriVar , 0),( rjriCov para r = 1,...,M e i j;
o 0),( siriCov para r s; r = 1,...,M; s = 1,...,M;
o ),0(~ 2
rri N )),((~ 2
rriri YENY , r = 1,...,M.
Antes da estimação, verificar:
o Identificação;
o Simultaneidade;
Métodos de Informação Limitada: considera restrições
relacionadas apenas à equação de interesse;
o EMQO;
o Estimador de Mínimos Quadrados Indiretos (EMQI);
o Estimador de Mínimos Quadrados de 2 Estágios (EMQ2E);
Métodos de Informação Completa: considera restrições entre
equações;
o Estimador de Mínimos Quadrados de 3 Estágios (EMQ3E);
o Estimador de Máxima Verossimilhança com Informação
Completa (EMVIC);
Tipologia de SES:
o Equações não relacionadas
0),( 21
2222202
1111101
ii
iii
iii
Cov
XbY
XbY
o Equações aparentemente não relacionadas (SURE)
0),( 21
2222202
1111101
ii
iii
iii
Cov
XbY
XbY
Nota: neste caso, estima se por algum método sistêmico, o mais
usual sendo o MQ3E;
o Sistemas Recursivos
0),( 21
2222121121202
1212111101
ii
iiiii
iiii
Cov
XXYbbY
XXbY
Nota: observe que iii YEY 111 )( ; substituindo na 2ª. equação
implica que ;0),( 21 iiYCov
o Sistemas Bloco Recursivos
0),(),(),( 323121
3232131232131303
2222121121202
1212111212101
iiiiii
iiiiii
iiiii
iiiii
CovCovCov
XXYbYbbY
XXYbbY
XXYbbY
o Sistemas Simultâneos:
iiiii
iiiii
XXYbbY
XXYbbY
2222121121202
1212111212101
Nota: estima se por MQI ou MQ2E;
Mínimos Quadrados de 2 Estágios
Caso particular do EMQVI;
Serve para estimar equações exatamente ou sobre identificadas;
Seja o seguinte:
MGD: ttt
ttttt
YbbY
XXYbbY
2121202
1212111212101
É fácil verificar (pelas condições de ordem e de posto) que:
o 1ª. equação não está identificada;
o 2ª. equação está sobre identificada;
o Logo, só é possível estimar a 2ª. equação;
É fácil verificar também que devido à causalidade bidirecional
(simultaneidade) entre tY1 e tY2 , ocorre:
0),( 21 ttYCov ;
Estimação da 2ª. equação por MQ2E:
o 1º. Estágio: construção de instrumento para tY1 via forma
reduzida;
Forma Reduzida (FR): tttt
tttt
wXXY
wXXY
2221121202
1212111101
Estima se por MQO a 1ª. equação da FR:
ttt XXY 212111101ˆˆˆˆ
o 2º. Estágio: usa se tY1ˆ no lugar de tY1 para estimar a 2ª.
equação da FE por MQVI;
*
112120
212112120
21121202
ˆ
ˆˆ
)ˆˆ(
tt
ttt
tttt
Ybb
wbYbb
wYbbY
o Estima se usando as fórmulas de MQVI:
tt
tt
yy
yyb
11
12
21ˆ
ˆˆ 121220
ˆˆ YbYb
Nota: é possível mostrar que a formula acima para 21b é
equivalente ao estimador de MQO (ver PR pg. 402)
Observe se que tY1ˆ é de fato um instrumento para tY1 :
o 0ˆ
lim11ˆ
11
YY
tt
n
yyp ;
o 0)),((ˆ
lim *
11
*
11
tt
ttYECov
n
yp
Logo, EM2QE é um estimador consistente para os parâmetros
estruturais de equações exatamente ou sobre identificadas.
Exemplo: Consumo Anual Brasil 1970 2004
Estimação por EMQ2E
(Opção TSLS do Eviews em Quick\Estimate Equation)
Dependent Variable: CO
Method: Two-Stage Least Squares
Date: 06/20/06 Time: 11:05
Sample (adjusted): 1970 2004
Included observations: 35 after adjustments
Instrument list: GR NE
Variable Coefficient Std. Error t-Statistic Prob.
C 1.83E+08 28288823 6.469929 0.0000
Y 0.470996 0.023360 20.16266 0.0000
R-squared 0.954299 Mean dependent var 7.36E+08
Adjusted R-squared 0.952914 S.D. dependent var 1.87E+08
S.E. of regression 40600140 Sum squared resid 5.44E+16
Durbin-Watson stat 0.449011 Second-stage SSR 5.20E+17
Estimação da Forma Reduzida no 1º. Estágio
Dependent Variable: Y
Method: Least Squares
Date: 06/20/06 Time: 11:08
Sample (adjusted): 1970 2004
Included observations: 35 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 8.49E+08 51210803 16.57725 0.0000
GR 3.370831 0.449911 7.492219 0.0000
NE 1.672787 1.082381 1.545469 0.1321
R-squared 0.696523 Mean dependent var 1.17E+09
Adjusted R-squared 0.677556 S.D. dependent var 3.57E+08
S.E. of regression 2.03E+08 Akaike info criterion 41.17520
Sum squared resid 1.32E+18 Schwarz criterion 41.30852
Log likelihood -717.5660 F-statistic 36.72227
Durbin-Watson stat 0.593245 Prob(F-statistic) 0.000000