Econometria Material de 2015
-
Upload
edvaldo-leonel-constantino -
Category
Documents
-
view
32 -
download
4
description
Transcript of Econometria Material de 2015
-
1
UNIVERSIDADE CATLICA DE ANGOLA
EECCOONNOOMMEETTRRIIAA
Por: Armando Manuel MSc Amlia Quinto - MSc
Albertina Dekgado-MSc Carlos Vasconcelos- MSc
2015
-
2
Introduo
O QUE A ECONOMETRIA
A econometria pode ser definida como a anlise quantitativa de fenmenos econmicos concretos, baseada no desenvolvimento simultneo de teoria e da
observao, relacionadas por mtodos de inferncia adequados.'
A econometria, consiste na aplicao da estatstica matemtica aos dados econmicos para dar suporte emprico aos modelos construdos pela economia
matemtica e para obter resultados numricos.
A econometria pode ser definida como a cincia social na qual as ferramentas da teoria econmica, matemtica e inferncia estatstica so aplicadas anlise dos
fenmenos econmicos.
A econometria se ocupa da determinao emprica das leis econmicas.
A arte do econometrista consiste em achar o conjunto de hipteses que sejam tanto suficientemente especficas quanto realistas, para lhe permitir tirar o
mximo proveito possvel dos dados sua disposio.'
Os econometristas... prestam uma inegvel contribuio tentativa de afastar a pobre imagem pblica da economia (quantitativa ou no), tida como um assunto
no qual latas vazias so abertas, supondo a existncia de abridores de lata, para
revelar.
O principal interesse da economia matemtica expressar a teoria econmica na forma matemtica (equaes), sem levar em conta a imensurabilidade ou a
verificao emprica da teoria. J a econometria, como destacamos
anteriormente est interessada na verificao da verificao emprica da teoria;
SOBRE A METODOLOGIA
Embora as questes de metodologia tm sido objecto de constantes criticas e sugestes,
a abordagem clssica apresenta 7 passos ou eixos sequenciais que nos sugerem a
metodologia de estudo da econometria:
o Formulao da teoria ou da hiptese o Especificao do modelo matemtico da teoria o Especificao do modelo economtrico da teoria o Obteno de dados o Estimativa dos parmetros do modelo economtrico o Teste de hiptese o Previso ou predio
1. ASPECTOS CONCEITUAIS a) REGRESSO
O termo regresso foi introduzido por Francis Galton num estudo relacionado a hereditariedade, no qual descobriu a tendncia dos filhos nascerem com caractersticas
prximas as dos pais. Outros nomes adicionados a estas descobertas, dizem respeito a
Karl Pearson que encontrou resultados robustos ao verificar que a altura mdia de filhos
pertencentes a um grupo de pais baixos era superior altura de seus pais.
-
3
A anlise de regresso diz respeito ao estudo da dependncia de uma varivel em
relao a uma ou mais variveis cujo comportamento independente. Este estudo visa
determinar o valor mdio da varivel dependente.
b) CORRELAO
A relao de correlao o processo no qual medimos a intensidade da relao
existente entre duas variveis, sempre que desenvolvermos um clculo de regresso, o
coeficiente de ajustamento do modelo, permite-nos obter a noo do grau de correlao
entre ambas as variveis. Podemos dizer, que trata-se do grau de associao linear.
Na anlise de correlao no se estabelece distino entre variveis dependentes
ou independentes, como fizemo-lo na anlise de regresso. Numa situao de correlao
baseamo-nos numa hiptese de aleatoridade enquanto que para a anlise de regresso
consideramos a aleatoridade apenas para a varivel dependente contrariamente as
vaiveis independentes em cujo valores so fixados e ou no-estocstico.
c) CAUSAO
A regresso explica a relao de dependncia entre uma varivel e outra. Este
tipo de relao consiste numa relao meramente estatstica, que no obstante permitir
encontrar uma relao, no implica necessariamente uma relao de causao.
A teoria econmica faz referncia a Causalidade de Granger
d) RELAO DETERMINISTA E ESTOCSTICA
No estudo do comportamento das variveis, encontramos variveis cujo
comportamento obedece tendncias probabilsticas. Estas variveis seguem um
comportamento aleatrio tambm chamadas variveis estocsticas. Exemplo:
pluviosidade, a temperatura ambiental, queda de aeronaves soviticas em Angola etc.
Quando nos referimos a relaes determinsticas, tratam-se de relaes nas quais
intervm variveis cujo comportamento determinstico e no aleatrio. Exemplo: Lei
de gravidade de Newton, Nascimento de um ser como resultado da fecundao de
espermatozoides etc...
Alguns Conceitos Sinnimos:
Varivel Endgena Varivel Exgena
Varivel de Resposta Varivel de Estimulo ou Controlo
Regredida Regressor
Predita Preditor
Varivel Explicada Varivel Explicativa
Varivel Dependente Varivel Independente
2. A NATUREZA E A FONTE DOS DADOS
Os tipos de dados existentes para o trabalho emprico sries temporais, dados
cross-secionais, dados qualitativos, e ainda dados de painel.
So dados qualitativos quando no acto da colheita tomamos uma categoria ou um
atributo cujo resultado toma o valor 1 ou 0 exemplo: homem ou mulher, empregado ou
desempregado. A este tipo de dados tambm chamamos por dummies.
-
4
Na maior parte dos casos, os economistas fazem recurso ou uso de sries de
variveis temporais. Na maior parte das sries temporais econmicas apresentam um
comportamento dinmico isto , a sua media e varincia tendem ambas a variar em
funo do tempo.
Os dados cross-seccionais, tambm chamados por dados de corte, so dados de uma ou mais varivel colectados ano mesmo ponto de tempo. Uma grande implicao
das sries cross-seccionais, diz respeito a heterogeneidade forada por hiatos no
tamanho e no efeito de escala.
Por outro lado, existem situaes nas quais consideramos a combinao de dados
de sries temporais e de dados cross-seccionais.
Dados Em Painel, tambm conhecidos como panel data, so informaes de
unidades, indivduos ou empresas, por exemplo, que podem ser acompanhadas ao longo
do tempo. Mas os mtodos de anlise tambm podem ser aplicados, com as devidas
consideraes, a diferentes sries de dados observados em duas dimenses, por
exemplo, observar as unidades, como empresas, em diferentes estados, ou pases.
Quanto a fontes dos dados, estes podem ser colectados por agncias
governamentais ou independentes. E os dados colectados podem ser experimentais ou
no-experimentais. Todavia os dados colectados no domnio das cincias sociais so
quase sempre no-experimentais o que pressupe dizer que so dados em que o
pesquisador no consegue exercer influncia significativa.
A preciso dos dados constitui um outro factor importante. Certamente que a
colecta de dados raramente ilustra 100% da realidade; quase sempre ocorrem erros de
observao, omisso e ou execuo. Porm do esforo em aproximar os dados
estatsticos realidade especfica, um factor muito importantssimo.
3. ELEMENTOS CHAVE DOS CONCEITOS BSICOS
1. A ideia chave da anlise de regresso a dependncia estatstica de uma varivel (a varivel dependente) em relao a uma outra ou outras variveis (as variveis explicativas).
2. O objectivo desta anlise estimar e/ou prever a mdia ou o valor mdio da varivel dependente, com base nos valores conhecidos ou fixados das variveis explicativas.
3. Na prtica, o sucesso da anlise de regresso depende da disponibilidade de dados
apropriados. Este captulo discutiu a natureza, as fontes e as limitaes dos dados que
geralmente esto disponveis para pesquisa, especialmente nas cincias sociais.
4. Em qualquer pesquisa, o pesquisador deve informar claramente as fontes dos dados
utilizados na anlise, suas definies, seus mtodos de colecta e quaisquer lacunas ou
omisses nos dados, bem como quaisquer revises dos dados. Lembre-se de que os
dados macro-econmicos publicados pelo governo so frequentemente revistos..
-
5
II. A REGRESSO SIMPLES
1. A FUNO DE REGRESSO POPULACIONAL (FRP)
Diremos que geometricamente, a curva de uma funo de regresso o espao
geomtrico onde as mdias ou expectativas condicionais das variveis dependentes para
os valores fixados da varivel explicativa;
)X(f)XY(E ii Equao 1
Onde X uma funo explicativa e Y a varivel explicada, linear em X.
Chamaremos assim a equao 1 como funo de populao de regresso (FPR) de
duas variveis. Assim, assumindo que X pode tomar valores nulos, podemos transcrever
a FPR em
i21i X)XY(E Equao 2
onde os parmetros beta um e beta dois so desconhecidos, todavia fixos e chama-
se coeficientes de regresso. Tambm so conhecidos como intercepto e coeficiente de
inclinao, respectivamente.
O objectivo presente consiste em estimar os parmetros desconhecidos da FRP
descrita na equao N 2.
2. PROPRIEDADES a) A LINEARIDADE
Assumimos que a nossa FRP linear, o que significa que a expectativa
condicional de Y em relao a X consequncia de uma funo linear, podendo esta ser
representada geometricamente por um grfico.
Semelhantemente, a FRP linear nos parmetros, ou seja a expectativa
condicional de Y em relao a X linear nos parmetros. Todavia, se obtivermos uma
funo do tipo 2
i21i X)XY(E ela continua sendo linear nos parmetros embora
no seja na varivel. Todavia, um caso como i21i X)XY(E no um modelo
de regresso linear nos parmetros.
Consideraremos um Modelo de Regresso Linear (MRL) i21i X)XY(E
todo aquele modelo onde )XY(E i linear quer nos parmetros como nas variveis.
b) A ESPECIFICAO ESTOCSTICA
Consideremos que dada a varivel Y e a sua estimativa condicional em relao a
Y, ocorrer sempre um desvio a que chamaremos o erro termo, a perturbao
estocstica ou ainda o white noise :
iii )XY(EY Equao 3
Alternativamente, podermos escrever da seguinte maneira iii )XY(EY e
consequentemente ii21i XY
Assim sendo o primeiro elemento do lado esquerdo ser o elemento sistemtico ou
determinstico, e o segundo termo, corresponde ao componente assistemtica ou
-
6
aleatria, cuja propriedade facilmente podemos obter quando aplicamos expectativas em
ambos os lados da equao condicional a X:
)X(E)XY(EE)XY(E iiii Equao 4
)X(E)XY(E)XY(E iiii
note que para que a igualdade vigore, necessrio que )X(E ii seja igual a zero
0)X(E ii Equao 5
Neste contexto, considerando que ao extrapolar o caso para a vida prtica,
encontraremos variveis sendo explicadas por outras, o termo erro i representar
sempre aqueles factores no considerados na explicao da varivel dependente. Isso
pode ser o caso de variveis omissas.
c) A PERTURBAO ESTOCSTICA E A FUNO DE REGRESSO AMOSTRAL
Para alm do aspecto da omisso de variveis destacado no ponto anterior, existem
outros factores que justificam a razo de existncia da perturbao estocstica no nosso
modelo, apontando-se:
1. Inexactido da teoria 2. Escassez de dados 3. Forma funcional errada 4. Casualidade intrnseca ao comportamento humano 5. Variveis fracas 6. Principio da parcimnia e 7. Variveis essenciais versus variveis perifricas
Considerando a aleatoriedade do erro, a representaes de uma funo de
regresso populacional para varias amostragens, da origem a chamada funo de
regresso amostral (FRA), tal que a amostra da equao 2 pode ser representada por:
ii XY 21 Equao 6
onde o Y estimador de )XY(E i , beta um chapu estimador de 1 e beta dois
chapu o estimador de 2 .
Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas
equaes 2 e a extenso da equao 3, teremos:
ii21iXY Equao 7
em sntese, conclumos que o nosso principal objectivo consiste em determinar
FRP ii21i XY dada a funo amostral FRA. ii21i XY
Adicionalmente podemos ainda apresentar FRA do seguinte modo:
iiiYY Equao 8
e em termos de FRP
-
7
iii )XY(EY Equao 9
3. MNIMOS QUADRADOS ORDINRIOS OLS a) ACESSIBILIDADE DOS MQO-OLS;
Conforme referido anteriormente, constitui objecto principal testar a FRP tendo
como referncia a FRA. Dos enumeras mtodos existentes1, vamos aqui considerar o
mtodo dos quadrados mnimos MQO tambm denominado por Ordinary Least Squares
OLS desenvolvido pelo matemtico Alemo Car Friederich Gauss.
O mtodo em causa baseia-se nos princpio dos mnimos quadrados.
Sabe-se que a FRP ii21i XY no directamente observvel, o que
ns conhecemos sim ii21i XY conforme as equaes 6 e 7 o elemento
erro ou resduo dado pela diferena do Y observado e Y estimado.
iii YY Equao 10
i21i XY
O interesse consistir neste caso em determinar a FRA mais prxima do Y
observado , o que em outras palavras pressupe dizer que quanto menor for resduo
quadrado melhor ser. iii YY . Note que o critrio MQO consiste em minimizar a soma do erro. Porm, veja na figura, a soma do erro 4321 e,, nula,
dada a sua assimetria. Entretanto, ns estamos mais interessados no quadrado da
soma, pois fazendo assim tornamos os valores negativos em positivos e o interesse
consistir em encontrar o menor valor possvel o que em outras palavras significa obter
resduos mais prximos da FRA.
Ilustrao 1 Demonstrao do critrio dos mnimos quadrados.
1 Existem os mtodos da Mxima Verosimilhana, OLS-two stage, Equaes simultneas e outros.
-
8
Assim sendo, tomamos a equao 10 e aplicamos sobre ela o quadrado.
2ii2i YY Equao 11
2
i21i XY
Em outras palavras podemos dizer que o resduo quadrado funo dos
estimadores. Quanto maior for o grau de significncia dos estimadores, maior a
probabilidade de se obter um resduo quadrado menor. 212i ,f .
Abaixo temos um exemplo hipottico no qual assumimos inicialmente que 1 =
2.752 e 2 =1.673 com estes estimadores e conhecendo a srie de X, estimamos a
populao real ou seja, obtemos iY na coluna (3) uma vez conhecido iY , determinamos
i na coluna (4) efectuando a diferena entre as colunas (1) e (3) conforme a equao
10. Seguidamente a coluna (6) representa a aplicao da equao 11 obtendo um
115460.104 2i . No segundo cenrio, assumimos novos valores para os parmetros de estimao 1 =3 e 2 = 1 o que permite encontrar um quadrado da soma do resduo
14 2 i inferior ao obtido no cenrio inicial.
Yi Xi Y1i chapeu ui1 chapeu
ui1 chapeu Quadado Y2i chapeu ui2 chapeu
ui2 chapeu Quadado
1 2 3 4 5 6 7
5 1 4.4250 0.5750 0.330625 4.0000 1 1
8 3 7.7710 0.2290 0.052441 6.0000 2 4
10 7 14.4630 -4.4630 19.918369 10.0000 0 0
12 11 21.1550 -9.1550 83.814025 14.0000 -2 4
35 22 -12.814000 104.115460 1 9
Tabela 1 Determinao Experimental da FRA
Assim, podemos representar a equao computada em (3) e (6) como:
ii1 X673.1752.2Y e ii1 X3Y respectivamente.
b) HIPTESES BSICAS DO MODELO;
Veremos agora as hipteses bsicas do Modelo Clssico de Regresso Linear (MCRL),
que de uma forma mais avanada, infere as hipteses enunciadas por Gauss Markov.
Hiptese 1 - Modelo de Regresso Linear - O modelo linear nos
parmetros conforme mostrado em ii21i XY ;
Hiptese 2 - Os valores de X so fixados em amostras iterativas Os valores assumidos pelo regressor X so considerados fixados
em repetidas2 amostras. A varivel um dado no estocstico.
Hiptese 3 - O valor mdio do resduo i nulo Dado o valor X, o
valor esperado da perturbao residual i zero. 0XE ii 2 Para o caso especifico dos experimentos de Monte Carlo, considerando que o resduo segue uma distribuio aleatria, conforme veremos adiante.
-
9
Hiptese 4 -Homoskedasticidade ou varincia igual de i - Dado o valor
da varivel independente, a varincia de i invariante ao
tempo.
2i2i
2
iiiii
XE
XEEXvar
3
Hiptese 5 -No existe autocorrelao entre as perturbaes4 e, entre a
perturbao i e a varivel independente X. Dados dois
valores ji ueu tal que ji a correlao entre quaisquer valores residuais de perodos distintos zero.
0
XXE
XEXEEX,X,cov
jjii
jjjiiijiji
0
oestocasticnoXEondeXEEXE
XEXE
XEXEEX,cov
iiiii
iji
iiiiiii
Hiptese 6 - O nmero de observaes n deve ser superior ao nmero de parmetros
5.
c) PROPRIEDADES DOS ESTIMADORES- GAUSS MARKOV THEOREM;
GAUSS MARKOV dadas as hipteses bsicas do modelo clssico de regresso linear, os estimadores por mnimos quadrados ordinrios so os
melhores estimadores lineares no enviesados MELNV com
varincia mnima.
Com ajuda das hiptese bsicas do modelo clssico e do teorema de Gauss
Markov, os estimadores dos mnimos quadrados apresentam algumas propriedades
bsicas dentre as quais:
1. Os estimadores OLS so lineares; 2. Os estimadores OLS no so viesados (unbiesed), isto quer dizer que o
valor esperado da estimativa de beta iE converge ao seu valor real i.
3 Lembre-se que para o desdobramento, aplicamos a hiptese 4. Sempre que a varincia alterar em funo do tempo, estaremos em presena da
Heteroskedasticidade. 4 Trata-se da ausncia da autocorrelao ou da correlao serial.
5 A esta hiptese juntam-se as hipteses da necessidade de suficiente variabilidade nas variveis independentes (necessidade de um nmero positivo
finito )Xvar( - hiptese da multicolinearidade), assim como a hiptese de que o modelo foi correctamente especificado retira-se a hiptese de existncia de
um vis de especificao.
-
10
3. Os estimadores OLS so eficientes possuem a varincia mnima a nvel da classe dos estimadores lineares.
Ilustrao 2 Distribuio amostral de 2 e
*
2
O grfico demonstra a distribuio amostral de dois estimadores. Onde 2 MELNV.
d) DETERMINAO DOS ESTIMADORES
(i) Derivao dos estimadores por OLS (modelo univarivel)
Como derivar a estimativas dos mnimos quadrados? Tomamos a funo
expressa na equao 11 e determinamos as derivadas parciais em relao a i e 2 .
ii21i
1
2
i2XY2
Equao 12
iii21i
2
2
i2XXY2
Equao 13
Resolvendo estas equaes igualando-as a zero e efectuando os cortes
necessrios, resulta em:
XY 21 Equao 14
2
i
ii
2x
yx 6 Equao 15
(ii) Linearidade e ausncia de vis
Como provar que os estimadores OLS so de facto MELNV? Tomando a
equao 15, considerando a anotao feita no rodap, tornamos a funo da estimativa
de2 como uma funo linear de Y onde:
2
i
ii
2y
Yx logo assumimos que i2
i
i kx
x
, logo escreveremos
ii2 Yk Equao 16
6 Lembra-se que esta funo pode ser desdobrada para apresentaes alternativas como
22i
ii
XnX
Yx ou ainda
22i
ii
XnX
yX, onde iiii YxyX e finalmente os
desvios de X e Y em relao a mdia dados por YYy;XXx iiii .
-
11
Note agora que a equao 16 apresenta o estimador 2 apresentado como uma
funo linear de Y dado o valor de k.
Agora como demonstrar que a o MELNV converge ao seu valor real?
Assumimos que o somatrio de k nulo, que o somatrio do quadrado de k
igual 1 sobre o somatrio de x (no seu desvio em relao a media). E finalmente
1Xkxk iiii
Vejamos por exemplo provando que o somatrio de k nulo.
i2
i
2
i
ii x
x
1
x
xk considerando que o somatrio do desvio de X
em relao a mdia nulo, a multiplicao do ltimo termo resulta num valor nulo.
Agora substitua a FRP ii21i XY na equao 16 resultar em:
ii21i2 Xk
iiii2i12 kXkk7
ii22 k Equao 17 aplicando expectativas na nossa funo teremos:
ii22 EkE sabendo que o valor esperado do resduo nulo, conseguimos provar que o
estimador OLS converge ao seu valor real.
22E Equao 18
(iii) Varincia e erro padro dos estimadores OLS
Conhecendo a definio da varincia como sendo o quadrado do valor esperado da
diferena entre o estimador e o seu valor mdio, escreveremos:
2222 EEvar Equao 19 usando a demonstrao de convergncia da estimativa ao seu valor real, substitumos
2E 2222 Evar 2ii2 kEvar 8 n1nn1n21212n2n222221212 kk2kk2k....kkEvar 2i22 kvar
7 Aplicando as propriedades enunciadas acima, somatrio de k igual a zero e somatrio de k vezes X igual a um.
8 Lembre-se que a equao 17 pode ser desdobrada sob forma de ii22 k
-
12
2
i
2
2x
var Equao 20
2
i
2
x
ep Equao 21
(iv) Covarincia entre as estimativas de 1 e 2
Existir correlao entre dois estimadores diferentes 1 e 2 ? Vejamos por definio:
2211
221121
E
)(E)(EE),cov(
2
2
2221
varX
EX),cov(
Equao 22
Consequentemente teremos
2i
2
21x
X),cov( Equao 23
(v) Propriedades da varincia mnima.
Lembra-se da equao 16 na qual demonstramos que 2 um estimador linear
em relao a Y, efectuamos algumas consideraes para k. Consequentemente,
podemos representa-las do seguinte modo.
2
i
i
2
i
i
ix
x
XX
XXk Equao 24
Agora, no mesmo esprito que a equao 16, achemos estimador alternativo,
tambm linear em relao a 2 :
ii
*
2 Yw Equao 25
onde embora w seja um coeficiente linear de beta em relao a Y todavia no
necessariamente igual a k.
ii2i1
i21i
ii
*
2
Xww
XEw
YEw)(E
agora para que o presente estimador seja no enviesado, necessrio que
0w i e consequentemente 1Xw ii Semelhantemente, nota que:
ii*2 Ywvarvar
i
2
i
*
2 Yvarwvar
2i2*2 wvar Equao 26
-
13
Tomando a equao 26, podemos introduzir transformaes de formas a atingir
um resultado desejado:
2
2
i
i
2
i
i1
2*
2x
x
x
xwvar
22i
2
i2
2
i
i
2
i
ii
2
2
2
i
ii
2*
2
x
x
x
x
x
xw2
x
xwvar
2i2
2
2
i
ii
2*
2x
1
x
xwvar
2
i
2*
2x
var Equao 27
fica assim provado que 2*2 varvar considerando que ii kw , a varincia do estimador linear beta asterisco deve ser igual a varincia do estimador de mnimos
quadrados.
4. ELEMENTOS CHAVE DA REGRESSO SIMPLES
1. A idia-chave que fundamenta a anlise de regresso o da funo de regresso populacional(FRP).
2. Consideramos a FRP lineares, isto regresses lineares nos parmetros desconhecidos. Elas podem no ser obrigatoriamente lineares na varivel dependente e na varivel independente.
3. Para trabalhos empricos interessa mais a FRP estocstica.
4. FRP um conceito idealizado, pois na realidade quotidiana, o que se tem uma observao da populao. Por esta razo utiliza-se a funo de regresso amostral estocstica FRA, para estimar FRP.
5. A estrutura bsica da anlise de regresso o MCRL, baseado num conjunto de hipteses. Com base nessas hipteses, os estimadores por mnimos quadrados adquirem certas propriedades resumidas no teorema de Gauss-Markov, em que, na classe dos estimadores lineares no-viesados, os estimadores de mnimos quadrados tm mnima varincia. Em suma, eles so MELNV
6. A preciso dos estimadores por MQO medida por seus erros-padro.
7. O grau de ajuste global do modelo de regresso medido pelo coeficiente de determinao, 2R . Com ele se tem a proporo da variao na varivel dependente, ou regredido, que
explicada pela varivel explicativa, ou regressor. Este 2R est entre 0 e 1; quanto mais
prximo de 1, melhor o ajuste.
8. Um conceito ligado ao coeficiente de determinao o de coeficiente de correlao, r. uma medida da associao linear entre duas variveis e est entre -1 e +1.
9. O MCRL uma abstraco ou construo terica, pois se baseia em um conjunto de hipteses que podem ser rgidas ou "irrealistas". Mas tal abstraco com frequncia necessria nos estgios iniciais do estudo de qualquer campo do conhecimento. Uma vez alcanado o domnio do MCRL, pode-se descobrir o que acontece se uma ou mais de suas hipteses no forem satisfeitas.
-
14
III. CASOS PRTICOS
1. TESTE DE HIPTESE E INTERVALOS DE CONFIANA; Para abordagem do teste de hiptese, importa fazer meno a conceitos
fundamentais como:
distribuio de probabilidade,
erros do tipo I ,
erros do tipo II,
intervalos de confiana,
poder de um teste estatstico e
a) O INTERVALO DE CONFIANA
Recordando a estatstica II:
O melhor intervalo para um parmetro ser aquele para o qual a probabilidade de conter
o valor do parmetro a maior:
baP Exemplo da mdia populacional:
baP
;~ N
n
XVF
(Varivel fulcral)
zVFzP
z
n
XzP
nzX
nzP
nzX
nzXP
nzX
nzXP
nzX
nzXP
nzX
nzXI
;
n
zXI
nze
(Margem de erro)
eXI
-
15
Voltando a matria de econometria:
Admita que queiramos descobrir quo prximo i de i , para isso tentamos
descobrir dois nmeros positivos, e , onde posiciona-se entre 0 e 1, de modo a
que a probabilidade de o intervalo aleatrio 22 ; conter o verdadeiro 2 de a 1 - .
1)Pr( 222 Equao 28
Porm note que a equao acima apresentada, reflecte um intervalo aleatrio, j
que 2 um parmetro desconhecido, a no ser que tenhamos uma amostra especifica e
obtivermos um valor especifico de 2 .
Conhecido o estimador dos mnimos quadrados, calculados luz dos
pressupostos bsicos do modelo clssico; normalmente distribudo com esperana nula
e varincia conhecida, e consequentemente o desvio padro, a estatstica de t seguindo a
distribuio de t student calculada do seguinte modo:
estimadordoestimadopadroerroparmetroestimador
ep
t
i
ii
Equao 29
onde t segue uma distribuio de n-2 gl , portanto, em vez de usarmos a
distribuio normal, usamos as distribuio de t estabelecendo um intervalo de
confiana para 2 tal como se segue:
1)tttPr( 22 Equao 30
onde 2t o valor da varivel i obtido da distribuio t para o nvel de
significncia 2
e 2n graus de liberdade; tambm chamado por t critico que se
pode encontrar na tabela.
1tep
tPr 2
i
ii2 Equao 31
Assim que se desejar calcular o intervalo de confiana, tomar a frmula:
i2i ept Equao 32
A interpretao deste intervalo dada pelo intervalo de confiana de 95% ao
longo prazo, tal que 95 a 100% dos intervalos como (0,4268; 0,5914) contero o
verdadeiro 2 . Sabe-se ainda que a amplitude do intervalo de confiana proporcional
ao erro padro do estimador. Quanto maior este for o erro padro maior ser a amplitude
do intervalo.
b) FRMULAO DAS HIPTESES NULAS E ALTERNATIVAS
A questo da formulao das hipteses estatsticas, relaciona-se aos casos nos
quais, dada uma observao, nos perguntamos at que ponto ela compatvel com a
-
16
hiptese previamente formulada. Estatisticamente a hiptese formulada conhecida
como hiptese nula 0H . Geralmente ela testada seguida de uma hiptese alternativa
AH por vezes tambm designada por hiptese sustentada.
Exemplo:
0:H0:H 2A20 Equao 33
Uma vez construdo o intervalo ou detectado os valores crticos para o nvel de
significaria achado pertinente, caso 2 cair na rea de )%1(100 , no rejeitar a
hiptese nula. Porm caso cair fora, na considerada rea critica, deve-se rejeitar a 0H .
Este tipo de teste um teste bicaudal.
Equao 34 Intervalo de Confiana de 100 (1- )% para 2
Quando rejeitamos a hiptese nula, dizemos que estamos em presena de
resultados estatisticamente significantes. Porm, quando no rejeitamos, os resultados
no so estatisticamente significantes.
Tabela de Deciso para o Teste de Hiptese
Tipo de hiptese 0H : Hiptese Nula 1H : Hiptese
Alternativa
Regras de deciso:
rejeitar 0H : se
Duas caudas 2 =
*
2 2 *
2 gl,2/tt
Cauda a direita 2
*
2 2 >*
2 gl,2/tt
Cauda a Esquerda 2
*
2 2 1 implica que 2R > 2R
d) A VARINCIA E A MATRIZ VARINCIA COVARINCIA
Considere o vector de estimadores dos mnimos quadrados ordinrios e faamos um
desenvolvimento preliminar:
uXXX
uXXXXXXX
)uX(XXX
1
11
1
implica que,
uXXX 1 Equao 60
Determinemos agora a varincia da covarincia:
9 Lembre-se que anteriormente referenciamos que o coeficiente de determinao tambm pode ser
apresentado como:
2
i
2
i2
y
1R ;
SQT
SQR1R 2
-
26
uXXXuXXXE
E)cov(var
11
1111 XXXuuEXXXXXXuuXXXE 121 XXIXXXX
finalmente obtemos a matriz varincia covarincia:
12 XX)cov(var Equao 61 na verdade a equao apresentar-se-ia do seguinte modo,
1
2
2
2
2
22
2
2
...
............
...
...
1...00
............
0...10
0...01
)cov(var
kiikiki
kiiii
kii
XXXX
XXXX
XXn
onde por obedincia das hipteses bsicas, apenas consideramos os valores da coluna
diagonal esquerda-direita, i.e. as varincias
Consequentemente, teremos:
)var(...),cov(),cov(
............
),cov(...)var(),cov(
),cov(...),cov()var(
)cov(var
k2k1k
k2212
k1211
De seguida, para o clculo da matriz do erro padro teremos:
)var(...),cov(),cov(
............
),cov(...)var(),cov(
),cov(...),cov()var(
)(ep
k2k1k
k2212
k1211
onde sero vlidos apenas os elementos da diagonal. Note que voc encontrar alguns
valores negativos fora da diagonal (esquerda direita) e estes no tero raiz quadrada. ~
-
27
6. EXERCCIO: ILUSTRAO Dados:
Ordem Qtid lbs Pre $/lbs Gastos em Propaganda $
1 55 100 5.5
2 70 90 6.3
3 90 80 7.2
4 100 70 7
5 90 70 6.3
6 105 70 7.35
7 80 70 5.6
8 110 65 7.15
9 115 60 7.5
10 130 55 7.15
11 130 50 6.5
Pretende-se:
1. Provar se os dados conferem com a equao abaixo:
i3i2ii X237.11X326.1532.117tidQ
2. Fazer o check up dos sinais esperados 3. Fazer o teste de t para cada parmetro. 4. Calcular o coeficiente de determinao sem tomar em conta os graus de
liberdade.
5. Interprete os resultados obtidos
RESOLUO:
Primeiro formulmos o modelo:
uXY
u
u
u
u
u
u
u
u
u
u
u
50.6501
15.7551
50.7601
15.7651
60.5701
35.7701
30.6701
00.7701
20.7801
30.6901
50.51001
130
130
115
110
80
105
90
100
90
70
55
1x1111
10
9
8
7
6
5
4
3
2
1
1x33
2
1
3x111x11
Calculo da Matriz quadrada XX das variveis exgenas.
-
28
5975.4965.516355.73
5.516357450780
55.7378011
50.6501
15.7551
50.7601
15.7651
60.5701
35.7701
30.6701
00.7701
20.7801
30.6901
50.51001
5.615.75.715.76.535.63.672.73.65.5
50556065707070708090100
11111111111
Clculo da matriz inversa da matriz quadrada 1XX das variveis exgenas
5975.4965.516355.73
5.516357450780
55.7378011
ASeja
Calculamos o determinante:
DET (A)=83815.75
Aplicar regra de Crammer neste momento segundo os passos:
Calcular determinante Calcular a matriz dos coofactores Calcular a matriz ajunta (transp cofactores) Dividir pelo determinante de A
Elementos da Coluna 1
51867794.125975.4965.5163
5.516357450c11
7570.6255975.4965.5163
55.73780c21
Elementos da Coluna 2
7570.6255975.49655.73
5163780c12
52.975975.49655.73
55.7311c22
570.55.5163780
55.7311c22
Elementos da coluna 3
-197917.55.516355.73
57450780c13
570.55.516355.73
78011c23
2355057450780
78011c33
-197917.55.516357450
55.7378031 c
-
29
Montamos neste momento a matriz adjunta
23550570.5197917.5-
570.552.977570.625
197917.5-7570.62551867794.12
AAdj
Calculamos a matriz inversa, dividindo o determinante a transposta da matriz
adjunta.
23550570.5197917.5-
570.552.977570.625
197917.5-7570.62551867794.12
75.83815
1A 1
Encontramos a matriz inversa:
50.2809734470.0068065922.36131340-
70.0068065910.000631980903246.0
22.36131340-090324611.022.2845244
A 1
Determinamos agora a matriz X y via multiplicao de matrizes, para computar o vector dos parmetros.
75.7301
72950
1075
130
130
115
110
80
105
90
100
90
70
55
5.615.75.715.76.535.63.672.73.65.5
50505560657070708090100
11111111111
yX
ok, conhecendo a frmula dos estimadores yXXX 1 , podemos calcula-los.
75.7301
72950
1075
50.2809734470.0068065922.36131340-
70.0068065910.000631980903246.0
22.36131340-090324611.022.2845244
Multiplicando obtm o vector dos estimadores:
698356216.9
295842369.1
7475407.124
E finalmente montamos a nossa funo estimada:
-
30
iiii GP698356216.9P295842369.17475407.124Qtid
Vamos agora calcular a varincia do erro:
32775314.33
8
1266.622025
kn
XXyyuu
kn
u2i
Sabendo que: 12 )XX()cov(var
50.2809734470.0068065922.36131340-
70.0068065910.000631980903246.0
22.36131340-090324611.022.2845244
32775314.33
364214.9226849.0698163.78
226849.0021063.0010316.3
698163.78010316.3693128.742
)cov(var
Assim teramos o vector do erro padro:
06010026.3
14512933.0
2523967.27
)(
e as estatsticas de t que nos dizem qual o grau de significncia estatstica
169294.3
92888.8
578223.4
)(t
Neste momento, efectuamos o teste de hipteses para avaliar o resultado obtidos:
Como se pode observar, ao nvel de significncia todos os parmetros so
poderosa e estatisticamente significantes.
O Calculo do coeficiente de determinao:
0.952543012105056.818110675
2105056.818110408.378
Ynyy
YnyXR
2
22
-
31
7. ILUSTRAO MICROSOFT EXCEL PARA CLCULOS ECONOMTRICOS
Parte A - Clculo Automtico 1. Considere que lhe foram dadas
13 observaes trimestrais da quantidade onde as quantidades procuras do referido preo
julgam-se depender dos gastos com publicidade segundo os
dados descritos abaixo:
Data Compras Preo Publicidade
1999-I 340 48.00$ 234.00$
1999-II 330 72.00$ 256.00$
1999-III 370 96.00$ 278.00$
1999-IV 350 72.00$ 300.00$
2000-I 380 48.00$ 322.00$
2000-II 380 144.00$ 344.00$
2000-III 400 96.00$ 366.00$
2000-IV 210 168.00$ 388.00$
2001-I 390 96.00$ 410.00$
2001-II 400 144.00$ 432.00$
2001-III 410 72.00$ 454.00$
2001-IV 230 216.00$ 476.00$
2002-I 420 192.00$ 498.00$
2. Para computar estes dados, tenha-nos inseridos numa folha de clculo, tal como se
visualiza na figura 1. 3. De seguida, v ao menu
Ferramentas e no final, escolha Anlise de dados, depois de aparecer a janela,
Analisar dados, escolha Regresso, e de seguida,
insira os dados como se visualiza na figura 2. Nota que a figura dois possui as
referencias $B$1:$B$14, $C$1:$D$14 que so as
coordenadas (coluna-linha) dos dados para a varivel dependente e para as
variveis independentes respectivamente.
Figura 1 Dados
4. Da figura 2, clicando OK, o resultado da analise de regresso para os dados apresentados automaticamente representado na rea comeando pela clula $C$17.- (Sempre que visualizar o $ entre coordenadas, ele usado para
fixar a clula). Assim sendo os seus resultados bsicos sero apresentados do seguinte modo:
-
32
Figura 2 Janela de Insero de dados e definio de pressupostos
Figura 3 Resultados da Analise de Regresso
5. Em termos de apresentao da regresso tomaramos os principais dados e apresenta-lo amos do seguinte modo. (Nota que existam varias formas
de apresentao dos dados, diferindo uma da outra):
iii PubPQ 499811800204202159928286 ... (76.0136504) (0.42838412) (0.27444772)
2R =0,36 %; Onde os valores em parntesis representam o desvio padro. Algumas vezes, escrevemos directamente as estatsticas de t para cada um dos coeficientes estimados (assumindo a hiptese nula)ao invs de apresentar o desvio-padro.
Parte B Clculo Manual Como resolver manualmente o exerccio acima exposto com ajuda do Excel?
-
33
1. Cria um ficheiro novo no Excel. V o menu Ficheiro, active guardar como, e
grave designando-o r-lienar 2. Introduza os dados no espao A1:D14 tal como consta na figura 1.
Alternativamente, voc poder fazer o download deste ficheiro no website;
3. Coloque o curso na Coluna C, e v ao menu Inserir, clique coluna criar-se h uma coluna a esquerda do vector do preo.
4. Escreva Intercepto na clula C1, escreva 1 em cada clula de C2 a C14;
5. V para a clula B20, escreva Matrix X Transposta.
6. Seleccione a rea C2:E14, clique no menu Editar, active copiar, de seguida,
coloque o curso na clula C20 e v para o menu Editar, clique em colar especial.
Ver uma janela, clique na caixinha junto de transpor, e depois clique em OK.
Ter assim criada a matriz transposta das variveis independentes.
7. V para a clula B25, escreva XX, de seguida seleccione a rea (C25:E27), clique na tecla F2 escreva =MATRIZ.MULT(C20:O22,C2:E14) de seguida clique
simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla
Enter, assim sendo voc ter a multiplicao da matriz transposta de X pela matriz X.
8. V para a clula B29, escreva XX Inversa, seleccione a rea (C29:E31), clique F2, escreva =MATRIZ.INVERSA(C25:E27), de seguida clique simultaneamente
em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter 9. V para a Clula B34, escreva Xy, seleccione (C34:36) a rea posicione o
cursor, prima F2 e escreva =MATRIZ.MULT (C20:O22,B2:B14), de seguida
clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a
tecla Enter 10. V para a clula B39, escreva Betas, seleccione a rea (C39:C41), prima F2 e
escreva =MATRIZ.MULT(C29:E31,C34:C36), de seguida clique simultaneamente
em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter, voc ter assim coeficientes no valor exacto dos clculos obtido acima.
11. Agora confira os seus resultados com os resultados da impresso no verso, para
averiguar se voc obteve os parmetros estimados conforme.
iii PubPQ 499811800204202159928286 ...
0
50
100
150
200
250
300
350
400
450
19
99
-I
19
99
-II
19
99
-III
19
99
-IV
20
00
-I
20
00
-II
20
00
-III
20
00
-IV
20
01
-I
20
01
-II
20
01
-III
20
01
-IV
20
02
-I
Y estimado Y
-
34
V. FORMAS FUNDAMENTAIS DOS MODELOS DE REGRESSO
Ao mudar unidades de medida das variveis dependente e/ou independente, estimativas
de MQO so afectadas.
Se a varivel dependente multiplicada pela constante c(cada valor na amostra multiplicado por c), ento as estimativas de MQO de intercepto e de inclinao
tambm so multiplicadas por c.
Se a varivel independente dividida (ou multiplicada) por alguma constante diferente de zero (c) ento o coeficiente de inclinao de MQO multiplicado (ou
dividido) por c, respectivamente.
Mudar as unidades de medida da varivel independente no afecta o intercepto.
O grau de ajuste do modelo (R2) no depende das unidades de medida das variveis.
Formas funcionais populares usadas em economia podem ser incorporadas anlise de
regresso.
At agora foram analisadas relaes lineares entre as variveis dependente e independente.
No entanto, relaes lineares no so suficientes para todas as aplicaes econmicas e sociais.
fcil incorporar no-linearidade na anlise de regresso simples.
1.1 Modelo Nvel Nvel (Modelo Lin-lin)
Suponha que a varivel dependente e varivel independente que se quer analisar esto
tanto na forma de nvel. Por exemplo se quisermos saber o efeito sobre os salrios de
uma ano extra de educao, e que os dados disponveis permitem estimar a seguinte
equao:
Neste caso, o coeficiente da varivel analisada pode ser interpretado como o efeito
marginal. O efeito marginal a forma como a varivel dependente muda quando as
mudanas de variveis independentes por uma unidade adicional mantendo todas as
outras variveis na equao constante (isto , calculando a derivada parcial) ou:
Portanto, Bj pode ser interpretado como a variao dos salrios a partir de um aumento
de uma unidade (ou mudana de estado se varivel dummy) de Xj mantendo todas as
outras variveis independentes constantes.
-
35
Exemplo:
Com base nos dados utilizados nesta regresso, um ano adicional de educao
corresponde a um aumento nos salrios de 0,75 USD/horas. Da mesma forma, um ano
de experincia est associada a um aumento de 0,3 USD/hora no salrio, mantendo-se
as demais variveis constantes.
1.2 Modelo Log- Log
Considere interpretar coeficientes de uma regresso em que a varivel dependente e
independente a analisar esto na forma de log. Os coeficientes j no podem ser
interpretados como efeitos marginais. Supes que a teoria econmica sugere estimativa
da nossa equao de salrios com a varivel dependente na forma log
e incluso de horas de trabalho voluntrio da comunidade por semana (Comm), tambm
em forma de log. A equao de anlise agora :
Gostaramos de interpretar o coeficiente sobre a varivel voluntrio da comunidade
(B4). Para entender melhor a interpretao, considere o diferencial da equao acima
mantendo todas as variveis independentes constantes, excepto Commi.
Uma vez que:
Ento podemos ter:
Onde o lado esquerdo a elasticidade (parcial) de W em relao ao Comm. A
elasticidade a razo entre a percentagem de alterao numa varivel para a
percentagem de alterao em uma outra varivel. O coeficiente de regresso uma
elasticidade parcial, j que todas as outras variveis da equao so mantidos
constantes.
Portanto, B4 pode ser interpretado como a variao percentual no salrio por hora de
um aumento de um porcento em horas de trabalho voluntrio da comunidade por
semana mantendo-se a educao, idade e experincia constantes.
-
36
Com base nestes resultados de regresso, um aumento de um por cento em horas de
trabalho voluntrio da comunidade por semana associada a um aumento de 1,2% no
salrio por hora.
1.3 Modelo Log- Nivel (Log Lin)
Na equao do modelo 1.2, a educao, idade e experincia esto em termos de nvel,
enquanto a varivel dependente (salrio) , em termos de log.
Gostaramos de interpretar os coeficientes dessas variveis. Primeiro, considere
educao. Leve o diferencial mantendo todas as outras variveis independentes
constantes.
Multiplicandos os dois lados por 100 e reorganizando teremos:
Portanto, 100 x B1 pode ser interpretado como a variao percentual de aumento Wi
unidade em Edi, mantendo todas as outras variveis independentes constantes.
Derivaes similares podem derivar da interpretao para os coeficientes da idade e
experincia.
Considerando o modelo estimado no ponto 1.2, podemos dizer o seguinte: mantendo
todas as outras variveis independentes constantes, um ano adicional de escolaridade
est associado a um aumento de 24% no salrio por hora. Da mesma forma, um ano
adicional de experincia associada a um aumento de 16% no salrio por hora.
1.4- Modelo Nivel-Log (Lin-Log)
Considere-se uma regresso em que a varivel dependente , em termos de nvel e a
varivel independente de interesse em termos de log. Por exemplo, considere a
seguinte equao:
Lembre-se da seco de regresses de nvel-nvel que os coeficientes de educao,
idade e experincia podem ser interpretados como efeitos marginais. Gostaramos de
interpretar o coeficiente de horas de trabalho voluntrio da comunidade (B4). Mais uma
vez, levar o diferencial de ambos os lados, mantendo todas as variveis independentes
constantes excepto trabalho de voluntrio da comunidade.
-
37
Dividindo os dois lados por 100 e reorganizando podemos ter:
Ento:
Pode ser interpretado, interpretado como o aumento do salrio por hora de um aumento
de um porcento de trabalho voluntrio da comunidade.
Portanto, mantendo-se a educao, idade e experincia constante, um aumento de um
porcento de trabalho voluntrio da comunidade est associado a um aumento de 0,132
dlares em salrios por hora.
Podemos sumarizar os modelos no seguinte quadro:
-
38
VI. RELAXANDO AS HIPTESES BSICAS DO MODELO
1. A MICRONUMEROSIDADE E MULTICOLINEARIDADE
O termo Multicolinaridade foi introduzido por Ragner Frisch para ilustrar a
existncia de uma perfeita ou exacta relao linear entre variveis independentes de um
modelo.
Existe uma relao linear exacta quando:
0X.....XXX kk332211 Equao 62
onde k21 ...., so constantes do modelo mas que todavia nem todas so iguais a zero.
comum encontra-se modelos com multicolinearidade porem no em situao de
colinearidade perfeita
Quando estamos em presena de multicolinearidade perfeita, os coeficientes da
regresso tornam-se indeterminveis e o erro padro tende para o infinito. Se a
multicolinearidade menos que perfeita, a tendncia to somente de observar-se um
alto erro padro o que traduz a dificuldade de estimao do erro padro.
Um aspecto importante a fazer meno que ainda que o modelo observe alta
multicolinearidade, este facto no afecta as propriedade bsicas dos estimadores dos
mnimos quadrados ordinrios. Eles mantm MELNV. De facto Cristopher Achen
salienta:
Estudantes principiantes de metodologia s vezes se preocupam com o facto de suas variveis independentes estarem correlacionadas - o assim
chamado problema da multicolinearidade. Mas a multicolinearidade no viola
nenhuma hiptese de regresso. Estimativas no-viesadas e consistentes vo
ocorrer, e seus erros-padro sero correctamente estimados. O nico efeito da
multicolinearidade tornar difcil a obteno de estimativas de coeficientes com
pequeno erro-padro. Mas ter um nmero pequeno de observaes tambm tem
esse efeito, assim como ter variveis independentes com pequenas varincias.
(Na verdade, em nvel terico, multicolinearidade, poucas observaes e
pequenas varincias nas variveis independentes so, basicamente, o mesmo
problema.) Assim, "O que devo fazer com a multicolinearidade?" uma questo
semelhante a "O que devo fazer se no tiver muitas observaes?". Nenhuma
resposta estatstica pode ser dada.
-
39
a) FONTES DA MULTICOLINEARIDADE
Montogomery e Peck, tero desenvolvido um trabalho extensivo no qual
possvel identificar as potenciais fontes da multicolinearidade:
1. O mtodo usado na colheita de dados: sobretudo quando consubstancia-se numa gama limitada de observaes tende a traduzir-se em relaes
colineares no pressuposto de que tomando o comportamento de
determinadas sries em tamanhos ou intervalos de tempo curtos, nunca
chega a ser suficientemente explicativo para captar as tendncias reais de
mudana;
2. Restries impostas ao modelo: costuma-se usar o exemplo da relao rendimento e consumo de electricidade, partindo do pressuposto de que
escales de baixo rendimento tendem a associar-se com habitaes
restritas em termos de espao e consequentemente no consumo de
energia;
3. Mispecification Bias: Quando as variveis a incluir no modelo no forem devidamente especificadas ou quando o modelo possui um numero de
parmetros superior ao tamanho da populao (observaes).
b) PRESENA, DETENO E MEDIDAS CORRECTIVAS
Como detectar a multicolinearidade constitui uma das questes preocupantes
para principiantes em econometria. De facto a existncia ou a no existncia da
multicolinearidade no deve constituir preocupao. O que mais deve preocupar so os
distintos nveis da multicolinearidade;
Veremos alguns indicadores bsicos que nos permitem induzir a existncia da
multicolinearidade:
1. Alto coeficiente de determinao e poucos parmetros afigurando-se estatisticamente significantes: Geralmente toma-se como referencia
80%, e em muitos dos casos o teste de F rejeita a hiptese nula de
simultaneidade dos coeficientes parciais;
2. Correlao elevada entre dois a dois parmetros: se computando o grau de correlao entre dois a dois parmetros vislumbra-se num
coeficientes de associao acima de 80% constitui uma pista para
suspeitar a existncia de alto nvel de colinearidade; Argumenta-se
tambm que para alguns casos a colinearidade pode existir mesmo em
situaes em que o grau de correlao de ordem zero entre variveis
baixo.
3. Regresses auxiliares: outra tcnica pertinente para deteno da existncia de multicolinearidade tem sido computar regresses auxiliares
de cada varivel independente sobre as demais e o consequente calculo
do coeficiente de determinao para averiguar o grau de ajustamento do
modelo.
-
40
Conhecidas as fontes e detectada a presena da multicolinearidade, que
mediadas correctivas? A multicolinearidade essencialmente um problema de amostra,
o que torna simples identificar a s medidas correctivas para livrar-se dela.
1. A informao a prior constitui um factor determinante na medida em que a percepo do tipo de variveis em causa ou o tipo de questes que
se tenham colocado num inqurito especfico, tendem a fornecer um foco
de correco; Exemplo, o modelo de determinao do consumo como
funo do rendimento pessoal disponvel e da riqueza um dos casos de
alta associao.
2. O tamanho da amostra, conforme j abordado, sempre que for possvel incrementar o tamanho da amostra, para alguns dos casos tende a
expurgar o efeito colinear entre determinadas variveis;
3. Re-especificao do Modelo: por vezes possvel num determinado modelo ter variveis redundantes, uma vez retiradas, o grau de
significncia estatstica do modelo no sofre grandes alteraes; Tambm
associam-se nestes casos a especificao correcta do modelo.
Exemplo:
O modelo correcto previsto dado por:
ii33i22ii XXY Equao 63
todavia ns especificamos o modelo da seguinte maneira:
ii212iiXY Equao 64
quando sabe-se afinal de contas que: 323212E onde 32 o ngulo de inclinao das variveis X2 e X3. Consequentemente, ocorrer
que a 12 ser um estimador enviesado de 2 desde que 32 seja
diferente de zero.
4. A Transformao de variveis: Ocorre para muitas variveis no estacionrias, geralmente quando estas apresentarem um comportamento
com trend tal que usando o exemplo do rendimento e consumo, a tendncia de ambas as variveis seguem a mesma direco. Estes caso
cria em certa parte um comportamento ilusrio que para alguns dos casos
traduz-se em multicolinearidade. A transformao de variveis muitos
casos consiste na aplicao de logaritmos para abrandar o
comportamento do trend ou no clculo da primeira diferena.
ii33i22ii XXY Equao 65
aplicando uma desfazem , teramos
1t1t331t22i1t XXY Equao 66
consequentemente, a diferena de ambas as funes seria:
t1t3t331t2t221tt vXXXXYY Equao 67
5. A combinao de dados de corte (cross-secionais) e sries temporais, embora seja um artifcio um pouco complexo, constitui uma das
sugestes pertinentes para resoluo do problema;
-
41
c) CONSEQUNCIAS PRATICAS DA MULTICOLINERARIDADE
1. No obstante continuarem sendo MELNV, os estimadores dos mnimos quadrados ordinrios tendem a produzir varincias e covarincias com
um tamanho bastante alto, difceis de serem estimadas;
2. Consequentemente, os intervalos de confidncia tendem a ser bastante largos forando a imediata aceitao da hiptese nula (de que o
coeficiente da populao real igual a zero);
3. Existe uma tendncia das estatsticas de t de cada coeficiente, mostrarem-se estatisticamente insignificantes em contraste, o coeficiente
de determinao do modelo 2R tende em muitos dos casos para um
valor prximo de 100% demonstrando que o modelo estimado ajusta-se
ao modelo real;
4. Pequenas alteraes nos dados estatsticos deixam os estimadores e os desvios-padro bastante sensveis a mudanas.
-
42
2. ELEMENTOS CHAVE10 DA MULTICOLINEARIDADE
10
Quanto a alnea (d) Alm disso, como destacaram C. Robert' Krishna Kumar, John O'Hagan e Brendan McCable, h alguns problemas estatsticos com o teste
de correlao parcial sugerido por Farrar e Glauber.
1. Uma das hipteses do modelo clssico de regresso linear a de que no haja multicolinearidade entre as variveis explicativas, os Xs. Interpretada a grosso modo,
multicolinearidade se refere situao em que h uma relao linear exacta ou
aproximadamente exacta entre as variveis X.
2. As consequncias da multicolinearidade so estas: se houver uma colinearidade perfeita entre os Xs, seus coeficientes de regresso sero indeterminados e seus erros-padro
no sero definidos. Se a colinearidade for alta, porm no perfeita, a estimativa dos
coeficientes de regresso ser possvel, mas seus erros-padro tendero a ser grandes.
Como resultado, os valores dos coeficientes na populao no podem ser estimados
precisamente. Porm, se o objectivo for estimar as combinaes lineares desses
coeficientes, as funes estimveis, isto pode ser feito mesmo na presena da
multicolinearidade perfeita.
3. Embora no haja nenhum mtodo infalvel para detectar a colinearidade, h diversos indicadores dela, que so os seguintes:
(a) O indcio mais claro da multicolinearidade surge quando 2R bastante alto, mas nenhum dos coeficientes de regresso estatisticamente significativo segundo o
teste t convencional. Este caso, naturalmente, extremo.
(b) Nos modelos envolvendo apenas duas variveis explicativas, pode-se obter uma ideia razoavelmente boa da colinearidade examinando-se o coeficiente de
correlao simples, ou de ordem zero, entre as duas variveis. Se esto
correlao for alta, geralmente a culpada a multicolinearidade.
(c) Os coeficientes de correlao de ordem zero, porm, podem ser enganadores em modelos que envolvam mais de duas variveis X, pois possvel ter baixas
correlaes de ordem zero e, apesar disso, existir alta multicolinearidade. Em
tais situaes, talvez tenhamos de examinar os coeficientes de correlao parcial,
(d) Se 2R for alto mas as correlaes parciais forem baixas, a multicolinearidade e uma possibilidade. Aqui, uma ou mais variveis podem ser suprfluas. Mas se o
2R for alto e as correlaes parciais tambm forem altas, a multicolinearidade
pode no ser facilmente detectvel.
(e) Portanto, podemos regredir cada uma das variveis X. sobre as demais variveis
X no modelo e descobrir os respectivos coeficientes de determinao
-
43
3. A HETEROSKEDASTICIDADE VERSUS HOMOSKEDASTICIDADE
Uma das mais relevantes hipteses do modelo clssico, consiste no
comportamento homoscedstico da varincia do resduo ao longo do tempo22 )( Var . (caracterstica bsica das sries temporais estacionarias). A questo
coloca-se de facto em questionar o que ocorre no modelo se esta hiptese for violada?
Na abordagem matricial, estaramos em presena da matriz do resduo, dada sob
forma de:
2
n
2
2
2
1
...00
............
0...0
0...0
)(E)var( Equao 68
o que significa que ao longo do tempo, os erros de distintos perodos possuem
correlao nula, quanto aos erros do mesmo perodo correspondem a varincia.
(expressa na linha diagonal), e segundo o postulado clssico, esta varincia deve
assumir valores constantes. Contrariamente, estamos em presena da
heteroskedasticidade.
A figura abaixo uma ilustrao clara da alterao da disperso do resduo como
funo do tempo. Um caso comum sustentando a heteroskedasticidade o modelo das
expectativas racionais - na justificao de que a medida em que o tempo passa as
pessoas ajustam o seu comportamento com os seus erros, tal que as oportunidades de
cometer um erro tornam-se reduzidas. Para este caso, teramos por exemplo um grfico
semelhante ao debaixo. Porm, com a distribuio do resduo variando do sentido
inverso.
Um outro exemplo semelhante diz respeito a firmas de pesquisa. Estas tendem a
melhorar a tcnica de colecta de dados ao longo do tempo, tambm diz respeito a
redues graduais que se vo registando na componente do resduo.
Ilustrao 3: Perturbaes Heteroscedsticas
-
44
a) PRESENA, DETENO E MEDIDAS CORRECTIVAS
Na presena de heteroskedasticidade, notamos que 22
i afectando a prior a
frmula da varincia conforme visto anteriormente. Segundo, nas abordagens anteriores
fez-se meno ao facto de 2 ser um estimador linear no viesado MELNV desde que
as hipteses do modelo clssico sejam observadas.
At este ponto, o simples facto da violao da homoskedasticidade, no retira a
propriedade de MELNV. Todavia, ocorre que estes estimadores dos mnimos quadrados
ordinrios continuam sendo melhores e no viesados porm no mais so eficientes ou
seja, no possuem varincia mnima.
b) TESTES DE HIPTESES
Para a deteno da heteroskedasticidade, utilizam-se vrios mtodos dentre os
quais:
MTODOS INFORMAIS:
Mtodos Grficos: No existindo informao alguma, basta fazer um plot do resduo em relao ao tempo ou em relao a varivel dependente, to
fcil podemos observar um comportamento (patetern) especifico que nos
permite perceber a variao do resduo em funo do tempo ou da varivel
dependente.
Ilustrao 4 Ilustrao de vrios padres de resduos quadrados estimados.
MTODOS FORMAIS:
Existem vrios testes para o efeito. O Teste de Gelser,Teste de Park , Teste de
Glejsere, Teste de Correlao de Spearman, Whites General Heteroscedasticity, Teste de Goldfield Quandt.
Whites General Heteroscedasticity
Inicialmente computamos a regresso auxiliar do quadrado do erro nos valores de X, no
quadrado de X e nos produtos cruzados
ii3i26
2
i35
2
214i33i221i vXXXXXXu Equao 69
de seguida computamos o coeficiente de determinao efectuamos o teste de hipteses.
-
45
2
df
2 ~Rn Equao 70
Se o valor computado da estatstica for superior ao valor critico chi-square segundo os
graus de liberdade (sem o intercepto) Conclui-se que existe Heteroskedasticidade. Se
no exceder: ento 0654321 o que significa estar-se em presena
de homoskedaticidade.
Teste de Goldfield Quandt
knu
knu
glSRQ
glSRQ
2
2
2elomod
1
2
1elomod
1
2
Equao 71
onde: SRQ= Soma do resduo quadrado
gl = graus de liberdade
Constitui passos para o emprego do presente teste:
o Organizar a amostra em ordem crescente a X o Omitir m observaes centrais tal que (n-m) seja num nmero
par
o Dividir a amostra em duas regresses (n-m)/2 o Obter a soma dos resduos quadrados de ambas regresses
Se lambda for superior ao valor critico tabelado de F, segundo os graus de liberdade ((n-
c)/2)-k, rejeitamos a hiptese de homoscedasticidade; A varincia comporta-se
heteroscedasticamente.
c) O MTODO DOS MNIMOS QUADRADOS GENERALIZADOS
Sempre que estivermos em presena da Heteroskedasticidade, o mtodo dos
mnimos quadrados ordinrios, no mais valido. Nestas circunstncias, fizemos
recurso ao mtodo dos Mnimos Quadrados Generalizados, um mtodo que consiste
na transformao do modelo com vista a poder estim-lo.
Vejamos um modelo com trs variveis:
ii33i22ii XXY Equao 72
podendo tambm ser escrito do seguinte modo
ii33i22i0ii XXXY Equao 73
onde 1X i0 suponha que seja conhecida a varincia 2
i ento dividiremos a equao
anterior pelo desvio padro.
i
i
i
i3
3
i
i22
i
i0
i
i
i XXXY Equao 74
o que facilita escrevermos o modelo como:
*
i
*
i3
*
3
*
i2
*
2
*
i0
*
1
*
i XXXY Equao 75
-
46
Neste momento as variveis sofreram uma transformao, tendo sido eliminado
o efeito da varincia heteroskedstica. Assim sendo, estamos em condies de estimar o
modelo aplicando os mnimos quadrados ordinrios. Assim:
2
i
i2*
i
*
i E)(Evar
Equao 76
2i2i
2
i2
i
2*
i
*
i
1E
1)(Evar
sabendo que 2i2iE Equao 77
1)(Evar 2*i*i Equao 78 Onde a varincia dos mnimos quadrados ordinrios generalizados possuem
varincia semelhante a observada pelos MQO ou OLS, que de facto uma constante.
4. A AUTOCORRELAO a) PRESENA, DETENO E MEDIDAS CORRECTIVAS
A semelhana da heteroskedasticidade, na presena da autocorrelao os
estimadores dos MQO continuam sendo os melhores estimadores lineares no viesados
mas no mais possuem a varincia mnima entre todos os estimadores no viesados
O termo Auto-correlao significa correlao entre elementos da mesma srie ao
longo do tempo, todavia, o pressuposto do modelo clssico de que no deve existir
este tipo de perturbaes.
0)(E ji quando ji Equao 79
Todavia quando estivermos em presena deste tipo de perturbao,
contrariamente a hiptese clssica, teremos um cenrio de:
0)(E ji quando ji Equao 80
A ttulo de exemplo, num cenrio destes, a greve que ocorre neste trimestre
afecta o resultado do trimestre seguinte, ou seja um erro cometido durante um mandato
influenciar os mandatos seguintes. De facto este cenrio 0)(E ji o que mais
representa a realidade.
CAUSAS
Uma das caractersticas principais de determinadas sries temporais diz respeito
a Inrcia ou a rigidez. Isto ocorre muitas vezes com os ndices de preos, PNB,
emprego/desemprego e outras variveis que apresentam flutuaes cclicas ao longo do
tempo. Geralmente obedecem uma tendncia, de recesso para perodos de reanimao,
expanso e boom para depois voltar em baixo e seguir novamente o ciclo iterativo.
Outras vezes, a especificao errnea do modelo ou a omisso de determinadas
variveis de destaque, constitui razo de existncia da auto-correlao.
Tambm salientam-se casos como o fenmeno cobb-web (teia de aranha) no
qual a oferta de produtos agrcolas reage aos preos com uma defasagem de um perodo.
-
47
121 tt PBananasOferta
Equao 81
A manipulao de dados, sobretudo quando se tem dados brutos ao invs de
dados regulares. Circunstncias nas quais se tomam dados brutos de um trimestre e
calcula-se a mdia para criar sries mensais, em muitos dos casos factor causador de
auto-correlao.
Alguns autores como Tinter distinguem o termo auto-correlao do termo
correlao serial, embora nos paream ter o mesmo significado, existe uma pequena
diferena. A autocorrelao a srie desfasada consigo mesma segundo um nmero de
unidades de tempo. Quando o termo correlao serial diz respeito a defasagem de sries
diferentes.
NATUREZA AR(i) e MA(i)
Os modelos com auto-correlao na varivel dependente denomina-se modelos
auto-regressivos. Exemplo:
ti3i21t10i ICRNRN Equao 82
uma representao mais comum, o caso da regresso do erro
t1tiu Equao 83
onde o coeficiente de correlao. Neste contexto, o modelo pode ser designado
como modelo auto-regressivos de ordem um AR (1).
Quando estivermos em presena de uma funo do erro dependendo de
componentes com desfazagem, porem sendo estas perturbaes aleatrias com mdia
zero, dizemos que estamos em presena de um esquema de mdia mvel -MA (1)
1ttiu Equao 84
Tambm podemos representar modelos com combinaes AR e MA,
designando-os ARMA (1,1)
1tt1tiu Equao 85
MEDIDAS CORRECTIVAS
Em presena de auto-correlao, os estimadores continuam sendo MELNV
porm no mais possuem varincia mnima, o que quer dizer que deixam de ser
eficientes. Se utilizarmos a 1AR2 )var( , os intervalos de confiana tendem a ser muito
amplos, tornando difcil a rejeio da hiptese nula.
Considerando que o erro no conhecido, a questo da auto-correlao muitas
vezes fruto de especulaes. O remdio depende em grande parte do conhecimento
tido quanto as interdependncias entre as distintas variveis, pois lidaremos com duas
situaes, uma quando a estrutura da correlao conhecida, outra, quando ela no
conhecida.
Quando o coeficiente de correlao conhecido, tomaremos uma FRP valida no
perodo t todavia tambm no perodo t-1. tal que:
tt2ti XY
-
48
1t1t2i1t XY Equao 86
multiplicando a FRP desfasada pelo coeficiente de correlao em ambos os lados,
teramos.
1t1t2i1t XY Equao 87
Subtraindo da funo primaria da equao 86 a da equao 87 teramos:
)(XX)1(YY 1tt1t2t2i1tt
t1tt2i1tt )XX()1(YY Equao 88
agora assumimos um modelo
t
*
t
*
2
*
1
*
t XY Equao 89
no qual, )XX(X);1();YY(Y 1tt*
t1
*
11tt
*
t
Neste contexto, o resduo respeita todas as premissas bsicas dos MQO, sendo
possvel estimar a equao 89 sem risco de vis.
Sempre que tivermos conhecimento da dimenso da correlao, bastar aplicar
diferenas ao modelo, reduzindo-o para tt2t XY , operao na qual ao aplicar
o operador da primeira diferena (delta) perdemos o intercepto. Nestas condies,
semelhantemente, podemos estimar o modelo fazendo recurso ao mtodo dos MQO.
b) TESTES DE HIPTESES
Durbin Watson
O teste de DW um dos testes tradicionais para testar a presena de auto-
correlao. Ele baseia-se nos resduos e obedece uma distribuio estatstica especfica,
na qual so considerados os pontos de significncia superior e inferior. Quanto aos
graus de liberdade, o parmetro k no considera o intercepto da funo. O teste DW no
deve ser aplicado em modelos auto-regressivos. O teste tem a seguinte frmula de
clculo:
n
1t
2
t
n
2t
2
1tt
e
ee
d Equao 90
Para o uso dos valores crticos tabelados de DW, devemos seguir o seguinte
diagrama que nos sugere em que circunstancias a correlao positiva, negativa, ou
quando que no possvel detecta-la.
Ilustrao 5 reas de deciso do teste de Durbin Watson
-
49
5. ELEMENTOS CHAVE DA AUTOCORRELAO
1. A autocorrelao pode ocorrer por varias razes, pode ser derivada por inrcia ou rigidez das
sries temporais econmicas, vis resultante da omisso de variveis importantes, ou por uso
da forma funcional incorrecta, o fenmeno cobb-wed, a da teia de aranha ou ainda a
manipulao dos dados.
2. Embora os estimadores de MQO permaneam no-viesados e consistentes na presena de
autocorrelao, eles deixam de ser eficientes. Como resultado, os testes de significancia t e F
usuais no podem ser legitimamente aplicados. Por isso, so necessrias medidas correctivas.
3. o remdio depende da natureza da interdependncia entre as perturbaes U t Mas como Ut no so observveis, a prtica comum supor que sejam geradas por algum mecanismo.
4. o mecanismo comummente suposto o esquema auto-regressivo de primeira ordem de Markov,
que supe que a perturbao no perodo corrente se relaciona linearmente com o termo de
perturbao no perodo anterior, sendo que o coeficiente de autocorrelao fornece o grau da
interdependncia. Este mecanismo conhecido como esquema AR(1).
5. Se o esquema AR(1) for vlido e o coeficiente de autocorrelao for conhecido, o problema da
correlao serial pode ser facilmente atacado por meio da transformao dos dados seguindo o
mtodo da diferena generalizada. O esquema AR(1) pode ser facilmente generalizado para um
esquema AR(p). Podemos tambm supor um mecanismo de mdia mvel (MA) ou uma mescla
dos esquemas AR e MA, conhecida como ARMA.
6. Mesmo que usemos um esquema AR(1), o coeficiente de autocorrelao p no conhecido a
priori. Examinamos vrios mtodos para estimar p, tais como d de Durbin-Watson, d modificado
de Theil-Nagar, mtodo de Cochrane-Orcutt (C-O) em duas etapas, mtodo C-O iterativo e o
mtodo de Durbin em duas etapas. Em grandes amostras, estes mtodos geralmente produzem
estimativas similares, mas no em pequenas amostras. Na prtica, o mtodo C-O iterativo se
tornou bastante popular.
7. Naturalmente, antes de corrigir a autocorrelao, preciso detect -la. H diversos mtodos de
deteco, dos quais o mais clebre a estatstica d de Durbin-Watson. Embora comummente
usada e rotineiramente produzida pela maioria dos pacotes de software, a estatstica d apresenta
vrias limitaes. Muitas vezes, a estatstica d indica no uma autocorrelao pura, mas sim um
vis de especificao ou o efeito ARCH.
8. Um modelo especial no discutido no nosso programa o modelo ARCH (Autoregressive
Conditional Heteroskedatic Model) , no qual a varincia condicional do termo de erro se
correlaciona serialmente com os valores passados do termo de erro elevados ao quadrado. Este
modelo provou ser muito til na modelagem e previso de muitas variveis financeiras, tais
como taxas de cmbio, taxas de inflao etc. Usar-lo-emos na cadeira de Mtodos de Previso.
-
50
VII. TPICOS QUALITATIVOS
i. A REGRESSO DE VARIVEIS DUMMIES No mbito da anlise de regresso, existem variveis que no so facilmente
quantificveis numa escala definida. Estas variveis quase frequentemente so
denominadas por variveis qualitativas, tambm designadas por variveis dummies. A
ttulo exemplificativo, num determinado modelo, mantendo todas as variveis
constantes, se estivermos a tratar do rendimento, notaremos que o sexo feminino tende
para alguns casos a auferir salrios inferiores aos seus colegas do sexo masculino.
Assim sendo, para a anlise do rendimento, veremos que este difere na medida em que
mudar o gnero. A este tipo de anlise, diz respeito o tratamento das variveis dummies.
As variveis qualitativas geralmente indicam a presena ou a ausncia de uma
qualidade ou atributo. Em termos numricos, elas assumem valores de 1 ou de 0,
servindo de indicadores alternativos variveis dicotmicas, variveis qualitativas, variveis binrias.
1. INCIDNCIA NO INTERCEPTO
Tomemos como referncia um modelo de uma varivel, tendo o rendimento
salarial como funo dos anos de experincia acumulada. Nota-se porem que, no
obstante os anos de experincia, h sempre uma tendncia ao longo da populao,
encontrar valores que diferem, podendo estar por detrs varias causas como, origem
regional, etnia, raa, ou gnero.
Vejamos o modelo abaixo:
iiiii uXDY 211
Equao 91
11
Nota que na verdade a incluso das variveis dummies implicaria ter as duas categorias, para o caso do rendimento como funo da oferta de trabalho de
professores, incluiramos duas categorias, ilustrando a demanda de professores
quando tratam-se de homens e mulheres, tal que o modelo apareceria do seguinte
modo: iiiiii uXDDY 2312
Tal que teramos:
contrriocaso
mulheresforseD
contrriocaso
emforseD
i
i
0
1
0
hom1
2
1
Entretanto, devido ao problema da multicolinearidade, no inclumos as duas
categoria, inclumos apenas uma, no principio de que tomando o numero de
categorias existentes, deveremos sempre deduzir uma. No nosso caso simples, a
excluso de uma categorias, ser coberta pela outra categoria na medida em que
o seus valores so exactamente o inverso da outra categoria.
Imagine que tivssemos uma amostra com trs observaes de homens, e
duas para mulheres, teramos a a apresentao do seguinte modo.
Intercepto D1 D2 X1
Homem Y1 1 1 0 234
Homem Y2 1 1 0 434
Mulher Y3 1 0 1 325
Homem Y4 1 1 0 543
Mulher Y5 1 0 1 278
Note que este modelo tem problemas de multicolinearidade, porque a soma
dos vectores D1 e D2 perfeitamente igual ao vector do intercepto, logo
estaramos em presena de colinearidade perfeita. Para este caso, devemos
excluir uma das variveis dummies, ou seja uma categoria da varivel dummy e
to logo poderemos estimar o modelo.
Quanto ao resultado da regresso saberemos a partida que o valor do
intercepto s ditaria os valores que a intercepto toma quando consideramos
-
51
Neste caso, a nossa varivel adicional expressa por D a varivel dummy. Esta
toma dois valores diferentes. Se tratar-se de um homem, tomar o valor de 1 e se tratar-
se de uma mulher, tomara o valor de 0.
De outro modo, formulando o modelo em relao ao valor convencional de Y
em relao a X, teremos:
ii uXDYE 1)0|( Modelo representativo para as Mulheres
ii uXDYE )()1|( 21 Modelo representativo para os Homens.
Como pode notar, as duas variantes de alfa, representam o termo intercepto,
logo, estamos em presena do efeito dummy sobre o intercepto.
Ilustrao 6 Demonstrao da Variao do Intercepto termo, numa funo onde
o salrio funo dos anos de experincia.
Uma varivel dummy pode apresentar mais de duas categorias. Sempre que
assim suceder, no acto da formulao do modelo, deduzimos sempre uma categoria (m-
1).
2. INCIDNCIA NO PARMETRO DE INCLINAO
A abordagem da inferncia das variveis dummies na inclinao da linha de
regresso est estreitamente correlacionada como a abordagem do teste de chow.
Lembre-se que o teste de chow diz respeito a averiguao da existncia ou no de
estabilidade estrutural, comparando duas regresses. Quando no existe estabilidade
estrutural, quer dizer que a duas regresses em anlise possuem graus de inclinao
diferentes. O mesmo seria tambm dizer que existe uma alterao da tendncia da linha
de regresso ao longo do perodo, isto seria o mesmo que admitir a existncia de uma
varivel independente cujo valor correlaciona-se com uma varivel dummy, ao ponto
desta varivel tomar valores diferenciados em funo do efeito dummy.
Considere que para o teste de chow, juntamos as duas regresses possveis e
expressamo-las no modelo abaixo:
apenas mulheres. Ao passo que se adicionarmos a este a varivel seguinte-D1 (a
dummy na sua primeira categoria) estaramos obtendo os valores do intercepto
considerando os homens.
Para livrar-se da armadilha da varivel dummy, tambm se usa um
artificio avanado que o de incluir o numero inteiro de categorias, todavia
eliminando o termo intercepto.
-
52
iiiiii uDXXXY )(....*
223220 Equao 92
Onde Y= representa por hipoteticamente rendimentos de firma da gua da
Chela,
Por hiptese poderamos ter uma varivel X1. Representando os gastos de
explorao, todavia, deixamos omissa para efeitos didcticos.. X2 =Volume de vendas geradas
*
2X Valor limiar das vendas, tambm designado como n, (conhecido de ante
mo). Tal que: D=1 se X2>*
2X
D=2 se X2