Econometria Material de 2015

54
1 UNIVERSIDADE CATÓLICA DE ANGOLA E E C C O O N N O O M M E E T T R R I I A A Por: Armando Manuel MSc Amália Quintão - MSc Albertina Dekgado-MSc Carlos Vasconcelos- MSc 2015

description

Resumo

Transcript of Econometria Material de 2015

  • 1

    UNIVERSIDADE CATLICA DE ANGOLA

    EECCOONNOOMMEETTRRIIAA

    Por: Armando Manuel MSc Amlia Quinto - MSc

    Albertina Dekgado-MSc Carlos Vasconcelos- MSc

    2015

  • 2

    Introduo

    O QUE A ECONOMETRIA

    A econometria pode ser definida como a anlise quantitativa de fenmenos econmicos concretos, baseada no desenvolvimento simultneo de teoria e da

    observao, relacionadas por mtodos de inferncia adequados.'

    A econometria, consiste na aplicao da estatstica matemtica aos dados econmicos para dar suporte emprico aos modelos construdos pela economia

    matemtica e para obter resultados numricos.

    A econometria pode ser definida como a cincia social na qual as ferramentas da teoria econmica, matemtica e inferncia estatstica so aplicadas anlise dos

    fenmenos econmicos.

    A econometria se ocupa da determinao emprica das leis econmicas.

    A arte do econometrista consiste em achar o conjunto de hipteses que sejam tanto suficientemente especficas quanto realistas, para lhe permitir tirar o

    mximo proveito possvel dos dados sua disposio.'

    Os econometristas... prestam uma inegvel contribuio tentativa de afastar a pobre imagem pblica da economia (quantitativa ou no), tida como um assunto

    no qual latas vazias so abertas, supondo a existncia de abridores de lata, para

    revelar.

    O principal interesse da economia matemtica expressar a teoria econmica na forma matemtica (equaes), sem levar em conta a imensurabilidade ou a

    verificao emprica da teoria. J a econometria, como destacamos

    anteriormente est interessada na verificao da verificao emprica da teoria;

    SOBRE A METODOLOGIA

    Embora as questes de metodologia tm sido objecto de constantes criticas e sugestes,

    a abordagem clssica apresenta 7 passos ou eixos sequenciais que nos sugerem a

    metodologia de estudo da econometria:

    o Formulao da teoria ou da hiptese o Especificao do modelo matemtico da teoria o Especificao do modelo economtrico da teoria o Obteno de dados o Estimativa dos parmetros do modelo economtrico o Teste de hiptese o Previso ou predio

    1. ASPECTOS CONCEITUAIS a) REGRESSO

    O termo regresso foi introduzido por Francis Galton num estudo relacionado a hereditariedade, no qual descobriu a tendncia dos filhos nascerem com caractersticas

    prximas as dos pais. Outros nomes adicionados a estas descobertas, dizem respeito a

    Karl Pearson que encontrou resultados robustos ao verificar que a altura mdia de filhos

    pertencentes a um grupo de pais baixos era superior altura de seus pais.

  • 3

    A anlise de regresso diz respeito ao estudo da dependncia de uma varivel em

    relao a uma ou mais variveis cujo comportamento independente. Este estudo visa

    determinar o valor mdio da varivel dependente.

    b) CORRELAO

    A relao de correlao o processo no qual medimos a intensidade da relao

    existente entre duas variveis, sempre que desenvolvermos um clculo de regresso, o

    coeficiente de ajustamento do modelo, permite-nos obter a noo do grau de correlao

    entre ambas as variveis. Podemos dizer, que trata-se do grau de associao linear.

    Na anlise de correlao no se estabelece distino entre variveis dependentes

    ou independentes, como fizemo-lo na anlise de regresso. Numa situao de correlao

    baseamo-nos numa hiptese de aleatoridade enquanto que para a anlise de regresso

    consideramos a aleatoridade apenas para a varivel dependente contrariamente as

    vaiveis independentes em cujo valores so fixados e ou no-estocstico.

    c) CAUSAO

    A regresso explica a relao de dependncia entre uma varivel e outra. Este

    tipo de relao consiste numa relao meramente estatstica, que no obstante permitir

    encontrar uma relao, no implica necessariamente uma relao de causao.

    A teoria econmica faz referncia a Causalidade de Granger

    d) RELAO DETERMINISTA E ESTOCSTICA

    No estudo do comportamento das variveis, encontramos variveis cujo

    comportamento obedece tendncias probabilsticas. Estas variveis seguem um

    comportamento aleatrio tambm chamadas variveis estocsticas. Exemplo:

    pluviosidade, a temperatura ambiental, queda de aeronaves soviticas em Angola etc.

    Quando nos referimos a relaes determinsticas, tratam-se de relaes nas quais

    intervm variveis cujo comportamento determinstico e no aleatrio. Exemplo: Lei

    de gravidade de Newton, Nascimento de um ser como resultado da fecundao de

    espermatozoides etc...

    Alguns Conceitos Sinnimos:

    Varivel Endgena Varivel Exgena

    Varivel de Resposta Varivel de Estimulo ou Controlo

    Regredida Regressor

    Predita Preditor

    Varivel Explicada Varivel Explicativa

    Varivel Dependente Varivel Independente

    2. A NATUREZA E A FONTE DOS DADOS

    Os tipos de dados existentes para o trabalho emprico sries temporais, dados

    cross-secionais, dados qualitativos, e ainda dados de painel.

    So dados qualitativos quando no acto da colheita tomamos uma categoria ou um

    atributo cujo resultado toma o valor 1 ou 0 exemplo: homem ou mulher, empregado ou

    desempregado. A este tipo de dados tambm chamamos por dummies.

  • 4

    Na maior parte dos casos, os economistas fazem recurso ou uso de sries de

    variveis temporais. Na maior parte das sries temporais econmicas apresentam um

    comportamento dinmico isto , a sua media e varincia tendem ambas a variar em

    funo do tempo.

    Os dados cross-seccionais, tambm chamados por dados de corte, so dados de uma ou mais varivel colectados ano mesmo ponto de tempo. Uma grande implicao

    das sries cross-seccionais, diz respeito a heterogeneidade forada por hiatos no

    tamanho e no efeito de escala.

    Por outro lado, existem situaes nas quais consideramos a combinao de dados

    de sries temporais e de dados cross-seccionais.

    Dados Em Painel, tambm conhecidos como panel data, so informaes de

    unidades, indivduos ou empresas, por exemplo, que podem ser acompanhadas ao longo

    do tempo. Mas os mtodos de anlise tambm podem ser aplicados, com as devidas

    consideraes, a diferentes sries de dados observados em duas dimenses, por

    exemplo, observar as unidades, como empresas, em diferentes estados, ou pases.

    Quanto a fontes dos dados, estes podem ser colectados por agncias

    governamentais ou independentes. E os dados colectados podem ser experimentais ou

    no-experimentais. Todavia os dados colectados no domnio das cincias sociais so

    quase sempre no-experimentais o que pressupe dizer que so dados em que o

    pesquisador no consegue exercer influncia significativa.

    A preciso dos dados constitui um outro factor importante. Certamente que a

    colecta de dados raramente ilustra 100% da realidade; quase sempre ocorrem erros de

    observao, omisso e ou execuo. Porm do esforo em aproximar os dados

    estatsticos realidade especfica, um factor muito importantssimo.

    3. ELEMENTOS CHAVE DOS CONCEITOS BSICOS

    1. A ideia chave da anlise de regresso a dependncia estatstica de uma varivel (a varivel dependente) em relao a uma outra ou outras variveis (as variveis explicativas).

    2. O objectivo desta anlise estimar e/ou prever a mdia ou o valor mdio da varivel dependente, com base nos valores conhecidos ou fixados das variveis explicativas.

    3. Na prtica, o sucesso da anlise de regresso depende da disponibilidade de dados

    apropriados. Este captulo discutiu a natureza, as fontes e as limitaes dos dados que

    geralmente esto disponveis para pesquisa, especialmente nas cincias sociais.

    4. Em qualquer pesquisa, o pesquisador deve informar claramente as fontes dos dados

    utilizados na anlise, suas definies, seus mtodos de colecta e quaisquer lacunas ou

    omisses nos dados, bem como quaisquer revises dos dados. Lembre-se de que os

    dados macro-econmicos publicados pelo governo so frequentemente revistos..

  • 5

    II. A REGRESSO SIMPLES

    1. A FUNO DE REGRESSO POPULACIONAL (FRP)

    Diremos que geometricamente, a curva de uma funo de regresso o espao

    geomtrico onde as mdias ou expectativas condicionais das variveis dependentes para

    os valores fixados da varivel explicativa;

    )X(f)XY(E ii Equao 1

    Onde X uma funo explicativa e Y a varivel explicada, linear em X.

    Chamaremos assim a equao 1 como funo de populao de regresso (FPR) de

    duas variveis. Assim, assumindo que X pode tomar valores nulos, podemos transcrever

    a FPR em

    i21i X)XY(E Equao 2

    onde os parmetros beta um e beta dois so desconhecidos, todavia fixos e chama-

    se coeficientes de regresso. Tambm so conhecidos como intercepto e coeficiente de

    inclinao, respectivamente.

    O objectivo presente consiste em estimar os parmetros desconhecidos da FRP

    descrita na equao N 2.

    2. PROPRIEDADES a) A LINEARIDADE

    Assumimos que a nossa FRP linear, o que significa que a expectativa

    condicional de Y em relao a X consequncia de uma funo linear, podendo esta ser

    representada geometricamente por um grfico.

    Semelhantemente, a FRP linear nos parmetros, ou seja a expectativa

    condicional de Y em relao a X linear nos parmetros. Todavia, se obtivermos uma

    funo do tipo 2

    i21i X)XY(E ela continua sendo linear nos parmetros embora

    no seja na varivel. Todavia, um caso como i21i X)XY(E no um modelo

    de regresso linear nos parmetros.

    Consideraremos um Modelo de Regresso Linear (MRL) i21i X)XY(E

    todo aquele modelo onde )XY(E i linear quer nos parmetros como nas variveis.

    b) A ESPECIFICAO ESTOCSTICA

    Consideremos que dada a varivel Y e a sua estimativa condicional em relao a

    Y, ocorrer sempre um desvio a que chamaremos o erro termo, a perturbao

    estocstica ou ainda o white noise :

    iii )XY(EY Equao 3

    Alternativamente, podermos escrever da seguinte maneira iii )XY(EY e

    consequentemente ii21i XY

    Assim sendo o primeiro elemento do lado esquerdo ser o elemento sistemtico ou

    determinstico, e o segundo termo, corresponde ao componente assistemtica ou

  • 6

    aleatria, cuja propriedade facilmente podemos obter quando aplicamos expectativas em

    ambos os lados da equao condicional a X:

    )X(E)XY(EE)XY(E iiii Equao 4

    )X(E)XY(E)XY(E iiii

    note que para que a igualdade vigore, necessrio que )X(E ii seja igual a zero

    0)X(E ii Equao 5

    Neste contexto, considerando que ao extrapolar o caso para a vida prtica,

    encontraremos variveis sendo explicadas por outras, o termo erro i representar

    sempre aqueles factores no considerados na explicao da varivel dependente. Isso

    pode ser o caso de variveis omissas.

    c) A PERTURBAO ESTOCSTICA E A FUNO DE REGRESSO AMOSTRAL

    Para alm do aspecto da omisso de variveis destacado no ponto anterior, existem

    outros factores que justificam a razo de existncia da perturbao estocstica no nosso

    modelo, apontando-se:

    1. Inexactido da teoria 2. Escassez de dados 3. Forma funcional errada 4. Casualidade intrnseca ao comportamento humano 5. Variveis fracas 6. Principio da parcimnia e 7. Variveis essenciais versus variveis perifricas

    Considerando a aleatoriedade do erro, a representaes de uma funo de

    regresso populacional para varias amostragens, da origem a chamada funo de

    regresso amostral (FRA), tal que a amostra da equao 2 pode ser representada por:

    ii XY 21 Equao 6

    onde o Y estimador de )XY(E i , beta um chapu estimador de 1 e beta dois

    chapu o estimador de 2 .

    Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas

    equaes 2 e a extenso da equao 3, teremos:

    ii21iXY Equao 7

    em sntese, conclumos que o nosso principal objectivo consiste em determinar

    FRP ii21i XY dada a funo amostral FRA. ii21i XY

    Adicionalmente podemos ainda apresentar FRA do seguinte modo:

    iiiYY Equao 8

    e em termos de FRP

  • 7

    iii )XY(EY Equao 9

    3. MNIMOS QUADRADOS ORDINRIOS OLS a) ACESSIBILIDADE DOS MQO-OLS;

    Conforme referido anteriormente, constitui objecto principal testar a FRP tendo

    como referncia a FRA. Dos enumeras mtodos existentes1, vamos aqui considerar o

    mtodo dos quadrados mnimos MQO tambm denominado por Ordinary Least Squares

    OLS desenvolvido pelo matemtico Alemo Car Friederich Gauss.

    O mtodo em causa baseia-se nos princpio dos mnimos quadrados.

    Sabe-se que a FRP ii21i XY no directamente observvel, o que

    ns conhecemos sim ii21i XY conforme as equaes 6 e 7 o elemento

    erro ou resduo dado pela diferena do Y observado e Y estimado.

    iii YY Equao 10

    i21i XY

    O interesse consistir neste caso em determinar a FRA mais prxima do Y

    observado , o que em outras palavras pressupe dizer que quanto menor for resduo

    quadrado melhor ser. iii YY . Note que o critrio MQO consiste em minimizar a soma do erro. Porm, veja na figura, a soma do erro 4321 e,, nula,

    dada a sua assimetria. Entretanto, ns estamos mais interessados no quadrado da

    soma, pois fazendo assim tornamos os valores negativos em positivos e o interesse

    consistir em encontrar o menor valor possvel o que em outras palavras significa obter

    resduos mais prximos da FRA.

    Ilustrao 1 Demonstrao do critrio dos mnimos quadrados.

    1 Existem os mtodos da Mxima Verosimilhana, OLS-two stage, Equaes simultneas e outros.

  • 8

    Assim sendo, tomamos a equao 10 e aplicamos sobre ela o quadrado.

    2ii2i YY Equao 11

    2

    i21i XY

    Em outras palavras podemos dizer que o resduo quadrado funo dos

    estimadores. Quanto maior for o grau de significncia dos estimadores, maior a

    probabilidade de se obter um resduo quadrado menor. 212i ,f .

    Abaixo temos um exemplo hipottico no qual assumimos inicialmente que 1 =

    2.752 e 2 =1.673 com estes estimadores e conhecendo a srie de X, estimamos a

    populao real ou seja, obtemos iY na coluna (3) uma vez conhecido iY , determinamos

    i na coluna (4) efectuando a diferena entre as colunas (1) e (3) conforme a equao

    10. Seguidamente a coluna (6) representa a aplicao da equao 11 obtendo um

    115460.104 2i . No segundo cenrio, assumimos novos valores para os parmetros de estimao 1 =3 e 2 = 1 o que permite encontrar um quadrado da soma do resduo

    14 2 i inferior ao obtido no cenrio inicial.

    Yi Xi Y1i chapeu ui1 chapeu

    ui1 chapeu Quadado Y2i chapeu ui2 chapeu

    ui2 chapeu Quadado

    1 2 3 4 5 6 7

    5 1 4.4250 0.5750 0.330625 4.0000 1 1

    8 3 7.7710 0.2290 0.052441 6.0000 2 4

    10 7 14.4630 -4.4630 19.918369 10.0000 0 0

    12 11 21.1550 -9.1550 83.814025 14.0000 -2 4

    35 22 -12.814000 104.115460 1 9

    Tabela 1 Determinao Experimental da FRA

    Assim, podemos representar a equao computada em (3) e (6) como:

    ii1 X673.1752.2Y e ii1 X3Y respectivamente.

    b) HIPTESES BSICAS DO MODELO;

    Veremos agora as hipteses bsicas do Modelo Clssico de Regresso Linear (MCRL),

    que de uma forma mais avanada, infere as hipteses enunciadas por Gauss Markov.

    Hiptese 1 - Modelo de Regresso Linear - O modelo linear nos

    parmetros conforme mostrado em ii21i XY ;

    Hiptese 2 - Os valores de X so fixados em amostras iterativas Os valores assumidos pelo regressor X so considerados fixados

    em repetidas2 amostras. A varivel um dado no estocstico.

    Hiptese 3 - O valor mdio do resduo i nulo Dado o valor X, o

    valor esperado da perturbao residual i zero. 0XE ii 2 Para o caso especifico dos experimentos de Monte Carlo, considerando que o resduo segue uma distribuio aleatria, conforme veremos adiante.

  • 9

    Hiptese 4 -Homoskedasticidade ou varincia igual de i - Dado o valor

    da varivel independente, a varincia de i invariante ao

    tempo.

    2i2i

    2

    iiiii

    XE

    XEEXvar

    3

    Hiptese 5 -No existe autocorrelao entre as perturbaes4 e, entre a

    perturbao i e a varivel independente X. Dados dois

    valores ji ueu tal que ji a correlao entre quaisquer valores residuais de perodos distintos zero.

    0

    XXE

    XEXEEX,X,cov

    jjii

    jjjiiijiji

    0

    oestocasticnoXEondeXEEXE

    XEXE

    XEXEEX,cov

    iiiii

    iji

    iiiiiii

    Hiptese 6 - O nmero de observaes n deve ser superior ao nmero de parmetros

    5.

    c) PROPRIEDADES DOS ESTIMADORES- GAUSS MARKOV THEOREM;

    GAUSS MARKOV dadas as hipteses bsicas do modelo clssico de regresso linear, os estimadores por mnimos quadrados ordinrios so os

    melhores estimadores lineares no enviesados MELNV com

    varincia mnima.

    Com ajuda das hiptese bsicas do modelo clssico e do teorema de Gauss

    Markov, os estimadores dos mnimos quadrados apresentam algumas propriedades

    bsicas dentre as quais:

    1. Os estimadores OLS so lineares; 2. Os estimadores OLS no so viesados (unbiesed), isto quer dizer que o

    valor esperado da estimativa de beta iE converge ao seu valor real i.

    3 Lembre-se que para o desdobramento, aplicamos a hiptese 4. Sempre que a varincia alterar em funo do tempo, estaremos em presena da

    Heteroskedasticidade. 4 Trata-se da ausncia da autocorrelao ou da correlao serial.

    5 A esta hiptese juntam-se as hipteses da necessidade de suficiente variabilidade nas variveis independentes (necessidade de um nmero positivo

    finito )Xvar( - hiptese da multicolinearidade), assim como a hiptese de que o modelo foi correctamente especificado retira-se a hiptese de existncia de

    um vis de especificao.

  • 10

    3. Os estimadores OLS so eficientes possuem a varincia mnima a nvel da classe dos estimadores lineares.

    Ilustrao 2 Distribuio amostral de 2 e

    *

    2

    O grfico demonstra a distribuio amostral de dois estimadores. Onde 2 MELNV.

    d) DETERMINAO DOS ESTIMADORES

    (i) Derivao dos estimadores por OLS (modelo univarivel)

    Como derivar a estimativas dos mnimos quadrados? Tomamos a funo

    expressa na equao 11 e determinamos as derivadas parciais em relao a i e 2 .

    ii21i

    1

    2

    i2XY2

    Equao 12

    iii21i

    2

    2

    i2XXY2

    Equao 13

    Resolvendo estas equaes igualando-as a zero e efectuando os cortes

    necessrios, resulta em:

    XY 21 Equao 14

    2

    i

    ii

    2x

    yx 6 Equao 15

    (ii) Linearidade e ausncia de vis

    Como provar que os estimadores OLS so de facto MELNV? Tomando a

    equao 15, considerando a anotao feita no rodap, tornamos a funo da estimativa

    de2 como uma funo linear de Y onde:

    2

    i

    ii

    2y

    Yx logo assumimos que i2

    i

    i kx

    x

    , logo escreveremos

    ii2 Yk Equao 16

    6 Lembra-se que esta funo pode ser desdobrada para apresentaes alternativas como

    22i

    ii

    XnX

    Yx ou ainda

    22i

    ii

    XnX

    yX, onde iiii YxyX e finalmente os

    desvios de X e Y em relao a mdia dados por YYy;XXx iiii .

  • 11

    Note agora que a equao 16 apresenta o estimador 2 apresentado como uma

    funo linear de Y dado o valor de k.

    Agora como demonstrar que a o MELNV converge ao seu valor real?

    Assumimos que o somatrio de k nulo, que o somatrio do quadrado de k

    igual 1 sobre o somatrio de x (no seu desvio em relao a media). E finalmente

    1Xkxk iiii

    Vejamos por exemplo provando que o somatrio de k nulo.

    i2

    i

    2

    i

    ii x

    x

    1

    x

    xk considerando que o somatrio do desvio de X

    em relao a mdia nulo, a multiplicao do ltimo termo resulta num valor nulo.

    Agora substitua a FRP ii21i XY na equao 16 resultar em:

    ii21i2 Xk

    iiii2i12 kXkk7

    ii22 k Equao 17 aplicando expectativas na nossa funo teremos:

    ii22 EkE sabendo que o valor esperado do resduo nulo, conseguimos provar que o

    estimador OLS converge ao seu valor real.

    22E Equao 18

    (iii) Varincia e erro padro dos estimadores OLS

    Conhecendo a definio da varincia como sendo o quadrado do valor esperado da

    diferena entre o estimador e o seu valor mdio, escreveremos:

    2222 EEvar Equao 19 usando a demonstrao de convergncia da estimativa ao seu valor real, substitumos

    2E 2222 Evar 2ii2 kEvar 8 n1nn1n21212n2n222221212 kk2kk2k....kkEvar 2i22 kvar

    7 Aplicando as propriedades enunciadas acima, somatrio de k igual a zero e somatrio de k vezes X igual a um.

    8 Lembre-se que a equao 17 pode ser desdobrada sob forma de ii22 k

  • 12

    2

    i

    2

    2x

    var Equao 20

    2

    i

    2

    x

    ep Equao 21

    (iv) Covarincia entre as estimativas de 1 e 2

    Existir correlao entre dois estimadores diferentes 1 e 2 ? Vejamos por definio:

    2211

    221121

    E

    )(E)(EE),cov(

    2

    2

    2221

    varX

    EX),cov(

    Equao 22

    Consequentemente teremos

    2i

    2

    21x

    X),cov( Equao 23

    (v) Propriedades da varincia mnima.

    Lembra-se da equao 16 na qual demonstramos que 2 um estimador linear

    em relao a Y, efectuamos algumas consideraes para k. Consequentemente,

    podemos representa-las do seguinte modo.

    2

    i

    i

    2

    i

    i

    ix

    x

    XX

    XXk Equao 24

    Agora, no mesmo esprito que a equao 16, achemos estimador alternativo,

    tambm linear em relao a 2 :

    ii

    *

    2 Yw Equao 25

    onde embora w seja um coeficiente linear de beta em relao a Y todavia no

    necessariamente igual a k.

    ii2i1

    i21i

    ii

    *

    2

    Xww

    XEw

    YEw)(E

    agora para que o presente estimador seja no enviesado, necessrio que

    0w i e consequentemente 1Xw ii Semelhantemente, nota que:

    ii*2 Ywvarvar

    i

    2

    i

    *

    2 Yvarwvar

    2i2*2 wvar Equao 26

  • 13

    Tomando a equao 26, podemos introduzir transformaes de formas a atingir

    um resultado desejado:

    2

    2

    i

    i

    2

    i

    i1

    2*

    2x

    x

    x

    xwvar

    22i

    2

    i2

    2

    i

    i

    2

    i

    ii

    2

    2

    2

    i

    ii

    2*

    2

    x

    x

    x

    x

    x

    xw2

    x

    xwvar

    2i2

    2

    2

    i

    ii

    2*

    2x

    1

    x

    xwvar

    2

    i

    2*

    2x

    var Equao 27

    fica assim provado que 2*2 varvar considerando que ii kw , a varincia do estimador linear beta asterisco deve ser igual a varincia do estimador de mnimos

    quadrados.

    4. ELEMENTOS CHAVE DA REGRESSO SIMPLES

    1. A idia-chave que fundamenta a anlise de regresso o da funo de regresso populacional(FRP).

    2. Consideramos a FRP lineares, isto regresses lineares nos parmetros desconhecidos. Elas podem no ser obrigatoriamente lineares na varivel dependente e na varivel independente.

    3. Para trabalhos empricos interessa mais a FRP estocstica.

    4. FRP um conceito idealizado, pois na realidade quotidiana, o que se tem uma observao da populao. Por esta razo utiliza-se a funo de regresso amostral estocstica FRA, para estimar FRP.

    5. A estrutura bsica da anlise de regresso o MCRL, baseado num conjunto de hipteses. Com base nessas hipteses, os estimadores por mnimos quadrados adquirem certas propriedades resumidas no teorema de Gauss-Markov, em que, na classe dos estimadores lineares no-viesados, os estimadores de mnimos quadrados tm mnima varincia. Em suma, eles so MELNV

    6. A preciso dos estimadores por MQO medida por seus erros-padro.

    7. O grau de ajuste global do modelo de regresso medido pelo coeficiente de determinao, 2R . Com ele se tem a proporo da variao na varivel dependente, ou regredido, que

    explicada pela varivel explicativa, ou regressor. Este 2R est entre 0 e 1; quanto mais

    prximo de 1, melhor o ajuste.

    8. Um conceito ligado ao coeficiente de determinao o de coeficiente de correlao, r. uma medida da associao linear entre duas variveis e est entre -1 e +1.

    9. O MCRL uma abstraco ou construo terica, pois se baseia em um conjunto de hipteses que podem ser rgidas ou "irrealistas". Mas tal abstraco com frequncia necessria nos estgios iniciais do estudo de qualquer campo do conhecimento. Uma vez alcanado o domnio do MCRL, pode-se descobrir o que acontece se uma ou mais de suas hipteses no forem satisfeitas.

  • 14

    III. CASOS PRTICOS

    1. TESTE DE HIPTESE E INTERVALOS DE CONFIANA; Para abordagem do teste de hiptese, importa fazer meno a conceitos

    fundamentais como:

    distribuio de probabilidade,

    erros do tipo I ,

    erros do tipo II,

    intervalos de confiana,

    poder de um teste estatstico e

    a) O INTERVALO DE CONFIANA

    Recordando a estatstica II:

    O melhor intervalo para um parmetro ser aquele para o qual a probabilidade de conter

    o valor do parmetro a maior:

    baP Exemplo da mdia populacional:

    baP

    ;~ N

    n

    XVF

    (Varivel fulcral)

    zVFzP

    z

    n

    XzP

    nzX

    nzP

    nzX

    nzXP

    nzX

    nzXP

    nzX

    nzXP

    nzX

    nzXI

    ;

    n

    zXI

    nze

    (Margem de erro)

    eXI

  • 15

    Voltando a matria de econometria:

    Admita que queiramos descobrir quo prximo i de i , para isso tentamos

    descobrir dois nmeros positivos, e , onde posiciona-se entre 0 e 1, de modo a

    que a probabilidade de o intervalo aleatrio 22 ; conter o verdadeiro 2 de a 1 - .

    1)Pr( 222 Equao 28

    Porm note que a equao acima apresentada, reflecte um intervalo aleatrio, j

    que 2 um parmetro desconhecido, a no ser que tenhamos uma amostra especifica e

    obtivermos um valor especifico de 2 .

    Conhecido o estimador dos mnimos quadrados, calculados luz dos

    pressupostos bsicos do modelo clssico; normalmente distribudo com esperana nula

    e varincia conhecida, e consequentemente o desvio padro, a estatstica de t seguindo a

    distribuio de t student calculada do seguinte modo:

    estimadordoestimadopadroerroparmetroestimador

    ep

    t

    i

    ii

    Equao 29

    onde t segue uma distribuio de n-2 gl , portanto, em vez de usarmos a

    distribuio normal, usamos as distribuio de t estabelecendo um intervalo de

    confiana para 2 tal como se segue:

    1)tttPr( 22 Equao 30

    onde 2t o valor da varivel i obtido da distribuio t para o nvel de

    significncia 2

    e 2n graus de liberdade; tambm chamado por t critico que se

    pode encontrar na tabela.

    1tep

    tPr 2

    i

    ii2 Equao 31

    Assim que se desejar calcular o intervalo de confiana, tomar a frmula:

    i2i ept Equao 32

    A interpretao deste intervalo dada pelo intervalo de confiana de 95% ao

    longo prazo, tal que 95 a 100% dos intervalos como (0,4268; 0,5914) contero o

    verdadeiro 2 . Sabe-se ainda que a amplitude do intervalo de confiana proporcional

    ao erro padro do estimador. Quanto maior este for o erro padro maior ser a amplitude

    do intervalo.

    b) FRMULAO DAS HIPTESES NULAS E ALTERNATIVAS

    A questo da formulao das hipteses estatsticas, relaciona-se aos casos nos

    quais, dada uma observao, nos perguntamos at que ponto ela compatvel com a

  • 16

    hiptese previamente formulada. Estatisticamente a hiptese formulada conhecida

    como hiptese nula 0H . Geralmente ela testada seguida de uma hiptese alternativa

    AH por vezes tambm designada por hiptese sustentada.

    Exemplo:

    0:H0:H 2A20 Equao 33

    Uma vez construdo o intervalo ou detectado os valores crticos para o nvel de

    significaria achado pertinente, caso 2 cair na rea de )%1(100 , no rejeitar a

    hiptese nula. Porm caso cair fora, na considerada rea critica, deve-se rejeitar a 0H .

    Este tipo de teste um teste bicaudal.

    Equao 34 Intervalo de Confiana de 100 (1- )% para 2

    Quando rejeitamos a hiptese nula, dizemos que estamos em presena de

    resultados estatisticamente significantes. Porm, quando no rejeitamos, os resultados

    no so estatisticamente significantes.

    Tabela de Deciso para o Teste de Hiptese

    Tipo de hiptese 0H : Hiptese Nula 1H : Hiptese

    Alternativa

    Regras de deciso:

    rejeitar 0H : se

    Duas caudas 2 =

    *

    2 2 *

    2 gl,2/tt

    Cauda a direita 2

    *

    2 2 >*

    2 gl,2/tt

    Cauda a Esquerda 2

    *

    2 2 1 implica que 2R > 2R

    d) A VARINCIA E A MATRIZ VARINCIA COVARINCIA

    Considere o vector de estimadores dos mnimos quadrados ordinrios e faamos um

    desenvolvimento preliminar:

    uXXX

    uXXXXXXX

    )uX(XXX

    1

    11

    1

    implica que,

    uXXX 1 Equao 60

    Determinemos agora a varincia da covarincia:

    9 Lembre-se que anteriormente referenciamos que o coeficiente de determinao tambm pode ser

    apresentado como:

    2

    i

    2

    i2

    y

    1R ;

    SQT

    SQR1R 2

  • 26

    uXXXuXXXE

    E)cov(var

    11

    1111 XXXuuEXXXXXXuuXXXE 121 XXIXXXX

    finalmente obtemos a matriz varincia covarincia:

    12 XX)cov(var Equao 61 na verdade a equao apresentar-se-ia do seguinte modo,

    1

    2

    2

    2

    2

    22

    2

    2

    ...

    ............

    ...

    ...

    1...00

    ............

    0...10

    0...01

    )cov(var

    kiikiki

    kiiii

    kii

    XXXX

    XXXX

    XXn

    onde por obedincia das hipteses bsicas, apenas consideramos os valores da coluna

    diagonal esquerda-direita, i.e. as varincias

    Consequentemente, teremos:

    )var(...),cov(),cov(

    ............

    ),cov(...)var(),cov(

    ),cov(...),cov()var(

    )cov(var

    k2k1k

    k2212

    k1211

    De seguida, para o clculo da matriz do erro padro teremos:

    )var(...),cov(),cov(

    ............

    ),cov(...)var(),cov(

    ),cov(...),cov()var(

    )(ep

    k2k1k

    k2212

    k1211

    onde sero vlidos apenas os elementos da diagonal. Note que voc encontrar alguns

    valores negativos fora da diagonal (esquerda direita) e estes no tero raiz quadrada. ~

  • 27

    6. EXERCCIO: ILUSTRAO Dados:

    Ordem Qtid lbs Pre $/lbs Gastos em Propaganda $

    1 55 100 5.5

    2 70 90 6.3

    3 90 80 7.2

    4 100 70 7

    5 90 70 6.3

    6 105 70 7.35

    7 80 70 5.6

    8 110 65 7.15

    9 115 60 7.5

    10 130 55 7.15

    11 130 50 6.5

    Pretende-se:

    1. Provar se os dados conferem com a equao abaixo:

    i3i2ii X237.11X326.1532.117tidQ

    2. Fazer o check up dos sinais esperados 3. Fazer o teste de t para cada parmetro. 4. Calcular o coeficiente de determinao sem tomar em conta os graus de

    liberdade.

    5. Interprete os resultados obtidos

    RESOLUO:

    Primeiro formulmos o modelo:

    uXY

    u

    u

    u

    u

    u

    u

    u

    u

    u

    u

    u

    50.6501

    15.7551

    50.7601

    15.7651

    60.5701

    35.7701

    30.6701

    00.7701

    20.7801

    30.6901

    50.51001

    130

    130

    115

    110

    80

    105

    90

    100

    90

    70

    55

    1x1111

    10

    9

    8

    7

    6

    5

    4

    3

    2

    1

    1x33

    2

    1

    3x111x11

    Calculo da Matriz quadrada XX das variveis exgenas.

  • 28

    5975.4965.516355.73

    5.516357450780

    55.7378011

    50.6501

    15.7551

    50.7601

    15.7651

    60.5701

    35.7701

    30.6701

    00.7701

    20.7801

    30.6901

    50.51001

    5.615.75.715.76.535.63.672.73.65.5

    50556065707070708090100

    11111111111

    Clculo da matriz inversa da matriz quadrada 1XX das variveis exgenas

    5975.4965.516355.73

    5.516357450780

    55.7378011

    ASeja

    Calculamos o determinante:

    DET (A)=83815.75

    Aplicar regra de Crammer neste momento segundo os passos:

    Calcular determinante Calcular a matriz dos coofactores Calcular a matriz ajunta (transp cofactores) Dividir pelo determinante de A

    Elementos da Coluna 1

    51867794.125975.4965.5163

    5.516357450c11

    7570.6255975.4965.5163

    55.73780c21

    Elementos da Coluna 2

    7570.6255975.49655.73

    5163780c12

    52.975975.49655.73

    55.7311c22

    570.55.5163780

    55.7311c22

    Elementos da coluna 3

    -197917.55.516355.73

    57450780c13

    570.55.516355.73

    78011c23

    2355057450780

    78011c33

    -197917.55.516357450

    55.7378031 c

  • 29

    Montamos neste momento a matriz adjunta

    23550570.5197917.5-

    570.552.977570.625

    197917.5-7570.62551867794.12

    AAdj

    Calculamos a matriz inversa, dividindo o determinante a transposta da matriz

    adjunta.

    23550570.5197917.5-

    570.552.977570.625

    197917.5-7570.62551867794.12

    75.83815

    1A 1

    Encontramos a matriz inversa:

    50.2809734470.0068065922.36131340-

    70.0068065910.000631980903246.0

    22.36131340-090324611.022.2845244

    A 1

    Determinamos agora a matriz X y via multiplicao de matrizes, para computar o vector dos parmetros.

    75.7301

    72950

    1075

    130

    130

    115

    110

    80

    105

    90

    100

    90

    70

    55

    5.615.75.715.76.535.63.672.73.65.5

    50505560657070708090100

    11111111111

    yX

    ok, conhecendo a frmula dos estimadores yXXX 1 , podemos calcula-los.

    75.7301

    72950

    1075

    50.2809734470.0068065922.36131340-

    70.0068065910.000631980903246.0

    22.36131340-090324611.022.2845244

    Multiplicando obtm o vector dos estimadores:

    698356216.9

    295842369.1

    7475407.124

    E finalmente montamos a nossa funo estimada:

  • 30

    iiii GP698356216.9P295842369.17475407.124Qtid

    Vamos agora calcular a varincia do erro:

    32775314.33

    8

    1266.622025

    kn

    XXyyuu

    kn

    u2i

    Sabendo que: 12 )XX()cov(var

    50.2809734470.0068065922.36131340-

    70.0068065910.000631980903246.0

    22.36131340-090324611.022.2845244

    32775314.33

    364214.9226849.0698163.78

    226849.0021063.0010316.3

    698163.78010316.3693128.742

    )cov(var

    Assim teramos o vector do erro padro:

    06010026.3

    14512933.0

    2523967.27

    )(

    e as estatsticas de t que nos dizem qual o grau de significncia estatstica

    169294.3

    92888.8

    578223.4

    )(t

    Neste momento, efectuamos o teste de hipteses para avaliar o resultado obtidos:

    Como se pode observar, ao nvel de significncia todos os parmetros so

    poderosa e estatisticamente significantes.

    O Calculo do coeficiente de determinao:

    0.952543012105056.818110675

    2105056.818110408.378

    Ynyy

    YnyXR

    2

    22

  • 31

    7. ILUSTRAO MICROSOFT EXCEL PARA CLCULOS ECONOMTRICOS

    Parte A - Clculo Automtico 1. Considere que lhe foram dadas

    13 observaes trimestrais da quantidade onde as quantidades procuras do referido preo

    julgam-se depender dos gastos com publicidade segundo os

    dados descritos abaixo:

    Data Compras Preo Publicidade

    1999-I 340 48.00$ 234.00$

    1999-II 330 72.00$ 256.00$

    1999-III 370 96.00$ 278.00$

    1999-IV 350 72.00$ 300.00$

    2000-I 380 48.00$ 322.00$

    2000-II 380 144.00$ 344.00$

    2000-III 400 96.00$ 366.00$

    2000-IV 210 168.00$ 388.00$

    2001-I 390 96.00$ 410.00$

    2001-II 400 144.00$ 432.00$

    2001-III 410 72.00$ 454.00$

    2001-IV 230 216.00$ 476.00$

    2002-I 420 192.00$ 498.00$

    2. Para computar estes dados, tenha-nos inseridos numa folha de clculo, tal como se

    visualiza na figura 1. 3. De seguida, v ao menu

    Ferramentas e no final, escolha Anlise de dados, depois de aparecer a janela,

    Analisar dados, escolha Regresso, e de seguida,

    insira os dados como se visualiza na figura 2. Nota que a figura dois possui as

    referencias $B$1:$B$14, $C$1:$D$14 que so as

    coordenadas (coluna-linha) dos dados para a varivel dependente e para as

    variveis independentes respectivamente.

    Figura 1 Dados

    4. Da figura 2, clicando OK, o resultado da analise de regresso para os dados apresentados automaticamente representado na rea comeando pela clula $C$17.- (Sempre que visualizar o $ entre coordenadas, ele usado para

    fixar a clula). Assim sendo os seus resultados bsicos sero apresentados do seguinte modo:

  • 32

    Figura 2 Janela de Insero de dados e definio de pressupostos

    Figura 3 Resultados da Analise de Regresso

    5. Em termos de apresentao da regresso tomaramos os principais dados e apresenta-lo amos do seguinte modo. (Nota que existam varias formas

    de apresentao dos dados, diferindo uma da outra):

    iii PubPQ 499811800204202159928286 ... (76.0136504) (0.42838412) (0.27444772)

    2R =0,36 %; Onde os valores em parntesis representam o desvio padro. Algumas vezes, escrevemos directamente as estatsticas de t para cada um dos coeficientes estimados (assumindo a hiptese nula)ao invs de apresentar o desvio-padro.

    Parte B Clculo Manual Como resolver manualmente o exerccio acima exposto com ajuda do Excel?

  • 33

    1. Cria um ficheiro novo no Excel. V o menu Ficheiro, active guardar como, e

    grave designando-o r-lienar 2. Introduza os dados no espao A1:D14 tal como consta na figura 1.

    Alternativamente, voc poder fazer o download deste ficheiro no website;

    3. Coloque o curso na Coluna C, e v ao menu Inserir, clique coluna criar-se h uma coluna a esquerda do vector do preo.

    4. Escreva Intercepto na clula C1, escreva 1 em cada clula de C2 a C14;

    5. V para a clula B20, escreva Matrix X Transposta.

    6. Seleccione a rea C2:E14, clique no menu Editar, active copiar, de seguida,

    coloque o curso na clula C20 e v para o menu Editar, clique em colar especial.

    Ver uma janela, clique na caixinha junto de transpor, e depois clique em OK.

    Ter assim criada a matriz transposta das variveis independentes.

    7. V para a clula B25, escreva XX, de seguida seleccione a rea (C25:E27), clique na tecla F2 escreva =MATRIZ.MULT(C20:O22,C2:E14) de seguida clique

    simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla

    Enter, assim sendo voc ter a multiplicao da matriz transposta de X pela matriz X.

    8. V para a clula B29, escreva XX Inversa, seleccione a rea (C29:E31), clique F2, escreva =MATRIZ.INVERSA(C25:E27), de seguida clique simultaneamente

    em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter 9. V para a Clula B34, escreva Xy, seleccione (C34:36) a rea posicione o

    cursor, prima F2 e escreva =MATRIZ.MULT (C20:O22,B2:B14), de seguida

    clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a

    tecla Enter 10. V para a clula B39, escreva Betas, seleccione a rea (C39:C41), prima F2 e

    escreva =MATRIZ.MULT(C29:E31,C34:C36), de seguida clique simultaneamente

    em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter, voc ter assim coeficientes no valor exacto dos clculos obtido acima.

    11. Agora confira os seus resultados com os resultados da impresso no verso, para

    averiguar se voc obteve os parmetros estimados conforme.

    iii PubPQ 499811800204202159928286 ...

    0

    50

    100

    150

    200

    250

    300

    350

    400

    450

    19

    99

    -I

    19

    99

    -II

    19

    99

    -III

    19

    99

    -IV

    20

    00

    -I

    20

    00

    -II

    20

    00

    -III

    20

    00

    -IV

    20

    01

    -I

    20

    01

    -II

    20

    01

    -III

    20

    01

    -IV

    20

    02

    -I

    Y estimado Y

  • 34

    V. FORMAS FUNDAMENTAIS DOS MODELOS DE REGRESSO

    Ao mudar unidades de medida das variveis dependente e/ou independente, estimativas

    de MQO so afectadas.

    Se a varivel dependente multiplicada pela constante c(cada valor na amostra multiplicado por c), ento as estimativas de MQO de intercepto e de inclinao

    tambm so multiplicadas por c.

    Se a varivel independente dividida (ou multiplicada) por alguma constante diferente de zero (c) ento o coeficiente de inclinao de MQO multiplicado (ou

    dividido) por c, respectivamente.

    Mudar as unidades de medida da varivel independente no afecta o intercepto.

    O grau de ajuste do modelo (R2) no depende das unidades de medida das variveis.

    Formas funcionais populares usadas em economia podem ser incorporadas anlise de

    regresso.

    At agora foram analisadas relaes lineares entre as variveis dependente e independente.

    No entanto, relaes lineares no so suficientes para todas as aplicaes econmicas e sociais.

    fcil incorporar no-linearidade na anlise de regresso simples.

    1.1 Modelo Nvel Nvel (Modelo Lin-lin)

    Suponha que a varivel dependente e varivel independente que se quer analisar esto

    tanto na forma de nvel. Por exemplo se quisermos saber o efeito sobre os salrios de

    uma ano extra de educao, e que os dados disponveis permitem estimar a seguinte

    equao:

    Neste caso, o coeficiente da varivel analisada pode ser interpretado como o efeito

    marginal. O efeito marginal a forma como a varivel dependente muda quando as

    mudanas de variveis independentes por uma unidade adicional mantendo todas as

    outras variveis na equao constante (isto , calculando a derivada parcial) ou:

    Portanto, Bj pode ser interpretado como a variao dos salrios a partir de um aumento

    de uma unidade (ou mudana de estado se varivel dummy) de Xj mantendo todas as

    outras variveis independentes constantes.

  • 35

    Exemplo:

    Com base nos dados utilizados nesta regresso, um ano adicional de educao

    corresponde a um aumento nos salrios de 0,75 USD/horas. Da mesma forma, um ano

    de experincia est associada a um aumento de 0,3 USD/hora no salrio, mantendo-se

    as demais variveis constantes.

    1.2 Modelo Log- Log

    Considere interpretar coeficientes de uma regresso em que a varivel dependente e

    independente a analisar esto na forma de log. Os coeficientes j no podem ser

    interpretados como efeitos marginais. Supes que a teoria econmica sugere estimativa

    da nossa equao de salrios com a varivel dependente na forma log

    e incluso de horas de trabalho voluntrio da comunidade por semana (Comm), tambm

    em forma de log. A equao de anlise agora :

    Gostaramos de interpretar o coeficiente sobre a varivel voluntrio da comunidade

    (B4). Para entender melhor a interpretao, considere o diferencial da equao acima

    mantendo todas as variveis independentes constantes, excepto Commi.

    Uma vez que:

    Ento podemos ter:

    Onde o lado esquerdo a elasticidade (parcial) de W em relao ao Comm. A

    elasticidade a razo entre a percentagem de alterao numa varivel para a

    percentagem de alterao em uma outra varivel. O coeficiente de regresso uma

    elasticidade parcial, j que todas as outras variveis da equao so mantidos

    constantes.

    Portanto, B4 pode ser interpretado como a variao percentual no salrio por hora de

    um aumento de um porcento em horas de trabalho voluntrio da comunidade por

    semana mantendo-se a educao, idade e experincia constantes.

  • 36

    Com base nestes resultados de regresso, um aumento de um por cento em horas de

    trabalho voluntrio da comunidade por semana associada a um aumento de 1,2% no

    salrio por hora.

    1.3 Modelo Log- Nivel (Log Lin)

    Na equao do modelo 1.2, a educao, idade e experincia esto em termos de nvel,

    enquanto a varivel dependente (salrio) , em termos de log.

    Gostaramos de interpretar os coeficientes dessas variveis. Primeiro, considere

    educao. Leve o diferencial mantendo todas as outras variveis independentes

    constantes.

    Multiplicandos os dois lados por 100 e reorganizando teremos:

    Portanto, 100 x B1 pode ser interpretado como a variao percentual de aumento Wi

    unidade em Edi, mantendo todas as outras variveis independentes constantes.

    Derivaes similares podem derivar da interpretao para os coeficientes da idade e

    experincia.

    Considerando o modelo estimado no ponto 1.2, podemos dizer o seguinte: mantendo

    todas as outras variveis independentes constantes, um ano adicional de escolaridade

    est associado a um aumento de 24% no salrio por hora. Da mesma forma, um ano

    adicional de experincia associada a um aumento de 16% no salrio por hora.

    1.4- Modelo Nivel-Log (Lin-Log)

    Considere-se uma regresso em que a varivel dependente , em termos de nvel e a

    varivel independente de interesse em termos de log. Por exemplo, considere a

    seguinte equao:

    Lembre-se da seco de regresses de nvel-nvel que os coeficientes de educao,

    idade e experincia podem ser interpretados como efeitos marginais. Gostaramos de

    interpretar o coeficiente de horas de trabalho voluntrio da comunidade (B4). Mais uma

    vez, levar o diferencial de ambos os lados, mantendo todas as variveis independentes

    constantes excepto trabalho de voluntrio da comunidade.

  • 37

    Dividindo os dois lados por 100 e reorganizando podemos ter:

    Ento:

    Pode ser interpretado, interpretado como o aumento do salrio por hora de um aumento

    de um porcento de trabalho voluntrio da comunidade.

    Portanto, mantendo-se a educao, idade e experincia constante, um aumento de um

    porcento de trabalho voluntrio da comunidade est associado a um aumento de 0,132

    dlares em salrios por hora.

    Podemos sumarizar os modelos no seguinte quadro:

  • 38

    VI. RELAXANDO AS HIPTESES BSICAS DO MODELO

    1. A MICRONUMEROSIDADE E MULTICOLINEARIDADE

    O termo Multicolinaridade foi introduzido por Ragner Frisch para ilustrar a

    existncia de uma perfeita ou exacta relao linear entre variveis independentes de um

    modelo.

    Existe uma relao linear exacta quando:

    0X.....XXX kk332211 Equao 62

    onde k21 ...., so constantes do modelo mas que todavia nem todas so iguais a zero.

    comum encontra-se modelos com multicolinearidade porem no em situao de

    colinearidade perfeita

    Quando estamos em presena de multicolinearidade perfeita, os coeficientes da

    regresso tornam-se indeterminveis e o erro padro tende para o infinito. Se a

    multicolinearidade menos que perfeita, a tendncia to somente de observar-se um

    alto erro padro o que traduz a dificuldade de estimao do erro padro.

    Um aspecto importante a fazer meno que ainda que o modelo observe alta

    multicolinearidade, este facto no afecta as propriedade bsicas dos estimadores dos

    mnimos quadrados ordinrios. Eles mantm MELNV. De facto Cristopher Achen

    salienta:

    Estudantes principiantes de metodologia s vezes se preocupam com o facto de suas variveis independentes estarem correlacionadas - o assim

    chamado problema da multicolinearidade. Mas a multicolinearidade no viola

    nenhuma hiptese de regresso. Estimativas no-viesadas e consistentes vo

    ocorrer, e seus erros-padro sero correctamente estimados. O nico efeito da

    multicolinearidade tornar difcil a obteno de estimativas de coeficientes com

    pequeno erro-padro. Mas ter um nmero pequeno de observaes tambm tem

    esse efeito, assim como ter variveis independentes com pequenas varincias.

    (Na verdade, em nvel terico, multicolinearidade, poucas observaes e

    pequenas varincias nas variveis independentes so, basicamente, o mesmo

    problema.) Assim, "O que devo fazer com a multicolinearidade?" uma questo

    semelhante a "O que devo fazer se no tiver muitas observaes?". Nenhuma

    resposta estatstica pode ser dada.

  • 39

    a) FONTES DA MULTICOLINEARIDADE

    Montogomery e Peck, tero desenvolvido um trabalho extensivo no qual

    possvel identificar as potenciais fontes da multicolinearidade:

    1. O mtodo usado na colheita de dados: sobretudo quando consubstancia-se numa gama limitada de observaes tende a traduzir-se em relaes

    colineares no pressuposto de que tomando o comportamento de

    determinadas sries em tamanhos ou intervalos de tempo curtos, nunca

    chega a ser suficientemente explicativo para captar as tendncias reais de

    mudana;

    2. Restries impostas ao modelo: costuma-se usar o exemplo da relao rendimento e consumo de electricidade, partindo do pressuposto de que

    escales de baixo rendimento tendem a associar-se com habitaes

    restritas em termos de espao e consequentemente no consumo de

    energia;

    3. Mispecification Bias: Quando as variveis a incluir no modelo no forem devidamente especificadas ou quando o modelo possui um numero de

    parmetros superior ao tamanho da populao (observaes).

    b) PRESENA, DETENO E MEDIDAS CORRECTIVAS

    Como detectar a multicolinearidade constitui uma das questes preocupantes

    para principiantes em econometria. De facto a existncia ou a no existncia da

    multicolinearidade no deve constituir preocupao. O que mais deve preocupar so os

    distintos nveis da multicolinearidade;

    Veremos alguns indicadores bsicos que nos permitem induzir a existncia da

    multicolinearidade:

    1. Alto coeficiente de determinao e poucos parmetros afigurando-se estatisticamente significantes: Geralmente toma-se como referencia

    80%, e em muitos dos casos o teste de F rejeita a hiptese nula de

    simultaneidade dos coeficientes parciais;

    2. Correlao elevada entre dois a dois parmetros: se computando o grau de correlao entre dois a dois parmetros vislumbra-se num

    coeficientes de associao acima de 80% constitui uma pista para

    suspeitar a existncia de alto nvel de colinearidade; Argumenta-se

    tambm que para alguns casos a colinearidade pode existir mesmo em

    situaes em que o grau de correlao de ordem zero entre variveis

    baixo.

    3. Regresses auxiliares: outra tcnica pertinente para deteno da existncia de multicolinearidade tem sido computar regresses auxiliares

    de cada varivel independente sobre as demais e o consequente calculo

    do coeficiente de determinao para averiguar o grau de ajustamento do

    modelo.

  • 40

    Conhecidas as fontes e detectada a presena da multicolinearidade, que

    mediadas correctivas? A multicolinearidade essencialmente um problema de amostra,

    o que torna simples identificar a s medidas correctivas para livrar-se dela.

    1. A informao a prior constitui um factor determinante na medida em que a percepo do tipo de variveis em causa ou o tipo de questes que

    se tenham colocado num inqurito especfico, tendem a fornecer um foco

    de correco; Exemplo, o modelo de determinao do consumo como

    funo do rendimento pessoal disponvel e da riqueza um dos casos de

    alta associao.

    2. O tamanho da amostra, conforme j abordado, sempre que for possvel incrementar o tamanho da amostra, para alguns dos casos tende a

    expurgar o efeito colinear entre determinadas variveis;

    3. Re-especificao do Modelo: por vezes possvel num determinado modelo ter variveis redundantes, uma vez retiradas, o grau de

    significncia estatstica do modelo no sofre grandes alteraes; Tambm

    associam-se nestes casos a especificao correcta do modelo.

    Exemplo:

    O modelo correcto previsto dado por:

    ii33i22ii XXY Equao 63

    todavia ns especificamos o modelo da seguinte maneira:

    ii212iiXY Equao 64

    quando sabe-se afinal de contas que: 323212E onde 32 o ngulo de inclinao das variveis X2 e X3. Consequentemente, ocorrer

    que a 12 ser um estimador enviesado de 2 desde que 32 seja

    diferente de zero.

    4. A Transformao de variveis: Ocorre para muitas variveis no estacionrias, geralmente quando estas apresentarem um comportamento

    com trend tal que usando o exemplo do rendimento e consumo, a tendncia de ambas as variveis seguem a mesma direco. Estes caso

    cria em certa parte um comportamento ilusrio que para alguns dos casos

    traduz-se em multicolinearidade. A transformao de variveis muitos

    casos consiste na aplicao de logaritmos para abrandar o

    comportamento do trend ou no clculo da primeira diferena.

    ii33i22ii XXY Equao 65

    aplicando uma desfazem , teramos

    1t1t331t22i1t XXY Equao 66

    consequentemente, a diferena de ambas as funes seria:

    t1t3t331t2t221tt vXXXXYY Equao 67

    5. A combinao de dados de corte (cross-secionais) e sries temporais, embora seja um artifcio um pouco complexo, constitui uma das

    sugestes pertinentes para resoluo do problema;

  • 41

    c) CONSEQUNCIAS PRATICAS DA MULTICOLINERARIDADE

    1. No obstante continuarem sendo MELNV, os estimadores dos mnimos quadrados ordinrios tendem a produzir varincias e covarincias com

    um tamanho bastante alto, difceis de serem estimadas;

    2. Consequentemente, os intervalos de confidncia tendem a ser bastante largos forando a imediata aceitao da hiptese nula (de que o

    coeficiente da populao real igual a zero);

    3. Existe uma tendncia das estatsticas de t de cada coeficiente, mostrarem-se estatisticamente insignificantes em contraste, o coeficiente

    de determinao do modelo 2R tende em muitos dos casos para um

    valor prximo de 100% demonstrando que o modelo estimado ajusta-se

    ao modelo real;

    4. Pequenas alteraes nos dados estatsticos deixam os estimadores e os desvios-padro bastante sensveis a mudanas.

  • 42

    2. ELEMENTOS CHAVE10 DA MULTICOLINEARIDADE

    10

    Quanto a alnea (d) Alm disso, como destacaram C. Robert' Krishna Kumar, John O'Hagan e Brendan McCable, h alguns problemas estatsticos com o teste

    de correlao parcial sugerido por Farrar e Glauber.

    1. Uma das hipteses do modelo clssico de regresso linear a de que no haja multicolinearidade entre as variveis explicativas, os Xs. Interpretada a grosso modo,

    multicolinearidade se refere situao em que h uma relao linear exacta ou

    aproximadamente exacta entre as variveis X.

    2. As consequncias da multicolinearidade so estas: se houver uma colinearidade perfeita entre os Xs, seus coeficientes de regresso sero indeterminados e seus erros-padro

    no sero definidos. Se a colinearidade for alta, porm no perfeita, a estimativa dos

    coeficientes de regresso ser possvel, mas seus erros-padro tendero a ser grandes.

    Como resultado, os valores dos coeficientes na populao no podem ser estimados

    precisamente. Porm, se o objectivo for estimar as combinaes lineares desses

    coeficientes, as funes estimveis, isto pode ser feito mesmo na presena da

    multicolinearidade perfeita.

    3. Embora no haja nenhum mtodo infalvel para detectar a colinearidade, h diversos indicadores dela, que so os seguintes:

    (a) O indcio mais claro da multicolinearidade surge quando 2R bastante alto, mas nenhum dos coeficientes de regresso estatisticamente significativo segundo o

    teste t convencional. Este caso, naturalmente, extremo.

    (b) Nos modelos envolvendo apenas duas variveis explicativas, pode-se obter uma ideia razoavelmente boa da colinearidade examinando-se o coeficiente de

    correlao simples, ou de ordem zero, entre as duas variveis. Se esto

    correlao for alta, geralmente a culpada a multicolinearidade.

    (c) Os coeficientes de correlao de ordem zero, porm, podem ser enganadores em modelos que envolvam mais de duas variveis X, pois possvel ter baixas

    correlaes de ordem zero e, apesar disso, existir alta multicolinearidade. Em

    tais situaes, talvez tenhamos de examinar os coeficientes de correlao parcial,

    (d) Se 2R for alto mas as correlaes parciais forem baixas, a multicolinearidade e uma possibilidade. Aqui, uma ou mais variveis podem ser suprfluas. Mas se o

    2R for alto e as correlaes parciais tambm forem altas, a multicolinearidade

    pode no ser facilmente detectvel.

    (e) Portanto, podemos regredir cada uma das variveis X. sobre as demais variveis

    X no modelo e descobrir os respectivos coeficientes de determinao

  • 43

    3. A HETEROSKEDASTICIDADE VERSUS HOMOSKEDASTICIDADE

    Uma das mais relevantes hipteses do modelo clssico, consiste no

    comportamento homoscedstico da varincia do resduo ao longo do tempo22 )( Var . (caracterstica bsica das sries temporais estacionarias). A questo

    coloca-se de facto em questionar o que ocorre no modelo se esta hiptese for violada?

    Na abordagem matricial, estaramos em presena da matriz do resduo, dada sob

    forma de:

    2

    n

    2

    2

    2

    1

    ...00

    ............

    0...0

    0...0

    )(E)var( Equao 68

    o que significa que ao longo do tempo, os erros de distintos perodos possuem

    correlao nula, quanto aos erros do mesmo perodo correspondem a varincia.

    (expressa na linha diagonal), e segundo o postulado clssico, esta varincia deve

    assumir valores constantes. Contrariamente, estamos em presena da

    heteroskedasticidade.

    A figura abaixo uma ilustrao clara da alterao da disperso do resduo como

    funo do tempo. Um caso comum sustentando a heteroskedasticidade o modelo das

    expectativas racionais - na justificao de que a medida em que o tempo passa as

    pessoas ajustam o seu comportamento com os seus erros, tal que as oportunidades de

    cometer um erro tornam-se reduzidas. Para este caso, teramos por exemplo um grfico

    semelhante ao debaixo. Porm, com a distribuio do resduo variando do sentido

    inverso.

    Um outro exemplo semelhante diz respeito a firmas de pesquisa. Estas tendem a

    melhorar a tcnica de colecta de dados ao longo do tempo, tambm diz respeito a

    redues graduais que se vo registando na componente do resduo.

    Ilustrao 3: Perturbaes Heteroscedsticas

  • 44

    a) PRESENA, DETENO E MEDIDAS CORRECTIVAS

    Na presena de heteroskedasticidade, notamos que 22

    i afectando a prior a

    frmula da varincia conforme visto anteriormente. Segundo, nas abordagens anteriores

    fez-se meno ao facto de 2 ser um estimador linear no viesado MELNV desde que

    as hipteses do modelo clssico sejam observadas.

    At este ponto, o simples facto da violao da homoskedasticidade, no retira a

    propriedade de MELNV. Todavia, ocorre que estes estimadores dos mnimos quadrados

    ordinrios continuam sendo melhores e no viesados porm no mais so eficientes ou

    seja, no possuem varincia mnima.

    b) TESTES DE HIPTESES

    Para a deteno da heteroskedasticidade, utilizam-se vrios mtodos dentre os

    quais:

    MTODOS INFORMAIS:

    Mtodos Grficos: No existindo informao alguma, basta fazer um plot do resduo em relao ao tempo ou em relao a varivel dependente, to

    fcil podemos observar um comportamento (patetern) especifico que nos

    permite perceber a variao do resduo em funo do tempo ou da varivel

    dependente.

    Ilustrao 4 Ilustrao de vrios padres de resduos quadrados estimados.

    MTODOS FORMAIS:

    Existem vrios testes para o efeito. O Teste de Gelser,Teste de Park , Teste de

    Glejsere, Teste de Correlao de Spearman, Whites General Heteroscedasticity, Teste de Goldfield Quandt.

    Whites General Heteroscedasticity

    Inicialmente computamos a regresso auxiliar do quadrado do erro nos valores de X, no

    quadrado de X e nos produtos cruzados

    ii3i26

    2

    i35

    2

    214i33i221i vXXXXXXu Equao 69

    de seguida computamos o coeficiente de determinao efectuamos o teste de hipteses.

  • 45

    2

    df

    2 ~Rn Equao 70

    Se o valor computado da estatstica for superior ao valor critico chi-square segundo os

    graus de liberdade (sem o intercepto) Conclui-se que existe Heteroskedasticidade. Se

    no exceder: ento 0654321 o que significa estar-se em presena

    de homoskedaticidade.

    Teste de Goldfield Quandt

    knu

    knu

    glSRQ

    glSRQ

    2

    2

    2elomod

    1

    2

    1elomod

    1

    2

    Equao 71

    onde: SRQ= Soma do resduo quadrado

    gl = graus de liberdade

    Constitui passos para o emprego do presente teste:

    o Organizar a amostra em ordem crescente a X o Omitir m observaes centrais tal que (n-m) seja num nmero

    par

    o Dividir a amostra em duas regresses (n-m)/2 o Obter a soma dos resduos quadrados de ambas regresses

    Se lambda for superior ao valor critico tabelado de F, segundo os graus de liberdade ((n-

    c)/2)-k, rejeitamos a hiptese de homoscedasticidade; A varincia comporta-se

    heteroscedasticamente.

    c) O MTODO DOS MNIMOS QUADRADOS GENERALIZADOS

    Sempre que estivermos em presena da Heteroskedasticidade, o mtodo dos

    mnimos quadrados ordinrios, no mais valido. Nestas circunstncias, fizemos

    recurso ao mtodo dos Mnimos Quadrados Generalizados, um mtodo que consiste

    na transformao do modelo com vista a poder estim-lo.

    Vejamos um modelo com trs variveis:

    ii33i22ii XXY Equao 72

    podendo tambm ser escrito do seguinte modo

    ii33i22i0ii XXXY Equao 73

    onde 1X i0 suponha que seja conhecida a varincia 2

    i ento dividiremos a equao

    anterior pelo desvio padro.

    i

    i

    i

    i3

    3

    i

    i22

    i

    i0

    i

    i

    i XXXY Equao 74

    o que facilita escrevermos o modelo como:

    *

    i

    *

    i3

    *

    3

    *

    i2

    *

    2

    *

    i0

    *

    1

    *

    i XXXY Equao 75

  • 46

    Neste momento as variveis sofreram uma transformao, tendo sido eliminado

    o efeito da varincia heteroskedstica. Assim sendo, estamos em condies de estimar o

    modelo aplicando os mnimos quadrados ordinrios. Assim:

    2

    i

    i2*

    i

    *

    i E)(Evar

    Equao 76

    2i2i

    2

    i2

    i

    2*

    i

    *

    i

    1E

    1)(Evar

    sabendo que 2i2iE Equao 77

    1)(Evar 2*i*i Equao 78 Onde a varincia dos mnimos quadrados ordinrios generalizados possuem

    varincia semelhante a observada pelos MQO ou OLS, que de facto uma constante.

    4. A AUTOCORRELAO a) PRESENA, DETENO E MEDIDAS CORRECTIVAS

    A semelhana da heteroskedasticidade, na presena da autocorrelao os

    estimadores dos MQO continuam sendo os melhores estimadores lineares no viesados

    mas no mais possuem a varincia mnima entre todos os estimadores no viesados

    O termo Auto-correlao significa correlao entre elementos da mesma srie ao

    longo do tempo, todavia, o pressuposto do modelo clssico de que no deve existir

    este tipo de perturbaes.

    0)(E ji quando ji Equao 79

    Todavia quando estivermos em presena deste tipo de perturbao,

    contrariamente a hiptese clssica, teremos um cenrio de:

    0)(E ji quando ji Equao 80

    A ttulo de exemplo, num cenrio destes, a greve que ocorre neste trimestre

    afecta o resultado do trimestre seguinte, ou seja um erro cometido durante um mandato

    influenciar os mandatos seguintes. De facto este cenrio 0)(E ji o que mais

    representa a realidade.

    CAUSAS

    Uma das caractersticas principais de determinadas sries temporais diz respeito

    a Inrcia ou a rigidez. Isto ocorre muitas vezes com os ndices de preos, PNB,

    emprego/desemprego e outras variveis que apresentam flutuaes cclicas ao longo do

    tempo. Geralmente obedecem uma tendncia, de recesso para perodos de reanimao,

    expanso e boom para depois voltar em baixo e seguir novamente o ciclo iterativo.

    Outras vezes, a especificao errnea do modelo ou a omisso de determinadas

    variveis de destaque, constitui razo de existncia da auto-correlao.

    Tambm salientam-se casos como o fenmeno cobb-web (teia de aranha) no

    qual a oferta de produtos agrcolas reage aos preos com uma defasagem de um perodo.

  • 47

    121 tt PBananasOferta

    Equao 81

    A manipulao de dados, sobretudo quando se tem dados brutos ao invs de

    dados regulares. Circunstncias nas quais se tomam dados brutos de um trimestre e

    calcula-se a mdia para criar sries mensais, em muitos dos casos factor causador de

    auto-correlao.

    Alguns autores como Tinter distinguem o termo auto-correlao do termo

    correlao serial, embora nos paream ter o mesmo significado, existe uma pequena

    diferena. A autocorrelao a srie desfasada consigo mesma segundo um nmero de

    unidades de tempo. Quando o termo correlao serial diz respeito a defasagem de sries

    diferentes.

    NATUREZA AR(i) e MA(i)

    Os modelos com auto-correlao na varivel dependente denomina-se modelos

    auto-regressivos. Exemplo:

    ti3i21t10i ICRNRN Equao 82

    uma representao mais comum, o caso da regresso do erro

    t1tiu Equao 83

    onde o coeficiente de correlao. Neste contexto, o modelo pode ser designado

    como modelo auto-regressivos de ordem um AR (1).

    Quando estivermos em presena de uma funo do erro dependendo de

    componentes com desfazagem, porem sendo estas perturbaes aleatrias com mdia

    zero, dizemos que estamos em presena de um esquema de mdia mvel -MA (1)

    1ttiu Equao 84

    Tambm podemos representar modelos com combinaes AR e MA,

    designando-os ARMA (1,1)

    1tt1tiu Equao 85

    MEDIDAS CORRECTIVAS

    Em presena de auto-correlao, os estimadores continuam sendo MELNV

    porm no mais possuem varincia mnima, o que quer dizer que deixam de ser

    eficientes. Se utilizarmos a 1AR2 )var( , os intervalos de confiana tendem a ser muito

    amplos, tornando difcil a rejeio da hiptese nula.

    Considerando que o erro no conhecido, a questo da auto-correlao muitas

    vezes fruto de especulaes. O remdio depende em grande parte do conhecimento

    tido quanto as interdependncias entre as distintas variveis, pois lidaremos com duas

    situaes, uma quando a estrutura da correlao conhecida, outra, quando ela no

    conhecida.

    Quando o coeficiente de correlao conhecido, tomaremos uma FRP valida no

    perodo t todavia tambm no perodo t-1. tal que:

    tt2ti XY

  • 48

    1t1t2i1t XY Equao 86

    multiplicando a FRP desfasada pelo coeficiente de correlao em ambos os lados,

    teramos.

    1t1t2i1t XY Equao 87

    Subtraindo da funo primaria da equao 86 a da equao 87 teramos:

    )(XX)1(YY 1tt1t2t2i1tt

    t1tt2i1tt )XX()1(YY Equao 88

    agora assumimos um modelo

    t

    *

    t

    *

    2

    *

    1

    *

    t XY Equao 89

    no qual, )XX(X);1();YY(Y 1tt*

    t1

    *

    11tt

    *

    t

    Neste contexto, o resduo respeita todas as premissas bsicas dos MQO, sendo

    possvel estimar a equao 89 sem risco de vis.

    Sempre que tivermos conhecimento da dimenso da correlao, bastar aplicar

    diferenas ao modelo, reduzindo-o para tt2t XY , operao na qual ao aplicar

    o operador da primeira diferena (delta) perdemos o intercepto. Nestas condies,

    semelhantemente, podemos estimar o modelo fazendo recurso ao mtodo dos MQO.

    b) TESTES DE HIPTESES

    Durbin Watson

    O teste de DW um dos testes tradicionais para testar a presena de auto-

    correlao. Ele baseia-se nos resduos e obedece uma distribuio estatstica especfica,

    na qual so considerados os pontos de significncia superior e inferior. Quanto aos

    graus de liberdade, o parmetro k no considera o intercepto da funo. O teste DW no

    deve ser aplicado em modelos auto-regressivos. O teste tem a seguinte frmula de

    clculo:

    n

    1t

    2

    t

    n

    2t

    2

    1tt

    e

    ee

    d Equao 90

    Para o uso dos valores crticos tabelados de DW, devemos seguir o seguinte

    diagrama que nos sugere em que circunstancias a correlao positiva, negativa, ou

    quando que no possvel detecta-la.

    Ilustrao 5 reas de deciso do teste de Durbin Watson

  • 49

    5. ELEMENTOS CHAVE DA AUTOCORRELAO

    1. A autocorrelao pode ocorrer por varias razes, pode ser derivada por inrcia ou rigidez das

    sries temporais econmicas, vis resultante da omisso de variveis importantes, ou por uso

    da forma funcional incorrecta, o fenmeno cobb-wed, a da teia de aranha ou ainda a

    manipulao dos dados.

    2. Embora os estimadores de MQO permaneam no-viesados e consistentes na presena de

    autocorrelao, eles deixam de ser eficientes. Como resultado, os testes de significancia t e F

    usuais no podem ser legitimamente aplicados. Por isso, so necessrias medidas correctivas.

    3. o remdio depende da natureza da interdependncia entre as perturbaes U t Mas como Ut no so observveis, a prtica comum supor que sejam geradas por algum mecanismo.

    4. o mecanismo comummente suposto o esquema auto-regressivo de primeira ordem de Markov,

    que supe que a perturbao no perodo corrente se relaciona linearmente com o termo de

    perturbao no perodo anterior, sendo que o coeficiente de autocorrelao fornece o grau da

    interdependncia. Este mecanismo conhecido como esquema AR(1).

    5. Se o esquema AR(1) for vlido e o coeficiente de autocorrelao for conhecido, o problema da

    correlao serial pode ser facilmente atacado por meio da transformao dos dados seguindo o

    mtodo da diferena generalizada. O esquema AR(1) pode ser facilmente generalizado para um

    esquema AR(p). Podemos tambm supor um mecanismo de mdia mvel (MA) ou uma mescla

    dos esquemas AR e MA, conhecida como ARMA.

    6. Mesmo que usemos um esquema AR(1), o coeficiente de autocorrelao p no conhecido a

    priori. Examinamos vrios mtodos para estimar p, tais como d de Durbin-Watson, d modificado

    de Theil-Nagar, mtodo de Cochrane-Orcutt (C-O) em duas etapas, mtodo C-O iterativo e o

    mtodo de Durbin em duas etapas. Em grandes amostras, estes mtodos geralmente produzem

    estimativas similares, mas no em pequenas amostras. Na prtica, o mtodo C-O iterativo se

    tornou bastante popular.

    7. Naturalmente, antes de corrigir a autocorrelao, preciso detect -la. H diversos mtodos de

    deteco, dos quais o mais clebre a estatstica d de Durbin-Watson. Embora comummente

    usada e rotineiramente produzida pela maioria dos pacotes de software, a estatstica d apresenta

    vrias limitaes. Muitas vezes, a estatstica d indica no uma autocorrelao pura, mas sim um

    vis de especificao ou o efeito ARCH.

    8. Um modelo especial no discutido no nosso programa o modelo ARCH (Autoregressive

    Conditional Heteroskedatic Model) , no qual a varincia condicional do termo de erro se

    correlaciona serialmente com os valores passados do termo de erro elevados ao quadrado. Este

    modelo provou ser muito til na modelagem e previso de muitas variveis financeiras, tais

    como taxas de cmbio, taxas de inflao etc. Usar-lo-emos na cadeira de Mtodos de Previso.

  • 50

    VII. TPICOS QUALITATIVOS

    i. A REGRESSO DE VARIVEIS DUMMIES No mbito da anlise de regresso, existem variveis que no so facilmente

    quantificveis numa escala definida. Estas variveis quase frequentemente so

    denominadas por variveis qualitativas, tambm designadas por variveis dummies. A

    ttulo exemplificativo, num determinado modelo, mantendo todas as variveis

    constantes, se estivermos a tratar do rendimento, notaremos que o sexo feminino tende

    para alguns casos a auferir salrios inferiores aos seus colegas do sexo masculino.

    Assim sendo, para a anlise do rendimento, veremos que este difere na medida em que

    mudar o gnero. A este tipo de anlise, diz respeito o tratamento das variveis dummies.

    As variveis qualitativas geralmente indicam a presena ou a ausncia de uma

    qualidade ou atributo. Em termos numricos, elas assumem valores de 1 ou de 0,

    servindo de indicadores alternativos variveis dicotmicas, variveis qualitativas, variveis binrias.

    1. INCIDNCIA NO INTERCEPTO

    Tomemos como referncia um modelo de uma varivel, tendo o rendimento

    salarial como funo dos anos de experincia acumulada. Nota-se porem que, no

    obstante os anos de experincia, h sempre uma tendncia ao longo da populao,

    encontrar valores que diferem, podendo estar por detrs varias causas como, origem

    regional, etnia, raa, ou gnero.

    Vejamos o modelo abaixo:

    iiiii uXDY 211

    Equao 91

    11

    Nota que na verdade a incluso das variveis dummies implicaria ter as duas categorias, para o caso do rendimento como funo da oferta de trabalho de

    professores, incluiramos duas categorias, ilustrando a demanda de professores

    quando tratam-se de homens e mulheres, tal que o modelo apareceria do seguinte

    modo: iiiiii uXDDY 2312

    Tal que teramos:

    contrriocaso

    mulheresforseD

    contrriocaso

    emforseD

    i

    i

    0

    1

    0

    hom1

    2

    1

    Entretanto, devido ao problema da multicolinearidade, no inclumos as duas

    categoria, inclumos apenas uma, no principio de que tomando o numero de

    categorias existentes, deveremos sempre deduzir uma. No nosso caso simples, a

    excluso de uma categorias, ser coberta pela outra categoria na medida em que

    o seus valores so exactamente o inverso da outra categoria.

    Imagine que tivssemos uma amostra com trs observaes de homens, e

    duas para mulheres, teramos a a apresentao do seguinte modo.

    Intercepto D1 D2 X1

    Homem Y1 1 1 0 234

    Homem Y2 1 1 0 434

    Mulher Y3 1 0 1 325

    Homem Y4 1 1 0 543

    Mulher Y5 1 0 1 278

    Note que este modelo tem problemas de multicolinearidade, porque a soma

    dos vectores D1 e D2 perfeitamente igual ao vector do intercepto, logo

    estaramos em presena de colinearidade perfeita. Para este caso, devemos

    excluir uma das variveis dummies, ou seja uma categoria da varivel dummy e

    to logo poderemos estimar o modelo.

    Quanto ao resultado da regresso saberemos a partida que o valor do

    intercepto s ditaria os valores que a intercepto toma quando consideramos

  • 51

    Neste caso, a nossa varivel adicional expressa por D a varivel dummy. Esta

    toma dois valores diferentes. Se tratar-se de um homem, tomar o valor de 1 e se tratar-

    se de uma mulher, tomara o valor de 0.

    De outro modo, formulando o modelo em relao ao valor convencional de Y

    em relao a X, teremos:

    ii uXDYE 1)0|( Modelo representativo para as Mulheres

    ii uXDYE )()1|( 21 Modelo representativo para os Homens.

    Como pode notar, as duas variantes de alfa, representam o termo intercepto,

    logo, estamos em presena do efeito dummy sobre o intercepto.

    Ilustrao 6 Demonstrao da Variao do Intercepto termo, numa funo onde

    o salrio funo dos anos de experincia.

    Uma varivel dummy pode apresentar mais de duas categorias. Sempre que

    assim suceder, no acto da formulao do modelo, deduzimos sempre uma categoria (m-

    1).

    2. INCIDNCIA NO PARMETRO DE INCLINAO

    A abordagem da inferncia das variveis dummies na inclinao da linha de

    regresso est estreitamente correlacionada como a abordagem do teste de chow.

    Lembre-se que o teste de chow diz respeito a averiguao da existncia ou no de

    estabilidade estrutural, comparando duas regresses. Quando no existe estabilidade

    estrutural, quer dizer que a duas regresses em anlise possuem graus de inclinao

    diferentes. O mesmo seria tambm dizer que existe uma alterao da tendncia da linha

    de regresso ao longo do perodo, isto seria o mesmo que admitir a existncia de uma

    varivel independente cujo valor correlaciona-se com uma varivel dummy, ao ponto

    desta varivel tomar valores diferenciados em funo do efeito dummy.

    Considere que para o teste de chow, juntamos as duas regresses possveis e

    expressamo-las no modelo abaixo:

    apenas mulheres. Ao passo que se adicionarmos a este a varivel seguinte-D1 (a

    dummy na sua primeira categoria) estaramos obtendo os valores do intercepto

    considerando os homens.

    Para livrar-se da armadilha da varivel dummy, tambm se usa um

    artificio avanado que o de incluir o numero inteiro de categorias, todavia

    eliminando o termo intercepto.

  • 52

    iiiiii uDXXXY )(....*

    223220 Equao 92

    Onde Y= representa por hipoteticamente rendimentos de firma da gua da

    Chela,

    Por hiptese poderamos ter uma varivel X1. Representando os gastos de

    explorao, todavia, deixamos omissa para efeitos didcticos.. X2 =Volume de vendas geradas

    *

    2X Valor limiar das vendas, tambm designado como n, (conhecido de ante

    mo). Tal que: D=1 se X2>*

    2X

    D=2 se X2