Econometria 21mar2012

83
 Econometria  Prof. Adriano M. R. Figueiredo 1 UNIVERSIDADE FEDERAL DE MATO GROSSO FACULDADE DE ECONOMIA Econometria Básica Prof. Adriano Marcos Rodrigues Figueiredo Versão de 21/03/2012 1  http://br.groups.yahoo.com/group/econometria_ufmt/ CUIABÁ   MT 2012 1  Os direitos de reprodução pertencem ao autor e requer citação apropriada.

Transcript of Econometria 21mar2012

Econometria Prof. Adriano M. R. Figueiredo 1 UNIVERSIDADE FEDERAL DE MATO GROSSO FACULDADE DE ECONOMIA Econometria Bsica Prof. Adriano Marcos Rodrigues Figueiredo Verso de 21/03/20121 http://br.groups.yahoo.com/group/econometria_ufmt/ CUIAB MT 2012

1 Os direitos de reproduo pertencem ao autor e requer citao apropriada. Econometria Prof. Adriano M. R. Figueiredo 2 Not everything that can be counted counts, and not everything that counts can be counted. Albert Einstein, (atribudo) Cientista, Fsico Alemo (1879 - 1955) Econometria Prof. Adriano M. R. Figueiredo 3 SUMRIO 1.Introduo.......................................................................................................................... 4 2.Pressuposies do Modelo de Regresso Linear Clssico .............................................. 12 2.1.Pressuposio 1: a relao entre Y e X linear ........................................................ 12 2.2.Pressuposio 2: O erro aleatrio tem mdia zero ................................................... 15 2.3.Pressuposio3:Oerroaleatriotemvarinciaconstante(presenade homocedasticidade) ............................................................................................................. 18 2.4.Pressuposio4:Oserrosaleatriossoindependentes(ouno autocorrelacionados) ............................................................................................................ 18 2.5.Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 21 2.6.Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante: ............................................................................................................................. 22 2.7.Pressuposio7:Ausnciaderelaolinearexataentreasvariveis explicativas (no multicolinearidade) .................................................................................. 22 2.8.Resumo das pressuposies ...................................................................................... 24 3Estimao ........................................................................................................................ 26 Anexo 1: Estimao utilizando matrizes no Excel: ............................................................. 31 Anexo 2: Exerccios: ............................................................................................................ 33 4Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear ..................... 36 4.1.Pressuposio 1: A relao entre Y e X linear....................................................... 36 4.2.Pressuposio 2: O erro aleatrio tem mdia zero ................................................... 43 4.3.Pressuposio3:Oerroaleatriotemvarinciaconstante(presenade homocedasticidade) ............................................................................................................. 49 4.4.Pressuposio4:Oserrosaleatriossoindependentes(ouno autocorrelacionados) ............................................................................................................ 64 4.5.Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante: ............................................................................................................................. 74 4.6.Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 78 4.7.Pressuposio7:Ausnciaderelaolinearexataentreasvariveis explicativas (no multicolinearidade) .................................................................................. 78 4.8.Resumo ..................................................................................................................... 82 5Referncias Bibliogrficas .............................................................................................. 83 7.Programas Recomendados .............................................................................................. 83 Econometria Prof. Adriano M. R. Figueiredo 4 1. Introduo AEconometriaumramodacinciaeconmicaquetratadaquantificaodas relaes econmicas. Combina a teoria econmica, a matemtica e a estatstica para a anlise de problemas econmicos como a oferta e demanda de moeda, oferta e demanda de produtos, a funo investimento, o emprego e a renda entre outros.O objetivo bsico da econometria Analisar conjuntos de dados econmicos de modo apoderverificaredarsustentaosteoriaseconmicas.Dateoriaeconmicaelaboram-se hipteses,traduzidasemlinguagempelasferramentasdamatemtica[ex.:umafuno y=f(x1, x2, x3,..., xn)]efaz-seainfernciaoudeduopeloraciocnio,tirandoporconcluso com tcnicas da estatstica.Temcomoinstrumentofundamentalaanlisederegresso,queconsistenaobteno dosparmetrosparaumadadarelaoexistenteentreasvariveisdependentese independentes.Muitasvezestrabalha-secomumaamostradedadosobtidosdeuma populao. Assim, tm-se alguns conceitos importantes aqui detalhados. Apopulao,outambmchamadadeuniverso,oconjuntodeindivduoscom caractersticas comuns para um determinado fenmeno. O fenmeno definido pela varivel, nopresentecaso,umfenmenoeconmicodefinidoporumaoumaisvariveiseconmicas. Estas variveis so as caractersticas medidas, podendo ser quantitativas como a produo e a renda, ou qualitativas como o gnero e a religio.A amostra um subconjunto da populao, uma parte do todo. Normalmente se utiliza aamostraquandoexistealgumempecilho(financeiro,prticoououtro)paraousoda populao.Nestecaso,espera-sequeaamostratenhacaractersticastaisquerepresentem adequadamenteotodo,edeprefernciaquesejaaoacaso.Paratanto,utilizam-setcnicas estatsticasparagarantirmaiorrepresentatividadedaamostra.Muitasvezesaamostra estratificadaouseparadaemestratos,deacordocomanecessidadedesedetalharos diferentes grupos. Econometria Prof. Adriano M. R. Figueiredo 5 Asvariveispodemserchamadasdealeatriasquandoseusvaloresestiverem relacionados com uma probabilidade de ocorrncia. A probabilidade a relao entre os casos favorveisentretodosospossveis.Serovariveisdiscretasquandonohouver probabilidade de ocorrncia. Umatcnicaparaanalisararelaoentrevariveiseconmicaspormeioda regresso. Na regresso linear simples (RLS), estima-se a relao existente entre apenas duas (2)variveis:umadependente(outambmchamadadeendgenaouexplicada),Y;euma independente (ou tambm chamada de exgena ou explicativa ou explicadora), X. Com o uso da matemtica, a relao se expressa como uma funo f qualquer: Y = f (X). Nocasomaisgeral,commaisdeduasvariveis,tem-searegressolinearmltipla (RLM), estimando-se a relao Y = f (X1, X2, ..., Xn). Neste caso, portanto, tem-se n variveis explicativas X para uma varivel explicada Y, sendo que existem situaes em que se pode ter mais de uma varivel explicada assim como mais de uma equao dentro do modelo analtico em estudo. Para melhor compreenso da econometria, convm explicar aestrutura do mtodo de anlise emprica.Econometria Prof. Adriano M. R. Figueiredo 6 A estrutura da anlise emprica do mtodo composta inicialmente por um problema uma questo a ser investigada. Com base na teoria econmica referendada em artigos, livros e observao,elaboram-sehiptesestericas(quepoderoounoseraceitas)compondoo modelo terico.A validao e verificao do modelo e confirmao ou no das hipteses requer o uso dedadosetcnicasestatsticasematemticasasquaiscompemoqueaquichamamosde estimaodomodelo,almdecritrioseconmicoseestatsticos.Avalidaodomodelo tambmpodeserrealizadacomeconomiapolticaeusodeargumentosnoquantitativos, normalmente associados aos enfoques da sociologia, do direito, das cincias polticas as quais se relacionaro com a econometria na fase de anlise e interpretao dos resultados. Assim, na anlisedosresultadospode-seterumdetalhamentodaconsistnciadomodeloterico adotado, refutao ou indicao de modelos tericos, e principalmente a sugesto de polticas econmicas para tratar o fenmeno econmico estudado. Portanto,omtodoimplicanaorigemnumateoriaenumalinguagemterica econmica, passando por uma traduo desta para a linguagem matemtica, muitas vezes com ousodeestatsticadescritivaeempregodetabelas,grficos,cartogramasououtrosobjetos que melhoram a visualizao dos resultados. importante frisar que a base terica deve ser a Econometria Prof. Adriano M. R. Figueiredo 7 origem da investigao do problema. Os dados sero associados s variveis detectadas nesta teoria.Aopassarparaalinguagemmatemtica,compe-seoquechamamosdemodelo analtico ou modelo operacional ou ainda modelo economtrico.O modelo economtrico ser uma representao simplificada de um processo real, ou ainda,oconjuntodeequaescomportamentaisderivadasdomodeloeconmico, (VASCONCELOS,2000:p.14)2.aoperacionalizaodomodeloemlinguagem matemtica. Omodeloaserestimadonormalmentepossuicomponentealeatrio,requerendoa incluso de um erro que captar os efeitos das variveis importantes para explicar Y, mas que no esto no modelo. Representa-se ento, o efeito das demais variveis explicativas por um termo aditivo ui, denominado resduo ou erro. O modelo torna-se: cuja expresso geral matricial Y = X + emque|umamatrizdeparmetrosaseremestimados(incluindoointerceptoeos coeficientesangulares)eumvetorderesduosouerrosaleatrios.Osparmetrosso constantessquaiscabempapisparticularesemtermosdeefeitosdeumavarivelsobre outra. O formato matricial linear aberto ser: 1 11 1 0 12 21 2 1 21111kkn n nk k nY X XY X XY X X| c(( (( (( ((| c (( ((= - + (( (( (( ((| c Portanto, tm-se as matrizes assim nomeadas: 1 11 1 0 12 21 2 1 21x 1x1 1x 1x 1111kkn n nk k nn n ( k ) ( k ) nY X XY X XY ; X ; ;Y X X+ +| c(((( ((((| c ((((= = | = c = (((( ((((| c Nestecenrio,tem-seumarelaoentrevariveisXeaY,podendo-seilustrar graficamente como uma disperso de pontos em dois eixos. A disperso dos pontos em torno de umareta de tendncia oresultado de umgrande nmero de pequenas causas, cada uma delasproduzindoumdesviopositivo(+)ounegativo().Odesvioseradiferenaentreo

2 VASCONCELLOS, M.A.S.; ALVES, D. (coords.). Manual de econometria. So Paulo: Atlas, 2000. Econometria Prof. Adriano M. R. Figueiredo 8 valorobservadoeovalorestimadodavariveldependentedomodelo.Portanto,tem-seui devido a: omisso de variveis problemas de especificao erros de medida da varivel dependente Pode-se dizer que Y nunca pode ser previsto exatamente. Portanto, para cada valor de X, existe uma distribuio de probabilidade dos valores de Y, com mdiaE(Yi) = Y= |X e varincia constante o2. Oobjetivodaanlisederegressoestimarumacurvaatravsdanuvemdepontos, relacionandoumavariveldependentecomofunodeoutrasvariveisditasindependentes, sendoqueaformafuncionaldeveserpressupostapelopesquisador.Nestecaso,ateoriaa respeito da relao estudada, a anlise da disperso dos pontos e os estudos anteriores acerca desta relao ajudaro nesta definio.Por exemplo, pode-se observar a relao entre o PIB dos municpios de Mato Grosso e sua componente da agropecuria para o ano de 2005. A mera descrio grfica destes valores indica uma disperso mais concentrada entre os valores de PIB inferiores a R$1.000.000 e de agropecuriainferioraR$100.000,mesmohavendovaloresatpicosmaioresqueos mencionados, mas para poucos municpios.Amesmaobservaopoderiaserconduzidacom cartogramas,oucomtabelas,masquetalveznopermitissemaoleitoramesmaimpresso que o grfico de disperso. 01,000,0002,000,0003,000,0004,000,0005,000,0006,000,0007,000,0000100,000 300,000 500,000 700,000AGRO05PIB05Econometria Prof. Adriano M. R. Figueiredo 9 Uma inspeo visual nos dados, como nos grficos ou com uso de medidas estatsticas descritivascomomdia,mediana,moda,mximosemnimos,importanteparao investigador ter maior conhecimento do comportamento das variveis, o que permitir melhor especificao do modelo analtico. A ocorrncia de valores atpicos uma preocupao que o investigador deve tentar tratar adequadamente e melhorando as estimaes. Asvariveiscomomencionadasanteriormente,podemserquantitativasou qualitativas.Osdadosaelaassociados,portanto,poderoterdiferentescaractersticas, diferenciando-seentresriestemporais,deseocruzada,oucombinaoentreestesdois tipos.Podem-se ter dados de uma varivel acompanhada no tempo, ou seja, o que se chama desrietemporalcomonogrficodondicedoPIBbrasileironoperodode1994a2003, comdadostrimestrais.Porexemplo,opreodeumaaoouarendadeumindivduopode seracompanhadasemanalmente,oumensalmenteouanualmente,enestecasoprocura-se avaliar as alteraes desta no tempo, ou a dinmica da srie.Neste caso, no se trata de uma amostraaleatria,emboraopesquisadordevaterargumentosparaaescolhadoperodo analisado.Asinvestigaesdasrelaesentresriestemporaistmocupadovastoespaona literaturaeconomtricarecente,preocupando-seprincipalmentecomapossibilidadede relaesesprias,quandoarelaodecorredocomportamentotemporal(tendnciae sazonalidade)enoprecisamentedoefeitoentreasvariveis,dandoorigemaosmodelos autoregressivos, mdias mveis e outros a serem desenvolvidos mais a frente. Figura. Valor do ndice do PIB trimestral brasileiro de 1994 a 2003. 961001041081121161201241994 1995 1996 1997 1998 1999 2000 2001 2002 2003PIBEconometria Prof. Adriano M. R. Figueiredo 10 Algunsdadospodemestarrelacionadosaomesmoperododetempo,paradiferentes indivduos, empresas, regies. Neste caso, d-se o nome de sries de seco cruzada. Quando setratamdeindivduosouempresasesoamostras,chamamosdeamostraaleatria.Cada observaoumnovoindivduo,firmaoumunicpiocominformaoemumpontono tempo. So tpicos os casos de dados municipais, como o PIB dos municpios de Mato Grosso para um dado ano. Nestes dados, em geral se preocupa com a variabilidade entre as unidades dasrie,ouseja,entreosmunicpios.Osdadosnestecasoficammaisbemexpressosem cartogramas,ouemgrficosdebarrasoucolunas,poisnopossvelunirpontoscomo num grfico no tempo. Figura. Valor do PIB dos municpios de Mato Grosso em 2005. Mapa. Arrecadao de ICMS de combustveis em Mato Grosso em 2008. 01,000,0002,000,0003,000,0004,000,0005,000,0006,000,0007,000,00025 50 75 100 125PIB05Econometria Prof. Adriano M. R. Figueiredo 11 Os dados podem ainda relacionar os dois tipos anteriores, ou seja, dados de diferentes unidades ou indivduos acompanhados para diferentes perodos de tempo, originando o que se chamadecombinaodesriestemporaiseseocruzada(STSC),oudadoslongitudinais. Como exemplo, pode-se ter uma amostra de consumidores de Mato Grossocomo no caso da PesquisaNacionaldeAmostragemporDomiclio(PNAD)conduzidapeloIBGE,cujos detalhesdoconsumosoinvestigadosanualmente.Nestecaso,apreocupaotantona variabilidadeentreindivduoscomonadinmicaounocomportamentotemporaldecada individuo. No caso de se ter os mesmos indivduos nos mesmos perodos de tempo, tem-se a especificidade de uma combinao STSC chamada painel. Aformaderelacionarasvariveisnomodeloeconomtricoobservaraspectos matemticoseestatsticos,semprecombasenateoria.Asprevisesaseremobtidasdevem serolhadascomcautela,poisousodefunesmatemticasouescolhasdevariveis inadequadaspoderresultaremmespecificaodomodeloeoutrosproblemasestatsticos queinvalidaroasestimativas.Porestemotivo,fundamentalterumaboarevisode literaturainvestigandooqueoutrospesquisadoresrealizaram,dequemodotrabalharam,e quaisosprincipaisresultados,tudoistopreviamenteaodesenvolvimentodomodelo economtrico.Estemodeloaindaestarsujeitoaverificaesestatsticasdepressupostos importantes, detalhados a seguir. Econometria Prof. Adriano M. R. Figueiredo 12 2. Pressuposies do Modelo de Regresso Linear Clssico Omodeloclssicodeanlisederegressoconstrudocombasenumasriede pressuposies referentes ao comportamento da populao. Conhecidas essas pressuposies, serpossvelestimarosparmetrosdomodelo,assimcomoamatrizdevarinciae covarincia dos mesmos e a respectiva matriz para os resduos. A seguir faz-se a descrio rpida das pressuposies do modelo clssico de regresso. 2.1.Pressuposio 1: a relao entre Y e X linear -Forma funcional Estapressuposioemprincpioimplicanaconsideraodeumaretaestimada,ouseja, uma funo linear nas variveis do tipo 0 1 1 2 2 i i i k ki iY X X X =| +| +| + +| +cou pela forma matricial: Y = X| + emqueYovetordevariveisexplicadas,Xumamatrizdevariveisexplicativas (incluindo uma coluna de uns para o intercepto) e um vetor de resduos aleatrios. Entretanto,deve-seatentarparaoutrostiposdelinearidadesimplcitasna pressuposio.Tm-seosseguintestiposdelinearidades:linearidadedasvariveis explicativas(X)elinearidadedosparmetros(|).Anolinearidadenasvariveissvezes pode ser contornada por transformaes nas variveis, mas a no linearidade dos parmetros mais complicada e requer outros mtodos de estimao no lineares. fcilimaginarqueocomportamentodeumfenmenoeconmiconoseguea relaoretilnea,comoporexemplo,astradicionaisrelaesdeofertaedemandano necessariamente sero retas que se cruzam. muito mais fcil admitir que o comportamento devariveiseconmicassejacurvilneo.NafiguradosretornosdasaesdasLojas AmericanasemfunodeumavarivelZqualquer,observa-sequeaspossibilidadesde ajustamentosemretaouemparbolaapresentamdiferentesresultadosemtermosdemelhor representar a nuvem de pontos. Quandoasvariveisexplicativassoelevadasaalgumapotnciadiferentedeum,a funoquerelacionaocomportamentodessasvariveiscomavarivelexplicadaser Econometria Prof. Adriano M. R. Figueiredo 13 diferente de uma reta e os estimadores tradicionais de Mnimos Quadrados Ordinrios (MQO) no mais sero vlidos. Existemmodelosquesochamadosdeintrinsecamentelineares,ouquepodemse tornar lineares por transformao das variveis. O caso mais comum na literatura econmica o de funes do tipo Cobb-Douglas, ou seja, c | | |e X X AX Y332211= emqueosparmetrospodemassumirvaloresdiferentesdeume,ainda,tem-sea multiplicaodevariveisexplicativas.Afunoacimapodeserlinearizadatransformando-se as variveis em logaritmos, obtendo:

ou, simbolizando o ln por *:c | | | | + + + + =*3 3*2 2*1 1 0*X X X Y Afunolinearizadapodeserestimadadaformatradicionallembrandoqueos parmetrosestimadosseroagoradafunotransformada,quenocasolog-log(Cobb-Douglas),equivalemselasticidades.Afunotransformadapodeservistacomolinearnos y = 0.0018x + 0.0048y = 0.2541x2- 0.0188x + 0.001600.010.020.030.040.050.060.07-0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5RLAME x ZZ Linear (Z) Polinmio (Z)Econometria Prof. Adriano M. R. Figueiredo 14 parmetros(osparmetrossotodosemprimeirapotncia)enasvariveistransformadas (X*=lnX). Outros modelos no podem ser transformados e so os chamados intrinsecamente no lineares. Por exemplo, possvel perceber que a funo abaixo no pode ser linearizada: c | |+ | + | + | = e e e A Y2 5 1 3X4X2 1 Esses modelos devem ser estimados por Mnimos Quadrados no lineares ou Mxima Verossimilhana no linear. Algumas formas funcionais utilizadas em economia da produo podem ser: Cobb-Douglas logaritmizada:=+ =n1 ii i 0x log a a y logElasticidade Constante de Substituio ou CES:= + =n1 ii i 0x a a yGeneralizada Leontief: = = =+ + =n1 in1 jj i ijn1 ii i 0x x a x a a yTranscendental Logaritmica ou Translog: = = =+ + =n1 in1 jj i ijn1 ii i 0x log x log a x log a a y logQuadrtica: = = =+ + =n1 in1 jj i ijn1 ii i 0x x a x a a y Autilizaodeumaformamaiscomplexaemdetrimentodeumamaissimples depender da disposio dos dados e do rigor cientfico desejado. A funo Cobb-Douglas de modo geral oferece um ajustamento satisfatrio e fcil de executar. As funes elasticidade desubstituioconstante(CES),GeneralizadaLeontief,TranscendentalLogartmicae QuadrticasogeneralizaesdafunoCobb-Douglasparacontornarpressuposies econmicasdesubstitutibilidadedosfatoreseprodutosouaindadeconcorrnciaperfeita, entre outras situaes. Juntamente ao problema da forma funcional (linearidade dos parmetros e variveis), quando se especifica um modelo, automaticamente esto sendo cometidos outros dois tipos de errosquepoderoounocomprometeraanlise.Umestassociadoomissodeuma varivel relevante e outro associado incluso de varivel irrelevante. -Omisso de varivel relevante Imaginequearevisodeliteratura,revisoterica,indiquequeaquantidade demandada(Q)deumprodutosejafunodopreodoproduto(P)edarenda(R),equeo Econometria Prof. Adriano M. R. Figueiredo 15 comportamentodademandadoprodutoanalisadonarealidadeestemconformidadecoma teoria. O modelo correto seria: (A) Qt = 0 + 1.Pt + 2.Rt + t* em que os so parmetros estimados e o resduo aleatrio. Imagineagoraque,poralgummotivo,estimou-seademandaemfunoapenasdo preo do produto, fazendo: (B) Qt = 0 + 1.Pt + t. em que so parmetros e as demais variveis como anteriormente citadas. Aquesto:quaisasconsequnciassobreosestimadoresdeMQO(ousobreos estimados)? Qual o efeito sobre 0 e 1 em razo da excluso de R do modelo? SePtforaltamentecorrelacionadocomRt,aretiradadeRttrarumaltovis(alta tendenciosidade) e os parmetros estimados sero muito diferentes do valor esperado: estimado E() ou seja, os parmetros estimados sero inconsistentes e no limite E() . Os testes de hipteses no sero vlidos e as estimativas de varincias tambm sero tendenciosas. -Incluso de varivel irrelevante Imagineagoraasituaoinversa:omodeloestimadocontemplamaisvariveis explicativas do que as que deveriam estar no modelo correto. Imagine que o modelo deveria ter apenas P e que foi estimado com P e Z, sendo Z uma varivel irrelevante no modelo. (A) Qt = 0 + 1.Pt + t.modelo correto (B) Qt = 0 + 1.Pt + 2.Zt + t*modelo estimado e que Z no tem relevncia terica.A questo : quais as consequncias de , em razo da incluso de Zt, sobre ? As consequncias da incluso de uma varivel irrelevante sero menos problemticas quenocasodaomissodeumavarivelrelevante.Primeiro,apresenadasvariveis irrelevantesnoviesaasoutrasestimativas.Segundo,aumentam-seavarinciados parmetrose o desvio-padro. Tende, portanto, a fazer com que seja no significativo, mas aumenta o coeficiente R2. 2.2.Pressuposio 2: O erro aleatrio tem mdia zero Econometria Prof. Adriano M. R. Figueiredo 16 Significa que o erro tem uma distribuio de probabilidade centralizada em zero (com mdiazero).Oerrooefeitodasvariveisquenoconsigoexplicarnomodelo.Amdia pode ser considerada como o valor esperado do erro, ou seja,

Ou na forma matricial,

Dado que Portanto,E(Y)=Xeomodelofornecesoluesadequadasestatisticamente.Essa pressuposioimportanteparaterconfiananaestimaopor=(XX)-1XY.Casoos erros no tenham mdia zero, o estimador = (XX)-1XY ser tendencioso. Observe na figura que traz as taxas de retorno observadas e estimadas para a ao das LojasAmericanasS.A.,verifiquequeexistemmomentosemqueospontosvermelhos(com marcadorquadrado)estoacimaqueosverdes(commarcadordex)eemoutrosmomentos estoabaixo.Ogrficodosresduosobtidosfazendoresduoigualadiferenaentreo observadoeoestimado,tem-sevalorespositivosenegativos.Apressuposioprevque estes,namdia,sejamnulos.Ainda,nogrficodedispersodeRLAMExRREN,pode-se observarqueexistemresduosuipositivosenegativosequearetaderegressoestimada como a reta de tendncia passa aproximadamente no meio da nuvem de pontos. Econometria Prof. Adriano M. R. Figueiredo 17 -.3-.2-.1.0.1.2.3-.4-.2.0.2.42005 2006 2007 2008 2009 2010 2011Residual = observado menos estimadoActual - observadoFitted - estimadoResultados de RLAME = f(RREN, RBVSP) e resduos-0.4-0.3-0.2-0.100.10.20.30.40.5-0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5RLAME x RRENRREN Linear (RREN)ui>0ui (XX)-1 e V() 2.aumenta erro-padro 3.reduzt=>induznosignificncia=>estareiaceitandoofatodequea varivelnoimportantenomodeloemvirtudedamulticolinearidade,mas que na realidade a varivel poder ser importante ao corrigir o modelo 4.Estimativasmuitosensveis:tirandoumaouduasobservaes,asestimativas alterammuito=>melhorterummodeloondeasalteraesnoalteram muitoasestimativas,umacertaestabilidadedomodeloemtermosde magnitudes e sinais 2.8.Resumo das pressuposiesApresentadasaspressuposies,oQuadro1temumresumocomaexpresso matemticaemformaescalarematricial,assimcomooproblemaquesetemcasoas pressuposiessejamvioladasounoatendidas.Emgeral,pode-sedizerquesetestaro modelo e, em caso de violao, se tratar ou corrigir adequadamente. Econometria Prof. Adriano M. R. Figueiredo 25 Quadro 1. Pressuposies do Modelo de Regresso Linear Clssico Normal Pressuposio Expresso Matemtica* Problema (o que acontece se as pressuposies no forem atendidas)Notao EscalarNotao Matricial 1. Relao Linear Yi=0 + 1 Xi1 + ... + k Xik + i em que i =1, 2, 3,..., n Y = X + No linearidade,Erro de especificao dos Xs 2 . Mdia do erro zeroE(i) = 0 para todo iE() = 0, onde e 0 so vetores nX1Erro de especificao 3. Varincia do erro constanteE(i) = , para todo i E() = I Heterocedasticidade 4. Erros independentesE(ij) = 0, i jAutocorrelao 5. Variveis explicativas so no estocsticas ou fixas X1, X2, ..., Xkso fixos Cov(Xij, i) = 0 p/j= 1, 2, 3, ..., n A matriz X no estocstica Cov(X, ) = 0 Erros nas variveis, Varivel dependente defasada, Relaes simultneas 6. Independncia linear entre as variveis explicativas Ausncia de relao linear entre os Xs Posto de X igual ao seu nmero de colunas, isto ,(X) = p < n Multicolinearidade 7. Erro tem distribuio normal i ~ N (0, ) i = 1, 2, 3, ..., n ~ N (0, I) Erros no normais * Em que Y = [Yi] um vetor (n x 1) das observaes da varivel dependente; X = [Xij] uma matriz (n x p) das observaes das variveis independentes; = [i] um vetor (nx1) dos erros aleatrios; = [j], j = 0, 1, 2, ..., k um vetor pX1 de parmetros a serem estimados; a varincia do erro, tambm a ser estimada; I uma matriz identidade de ordem(m x n); k o nmero de variveis independentes; p =(K + 1) o nmero de parmetros; n o nmero de observaes; E significa valor esperado ou esperana matemtica. Econometria Prof. Adriano M. R. Figueiredo 26 3Estimao A estimao dos parmetros do modelo linear pressupe a satisfao aos pressupostos bsicos anteriormente mencionados. O princpio que norteia os clculos obter valores de parmetros que minimizem a Soma do Quadrado dos Resduos - SQRes, ou comumente chamado de Mnimos Quadrados Ordinrios - MQO. Ou seja, para o modelo Y = X + a estimao requer a minimizao conforme a seguir:FORMA ALGBRICA: Min i2 = (Yi 0 1X1i 2X2i)2 FORMA MATRICIAL: Min ou Min SQRes Oproblemamatemticodeotimizar,ouseja,minimizarumprodutodeumvetor linha por um vetor coluna. Portanto, deriva-se e iguala a zero obtendo a soluo para o vetor de parmetros. Segue abaixo: ( ) ( )( )12 2 0 ' Y X Y X ' Y Y Y X X Y X X( ' )X Y X XX X X YX X X Y'c c = | |' ' '' '' c c = || +| |c c c' ' = + | =c|' ' | =' ' | = Portanto, o estimador dos parmetros pelo mtodo de Mnimos Quadrados Ordinrios (MQO) : ( )1(k+1 x 1)X X X Y' ' | = Assim, com as matrizes X e Y posso obter os parmetros estimados. O estimador da varincia dos resduos ser s2, para os (n-p) Graus de Liberdade (GL = nmero de observaes, n, menos o nmero de parmetros, p): 2SQRes SQRes e esn p n p G.L.'= = = A matriz de varincia-covarincia dos parmetros ser: Sistema de equaes normais dos mnimos quadrados Vlida para no multicolinearidade de X Econometria Prof. Adriano M. R. Figueiredo 27 ( )( )( )( ) ( ) ( ) ( )( )( )( )( ) ( )( )( ) ( )11 1 1111 11 1 Var Cov( ) EmasX X X YX X X X X X X X X X XI . X X XX X XVar Cov( ) E X X X X X XVar Cov( ) E X X X X X X ' ( | = || || ( ' ' | =' ' ' ' ' ' | = |+ c = |+ c' ' | = |+ c' ' || = c' (' ' ' ' | = c c ( (' ' ' ' | = cc Mas como X so fixas, independentes dos resduos, o valor esperado se reduz a: ( ) | | ( )( ) ( )1 11 12Var Cov( ) X X X E X X XVar Cov( ) X X X IX X X ' ' ' ' | = cc' ' ' | = o Ou seja, ( ) ( )( )( )( )1 12121212Var Cov( ) X X X X X XVar Cov( ) I X XVar Cov( ) X XouVar Cov( ) s X X ' ' ' | = o' | = o' | = o' | = Destaforma,tm-seasequaesessenciaisparaaestimao.Seguequadroresumo abaixo, com os estimadores de MQO. Quadro 2. Estimadores de Mnimos Quadrados Ordinrios. ( )( )1212SQRes SQResX X X Ye esn p n p G.L.Var Cov( ) s X X' ' | ='= = = ' | = Estimadores dos parmetros Estimador da varincia-covarincia dos resduos Estimador da varincia-covarincia dos parmetros Econometria Prof. Adriano M. R. Figueiredo 28 O valor dos erros padres dos parmetros ser obtido a partir da raiz da varincia dos parmetros, ou seja, tirando-se a raiz da diagonal principal da var-cov(). Os parmetros devem ter anlise de significncia, por meio de um teste de hiptese do tipo t: 0100 jjjjcalculado n pG.L. H :H : ( bilateral )t ~ ts|| =| =|= Ossoftwareseconomtricosemgeraldisponibilizamovalordaprobabilidade(p-value)associadoaovalordetcalculado.Destaforma,pode-secompararcomnveis predeterminadosdesignificnciapararejeitarounoahiptesenula.Emgeral,costuma-se observar os valores das probabilidades comparando a 10%, 5% ou 1% para concluir a respeito da hiptese nula. Espera-se, para que a varivel X tenha efeito no nulo sobre Y, que se rejeite a hiptese nula e que assim, os valores calculados dos parmetros permitam uma interpretao econmica deste efeito. Para auxiliar o entendimento, possvel decompor a variao de Y como abaixo:

Variao total = variao explicada por X + variao no explicada

:variao devida regresso SQTot=SQReg + SQResY X

+

(reta estimada)

Econometria Prof. Adriano M. R. Figueiredo 29

EmqueSQTotasomadosquadradostotais(relativavariaototal),SQResa somadoquadradodosresduos(relativavariaonoexplicada)eSQRegasomados quadrados da regresso (relativa variao explicada por X). ( )( )22 2 2 2222 2SQTot 2SQResSQRegSQTot SQReg + SQResi i i i i iii i y y y e e Y Y Y Y nY e e' e Y Y X Y y Y Y Y Y nY' = = + + = = ' '' = = = |' = = = = O coeficiente de determinao (R2 R-squared ou R quadrado) utilizado para avaliar quanto da variao total explicada. Define-se como:

Seu intervalo de variao de zero a um em condies normais: 0 < R2 < 1.Se SQRes=SQT ento R2=0.Se SQRes 0 ento R2=1.Ou seja, mede quanto da Variao de Y est sendo explicada por Variaes de X, ou seja,medeaqualidadedoajustamento.Procura-seestimarummodelocomomaiorR2 possvel. Em geral, acredita-se ter um modelo bem ajustado para valores maiores que 0,8, mas sempre se deve ter cautela quanto a esses indicadores usualmente aceitos. Na forma matricial, o clculo ser; 222 21 X Y nY Y Y X YRY Y nY Y Y nY'' ' '' | |= = ' ' Outroindicadortil,principalmenteparacomparaesentremodelosoR2 ajustado (adjusted R-squared). Ele recebe este nome, pois se faz um ajustamento de SQRes e de SQTotquanto aos graus de liberdade da respectiva variao. Assim, tem-se: ( )( )2SQResn-p1SQTotn-1R = Em geral, quanto maior o nmero de variveis X, maior o valor de R2, mas para o R2 ajustadoestaregranovale.Justamenteparaevitarainclusoequivocadadevariveis Econometria Prof. Adriano M. R. Figueiredo 30 explicativas que se usa o R2 ajustado. Assim, a incluso de uma varivel irrelevante poder elevar o valor de R2, mas no necessariamente elevar o valor de R2 ajustado. Senforgrandeeppequenoemrelaoan,adiferenaentre 2R(Rquadrado ajustado)eRserpequena.Senforpequenoepgrandeemrelaoan,adiferenaentre ambos pode ser grande e o valor ajustado ser mais importante. OutroindicadoroTesteFdaregresso(F-statistic).Procura-sesaberseomodelo temsuporteestatstico.oTestedesignificnciaglobaldaregresso:osXsemconjunto explicam Y de forma significativa. A hiptese nula de que todos os parmetros em conjunto so nulos. A Hiptese alternativa prev pelo menos um parmetro no nulo. 0 1 210 0 0 0kiH : , ,...,H : pelo menos um| = | = | =| = Define-se a estatstica de teste F como: 1SQRegp-1SQResn-pp ,n pG.L.F ~ F =Se Fcalculado > Ftabelado , ento rejeita-se H0 e concluo pela existncia de ao menos um X explicandoY.Deseja-seumP-value(Fdesignificao)menorque10%,5%ou1%, similarmente ao teste de t dos parmetros. Essesindicadoresemgeralsoobtidosemtodosossoftwareseconomtricosou estatsticos.Pode-semencionaralguns:Excel,Eviews,Stata,Gretl,SAS,SPSS,Gauss,e MatLab. Alguns sites podem auxiliar ao leitor: http://www.oswego.edu/~economic/econsoftware.htmhttp://www.economics.ltsn.ac.uk/software/econometrics.htmhttp://emlab.berkeley.edu/eml/index.shtmlO anexo apresenta rotinas para execuo dosclculos usando matrizes noExcel. Um software bastante interessante, plataforma livre e com verso em portugus o Gretl, no link: . OsestimadoresdoMQOsoosMelhoresEstimadoresLinearesNotendenciosos (MELNT).Ouseja,quantomaioraamostra,tendendoaoinfinito,osestimadoresdeMQO tenderoaosvaloresverdadeiros,osqueseteriaparaapopulao,notendenciosos,de varincia mnima.Econometria Prof. Adriano M. R. Figueiredo 31 Anexo 1: Estimao utilizando matrizes no Excel: 1.Entrada dos dados: a.Digitar matriz de dados Xe Y no Excel i.Gujarati (2006: p.71)X(10x2)e Y(10x1) Tabela. Despesas familiares de consumo semanal Y e renda familiar semanal X dados hipotticos. obs Y (consumo) X X0 (intercepto) X1 (renda) 170180 2651100 3901120 4951140 51101160 61151180 71201200 81401220 91551240 101501260 Fonte: Gujarati (2006: p.71). 2.Copiar X e colar especial selecionando transpor, fazendo X (2x10) 3.Fazer multiplicao X.X (2x10).(10x2) = XX(2x2) a.Seleciona a rea de sada (2x2) b.Inserir frmula matemtica Matriz.mult i.Matriz 1 = X ii.Matriz 2 = X c.Teclar OK d.Teclar F2 e.Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os dados da matriz XX (2x2) 4.Fazer inversa de XX fazendo (XX)-1 a.Selecionar rea de sada (2x2) b.Inserir frmula matemtica Matriz.inverso c.Matriz = XX d.Teclar OK e.Teclar F2 f.Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os dados da matriz (XX)-1 (2x2) 5.Fazer XY (2x10).(10x1) = XY(2x1) a.Selecionar rea de sada (2x1) b.Inserir frmula Matriz.mult i.Matriz 1 = X ii.Matriz 2 = Y Econometria Prof. Adriano M. R. Figueiredo 32 c.Teclar OK d.Teclar F2 e.Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os dados da matriz (XY) (2x1) 6.Clculo de beta estimado a.Betaest = (XX)-1(2x2) (XY)(2x1) = (XX)-1(XY)(2x1) i.Selecionar sada 2x1 ii.Inserir frmula Matriz.mult 1.matriz 1 = (XX)-1

2.matriz 2 = (XY) b.Teclar OK c.Teclar F2 d.Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os dados da matriz (betaest) (2x1) 7.Para obter Matriz de var-cov(betaest) fazer a.' = YY betaest. XY i.Calcular YY pela funo Matriz.mult ii.Calcularbetaest. XY pela funo Matriz.mult 1.matriz 1 = betaest 2.matriz 2 = XY iii.Fazer diferena i ii b.Calcular sigma quadrado: s2 = /(n-k) i.n-k = graus de liberdade c.Calcular var-cov(betaest) = s2.(XX)-1(2x2) i.Fazer multiplicao de escalar por cada elemento de (XX)-1 8.Fazer a raiz quadrada dos elementos da diagonal, obtendo os erros padres dos parmetros estimados: utilizar a funo RAIZ( ) do Excel. 9.Calcular o valor de t fazendo t = betaest/erropbeta .O valor da probabilidade do teste podeserobtidopelafunoestatsticadoExcel,fazendoDISTT(t;n-p;2)que retornarovalordaprobabilidadeparaP(t>t)paraovalort,paran-pgrausde liberdade e 2 caudas (bicaudal). 10. Calcular R2 a.R2 = SQE/SQT=(betaest.XY n. Y2)/(YY - n. Y2) i.Y = mdia de Y b. 1 nSQTp ns Re SQ11 nSQT1 pSQER2 ==c. ) GL ( p n , 1 pF ~p ns Re SQ1 pSQEF = Econometria Prof. Adriano M. R. Figueiredo 33 Anexo 2: Exerccios: 1. De acordo com a metodologia economtrica, responda verdadeiro (V) ou falso (F): ()Aheterocedasticidadeumproblemanomodeloderegressoclssicopoisalteraoserros-padres dos parmetros. () A expresso ( ) Y X X X ' '1 = | permite o clculo dos parmetros por MQO. () A existncia de resduos autocorrelacionados implica em interdependncia entre os mesmos. () A aceitao da hiptese nula do teste t-Student dos parmetros implica na existncia de efeitos da varivel X sobre Y no modelo Y = f(X) + () sempre desejvel acrescentar variveis ao modelo de regresso at o limite de dez regressores. ()AexpressoparaobtenodosparmetrosporMnimosQuadradosOrdinrios, ( ) Y X X X ' '1 = | pode ser utilizada para um modelo logaritmizado linear. ()Apressuposiodeno-autocorrelaodosresduosimplicaemcovarinciasnulasentreos mesmos. ()AestimaorealizadapelaFerramentadeAnlisedeDadosdeRegressonoExcelforneceos mesmos parmetros estimados que em ( ) Y X X X ' '1 = |.() A idia bsica da estimao economtrica obter os parmetros de tal forma que a soma dos erros seja, na mdia, nula, e a soma de seus quadrados seja mnima. ()AexpressoparaobtenodosparmetrosporMnimosQuadradosOrdinrios, ( ) Y X X X ' '1 = | refere-se a um modelo linearizado qualquer. ()Aheterocedasticidadedosresduosimplicaemvarinciasconstantesdosresduosaolongoda amostra. ()AestimaorealizadapelasoperaesmatriciaisnoExcelfornecemosmesmosparmetros estimados que a Ferramenta de Anlise de Dados de Regresso do referido software.() A especificao do modelo no precisa ser feita antes da estimao, pois as vezes ser necessrio excluir alguma varivel do modelo. () A fase de estimao do modelo consiste em determinar os parmetros da equao estimada. () Todo modelo estimado pode ser utilizado para fazer previses da varivel explicada. ()Aeconometriapodefavorecer todasas reas daeconomia,pois sempre possvel explicar tudo que se quer com a econometria. ()Omodeloderegressolinearsimplesumcasoespecficodomodeloderegressolinear mltiplo, podendo estimar os parmetros matricialmente nos dois casos. 2. Cite e comente a pressuposio de linearidade do modelo de regresso clssico. 3.OmtododeestimaodeMnimosQuadradosOrdinriosumdosmaisutilizadosparaestimar parmetros economtricos. Explique o que significa e o raciocnio por trs desse mtodo. 4.Citeecomenteapressuposiodepresenadehomocedasticidadedosresduosdomodelode regresso clssico. 5. Suponha que se tem dados municipais para o modelo lnQi = o + 1.lnJUROSi1 + 2.lnRDi2 + i, em que Q a quantidade demandada de moeda no municpio i, em milhares de reais; JUROS a taxade juros interbancria (CDI) emvalores nominais; RD arendadisponvel per capitaem reais; s so parmetros do modelo e o erro aleatrio tal que ~ N(0,s2). Pergunta-se: a)Comovoc fariaparaobter osvaloresdossnum ambientecomputacional do Microsoft Excel? Quais os passos necessrios para execuo da estimao? b) possvel fazer por meio matricial? Quais os passos necessrios para execuo da estimao? Econometria Prof. Adriano M. R. Figueiredo 34 6.SejaumexemplodaversomodificadadaCurvadePhillipsmacroeconmica,relacionandoo ndicedesalrioscomovariveldependente(W)comofunodospreos(IGP),dataxade desemprego (U) e do produto nacional bruto (PNB) como variveis independentes. O modelo ser do tipo: t t 3 t 2 t 1 0 tU PNB IGP W c + | + | + | + | = .Interpreteosresultadosabaixoeavalie comparativamenteosdoisresultados.Fonte:dadosmensaisdeW,UeIGP-DI,coletadosno www.ipeadata.gov.br e realizaram-se mdias anuais. O PIB per capita anual foi obtido diretamente do mesmo site. Dependent Variable: LOG(W) Method: Least Squares Date: 03/22/06 Time: 11:05 Sample: 1980 2004 Included observations: 25 VariableCoefficientStd. Errort-StatisticProb. C-17.741513.737840-4.7464590.0001 LOG(IGP)-0.0202700.002273-8.9180100.0000 LOG(PIB)2.4508330.4076856.0115890.0000 LOG(U)0.4251830.0682496.2298850.0000 R-squared0.818600 Mean dependent var5.414171 Adjusted R-squared0.792686 S.D. dependent var0.181513 S.E. of regression0.082646 Akaike info criterion-2.002847 Sum squared resid0.143439 Schwarz criterion-1.807827 Log likelihood29.03559 F-statistic31.58878 Durbin-Watson stat1.724283 Prob(F-statistic)0.000000 Dependent Variable: W Method: Least Squares Date: 03/22/06 Time: 11:10 Sample: 1980 2004 Included observations: 25 VariableCoefficientStd. Errort-StatisticProb. C-290.8117327.1702-0.8888700.3841 IGP-0.3268470.193898-1.6856640.1067 PIB0.0461820.0341761.3513210.1910 U21.077828.0480402.6190000.0160 R-squared0.255609 Mean dependent var228.0943 Adjusted R-squared0.149268 S.D. dependent var40.64528 S.E. of regression37.48923 Akaike info criterion10.23163 Sum squared resid29514.30 Schwarz criterion10.42665 Log likelihood-123.8954 F-statistic2.403666 Durbin-Watson stat0.607152 Prob(F-statistic)0.096187 7.SejaumexemplodoPIBReal(REALGDP)comofunodoConsumoReal(REALCONS), InvestimentoReal(REALINVS),GastosReaisdoGoverno(REALGOVT),eTransaesLquidas ReaiscomoExterior(REALINT),OBSavariveldetendncia.EncontreoR2,R2ajustado,os coeficientes, erros-padres e valores de t para completar os resultados e analise-os a seguir: Econometria Prof. Adriano M. R. Figueiredo 35 Dependent Variable: REALGDP Method: Least Squares Date: 03/09/06 Time: 08:29 Sample: 1950:1 2000:4 Included observations: 204 VariableCoefficientStd. Errort-StatisticProb. REALCONS1.12393644.487540.0000 REALINVS0.5163960.04404611.724010.0000 REALGOVT0.5388370.0561649.5940290.0000 REALINT1.089732-1.5583850.1207 OBS1.9289420.3709990.0000 C121.901124.047635.0691540.0000 R-squared Mean dependent var4562.646 Adjusted R-squared S.D. dependent var2113.962 S.E. of regression40.65281 Akaike info criterion10.27698 Sum squared resid327224.9 Schwarz criterion10.37458 Log likelihood-1042.252 F-statistic109744.5 Durbin-Watson stat0.246057 Prob(F-statistic)0.000000 Econometria Prof. Adriano M. R. Figueiredo 36 4Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear Omodeloclssicodeanlisederegressoconstrudocombasenumasriede pressuposiesreferentesaocomportamentodapopulao.Estaspressuposiesforamdescritas nasseesanterioreseaquisediscuteprincipalmenteaformadetestarahipteseea operacionalizao da soluo. 4.1.Pressuposio 1: A relao entre Y e X linear -Deteco do problema:Entre outros testes, o teste RESET de Ramsey (1969)3 um dos mais aplicados na literatura. O nome vem do pesquisador Ramsey para o Regression Specification Error Test ou teste de erro de especificaodaregresso(NoEviews,vernajaneladaequaootestedeestabilidade(Stability Tests) e definir o nmero de termos estimados). O teste baseado na regresso aumentada Y = X + Z + emqueXsoasvariveisexplicativaseZsovariveisdependentesestimadaseelevadasauma potncia Z=[Yest2Yest3Yest4]exemploparatrsfittedterms(termosacrescentadosnaregresso aumentada). Aidiaolharasignificnciadosparaverseostermosacrescentadossorelevantesno modelo, indicando erro de especificao. Procedimento do teste:1)estima-se Y = X + 2)obtm-seosvaloresprevistosdeYegera-seYest2Yest3oumaisse desejar. Recomenda-se no mximo at 3 termos, ou seja, at Yest4. 3)Ajusta-se a regresso aumentada, colocando-se os X e as variveis do item 2 : Y = f ( X, Yest2, Yest3 ) 4)Com as regresses de 1 e de 3, observam-se os valores de R2 novo (de 3) e R2 velho (de 1)e calcula-se a estatstica de teste:

3Ramsey, J. B. (1969) Tests for Specification Errors in ClassicalLinearLeast SquaresRegression Analysis,Journal of the Royal Statistical Society, Series B, 31, 350371. Econometria Prof. Adriano M. R. Figueiredo 37 5)Estatstica de Teste; (p) mod1) (22 2elo novo no parametros nmero nRm s regressore novos de nmeroR RFnovovelho novo=F ~ Fm,n-p m o nmero de novos regressores n-ponmerodeobservaesmenosonmerodeparmetrosno novo modelo 6)CompararoFdoitem5comoFdatabela,paraonveldesignificncia, numeradormedenominadorn-p.Comoahiptesenuladequenoh erro deespecificao,espera-se que a hiptesenula no seja rejeitada, ou seja, que F seja muito pequeno. OtesteRESETindicaapenasseomodeloestespecificadoincorretamente,masnodiz qualseriaasoluo.Asoluoparaumproblemaseriaincluiroutrasvariveisrelevantesno modelo,retirarasirrelevantes,oumudaraformafuncional.Portanto,obomsensoindicaque melhor incluir variveis do que excluir, pois a excluso pode causar vis, enquanto a incluso tende a melhorar o modelo, a no ser pela possibilidade de no-significncia dos parmetros. -Implementao no Eviews: No Eviews, aps a estimao dos parmetros, abre-se a janela da equao e depois clica-se em View, e posteriormente em Stability Tests. A opo do teste RESET aparecer em outra janela perguntandoquantostermosajustadosseroincludos(fittedterms).Oalunodeveestabelecer quantos termos (sugere-se at 3) e clica-se em ok. O programa gerar a estatstica de teste RESET deRamsey,masaquiahiptesenulaumpoucodiferentedotestecalculadoanterior,poiso programatestasetodososparmetrossozeros,oqueindicarquenoherro.Portanto,sea probabilidadedeFdoEviewsforabaixodonveldesignificncia(porexemplo,10%)(Falto), pode-sedizerquerejeita-seahiptesenulaeexisteumerrodeespecificao.SeoFforbaixo, aceita-se que =0 e, portanto, no h erro de especificao. No exemplo, mostra-se que existe erro de especificao. Econometria Prof. Adriano M. R. Figueiredo 38 Tabela 1. Exemplo de sada do Eviews para o Ramsey RESET Test. Ramsey RESET Test: F-statistic5.281559 Probability0.001932 Log likelihood ratio15.74446 Probability0.001279 Test Equation: Dependent Variable: QSOJA Method: Least Squares Date: 06/06/03 Time: 14:57 Sample: 1988:09 1998:05 Included observations: 117 VariableCoefficientStd. Errort-StatisticProb. FERTILIZANTE304.1298135.04692.2520310.0263 TRATOR18591.298231.7672.2584810.0259 MO115237.751069.362.2564930.0260 C-230604.7101861.3-2.2639080.0255 FITTED^22.6648041.1652692.2868570.0241 FITTED^3-0.0056420.002453-2.3000250.0233 FITTED^44.43E-061.92E-062.3026170.0232 R-squared0.532456 Mean dependent var322.2544 Adjusted R-squared0.506954 S.D. dependent var56.01272 S.E. of regression39.33059 Akaike info criterion10.23985 Sum squared resid170158.4 Schwarz criterion10.40510 Log likelihood-592.0310 F-statistic20.87869 Durbin-Watson stat0.770973 Prob(F-statistic)0.000000 Outra forma olhar os diferentes modelos e comparar o R2 ajustado. Quanto mais prximo de 1 melhor ser a estimao. deficiente para o caso de varivel omitida. OutrasopessoobservaroscoeficientesdocritriodeAkaikeeSchwarz,fornecidosna sada da estimao do Eviews. Menores coeficientes AIC e SIC indicam melhores ajustamentos da regresso,masspodemsercomparadosseasunidadesdasvariveisdasdiferentesregresses forem as mesmas (por exemplo, no se aplica numa comparao entre Y e outra com LogY). Deve-se olhar todos os critrios para melhor anlise dos resultados. OCritriodeInformaodeAkaike(ouAICdeAkaikesInformationCriterion)ouo CritriodeInformaodeSchwarzouBayesiano(ouSICdeSchwarzsInformationCriterionou emalgunslivrosBICdeBayesianInformationCriterion)soexpressosnoEviewsdaformaj logaritmizada como:

Econometria Prof. Adriano M. R. Figueiredo 39 em que k o nmero de regressores incluindo-se o intercepto;n o nmero de observaes;l o log Verossimilhana da regresso; e so os resduos estimados do modelo.No formato mais simplificado exposto por Greene (2002), tem-se:

Econometria Prof. Adriano M. R. Figueiredo 40 Anexo Fazendo o teste RESET para investigar se existe erro de especificao: 1)fazer a estimao original a ser testada Econometria Prof. Adriano M. R. Figueiredo 41 2) na janela Equation, entrar em View, Stability Tests, Ramsey Reset Test como na figura a seguir: 3) na janela RESET Specification, colocar o nmero de variveis a serem adicionadas no teste (nmero de variveis dos valores previstos de Y) ente sucessivam assim 3 digitar ento (FITTED^4) Y e(FITTED^3) Y e(FITTED^2) Y apenasinserir se 2 digitar ento (FITTED^3) Y e(FITTED^2) Y apenasinserir se 1 digitar ento (FITTED^2) Y apenasinserir se 4 3 23 22 O RESULTADO SAIR CONFORME A LTIMA IMAGEM A SEGUIR Econometria Prof. Adriano M. R. Figueiredo 42 Econometria Prof. Adriano M. R. Figueiredo 43 4.2.Pressuposio 2: O erro aleatrio tem mdia zero Amaiordificuldadequenoexistetesteformalparaessapressuposio.similaraum erro de especificao do modelo, como por exemplo, com variveis relevantes omitidas do modelo. Omodelocomumacorretaespecificaoprovavelmentenoterproblemascommdiados resduos no nula. Normalmente se faz o teste simples de H0: mdia igual a zero para investigar a violao ounodapressuposio.Valoreselevadosparaaprobabilidadeindicaroaaceitaodahiptese nula e confirmao da pressuposio. Econometria Prof. Adriano M. R. Figueiredo 44 Anexo: Roteiro para testar mdia dos resduos nula: Econometria Prof. Adriano M. R. Figueiredo 45 Tabela dos resduos observaoobservadoprevistoresduos obsActualFittedResidual 1971Q3 11484.0 10943.9 540.083 1971Q4 9348.00 9417.85-69.8452 1972Q1 8429.00 9502.75-1073.75 1972Q2 10079.0 9184.43 894.568 1972Q3 9240.00 8884.84 355.164 1972Q4 8862.00 9288.01-426.006 1973Q1 6216.00 7311.47-1095.47 1973Q2 8253.00 7595.20 657.800 1973Q3 8038.00 8297.50-259.501 1973Q4 7476.00 7559.49-83.4900 1974Q1 5911.00 5955.55-44.5506 1974Q2 7950.00 6004.86 1945.14 1974Q3 6134.00 6802.14-668.142 1974Q4 5868.00 6544.46-676.458 1975Q1 3160.00 3992.40-832.395 1975Q2 5872.00 5035.14 836.855 Econometria Prof. Adriano M. R. Figueiredo 46 Na janela do Workfile, na serie Resid, possvel fazer o teste t para a mdia dos erros igual a zero: Econometria Prof. Adriano M. R. Figueiredo 47 NajanelaViewdaSeries:Resid,escolheraopoTestsforDescriptionStats,Simple Hypothesis Tests: AjaneladosimpleHypothesistestspermitirespecificarseamdiaigualazero, especificando zero e teclando ok: Econometria Prof. Adriano M. R. Figueiredo 48 Hypothesis Testing for RESID Date: 03/16/06 Time: 17:12 Sample: 1971Q3 1975Q2 Included observations: 16 Test of Hypothesis: Mean =0.000000 Sample Mean = -4.16e-16 Sample Std. Dev. =0.144606 MethodValueProbability t-statistic-1.15E-141.0000 Como o valor da probabilidade implica na aceitao da hiptese nula, ou seja, H0: mdia = 0 Econometria Prof. Adriano M. R. Figueiredo 49 4.3.Pressuposio 3: O erro aleatrio tem varincia constante (presena de homocedasticidade) Apresenadeheterocedasticidadenogeravisoutendenciosidadenosparmetros angulares. Entretanto, os parmetros de M.Q.O. no sero os mais eficientes (pois o M.Q. O. superestimaroverdadeiroerro-padroepresenadeheterocedasticidade)eaestimao deverserfeitaporMnimosQuadradosGeneralizados(M.Q.G.),queconsisteemum M.Q.O.paravariveistransformadasquesatisfazemashiptesesusuaisdemnimos quadrados. A mecnica passa pela diviso de todas as variveis, por exemplo, pelo respectivo desvio-padrodoresduo,oucasoodesconhea,pelavarivelexplicativacorrelacionadaao resduo. Procede-se da seguinte forma. Primeiro realiza-se o teste de Glejser, que entre outros comoodeGoldfeld-Quandt,apresenta-semaiseficienteeauxilianaimplementaoda correodoproblema.Essetestepermitequeseindiqueaexatarelaoexistenteentrea varivel X e os resduos (Diaz, 2000)4. Passos: 1.estimar o modelo inicial: Y = X + 2.com os resduos de 1, estimar as regresses auxiliares: a.|ei| = 0 + 1Xi b.|ei| = 0 + 1Xi2 c.|ei| = 0 + 1(1/Xi) d.|ei| = 0 + 1(Xi) e.|ei| = 0 + 1Xih em que h denota uma potncia. Seo1fordiferentedezeroemalgumadasregressesauxiliares(peloteste usual de t), ento rejeita-se a hiptese nula de que no h heterocedasticidade. Portanto,existeheterocedasticidade.Casotodasasregressestenham1=0, ento no existe heterocedasticidade.

4 DIAZ, M.D.M. Problemas economtricos no modelo linear geral. In: VASCONCELLOS, M.A.S.; ALVES, D. (Coords.) Manual de econometria. So Paulo:Atlas, 2000. p.105-137.Econometria Prof. Adriano M. R. Figueiredo 50 Esteproblemadepresenadeheterocedasticidadetambmpodeserdetectadopor meio de anlisegrfica.Pode-se estimar afuno e fazer ogrfico dosresduos ao longo da amostra: ei x Xi ei x Yi ou Yi,estimado ConhecidooresultadodotestedeGlejser,utiliza-seavariveldaregressoauxiliar queacusouoproblema paraponderarasvariveis,transformando-as,eprocedendoa estimao de M.Q.G., ou seja, M.Q.O. nas variveis transformadas. A estimao por M.Q.G. ser para o modelo: P.Y = PX + P e o vetor de parmetros estimados ser = (XPPX)-1XPPY que o mesmo que estimar o M.Q.O. para Y* = X* + *. OsresduospodemserobtidosnoEviewsfazendo,najaneladeumaequao, Procs/make residual series. O programa pergunta o nome da srie a conter os resduos e uma vez feito isso s especificar a srie como varivel. Omtodocomodescritoacimaumaalternativaapresentadaemvrioslivrosde econometria,mascomoatransformaofazendoY/Xipodegerarumacorrelaoespria, indicandoumacorrelaoentreY/XquenarealidadenoocorreriaentreYeXcasono fossefeitaatransformao,sugere-seentoostestesdeWhiteedeBreusch-Paganea correo de White5. Por exemplo, para uma regresso da forma

o teste de White implementado manualmente da seguinte forma: a) estima-se a regresso inicial e obtm-se os resduos ei; b) faz-se uma regresso auxiliar do tipo

ouseja,oquadradodosresduosestimadoscomofunodasvariveisexplicativas,dos quadrados das variveis explicativas e do produto cruzado das variveis explicativas. Deve-se incluir o termo do intercepto (1) mesmo que na regresso original no o tenha.

5White,Halbert(1980)AHeteroskedasticity-ConsistentCovarianceMatrixandaDirectTestfor Heteroskedasticity, Econometrica, 48, 817838. Econometria Prof. Adriano M. R. Figueiredo 51 c)Analisa-seoR2daregressoauxiliarmultiplicadopelotamanhodaamostra(n) comparandocomovalordatabelaqui-quadradoparagrausdeliberdadeiguaisaonmero total de regressores da equao auxiliar. No nosso exemplo,n. R2 ~2 comgl = 5 (X2i, X3i , X2i2, X3i2 , X2i.X3i) Se n.R2 > 2 tabelado, ento existe heterocedasticidade. Sen.R2 no h autocorrelao Contra a hiptese alternativa H1: 0 => > 0 autocorrelao positiva => < 0autocorrelao negativa A estatstica de teste o chamado DW, calculado como: ( )( ) =cc c=== 1 2 DWT1 t2tT2 t21 t t em que = 0 DW = 2=> ausncia de autocorrelao = +1 DW = 0=> autocorrelao positiva e perfeita = -1DW = 4=> autocorrelao negativa e perfeita Portanto, deseja-se DW prximo de 2, ou seja, ausncia de autocorrelao. Econometria Prof. Adriano M. R. Figueiredo 65 AanliserequeracomparaodosvaloresdeDWcomvalorestabelados,que prevemduasdistribuiesdeprobabilidadeentrelaadas:umadistribuioinferioreoutra superior.Elasdeterminamreasdeaceitaoerejeiodahiptesenula,comonafiguraa seguir: em que dL = limite inferior=> vem da tabela para n observaes e k variveis explanatrias dU = limite superior => vem da tabela para n observaes e k variveis explanatrias Exemplo:Para k = 3 (referente a um modelo comX1, X2e X3), para n = 30 observaes, a tabela de DW para 5% de significncia nos fornece dL = 1,21 e dU=1,65, e portanto,4-dL = 4 1,21 = 2,79 4 dU = 4 1,65 = 2,35 Para 0