51060700-Econometria

43
ECONOMETRIA 1 MODELO DE REGRESSÃO LINEAR SIMPLES

Transcript of 51060700-Econometria

  • ECONOMETRIA 1 MODELO DE REGRESSO LINEAR SIMPLES

  • ECONOMETRIAREFERNCIAS:

    Introduo Econometria Uma abordagem Moderna. Jeffrey M. Wooldridge 2 edio 2006Estatstica e Introduo a Econometria Alexandre Sartoris Ed.Saraiva. 1edio - 2004

  • ECONOMETRIARegresso: Processo o qual tenta se estimar a relao entre duas ou mais variveis Regresso Linear Simples: ocorre quando a regresso apresenta apenas uma varivel independente.

  • ECONOMETRIARegresso Linear Simples(RLS)

    Formalmente a RLS se apresenta no seguinte formato:

    Sendo: equao da reta.

    : termo de erro.

    O termo , deve ser includo na regresso, pois como mostra o grfico, o valor de Y no ser exatamente dado pelo ponto da reta. Em segundo, o termo , se refere diretamente a impreciso de medidas, por mais preciso que este seja.

  • ECONOMETRIAPor fim, o erro da conta de todos os eventos de difceis mensurao, mas que so (supostamente) aleatrios. Se o modelo que estivermos trabalhando estiver corretamente especificado, podemos supor, que em mdia o erro tem valor zero, isto , a probabilidade do erro ser x unidades acima da reta a mesma de ser x unidades abaixo da reta.Com isso, temos a primeira hiptese sobre o modelo de regresso:1. , os erros tem mdia zero.

  • ECONOMETRIA Mtodo dos Mnimos Quadrados Ordinrios (OLS)Estimar a reta de regresso significa na verdade, encontrar os estimadores para e (pois estamos trabalhando com uma amostra). Para isso, podemos reordenar as variveis x e y da seguinte forma:

    x e y so variveis centradas na mdia.

  • ECONOMETRIAAssim: (1)Como por hiptese (2)Ao subtrairmos (2) de (1):

    Logo: (3)

    Tal metodologia pressupe que queremos estimar uma reta que tenha o menor erro possvel. Mas somar erros no acrescenta muito, pois h erros negativos e positivos, que iro se cancelar.

  • ECONOMETRIA Para resolvermos isto, basta elevarmos ao quadrado, eliminando os negativos. Ento a melhor reta ser aquela cuja a soma dos quadrados dos erros for mnima. Da: MQO ou OLS (ordinary least squares).De (3), usando as variveis centradas na mdia:

    A soma dos quadrados dos erros:

    ou;

    Pelas propriedades da soma e como uma constante:

  • ECONOMETRIA Para Encontrar o valor de que d o minimize essa soma, o procedimento derivar e igualar a zero. Como o valor de um estimador, utilizaremos logo . .Derivando em relao a e igualando a zero:

    Dividindo por dois em ambos os lados:

    Assim :

    (4)

  • ECONOMETRIAE o estimador para :

    Substituindo pelos respectivos estimadores: portanto: (5)

  • ECONOMETRIATabela 1:

    Som/mdXYxyxyxy

    103160-50.57-52.572575.562763.602667.92123167-30.75-45.57945.562076.621401.27145205-8.75-7.5776.5657.3066.23126173-27.75-39.57770.061565.781098.0618925635.2543.431242.561886.161530.921129057.2577.433277.665995.404432.8617823724.2524.43588.06596.82592.4210751488009474.9214941.6811788.68Mdia 153,7212,5001353.562134.521684.09

  • ECONOMETRIA Agora podemos facilmente estimar a reta de regresso que na tabela representa os valores em negrito: = 1684.09 /1353.56 = 1.244E para o intercepto, utilizamos os valores em vermelho: = 212.57 1.244 x 153.75 = 21.28A reta a ser estimada dada por: = 21.28 + 1.244. Significando que se x = 150: = 21.28 + 1.244. 150 = 207.88

  • ECONOMETRIA Devemos verificar se a regresso boa e a maneira mais formal calcular a diferena entre os dados no exemplo e o da reta de regresso: = 21.28 + 1.244. 103 = 149.42 = 21.28 + 1.244. 123 = 174.29 = 21.28 + 1.244. 145 = 201.08 = 177.52 = 255.64 = 282.92 = 242.71

  • ECONOMETRIATabela 2

    Soma/mdia 149.4210.59174.29-7.29201.083.92177.52-4.52255.640.36282.927.08242-51481.860mdia211.590

  • ECONOMETRIAEssas diferenas no so os erros, quase isso. Os erros so as diferenas entre os valores de Y e a reta verdadeira, isto , a reta oriunda de valores populacionais de e (que no so conhecidos). As diferenas que encontramos so entre os valores de Y e os dados com os valores amostrais de e . So, portanto, no os erros, mas os estimadores dos erros, ou simplesmente os resduos da regresso. Analisaremos, agora o quadro dos resduos e sua varincia, a anlise da varincia conhecido como ANOVA.

  • ECONOMETRIA A anlise da varincia consiste em dividir a varivel Y em duas partes:i) a explicada pela regressoii) no explicada (resduos)Ento o primeiro passo calcular a soma dos quadrados da varivel Y e de suas partes explicada e no explicada.

    Soma/mdResduosQuadrado dos resduos149.4210.59112.78174.29-7.2953.14201.083.9215.36177.52-4.5220.43255.640.360.129282.927.0850.12242-5251481.860276.04mdia211.59039.56

  • ECONOMETRIACalculamos, logo:1) SQT Soma dos Quadrados Totais de Y(centrado);2) SQE Soma dos Quadrados Explicativos (Y estimado);3) SQR Soma dos Quadrados dos Resduos. Com tais informaes, j possvel tirar uma concluso a respeito da regresso, dado que SQR uma parcela pequena do total ou podemos dizer que SQE tem uma parcela importante.

  • ECONOMETRIA SQT = 14941.68 = y.Para a SQE h duas maneiras:1 Calcular um a um tirando a mdia e elevando ao quadrado.2 Ou usarmos a equao da reta:

    SQE =

    = 1.244 . 9474.92 = 14662.62e SQR que j foi calculado:SQR = 276.92Notando que: SQT = SQR + SQE = 14662.62 + 276.96 = 14941.68

  • ECONOMETRIAEssa proporo conhecida como poder explicativo, coeficiente de determinao ou simplesmente R:R = SQE/ SQT = 14665.62/ 14941.68 = 0.9814 = 98.14%Note que impossvel SQE > SQT e este tambm no pode ser negativo. Logo 0 R 1.Como R = 98.14%, dizemos que 98.14% da varincia de Y explicada por X, indicando que a regresso de Y por X indicou um bom resultado.

  • ECONOMETRIA Contudo, a anlise continua. Colocaremos os Graus de Liberdade(G.L) ( lembrando que G.L adquirido atravs da varincia amostral que dada por porque seu estimador uma soma de n 1 variveis normais padronizadas, dado que S obtido de uma varivel cuja a distribuio normal.). Para SQT, os Graus de Liberdade so os mesmos p/ varincia amostral normal, ou seja, 7 1 = 6.

  • ECONOMETRIASQR so os resduos de uma reta e para uma reta so necessrios dois pontos. Mas com dois pontos, no temos variao nenhuma. Assim, devemos ter n 2 G.L para os resduos, ou seja, 7 2 = 5.Para SQE, h dois modos:- diferena( 6 5 = 1)- o fato de que h apenas uma varivel explicativa. Utilizando de uma tabela temos:

    Soma dos QuadradosG.LQuadrados MdiosSQE = 14662.62114662.62SQR = 276.96555.39SQT = 14941.6862489.93

  • ECONOMETRIAOs quadrados mdios so as varincias propriamente ditas. Iremos testar, estatisticamente falando, se a varincia explicada maior do que a varincia dos resduos, ou seja, faremos a comparao de varincias.O Teste F feito,dividindo-se uma varincia pela outra. Mas para tal teste, necessrio que as variveis das quais foram obtidas as varincias sejam normais, isto , Y normalmente distribudo: Como ela uma reta, mais um erro aleatrio, a varincia de Y ser dada pela varincia do erro. Portanto, criaremos uma hiptese adicional sobre o erro, a de que ele segue uma distribuio normal. Ento:

    Soma dos QuadradosG.LQuadrados MdiosTeste FSQE = 14662.62114662.62264.71SQR = 276.96555.39SQT = 14941.6862489.93

  • ECONOMETRIAConsultando a Tabela de distribuio F, acharemos o valor limite da distribuio para o teste, com 1 G.L para o numerador e 5 para o denominador, a 5% de significncia:F1,5 = 6.61 FTABELADOFCALCULADO = 264.71Logo Fc > FT. Na regresso, temos a hiptese nula de que as varincias so iguais. Se rejeitarmos H0, isso significa que a regresso explica mais do que no explica, considerando a regresso vlida. No nosso caso, Fc > FT, por isso a regresso valida a 5% de significncia.

  • ECONOMETRIATeste de Significncia dos Parmetros.Testar a significncia dos parmetros significa testar H0 de que e so, na verdade, iguais a zero. Isto , ser que os parmetros no existem de fato, e o valor que encontramos apenas resultados da amostra? Isto equivale a testar as seguintes hipteses p/ (assim como p/ ):

  • ECONOMETRIAComo so variveis normalmente distribudas, cuja a varincia no conhecemos ao certo, a distribuio a ser utilizada a t de Student. Os valores tabelados com 5 (= n -2) G.L, com 1%, 5% e 10% (bicaudais) so:

    E o valor calculado da estatstica t dado por:

    Isto , basta dividir o coeficiente encontrado pelo seu desvio padro.

  • ECONOMETRIAA questo, agora, encontrar o dp de . Sabemos que:

    Ento:

    O estimador dessa varincia (amostral)ser:

    Onde var(yi) = var(resduos)

  • ECONOMETRIAJ que a varincia de Y dado X, ou seja, a varincia de Y no modelo de regresso, a prpria varincia dos resduos, que j calculamos na ANOVA igual a 55,39 e foi obtida por meio da expresso SQR/(n-2):

    O clculo da estatstica , ento:

    Como o valor calculado superior aos tabelados, rejeitamos H0 de que .Dizemos ento que estatisticamente diferente de zero ou significante a 1%.

  • ECONOMETRIAO Procedimento para quase o mesmo. A diferena est no clculo de seu desvio padro. Sabemos que:

    Cujo o estimador ser dado por:

    Logo tambm estatisticamente significante a 1%

  • ECONOMETRIAEx: Uma amostra de 16 observaes de duas variveis Y e X, foram obtidos os seguintes resultados:

    Estimemos os parmetros da reta de regresso e testemos sua significncia, assim como a validade da regresso. Os parmetros da regresso sero dados por:

  • ECONOMETRIAO modelo encontrado ento:

    Para testar a validade da regresso, montamos uma ANOVA. Para isso, calculamos as somas dos quadrados:

    Soma dos QdosG.LQdos MdiosTeste FSQE= 52.719,75SQR= 5.847,3711452.719,75417,67126,22SQT= 58.567,12153.904,47

  • ECONOMETRIAUsando a Tabela com GL1,14 a 5%, valor encontrado 4,60. Com isso, aceitamos a validade da regresso. O poder explicativo :

    Quanto a significncia dos parmetros, temos que seus desvios-padro so:

    As estatsticas t sero, portanto:

  • ECONOMETRIAOs valores crticos para a distribuio t , com 14 G.L so:

    Como o valor encontrado para superior a todos esses valores, temos que ele significante a 1%.J para , ocorre o contrrio, portanto, conclumos que no significante, o que vale dizer que no podemos rejeitar a hiptese de que zero. Poderamos, tambm, dizer que o intercepto no existe.O procedimento agora seria, logo, retirar o intercepto, isto , estimar novamente a regresso sem o coeficiente , o que feito no exemplo seguinte.

  • ECONOMETRIATendo em vista que o intercepto da regresso do exemplo anterior era no significante estatisticamente, estimemos novamente a regresso, s que sem intercepto: (reta que passa pela origem)Quando encontramos o estimador de M.Q.O, havamos substitumos as variveis originais ( X e Y) por variveis centradas na mdia. O objetivo era, exatamente, eliminar o intercepto da equao. Como ele agora no existe mesmo, o estimador de MQO ser o mesmo, exceto pelo fato de que no usaremos mais variveis centradas.

  • ECONOMETRIASubstituindo pelos valores dados no ex. anterior:

    O modelo ser:

    E, para o teste do coeficiente encontrado, precisaremos de seu dp. Temos que o SQE pela regresso dada por:

    A soma dos quadrados dos resduos ser, portanto:

    E, assim, podemos encontrar a varincia dos resduos (que a prpria varincia da regresso):

  • ECONOMETRIARepare que usamos n 1 e no n 2, como fazamos quando a regresso inclua o intercepto. Isso fcil de entender j que, ao excluir o intercepto, implicitamente supomos conhecer a existncia de pelo menos um ponto da reta, que a origem, o que nos faz ganhar um grau de liberdade.Para calcular a varincia ( e o dp) do coeficiente , usamos a mesma frmula j usada anteriormente, apenas trocando o x (centrado) pelo X:

    Portanto, a estatstica t ser:

  • ECONOMETRIAO que, evidentemente, maior do que os valores tabelados. Em todo caso, esses valores, para 15 GL, so:

    E, obviamente, o valor encontrado, 27, maior do que os tabelados, sendo ento, significante a 1%.

  • ECONOMETRIAO R, tb deve ser visto com reservas qdo se trata de uma regresso sem intercepto. Isso porque, na medida em que usamos variveis no centradas, ele diferente do R usual e ambos no podem ser comparados ( pois se usarmos o R c/as variveis centradas, o resultado poder ser negativo).Esse R especial p/modelos sem intercepto conhecido como R no centrado ou R bruto. Nesse caso:

  • ECONOMETRIAQuando comparamos os resultados obtidos nos dois modelos ( com e sem intercepto), verificamos que as diferenas entre os coeficientes so muito pequenas. O dp, quando a estimao foi realizada sem intercepto, foi menor ( o q uma vantagem). De fato, se a reta realmente passa pela origem, razovel que uma estimao que leve isso em conta seja mais precisa.Obs: Devido a relao custo benefcio (devido a erros de especificao e avaliao no modelo) a estimao sem intercepto s recomendvel se existir uma razo muito forte em se acreditar que a reta passe pela origem.

  • ECONOMETRIA Hiptese de Normalidade:As hipteses at o momento para regresso:1) E(i) = 0, os erros tem mdia zero.2) i so normalmente distribudos.

  • ECONOMETRIAPropriedades dos estimadores de mnimos quadrados:O estimador de no viesado?

    Como a esperana da soma a soma das esperanas: e como uma constante:

  • ECONOMETRIAOlhando o termo dentro da esperana, vemos que os valores xi so fixos, ou para ser mais preciso, fixos em amostras repetidas. Ex: Imveis. Um imvel sorteado na amostra e este tem uma rea(m).Se por acaso este for novamente sorteado, ele ir apresentar a mesma rea, ou seja, valor fixo, e que no depende de Pbdd. Logo, a rea de um imvel se enquadra nesta hiptese. Isto no se aplicaria se: ex: nota de um aluno.P1 8,0P2 no necessariamente tiraria a mesma nota, ento, dependeramos de uma distribuio de Pbdd e neste caso x uma varivel estocstica.Se x for fixa ento xi pode ser estimado como uma constante:

  • ECONOMETRIAJ que , logo:

    Dessa forma, , um estimador no viesado do coeficiente Assim:

  • ECONOMETRIA Isso significa que, se for estocstica o coeficiente no ser viesado se mantivermos a condio de que , o que equivale a dizer que J que , podemos garantir que o estimador no viesado, ou seja, EFICINCIA E BLUE Se alm das hipteses 1 e 3 os tiverem varincia constante e forem no autocorrelacionados (erros independentes) o Teorema de Gauss-Markov mostra que o estimador de MQO apresenta a menor varincia entre todos, que so lineares e no viesados, portanto um BLUE: 4. (constante)5. (os erros no so autocorrelacionados).Se ainda levarmos em conta a hiptese de normalidade, possvel demonstrar (desigualdade de Cramer-Rao) que o estimador tem a menor varincia entre todos os estimadores no viesados de , isto , um estimador eficiente.

    3. * , os xi so no correlacionados com os erros

    ******************************************