Apostila Econometria 2013

112
Introdução à ECONOMETRIA Prof. Helio Otsuka Versão 2013

description

econometria

Transcript of Apostila Econometria 2013

Page 1: Apostila Econometria 2013

Introdução à ECONOMETRIA Prof. Helio Otsuka

Versão 2013

Page 2: Apostila Econometria 2013

Sumário . Capítulo 1: Introdução .............................................................................................................................. 1 . Capítulo 2: Conceitos iniciais .................................................................................................................... 3

2.1. Objetivo da econometria ..................................................................................................................... 3 2.2. Definição de modelo ............................................................................................................................ 3 2.3. Estrutura de um modelo econométrico ............................................................................................... 4

. Capítulo 3: Análise de regressão linear simples de duas variáveis ............................................................ 6 3.1. Expressão do modelo ........................................................................................................................... 8 3.2. Pressupostos básicos............................................................................................................................ 8 3.3. Estimação dos parâmetros ................................................................................................................... 9 3.4. Equações normais (equações simultâneas) ......................................................................................... 10

. Capítulo 4: Regressão linear múltipla ....................................................................................................... 22 4.1. Introdução ............................................................................................................................................ 22 4.2. Pressupostos do modelo ...................................................................................................................... 23

4.2.1. Teorema de Gauss-Markov ....................................................................................................... 23 4.3. Estimação dos parâmetros ................................................................................................................... 24 4.4. Estimação da equação de regressão múltipla ...................................................................................... 25 4.5. Previsão de valores com base na equação de regressão ..................................................................... 25 4.6. Erro padrão da estimativa .................................................................................................................... 26 4.7. Intervalos de predição (IP) ................................................................................................................... 26 4.8. Erro padrão dos estimadores ............................................................................................................... 26 4.9. Intervalo de confiança dos estimadores .............................................................................................. 27 4.10. Coeficiente de determinação (poder explicativo da regressão) ........................................................ 27 4.11. Teste de hipóteses ............................................................................................................................. 28

. Capítulo 5: Correlação .............................................................................................................................. 45 5.1. Objetivo para economia ....................................................................................................................... 45 5.2. Conceito de correlação ........................................................................................................................ 45 5.3. Medida de correlação .......................................................................................................................... 46 5.4. O coeficiente de correlação r e sua interpretação ............................................................................. 46 5.5. Imagens de r no plano cartesiano em função do seu valor ............................................................... 47 5.6. Diferença entre correlação e regressão ............................................................................................... 48

. Capítulo 6: Violação dos pressupostos básicos ......................................................................................... 54 6.1. Heteroscedasticidade e homoscedasticidade ...................................................................................... 54 6.2. Natureza da heteroscedasticidade ....................................................................................................... 55 6.3. Consequências da heteroscedasticidade ............................................................................................. 57 6.4. Detecção da heteroscedasticidade ...................................................................................................... 57

. Capítulo 7: Autocorrelação ou Correlação Serial ....................................................................................... 69

7.1. Natureza da autocorrelação ................................................................................................................. 69 7.2. Padrões gráficos de autocorrelação ..................................................................................................... 69 7.3. Causa da autocorrelação ...................................................................................................................... 70 7.4. Consequências da autocorrelação ....................................................................................................... 70 7.5. Diagnóstico (identificação) da autocorrelação .................................................................................... 71 7.6. Medidas corretivas visando a remoção da autocorrelação ................................................................. 76

Page 3: Apostila Econometria 2013

. Capítulo 8: Utilização de variáveis especiais ............................................................................................. 82

8.1. Variáveis dummy (dummies, binárias, artificiais, dicotômicas, etc.) ................................................... 82 8.2. Incorporação da variável ( )d ao modelo de regressão linear ............................................................. 83

A) Incorporação da variável ( )d pela forma aditiva .......................................................................... 83

B) Incorporação da variável ( )d pela forma multiplicativa ............................................................... 87

. Capítulo 9: Análise das séries temporais ................................................................................................... 92 9.1. Introdução ............................................................................................................................................ 92 92. Conceito de séries temporais ................................................................................................................ 92 9.3. Análise de uma série temporal ............................................................................................................ 94

. Tabelas ..................................................................................................................................................... 104

Tabela normal ............................................................................................................................................. 104 Distribuição t de Student ............................................................................................................................ 105 Tabela da distribuição F (nível de significância 1%) .................................................................................... 106 Tabela da distribuição F (nível de significância 5%) .................................................................................... 107 Tabela de Durbin-Watson ........................................................................................................................... 108

. Bibliografia ............................................................................................................................................... 109

Page 4: Apostila Econometria 2013

ECONOMETRIA (Noções Básicas)

Capítulo 1: INTRODUÇÃO Uma imensa gama de relações teóricas existentes entre variáveis de natureza econômica podem ser expressas e formuladas através de modelos matemáticos. Assim, nota-se que cada vez mais estudiosos em economia se valem de metodologias estatísticas para estimar parâmetros desconhecidos, testar hipóteses, efetuar simulações sobre as mais diversas relações entre variáveis econômicas, visando efetuar previsões de caráter quantitativo de inúmeros eventos. É exatamente nesse contexto que se torna imprescindível a efetiva participação da econometria como ferramenta necessária na verificação, por exemplo, de teorias e políticas econômicas, previsão de valores de variáveis de natureza econômica, influenciando sobremaneira na tomada de decisões. O objetivo dessa apostila é procurar transmitir aos estudantes de economia, de forma clara e resumida, os principais conceitos que entendemos serem relevantes para a sua formação. Dado o número exíguo de horas/aulas disponíveis, procuramos abranger o máximo do nosso conteúdo programático, dando ênfase à parte prática/operacional de cada capítulo com aplicação de exercícios já desenvolvidos com a consequente interpretação dos seus resultados, deixando a parte teórica de maior profundidade, como trabalho de consulta, análise e interpretação por parte do aluno junto a bibliografia recomendada. Contem ainda exercícios complementares que deverão ser desenvolvidos no decurso das aulas Assim, entendemos que o conteúdo programático apresentado na sequencia será suficiente para dar uma ideia da importância do conhecimento de econometria como base na formação dos futuros profissionais em economia. Vale deixar aqui registrado, contudo, que a econometria, como também ocorre em outras ciências, apresenta suas limitações, principalmente de natureza estatística e econômica. Poderíamos citar algumas de natureza estatística, como por exemplo: − utilização de amostras pequenas, não representativas;

− falhas nas observações das variáveis;

− dificuldade de dar tratamento adequado a alguns modelos não lineares;

− o problema da multicolinearidade, etc. Entre os de natureza econômica temos:

1

Page 5: Apostila Econometria 2013

− dificuldades na classificação de variáveis em endógenas e exógenas o que tornaria tendencioso o efeito das mesmas;

− dificuldade de incorporar nos modelos os fatores de natureza qualitativa e subjetiva como opiniões; expectativas; intenções; etc.

− problemas de especificação da teoria e dos erros, etc.

Os problemas citados já vêm sendo analisados há algum tempo por econometristas, entretanto alguns pontos não foram totalmente solucionados como o problema da multicolinearidade (intercorrelação entre variáveis explicativas) e mensuração de variáveis subjetivas. Para o aprendizado suave da matéria pressupõe-se que o alunado tenha algum conhecimento de estatística básica e de inferência estatística. Apresentamos abaixo, os assuntos abordados nesta apostila, acompanhados de exercícios ao fim de cada capitulo, procurando, na medida do possível, alinhar-se com o programa de econometria instituído pela Faculdade. − Conceito de econometria e o seu objetivo;

− Conceito de modelo (classificação, estrutura, pressupostos básicos, etc.);

− Análise da regressão linear simples de duas variáveis (estimação e interpretação dos

parâmetros; o método dos mínimos quadrados ordinários; conceito de regressão; previsão de valores; erro padrão da estimativa; erro máximo de estimação; intervalo de predição; erro padrão dos estimadores; qualidade do ajuste e sua interpretação; teste de hipóteses aplicados à regressão pela distribuição “t” de Student e pela distribuição “F” de Fisher/Snedecor com a elaboração do quadro ANOVA (Analysis of Variance);

− Análise da regressão linear múltipla, onde serão abordados todos os itens já comentados na análise de regressão simples;

− Covariância e correlação (determinação, interpretação e verificação da sua existência);

− Violação dos pressupostos básicos (heteroscedasticidade e homoscedasticidade; natureza, consequência e detecção da heteroscedasticidade); autocorrelação serial (causas, consequências e diagnóstico da autocorrelação);

− Utilização de variáveis especiais como extensão dos modelos de regressão (variáveis dummy, binária, artificial ou dicotômica); utilização da variável tempo como variável explicativa numa série temporal de informações numéricas;

− Modelos não lineares;

− Análise de séries temporais. 2

Page 6: Apostila Econometria 2013

Para finalizar, gostaríamos de lembrá-los de que a presente apostila não é uma receita de bolo, onde o estudante pensa que aprendendo o que está nela contida, já sabe tudo sobre econometria. Muito pelo contrário. O nosso objetivo, ao preparar a matéria dessa forma, foi com a intenção de facilitar e maximizar o processo de aprendizado, dando ênfase aos itens de maior relevância dentro do conteúdo programático adotado pela Faculdade, contendo aplicações práticas de fácil entendimento. Certamente um dos mais poderosos instrumentos utilizados na análise de problemas econômicos são as aplicações de técnicas estatísticas à economia, denominada de econometria. A econometria em si, é muito mais abrangente com uma diversidade de tópicos que não estão aqui comentados. Capítulo 2: CONCEITOS INICIAIS 2.1. OBJETIVO DA ECONOMETRIA A econometria trata da mensuração das relações entre variáveis de natureza econômica com base em ferramental estatístico e tem como alguns de seus objetivos a verificação empírica das leis e das teorias econômicas, a avaliação das políticas econômicas, a previsão dos valores das variáveis de natureza econômica, etc. Alguns autores como Artur S. Goldberger, em seu livro “Econometric Theory”, define econometria como a ciência social no qual o ferramental estatístico, tais como inferência estatística e a estatística matemática, são aplicadas à análise dos fenômenos econômicos. 2.2. DEFINIÇÃO DE MODELO Entende-se como modelo em econometria a um conjunto de hipóteses estabelecidas à priori, acerca do comportamento de um dado fenômeno, com base numa teoria já existente e podem ser classificados em teóricos e econométricos. Um modelo é teórico quando expressam leis de natureza econômica sem conter necessariamente tratamento estatístico; já os econométricos, contém necessariamente tratamento estatístico com as devidas especificações como, por exemplo: a definição das variáveis, a forma funcional, o nº de equações, etc. como veremos a seguir. Exemplo de modelo teórico: Função liquidez: M= L (i;x) , onde M= meios de pagamento; L=liquidez; i=taxa de juro; x =

renda

Exemplo de modelo econométrico: Função consumo: C= a+bx+e, onde C= consumo agregado; a e b = parâmetros linear e angular;

x= renda; e= erro aleatório

3

Page 7: Apostila Econometria 2013

Os modelos podem ainda ser classificados quanto a sua forma funcional e quanto ao número de equações: Quanto a forma funcional

- Lineares: quando é expressa por uma função linear

ixy .21 ββ += - Não lineares: quando é expressa por uma função não linear

ixy 21 ββ ⋅= , que é uma função exponencial simples Quanto ao número de equações:

- Uniequacionais: quando contêm apenas uma equação

xcxbxay ++=

- Pluriequacionais: quando contêm pelo menos duas equações como, por exemplo, uma função

linear (1) e a função (2) onde x representa o resultado da diferença entre a função (1) e o resultado dos investimentos (w)

ixy .21 ββ += (1)

wyx −= (2)

Onde =y despesa em função da renda, =x renda e =w resultado dos investimentos 2.3. ESTRUTURA DE UM MODELO ECONOMÉTRICO

Estruturalmente um modelo econométrico envolve quatro elementos básicos que são: Variáveis (dependente e independente), Equações, Parâmetros ou Coeficientes (intercepto e o parâmetro responsável pela declividade, além do termo aleatório ou perturbações). Por exemplo: na estrutura de um modelo linear encontramos a variável dependente (ou endógena ou explicada), a variável independente x (ou exógena ou explicativa), os parâmetros linear ou intercepto 1β e o angular 2β , conforme esquema a seguir, além do termo aleatório e .

exy i ++= .21 ββ Onde: =y variável dependente =1β parâmetro intercepto

4

Page 8: Apostila Econometria 2013

=ix variável independente =2β parâmetro angular =e termo aleatório

O que são regressores?

O conjunto de variáveis exógenas ou explicativas mais o termo constante ou linear ou intercepto são denominados de regressores. Assim, na equação acima, os regressores seriam:

1β e ix.2β Cabe lembrar que o comportamento da economia resulta da interdependência de diversos fatores e ao explicá-lo os economistas evitam a complexidade do mundo real através da construção de modelos que apesar de retratarem de forma aproximada a realidade, destacando apenas os elementos ou variáveis consideradas relevantes, permitem alcançar a essência do fenômeno em questão. Apesar do avançado estágio em que se encontra a teoria econômica, ocorrem situações onde a formulação das hipóteses do modelo e a identificação dos elementos relevantes é um tanto arbitrária, não havendo garantias de que elas sejam realistas, portanto, é preciso verificar se o modelo proposto é capaz de explicar o fenômeno a que se propõe. Através do confronto do modelo com as observações do mundo real é que se pode concluir ou não a validade do modelo. Um poderoso instrumento neste sentido são os modelos econométricos analisados pela econometria, uma técnica que agrega a estatística, a matemática e a teoria econômica. Conforme indicado na figura 1 a seguir, um modelo econométrico resulta de um processo que se inicia com uma análise econômica que envolve a consulta da teoria econômica e percepção da realidade para auxiliar na identificação das variáveis dependentes e independentes a serem incluídas no modelo, bem como na especificação da forma funcional que relaciona estas variáveis. Uma característica dos modelos econométricos é a consideração de um termo estocástico, com uma distribuição de probabilidade hipotética, para representar a incerteza inerente ao comportamento da economia e também outras variáveis, omitidas na formulação do modelo, mas que explicam a realidade. Uma vez especificado o modelo econométrico e estabelecidas às hipóteses pertinentes, são coletadas observações das variáveis dependentes e independentes, para em seguida, através da aplicação da inferência estatística, estimar e testar a validade do modelo econométrico. A validade de um modelo econométrico não será apenas julgada por técnicas de inferência estatística, mas também pela coerência com a teoria econômica. Caso o modelo especificado não seja o aceito deve ser corrigido, seja retirando ou incluindo variáveis independentes ou ainda modificando a forma funcional que relaciona as variáveis. Quanto à aplicação, os modelos econométricos podem ser utilizados na obtenção de evidências empíricas que modifiquem, refinem ou refutem as conclusões contidas na teoria econômica ou novas proposições teóricas e também na avaliação de políticas econômicas, sendo uma ferramenta muito útil para fazer previsões de alguma variável econômica ou ainda estimar

5

Page 9: Apostila Econometria 2013

parâmetros como elasticidades, multiplicadores, coeficientes técnicos e custos marginais, portanto trata-se de uma valiosa ferramenta em um processo de tomada de decisão.

Figura 1 – sugestão de roteiro para construção de modelos econométricos Capítulo 3: ANÁLISE DE REGRESSÃO LINEAR SIMPLES DE DUAS VARIÁVEIS O gerente de vendas de uma empresa varejista do ramo de calçados está interessado em obter uma equação que sintetize a relação existente entre o investimento em propaganda e o volume de vendas da empresa, com a finalidade de realizar projeções do volume de vendas.

6

Page 10: Apostila Econometria 2013

Tabela 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z.

Investimento em Propaganda milhares de Reais (x)

Venda em milhares de Reais (y)

30 40 20 34 35 52 40 49 38 47 18 21 10 20 15 27 35 41 24 48

0

10

20

30

40

50

60

0 10 20 30 40 50

Investimento em propraganda milhares de Reais

Vend

a em

milh

ares

de

reai

s

Figura 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z.

A figura 3.1 apresenta um gráfico com os valores de uma amostra levantada pelo departamento de vendas da empresa Z. O gráfico revela uma tendência de crescimento entre o volume de vendas e o investimento em propaganda, ou seja, um incremento no investimento em propaganda resulta em um aumento no volume de vendas.

7

Page 11: Apostila Econometria 2013

0

10

20

30

40

50

60

0 10 20 30 40 50

Investimento em propraganda milhares de Reais

Vend

a em

milh

ares

de

reai

s

Figura 3.2 Reta ajustada entre Volume de vendas e investimento com propaganda em milhares de

reais. O exemplo anterior constitui uma aplicação de regressão linear simples, onde a relação existente entre a variável dependente ou endógena (volume de vendas) e a variável independente ou exógena (investimento em propaganda) é modelada através de uma reta ajustada aos dados amostrais, conforme mostra a Figura 3.2 3.1. EXPRESSÃO DO MODELO:

exy i ++= .21 ββ (3) O modelo é chamado de regressão linear simples porque há apenas uma variável econômica ( )x , no lado direito da equação. Quando houver mais de uma variável explicativa ( )x é chamada de regressão múltipla. É chamado de linear porque a expectativa condicional de y é uma função linear de x , ou seja:

( ) exxyE ++= .21 ββ 3.2. PRESSUPOSTOS BÁSICOS: O termo regressão mostra o efeito da variável explicativa x sobre a variável explicada y , através das estimativas dos parâmetros iβ .

Num modelo de regressão linear deverão ser considerados alguns pressupostos conforme abaixo: a) O valor de y para cada valor de x é definido pela expressão acima (3), onde “ e ” é o erro ou

termo aleatório. 8

Page 12: Apostila Econometria 2013

b) A esperança matemática do erro aleatório é igual a zero, pois admite-se que ( ) ixyE .21 ββ += ,

donde se conclui que: ( ) 0=eE .

c) A variância do erro aleatório é igual à variância de y , pois y e “ e ” diferem apenas pelo intercepto, que é um fator constante que não altera a variância, ( ) ( )yVeV = . Portanto, a variância do erro aleatório é finita e constante.

d) A covariância entre qualquer par de erros aleatórios 1e e 2e é igual à covariância do par 1y e

2y que é igual à zero, ou seja: ( ) ( ) 0;cov;cov 2121 == yyee . Assim, temos que os termos aleatórios são independentes.

e) O Erro aleatório (e) segue distribuição normal com média igual a zero e variância constante; OBS: Significado do termo erro aleatório ou perturbação estocástica ( )e : resumidamente podemos conceituar como sendo o substituto ou representante de todas as variáveis omitidas ou desconsideradas que podem afetar a variável dependente y , mas que não estão no modelo de regressão ou que não puderam ser incluídos no citados modelo. 3.3. ESTIMAÇÃO DOS PARÂMETROS

O problema de regressão consiste em, dado o modelo teórico (como o linear, por exemplo), estimar os parâmetros desconhecidos 1β e 2β que são respectivamente os parâmetros intercepto e o angular, com base nas informações amostrais de um dado fenômeno como, por exemplo, despesas com alimentação e renda (no caso de uma regressão linear simples). Apesar de existirem vários métodos para sua obtenção (polinômios ortogonais, máxima verossimilhança, mínimos quadrados ordinários, etc.), o mais recomendado, por ser não tendencioso, consistente, eficiente, de fácil obtenção e de maior confiabilidade, é o método dos mínimos quadrados ordinários, que sugere como princípio que devemos obter uma reta tal que a soma dos quadrados das distancias verticais de cada ponto à reta seja o menor possível ou em outras palavras, que a soma dos quadrados das diferenças entre cada valor conhecido e ajustado pela função ( )y seja o menor possível, isto é:

( )∑=

−n

iyy

1

2ˆ = mínimo (4)

O valor do intercepto ( )1β e o valor do parâmetro angular ( )2β dessa reta que melhor se ajusta aos dados conhecidos ( )y , pelo método dos mínimos quadrados ordinários (m.q.o.) são 1b e 2b que são as estimativas de 1β e 2β do modelo linear simples: ixbby .21 += .

9

Page 13: Apostila Econometria 2013

3.4. EQUAÇÕES NORMAIS (Equações simultâneas) Para obtermos os valores de 1b e 2b , utilizamos a forma recursiva, denominada de equações normais que são obtidas derivando-se parcialmente a igualdade (4) acima e igualando-a a zero, obtendo-se: - Forma geral

+=

+=

∑∑ ∑∑∑

22

2

..

..

xbxbxy

xbnby

i

i (5)

- Forma reduzida

( ) ( )( )( ) ( )222.

..

∑∑∑∑∑

−=

xxn

yxxynb (6)

xbyb .21 −= (7)

As fórmulas (4), (5) e (6) e (7) são denominadas de estimadores de mínimos quadrados e são utilizadas para estimar os parâmetros 1b e 2b da função. Na sequência daremos um exemplo com várias perguntas. O desenvolvimento, a interpretação e a natureza das mesmas estão explicitados no decurso das resoluções das questões. Exemplo 1: A tabela abaixo mostra a evolução da poupança pessoal ( )y e renda pessoal ( )x em unidades monetárias (U.M.) por um período de 12 anos (Colunas (1), (2) e (3)). Pressupõe-se que a trajetória das variáveis assume um comportamento linear.

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

Anos Poupança

( )y

Renda ( )x

yx. 2x y ( )2yy − ( )2xx − ( )2yy − ( )2ˆ yy −

1 6 8 48 64 6,15 0,023 49 16 14,82 2 7 8 56 64 6,15 0,723 49 9 14,82 3 6 9 54 81 6,70 0,490 36 16 10,89 4 8 11 88 121 7,80 0,040 16 4 4,84 5 9 12 108 144 8,35 0,422 9 1 2,72 6 10 13 130 169 8,90 1,210 4 0 1,21 7 9 14 126 196 9,45 0,202 1 1 0,30 8 9 16 144 256 10,55 2,402 1 1 0,30 9 11 18 198 324 11,65 0,422 9 1 2,72

10 12 20 240 400 12,75 0,002 25 4 7,56 11 15 11 165 121 13,85 1,322 49 25 14,82 12 18 29 522 841 17,70 0,090 196 64 59,29 ∑ 120 180 2044 3144 - 7,911 444 142 134,29

10

Page 14: Apostila Econometria 2013

Nota: as colunas (1) a (3) são dados informados e as colunas (4) a (10) são colunas auxiliares para desenvolvimento das questões. Com base nas informações pede-se: 1) Estimar pelo método dos mínimos quadrados ordinários a equação da poupança em função

da renda; 2) Calcular e interpretar o resultado dos estimadores obtidos;

3) Estimar a poupança provável, se a renda pessoal num determinado ano for de 35 U.M.

4) Avaliar o erro padrão de estimativa

5) Obter o intervalo de predição para a poupança estimada em (3)

6) Determinar o erro padrão dos estimadores;

7) Obter o intervalo de confiança dos estimadores com 05,0=α e interpretá-los;

8) Verificar a qualidade do ajuste e interpretá-lo;

9) Determinar o intervalo de predição em função do erro máximo do valor estimado e o

intervalo de predição dela decorrente.

10) Testar a hipótese da existência de regressão entre o par x e y (por Student e por Fische Desenvolvimento:

1) Equação de regressão do modelo ( )xy .21 ββ +=

( ) ( )( )( ) ( )222.

..ˆ∑∑∑∑∑

−=

xxn

yxxynb

( )22 180314412120180204412ˆ

−××−×

=b ∴ 55,02 =b

1555,010.ˆˆ

21 ×−=−= xbyb ∴ 75,11 =b

- Equação de regressão da poupança:

xy 55,075,1ˆ += 2) Interpretação de 1b e 2b

11

Page 15: Apostila Econometria 2013

No contexto econômico, o valor 75,11 =b , significa que mesmo que a renda x seja zero, a poupança pessoal y teria um crescimento de 1,75 U.M. Quanto ao estimador 2b , significa aumento de 0,55 na poupança pessoal ( )y , quando a renda pessoal ( )x (parâmetro angular) aumentar de uma unidade monetária. 3) Valor estimado da poupança quando a renda for de 35 U.M. Com a ajuda da equação obtida na questão (1), ou seja, xy 55,075,1ˆ += , podemos estimar o provável valor da poupança pessoal ( )y , bastando para tanto substituir a variável explicativa ( )x por 35 U.M. que é a renda conhecida, ou seja:

xy 55,075,1ˆ +=

3555,075,1 ×+=esty ∴ 21=esty U.M.

4) Erro padrão de estimativa O erro padrão da estimativa tem como uma de suas finalidades estabelecer o intervalo de predição (margem de desvio) para mais ou para menos do valor estimado de ( )y em função de ( )x . Portanto, nada mais é do que a dispersão em termos absolutos dos valores residuais. Como se sabe, os valores residuais são aqueles valores resultantes da diferença entre os dados conhecidos e os ajustados por uma função qualquer. O erro padrão da estimativa, geralmente representado por xyS :

ˆ é calculado pela expressão:

( )knyy

S xy −−

= ∑ 2

:

ˆˆ (8)

Sendo: =y dados conhecidos (coluna 2 da tabela) =y dados ajustados pela equação (coluna 6) =n tamanho da amostra ( 12=n ) =k número de parâmetros (intercepto + angular)

( )212

911,7ˆˆ2

: −=

−−

= ∑knyy

S xy ∴ 89,0ˆ: =xyS

5) Intervalo de Predição (IP) para o valor estimado da poupança de 21 U.M. O Intervalo de Predição (IP) nada mais é do que a margem de erro do valor estimado, o que sugere diminuir e posteriormente somar ao valor estimado o erro padrão da estimativa, calculado na questão anterior, ou seja, quanto menor o seu valor, menor é a margem de erro. IP = valor estimado (VE) ± erro padrão da estimativa

12

Page 16: Apostila Econometria 2013

IP = VE ± xyS :ˆ

IP = (VE - xyS :ˆ ; VE + xyS :

ˆ ) (9) IP = 21 + 0,89 IP = (21 - 0,89 ; 21 + 0,89) IP = (20,11 ; 21,89) 6) Erro padrão dos estimadores 1b e 2b No estudo da regressão, a determinação do erro padrão dos estimadores ( )

bS tem como uma de suas finalidades básicas auxiliar na obtenção do intervalo de confiança dos estimadores, pois é de fundamental importância que os estimadores sejam não tendenciosos. No caso da regressão linear simples, vimos que os estimadores são 1b e 2b , assim, temos: Cálculo do erro padrão do estimador 1b :

( )∑∑

−= 2

2

: ..ˆˆ

1 xxnx

SS xyb (10)

Cálculo do erro padrão do estimador 2b :

( )∑ −=

2

ˆ2 xx

SS xy

b (11)

No exemplo em questão temos:

6.1) Erro padrão do estimador 1b ( )1

ˆbS

( )∑∑

−= 2

2

: ..ˆˆ

1 xxnx

SS xyb (12)

444123144.89,0ˆ

1 ×=bS ∴ 68,0ˆ

1=bS

6.2) Erro padrão do estimador 2b ( )

bS

( )∑ −=

2

ˆ2 xx

SS xy

b (13)

44489,0ˆ

1=bS ∴ 042,0ˆ

2=bS

13

Page 17: Apostila Econometria 2013

7) Intervalo de confiança dos estimadores A construção de um intervalo de confiança (IC) para um estimador tem como finalidade, principalmente em econometria, medir o nível de precisão do citado estimador, ou seja, se há sintomas de tendenciosidade. Para a construção do IC, o pesquisador deverá levar em consideração algumas informações relevantes como, por exemplo: − Valor do erro padrão dos estimadores ( )

bS , conforme mencionado no item anterior; − O nível de confiança α desejado na pesquisa, com base na distribuição t de Student; − O número de graus de liberdade ( )knlg −=.. .

=n tamanho da amostra e =k número de parâmetros

Assim, observadas as condições acima, o intervalo de confiança de um dado estimador poderá ser construído com base no modelo genérico a seguir:

( ) ( )ii biibi SkntbSkntb ˆ.ˆ. −+<<−− αα β (14)

7.1) Intervalo para 1b

( ) ( ) 68,0.21275,168,0.21275,1 05,0105,0 −+<<−− tt β

27,323,0 1 << β O intervalo acima definido significa que existe a probabilidade 0,95 ou 95% de chance de que o valor de 1β esteja entre 0,23 e 3,27. 7.2) Intervalo para 2b

042,02281,255,0042,02281,255,0 2 ×+<<×− β 644,04564,0 2 << β

O intervalo acima significa que existe a chance de 95% de que 2β esteja entre 0,4564 e 0,644. 8) Avaliação da qualidade do ajuste A qualidade do ajuste ou poder explicativo da regressão pode ser avaliado pelo coeficiente de determinação ( )2R e tem como finalidade verificar em quantos por centos a variável dependente ( )y é explicada pela variável independente ( )x . Quanto mais o valor de 2R se aproximar de 100%, melhor é a qualidade do ajuste.

14

Page 18: Apostila Econometria 2013

Expressão para cálculo:

( )( )2

22 ˆ

∑∑

−=

yy

yyR (15)

Substituindo com os resultados encontrados nas colunas (9) e (10) do exemplo,

14229,1342 =R ∴ 946,02 =R ou %6,94

O resultado indica que 94,6% da variável y é explicada pela variável X, que sugere uma boa qualidade do ajuste, pois quanto mais se aproximar de 100% ou de 1, melhor é a qualidade do ajuste. 9) Erro máximo do valor estimado Para obtermos o intervalo de predição com base no erro máximo do valor estimado, devemos inicialmente determinar o valor do erro ( )E pela expressão:

( )( )∑ ∑−

−++= 22

2

..11ˆ.

xxnxxn

nStE yα (16)

Onde:

=αt distribuição t de Student com ( ) ..lgkn − , com 05,0=α ou 95% ou outro nível qualquer

=yS erro padrão da estimativa

=n tamanho da amostra e =k nº de parâmetros da função sob análise . As estatísticas acima são conhecidas: ( ) ( ) 228,21005,0 ==− tkntα (tabelado)

89,0ˆ =yS 12=n

=x variável explicativa utilizada na época it para estimativa de y . No exemplo em questão 35=x U.M. 15=x

∑ = 31442x . Daí temos:

( )2

2

1803144121535.12

1211.89,0228,2

−×−

++×=E

15

Page 19: Apostila Econometria 2013

1b 2b

53284800083,01.982,1 ++=E

984,1.982,1=E ∴ 79,2±=E Obtido E , o intervalo de predição será conhecido, somando-se e subtraindo-se ao valor estimado o valor de E , ou seja:

EVEIP ±= (17)

( )79,221;79,221 +−=IP

( )79,23;21,18=IP

Observe que a diferença em relação ao intervalo de predição encontrado na questão 5 anterior é que no 2º procedimento foi introduzido o fator probabilístico (distribuição t de Student). 10) Teste de hipótese da existência de regressão por t de Student e Fisher

Um recurso estatístico para se verificar a existência de regressão entre variáveis de uma dada função é a aplicação do teste de hipóteses. Existem inúmeras formas para efetuar o teste. Serão abordados, neste caso, o de Student e o de Fisher/Snedecor, por serem os mais usuais. 10.1) Teste t de Student Por este teste calculamos inicialmente o valor de ct pela função:

ib

iic S

bt ˆβ−

= (18)

Onde: =ct t calculado =ib parâmetros intercepto e angular =iβ hipótese a ser testada

=ibS erro padrão dos estimadores

No exemplo são conhecidos: - A equação de regressão: xy 55,075,1 +=

- Erro padrão do estimador 2b → 042,0ˆ2=bS

16

Page 20: Apostila Econometria 2013

Assim: 042,0

055,0 −=ct ∴ 09,13=ct

Na sequência, formulamos as hipóteses:

020 == βH (ausência de regressão) 021 ≠= βH (presença de regressão)

Verificamos na tabela da distribuição t o valor de ( ) ( ) 228,221205,0 =−=− tkntα . Comparamos ct com ( )knt −α . Se ct (calculado) for maior que ( )knt −α (tabelado), ou seja, diferente de zero, significa presença de regressão entre as variáveis x e y . No teste em questão, as decisões a serem apresentadas são: a) Decisão estatística = rejeita-se a hipótese 0H ; b) Decisão econômica = a população da qual foi extraída a amostra de 12 observações sobre

poupança ( )y e renda ( )x ) sugere a existência de regressão entre elas com 95% de probabilidade de que a decisão tomada esteja correta.

10.2) Teste F de Fisher Uma outra forma de verificar a existência de regressão é através do teste F com auxílio do quadro de análise da variância (ANOVA), cujo desenho para determinar o F calculado ( )cF é o que se segue:

Fonte da variação

Soma dos quadrados

Graus de Liberdade ( )..lg

Média Quadrática cF

Devido a regressão

( )∑ − 2ˆ yy 1=k ( )

1ˆ 2∑ − yy

(a)

baFc =

Devido a resíduos

( )∑ − 2yy 1−− kn ( )

1ˆ 2

−−−∑

knyy

(b)

No exemplo em questão já foram calculadas as estatísticas necessárias ao cálculo de cF (na tabela do exemplo 1). Encontrado o valor de cF , este é comparado ao ( )1−− knFα (tabelado), na distribuição de Fisher/Snedecor. Se o valor de cF for maior que ( )1−− knFα , rejeitamos a hipótese nula 0H , o que sugere presença de regressão entre as variáveis x e y , que são respectivamente a renda e a poupança. Conforme visto no teste anterior por Student, as hipóteses deverão ser formuladas como se segue:

17

Page 21: Apostila Econometria 2013

:0H ausência de regressão :1H presença de regressão

Finalmente, enunciamos as decisões estatística e econômica. Dessa forma, aplicando-se o teste F ao exemplo 1 temos: Elaboração do quadro ANOVA com base nas estatísticas conhecidas:

Fonte da variação ∑ dos quadrados ( )..lg Média

Quadrática cF

Regressão 134,29 1 134,29 75,16979,029,134

= Resíduos 7,911 12-1-1 = 10 0,79

75,169=cF ( ) ( ) 96,4101 05,0 ==−− FknFα

- Formulação das hipóteses:

:0H ausência de regressão :1H presença de regressão

Nota-se que ( )1005,0FFc > o que sugere rejeitar a hipótese 0H , o que nos leva as seguintes decisões: a) Decisão estatística = rejeitar 0H

b) Decisão econômica = a população da qual foram extraídas as 12 amostras sugere a existência

de regressão entre o par de valores x e y , com 95% de probabilidade de que a decisão esteja correta.

18

Page 22: Apostila Econometria 2013

Exemplo 2:

Com base nos dados de despesas com alimentação (yi) e renda mensal (xi), levantados durante 10 periodos consecutivos (ti), desenvolver as questões 1 a 11. Os valores estão em unidades monetárias (U.M.)

it iy ix 1 5 10 2 6 15 3 8 17 4 12 20 5 13 25 6 10 20 7 12 22 8 18 30 9 13 25

10 18 26 ∑ 115 210

1) Estimar a equação da reta que exprime a relação entre y e x ;

2) Interpretar os resultados obtidos dos estimadores no contexto do modelo econômico em

questão;

3) Estimar, com base na equação obtida em (1), a despesa com alimentação ( )y , sabendo-se que a renda mensal ( )x é de 30 U.M.;

4) Determinar o erro padrão da estimativa;

5) Determinar o intervalo de predição com base nos resultados encontrados em (3) e (4);

6) Determinar o intervalo de predição com base no erro máximo do valor estimado;

7) Determinar o erro padrão dos estimadores 1b e 2b ;

8) Determinar o intervalo de confiança dos estimadores 1b e 2b ;

9) Avaliar a qualidade do ajuste (poder explicativo da regressão), interpretando-o;

10) Testar a hipótese da existência de regressão entre as variáveis x e y pela distribuição t ;

11) Idem acima pela distribuição F . Elaborar o quadro ANOVA.

19

Page 23: Apostila Econometria 2013

Exemplo 3: O par de valores iy e ix referem-se a índice de quantidade demandada e tarifa real média, respectivamente, de energia elétrica. Os valores da tarifa foram deflacionados por um indicador adequado, tendo como base o ano t6.

Anos iy ix

t1 74 145 t2 76 134 t3 81 117 t4 90 111 t5 94 109 t6 100 100 t7 103 137 t8 108 122 t9 113 85 t10 115 90

1) Estimar a equação da demanda;

2) Tendo por base a equação obtida em (1), estimar a demanda esperada em t11 se a tarifa real

em t1 for de 98;

3) Determinar o intervalo de predição do valor estimado da demanda em t11;

4) Determinar o intervalo de predição com base no erro máximo do valor estimado;

5) Determinar o intervalo de confiança dos estimadores 1b e 2b ;

6) Avaliar a qualidade do ajuste;

7) Testar a hipótese da existência de regressão entre as duas variáveis (por Student e por Fisher);

20

Page 24: Apostila Econometria 2013

Exemplo 4: Considere os dados amostrais de um estudo da relação entre o número de anos que os candidatos a empregos em um determinado banco comercial estudaram inglês na faculdade e as notas obtidas em um teste de proficiência nessa língua.

Número de anos (x) Nota do teste (y) 3 5,2 4 7,7 4 7,4 2 5,3 5 9,1 3 6,4 4 7,3 5 8,6 3 7,4 2 4,3

Exemplo 5:

Uma empresa, com a finalidade de determinar a relação entre gastos anuais com propaganda (X), em R$1.000,00 e lucro anual (Y), em R$1.000,00, optou por utilizar o modelo linear simples ii XY εβα ++= , em que Yi é o valor do lucro bruto auferidono ano i, Xi é o valor gasto com propaganda no ano i e ε , o erro aleatório com as respectivas hipóteses consideradas para a regessão linear simples (α e β são parâmetros desconhecidos). Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa

∑=

=10

1100

iiY ; ∑

=

=10

160

iiX ; ∑

=

=10

1650

iiiYX ;

∑=

=10

1

2 400i

iX ; ∑=

=10

1

2 1080i

iY ;

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que,caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais será de: a) 84 b) 102,5 c) 121 d) 128,4 e) 158

Exemplo 6: Utilizou-se um modelo de regressão linear para avaliar a relação entre o preço do litro da

gasolina e o do pretróleo Brent, ambos em reais, compreendendo o período de janeiro de 2002 a dezembro de 2006. Os resultados obtidos foram:

( ) ( )∑ ∑= =

=−=−60

1

60

1

22 052,0ˆ581;18

i iiii YYYY e 478,2 −= EFsig

21

Page 25: Apostila Econometria 2013

Considere o quadro a seguir: ANOVA Soma dos

quadrados Graus de liberdade

Média dos quadrados

F Fsig

Modelo (regressão)

Residual X Y Total Os valores de X , Y e Z , no quadro acima, respectivamente são: a) 3,016 ; 0,052 e 2,78E-4; b)3,016; 0,052 e 288,154; c) 14,98; 3,016 e 288,154; d) 18 ; 0,052 e 2,78E-4; e) 18 ; 0,052 e 288,154

Capítulo 4: REGRESSÃO LINEAR MÚLTIPLA 4.1. INTRODUÇÃO Já vimos que na regressão linear simples consideramos apenas uma variável econômica, explicativa ou exógena, na parte direita da equação ( )exy ++= .21 ββ . Na regressão múltipla são consideradas duas ou mais variáveis explicativas ( )ix , como por

exemplo: salário ( )1x , renda de aluguel ( )2x , renda de investimento ( )3x , etc. que influenciam a variável dependente iy . Trata-se, portanto, de uma extensão do modelo de regressão linear simples. Genericamente, em n observações de variáveis amostrais ( )nxxxy ,...,,, 21 , o modelo assumirá a forma:

exxxy nn +++++= −1231211 ...... ββββ (19) Ou, sob a forma de estimadores:

exbxbxbby nn +++++= −1231211 ...... (20) Se chamarmos a variável endógena y de nível de investimento, ele dependerá de fatores a ela agregados como, por exemplo: taxa de juros, variável de renda, etc. que são respectivamente as variáveis explicativas ix .

22

Page 26: Apostila Econometria 2013

Os estimadores da equação (20) são os ib ( )nbbbb ,...,,, 321 e as estimativas desses estimadores são os iβ ( )nββββ ,...,,, 321 da equação (19). O erro aleatório ou resíduo ( )e apontado nas duas equações é o resultado da diferença que porventura venha a ocorrer entre os valores conhecidos iy e os valores esperados ou ajustados pelo modelo iy .

ii yye ˆ−= (resíduo) =iy volume real de venda =iy volume esperado de venda

Alguns outros fatores que poderiam influenciar no valor de ( )e , no caso da variável venda, são os comportamentos dos concorrentes, fatores meteorológicos, etc. denominadas eventos de natureza qualitativa, que veremos no capítulo 8. 4.2. PRESSUPOSTOS DO MODELO Alguns pressupostos deverão ser considerados nos modelos de regressão múltipla, assim como foram no modelo de regressão simples, tais como: a) O valor de y para cada valor de x é definido por 123121 ...... −++++= nni xxxy ββββ

b) A esperança do erro aleatório ( )eE é igual a zero c) A variância do erro aleatório ( )eV é igual a 2σ , o que significa que variância do erro aleatório

é constante d) O erro aleatório e tem distribuição normal cuja média é zero, ( ) a igual variânciae ,0=eE 2σ

finito e constante.

e) A covariância entre qualquer par de erros aleatórios 1e e 2e é igual à covariância do par 1y e

2y que é igual à zero, ou seja: ( ) ( ) 0;cov;cov 2121 == yyee , significando que os termos aleatórios são independentes.

f) O valor esperado ou a esperança matemática da variável dependente y , ( )yE , depende dos valores das variáveis explicativas ix e dos parâmetros desconhecidos iβ , ou seja: ( ) 123121 ...... −++++= nn xxxyE ββββ

4.2.1. Teorema de Gauss-Markov Este teorema nos diz que se os estimadores de mínimos quadrados atenderem as hipóteses acima relacionadas (letras “a” a “f”) serão os melhores estimadores lineares não-tendenciosos dos parâmetros, ou seja, eles são BLUE (best linear unbiesed estimators) em um modelo de regressão múltipla.

23

Page 27: Apostila Econometria 2013

4.3. ESTIMAÇÃO DOS PARÂMETROS

Para a estimação dos parâmetros intercepto e angulares, podemos recorrer a dois caminhos.

a) Pela aplicação do princípio dos mínimos quadrados ordinários (conhecido como equações normais), comentado no capítulo anterior;

b) Pela forma matricial

Geralmente recomendado para modelos com mais de três parâmetros a serem estimados. Conceitualmente, o modelo de n variáveis é uma extensão dos modelos de duas e três variáveis, objeto de abordagem do presente curso. Assim, salvo a notação matricial, poucos conceitos serão acrescentados, razão pela qual abordaremos apenas o primeiro procedimento, ou seja, pelo critério dos mínimos quadrados. A vantagem da aplicação da álgebra matricial sobre a escalar é que ela se aplica a uma, duas, três ou qualquer número de varáveis, mas exigirá do estudante total intimidade com a álgebra matricial.

Estimação dos parâmetros pela aplicação dos Mínimos Quadrados Ordinários (M.Q.O.)

Procedimentos operacionais: a) Determinar inicialmente os desvios em relação à média aritmética de cada uma das

variáveis amostrais informadas (tanto dependentes quanto as independentes), ou seja: Para valores de YYyY iii −=⇒ Para valores de XXxX iii −=⇒ Este procedimento tem como finalidade facilitar os cálculos, pois operamos com valores reduzidos de iy e ix . b) Aplicar os valores reduzidos de iy e ix nos modelos abaixo:

1º) Cálculo do estimador 2b

( )( ) ( )( )( )( ) ( )221

22

21

221221

2..

.....

∑∑∑∑∑∑∑

−=

xxxx

yxxxxyxb (21)

2º) Cálculo do estimador 3b

( )( ) ( )( )( )( ) ( )221

22

21

121212

3..

.....

∑∑∑∑∑∑∑

−=

xxxx

yxxxxyxb (22)

24

Page 28: Apostila Econometria 2013

3º) Cálculo do estimador 1b (intercepto) Para este cálculo utilizamos os valores já conhecidos de 2b e 3b além da média aritmética dos valores reais de iY e iX .

23121 .. XbXbYb −−= (23)

Representação:

ni XXXY ;...;;; 21 (são os dados numéricos conhecidos)

21;; XXYi (são as médias dos mesmos dados) As variáveis iy e ix em letras minúsculas são os afastamentos ou desvios em relação à média de iY e iX , ou seja:

iii YYy −= ; 111 XXx −= ; 222 XXx −= ; etc.

4.4. ESTIMAÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA

Encontrados os estimadores 1b , 2b e 3b pelas equações (21), (22) e (23) para obter a equação de

regressão da variável dependente ( )iy em função das variáveis explicativas ( )1x e ( )2x , pelo método dos mínimos quadrados ordinários, basta substituir no modelo de regressão múltipla representado em (20) os parâmetros obtidos, ou seja:

23121 ..ˆ xbxbby ++= Onde:

1b obtido em (19)

2b obtido em (17)

3b obtido em (18) 4.5. PREVISÃO DE VALORES COM BASE NA EQUAÇÃO DE REGRESSÃO Definida a equação de regressão acima, poderemos efetuar previsões ou estimação de valores com a ajuda da citada equação.

25

Page 29: Apostila Econometria 2013

Se forem conhecidos os valores de 1x e de 2x , poderemos estimar y . Como 1b (intercepto) é constante, basta multiplicar 1x e 2x por 2b e de 3b , respectivamente, e adicionar o valor constante

de 1b para termos o y estimado. 4.6. ERRO PADRÃO DA ESTIMATIVA

Conforme já visto na regressão simples, o erro padrão da estimativa na regressão múltipla tem a mesma finalidade, ou seja, avaliar a margem de erro (desvio padrão) do valor estimado, podendo ser calculado pela expressão:

( )knyy

Sixy −

−±= ∑ 2

:

ˆˆ (24)

Onde: =y dados numéricos conhecidos =y dados ajustados pelo modelo =n tamanho da amostra =k número de parâmetros (intercepto + angulares)

4.7. INTERVALOS DE PREDIÇÃO ( )IP Conhecido o valor estimado ( )VE , para determinarmos a margem de variação do citado valor basta subtrair e adicionar ao mesmo o erro padrão da estimativa ( )

ixyS :ˆ que nada mais é do que o

desvio padrão dos resíduos, conforme explicitado em (24). Assim:

( )ixySVEIP :

ˆ±= (25)

( )ii xyxy SVESVEIP ::

ˆ;ˆ +−= 4.8. ERRO PADRÃO DOS ESTIMADORES Os estimadores 2b e 3b também devem ser analisados quanto a sua variabilidade, pois quanto menor o erro, melhor será a qualidade do ajuste. A qualidade do ajuste, como veremos em 4.10, é também denominada Coeficiente de Determinação. A obtenção do erro padrão do estimador 2b é feita pela expressão:

26

Page 30: Apostila Econometria 2013

( )[ ]∑ ∑

∑−

=

22

2212

1

:

.

ˆˆ

2

xxx

x

SS xy

b (26)

Quanto ao estimador 3b , a expressão para cálculo é:

( )[ ]∑ ∑

∑−

=

21

2212

2

:

.

ˆˆ

3

xxx

x

SS xy

b (27)

4.9. INTERVALO DE CONFIANÇA DOS ESTIMADORES Assim como calculamos o intervalo de predição do valor estimado, podemos também determinar o intervalo de confiança dos estimadores com base no erro padrão e em função do nível de significância desejado na distribuição αt de Student e tem como finalidade avaliar o nível de precisão dos estimadores de fundamental importância para análise de regressão. A expressão para determinar o intervalo de confiança de um dado estimador é:

( ) ( ){ }ii biibi SkntbSkntbP ˆ.ˆ.1 −+≤≤−−=− αα βα (28)

Onde:

=ib estimadores ( );...; 32 bb ( ) =− kntα valor tabelado na distribuição t

=α nível de significância ( );...05,0;01,0 =n tamanho da amostra =k número de parâmetros, inclusive intercepto =

ibS erro padrão do estimador ib 4.10. COEFICIENTE DE DETERMINAÇÃO (poder explicativo da regressão) Na análise de regressão é importante para o pesquisador verificar a qualidade do ajuste, ou seja, uma medida que indique a proporção da variação de y que a equação de regressão consegue explicar. Essa medida por ser avaliada pelo coeficiente de determinação, também conhecido como poder explicativo da regressão, cuja expressão é:

( )( )∑

∑−

−= 2

22 ˆ

yyyy

R (29)

27

Page 31: Apostila Econometria 2013

O valor de 2R , por ser uma proporção, estará compreendido entre 0 e 1 e quanto mais se aproximar de 1, mais forte é a associação entre variáveis envolvidas na equação de regressão. Costuma também ser apresentado em termos percentuais e, nesse caso, o campo de definição de

2R será de 0 a 100%, conforme já comentado no capítulo anterior. 4.11. TESTE DE HIPÓTESES O teste de hipóteses pode ser aplicado à análise de regressão com o objetivo de verificar a existência de regressão entre variáveis x e y no caso de uma regressão simples, conforme já visto no capítulo anterior. No caso de uma regressão múltipla, o teste pode ser utilizado para verificar a influência das variáveis explicativas 1x e 2x sobre a explicada y . Os testes que poderão ser utilizados são de Student ( )t e o de Fisher/Snedecor ( )F . Os procedimentos operacionais para a realização dos testes seguem os mesmos critérios aos já explicitados para a regressão simples, o que torna desnecessária a sua repetição. Os detalhes, se houverem, são mínimos e de fácil entendimento.

Exemplo 6:

Os dados abaixo se referem ao índice de quantidade demandada de energia elétrica ( )Y , da tarifa real média ( )1X e do produto real ( )2X .

Y 1X 2X y 1x 2x 1.xy 2.xy 21.xx 2

1x 22x y ( )2yy − ( )2yy − ( )2ˆ yy −

69 143 84 -26 28 -11 -728 286 -308 784 121 74,46 29,81 676 421,89 76 134 85 -19 19 -10 -361 190 -190 361 100 77,89 3,57 361 292,75 81 117 82 -4 2 -13 -28 182 -26 4 169 78,28

... ... ...

90 111 86 -5 -4 -9 20 45 36

... ...

97,22 94 109 93 -1 -6 -2 6 2 12 97,71

100 100 100 5 -15 5 -75 25 -75 104,89 103 137 104 8 22 9 176 72 198 100,89 108 122 104 13 7 9 91 117 63 104,54 113 85 107 18 -30 12 -540 216 -360 117,28 18,32 324 496,40 115 92 105 21 -23 10 -483 210 -230 529 100 113,08 8,53 441 326,89 950 1150 950 0 0 0 -1922 1345 -880 3388 906 - 173,86 2282 1924,13

Desenvolver as questões: 1) Estimar a equação da demanda por energia elétrica pelo MQO;

2) Com base na equação da demanda obtida, estimar a demanda provável quando a tarifa real

média ( )1x for de 87 e o produto real ( )2x for de 105;

3) Obter o intervalo de predição do valor estimado da demanda;

4) Calcular e interpretar o valor do coeficiente de determinação (poder explicativo da regressão);

28

Page 32: Apostila Econometria 2013

5) Testar o efeito conjunto das variáveis explicativas ao nível de 5% pelo teste F, com o auxílio do

quadro ANOVA;

6) Testar, com base em Student, o efeito de cada variável explicativa ( 1x e 2x ) sobre os parâmetro a elas associadas ( 1b e 2b ) a nível de 5%.

Desenvolvimento: 1) Equação da demanda (forma linear)

Inicialmente calculamos os estimadores: 1.1) Estimador 2β

( )( ) ( )( )

( )( ) ( )22122

21

221221

22..

.....

∑∑∑∑∑∑∑

−==

xxxx

yxxxxyxbβ

( ) ( )

( ) ( ) 128.295.2732.557

880906338813458809061922

22−

=−−×

×−−×−=b

243,02 −=b

1.2) Estimador 3β

( )( ) ( )( )

( )( ) ( )22122

21

121212

33..

.....

∑∑∑∑∑∑∑

−==

xxxx

yxxxxyxbβ

( ) ( )

( ) ( ) 128.295.2500.865.2

8809063388192288033881345

23 =−−×

×−−×=b

249,13 =b

1.3) Estimador 1β

231211 .. xbxbyb −−==β

( ) 95249,1115243,0951 ×−×−−=b

29,41 =b

29

Page 33: Apostila Econometria 2013

A equação da demanda será então:

21 .249,1.243,029,4ˆ xxy +−= 2) Previsão da demanda quando:

871 =x (tarifa real média) 1052 =x (produto real)

Substituindo na equação anterior, encontramos:

( ) 105249,187243,029,4ˆ ×+×−=esty

( ) 3,114ˆ =esty

3) Intervalo de predição 3.1) Pelo critério normal É necessário calcular inicialmente o erro padrão da estimação

( )210

86,170ˆˆ2

−=

−−

= ∑knyy

S y

66,4ˆ =yS

O intervalo de predição será então

ySVE ˆ± 66,43,114 ±

96,11864,109 << IP 4) Coeficiente de determinação

O coeficiente de determinação (Poder explicativo da regressão), tem por objetivo medir a qualidade do ajuste, podendo ser avaliado pela relação:

( )( )

84,02282

13,1924ˆ2

22 ==

−=∑∑

yyyy

R

O resultado 84,02 =R ou %84 sugere uma boa qualidade de ajuste.

30

Page 34: Apostila Econometria 2013

5) Estatística F (ou teste F)

Pode ser obtido pelo quadro da análise da variância (ANOVA – Analisys of Variance) A aplicação da estatística F ao problema é verificar se as variáveis explicativas 1x e 2x (tarifa real e produto real), respectivamente, exercem conjuntamente efeito significativo sobre a variável dependente y (demanda de energia elétrica).

Quadro ANOVA Fonte de Variação

Soma dos quadrados

Graus de liberdade

Média quadrática

E

Regressão ( )∑ − 2ˆ yy k ( )

kyy

SR∑ −

=2

2 ˆ

2

2

E

R

SSE =

Resíduos ( )∑ − 2yy 1−− kn ( )

1ˆ 2

2

−−−

= ∑kn

yySE

=2RS variância explicada ou variância da regressão =2

ES variância residual =k número de variáveis explicativas

Retirando as estatísticas da tabela auxiliar e substituindo, encontramos:

Fonte de Variação ∑ dos quadrados g.l. Média

quadrática E

Regressão 13,1924 2 07,9622 =RS 73,38

84,2407,962

==E Resíduos 86,173 1210 −− 84,242 =ES

Logo,

73,38=cF (valor calculado de F) No caso de regressão múltipla, ou seja, duas ou mais variáveis explicativas, a formulação das hipóteses pode ser feita conforme abaixo:

0: 320 == bbH (ausência de efeito) 0: 321 ≠≠ bbH (presença de efeito)

Se ( )1−−> knFFc α , rejeitamos 0H ( )1−−< knFFc α , aceitamos 0H No exemplo em questão, ( )121005,0 −−> FFc

31

Page 35: Apostila Econometria 2013

( ) 74,4705,0 =F (na distribuição F, deve-se observar que o g.l. é igual a 2 no numerador e 7 no denominador. Como 74,473,38 05,0 =>= FFc , devemos rejeitar a hipótese 0H , o que sugere que pelo menos

uma das variáveis explicativas 1x ou 2x exerce influência significativa sobre a variável dependente y , com probabilidade de erro 5%.

6) Estatística t com relação aos parâmetros 2β e 3β

Sabe-se que: ib

iic S

bt ˆβ−

=

6.1) Estatística t para 02 =β O teste de significância para o efeito da variável explicativa 1x (tarifa real) pode ser:

0: 20 =βH (ausência de efeito) 0: 21 <βH (presença de efeito negativo)

Sabemos que: 243,02 −=b ; 093,0ˆ

2=bS

66,4ˆ =yS ; ( ) 3646,205,0 =− knt

( ) ( )093,0

9068803388

66,4

.

ˆˆ

2

22

2212

1

2=

−−

=

=

∑ ∑∑

xxx

x

SS y

b

62,2093,0

0243,0−=

−−=ct

62,2=ct Como αttc > ( )3646,262,2 > , rejeitamos 0H , o que sugere a presença de efeito negativo da variável x sobre y .

6.2) Estatística t para 3β

O teste t para o efeito da variável explicativa 2x (produto real) pode ser:

0: 30 =βH (ausência de efeito) 0: 31 >βH (presença de efeito positivo)

Sabemos que: 249,13=b ; 179,0ˆ

3=bS

32

Page 36: Apostila Econometria 2013

66,4ˆ =yS ; ( ) 3646,2705,0 =t

( ) ( )179,0

3388880906

66,4

.

ˆˆ

2

21

2212

2

3=

−−

=

=

∑ ∑∑

xxx

x

SS y

b

977,6179,0

0249,1=

−=ct

Verifica-se que αttc > ( )3646,2977,6 > , o que sugere rejeitar a hipótese 0H , significando a

presença de efeito positivo da variável explicativa 2x (produto real) sobre a demanda y . Pelo teste t, nota-se que os parâmetros 2β e 3β exercem influência sobre y , primeira negativamente e a segunda positivamente. Exemplo 7:

Considere o quadro abaixo com informações sobre investimentos ( )Y , lucro esperado ( )1X e o estoque de capital desejado ( )2X durante 15 anos (valores em R$ milhões).

it iY 1X 2X iy 1x 2x yx .1 21.xx yx .2 2

1x 22x y ( )2yy − ( )2ˆ yy − ( )2yy −

1 2 60 3 -3 -9 -3 27 27 9 81 9 2,48 0,23 6,35 9 2 2 62 3 -3 -7 -3 21 21 9 49 9 2,47 0,22 6,40 9 3 4 65 4 -1 -4 -2 4 8 2 16 4 3,32 0,46 2,82 1 4 6 68 5 1 -1 -1 -1 1 -1 1 1 4,16 3,39

...

1 5 4 65 5 -1 -4 -1 4 4 1 16 1 4,17 0,03 1 6 3 62 4 -2 -7 -2 14 14 4 49 4 3,32 0,10 4 7 5 66 6 0 -3 0 0 0 0 9 0 5,01 0,01 0 8 6 70 7 1 1 1 1 1 1 1 1 5,85 0,02 1 9 5 68 6 0 -1 0 0 0 0 1 0 5,86 0,74 0

10 3 65 4 -2 -4 -2 8 8 4 16 4 3,32 0,10 4 11 4 69 5 -1 0 -1 0 0 1 0 1 4,15 0,02 1 12 5 72 6 0 3 0 0 0 0 9 0 4,99 0,00 0 13 6 78 8 1 9 2 9 18 2 81 4 6,68 0,46 1 14 8 80 10 3 11 4 33 44 12 121 16 8,37 0,14 11,36 9 15 12 85 14 7 16 8 112 128 56 256 64 11,76 0,06 45,70 49 ∑ 75 1035 90 0 0 0 232 274 100 706 118 - 5,98 84,67 90

Pedidos: 1) Obter a função de regressão do investimento;

2) Interpretar os resultados dos parâmetros, pelo MQO;

3) Estimar o investimento esperado quando o lucro esperado for 90 e o estoque de capital for

12;

33

Page 37: Apostila Econometria 2013

4) Obter o intervalo de predição ou previsão do valor estimado em (3), com base no erro padrão

da estimativa;

5) Obter o intervalo de confiança dos estimadores 2β e 3β ;

6) Obter e interpretar o resultado da qualidade do ajuste (poder explicativo da regressão);

7) Verificar pelo teste F se as variáveis 1X e 2X exercem conjuntamente efeito significativo sobre Y (dependente);

8) Verificar pelo teste t se as variáveis 1X e 2X exercem separadamente efeito sobre Y .

Desenvolvimento:

1) Função Investimento O modelo é: exxy +++= 23121 ..ˆ βββ , cujos estimadores são 1b , 2b e 3b . As estatísticas calculadas com base no quadro auxiliar são:

5=Y 691 =X 62 =X 232.1 =∑ yx 7062

1 =∑ x

100.2 =∑ yx 11822 =∑ x

2747. 21 =∑ xx ( ) 75076. 221 =∑ xx

YYyi −= 11 XXxi −= 2,22 XXx i −=

( )( ) ( )( )

( )( ) ( )22122

21

221221

2..

.....

∑∑∑∑∑∑∑

−=

xxxx

yxxxxyxb

( ) ( )( ) 003,0

823224

75076118706100274118232

2 −=−

=−×

×−×=b

003,02 −=b

( )( ) ( )( )( )( ) ( )221

22

21

121212

3..

.....

∑∑∑∑∑∑∑

−=

xxxx

yxxxxyxb

34

Page 38: Apostila Econometria 2013

( ) ( )( ) 85,0

82327032

75076118706232274706100

3 ==−×

×−×=b ; 85,03 =b

23121 .. xbxbyb −−=

( ) 685,069003,051 ×−×−−=b

( ) 10,521,051 −−−=b

11,01 =b

21 .85,0.003,011,0ˆ xxy +−=

2) Interpretação dos parâmetros 2.1) O valor 0,11 do intercepto significa que se o lucro esperado ( )1X e o estoque de capital

desejado ( )2X forem zero, o investimento seria de R$0,11.

2.2) A variável explicativa 1X (lucro esperado) sendo negativa, um aumento de R$1,00 no lucro esperado acarreta um decréscimo de R$0,003 no investimento.

2.3) A variável explicativa 2X (estoque de capital desejado) sendo positiva, significa que um aumento de R$1,00 nessa variável acarreta um aumento de R$0,85 no investimento.

3) Investimento esperado

( ) 21 .85,0.003,011,0ˆ xxy esperado +−=

( ) 20,1027,011,0ˆ +−=esperadoy

( ) 04,10$ˆ Ry esperado =

4 ) Intervalo de predição do valor estimado

( )knyy

S y −−

= ∑ 2ˆˆ ySVEIP ˆ±=

( ) 98,5ˆ 2 =−∑ yy ; 15=n ; 3=k

71,0315

98,5ˆ =−

=yS

35

Page 39: Apostila Econometria 2013

71,0ˆ =yS

yy SVEIPSVEIP ˆˆ +<<−=

71,004,1071,004,10 +<<− IP

75,1033,9 << IP

5) Intervalo de confiança dos estimadores 5.1) Intervalo de 22 b=β Calculamos inicialmente o erro padrão de 2β

( )∑∑∑ −

=

22

2212

1

.

ˆˆ

2

xxx

x

SS yβ ∑ = 7062

1x ; ∑ =11822x

( )085,0

118274706

71,0ˆ22=

=βS

085,0ˆ

2=βS

O intervalo de confiança de

2ˆβS baseia-se na igualdade probabilística.

( )( ) ( )

iiSkntbSkntbPP iii βαβα β ˆ.ˆ.1 −+≤≤−−=−

( ) ( ) 085,0.315003,0085,0.315003,01 05,0205,0 −+−≤≤−−−=− ttP β

085,01788,2003,0085,01788,2003,01 2 ×+−≤≤×−−=− βP

1822,01882,095,0 2 ≤≤−= β

O resultado significa que existe uma probabilidade de 0,95 de que o estimador 2β esteja entre

1882,0− e 1822,0 . 5.2) Intervalo de 3β . Cálculo inicial de erro padrão de 3β

36

Page 40: Apostila Econometria 2013

( )∑ ∑

∑−

=

21

2212

2

.

ˆˆ

3

xxx

x

SS y

b

Estatísticas:

∑ =11822x ( ) 076.75274. 22

21 ==∑ xx

71,0ˆ =yS 70621 =∑ x

66,1171,0

706076.75118

71,0ˆ3

=−

=bS

21,0ˆ

3=bS

Calculado o erro padrão de

bS , o intervalo de confiança baseia-se na igualdade probabilística

( )( ) ( )33

ˆ.ˆ.1 333 βαβα β SkntbSkntbPP −+≤≤−−=− Sabemos que:

85,03 =β , 21,03=βS e ( ) 1788,21205,0 =t , então teremos:

1788,221,085,01788,221,085,095,0 3 ×+≤≤×−= β

31,139,095,0 3 ≤≤= β

O intervalo encontrado de 3β sugere que existe uma probabilidade de 0,95 de que 3β esteja entre 39,0 e 31,1 . 6) Qualidade do ajuste O poder explicativo da regressão ou coeficiente de determinação tem por objetivo avaliar a qualidade do ajuste e é medido pela expressão 2R .

( )( )∑

∑−

−= 2

22 ˆ

yyyy

R

Onde: 10 2 ≤≤ R ou %1000 2 ≤≤ R Da tabela extraímos as estatísticas:

37

Page 41: Apostila Econometria 2013

( ) 67,84ˆ 2 =−∑ yy ; ( ) 902∑ =− yy

9067,842 =R ∴ 94,02 =R ou %94

O resultado obtido sugere uma boa qualidade de ajuste na função de regressão.

7) Verificação pelo teste F se as variáveis explicativas 1X e 2X exercem influência conjunta sobre a variável dependente Y .

Do quadro auxiliar de cálculos retiramos as estatísticas:

( ) 67,84ˆ 2 =−∑ yy ; 15=n (amostra)

( ) 98,5ˆ 2 =−∑ yy ; 2=k (variáveis explicativas) Utilizando ANOVA para obter cF :

Fonte de Variação ∑ dos quadrados g.l. Média

quadrática cF

Regressão 67,84 2 34,42 48,170

25,034,42

==cF Resíduos 98,5 1215 −− 25,0

Hipóteses:

0: 320 == bbH (ausência de efeito) 0: 321 ≠≠ bbH (presença de efeito)

Conclusão:

48,170=cF ; ( ) 89,31305,0 =F

αFFc > Como αFFc > rejeitamos a hipótese 0H , o que sugere que pelo menos uma das variáveis explicativas exerce efeito sobre a variável Y . Com a probabilidade de 95% de que a assertiva esteja correta. 8) Avaliação da influência pelo teste t (Student) - Formulação das hipóteses:

38

Page 42: Apostila Econometria 2013

0: 20 =bH (ausência de influência) 0: 21 ≠bH (presença de influência)

ib

iic S

bt ˆβ−

= (Geral)

- Teste para o estimador 2b (estimativa de 2β )

035,0085,0

0003,0ˆ

2

22 =−

=−

=b

c Sbt β

035,0=ct

Tabela (t) = ( ) 1788,21205,0 =t Verifica-se que αttc < , o que sugere aceitar 0H , ou seja, ausência de influência. - Teste para o estimador 3b (estimativa de 3β )

04,421,0

085,0=

−=ct

04,4=ct

( ) 1788,21205,0 =t

Verifica-se que αttc > , o que sugere rejeitar a hipótese 0H , ou seja, a variável estoque de capital ( )2X exerce influência positiva sobre os investimentos. Nota-se pelo teste t que apenas 3β exerce influência sobre a variável y .

39

Page 43: Apostila Econometria 2013

Exemplo 8:

A tabela abaixo representa as observações semanais sobre receitas ( )iY , em R$1000,00, sobre

preço de venda ( )1X , em R$1,00, e gastos com propaganda ( )2X , em R$1000,00, durante 12 semanas para uma cadeia de lanchonetes.

it iY 1X 2X

1 120 2,0 10 2 122 2,0 8 3 90 1,5 23 4 123 2,0 11 5 122 2,0 10 6 108 2,5 6 7 150 2,5 18 8 90 1,8 19 9 140 2,5 21

10 125 1,2 18 11 110 1,8 16 12 116 2,2 20 ∑ 1416 24 180

- Desenvolver: 1) Obter a equação de regressão múltipla estimada da receita ( )iy ;

2) Obter a previsão da receita quando 30,21 =x e 222 =x , em 13t ;

3) Obter o intervalo de predição da receita prevista no item anterior;

4) Determinar o erro padrão de estimativa;

5) Calcular o erro padrão dos estimadores 2β e 3β ;

6) Obter o intervalo de confiança dos estimadores 2β e 3β ;

7) Avaliar a qualidade do ajuste;

8) Verificar pelo teste F se as variáveis explicativas 1x e 2x exercem influência conjunta sobre a

variável receita ( )iY .

Exemplo 9: Dez pessoas sadias entre 20 e 40 anos, do sexo masculino, foram submetidas a um teste de avaliação física, quanto ao peso total ( )iY , peso magro ( )1X e as calorias diárias ingeridas ( )2X , como se segue:

40

Page 44: Apostila Econometria 2013

iY 1X 2X 77 52 2.000 62 42 1.600 65 45 1.800 76 51 2.000 74 45 1.800 61 41 1.600 64 42 1.700 61 41 1.500 67 47 1.600 63 44 1.400

- Considerando que a série de valores apresenta comportamento linear, obter:

a) A equação de regressão múltipla;

b) O peso total estimado, quando 501 =X e 450.12 =X ;

c) O erro padrão da estimativa;

d) O erro padrão dos estimadores 2β e 3β ;

e) Analisar pelo teste F se as variáveis explicativas 1x e 2x exercem, conjuntamente, influência sobre o peso total y ;

Exemplo 10: Considere as assertivas abaixo: A) A função consumo: C= a+bx+e, onde C= consumo agregado; x= renda e e= erro aleatório, é um

exemplo clássico de modelo teórico; B) O conjunto de variáveis exófenas mais o termo constante é denominado de regressor;

C) Com relação a regressão linear múltipla, a variável dependente y deve variar linearmente com o conjunto de variáveis xi e não com cada uma destas;

D) Se comparamos a regressão linear múltipla com a regressão linear simples, os resíduos

daquele são sempre menores; E) Numa análise de regressão, o termo erro aleatório ou perturbação estocástica (e), nada mais é

do que o representante de todas as variáveis omitidas que podem eventualmente afetar a variável endógena, mas que não puderam ser incluídas no modelo.

41

Page 45: Apostila Econometria 2013

Estão corretas as afirmativas: a) A e B b) C e D c)A e E d) B eE e) A,B e E

Exemplo 11:

Com relação à regressão linear múltipla, assinale a afirmativa correta: A) A representação geométrica é sempre de um plano: exxxy nn +++++= −123121 ..... ββββ B) Quando comparados com a regressão linear simples, os resíduos são sempre menores; C) A variável y dependente deve variar linearmente com o conjunto de variáveis xi e não com

cada uma delas; D) Funções como kx

kxx bbbay .....21

21 ⋅⋅= são sempre linearizáveis ; E) Na aplicação de logaritmos sempre permite a lenearização, culminando na representação

geométrica por hiperplano. Exemplo 12: Considerando o modelo de regressão linear simples, tendo x como variável aleatória e

independente e y como variável dependente, é correto afirmar que: a) A variável x não é isenta de erro; b) A função de regressão fornece a média de x para cada y considerado; c) A variável não é isenta de erro; d) A variação residual de y é distribuída normalmente com desvio padrão constante e média

diferente de zero; e) A variação residual de y é constante com x.

42

Page 46: Apostila Econometria 2013

Exemplo 13: Dentre as afirmativas abaixo, assinale a(s) correta(s) a) Quando o pesquisador encontra dificuldades para incorporar a um dado modelo e fatos de

natureza não quantitativa, podemos dizer que está diante de umalimitação de natureza estatística;

b) A função consumo do tipo ex ++ .21 ββ , onde y= consumo agregado; x= renda e e = erro

aleatório , pode ser considerado um modelo econométrico, dada a necessidade de aplicar tratamento estatístico na sua análise;

c) O conjunto de variáveis exógenas mais o termo entercepto são denominados de regressores; d) Num modelo de regressão linear deverão ser levados em consideração alguns pressupostos

básicos, como por exemplo: “A covariância entre qualquer par de erros aleatórios e1 e e2 é sempre diferente da covariância do par y e y2 que é igual a unidade”

Exemplo 14: Uma série temporal de 15 termos foi ajustada a uma função do tipo µββ ++= xy .21 , tendo sido encontradas as seguintes estatísticas de avaliação: a) xy 8,15,4ˆ += b) 696,0ˆ

2 =bS c) ( )∑ =− 4,113ˆ 2yy d) ( )∑ =− 3002yy e) ( )∑ =− 6,186ˆ 2yy 14.1. Determinando o intervalo de confiança com o estimador 2β , com 05,0=α , encontramos ... a) 0,316 283,32 ≤≤ β b) 0,307 292,32 ≤≤ β c) 0,302 983,52 ≤≤ β

43

Page 47: Apostila Econometria 2013

d) 2,996 003,62 ≤≤ β e) 0,296 303,32 ≤≤ β 14.2. Determinando o valor do poder explicativo da regressão (R2) obtemos: a) 0,608 b)0,622 c)0,378 d)0,806 e)2,645 14.3. Testando a hipótese quanto a ausencia ou a presença de regressão da função xy 8,15,4ˆ += pelo teste F, com base em ANOVA, obtemos para F0(calculado) o valor de .......; e assim podemos concluir que ..... a) 7,9 ; sugere ausência de regressão entre x e y; b) 7,9 ; os dados são insuficientes para aplicação do teste; c) 9,1 ; sugere ausência de linearidade da função; d) 7,9 ; sugere presença de regressão entre x e y; e) N.R.A Exemplo 15:

Qual das afirmações abaixo faz referencia correta ao modelo de regressão linear simples? a) Toda regressão apresenta heterocedasticidade. b) Se a variância é constante, os dados são homocedásticos. c) O intercepto α representa a inclinação da reta de regressão. d) Os erros do modelo não são aleatórios, com a esperança igual a 1. e) A constante α é sempre positiva. Exemplo 16 :

Com relação à Regressão Linear Múltipla, assinale a afirmativa correta: a) A variável Y dependente deve variar linearmente com o conjunto de variáveis X1 e não com

cada uma destas. b) A representação geométrica é sempre de um plano: y=a1+b2x1+b3x2+.......bnxn-1 +e1 . c) Funções como xk

kxx bbaby .....22

11= são sempre linearizáveis.

d) A aplicação de logaritmos sempre permite a linearização, culminando na representação geométrica por hiperplano.

e) Quando comparados com a Regressão Linear Simples, os resíduos são sempre menores.

44

Page 48: Apostila Econometria 2013

Exemplo 17: Suponha que o custo de produção de energia por kilowatt/hora(Y) seja uma função linear do fator de carga (X1), em % e do custo do carvão (XZ) em centavos de dólar por milhão de Btu. Assumindo normalidade dos dados, um modelo de regressão linear múltipla foi adotado para uma amostra de tamanho 12. O modelo estimado foi: Y= 6,14 – 0,04X1 + 0,09X2 (0,91) (0,01) (0,01) Sendo os erros padrões indicados entre parênteses. A tabela da análise de variância, incompleta, encontra-se a seguir

TABELA ANOVA

FV Graus de liberdade

Soma dos quadrados

Média dos quadrados

F F de significação

Regressão 31,15 9,02E-05 Residuo 0,6 Total

Com base nesses dados, considere as afirmações a seguir: I. Para cada aumento de uma unidade na variável X1 corresponderá um decréscimo de 0,04 na

variável Y, permanecendo inalterada a variável X2. II. A variância residual do modelo considerado é 0,6 (Kilowatt/hora)2. III. O intervalo bilateral de 95% de confiança para o custo do carvão é, aproximadamente, (0,07;

0,11) Está correto o que se afirma em: a) II apenas b) III apenas c) I e II apenas d) I e III apenas e ) I,II e III . Capítulo 5: CORRELAÇÃO 5.1. OBJETIVO PARA A ECONOMIA É de grande importância para a Economia explorar e verificar os inter-relacionamentos existentes entre as variáveis econômicas. Essa avaliação, bem como seu grau de intensidade, pode ser medida através do coeficiente de correlação que veremos a seguir. 5.2. CONCEITO DE CORRELAÇÃO Correlacionar é verificar com base em técnicas especiais se existe inter-relacionamento entre variáveis (econômicas ou não).

45

Page 49: Apostila Econometria 2013

Quando esta avaliação é feita entre duas variáveis como, por exemplo, consumo médio e renda média, é denominada correlação simples. Quando a avaliação é feita entre três ou mais variáveis é chamada de múltipla como, por exemplo, temperatura, umidade, índice pluviométrico, patrimônio, faturamento, vendas, etc...Os princípios básicos que regem os problemas da correlação múltipla são semelhantes aos da correlação simples. Quando é feita entre três ou mais variáveis permanecendo fixa (constante), as demais variáveis do conjunto observado é chamada de parcial. Dessa forma, a correlação parcial estima a relação funcional entre a variável dependente e outras variáveis independentes. No nosso curso, serão detalhadas apenas a avaliação e interpretação da correlação simples. 5.3. MEDIDA DE CORRELAÇÃO O instrumento de medida de correlação é dado pelo coeficiente de correlação de Pearson, representado por r , e as expressões para o cálculo geralmente utilizadas são:

( )( )

( ) ( )

−=

∑ ∑∑ ∑

∑∑∑

ny

ynx

x

nyx

xyr

22

22 .

.

(30)

Outra forma de cálculo:

( )( )[ ]yxn

yyxxr

σσ ××−−

= ∑ . (31)

Onde: x e y = variáveis sob análise

xσ e yσ = desvios padrão das variáveis x e y n = tamanho amostral 5.4. O COEFICIENTE DE CORRELAÇÃO r E SUA INTERPRETAÇÃO O valor de r pode apresentar-se de forma positiva ou negativa. Quando r é positivo significa que as duas variáveis em estudo ( x e y ), por exemplo, crescem ou decrescem no mesmo sentido. Quando r é negativo significa que as duas variáveis em análise seguem sentidos inversos, ou seja, quando os valores de x evoluem crescentemente, os de y tendem a evoluir decrescentemente e vice-versa.

46

Page 50: Apostila Econometria 2013

Genericamente, a interpretação do valor de r pode ser obtida com base na tabela seguinte:

r ( )± Correlação 0 Nula

0,00 0,30 Fraca 0,30 0,60 Média 0,60 0,90 Forte 0,90 0,99 Fortíssima

1 Máxima O domínio de r é portanto:

11 +≤≤− r Depreende-se pela tabela de avaliação que quanto mais próximo for o valor de r de 1 ou -1, mais acentuado é o inter-relacionamento entre as variáveis ( x e y ). Ressalve-se que tais valores são arbitrários , razão pela qual deverão ser usados apenas para se ter uma idéia da magnitude da correlação e não como medida decisória. 5.5. IMAGENS DE r NO PLANO CARTESIANO EM FUNÇÃO DO SEU VALOR

10 << r

y

x01 <<− r

y

x(correlação

(correlação negativa)

0=r

(correlação nula) (circular)

y

x

y

x

47

Page 51: Apostila Econometria 2013

( r = máxima positiva)

5.6. DIFERENÇA ENTRE CORRELAÇÃO E REGRESSÃO Vale deixar registrado que existe uma diferença entre correlação e regressão. Como já vimos, a correlação mede o grau de inter-relacionamento ou associação entre variáveis, ao passo que a regressão mostra o efeito da variável explicativa ix sobre a variável explicada iy . Se analisarmos os dois procedimentos, podemos sugerir que a análise de regressão apresenta algumas vantagens em relação à análise de correlação, quais sejam: - A regressão indica o sentido da relação de dependência entre x e y ; - Os parâmetros intercepto e angular podem ser estimados e utilizados para fins de previsão. Exemplo 18:

O par y e x se refere a demanda de energia elétrica ( )y e tarifa ( )x .

it ( )kwy 1000 x yx. 2y 2x ( )xx − ( )yy − ba× 2a 2b 1 30 4 120 900 16 -2 8 -16 4 64 2 28 4 112 784 16 -2 6 -12 4 36 3 24 3

... ... ...

-3 2 -6 9 4 4 23 5 -1 1 -1 1 1 5 22 5 -1 0 0 1 0 6 22 5 -1 0 0 1 0 7 20 6 0 -2 0 0 4 8 18 8 2 -4 -8 4 16 9 18 9 3 -4 -12 9 16

10 15 11 165 225 121 5 -7 -35 25 49 ∑ 220 60 1230 5030 418 0 0 -90 58 190

( r = máxima negativa)

1+=r 1−=r

48

Page 52: Apostila Econometria 2013

Perguntas: 1) Calcular o coeficiente de correlação ( )r pelos dois procedimentos, interpretando o resultado;

2) Traçar o diagrama de dispersão e verificar se o citado diagrama corresponde ao valor

encontrado de r ;

3) Testar a hipótese da existência de correlação entre y e x por Student, com 05,0=α .

Desenvolvimento: 1) Cálculo de r

1.1) Pela expressão (30)

( )( )

( ) ( )

−=

∑ ∑∑ ∑

∑∑∑

ny

ynx

x

nyx

xyr

22

22 .

.

×−

=

10484005030.

103600418

10220601230

r

86,0−=r

Pela expressão (31)

( )( )[ ]

yxnyyxx

rσσ ××−−

= ∑ .

408,2359,41090××

−=r

86,0−=r

. Interpretação: É fácil verificar que os resultados obtidos pelos dois critérios são os mesmos, sugerindo uma forte correlação inversa, o que significa que, à medida que o consumo de energia elétrica decresce, aumenta o valor da tarifa.

49

Page 53: Apostila Econometria 2013

y

x

2) Diagrama de dispersão O diagrama de dispersão nada mais é do que a colocação de pontos coordenados de y e x no plano cartesiano, o que nos permite visualizar a relação entre essas variáveis. Além disso, ajuda-nos a identificar a presença de outliers que, se ocorrer, pode distorcer acentuadamente o resultado da correlação. Outliers são dados atípicios que diferem significativamente do conjunto sob análise. A imagem gráfica abaixo sugere que as duas variáveis nela consideradas (consumo de energia elétrica x tarifa) são negativamente relacionadas, sem presença de outliers

3) Teste de hipótese da existência de ( )r

Nem sempre o valor de ( )r garante a existência de correlação devido a fatores diversos, tais como número insuficiente de dados amostrais, variáveis com informações distorcidas, etc. Uma forma para se verificar a existência de correlação é a aplicação do teste de hipóteses, como a distribuição t de Student, por exemplo. Recomenda-se aplicar o teste para variáveis com tamanho da amostra igual ou superior a 30 informações, pois se deve atender a hipótese que as mesma apresentam tendência de normalidade. Para testar a hipótese por Student, devemos inicialmente determinar o valor de t calculado ( )ct pela expressão:

30

25

20

15

10

5

2 4 6 8 10 12

50

Page 54: Apostila Econometria 2013

21.

rknrtc

−= (32)

Onde: =r resultado do coeficiente de correlação =n tamanho da amostra

K = número de variáveis O valor de ct deve ser comparado com o valor de ( )knt −α tabelado. Se ( )knttc −> α

ou ( )knttc −−< α Em contra partida se:

( ) ( )knttknt c −≤≤−− αα , aceita a hipótese 0H A formulação das hipóteses deverá acompanhar o seguinte esquema:

0:0 =ρH , ausência de correlação 0:1 ≠ρH , presença de correlação

No exemplo em questão temos:

21.

rknrtc

−=

( )286,01

210.86,0

−−=ct

Consultando a tabela para ( ) 31,221005,0 =−t , nota-se que 7,4−=ct é maior que ( ) 31,28 =αt , o

que sugere rejeitar a hipótese 0H e aceitar 1H , que indica presença de correlação, conforme hipóteses abaixo formuladas.

0:0 =ρH , ausência de correlação 0:1 ≠ρH , presença de correlação

4) Formas alternativas para o cálculo de r (coeficiente de correlação) e de R2 (coeficiente de

determinação) Conhecendo-se o valor de r, pode-se rapidamente estimar o valor de R2, bastanto para tanto elevar ao quadrado o valor de r, ou seja: se r = 0,75, R2=0,56. Da mesma forma, como decorrência, se R2 =0,56, r = 75,056,0 ±=

51

Page 55: Apostila Econometria 2013

Exemplo 19: Considere o par abaixo referente a taxa efetiva de inflação ( )%y e a taxa de desemprego ( )%x . ( )it iy ix

t1 6 5 t2 11 6 t3 9 8 t4 6 8 t5 6 7 t6 8 6 t7 11 6 t8 13 7 t9 10 8 t10 10 9

1) Calcular o coeficiente de correlação pelos modelos conhecidos, interpretando o resultado;

2) Traçar o diagrama de dispersão no plano cartesiano. Verificar se há coerência com o valor de

r encontrado; 3) Testar a hipótese da existência de correlação entre inflação e taxa de desemprego. Utilize

Student com 05,0=α . Exemplo 20: Com base nos dados do índice de quantidade demandada e tarifa real do exemplo 3, obter: a) O coeficiente de correlação, interpretando o seu resultado;

b) Traçar o diagrama de dispersão; c) Testar a hipótese da existência de correlação, utilizando Student, com 05,0=α .

Exemplo 21: Sobre a avaliação da correlação linear, analise as assertivas: A) O coeficiente de correlação deverá ser testado quanto à diferença para nulidade, através do teste t de Student; B) A correlação parcial estima a relação funcional entre a variável dependente e outras variáveis independentes;

52

Page 56: Apostila Econometria 2013

C) Na correlação linear múltipla, R2 indica a parcela de variação total de y explicada pelo hiperplano de regressão. D) A presença de outliers suaviza o efeito da correlação. Está (ão) correta (s) apenas a(s) afirmativa (s) : 1) A 2) B e C 3) A, B e C 4) A,C e D 5) A e B Exemplo 22:

Utilizou-se um modelo de regressão linear para avaliar a relação entre o preço do litro da gasolina e o do petróleo Brent, ambos em reais, compreendendo o período de janeiro de 2002 a dezembro de 2006. Os resultados obtidos foram:

( ) ( )∑ ∑= =

=−=−60

1

60

1

22 052,0ˆ581;18

i iiii YYYY e 47,2. −= EFsig

Considere o quadro a seguir. ANOVA

FV Soma dos quadrados Graus de liberdade Média dos quadrados F Fsig

Modelo (regressão) z

Residual x Y

Total

Os valores de X , Y e Z, no quadro acima, respectivamente, são: a) 3,016; 0,052 e 2,78E-4; b) 3,016; 0,052 e 288,154; c) 14,98; 3,016 e 288,154; d) 18; 0,052 e 2,78E-4 e) 18; 0,052 e 288,154.

53

Page 57: Apostila Econometria 2013

Exemplo 23: As estatísticas a seguir foram obtidas de observações realizadas em 100 individuos com relação a duas características X e Y.

∑ ∑= =

=−=100

1

100

1248;58

i iii XY ;

( ) ( )∑ ∑= =

=−=−100

1

100

1

22 144;25i i

ii YYXX ;

( )( )∑=

=−−100

1;2,43

iii YYXX

O coeficiente de correlação amostral entre X e Y é igual a : a) -0,36 b) -0,18 c) 0,44 d) 0,72 e) 0,80

Exemplo 24: A partir de uma amostra aleatória (X1 , Y1), (X2, Y2) ........., (X20, Y20) foram obtidas as estatísticas: médias 5,12=X e 19=Y , variâncias amostrais 302 =xS e 542 =yS e covariância 362 =xyS Qual a reta de regressão estimada de Y em X? a) ;667,019ˆ

ii XY += b) ;2,15,12ˆii XY +=

c) ;2,14ˆii XY += d) ;2,119ˆ

ii XY += e) ;8,2280ˆii XY +=

Capítulo 6: VIOLAÇÃO DOS PRESSUPOSTOS BÁSICOS Neste capítulo serão abordados alguns aspectos relacionados com a estimação de modelos quando os resíduos ( )ie não são constantes, ou seja, quando tais resíduos associados com observações em um dado período de tempo se mantiverem, por transferência, nos períodos subsequentes. Na ocorrência desses casos, estamos diante de uma violação aos pressupostos básicos já comentados. Assim, nos itens 6.1 a 6.5 deste capítulo falaremos sobre heteroscedasticidade e no capítulo 7 sobre autocorrelação que é uma outra forma de violação.

54

Page 58: Apostila Econometria 2013

6.1. HETEROSCEDASTICIDADE E HOMOSCEDASTICIDADE Já vimos que na análise de regressão era necessário levar em consideração algumas hipóteses, tais como: - o valor de y para cada valor de x é dado por: exy ++= 121 .ββ ; - a esperança do erro aleatório deverá ser igual a zero → ( ) 0=eE ; - a variância do erro aleatório deverá ser igual a variância de y (variável explicada) →

( ) ( )yVeV = ; - as variáveis explicativas ( )ix são fixas e não estocásticas;

- a variância do erro aleatório deverá ser constante → ( )eV = constante; - além de outros.

Quando os pressupostos citados ou hipóteses básicas não se verificam, estamos diante de uma violação ou transgressão. Na ocorrência desses casos algumas indagações vêm à mente do pesquisador, tais como: o que provoca tais distorções? Quais as consequências para as estimações dos parâmetros? O que fazer para minimizar tais problemas? Quais os procedimentos para diagnosticá-los? Para melhor entender a matéria é necessário conhecer o significado de alguns termos, como heteroscedasticidade e homoscedasticidade.

6.2. NATUREZA DA HETEROSCEDASTICIDADE Conforme comentado acima, uma importante hipótese no modelo de regressão é que a variância de cada erro aleatório ( )eV seja um número constante igual a 2σ . Essa é a hipótese do princípio da homoscedasticidade. Quando isso não se verifica, ou seja, quando a variância do erro aleatório ( )eV é algum número não constante, para todas as informações numéricas dizemos que o modelo de regressão é heteroscedástico e, nesse caso, estaremos diante de uma série numérica que apresenta problemas heteroscedásticos. Para melhor esclarecer a diferença entre homoscedasticidade e heteroscedasticidade suponha que no modelo exy ++= 121 .ˆ ββ , y represente poupança e x a renda. Na prática, à medida que a renda aumenta a poupança também tende a aumentar, em média. Quando a variância, em relação à média da poupança, permanece a mesma em todos os níveis de renda, ou seja, mesmo que a renda aumente, a variância da poupança permanece constante, dizemos que este comportamento é homoscedástico.

55

Page 59: Apostila Econometria 2013

Diagramaticamente, um comportamento homoscedástico de pontuações aleatórias pode ser observado no diagrama 1. Por esse diagrama, mesmo quando o nível ( )in de renda aumenta, a variância condicional da poupança permanece a mesma.

Diagrama 1 (homoscedástico)

ni = nível de renda Nota-se que a variância da poupança permanece constante, mesmo com o aumento da renda. Quando a variância condicional de y (poupança) aumenta, quando a renda ( )in aumenta, ou seja, quando as variâncias não são mais as mesmas, quando os níveis de renda aumentam, como se pode verificar no diagrama 2, dizemos que existe heteroscedasticidade.

n3

n2

n1

ixy .ˆ 21 ββ +=

Renda ( )x

Poupança ( )y

Função densidade de probabilidade

56

Page 60: Apostila Econometria 2013

Diagrama 2 (heteroscedástico) ni = nível de renda OBS: Nota-se que a variância da poupança vai se modificando à medida que o nível de renda aumenta. Alguns autores definem heteroscedasticidade como sendo a existência de não-imutabilidade nos resultados da variância dos erros, ou também, quando os desvios-padrão dos resíduos não são constantes. Como o desvio padrão é a raiz quadrada da variancia, procede a definição. 6.3. CONSEQUÊNCIAS DA HETEROSCEDASTICIDADE Uma das consequências de maior relevância é que os estimadores ( )ib obtidos (principalmente pelo M.Q.O.) não são eficientes ou não apresentam variância mínima, o que significa violar um dos princípios do método dos mínimos quadrados, tendo como consequências: - erros padrão viesados; - incorreção nos testes t e F; - intervalos de confiança não confiável; - etc. 6.4. DETECÇÃO DA HETEROSCEDASTICIDADE Para verificação da existência de heteroscedasticidade existem dois métodos (formais e informais)

n3

n2

n1

ixy .ˆ 21 ββ +=

Renda ( )x

Poupança ( )y

Função densidade de probabilidade

57

Page 61: Apostila Econometria 2013

Detecção pelo método informal ou por observação visual: Os métodos informais podem ser utilizados quando se desconhece a natureza da heteroscedasticidade e, nesse caso, efetuamos a análise de regressão partindo-se da hipótese de que não há nenhuma violação aos pressupostos. Procedimentos operacionais: 1) Obter a equação de regressão; 2) Determinar os resíduos ( )ie ; 3) Representar graficamente os valores residuais no plano cartesiano; 4) Comparar o diagrama assim obtido com os diagramas padronizados de resíduos

reconhecidamente heteroscedásticos, cujos formatos são os diagramas d1, d2, d3 e d4 adiante;

5) Se o diagrama obtido assemelhar-se ao da figura (d1, d2 e d3) é provável que a série seja heteroscedástica; caso se assemelhe ao da figura d4 é provável que a série seja homoscedástica.

Diagramas padrão de resíduos heteroscedásticos

d1, d2 e d3 são resíduos heteroscedásticos. d4 é um resíduo homoscedástico.

ie

ix

d1 ie

ix

d2

ie

ix

d3 ie

ix

d4

58

Page 62: Apostila Econometria 2013

x

ie

Exemplo 25:

O par ii yx ; apresenta a seguinte equação de regressão: xy 77,022,0ˆ +−= . Verificar, com base em análise visual dos resíduos ( )ie , se a série apresenta tendência heteroscedástica.

x y ie 6 4 -0,4 9 6 -0,7

11 10 1,5 15 14 2,5 16 9 -3,3 22 13 -3,9 23 21 3,3

102 77 Desenvolvimento:

Pelo método informal, calculamos os resíduos ( )ie com base na equação de regressão já informada, xy 77,022,0ˆ +−= , resultando na coluna ie do quadro. Na sequência plotamos esses valores no plano cartesiano, cuja imagem é a que se segue.

4,0

3,5

3,0

2,5

2,0

1,5

1,0

0,5

-0,5 5 10 15 20 25

-1,0

-1,5

-2,0

-2,5

-3,0

-3,5

-4,0

59

Page 63: Apostila Econometria 2013

Conclusão: Fazendo a comparação gráfica nota-se que o diagrama residual ie do par de valores ( x e y ) assemelha-se ao da figura d1 que é um padrão de resíduo heteroscedástico. Dessa forma, com base em análise visual dos resíduos, conclui-se que a série em questão é heteroscedástica. Exemplo 26:

O par ii yx ; de tendência linear tem equação de regressão ixy 94,771342,0ˆ +−= . Verificar, com base em análise visual dos resíduos se a mesma é heteroscedástica.

ix iy 0,060 4 0,086 6 0,107 10 0,146 14 0,156 9 0,215 13 0,230 21 1,00 77

Detecção da heteroscedasticidade pelo método formal Existem inúmero testes para verificar a presença de heteroscedasticidade pelo método formal, tais como os métodos de: - Goldfeld e Quandt; - Pesaran e Pesaran; - Gledjiser; - Etc. Apesar desses métodos apresentarem fundamentos teóricos assemelhados, o mais recomendado é o teste de Goldfeld e Quandt. Neste método, conhecido um dado par de valores de iy e ix , os procedimentos operacionais para sua verificação sãos os seguintes: Teste de Goldfeld e Quandt

1) Ordenar os valores da variável explicativa ix , de forma crescente, ou seja, segundo a sua

magnitude;

2) Os valores de y deverão acompanhar o deslocamento de x ;

3) Eliminar alguns dados centrais da série após a ordenação. Geralmente é da ordem de, no máximo, ⅓ do tamanho amostral ( c = dados eliminados);

60

Page 64: Apostila Econometria 2013

4) As observações restantes, ou seja, aquelas correspondentes a ( )cn − observações deverão

ser divididas em dois subgrupos de igual tamanho. Por exemplo, se 30=n e tendo sido desconsiderado 10=c (⅓ de 30), restando 20=n , formando dois subgrupos de 10 informações cada;

5) Obter a função de regressão dos dois subgrupos;

6) Obter a soma dos quadrados dos resíduos dos dois subgrupos, respectivamente SQR1 e SQR2, ou seja:

( )∑ −= 2111 yySQR (33)

( )∑ −= 2222 yySQR (34)

7) Obter F calculado ( )cF , que é a relação entre SQR2 e SQR1, dividido pelo número de graus de

liberdade. ( )( )( )( )kcn

yykcn

yy

Fc

2.5,0ˆ

2.5,0ˆ

211

222

−−−−−

=∑

∑ (35)

O número de graus de liberdade (g.l.) é dado pela expressão:

( ) ( )kcnkcnlg 2.5,02

2.. −−=−−

= (36)

Onde: =n tamanho da amostra inicial =c número de itens amostrais desprezados =k número de parâmetros (intercepto + angulares)

8) Comparar o valor de cF com o valor tabelado de F de Fisher, com o g.l. obtido em (36), ou

seja: ( ) 5,0.2kcnF −−α

9) Se αFFc > rejeitamos a hipótese de que a série de resíduos é homoscedástica, o que significa sugerir que, provavelmente, a série é heteroscedástica. Em caso contrário, se αFFc < a série é homoscedástica.

OBSERVAÇÃO: A finalidade de se desprezar alguns dados centrais da série é acentuar a diferença entre o subgrupo de variância maior. A omissão de dados deverá ser feita em função do tamanho da amostra. Via de regra costuma-se desprezar: - para 830 ±→=n dados - para 1660 ±→=n dados, etc.

61

Page 65: Apostila Econometria 2013

Exemplo 27:

Verificar, com base no teste de Goldfeld e Quandt, se o par de valores abaixo apresenta sintomas de heteroscedasticidade. Dados originais

1y 1x 33 44 37 49 41 54 46 62 51 68 57 71 65 78 72 82 81 86 91 92

100 100 103 97 114 98 122 95 136 101 141 109 150 117 155 121 163 121 170 125 172 119

Desenvolvimento:

1) Dados ordenados 2y 2x 2y 2x 2y 2x

33 44 122 95 170 125 37 49 103 97 41 54 114 98 46 62 100 100 51 68 136 101 57 71 141 109 65 78 150 117 72 82 172 119 81 86 155 121 91 92 163 121

62

Page 66: Apostila Econometria 2013

OBS: Os dados foram ordenados em função da magnitude de ix

2) Obtenção da função de regressão e do número de graus de liberdade da série 1 (S1)

1y 1x 1y ( ) ( )212

11 ˆˆ eyy =− 33 44 31,90 1,20 37 49 36,83 0,03 41 54 41,76 0,58 46 62 49,65 13,32 51 68 55,57 20,88 57 71 58,52 2,31 65 78 65,43 0,18 72 82 69,37 6,91

402 508 - 45,42 (SQR1) - Estatísticas obtidas para a série 1: a) Função de regressão: 1.986,048,11ˆ xy +−=

b) Número de graus de liberdade:

( ) ( ) 62

225212

2.. 1 =×−−

=−−

=kcnSlg

c) Soma dos quadrados dos resíduos:

42,451 =SQR

3) Obtenção da função de regressão e do número de graus de liberdade da série 2.

2y 2x 22.xy 22x 2y ( ) ( )2

22

22 ˆˆ eyy =− 100 100 10.000 10.000 148,74 2.375,59 136 101

...

10.201 149,47 181,44 141 109

...

155,31 204,78 150 117 161,15 124,32 172 119 162,61 88,17 155 121 164,07 82,26 163 121 164,07 1,15 170 125 21.250 15.625 166,99 9,06

1.187 796 136.851 104.839 - 3.066,77 (SQR2)

63

Page 67: Apostila Econometria 2013

( ) ( )( )( ) ( ) ( )

73,0796839.1048

187.1796851.1368.

...222

22222 =

−××−×

=−

−=

∑∑∑∑∑

xxn

yxyxnb

74,755,9973,038,148. 2221 =×−=−= xbyb

− Estatísticas obtidas para a série 2:

a) Função de regressão: 22 .73,074,75ˆ xy +=

b) Graus de liberdade da S2

( ) ( ) 64521.5,0.. 2 =−−=Slg

c) SQR2 = 3.066,77 (Soma do quadrado dos resíduos)

4) Cálculo do cF

( )

( )

52,67

642,45

672,066.3

..

..

1

1

2

2

===

SlgSQR

SlgSQR

Fc

52,67=cF

5) cF (tabelado). Consultando a tabela obtemos:

( )2

2kcnF −−α ∴ ( ) 28,4605,0 =F

6) Conclusão: ( ) 28,4652,67 05,0 =>= FFc

Constata-se que αFFc > o que sugere que a série sob estudo é heteroscedástica.

Exemplo 28:

Verificar se o par de valores abaixo, referentes às despesas com alimentação y e renda mensal x , apresenta violação aos pressupostos básicos pelo método de Goldfeld e Quandt. Faça 05,0=α .

64

Page 68: Apostila Econometria 2013

Dados informados

Desenvolvimento:

1) Dados ordenados

1y 1x

58 343 82 425

120 467 100 480 126 483 122 496 100 519 105 540 128 543 98 555

107 560 181 591 93 605

122 607 129 611 118 659 82 664

139 700 182 704 98 720

124 722 126 722

22=n

1y 1x 1y 1x 58 343 122 607 82 425 129 611

120 467 93 605 126 483 118 659 100 480 82 664 122 496 182 704 100 519 139 700 128 543 98 720 105 540 124 722 107 560 126 722 98 555

181 591

Dados eliminados c = 6

22=n

65

Page 69: Apostila Econometria 2013

2) Determinação da equação de regressão da amostra 1

iy ix xy. 2x y ( ) ( )21

2 ˆˆ eyy =− 58 343 19.894 117.649 66,4 71,18 82 425

... ...

89,3 53,51 120 467 101,0 359,75 100 480 104,7 21,71 126 483 105,5 420,37 122 496 109,1 165,79 100 519 115,5 241,52 105 540 56.700 291.600 121,4 268,96 813 3.753 388.754 1.787.029 - 1.602,79 (SQR1)

( ) ( )( )

( ) ( ) 279,0223.211

843.58009.085.14029.787.18

753.3813754.3888.

...222 ==

−××−×

=−

−=

∑∑∑∑∑

xxn

yxyxnb

279,02 =b

26,2913,469279,063,1011 −=×−=b

ixy .279,026,29ˆ +−=

(Função de regressão da série 1)

3) Determinação da equação de regressão da amostra 2

2y 2x 22.xy 2x y ( ) ( )2

22 ˆˆ eyy =−

129 611 78.819 373.321 116,8 147,79 118 659

... ...

121,8 14,34 82 664

...

1.624,25 139 700 168,74 182 704 3.088,91 98 720 904,20

124 722 18,28 126 722 90.972 521.284 128,3 5,18 998 5.502 687.517 3.795.082 - 5.067,49 (SQR2)

103,0652.88140.9

004.272.30082.795.38502.5998517.6878

2 ==−×

×−×=b

91,5375,687103,075,124.ˆ

21 =×−=−= xbyb

66

Page 70: Apostila Econometria 2013

ixy .103,091,53ˆ2 +=

(Regressão da amostra 2)

4) Determinação dos graus de liberdade das amostras 1 e 2

( )kcnlg 2.5,0. 1 −−=

( ) 622622.5,0. 1 =×−−=lg

5) Determinação do F calculado:

16,36

79,602.16

49,067.5

.

.1

2

===

lgSQR

lgSQR

Fc

16,3=cF

6) Comparação com o αF (tabelado)

28,4)6(05,0 =F

. Conclusão:

Nota-se que αFFc < , o que sugere aceitar a hipótese 0H , ou seja, a série de resíduos é homoscedástica. Hipóteses:

0H : a série de resíduos é homoscedástica

1H : tal não ocorre

Exemplo 29: O par de valores abaixo mostra o consumo (Y) e renda (X). Aplicar o teste de Goldfeld-Quandt e verificar se há presença de violação aos pressupostos básicos (heteroscedasticidade). Faça

05,0=α .

67

Page 71: Apostila Econometria 2013

ti iY iX

t1 6 8 t2 7 10 t3 7 9 t4 8 11 t5 8 12 t6 9 12 t7 10 13 t8 10 14 t9 9 13 t10 8 9 t11 8 11 t12 11 16 t13 11 15 t14 13 17 t15 11 15 t16 12 18 t17 14 23 t18 12 22 t19 15 24 t20 18 19

Exemplo 30: Dentre os itens abaixo, identifique as premissas básicas para o modelo de regressão. I. Linearidade do fenômeno medido. II. Variancia não constante dos termos de erro (heteroscedasticidade). III. Normalidade dos erros. IV. Erros correlacionados. V. Presença de colinearidade. a) I e III; b) II e III; c) I,III e IV; d) I,III e V; e) I,II, III e V.

Exemplo 31: Heterocedasticidade refere-se à situação onde a variância dos erros é: a) constante e igual a 1; b) constante; c) variável; d) variável entre 0 e 1; e) infinita sempre.

68

Page 72: Apostila Econometria 2013

Exemplo 32: Após a estimativa de um modelo de regressão linear, foi constata a presença de heterocedasticidade. Isto significa que os (as): a) resíduos são auto-correlacionados; b) resíduos somados não dão um resultado nulo; c) desvios padrões dos resíduos não são constantes; d) dados usados são transversais (cross-section); e) variáveis independentes são fortemente correlacionadas.

Exemplo 33: Na estimativa de uma regressão linear, o problema da heterocedasticidade ocorre quando: a) os dados são transversais; b) há autorrelação dos resíduos; c) há correlação positiva entre as variáveis independentes; d) a variância dos erros não é constante; e) as variáveis independentes são negativas.

Capítulo 7: AUTOCORRELAÇÃO OU CORRELAÇÃO SERIAL 7.1. NATUREZA DA AUTOCORRELAÇÃO O termo autocorrelação numa série histórica de informações pode ser interpretado como sendo a presença de correlação entre resíduos ( )ie de uma dada série temporal. Por exemplo, se uma variável tx é sistematicamente correlacionada com a variável da época imediatamente anterior 1−tx , dizemos que tx é uma variável autocorrelacionada e, nesse caso, pode-se concluir que o valor da correlação entre as variáveis tx e 1−tx é diferente de zero. 7.2. PADRÕES GRÁFICOS DE AUTOCORRELAÇÃO

ie

tx

Fig. 1

Ausência de autocorrelação

ie

tx

Fig. 2

Presença de autocorrelação

69

Page 73: Apostila Econometria 2013

Autocorrelação Positiva

Autocorrelação Negativa

Geralmente uma autocorrelação costuma ser positiva, dado que a maioria das séries temporais econômicas se move mais para cima do que para baixo por um período relativamente longo (como o da fig. 3) e não de forma sistemática de curta duração (como o da fig. 5). 7.3. CAUSAS DA AUTOCORRELAÇÃO a) Omissão de variáveis relevantes na especificação do modelo;

b) Escolha inadequada do modelo funcional, ou seja, as informações a serem analisadas podem

sugerir, a título de exemplo, a aplicação de um modelo exponencial ao invés de um modelo quadrático.

7.4. CONSEQUÊNCIAS DA AUTOCORRELAÇÃO

a) Os parâmetros estimados ( ).;; 21 etcββ podem não ser eficientes;

ie

tx

Fig. 3 ie

tx

Fig. 4

ie

tx

Fig. 5 ie

tx

Fig. 6

70

Page 74: Apostila Econometria 2013

b) A estimativa do erro padrão pode apresentar-se viezada, ou seja, um valor que não reflete a realidade, conduzindo os resultados dos testes e intervalos de confiança incoerentes.

7.5. DIAGNÓSTICO (IDENTIFICAÇÃO) DA AUTOCORRELAÇÃO

Para verificar a existência da autocorrelação, podemos recorrer ao teste de Durbin & Watson mediante aplicação da equação abaixo:

( )

=

=−−

= n

tt

n

ttt

c

e

eed

1

2

1

21ˆˆ

(37)

=te valor do resíduo na época t; =−1te valor do resíduo na época imediatamente anterior

Devendo-se ressaltar que, quando a análise é feita com esta concepção, ou seja, considerando a época imediatamente anterior, a autocorrelação é chamada de 1ª ordem (maioria dos casos). Quando a análise da época não é a imediatamente anterior, diz-se que a autocorrelação é de ordem superior. O valor de cd é compreendido no intervalo 0 a 4, ou seja, ( )40 ≤≤ cd . - se 0=cd indica ausência de autocorrelação - se 2>cd indica a presença de autocorrelação negativa - se 2<cd indica a presença de autocorrelação positiva Para fazer o diagnóstico, o valor de cd (d calculado) é comparado com o valor tabelado de Durbin & Watson, levando sempre em consideração o nível de significância α desejado e o número de variáveis explicativas. A tabela de Durbin/Watson apresenta suas limitações, pois não foi desenvolvida com base em modelos funcionais, como é o caso da distribuição normal, razão pela qual existe um intervalo de valores em que o teste de Durbin/Watson ( )d é inconclusivo. Nestes casos outros meios poderão ser usados, como veremos mais à frente. Na tabela de Durbin/Watson, os limites iD (inferior) e uD (superior), que passaremos a chamar de

id e Sd , respectivamente, são utilizados para testar a autocorrelação positiva ( )2<d , enquanto que os limites ( )sd−4 e ( )id−4 para testar a autocorrelação negativa ( )2>d . Assim, id e sd são valores críticos da estatística de Durbin/Watson (tabelados).

71

Page 75: Apostila Econometria 2013

Realização do teste: 1) Quando a autocorrelação é positiva ( )2<cd .

1.1) Se ic dd < → sugere presença de autocorrelação positiva (Região I do gráfico). 1.2) Se sci ddd << → o teste é não conclusivo, ou seja, não podemos afirmar se a série é ou não

autocorrelacionada (Região II do gráfico). 1.3) Se sc dd > → ausência de autocorrelação (Região III).

2) Quando a autocorrelação é negativa ( )2>cd .

2.1) Se ( )sc dd −< 4 → ausência de autocorrelação (Região III)

2.2) Se ( ) ( )ics ddd −<<− 44 → o teste é inconclusivo (Região IV)

2.3) Se ( )ic dd −> 4 → sugere presença de autocorrelação negativa (Região V).

( )2<cd sugere presença de autocorrelação positiva ( )2<cd sugere presença de autocorrelação negativa

0

id sd ( )sd−4 ( )id−4 4

( )2>cd Autocorrelação negativa ( )2<cd Autocorrelação positiva

2

Pres. AC (+)

Região

I

Não Conc.

Região

II

Ausência AC

Região

III

Não Conc.

Região

IV

Pres. AC (-)

Região

V

72

Page 76: Apostila Econometria 2013

Exemplo 34: Verificar a existência de autocorrelação no par de valores referente a dados de consumo ( )iY e renda iX . O modelo funcional é linear. Faça 05,0=α .

(1) (2) (3) (4) (5) (6) (7) (8)

it iY iX iy te 1ˆˆ −− tt ee ( )21ˆˆ −− tt ee ( )2ˆte

1 745 988 708,11 36,89 - - 1.360,87 2 652 812 648,97 3,03 -33,86 1.146,50 9,18 3 709 892 675,85 33,15 30,12 907,21 1.098,92 4 692 911 682,24 9,76 -23,38 547,09 95,26 5 668 904

... ... ... ... ...

6 671 920 7 698 934 8 661 956 9 685 959

10 675 966 11 673 989 12 693 997 13 748 1.011 14 740 997 15 715 999 711,80 3,20 -25,67 658,95 10,24 ∑ 10.425 14.235 - - - 10.288,95 8.663,40

Procedimentos operacionais: a) Equação de regressão do consumo em função da renda.

ixy .336,014,376ˆ +=

b) Valores ajustados com base na equação anterior. Ver coluna (4) iy→

c) Valores residuais ( )→te coluna (5)

d) Cálculo das diferenças sucessivas residuais da época t em relação à época imediatamente anterior ( ) 1ˆˆ1 −−→− tt eet . Coluna (6)

e) Soma dos quadrados das diferenças residuais. Coluna (7)

( )∑ =− − 95,288.10ˆˆ 21tt ee

f) Soma dos quadrados dos resíduos 2ˆie . Coluna (8).

40,663.8ˆ15

1

2 =∑=i

ie

g) Cálculo de d .

73

Page 77: Apostila Econometria 2013

19,11876,140,663.895,288.10

===cd

h) Comparar o valor de 19,1=cd com o valor tabelado de Durbin/Watson, com 05,0=α e com o

tamanho da amostra 15=n para o exercício em questão e ainda considerando uma variável explicativa, dado que a forma funcional é linear simples. Daí obtemos para 08,1=id e

36,1=sd . Como o valor calculado de d ( )19,1=cd está entre os dois valores tabelados, ou seja,

36,119,108,1 << , conclui-se que o resultado do teste é inconclusivo, o que significa que não podemos afirmar se há ou não autocorrelação.

Exemplo 35:

Uma amostra de 10 observações de um dado fenômeno foi ajustado a um modelo econométrico contendo 2 variáveis explicativas. O valor obtido de 17,1=cd . Verificar pelo teste DW se a série é autocorrelacionada. Faça 05,0=α . Solução:

10=n ; 17,1=cd ; 2=k ; 05,0=α

Verifica-se que 2<cd , o que significa que a autocorrelação, se existir, será positiva. Como

sci ddd << ( )641,117,1697,0 << sugere inconclusão, não se podendo afirmar se é autocorrelacionada ou não. Exemplo 36:

Com uma amostra de 80 observações foi estimada uma equação com três variáveis explicativas. Considerando que o valor obtido para 92,2=cd , testar a presença de autocorrelação pelo teste de DW com 05,0=α . Solução:

80=n ; 92,2=cd ; 3=k ; 05,0=α

Considerando a tabela, obtemos: 56,1=id ; 715,1=sd . Como 2>cd , a autocorrelação é negativa.

285,2715,144 =−=− sd

74

Page 78: Apostila Econometria 2013

44,256,144 =−=− id Como 92,2=cd é maior do que 44,24 =− id ( )ic dd −> 4 , pertence a região de aceitação da hipótese da existência de autocorrelação (Região V) no gráfico ilustrativo, o que sugere a presença de autocorrelação negativa. Exemplo 37:

São conhecidas as estatísticas: a) Tamanho da amostra 50=n observações; b) Número de variáveis explicativas: 4=k variáveis; c) Nível de significância desejado 05,0=α .

Testar a presença de autocorrelação para os valores de cd a seguir: 1) 40,1=cd 2) 50,2=cd 3) 97,3=cd 4) 115,2=cd

Exemplo 38: Verificar a existência de autocorrelação no par de valores abaixo. O modelo funcional é linear.Faça 05,0=α

ti iY iX t1 20 12 t2 26 13 t3 30 15 t4 28 18 t5 32 24 t6 30 30 t7 35 40 t8 48 64 t9 41 88 t10 50 96 ∑ 330 400

75

Page 79: Apostila Econometria 2013

7.6. MEDIDAS CORRETIVAS VISANDO A REMOÇÃO DA AUTOCORRELAÇÃO

Detectada a presença de autocorrelação é possível removê-la. Entretanto, a operação de remoção deverá ser precedida de algum tipo de análise com o objetivo de verificar a sua causa. Por exemplo, poderá ser ocasionada pela má especificação na formatação do modelo. Uma vez detectada a causa, poderá ser corrigida com a inclusão de variáveis adicionais ou com a substituição do modelo funcional. Se a causa é parte integrante do modelo estimado pelo pesquisador, ela deverá ser removida. Para melhor entendimento do problema, mostraremos, inicialmente, o desenvolvimento da equação de Durbin/Watson (DW) para a obtenção do valor de cd . Desenvolvimento da equação de Durbin/Watson para obtenção do valor de cd . Já vimos que:

( )

( )∑

=

=−−

= n

it

n

itt

c

e

eed

1

2

1

21

ˆ

ˆˆ

Desenvolvendo o numerador da equação, obtemos:

( )∑

∑ −− +×−= 2

211

2

ˆˆˆˆ.2ˆ

t

ttttc e

eeeed

∑∑ ∑ ∑ −− +×−

= 2

211

2

ˆˆˆˆ.2ˆ

t

ttttc e

eeeed (38)

Se o tamanho da amostra da série sob estudo for relativamente grande, a diferença entre 2

te e 2

1ˆ −te , segundo leis estatísticas, é muito pequena, podendo considerá-las como sendo iguais. Aplicando esse princípio em (38), obtemos:

∑∑ ∑ −×−

= 21

2

ˆˆˆ.2ˆ

t

tttc e

eeed

Dividindo os dois membros do numerador por 2

te , obtemos:

×−×=

∑∑

∑∑ −

21

2

2

ˆˆˆ

ˆˆ

2t

tt

t

tc e

eeee

d

76

Page 80: Apostila Econometria 2013

×−×=

∑∑ −

21

ˆˆˆ

12t

ttc e

eed (39)

Sabe-se que a relação ∑

∑ −×2

1

ˆˆˆ

t

tt

eee

é um estimador do coeficiente de correlação de erros, podendo

assim ser denominado de r . Assim, a equação (39) transformar-se-á em:

( )rdc −×= 12 (40) Esta equação também poderá ser usada para verificar a presença de autocorrelação. Por exemplo: Se o valor de 0=r , cd terá um valor próximo de 2, o que sugere ausência de autocorrelação.

Se ( )1±=r , ou no entorno desse valor, cd terá um valor próximo de zero, o que indica presença de autocorrelação positiva. Se ( )1−=r , ou próximo desse valor, cd terá um valor próximo de quatro, o que indica presença de autocorrelação negativa, pois, conforme já foi visto, valores acima de 2 indicam autocorrelação negativa e inferiores a 2 autocorrelação positiva. Contudo, para verificação da existência de autocorrelação, DW desenvolveu uma tabela contendo os valores críticos dos limites inferiores e limites superiores em função do número de observações ( )n , número de variáveis explicativas ( )k e do nível de significância desejado ( )α , já do nosso conhecimento e utilizados em exemplos anteriores. Para a remoção da autocorrelação, tomaremos como base a equação (40) para estimar o valor de r que nada mais é do que o estimador do coeficiente de correlação de erros, ou seja:

=

=−×

= n

it

n

itt

e

eer

1

2

11

ˆ

ˆˆ

Efetuando-se os desenvolvimentos, obteremos o valor de ( )rdc −= 1.2 , colocando r em evidência obtemos rdc 22 −= , dividindo ambos os membros por 2 obtemos:

22

22

2rdc −=

rdc −=12

∴ 2

1 cdr −= (41)

77

Page 81: Apostila Econometria 2013

Assim, conhecido o valor de cd , pode-se estimar o valor de r através da igualdade (41) acima e, uma vez estimado r , podemos efetuar a correlação dos valores conhecidos das variáveis, obtendo-se as variáveis transformadas. Por exemplo: Se y é a variável dependente e x a variável explicativa e chamando cy e cx de variáveis transformadas em função de r , temos:

1, −×−= tttc yryy (42)

1, −×−= tttc xrxx (43) Exemplo: Suponhamos que: 188,1=cd ; 745

1=ty ; 652=y

O valor de y corrigido em 2t será:

4060,02

188,112

1 =−=−= cdr

7454060,022, ×−= yyc

47,3026522, −=cy

53,3492, =cy

Procedimento idêntico deverá ser observado para as variáveis explicativas x . Exemplo 39: No exemplo 34 da página 73 verificamos que o par de valores y e x eram autocorrelacionados e concluímos, pelo teste de Durbin/Watson, que não podemos afirmar se há ou não autocorrelação pois, segundo o teste, caiu na região de inconclusão.

78

Page 82: Apostila Econometria 2013

Com base nos dados do mesmo exemplo 34, aplicar medidas corretivas junto às variáveis iy e ix e verificar se a nova série permanece inconclusiva.

(1) (2) (3) (4) (5) (6) (7) (8) (9)

it iy tcy , tx tcx , ( ) ( )53 × ( )25 tcy ,ˆ tce ,ˆ 1 745 - 988 - - - - - 2 652 349,53 812 410,87 143.611,39 168.814,16 347,04 2,48 3 709 444,29 892 562,33

... ...

409,82 34,47 4 692 404,15 911 548,85 404,23 -0,08 5 668 387,05 904 534,13 398,13 -11,08 6 671 399,79 920 552,97 405,06 -6,15 7 698 425,57 934 560,48 409,06 16,51 8 661 377,61 956 576,79 415,81 -38,20 9 685 416,63 959 570,86 413,36 3,97

10 675 396,89 966 576,65 415,76 -18,87 11 673 398,95 989 596,80 424,11 -25,16 12 693 419,76 997 595,47 423,56 -3,80 13 748 466,64 1.011 606,22 428,01 38,63 14 740 436,31 997 586,53 419,85 16,46 15 715 414,56 999 594,22 246.339,84 353.097,41 423,04 -8,48 ∑ 10.425 5.737,73 - 7.873,17 3.239.285,87 4.457.939,38 - -

. Continuação da tabela:

(1) (10) (11) (12)

it 1,,, ˆˆˆ −−= tctctc eeei

( )210 ( )29 1 - - - 2 - - 6,15 3 31,99 1.023,36 1.188,18 4 -34,55 1.193,70 0,006 5 -11,00 121,00 122,77 6 4,93 24,30 37,82 7 22,66

... ...

8 -54,71 9 41,47

10 -22,14 11 -6,29 12 21,36 13 42,43 14 -22,17 15 -24,94 622,00 71,91 ∑ - 11.488,60 5.936,10

Desenvolvimento:

1) Valor de d já obtido anteriormente

19,1188,1 ≅=d

79

Page 83: Apostila Econometria 2013

... ...

2) Cálculo do valor de r

21 dr −= ⇒ 4060,0

21876,11 =−=r

3) Transformação da variável ty em tcy ,

1, −×−= ttc yryy (coluna 3 da tabela)

53,3497454060,06521, =×−=tcy

56,4147404060,0715

15, =×−=tcy 4) Transformação da variável tx em tcx ,

1, −×−= tttc xrxx (coluna 5 da tabela)

87,4109884060,08121, =×−=tcx

22,5949974060,0999

15, =×−=tcx 5) Determinação da função consumo, tendo por base os dados transformados (colunas 3 e 5)

( ) ( )( )

( ) ( )∑ ∑∑ ∑∑

−×= 2

,2

,

,,,,2

...

tctc

tctctctc

xxnxyxyn

β

4145,02 =β

2,,1 ββ ×−= tctc xy

74,1761 =β

∴ tctc xy ,, .4145,074,176ˆ +=

6) Ajustamento dos valores de tcy , com base na função encontrada na questão anterior (coluna 8 da tabela)

04,34787,4104145,074,176ˆ2, =×+=tcy

80

Page 84: Apostila Econometria 2013

... ...

OBS: reparar que a 1,ˆ tcy desaparece, pois 1t não existe mais.

04,42322,5944145,074,176ˆ

15, =×+=tcy

7) Determinação dos resíduos, efetuando-se a diferença entre os dados de ty (conhecido) e os

tcy ,ˆ (ajustados), ou seja

tctctc yye ,,, ˆˆ −=

48,204,34752,349ˆˆ2222 ,,, =−⇒−= tctctc yye

48,804,42356,414ˆˆ

15151515 ,,, −=−⇒−= tctctc yye

8) Determinação das diferenças sucessivas dos resíduos, ou seja, entre os resíduos da época t pelas da época imediatamente anterior ( )1−t .

1,,, ˆˆˆ −−= tctctc eee (coluna 10) Observar que os resíduos da época 1t e 2t não existirão mais, iniciando-se pela época 3t .

98,3148,247,34ˆˆˆ233 ,,, =−⇒−= tctctc eee

94,2446,1648,8ˆˆˆ

141515 ,,, −=−−⇒−= tctctc eee

9) Determinação da soma dos quadrados das diferenças sucessivas residuais

( ) 60,488.11ˆˆ1

21,, =−∑

=−

n

itctc ee (coluna 11)

10) Determinação da soma dos quadrados dos resíduos

∑ = 10,936.5ˆ2,tce (coluna 12)

81

Page 85: Apostila Econometria 2013

11) Determinação do novo valor de d

( )94,1

10,936.560,488.11

ˆˆˆ

2,

21,, ==

−=

∑∑ −

tc

tctcc e

eed

12) Consulta ao valor tabelado de d com: 14=n ; 05,0=α e 1=k

Encontramos 045,1=id e 350,1=sd que são os intervalos críticos.

13) Comparação com o valor de 94,1=cd Verifica-se que o valor calculado de d ( )94,1=cd é exterior aos intervalos críticos da tabela de Durbin/Watson, cujos valores são, respectivamente, 045,1=id e 350,1=sd . Verifica-se também que o valor de d é menor que 2 ( )2<d , o que sugere, em princípio, que a série é autocorrelacionada positivamente. Contudo, como 94,1=cd , ou seja, maior do que o 350,1=sd , cai na Região III da ilustração gráfica, o que sugere ausência de autocorrelação, significando que a autocorrelação foi removida. Capítulo 8: UTILIZAÇÃO DE VARIÁVEIS ESPECIAIS 8.1. VARIÁVEIS DUMMY (DUMMIES, BINÁRIAS, ARTIFICIAIS, DICOTÔMICAS, ETC.) Nos capítulos anteriores lidamos exclusivamente com variáveis que podíamos medir, denominadas variáveis quantitativas como, por exemplo: nível de renda, variação salarial, taxa de desemprego, etc. Entretanto, algumas variáveis consideradas relevantes para fins de pesquisas não são numéricas, elas são de natureza qualitativa, tais como: sexo, religião, nível de instrução, etc. Em certos estudos, é fundamental o uso das variáveis qualitativas denominadas dummy ( )d na análise de regressão, pois permite expandir os objetivos da mesma, de forma a levar em consideração variáveis relevantes que não podem ser avaliadas em termos quantitativos. Com a aplicação da variável ( )d é possível considerar os efeitos de natureza qualitativa que influenciam os valores da variável dependente ( )y . A variável ( )d , para fins operacionais, assume dois valores: 1 (um), indicando uma situação e 0 (zero), a outra situação como, por exemplo:

82

Page 86: Apostila Econometria 2013

1 = ocorrência de um evento e 0 = não ocorrência Por ser uma variável qualitativa, tem como alguns de seus objetivos, na análise de regressão, absorver os efeitos temporais, tais como: mudança nas políticas econômicas, efeitos decorrentes de sexo, religião, nacionalidade, etc. conforme acima comentado. 8.2. INCORPORAÇÃO DA VARIÁVEL ( )d AO MODELO DE REGRESSÃO LINEAR Pode ser incorporada de forma aditiva, multiplicativa ou mista (conjugação dos dois primeiros). Abordaremos nesse módulo as formas aditiva e multiplicativa. A) INCORPORAÇÃO DA VARIÁVEL d PELA FORMA ADITIVA Quando os efeitos citados anteriormente alteram apenas o termo constante (intercepto), a variável é incorporada aditivamente. Assim, incorporando ao modelo de regressão uma variável qualitativa e chamando de 1=d um determinado período da série e 0=d o outro período, cuja condição é normal, teremos na equação geral de regressão a seguinte expressão:

exxy +++= 23121 .. βββ Fazendo dx =2 , temos: edxy +++= .. 3121 βββ Fazendo 0=d , obtemos: exy ++= 121 .ββ Fazendo 1=d temos: exy +++= 3121 . βββ Sabemos que 1β e 3β são constantes e nessa condição temos: ( ) exy +++= 1231 .βββ Assim, chegamos a duas equações de regressão. A primeira com base na condição 0=d , obtendo-se exy ++= 121 .ββ e a segunda na condição

1=d , obtendo-se ( ) exy +++= 1231 .βββ . Verifica-se que quando 1=d o valor do intercepto se modifica, passando a ser ( )31 ββ + e quando

0=d o intercepto não se altera.

83

Page 87: Apostila Econometria 2013

Com a incorporação da variável ( )d ao modelo, criamos um deslocamento paralelo de ( )d que pode ser para cima (forma aditiva) ou para baixo (forma subtrativa), conforme o valor de 3β resulte de forma positiva ou negativa, respectivamente. Um exemplo numérico poderá explicitar melhor. Exemplo 40:

Considere a série de valores, em milhões de dólares, referente ao gasto de um dado país com esforço de guerra ( )Y e a renda nacional ( )X . Introduzir a variável ( )d no período de t8 a t13, considerado período de convulsão. Mostrar o efeito causado pela interação da variável ( )d , pela forma aditiva, bem como a imagem gráfica das duas equações de regressão.

it Y 1X DX =2 y 1x d yx. 2d dx. dy. 2x

1 2,6 2,4 0 -4,16 -4,44 -0,35 18,47 0,1225 1,554 1,456 19,714 2 3,0 2,8 0 -3,76 -4,04 -0,35 15,19 0,1225 1,41 3 3,6 3,1 0 -3,16 -3,74 -0,35 11,82 0,1225 1,31 4 3,7 3,4 0 -3,06 -3,44 -0,35 10,53 0,1225 1,20 5 3,8 3,9 0 -2,96 -2,94 -0,35 8,70 0,1225 1,03 6 4,1 4,0 0 -2,66 -2,84 -0,35 7,55 0,1225 0,99 7 4,4 4,2 0 -2,36 -2,64 -0,35 6,23 0,1225 0,92 8 7,1 5,1 1 0,34 -1,74 0,65 -0,59 0,4225 -1,13 9 8,0 6,3 1 1,24 -0,54 0,65 -0,67 0,4225 -0,35

10 8,9 8,1 1 2,14 1,26 0,65 2,70 0,4225 0,82 11 9,7 8,8 1 2,94 1,96 0,65 5,76 0,4225 1,27 12 10,2 9,6 1 3,44 2,76 0,65 9,49 0,4225 1,79 13 10,1 9,7 1 3,34 2,86 0,65 9,55 0,4225 1,86 14 7,9 9,6 0 1,14 2,76 -0,35 3,15 0,1225 -0,97 15 8,7 10,4 0 1,94 3,56 -0,35 6,91 0,1225 -1,25 16 9,1 12,0 0 2,34 5,16 -0,35 12,07 0,1225 -1,81 17 10,1 12,9 0 3,34 6,06 -0,35 20,24 0,1225 -2,12 -1,169 36,724 ∑ 115 116,3 6 147,10 3,8825 6,52 13,425 193,76

OBS: Para a determinação dos parâmetros 1β , 2β e 3β , recomendamos inicialmente efetuar a transformação das variáveis Υ , 1Χ e D em y , 1x e d , calculando-se os afastamentos em torno da média de cada variável, ou seja:

YYy −=

111 XXx −= DDd −=

No exemplo: 76,6=Y ; 84,61 =X ; 35,0=D

84

Page 88: Apostila Econometria 2013

Cálculo dos parâmetros:

( )( ) ( )( )( )( ) ( )21

221

21

2..

.....

∑∑∑∑∑∑∑

−=

dxdx

dydxdyxb

( ) 763,709585,483

52,6885,376,193425,1352,6885,310,14722 =

−××−×

=b

68,02 =b

( )( ) ( )( )

( )( ) ( )222

2

3..

.....

∑∑∑∑∑∑∑

−=

dxdxyxdxxdy

b

( ) 763,70914,1642

52,68825,376,193425,1352,676,193425,1323 =

−××−×

=b

31,23 =b

Dbxbyb .. 3121 −−=

35,031,284,668,076,61 ×−×−=b

3,11 =b ∴ dxy .31,2.68,03,1ˆ ++=

- Fazendo 0=d , encontramos:

xy .68,03,1ˆ1 += (1) - Para 1=d

31,2.68,03,1ˆ2 ++= xy

( ) xy .68,031,23,1ˆ2 ++=

xy .68,061,3ˆ2 += (2) - Conclusão: Para a época normal de paz, a equação de regressão é a (1), ou seja, xy .68,03,1ˆ1 += . Para a época de guerra a equação de regressão é a (2), ou seja, xy .68,061,3ˆ1 += .

85

Page 89: Apostila Econometria 2013

O efeito aditivo da interação é a diferença entre os interceptos de 2y e 1y , ou seja, 31,230,161,3 ⇒− (milhões).

- Imagem gráfica:

12

10

8

6

4

2

2 4 6 8 10 12 Na regressão (1) para 3,1ˆ0 1 =→= yx 1,8ˆ10 1 =→= yx Na regressão (2) para 61,3ˆ0 2 =→= yx 41,10ˆ10 2 =→= yx Exemplo 41:

Considere o par de valores X e Y levantados durante 10 períodos. Introduzir a variável dummy no período de t1 a t5 pela forma aditiva e avaliar o efeito da interação, retratando inclusive a sua imagem no plano cartesiano.

it iY iX

1 6 2 2 13 1 3 15 5 4 12 4 5 9 3 6 14 13 7 16 18 8 18 20 9 15 25

10 22 29 ∑ 140 120

Efeito da interação ( ) 31,230,161,3 =−

xy .68,03,1ˆ1 +=

xy .68,061,3ˆ2 +=

86

Page 90: Apostila Econometria 2013

B) INCORPORAÇÃO DA VARIÁVEL ( )d PELA FORMA MULTIPLICATIVA Geralmente, a incorporação da variável ( )d pela forma multiplicativa é utilizada quando ocorre alguma mudança na capacidade de gerar efeito de uma ou mais variáveis explicativas do modelo. Ex: Produção de um determinado bem agrícola em função da área plantada e da aplicação de fertilizante ao solo. Sabemos que a aplicação de fertilizante intensifica o efeito da área plantada, o que sugere a introdução da variável ( )d multiplicativa para captar o efeito interativo das duas variáveis (área plantada e aplicação de fertilizante). O modelo de regressão poderá ser especificado da forma a seguir:

( )dxxy ... 13121 βββ ++= Onde:

dummyd = 1=d = se for utilizado fertilizante e 0=d = em caso contrário O termo ( )dx .1 indica a mudança provocada pela influência de 1x após a aplicação de fertilizante. Assim, se for aplicado fertilizante, temos 1=d e teremos:

( )1... 13121 xxy βββ ++= , o que implica em:

( )3211 . βββ ++= xy Em caso contrário, ou seja, área não fertilizada, temos 0=d .

( )0... 13121 xxy βββ ++= , o que implica em:

121 .xy ββ += Pode-se observar que o coeficiente angular 2β se altera caso 1=d , significando que o efeito sobre a área plantada se intensifica com o emprego do fertilizante. Resumindo: ( )dx .1 é uma variável interativa e ( )32 ββ + é o efeito da interação. O exemplo a seguir explicitará melhor.

87

Page 91: Apostila Econometria 2013

Exemplo 42:

Os dados a seguir referem-se a produção agrícola ( )Y , em milhões de toneladas, e a quantidade de fertilizantes aplicados ( )X , em toneladas, durante dez períodos consecutivos. Verificar o efeito da aplicação de fertilizantes na produção agrícola com a introdução da variável dummy pela forma multiplicativa, sabendo-se que o período da aplicação de fertilizantes foi durante a época t5 a t10. Traçar a equação no plano cartesiano, ilustrando a imagem gráfica do efeito.

it Y X D y x '. DDX = yx. 2d dx. dy. 2x 1 9 8 0 -5 -1 0 5 32,49 5,7 28,5 1 2 8 7 0 -6 -2 0 12 32,49 11,4 34,2 4 3 11 8 0 -3 -1 0 3 32,49 5,7 17,1 1 4 13 10 0 -1 1 0 -1 32,49 -5,7 5,7 1 5 10 7 1 -4 -2 7 8 1,69 -2,6 -5,2 4 6 14 6 1 0 -3 6 0 0,09 -0,9 0 9 7 15 12 1 1 3 12 3 39,69 18,9 6,3 9 8 18 11 1 4 2 11 8 28,09 10,6 21,2 4 9 20 10 1 6 1 10 6 18,49 4,3 25,8 1

10 22 11 1 8 2 11 16 28,09 10,6 42,4 2 ∑ 140 90 6 0 0 57 60 246,1 58 176 36

14=y 9=X 7,51057' ==D DXD .'= '' DDd −=

( )( ) ( )( )

( )( ) ( )2221

21

2..

.....

∑∑∑∑∑∑∑

−=

dxdxdydxdyx

b

( ) ( )( ) ( )

83,06,5495

4558581,24636

176581,2466022 ==

−××−×

=b

( )( ) ( )( )

( )( ) ( )222

2

3..

.....

∑∑∑∑∑∑∑

−=

dxdxyxdxxdy

b

52,06,5495

28563 ==b

7,5.. 321 bxbyb −−=

7,552,0983,0141 ×−×−=b

57,31 =b

∴ dxxy .52,083,057,3ˆ ++= (geral)

variável de interação 0=d → xy .83,057,3ˆ +=

88

Page 92: Apostila Econometria 2013

1=d → ( ) xxy .35,157,3.52,083,057,3ˆ +=++=

efeito da interação - Imagem Gráfica

25

20

15

10

5

5 10 15 20 25

xy .83,057,3ˆ1 += Para 57,30 1 =→= yx 87,1110 1 =→= yx

xy .35,157,3ˆ2 += Para 57,30 2 =→= yx 1,1710 2 =→= yx

Com fertilizante

Sem fertilizante

Efeito da interação

xy .83,057,3ˆ1 +=

xy .35,157,3ˆ1 +=xy .68,03,1ˆ1 +=

89

Page 93: Apostila Econometria 2013

Exemplo 43:

Dado o par de valores ix e iy de tendência linear, aplicar a variável binária pela forma multiplicativa. Introduzir a variável d nos 6 primeiros períodos da série.

it Y 1X D′ DXD ′= . y 1x d yx .1 2

1x 2d dx .1 dy. 1 5 12 1 12 -7 -4 2 28 16 4 -8 -14 2 6 15 1 15 -6 -1 5 6 1 25 -5 -30 3 7 22 1 22 -5 6 12 -30 36 144 72 -60 4 12 20 1 20 0 4 10 0 16 100 40 0 5 14 15 1 15 2 -1 5 -2 1 25 -5 10 6 10 16 1 16 -2 0 6 0 0 36 0 -12 7 15 19 0 0 3 3 -10 9 9 100 -30 -30 8 18 20 0 0 6 4 -10 24 16 100 -40 -60 9 13 12 0 0 1 -4 -10 -4 16 100 40 -10

10 20 9 0 0 8 -7 -10 -56 49 100 70 -80 ∑ 120 160 - 100 0 0 0 -25 160 734 134 -286

12=Y 12−= Yy

161 =X 1611 −= Xx

10=D 10−= Dd

− Estatísticas:

25.1 −=∑ yx 134.1 =∑ dx

1602

1 =∑ x 286. −=∑ dy

7342 =∑d

( )( ) ( )( )( )( ) ( )21

221

12

12

..

.....

∑∑∑∑∑∑∑

−=

dxdx

dydxdyxb

( ) ( )

( ) 2,0484.99974.19

13473416028613473425

22 ==−×

−×−×−=b

( )( ) ( )( )( )( ) ( )21

221

21

3..

.....

∑∑∑∑∑∑∑

−=

dxdx

yxdxxdyb

90

Page 94: Apostila Econometria 2013

43,0484.99410.42

484.99350.3760.45

3 −=−

=−−

=b

( ) 1,131043,0162,0121 =×−−×−=b

dxxy .43,02,01,13ˆ 11 −+=

− Para 0=d

11 2,01,13ˆ xy += ( 1 )

− Para 1=d

112 43,02,01,13ˆ xxy −+=

( )43,02,0.1,13ˆ 12 −+= xy

12 23,01,13ˆ xy −= ( 2 )

- Imagem gráfica:

20

15

10

5

5 10 15 20

− Regressão (1)

11 2,01,13ˆ xy += 1,130 1 =→= yx 1,171,130,420 1 =+=→= yx

− Regressão (2)

(efeito subtrativo)

(2)

(1)

=α efeito da interação

91

Page 95: Apostila Econometria 2013

12 23,01,13ˆ xy −= 1,130 2 =→= yx 5,820 2 =→= yx

Exemplo 44:

Os dados abaixo referem-se a consumo de energia elétrica ( )Y , produção real ( )iX e variável dummy ( )D , levantados no horário de verão durante 10 anos (dados hipotéticos). Verificar o efeito da variável ( )D pela forma multiplicativa.

it Y iX ( )D 1990 7 8 0 1991 8 9 0 1992 8 8 0 1993 9 9 0 1994 9 9 0 1995 10 10 1 1996 10 12 1 1997 11 13 1 1998 12 15 1 1999 16 17 1

∑ 100 110 5

Capítulo 9: ANÁLISE DAS SÉRIES TEMPORAIS 9.1. INTRODUÇÃO

O objetivo deste módulo é fazer uma abordagem superficial sobre análise de uma série temporal, não tendo como objetivo o aprofundamento teórico e operacional deste importante segmento da estatística, em função da reduzida carga horária disponível.

9.2. CONCEITO DE SÉRIES TEMPORAIS Uma série temporal é um conjunto de observações de um determinado fenômeno variável com o tempo. Por exemplo, constituem séries temporais, os índices de preços mensais de um bem, exportação brasileira de manufaturados no período de t1 a tn , etc. Se representarmos os termos da série em um plano cartesiano, representado pelo eixo de ordenadas (y) pelo eixo das abscissas (x), acompanhando os dados da série, obter-se-á uma configuração como o da figura abaixo: Figura 1

y

x 92

Page 96: Apostila Econometria 2013

Onde y é uma variável função do tempo ∴ =y f(x) Numa série temporal costumamos distinguir quatro componentes (tendência, variações sazonais; variações cíclicas e variações aleatórias ou irregulares), cuja análise é importante para o perfeito conhecimento do fenômeno representado pelos mesmos. Os componentes citados podem ser definidos conforme abaixo: a) Tendência Também chamada de tendência secular ou movimento a longo prazo, pode ser conceituada como sendo a função média de seu processo gerador, entendendo-se por processo gerador, ou processo estocástico, uma família infinita de variáveis Xi (i= 0; ±1; ±2; ±3;......) tal que os diversos termos da série são considerados como observações das variáveis aleatórias x1; x2; ......xn, , o que significa dizer que X1 é uma observação de x1; X2 é uma observação de x2; Xn de xn......etc. Em outras palavras, é a tendência provável do comportamento da série num intervalo de tempo razoavelmente longo em relação a unidade de tempo considerada. Nota-se na figura 1 a provável tendência crescente da série. b) Variações sazonais ou estacionais São flutuações que se verificam aproximadamente nas mesmas épocas de cada ano resultantes de fenômenos cíclicos exteriores ao conjunto principal de causas que atuam sobre os termos da série. São exemplos de variações sazonais: a venda de artigos para crianças na época natalina; índice de precipitação pluviométrica acompanhada mensalmente numa determinada cidade num período de cinco anos. c) Variações cíclicas Os movimentos cíclicos são formados por ciclos. Basicamente um ciclo consiste de um período de expansão das atividades econômicas, seguidas de recessão, contração e recuperação que se confunde com a fase de expansão do novo ciclo. Na componente cíclica, o mais importante é o denominado ciclo de negócios que são tipos de flutuações encontradas nas atividades econômicas agregada de nações que organizam seu trabalho principalmente em empresas comerciais. Os ciclos econômicos são tipos de flutuações que perduram por mais de um ano e tendem a se repetir com certa regularidade. O ciclo de negócios, por exemplo, costuma ter duração superior a um ano podendo alcançar até 10 a 12 anos. Em média, um ciclo costuma oscilar em torno de 4 anos.

93

Page 97: Apostila Econometria 2013

d) Variações irregulares São flutuações esporádicas da série ocasionadas por eventos inesperados. São exemplos de variações irregulares: enchentes; greves; terremotos; incêndios, etc.. que afetam a maioria das atividades produtivas dependendo da sua intensidade. Este componente, face as suas características imprevisíveis, é de difícil análise. Sob o ponto de vista econômico, é comum afirmar-se que a componente tendência , comentado em a) e a componente sazonal comentado em (b) são as de maior relevância, ou seja, aquelas que mais se sobressaem se comparadas com as outras componentes. 9.3. ANÁLISE DE UMA SÉRIE TEMPORAL Já vimos que os principais componentes de uma série temporal podem ser: Tendência (T); Variações estacionais (E); Variações cíclicas (C) e Variações irregulares (I). Analisar uma série temporal consiste em investigar, utilizando-se de técnicas especiais, as componentes T; E; C e I, podendo ser feito duas formas: por soma Y= T + E + C + I , ou por multiplicação Y= T x E x C x I. Na prática, o método a ser considerado depende da significância do sucesso alcançado com a aplicação da hipótese. Para melhor compreensão, daremos a sequencia normal dos procedimentos operacionais que deverão ser adotados para analisar uma série temporal: a. Preparar a série quando se tratar de valores monetários, deflacionando-a convenientemente

em relação a um ano ou período básico adequado, com vistas a eliminar as distorções inflacionárias;

b. Traçar o gráfico conveniente (linhas ou curvas) , no plano cartesiano, dos valores

deflacionados para examinar a tendência provável da série; c. Analisar a tendência da série baseado no exame anterior, utilizando-se dos procedimentos

explicitados na sequência c.1. Processo gráfico, geométrico ou a mão livre: Consiste em traçar sobre o gráfico da série estudada, curva que melhor representa a sua tendência. A interpretação deste método é estritamente pessoal e não apresenta uma justificativa teórica onde possa apoiar-se, portanto este método apresenta as suas falhas, razão pela não será exemplificada.

94

Page 98: Apostila Econometria 2013

c.2. Processo das semi-médias: Consiste em dividir a série em duas partes aproximadamente iguais, determinando a média aritmética de ambas. A seguir marcamos sobre o gráfico as duas médias obtidas. Ligando-a convenientemente teremos a reta ajustada. (ver figura 2)

Exemplo 45:

Considere a série de valores abaixo, já deflacionados. Avaliar a sua tendência pelo método das semi-médias

TABELA 1

ANOS VALOR VALOR MÉDIO t1 30 t2 36 33,3 ( )1x t3 40 t4 27 t5 46 t6 42 42,5 ( )2x t7 40 t8 42

Procedimentos: - Dividir a série em dois subgrupos de tamanhos iguais; - Tirar a Média do 1º grupo (t1 a t4) : 3,331 =x - Tirar a Média do 2ºgrupo (t5 a t8) : 5,422 =x - Traçar o gráfico no plano cartesiano - Unir os dois pontos 1x e 2x obtendo-se assim a reta de tendência T.

(Figura 2)

50 T

45

40

35

30

t1 t2 t3 t4 t5 t6 t7 t8

$R

( )it

2x

1x

95

Page 99: Apostila Econometria 2013

O ponto ix poderá ser colocado entre o período t2 e t3 e o ponto 2x entre t6 e t7. T= linha de tendência sugerida pelo método das semi-médias. c.3) Processo das médias móveis Consiste em calcular as médias sucessivas de igual número de termos denominado de “período”. A série assim constituída caracteriza-se pela regularização ou suavização dos valores originais da série eliminando em alguns casos a influencia das componentes cíclica e estacional. Uma das inconveniências deste processo é a perda dos valores extremos da série de acordo com a periodicidade adotada. Exemplo 46: Construção de uma média móvel de ordem ou períiodicidade 2 e 3 do exemplo anterior.

TABELA 2

1 2 3 4

ANOS VALOR (R$) y1

MÉDIA MÓVEL DE 2 ANOS y2 (N=2)

MÉDIA MÓVEL DE 3 ANOS y3 (N=3)

t1 30 t2 36 33,0 35,7 t3 40 38,0 38,3 t4 37 38,5 41,1 t5 46 41,6 41,9 t6 42 44,0 42,9 t7 41 41,5 41,4 t8 42 41,5

Figura 3

96

Page 100: Apostila Econometria 2013

Nota-se pela figura 3 que, com a aplicação das médias móveis, os dados originais sofrem processo de suavização. A linha 1 (contínua), refere-se a dados originais e a linha 2 (tracejada) é o resultado da aplicação da média móvel de periodicidade 2 (y2). d. Determinação da equação de tendência pelo processo analitico Consiste em analisar a série utilizando-se de conceitos matemáticos, sendo por esta razão apresentar um bom índice de confiabilidade no estudo da tendência. Basicamente neste processo poderá recorrer-se a três métodos para a caracterização da função ajustante: método dos mínimos quadrados; método dos momentos e método da máxima verossimilhança. Para o presente caso, será adotado o método dos mínimos quadrados por ser de fácil compreensão e de largo emprego na prática. e. Ajuste da série Consiste em promover o ajustamento da série observada, através de uma função que melhor represente aqueles dados. f. Obtenção do coeficiente de determinação (R2) ou poder explicativo da regressão Tem por objetivo avaliar o nível de representatividade da variável explicativa x sobre a explicada y. g. Estacionariedade da série Significa verificar se a função valor médio e a função covariância são constantes ao longo do tempo, ou seja: se ( )tyE e ( )tyv são constantes para todo t, além de ( ) ( )jttjtt yyyy +− = ;cov;cov Exemplo 47: Considere a série temporal de valores investidos em ativos fixos, em milhões de reais, no período de 2000 a 2010 Tabela 3

(1) (2) (3) (4) ANOS INVESTIMENTOS

(a preços correntes) INFLAÇÃO INVESTIMENTOS

(deflacionados) 2000 28 96 29,2 2001 30 99 30,3 2002 32 100 32,0 2003 34 110 30,9 2004 49 128 38,3 2005 54 136 39,7 2006 56 150 37,3 2007 91 180 50,6 2008 99 185 53,5 2009 117 228 51,3 2010 140 286 50,0

97

Page 101: Apostila Econometria 2013

Obter: a) Equação de tendência pelo método analitico b) O poder explicativo da regressão c) Efetuar o teste de estacionariedade Solução: Inicialmente devemos deflacionar os dados de investimentos, escolhendo-se um indicador inflacionário e um ano base adequado, à escolha do pesquisador. Os dados inflacionários hipotéticos são os que estão relacionados na coluna (3) da tabela 3. Tomando-se como base o ano de 2002, obtemos na coluna (4) da tabela 3, os investimentos deflacionados que servirão de base para o desenvolvimento das questões solicitadas. Dando sequencia aos procedimentos, traçamos no plano cartesiano o gráfico evolutivo da série deflacionada para verificar se sugere uma tendência linear (figura 4).

Figura 4

98

Page 102: Apostila Econometria 2013

Nota-se pela figura 4, que a série de investimentos deflacionados sugere aplicação do modelo linear, o que nos permite dar sequencia para obtenção da equação de tendência, com a utlização de variáveis explicativas especiais, como representada na coluna 3 da tabela 4.

Tabela 4

(1) (2) (3) (4) (5) (6) (7) (8) (9) ANOS INVEST

(Y) (x1) X2 y.x y ( )2ˆ yy − ( )2yy − ( )2yy −

2000 29,2 -5 25 -146 27,1 174,2 123,2 4,4 2001 30,3 -4 16 -121,2 29,7 112,4 100,0 0,4 2002 32,0 -3 9 -96 32,4 62,4 68,9 0,2 2003 30,9 -2 4 -61,8 35,0 28,1 88,4 16,8 2004 38,3 -1 1 -38,3 37,7 6,8 4,0 0,4 2005 39,7 0 = = 40,3 0 0,4 0,4 2006 37,3 1 1 37,3 42,9 6,3 9,0 31,3 2007 50,6 2 4 101,2 45,6 28,1 106,1 25 2008 53,5 3 9 160,5 48,2 7,9 174,2 28 2009 51,3 4 16 205,2 50,9 62,4 121,0 0,2 2010 50,0 5 25 250,0 53,5 174,2 94,1 12,3

TOTAL 443,1 = 110 290,0 = 662,8 889,3 119,4 Desenvolvimento: a) Determinação dos parâmetros intercepto (â) e angular )ˆ(b com auxílio das equações normais,

pelo método dos minimos quadrados ordinários:

( ) ( ) ( )( ) ( )22

ˆ∑∑∑∑∑

⋅−=

xxb

yxxynb

xbya ⋅−= ˆˆ

( ) 64,2

0110111,443029011ˆ

2 =−⋅⋅−⋅

=b

3,40ˆ064,23,40ˆ =∴⋅−= aa

b) Equação de tendência:

ixy 64,23,40ˆ +=

99

Page 103: Apostila Econometria 2013

Para verificar o posicionamento da equação de tendencia no plano, basta substituir na função ixy 64,23,40ˆ += atribuindo a x os valores -5 e 5 para os anos de 2000 e 2010 respectivamente,

obtendo-se assim, os extremos da função. (ver a representação na figura 4)

( ) 1,27564,23,40ˆ1 =−⋅+=y

5,53564,23,40ˆ2 =⋅+=y Com base nessa equação, podemos efetuar previsões. No exemplo em questão, trata-se de estimar os investimentos em ativos fixos para épocas futuras, bastando para tanto, multiplicar o parâmetro angular da função pelo valor sequencial da variável especial xi, constante na coluna (3) da tabela 4. Por exemplo, se quisermos estimar o investimento esperado para 2011, basta atribuir a x o valor 6: ( ) ixy ⋅+= 64,23,402011ˆ

( ) 664,23,402011ˆ ⋅+=y

( ) 1,562011ˆ =y

c) Determinação do poder explicativo da regressão (R2) Essa medida, também denominada de coeficiente de determinação, tem como finalidade avaliar o grau de dependência da variável endógena y em relação a variável independente x. Quanto maior o valor de R2 melhor é a qualidade do ajuste. Por exemplo, se R2=0,75 indica que 75% da variável y é explicada pela variável x, sugerindo portanto, uma boa qualidade do ajuste . Expressão para cálculo:

( )( )∑

∑−

−= 2

22 ˆ

yyyy

R

Onde: =y dados ajustados pela função; y = média aritmética da variável y; Y = dados observados ou conhecidos de y.

75,03,8898,6622 ==R ou 75%

O valor de R2 obtido sugere que a equação de tendência explica algo em torno de 75% o comportamento da série.

100

Page 104: Apostila Econometria 2013

d) Teste de estacionariedade Ao analisar uma série temporal devemos verificar ainda se a mesma não apresenta sintomas de tendenciosidade. Diz-se que uma série é estacionária quando não apresenta esse sintoma, ou seja, quando sua média e sua variância são constantes ao longo do tempo, então: ( )iyE = constante para todo i

)( iyV = constante para todo i ( )ycov = ( )ycov , significa que a covariância só depende do afastamento (distância) no tempo que

separa os dois valores e não do momento em que estamos no tempo. Assim como existem séries estacionárias, vale lembrar que também existem séries não estacionárias. Estes tipos de série são denominadas de “passeios aleatórios” (random walks), dado que os pontos na linha do tempo passeiam vagarosamente para cima e para baixo, sem um padrão definido. Para avaliar a estacionariedade de uma série existem vários caminhos, tais como o teste de raiz unitária. O teste da raiz unitária mais utilizado é o de Dickey-Fuller, que não será explicitado nessa apostila. Um outro teste comumente utilizado é o teste de Mann, objeto do nosso estudo. Assim, na tabela 5, a seguir, será aplicado esse teste. Observar, com cuidado, o significado de cada coluna.

Tabela 5

(1) (2) (3) (4) (5) (6) ANOS ti r1 r2 Pi ωi

2000 1 2,1 -5,6 7 4 2001 2 0,6 -4,1 4 6 2002 3 -0,4 -3,5 11 0 2003 4 -4,1 -0,6 6 3 2004 5 0,6 -0,4 3 4 2005 6 -0,6 0,4 10 0 2006 7 -5,6 0,6 2 3 2007 8 5,0 0,6 5 2 2008 9 5,3 2,1 1 2 2009 10 0,4 5,0 8 1 2010 11 -3,5 5,3 9 0

∑ - - - - 25

Significado das colunas: (2) ordenação unitária dos anos (ti)

101

Page 105: Apostila Econometria 2013

(3) Residuos (ri) calculados com base na função de regressão já obtida. r1= yi - iy (diferença entre os dados conhecidos e os dados ajustados pela função

ixy 64,23,40ˆ += (4) ordenação dos resíduos de forma crescente (r2) (5) enumeração dos resíduos já ordenados na posição em que se encontrava primitivamente (Pi).

Exemplo: o valor -5,6 estava posicionado em 2000, ou seja, na posição 7 ; -4,1 na posição 4 e assim sucessivamente.

(6) refere-se ao número de elementos da série com valores superiores a cada Pi. Por exemplo: valores superiores a P1=7 encontramos : (11,10,8 e 9), ou seja, 4 elementos. Etc.... (Pi)

Na sequencia , calculamos o valor de S pela expressão:

( )∑ −−⋅=

212 nnS iω

( )

211111252 −

−⋅=S

55550 −=−=S

Para amostras superiores a 10 (n>10), partimos da hipótese de que a distribuição dos resíduos ( )S é assintóticamente normal com média zero: ( ) 0=SE e desvio padrão

( ) ( ) ( )18

521 +⋅−=

nnnsσ ou variância ( ) ( ) ( )18

5212 +⋅−=

nnnsσ

Nesses casos recomenda-se ainda aplicar a correção de continuidade, adicionando-se uma unidade ao resultado de S , quando esta for negativa e subtraindo-se 1 quando for positiva. No exemplo : S = - 5 + 1= - 4 . A seguir calculamos o desvio padrão pela expressão acima citada

( ) ( )( )18

52)1 +⋅−⋅=

nnnSσ

( ) ( ) 84,12

18511211111)( =

+⋅⋅−⋅=Sσ

Conhecido o valor de σ (S), o próximo passo é determinar o valor de t calculado (tc)pela expressão:

39,084,125

)(−=

−==

SStc σ

Este valor é comparado com o valor tabelado de t com nivel de confiança desejado. No presente estudo foi adotado 95% (1,96). Vale lembrar que a estatistica t pode ser aproximada a distribuição

102

Page 106: Apostila Econometria 2013

normal quando o tamanho da amostra n for relativamente grande. Assim, se o valor de tc estiver compreendido no intervalo ±1,96, aceitamos a hipótese H0 de que a série é estacionária. -1,96 ≤ tc ≤ 1,96 (série é estacionária) No exemplo em estudo, nota-se que tc = - 0,39, portanto menor do que 1,96 estando compreendido no intervalo citado, o que sugere que a série é estacionária. A formulação das hipóteses no teste de Mann é: H0: a série de resíduos é estacionária H1: a série de resíduos apresenta tendência Pelo resultado acima obtido, concluímos pela aceitação da hipótese nula ,.H0

Para amostras inferiores ou iguais a 10 (4 ≤ n ≤ 10), pode-se recorrer a tabela de Kendall. Devido a exiguidade da carga horária, exercícios contendo aplicações dessa tabela não serão aqui abordados. Conforme comentado inicialmente, este tópico mostra de forma apenas superficial o problema envolvendo séries temporais. A matéria sobre este assunto é muito mais abrangente, razão pela qual, deixaremos de abordar uma série de tópicos inerentes a análise das séries temporais, tais como: Modelos Autorregressivos (AR), Modelos de Média Móvel (MA); Modelo Autorregressivo e Média Móvel (ARMA), que é a combinação de Média Móvel e Autorregressivo, Processo de Periodicidades Ocultas, etc.

103

Page 107: Apostila Econometria 2013

104

Page 108: Apostila Econometria 2013

105

Page 109: Apostila Econometria 2013

106

Page 110: Apostila Econometria 2013

107

Page 111: Apostila Econometria 2013

108

Page 112: Apostila Econometria 2013

BIBLIOGRAFIA: DAMODAR N. GUJARATI Econometria Básica, Makron Books Ltda., São Paulo HILL, R. CARTER Econometria, Saraiva, São Paulo, 1999 KELEIJIAN, HARRY H. Introdução à Econometria: princípios e aplicações, Campus, Rio de

Janeiro SCHRÖDER, BRUNO Econometria para Concursos, Rio de Janeiro – Elsevier, 2012.

109