Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

76
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA APOSTILA: MAT02207 - ESTATÍSTICA ECONÔMICA Prof. Vanessa Leotti ([email protected])

Transcript of Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

Page 1: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA

DEPARTAMENTO DE ESTATÍSTICA

APOSTILA:

MAT02207 -

ESTATÍSTICA ECONÔMICA

Prof. Vanessa Leotti ([email protected])

Page 2: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

2

ÍNDICE

1 MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS) ................................................................ 4

1.1 INTRODUÇÃO À REGRESSÃO .................................................................................................................. 4 1.1.1 RELAÇÕES ESTATÍSTICAS VERSUS DETERMINÍSTICAS ........................................................................... 4 1.2 MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)........................................................................... 4 1.2.1 FUNÇÃO LINEAR DE REGRESSÃO POPULACIONAL ................................................................................. 4 1.2.2 FUNÇÃO LINEAR DE REGRESSÃO AMOSTRAL ........................................................................................ 5 1.2.3 PREMISSAS CLÁSSICAS .......................................................................................................................... 6 1.3 ESTIMAÇÃO DOS PARÂMETROS DO MODELO: MÉTODO DE MÍNIMOS QUADRADOS ORDINÁRIOS (MQO) .............................................................................................................................................................. 7 1.3.1 SIGNIFICADO DE 1β E 2β ..................................................................................................................... 8 1.3.2 PRECISÃO OU ERRO-PADRÃO DAS ESTIMATIVAS DE MQO.................................................................... 9 1.3.3 PROPRIEDADES DOS ESTIMADORES DE MQO........................................................................................ 9 1.4 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON - R.................................................................. 12 1.5 COEFICIENTE DE DETERMINAÇÃO - R2 ................................................................................................ 13 1.6 A PREMISSA DE NORMALIDADE DOS RESÍDUOS................................................................................... 15 1.7 ESTIMAÇÃO POR INTERVALO............................................................................................................... 15 1.7.1 INTERVALOS DE CONFIANÇA PARA OS COEFICIENTES DE REGRESSÃO ................................................ 15 1.7.2 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA RESIDUAL ................................................................ 17 1.8 TESTES DE HIPÓTESES .......................................................................................................................... 18 1.8.1 ABORDAGEM DO INTERVALO DE CONFIANÇA ..................................................................................... 18 1.8.2 ABORDAGEM DO TESTE DE SIGNIFICÂNCIA ......................................................................................... 19 1.9 PREVISÃO .............................................................................................................................................. 21 1.9.1 INTERVALO DE CONFIANÇA PARA A ESTIMATIVA MÉDIA DE Y, DADO X = X0 .................................... 21 1.9.2 INTERVALO DE CONFIANÇA PARA A ESTIMATIVA INDIVIDUAL DE Y, DADO X = X0 ........................... 22 1.10 ANÁLISE DE VARIÂNCIA – ANOVA................................................................................................... 23 1.10.1 TESTE DE SIGNIFICÂNCIA PARA O COEFICIENTE DE DETERMINAÇÃO ................................................ 24 1.11 REGRESSÃO PELA ORIGEM................................................................................................................. 25 1.12 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO ...................................................................... 26 1.12.1 MODELO LOG-LINEAR OU LOG-LOG ................................................................................................ 26 1.12.2 MODELOS SEMILOGARÍTMICOS LOG-LIN E LIN-LOG ........................................................................ 26 1.12.3 MODELOS RECÍPROCOS (INVERSOS) ................................................................................................. 27

2 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM)......................................................... 29

2.1 SIGNIFICADO DOS PARÂMETROS DO MODELO .................................................................................... 29 2.2 NOTAÇÃO MATRICIAL DO MRLM....................................................................................................... 29 2.3 PREMISSAS DO MRLM......................................................................................................................... 30 2.4 MÉTODO DOS MÍNIMOS QUADRADOS ORDINÁRIOS (MQO) ............................................................... 30 2.4.1 VARIÂNCIAS DOS ESTIMADORES DE MQO.......................................................................................... 31 2.5 COEFICIENTE MÚLTIPLO DE DETERMINAÇÃO: R2.............................................................................. 33

2.6 COEFICIENTE MÚLTIPLO DE DETERMINAÇÃO AJUSTADO: 2R ......................................................... 33

2.7 COEFICIENTE DE CORRELAÇÃO PARCIAL ........................................................................................... 34 2.8 COEFICIENTE DE DETERMINAÇÃO PARCIAL ....................................................................................... 35 2.9 INTERVALO DE CONFIANÇA E TESTE DE SIGNIFICÂNCIA INDIVIDUAL PARA OS COEFICIENTES DE REGRESSÃO ..................................................................................................................................................... 35 2.10 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA RESIDUAL ............................................................. 36 2.11 TESTE DA SIGNIFICÂNCIA GERAL DA REGRESSÃO (ANOVA).......................................................... 37 2.12 CONTRIBUIÇÃO MARGINAL OU INCREMENTAL DE UMA VARIÁVEL EXPLICATIVA......................... 39 2.13 PREVISÃO NO MRLM......................................................................................................................... 41 2.14 MODELO DE REGRESSÃO POLINOMIAL ............................................................................................. 42

Page 3: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

3

2.15 VARIÁVEIS DUMMIES ......................................................................................................................... 43 2.15.1 REGRESSÃO SOMENTE COM VARIÁVEIS DUMMIES (MODELOS ANOVA) ......................................... 43 2.15.2 REGRESSÃO COM VARIÁVEIS QUANTITATIVAS E DUMMIES (MODELOS ANCOVA) ........................ 45 2.15.3 EFEITOS DE INTERAÇÃO COM O USO DE VARIÁVEIS BINÁRIAS .......................................................... 46 2.15.4 O EMPREGO DE VARIÁVEIS BINÁRIAS EM ANÁLISES SAZONAIS ........................................................ 48 2.15.5 MODELOS LOG-LIN E VARIÁVEIS DUMMIES..................................................................................... 48

3 VIOLAÇÕES DAS PREMISSAS DO MODELO DE REGRESSÃO................................................ 50

3.1 NÃO-NORMALIDADE DOS RESÍDUOS .................................................................................................... 50 3.1.1 DETECÇÃO........................................................................................................................................... 50 3.1.2 CONSEQÜÊNCIAS ................................................................................................................................. 52 3.1.3 MEDIDAS CORRETIVAS ........................................................................................................................ 52 3.2 MULTICOLINEARIDADE ........................................................................................................................ 54 3.2.1 CONSEQÜÊNCIAS ................................................................................................................................. 55 3.2.2 DETECÇÃO........................................................................................................................................... 57 3.2.3 MEDIDAS CORRETIVAS ........................................................................................................................ 60 3.3 HETEROCEDASTICIDADE ...................................................................................................................... 63 3.3.1 MÉTODO DOS MÍNIMOS QUADRADOS GENERALIZADOS (MQG)........................................................ 64 3.3.2 CONSEQÜÊNCIAS ................................................................................................................................. 64 3.3.3 DETECÇÃO........................................................................................................................................... 65 3.3.4 MEDIDAS CORRETIVAS ........................................................................................................................ 68 3.4 AUTOCORRELAÇÃO .............................................................................................................................. 71 3.4.1 CONSEQÜÊNCIAS ................................................................................................................................. 73 3.4.2 DETECÇÃO........................................................................................................................................... 73 3.4.3 MEDIDAS CORRETIVAS ........................................................................................................................ 76

Page 4: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

4

1 MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)

1.1 Introdução à Regressão

A análise de regressão estuda a dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explanatórias ou independentes, com o objetivo de estimar e/ou prever o valor médio da primeira em termos de valores conhecidos ou fixados das segundas. Pressupõe-se implicitamente que as relações causais, se as houver, entre a variável dependente e as explanatórias só se dão em uma direção: das variáveis explanatórias para a dependente. Exemplo: Poderia-se estudar a relação de dependência do rendimento das lavouras em relação à temperatura, pluviosidade, luz solar ou fertilizante, por exemplo.

1.1.1 Relações estatísticas versus determinísticas

Na análise de regressão, estamos preocupados com o que é conhecido como dependência estatística, e não funcional ou determinística, entre as variáveis. Nas relações estatísticas entre variáveis, lidamos essencialmente com variáveis aleatórias ou estocásticas, isto é, variáveis que têm distribuições probabilísticas. Na dependência funcional ou determinística, por outro lado, também lidamos com variáveis, mas estas não são aleatórias ou estocásticas. O exemplo anterior é uma dependência estatística. Já um exemplo de dependência determinística é a fórmula: lucro bruto = preço x unidades vendidas.

1.2 Modelo de Regressão Linear Simples (MRLS)

Método de ajustamento de uma reta para análise da relação entre uma variável independente (explicativa ou regressora) e uma variável dependente (explicada ou resposta). Ambas as variáveis são quantitativas. Este modelo também é conhecido como modelo de duas variáveis.

1.2.1 Função linear de regressão populacional

Denotaremos por iY o valor da variável dependente para a i-ésima observação e iX o valor

da variável independente para a i-ésima observação. Como dito anteriormente, o objetivo da regressão é estimar um valor médio da variável

dependente com base nos valores conhecidos da variável explanatória. Desenho (fertilizante x produtividade):

Page 5: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

5

Podemos expressar isso matematicamente escrevendo:

( ) ii XXYE 21| ββ +=

onde 1β e 2β são chamados de coeficientes de regressão, ou respectivamente, intercepto e coeficiente angular, e o subscrito i indica os pares de observações, i = 1, 2, ..., n.

A expressão acima é conhecida como função linear de regressão populacional. Nem todos os valores de Y caem sobre a reta, existe um desvio em torno de seu valor esperado, que pode ser denotado por:

( )iii XYEYe |−=

Ou ( ) iii eXYEY += |

O que implica que ieXY iii ∀++= ,21 ββ

O desvio e, também conhecido como perturbação aleatória, resíduo aleatório, ou distúrbio

aleatório, é um “substituto” ou representante de todas as variáveis que podem afetar Y, mas não foram incluídas no modelo de regressão; dos elementos não-previsíveis de aleatoriedade e dos erros de mensuração em Y.

1.2.2 Função linear de regressão amostral

1β e 2β são parâmetros conhecidos apenas se toda a população fosse pesquisada, ou seja, se um censo fosse realizado. Entretanto, na prática, amostras são utilizadas para estimar a função de regressão. Assim, temos a função linear de regressão amostral:

ii XY 21ˆˆˆ ββ +=

iY é um estimador de ( )iXYE | , assim como a distância iii YYe ˆˆ −= estima o resíduo e.

Assim, pode-se escrever a função de regressão amostral como:

iiiii eYeXY ˆˆˆˆˆ21 +=++= ββ

A figura abaixo ilustra as diferenças entre a FRP e FRA:

Page 6: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

6

Assim, temos duas questões para responder:

- Como obter 1β e 2β ?

- Após 1β e 2β terem sido obtidos, como podemos fazer inferências sobre os verdadeiros

parâmetros 1β e 2β ?

1.2.3 Premissas clássicas

Para realizarmos inferências sobre 1β e 2β , precisamos fazer algumas suposições sobre a maneira com que X e e influenciam em Y. [1]: ieXY iii ∀++= ,21 ββ

Estabelece que, para cada observação i, existe uma relação linear de dependência entre uma variável explicada observável, Y, uma variável explicativa observável, X e um termo de perturbação aleatório não observável, e.

Ou seja, o modelo é linear nos parâmetros e nas variáveis. Um exemplo de modelo não linear nas variáveis é iii eXY ++= 2

21 ββ , e veremos que alguns

casos desse tipo podem ser resolvidos através do modelo acima. Tipos de não-linearidade nas variáveis:

Um exemplo de modelo não linear nos parâmetros é ( ) iii eXY ++=2

21 ββ e não veremos

esse tipo de modelo. [2]: Os valores de X são fixados em amostragem repetida;

A idéia é que os valores de X são fixos e se observa os valores de Y correspondentes. Isso implica que X não é uma variável aleatória. [3]: ( ) iXeE ii ∀= ,0|

O valor médio do termo de erro é zero. Isso significa que fatores não incluídos no modelo e, portanto, agrupados em e, não afetam sistematicamente o valor médio de Y. [4]: ( ) iXeVar ii ∀= ,| 2σ

A variância do resíduo aleatório é constante (homoscedasticidade: variâncias iguais; heteroscedasticidade: variâncias diferentes).

Desenho da heteroscedasticidade:

Page 7: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

7

[5]: ( )ji eeCov , = 0, jiji ≠∀ ,,

É nula a covariância entre os resíduos aleatórios (ausência de autocorrelação). Intuitivamente, a importância dessa hipótese pode ser explicada do seguinte modo: seja

nossa FRP ttt uXY ++= 21 ββ , onde tu e 1−tu apresentam correlação. Então, tY não depende

apenas de tX mas também de 1−tu , que em alguma medida, influencia em tu .

[6]: Cov(Xi, ei) = 0;

A covariância entre o termo de erro e a variável explicativa é nula. Assim, presumimos que X e e exercem influências separadas em Y. Isso ocorre automaticamente se X é não aleatório.

Por isso, mesmo se X não for aleatório, mas for não correlacionado com e, o modelo é válido. [7]: O número de observações (n) deve ser maior que o número de parâmetros a serem estimados; Ou seja, são necessários no mínimo 2 pares de observações para ajustar o modelo postulado em 1. [8]: A variável explicativa X assume, no conjunto das observações, valores não todos iguais, ou seja, a variável X não é constante na amostra. [9]: O modelo está corretamente especificado (não há viés ou erro de especificação); Exemplo de erro de especificação: ajustar uma reta a dados que tem comportamento quadrático. [10]: Não existe relação linear exata nos regressores (ausência de multicolinearidade).

Resulta destas hipóteses que Y é uma variável aleatória que tem, para todo i, média dada por: E(Yi |Xi) = β1 + β2Xi (Implica de 3)

E variância:

Var(Yi|Xi) = σ2 (Implica de 4)

Assim, β1, β2 e σ2 são os parâmetros, geralmente desconhecidos, da distribuição de Y.

1.3 Estimação dos parâmetros do modelo: Método de Mínimos Quadrados Ordinários (MQO)

Dentre os diversos métodos existentes para estimar os verdadeiros parâmetros de funções

estatísticas, no contexto da análise de regressão, o método dos mínimos quadrados ordinários (MQO) é um dos mais populares. Para entender esse método será visto brevemente o princípio dos mínimos quadrados.

Primeiro, devemos lembrar da definição do resíduo estimado, isto é: iii YYe ˆˆ −= . Ou seja, os

resíduos são simplesmente as diferenças entre os valores observados de Y e os estimados. Queremos determinar a FRA de tal modo que seja tão próxima quanto possível do Y observado. Para tanto, podemos adotar o seguinte critério: escolher a FRA para que a soma dos resíduos,

( )∑∑ −= iii YYe ˆˆ ,

seja a menor possível. Contudo, esse método pode conduzir a resultados inócuos e dessa forma, é

preferível adotar o critério da minimização dos quadrados dos resíduos, isto é: ( )22 ˆˆ ∑∑ −= iii YYe .

Page 8: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

8

Gráfico: Critério dos mínimos quadrados Assim, através do cálculo diferencial (ver demonstração em Gujarati) o método de MQO nos

fornece as estimativas únicas de 1β e 2β que resultam no menor valor possível de ∑ 2ˆie . O

processo de diferenciação resulta na resolução do seguinte sistema de equações normais:

+=

+=

∑∑∑∑∑

221

21

ˆˆ

ˆˆ

iiii

ii

XXYX

XnY

ββ

ββ

onde, n é o tamanho da amostra. Resolvendo as equações normais simultaneamente, obtemos:

( )( )( ) ∑

∑∑

∑=

−−=

222ˆ

x

xy

XX

YYXX

i

iiβ

e,

XY 21ˆˆ ββ −= ,

onde X e Y são as médias amostrais de X e Y, ou seja, n

XX ∑

= e n

YY ∑

= ;

e x e y são as variáveis em formato desvio, ou seja, XXx ii −= e YYy ii −= .

1.3.1 Significado de 1β e 2β

1β : valor estimado para Y quando X = 0

2β : acréscimo (ou decréscimo) em Y quando X aumenta 1 unidade. Seu sinal indica se a relação entre X e Y é positiva ou negativa.

Page 9: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

9

1.3.2 Precisão ou erro-padrão das estimativas de MQO

As estimativas de MQO são uma função dos dados amostrais. Mas, como os dados tendem a mudar de amostra para amostra, as estimativas também mudarão. Portanto, é necessária alguma

medida da confiabilidade ou precisão dos estimadores 1β e 2β . Em estatística, a precisão de uma estimativa é medida pelo seu erro-padrão, que nada mais é do que a raiz quadrada da variância.

Pode ser mostrado que as variâncias e os erros-padrão dos estimadores de MQO podem ser obtidos por:

( ) ( )∑∑

+==⇒

+==

2

2

1ˆ2

22

12ˆ

1ˆ1ˆ11 x

X

nEp

x

X

nVar σβσσβσ

ββ

( ) ( )∑∑

==⇒==22ˆ2

2

22ˆ

ˆˆ22 x

Epx

Varσ

βσσ

βσββ

onde 2σ é a variância de ei, segundo a premissa 4, que pode ser estimada através da fórmula:

2

ˆˆ

22

−=∑n

eσ , onde

( )∑∑∑∑∑∑ −=−=

2

2

2222

22 ˆˆx

xyyxye β .

Assim, a partir de uma amostra, podemos estimar as variâncias e erros-padrão dos estimadores de MQO apenas substituindo 2σ por 2σ nas expressões acima:

( ) ( )∑∑

+==⇒

+==

2

2

1ˆ2

22

12ˆ

1ˆˆˆ

1ˆˆˆ

11 x

X

nep

x

X

nvar σβσσβσ

ββ

( ) ( )∑∑

==⇒==22ˆ2

2

22ˆ

ˆˆˆˆˆˆ

22 xep

xvar

σβσ

σβσ

ββ

1.3.3 Propriedades dos estimadores de MQO 1. A reta de regressão sempre passa pelas médias amostrais de Y e X:

XYXY 2121ˆˆˆˆ ββββ +=⇒−=

2. A soma dos resíduos estimados é igual a zero: ( ) 0ˆˆ =−=∑∑ iii YYe .

3. Dadas as premissas do MRLS, os estimadores de MQO são os melhores estimadores lineares não-tendenciosos de seus respectivos parâmetros. Isto significa que: a. Linear: função linear de Y b. Não-tendencioso: esperança do estimador é igual ao verdadeiro valor do parâmetro. c. Têm variância mínima dentre todos os estimadores lineares não-tendenciosos. 4. São consistentes, pois quanto maior o n, menor sua variância, ou seja, maior sua precisão.

Page 10: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

10

Exemplo 1. Utilize o método dos mínimos quadrados para estimar a reta de regressão entre consumo (Y) de pizzas e renda (X) per capita, baseado numa amostra observada de cinco cidades. Interprete os valores do intercepto e coeficiente angular. Estime também as variâncias e erros-padrão dos estimadores.

i X Y x y x² y² xy

1 8 40 2 4 30 3 6 28 4 12 46 5 15 59

Total

Page 11: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

11

y = 0,8977x + 12,447

R2 = 0,764

10

12

14

16

18

20

22

24

0 2 4 6 8 10 12 14

Nº semanas trabalhadas

auto

móveis

inspecio

nados

Exercício 1. A tabela a seguir informa quantas semanas (X) seis pessoas trabalharam em um posto de inspeção de automóveis e quantos automóveis (Y) cada pessoa inspecionou entre 12hs e 14hs, em determinado dia. a) Ajuste o modelo de regressão linear para esses dados, interpretando as estimativas obtidas; b) Estime as variâncias e erros-padrão dos estimadores.

X Y

2 13 7 21 9 23 1 14 5 15 12 21

Page 12: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

12

1.4 Coeficiente de correlação linear de Pearson - r

Supondo que exista algum tipo de relação linear entre as variáveis X e Y, uma medida utilizada para verificar o grau de correlação entre elas é o coeficiente de correlação linear de Pearson, cujo valor amostral é dado por:

∑∑∑

=22 yx

xyr

Este coeficiente tem a propriedade de que: 11 +≤≤− r .

Gráfico: Tipos de correlação

Obs: o verdadeiro valor da correlação linear (desconhecido) é representado pela letra ρ (rô). Exemplo 2. Calcular e interpretar o coeficiente de correlação linear de Pearson para os dados do Exemplo 1. Exercício 2. Calcular e interpretar o coeficiente de correlação linear de Pearson para os dados do Exercício 1.

Page 13: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

13

1.5 Coeficiente de determinação - r2

Apesar de ser diretamente ligado ao coeficiente de correlação, o coeficiente de determinação possui uma interpretação bastante distinta. É uma medida para verificar a qualidade do ajuste de uma regressão, ou seja, o quão “bem” a reta de regressão se ajusta aos dados. Quando ajustamos uma reta, esperamos que os resíduos em torno da linha sejam os menores possíveis. Então, quanto mais próximos da reta os resíduos estiverem, melhor será o grau de ajuste e é essa a informação que o coeficiente de determinação sintetiza.

Lembrando da FRA iii eYY ˆˆ += , adicionando-se a média de Y dos dois lados, tem-se:

( )iiii YYYYYY ˆˆ −+−=−

Elevando ao quadrado ambos os lados e somando ao longo da amostra, obtemos:

( ) ( ) ( )∑∑∑ −+−=−222 ˆˆ

iiii YYYYYY

SQT = SQE + SQR onde SQT é a soma de quadrados total, SQE é a soma de quadrados explicados pela regressão e SQR é a soma de quadrados de resíduos. Ou seja, a variação total dos valores observados de Y em torno de sua média pode ser divida em duas partes: uma atribuível à linha de regressão e a outra, a forças aleatórias porque nem todas as observações de Y se situam sobre a linha.

Gráfico. Decomposição da soma de quadrados total Definimos agora r2 como:

SQT

SQEr =2 ou alternativamente,

SQT

SQRr −= 12

Assim, o r2 determina a proporção (percentual) da variação total de Y explicada pela

variação de X (ou pelo modelo de regressão). Seus limites são: 10 2 ≤≤ r .

Page 14: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

14

Fórmulas alternativas:

( )∑∑

∑∑∑

=

=

22

2

2

222

2 ˆyx

xy

y

xr β

A relação entre o coeficiente de correlação e o de determinação é dada por:

2rr ±= . Exemplo 3. Calcule e interprete o coeficiente de determinação para os dados do Exemplo 1. Exercício 3. Calcule e interprete o coeficiente de determinação para os dados do Exercício 1.

Page 15: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

15

1.6 A premissa de normalidade dos resíduos

Para poder fazer inferências sobre os parâmetros do modelo de regressão, devemos fazer

alguma pressuposição sobre a distribuição de probabilidades dos resíduos ei. Geralmente se supõe que:

[11]: ),0(~ 2σNIDei

Isso implica que:

( )2ˆ111

,~ˆβ

σββ N ;

( )2ˆ222

,~ˆβ

σββ N ;

( ) ( )2

22

2

2 −− nn χσ

σ e

( )221 ,~ σββ ii XNY + .

1.7 Estimação por intervalo

Vimos anteriormente a estimação pontual dos coeficientes de regressão por MQO. Podemos

nos perguntar: até que ponto essas estimativas são confiáveis? Em decorrência de variações amostrais, uma única estimativa possivelmente será diferente do verdadeiro valor, embora se espere que, em amostras repetidas, seu valor médio seja igual ao verdadeiro valor. Agora, na estatística, a confiabilidade de um estimador é medida por seu erro-padrão. Portanto, em vez de nos embasar apenas na estimativa pontual, podemos construir um intervalo em torno do estimador pontual, digamos, de dois ou três erros-padrão de cada lado, de tal modo que esse intervalo tenha, digamos, 95% de probabilidade de incluir o verdadeiro valor do parâmetro. Essa é a idéia que está por trás dos intervalos de confiança.

Não podemos dizer que o verdadeiro valor do parâmetro possui tal probabilidade de estar contido no intervalo. Ele é um número fixo, então ou está ou não está no intervalo (probabilidade 0 ou 1).

Depois de observarmos a amostra e calcularmos o intervalo para ela, ele deixa de ser aleatório e passa a ser fixo, e então não podemos mais falar em probabilidade. Trocamos então a palavra probabilidade por confiança. Assim, dizemos que tal intervalo possui “x” de confiança de conter o verdadeiro valor do parâmetro.

1.7.1 Intervalos de confiança para os coeficientes de regressão

Pode-se demonstrar que, se 2σ conhecida, os coeficientes do modelo distribuem-se normalmente. E assim, tem-se:

( )1,0~ˆ

ˆ

NZi

ii

βσ

ββ −=

Contudo, sabemos que a variância raramente é conhecida e devemos estimá-la a partir da amostra. Assim devemos usar a aproximação da normal pela distribuição t de Student com n-2 graus de liberdade, então:

( )2ˆ

ˆ−

−= n

ii ttiβ

σ

ββ

Page 16: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

16

Podemos estabelecer um intervalo de confiança tal que:

ααα −=

≤≤−

−−1

2;2

2;2 nn

tttP

Substituindo-se em t, temos

ασ

ββα

β

α −=

−≤−

−−1

ˆ

ˆ

2;2

ˆ2;2 n

ii

nttP

i

e, com algumas manipulações, chega-se a

ασββσββαβα −=

+≤≤−

−−1ˆˆˆˆ

ˆ

2;2

ˆ

2;2 ii n

iin

i ttP

o qual é o intervalo de confiança para βi, e pode ser escrito mais concisamente como:

( )

±−×

− inii tparaIC

βα σββα ˆ

2;2

ˆˆ:%1100 .

Exemplo 4. Intervalos de 95% de confiança para os coeficientes da regressão do Exemplo 1. Exercício 4. Calcule e interprete os IC com 90% e 99% para os coeficientes de regressão para os dados do Exercício 1.

Page 17: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

17

1.7.2 Intervalo de confiança para a variância residual

Vimos que a variável ( )

( )22

2

22 ~

ˆ2−

−= n

nq χ

σ

σ.

Podemos usar essa variável para estabelecer um intervalo de confiança para a variância

residual da seguinte forma:

αχχ αα −=

≤≤

−−−12

2;2

22

21;2 nn

qP

Substituindo-se em q2 e fazendo-se algumas manipulações, temos:

( ) ( ) αχ

σσ

χ

σ

αα

−=

−≤≤−

−−−

22

21;2

22

2

2;2

2

nn

nnP

Ou ( ) ( ) ( )

−−−×

−−−

2

21;2

2

2

2;2

22 ˆ

2;ˆ

2:%1100αα χ

σ

χ

σσα

nn

nnparaIC .

Exemplo 5. Supondo que temos uma amostra de 10 observações de duas variáveis X e Y, a variância estimada de Y foi igual a 42,1591. O IC de 95% para a variância da estimativa é: Exercício 5. Calcule e interprete os IC com 90% e 99% para a variância residual do Exercício 1.

Page 18: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

18

1.8 Testes de hipóteses

O problema do teste estatístico de hipóteses pode ser resumido assim: uma dada observação

ou resultado é compatível com alguma hipótese feita ou não? Assim temos a hipótese nula (H0) que é testada contra a hipótese alternativa (H1), e decidimos sobre a veracidade ou a falsidade da hipótese nula através dos resultados amostrais. Ou seja, a teoria do teste de hipóteses cuida da formulação de regras ou procedimentos a serem adotados para decidir se a hipótese nula deve ser rejeitada ou não rejeitada. Há duas abordagens complementares para a elaboração dessas regras: o intervalo de confiança e o teste de significância.

1.8.1 Abordagem do intervalo de confiança

- Teste bilateral ou bicaudal As hipóteses deste teste são:

=*

1

*0

:

:

ii

ii

H

H

ββ

ββ

Por exemplo, poderíamos estar interessados em testar as seguintes hipóteses: 1. O intercepto do modelo (coeficiente linear) é nulo? Ou, a regressão passa pela origem do sistema coordenado?

=

0:

0:

11

10

β

β

H

H

2. A inclinação do modelo (coeficiente angular) é nula? Ou, não existe relação linear entre X e Y?

=

0:

0:

21

20

β

β

H

H

Em ambos os casos acima, 0* =iβ .

Regra de decisão: para um nível de significância α , estabeleça um intervalo de confiança de

( )%1100 α−× para iβ . Se *iβ cair dentro do intervalo de confiança, não rejeite H0, caso contrário,

rejeite. Em estatística, quando rejeitamos a hipótese nula, dizemos que nossos resultados foram estatisticamente significativos.

- Teste unilateral ou unicaudal Às vezes, temos uma forte expectativa a priori ou teórica de que a hipótese alternativa seja unilateral. Um exemplo de teste unilateral é:

>

0:

0:

21

20

β

β

H

H.

Por questões de facilidade, veremos testes unilaterais apenas através da abordagem dos testes de significância.

Page 19: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

19

Exemplo 6: Usando um nível de significância de 5%, teste, através dos intervalos de confiança, as hipóteses de que o intercepto e o coeficiente angular são significativamente diferentes de zero para os dados do Exemplo 1. Exercício 6: Usando um nível de significância de 10%, teste, através dos intervalos de confiança, as hipóteses de que o intercepto e o coeficiente angular são significativamente diferentes de zero para os dados do Exercício 1.

1.8.2 Abordagem do teste de significância

A rotina de procedimentos para os testes de significância pode ser resumida da seguinte maneira:

a) Escolhe-se o nível de significância α, em geral 1%, 5% ou 10%; b) Estabelecer as hipóteses e verificar a forma do teste, isto é, unilateral ou bilateral; c) Verificar o valor crítico (valor tabelado), que será

2;2 α−nt para um teste bilateral e α;2−nt

para um teste unilateral; d) Calcular o valor amostral da estatística de teste:

i

iitβ

σ

ββ

ˆ

*

ˆ

ˆ −=

e) Decidir conforme a tabela abaixo:

Tipo de hipótese H0 H1 Decisão: rejeitar H0 se Bicaudal *

0 : iiH ββ = *1 : iiH ββ ≠

2;2 α−>

ntt

Cauda direita *0 : iiH ββ ≤ *

1 : iiH ββ > α;2−> ntt

Cauda esquerda *0 : iiH ββ ≥ *

1 : iiH ββ < α;2−−< ntt

Page 20: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

20

Exemplo 7: Usando um nível de significância de 5%, teste, através dos testes de significância, as hipóteses de que o intercepto e o coeficiente angular são significativamente diferentes de zero para os dados do Exemplo 1. Exemplo 8: Para os dados do exemplo 1, usando um nível de significância de 5%, teste a hipótese de que o coeficiente angular é maior que 1. Exercício 7: Considere os dados do Exemplo 1. Em uma pesquisa anterior, um economista havia

estimado o modelo XY 34,25,15ˆ += . Existe diferença significativa entre as estimativas obtidas na pesquisa anterior e a atual, a 5% de nível de significância? Exercício 8: Considere os dados do Exercício 1. A um nível de significância de 1%, teste as hipóteses de que o intercepto e o coeficiente angular são maiores que zero.

Page 21: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

21

- O valor-p: é definido como o menor nível de significância ao qual a hipótese nula pode ser rejeitada. Só pode ser calculado exatamente através de métodos computacionais. A relação entre o valor-p e o nível de significância é: se valor-p < α , rejeita-se H0, caso contrário não se rejeita.

1.9 Previsão

Um dos principais objetivos da análise de regressão é “prever” valores de Y com base em valores conhecidos de X. Há dois tipos de previsão: 1. Previsão para a estimativa média de Y dado X=X0: Exemplo: Estimar o consumo médio de pizza para cidades com renda igual a 7.

( ) 02100ˆˆ|ˆ XXXYEdeestimadorY ββ +===

2. Previsão para a estimativa individual de Y dado X=X0: Exemplo: Estimar o consumo de pizza para uma cidade com renda igual a 7.

( ) 02100ˆˆ|ˆ XXXYdeestimadorY ββ +===

1.9.1 Intervalo de confiança para a estimativa média de Y, dado X = X0

( ) ( )

±=−×

−m

ntYXXYEIC σα α ˆˆ:| para %1100

2;2

00 e

−+=

∑ 2

2022 )(1

ˆˆx

XX

nm σσ

Exemplo 9. Calcular um intervalo com 95% de confiança para o valor médio de Y, quando X = 100,

para a regressão XY 5091,04525,24ˆ += , obtida de uma amostra de 10 observações, com 170=X ,

000.332 =∑ x e 159,42ˆ 2 =σ .

Page 22: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

22

1.9.2 Intervalo de confiança para a estimativa individual de Y, dado X = X0

( ) ( )

±=−×

−i

ntYXXYIC σα α ˆˆ:| para %1100

2;2

00 e

−++=∑ 2

2022 )(1

1ˆˆx

XX

ni σσ

Exemplo 10. Calcular um intervalo com 95% de confiança para o valor individual de Y, quando X = 100, para a regressão do Exemplo 9.

Alguns cuidados em relação à previsão: 1. Quanto mais afastados da média dos valores observados na amostra for a estimativa,

menos precisão haverá.

2. Ao extrapolar as estimativas para valores fora do intervalo dos dados amostrais, não existem garantias de que a relação entre as variáveis manterá o mesmo padrão observado na amostra.

Exercício 9. Calcular os intervalos com 90% de confiança para a estimativa média e individual de Y dado que X = 10 para os dados do Exercício 1.

Page 23: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

23

1.10 Análise de Variância – ANOVA

Um método complementar para o estudo da análise de regressão é a análise de variância. A ANOVA verifica se o modelo estimado possui algum grau de explicação sobre a variável resposta. No caso de apenas duas variáveis (ou seja, MRLS), esse método é equivalente ao teste t para testar se o coeficiente angular do modelo é nulo, isto é:

=

0:

0:

21

20

β

β

H

H

Como já mencionado, é possível particionar as somas de quadrados da seguinte forma:

( ) ( ) ( )∑∑∑ −+−=−222 ˆˆ

iiii YYYYYY

SQT = SQE + SQR

Ou seja: SQT: soma de quadrados total, com (n-1) g.l.; SQE: soma de quadrados explicada pela regressão, com 1 g.l.; SQR: soma de quadrados dos resíduos, com (n-2) g.l.. As somas de quadrados também podem ser calculadas através das seguintes expressões:

( ) ∑∑ =−= 22

ii yYYSQT

( )∑ ∑=−= 222

2 ˆˆii xYYSQE β

( ) ( )∑

∑∑∑∑∑∑ −=−==−=

2

2

2222

222 ˆˆˆx

xyyxyeYYSQR iii β

A ANOVA utiliza essa relação entre as somas de quadrados é geralmente resumida e analisada através da seguinte tabela: ANOVA

Causas de Variação GL SQ QM F Devida à regressão 1 ∑ 22

ixβ

1

ˆ 222∑

=ix

QMEβ

QMR

QME

Devido aos resíduos n-2 ∑ 2ie 2

2

ˆ2

ˆσ=

−=∑n

eQMR i

Total n-1 ∑ 2iy

O valor da estatística F tem 1 g.l. no numerador e n-2 g.l. no denominador, ou seja:

F ~ F(1;n-2) Regra de decisão: Se ( )2;1; −> nFF α , rejeita-se H0, caso contrário não se rejeita.

No caso de apenas duas variáveis, deve-se observar que a relação entre as estatísticas t e f é

ft =2

.

Page 24: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

24

Exemplo 11. Utilizando os dados do Exemplo 1, construa a tabela da análise de variância e analise os resultados, considerando um nível de significância de 5%.

1.10.1 Teste de significância para o coeficiente de determinação Alternativamente, pode-se observar que o teste F para testar a significância global do modelo também pode ser visto como um teste de significância para o coeficiente de determinação r2, isto é, se o coeficiente de determinação é nulo ou não:

20

21

: 0

: 0

H

H

ρ

ρ

=

≠ Através de manipulações algébricas, a tabela ANOVA pode ser re-escrita em termos desse coeficiente da seguinte forma: ANOVA

CV GL SQ QM F Regressão 1 ( )∑ 22

iyr

( ) 122 ∑ iyr

( )( )2

2

1

2

r

rn

Resíduos n-2 ( )( )∑− 221 iyr

( )( ) ( )21 22 −− ∑ nyr i

Total n-1 ∑ 2iy

Exemplo 12. Refazer a tabela de análise de variância do exemplo 11 em termos do coeficiente de determinação.

Page 25: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

25

Exercício 10. a) Faça a ANOVA para os dados do Exercício 1 e analise os resultados. b) Refaça a ANOVA em termos do coeficiente de determinação e compare os resultados com o item a).

1.11 Regressão pela origem

Em algumas situações, a FRP de duas variáveis assume a seguinte forma:

iii eXY += 2β

Nesse modelo, o termo do intercepto está ausente ou é nulo. Aplicando então o método de

MQO, obtemos as seguintes fórmulas para 2β e sua variância:

∑∑

=22

ˆX

XYβ ,

∑=

2

22ˆ

ˆˆ

2 X

σσ

β ,

1

ˆˆ

22

−=∑n

eσ ,

( )∑

∑∑∑ −=

2

2

22ˆX

XYYe

A primeira diferença entre o modelo de regressão pela origem e o modelo com intercepto é que as fórmulas para o primeiro envolvem somas brutas das variáveis, e não no formato desvio. A segunda diferença são os graus de liberdade, que passam a ser n – 1. Outra diferença é que, no modelo com intercepto 0ˆ =∑ ie , já na regressão pela origem, isto

nem sempre acontece. Além disso, o r2 conforme definido anteriormente pode ser negativo nos modelos com intercepto ausente. Portanto, ele não pode ser usado diretamente nesse caso e também é necessário ajustar os cálculos, obtendo o que se chama de r2 bruto, definido como:

( )∑∑

∑=

22

2

2

YX

XYrbruto .

O r2 bruto está sempre entre 0 e 1, mas não pode ser comparado diretamente ao valor do r2

convencional. Em decorrência das características especiais deste modelo, é preciso ter grande cautela ao

empregá-lo. A menos que exista uma expectativa a priori muito forte, seria preferível ater-se ao modelo com intercepto. Exemplo 13. Ajustar o modelo de regressão pela origem aos dados do Exemplo 1, calcular o r2 bruto e testar a hipótese de que existe influência linear de X em Y, para uma significância de 5%.

Page 26: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

26

Exercício 11. Ajustar o modelo de regressão pela origem aos dados do Exercício 1, calcular o r2 bruto e testar a hipótese de que existe influência linear de X em Y, para uma significância de 5%.

1.12 Formas funcionais dos modelos de regressão

Trabalhamos até agora com um modelo linear nos parâmetros e nas variáveis. Entretanto,

alguns modelos de regressão bastante usados não são lineares nas variáveis, mas o são nos parâmetros. Esses modelos podem ser tornados lineares por meio de transformações nas variáveis.

1.12.1 Modelo Log-Linear ou Log-Log Modelo de Regressão Exponencial:

( )iii eXY exp21

ββ= Este modelo pode ser expresso como:

( ) ( ) ( ) iii eXY ++= lnlnln 21 ββ

Se escrevermos ( )1ln βα = , temos o modelo log-linear, que é linear nos parâmetros mas não nas variáveis:

( ) ( ) iii eXY ++= lnln 2βα Se fizermos, ( )ii YY ln* = e ( )ii XX ln* = , teremos o MRLS iii eXY ++= *

2* βα , que pode ser

estimado por MQO. A utilidade desse modelo é que 2β mede a elasticidade de Y em relação a X, isto é, a variação percentual de Y correspondente a variação de 1% em X. Assim, se Y representa a quantidade demandada de um bem e X seu preço unitário, 2β mede a elasticidade preço da demanda. Desenhos: No modelo de 2 variáveis, para verificar se o modelo log-linear se ajusta aos dados, traça-se o diagrama de dispersão de ( )iYln contra ( )iXln e verifica-se se os pontos se aproximam de uma

reta.

1.12.2 Modelos semilogarítmicos Log-Lin e Lin-Log - Modelo Log-Lin Muitas vezes é interessante conhecer a taxa de crescimento de algumas variáveis como população, PNB, etc. Imagine que desejamos conhecer a taxa de crescimento de uma população no período t. Denotemos por tY a população no final do período e 0Y no início do período.

Page 27: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

27

Recordando a fórmula de juros compostos, temos que:

( )tt rYY += 10

Onde r é a taxa de crescimento de Y. Aplicando-se o logaritmo natural nos 2 lados da equação temos que:

( ) ( ) ( )rtYYt ++= 1lnlnln 0 Agora, fazendo ( )01 ln Y=β e ( )r+= 1ln2β , temos:

( ) tYt 21ln ββ += .

Incluindo o termo de erro temos o modelo log-lin: ( ) tt etY ++= 21ln ββ

que pode ser analisado por MQO fazendo-se ( )tt YY ln* = .

Se multiplicarmos 2β por 100 temos a taxa de crescimento de Y. - Modelo Lin-Log: No modelo anterior (Log-lin) queremos conhecer o crescimento percentual de Y para uma variação absoluta em X. O modelo Lin-log serve para conhecermos a variação absoluta em Y para uma variação percentual em X. Assim,

( ) iii eXY ++= ln21 ββ que pode ser analisado por MQO fazendo-se ( )ii XX ln* = .

Dividindo-se 2β por 100 tem-se a variação absoluta de Y dada uma variação de 1% em X. Uma das aplicações deste modelo são os modelos de despesas de Engel, que verificou que “o total de despesas com alimentação tende a aumentar em PA enquanto as despesas totais aumentam em PG”.

1.12.3 Modelos Recíprocos (Inversos) São do tipo:

ii

i eX

Y +

+=

121 ββ

Se fizermos

=

ii X

X1* , podemos utilizar MQO.

Este modelo pode assumir formas como (desenhos):

Page 28: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

28

Como ilustração pode-se pensar em ajustar um modelo onde a variável dependente é mortalidade infantil de vários países, e a variável independente é o PNB per capita de cada um. Espera-se que, quanto maior o PNB per capita, menor a mortalidade, mas esta relação não é uma linha reta. Quando PNB aumenta, no início há uma redução substancial da mortalidade, mas depois a queda ameniza. Uma das aplicações deste modelo é a curva de Phillips, da macroeconomia. Exemplo 14: Na tabela a seguir, tem-se parte de um conjunto de dados que mostra as despesas com serviços por trimestre, no período de 1993 até o 3° trimestre de 1998.

Ano-trimestre t Desp. Serv. (Y) Y*=ln(Y) 1993-I 1 2445,3 7,802 1993-II 2 2455,9 7,806 1993-III 3 2480,0 7,816 1993-IV 4 2494,4 7,822

... ... ... ... 1998-I 21 2829,3 7,948 1998-II 22 2866,8 7,961 1998-III 23 2904,8 7,974

Ajustar um modelo log-lin onde a variável independente é t, e a variável dependente é Y é o mesmo que ajustar um MRLS onde a variável independente é t e a variável dependente é Y*.

Fazendo isso se obtém a equação tYt 00743,07890,7ˆ* += , isso indica que em um período

que vai do 1° trimestre de 1993 até o 3° trimestre de 1998, as despesas com serviços aumentaram a uma taxa trimestral de 0,743%. Exercício 15. Os dados a seguir mostram as despesas com propaganda (X), expressas em percentagem das despesas totais, e o lucro operacional líquido (Y), expresso em percentagem do total de vendas, em uma amostra de seis drogarias.

X Y 1,5 3,6 1,0 2,8 2,8 5,4 0,4 1,9 1,3 2,9 2,0 4,3

a) Ajuste a reta de mínimos quadrados que permita predizer o lucro operacional líquido em termos das despesas com propaganda. b) Calcule o coeficiente de correlação e interprete. c) Qual o grau de ajuste do modelo? Interprete. d) Teste a hipótese nula β2 ≥ 1,6 contra a hipótese β2 < 1,6, ao nível de 0,01 de significância. e) Construa um intervalo de 99% de confiança para β2. f) Construa um intervalo de 90% de confiança para a variância residual. g) Construa um intervalo de 95% de confiança para o lucro operacional líquido médio quando as despesas com propaganda são de 2,5% da despesa total. h) É possível utilizar o modelo ajustado para prever o lucro quando as despesas são da ordem de 5%? Nesse caso, o que se deve observar? i) Ajuste um modelo de regressão que passe pela origem do sistema coordenado e compare os resultados com o primeiro modelo estimado.

Page 29: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

29

2 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM) A teoria econômica raramente é simples a ponto de explicar o comportamento da variável de interesse com base na informação de apenas uma outra variável explicativa. Dessa forma, ampliaremos o que já foi discutido para o caso de mais de uma variável independente. O mais simples caso de regressão múltipla possui três variáveis, sendo duas explicativas e uma resposta, de forma que a FRP do modelo de três variáveis é dada por:

1 2 2 3 3i i i iY X X eβ β β= + + +

Generalizando quando temos k variáveis:

ikikiii eXXXY +++++= ββββ …33221 , com i = 1, 2, ..., n.

Nesse modelo: - As k-1 variáveis explicativas são X2, X3, ..., Xk, e Y é a variável dependente ou explicada; - Os ei são os erros aleatórios (resíduos) que seguem as hipóteses clássicas; - β1 é o intercepto; - Os coeficientes parciais de regressão, desconhecidos, são β2, β3, ..., βk.

2.1 Significado dos parâmetros do modelo

- β1 é o valor médio de Y quando X2 = X3 = ... = Xk = 0 - β2, β3, ..., βk: βi mede a variação de Y, por uma unidade de variação em Xi, mantendo-se as demais variáveis constantes (ceteris paribus).

2.2 Notação matricial do MRLM

A grande vantagem da álgebra matricial sobre a álgebra escalar é que ela oferece um método compacto para lidar com modelos de regressão envolvendo qualquer número de variáveis; uma vez formulado o modelo, a solução se aplica a uma, duas ou qualquer número de variáveis.

Seja a FRP para o modelo de k variáveis. Essa equação é uma expressão abreviada do seguinte conjunto de n equações:

1131321211 eXXXY kk +++++= ββββ …

2232322212 eXXXY kk +++++= ββββ …

...

nknknnn eXXXY +++++= ββββ …33221

Em notação matricial, esse conjunto pode ser escrito como:

� � �eβXY

+

=

nkknn

k

k

n e

e

e

XX

XX

XX

Y

Y

Y

��

��� ���� ���

���

2

1

2

1

2

222

121

2

1

1

1

1

β

β

β

Page 30: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

30

Assim, a FRP sob a forma matricial é então representada por: eXβY +=

onde: Y: é o vetor coluna de dimensão (n x 1) de valores observados; X: é a matriz (n x k) de valores observados para as variáveis explicativas; β : é o vetor (k x 1) de parâmetros desconhecidos; e : representa o vetor (n x 1) de perturbações (erros) aleatórias. Obs: as notações negrito representam formas matriciais.

2.3 Premissas do MRLM

[1]: eXβY += ; [2]: 0)( =eE ;

[3]: nIee 2)'( σ=E , sendo In a matriz identidade de ordem n (hipótese de ausência de heteroscedasticidade ou autocorrelação serial);

)'(eeE é a chamada matriz de variâncias e covariâncias dos resíduos aleatórios. Os elementos na diagonal principal dessa matriz são as variâncias, e os elementos fora da diagonal principal são as covariâncias. [4]: a matriz X é não aleatória, isto é, consiste em um conjunto de números fixos; [5]: a raiz característica, ou posto de X é k < n (hipótese de ausência de multicolinearidade); Isto significa que as colunas da matriz X são linearmente independentes, ou seja, não há uma relação linear exata entre as variáveis X. [6]: para realizarmos inferências, é necessário supor que ( )nIe 2;0~ σN .

2.4 Método dos mínimos quadrados ordinários (MQO)

Seja a FRA de k variáveis:

iiikikiii eYeXXXY ˆˆˆˆˆˆˆ33221 +=+++++= ββββ … ,

que pode ser escrita em notação matricial como:

eYeβXY ˆˆˆˆ +=+= .

Da mesma forma que no modelo de duas variáveis, os estimadores de MQO podem ser obtidos através da minimização da soma dos quadrados dos resíduos, isto é:

( )∑∑ −−−−−=2

332212 ˆˆˆˆˆ kikiiii XXXYe ββββ … .

Em notação matricial, isto equivale a minimizar e'e ˆˆ , pois:

[ ] ∑=+++=

=2222 ˆˆˆˆ

ˆ

ˆ

ˆ

ˆˆˆˆˆin21

n

2

1

n21 eeee

e

e

e

eee …�

�e'e

Page 31: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

31

A aplicação desse método conduz ao vetor de estimadores de mínimos quadrados dos coeficientes de regressão:

( ) YXXXβ ''ˆ 1−=

As matrizes XX' e YX' são dadas por:

=

∑∑∑∑

∑∑∑∑∑∑∑∑∑∑∑

232

323323

232222

32

kikiikiiki

kiiiiii

kiiiiii

kiii

XXXXXX

XXXXXX

XXXXXX

XXXn

����

XX' e

=

∑∑∑

iki

ii

ii

i

YX

YX

YX

Y

3

2

'YX .

Obs: Métodos para inverter uma matriz 1) Cofatores Queremos determinar a inversa da matriz A, ou seja, A-1. Para isso devemos fazer:

1. Achar o det(A);

2. Obter a matriz de cofatores C, lembrando que: ( ) ijji

ij Mc +−= 1 , onde Mij é o menor do

elemento da linha i e coluna j, obtido suprimindo-se a linha i e coluna j. 3. Fazer a transposta da matriz de cofatores, C’; 4. Dividir cada elemento de C’ por det(A).

Em resumo: 'Cdet(A)

1A 1 =− .

2) Escalonamento Escreve-se a matriz identidade do lado da matriz que se quer inverter. Fazem-se operações lineares nas linhas até que a primeira matriz se torne a identidade.

2.4.1 Variâncias dos estimadores de MQO Demonstra-se que

( ) ( ) 12ˆ −= XX'β σVar ,

que é a matriz de variâncias e covariâncias dos estimadores de MQO, que só e conhecida se 2σ for conhecido. Entretanto, a variância residual pode ser estimada por:

knkn −

−=

−=

YX'βYY'e'e ˆˆˆˆ 2σ ,

onde ∑= 2iYYY' .

Assim, as variâncias estimadas dos estimadores de MQO são:

iiai

22ˆ ˆˆ σσ

β= ,

onde iia é o elemento da linha i, coluna i, da matriz ( ) 1−XX' .

Demonstra-se que o vetor β é um estimador linear, não-tendencioso e de variância mínima.

Page 32: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

32

Exemplo 1. Uma empresa de tele-entrega quer estimar o tempo que seus funcionários devem levar até que retornem com uma lista de tarefas concluída. Assim, coletou o tempo de viagem (Y), a quantidade de km percorridos (X2) e o número de entregas (X3) de cinco de seus moto-boys. Com os dados a seguir, estime o modelo de regressão linear múltipla, bem como os erros-padrão dos estimadores.

i Y X2 X3 Y² X2² X3² X2Y X3Y X2X3 1 9,3 100 4 2 4,8 50 3 3 8,9 100 4 4 6,5 100 2 5 4,2 50 2

Total

Page 33: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

33

Exercício 1. Seja a amostra abaixo. Estime o MRLM de três variáveis, bem como as variâncias e erros-padrão dos estimadores.

Y X2 X3 5 1 1 6 2 1 7 3 2 8 4 2 8 5 2

2.5 Coeficiente múltiplo de determinação: R2

No modelo de k variáveis, o coeficiente de determinação mede a proporção da variação em Y explicada conjuntamente por todas as variáveis X. Assim, no MRLM o coeficiente múltiplo de determinação R2 é definido como:

SQT

SQR

nSQT

SQE

n

nR −=

−−==

−= 1

'1

'

''22

2^

2

YYY

ee'

YYY

YYXβ

Obs.: No modelo de duas variáveis definimos o coeficiente de correlação (r) como uma medida do grau da relação entre as variáveis. No caso de três ou mais variáveis, há um coeficiente análogo, o

coeficiente de correlação múltipla ( 2RR = ), que mede a associação entre Y e todas as variáveis explanatórias em conjunto. Embora r possa ser positivo ou negativo, R sempre será positivo (pois nem todas as variáveis explicativas podem ter relação no mesmo sentido com a variável resposta). Na prática, porém, R tem pouca importância. A quantidade mais significativa é R2.

2.6 Coeficiente múltiplo de determinação ajustado: 2R

Uma propriedade importante do R2 é que ele é uma função não-decrescente do número de variáveis explicativas. O R2 quase invariavelmente aumenta e nunca diminui quando o número de regressores aumenta.

Em vista disto, ao comparar dois modelos de regressão com a mesma variável dependente, mas com número diferente de variáveis X, deveríamos escolher o modelo com o R² mais alto. Para comparar dois termos R², é preciso levar em conta o número de variáveis X presentes no modelo. Isto pode ser feito se considerarmos o coeficiente múltiplo de determinação ajustado, que é dado por:

( )kn

nR

n

SQTkn

SQR

R−

−−−=

−−=1

11

1

1 22

O 2R pode ser negativo, e neste caso, na prática, seu valor será tomado como zero.

Obs.: o 2R , não é a única forma de correção do R2 e nem a única medida para julgar a adequação de um modelo de regressão, outras medidas conhecidas são o R2 Modificado, o critério de Informação de Akaike e os critérios de Predição de Amemiya.

Page 34: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

34

Exemplo 2. Cálculo do R2, 2R para os dados do Exemplo 1.

Exercício 2. Cálculo do R2, 2R para os dados do Exercício 1.

2.7 Coeficiente de correlação parcial

Na regressão linear múltipla, podemos ter um coeficiente de correlação para cada par de variáveis do modelo. Por exemplo, no modelo de três variáveis, têm-se r12, r13 e r23. Esses coeficientes são denominados de coeficientes de correlação simples, ou de ordem zero. Eles podem ser calculados conforme a fórmula:

( )( )

( ) ( ) ]][[222222

∑∑∑∑∑∑∑

∑∑∑

−−

−==

YYnXXn

YXXYn

yx

xyr

Seja o coeficiente r12. Ele não refletirá o verdadeiro grau de associação entre Y e X2 na presença de X3, pelo fato que X3 provavelmente influencia em Y e X2. Para obter um coeficiente de correlação que reflita o verdadeiro grau da relação entre duas variáveis na presença das demais, é necessário manter a influência das demais variáveis constante. Assim, no modelo com três variáveis, denota-se:

r12.3: coeficiente de correlação parcial entre Y e X2, mantendo X3 constante; r13.2: coeficiente de correlação parcial entre Y e X3, mantendo X2 constante; r23.1: coeficiente de correlação parcial entre X2 e X3 mantendo Y constante.

As fórmulas de cálculo são:

( )( )223

213

2313123.12

11 rr

rrrr

−−

−= ;

( )( )13 12 23

13.22 2

12 231 1

r r rr

r r

−=

− − e

( )( )213

212

1312231.23

11 rr

rrrr

−−

−=

r12.3, r12.3 e r12.3 são os coeficientes de primeira ordem. Se houvessem mais variáveis no modelo, ocorreriam também coeficientes de correlação de segunda ordem (r12.34), terceira ordem (r12.345) e assim por diante.

Page 35: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

35

2.8 Coeficiente de determinação parcial

Os coeficientes de determinação parciais expressam o grau de explicação que cada variável

exerce sobre as demais, mantendo constante todos os outros fatores, ou seja: 2

3.12r : o coeficiente de determinação parcial entre Y e X2 é a proporção da variação em Y não

explicada pela variável X3 que foi explicada pela inclusão de X2 no modelo. Os coeficientes de determinação parciais são obtidos simplesmente tomando-se o quadrado

dos coeficientes de correlação parciais correspondentes. Existe as seguintes relações entre esses coeficientes e R²:

223

2313122

132

122

1

2

r

rrrrrR

−+=

( ) 22.13

212

212

2 1 rrrR −+=

( ) 23.12

213

213

2 1 rrrR −+=

Então, 212

2 rR > desde que 022.13 >r . Ou seja, R2 sempre cresce com a inclusão de uma nova

variável, a menos que 022.13 =r , onde teríamos 2

122 rR = .

Exemplo 3. Dados r12 = 0,8822, r13 = 0,8089 e r23 = 0,4564 para o Exemplo 1, calcular e interpretar os coeficientes de determinação parciais. Exercício 3. Ao se ajustar um modelo de três variáveis, encontrou-se r12 = 0,3048, r13 = 0,1391 e r23=-0,7043. Calcule e interprete os coeficientes de determinação parciais.

2.9 Intervalo de confiança e teste de significância individual para os coeficientes

de regressão

Para podermos realizar inferências, supomos que ( )nIe 2;0~ σN . Isso implica que, sob as

hipóteses clássicas, β tem distribuição normal multivariada, isto é:

( )( )12;~ˆ −XX'ββ σN

Page 36: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

36

E cada iβ tem distribuição marginal também normal:

( )iiii aσ;β~Nβ 2ˆ

com aii sendo o elemento da i-ésima linha e i-ésima coluna de (X’X)-1. Sendo 2σ desconhecido, tem-se que:

( )knii tt

i

−= ~

ˆ

ˆ

ˆ

*

βσ

ββ

com iiaσi

22ˆˆ =

βσ e iiaσ

i

2ˆˆ =

βσ .

Assim, o intervalo de confiança para cada coeficiente de regressão é dado por:

( )

±−×

− iknii tparaIC

βα σββα ˆ

2;

ˆˆ:%1100

Além disso, utilizamos o procedimento idêntico do teste de hipóteses para o modelo de duas variáveis para testar a significância individual dos coeficientes. Por exemplo, seja o modelo de 3 variáveis. Poderia ser interessante testar as hipóteses

=

0:

0:

21

20

β

β

H

H

. Neste caso, estaríamos avaliando se X2 tem alguma influência linear sobre Y, mantendo-se X3 constante. A tabela abaixo nos dá a área de rejeição de cada teste:

Tipo de hipótese H0 H1 Decisão: rejeitar H0 se Bicaudal *

0 : iiH ββ = *1 : iiH ββ ≠

2;αkntt

−>

Cauda direita *0 : iiH ββ ≤ *

1 : iiH ββ > α;kntt −>

Cauda esquerda *0 : iiH ββ ≥ *

1 : iiH ββ < α;kntt −−<

2.10 Intervalo de confiança para a variância residual

Na regressão múltipla, sabe-se que

( )( )kn

kn−

− 22

2

χσ

σ.

Assim, o intervalo de confiança para a variância residual é:

( ) ( ) ( )

−−−×

−−−

2

21;

2

2

2;

22 ˆ

:%1100αα χ

σ

χ

σσα

knkn

knknparaIC .

Exemplo 4. Teste se os coeficientes do modelo de regressão estimado no Exemplo 1 são significativamente diferentes de zero, para um nível de significância de 5%. Além disso, construa os intervalos de 95% de confiança para os coeficientes de regressão e para a variância residual.

Page 37: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

37

Exercício 4. a) Teste se os coeficientes do modelo de regressão estimado no Exercício 1 são significativamente diferentes de zero, para um nível de significância de 5%. b) Construa um IC de 90% para o coeficiente de X2 e teste se ele é diferente de 1. c) Teste, a 5% de significância, se o intercepto é maior que 2.

2.11 Teste da significância geral da regressão (ANOVA)

No teste individual, trabalhamos separadamente com a hipótese de que cada verdadeiro

coeficiente parcial de regressão era zero. Mas vejamos agora a seguinte hipótese: 0: 320 ==== kH βββ …

Esta hipótese não pode ser testada fazendo-se um teste de significância para cada coeficiente parcial. Isto porque, se para cada teste adotamos um nível de significância α (probabilidade de erro tipo I), a probabilidade de erro tipo I de todos os testes simultaneamente é maior que α . Entretanto, através da ANOVA, podemos testar as hipóteses abaixo de uma única vez:

====

.:

0:

1

320

zerodediferenteédosummenosaoH

H

i

k

β

βββ …

A tabela de ANOVA para o modelo de k variáveis é:

CV GL SQ QM F

Regressão k-1 2^

'' Yn−YXβ 1−k

SQE

QMR

QME

Resíduos n-k YXβYY '''^

− kn

SQR

Total n-1 2' Yn−YY

Demonstra-se que a estatística F segue distribuição F de Snedecor com k-1 g.l. no numerador e n-k g.l. no denominador, ou seja:

F ~ F(k-1;n-k) Regra de decisão: Se ( )knkFF −−> ;1;α , rejeita-se H0, caso contrário não se rejeita.

Pode-se reescrever a tabela de ANOVA em termos do coeficiente múltiplo de determinação, R²:

CV GL SQ QM F

Regressão k-1 ( )22 ' YnR −YY 1−k

SQE

( )( )( )2

2

11 Rk

Rkn

−−

Resíduos n-k ( )( )22 '1 YnR −− YY kn

SQR

Total n-1 2' Yn−YY

Page 38: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

38

Novamente, a ANOVA serve para testar também as hipóteses: 2

0

21

: 0

: 0

H

H

ρ

ρ

=

≠ onde 2ρ é o coeficiente múltiplo de determinação populacional. Exemplo 5. Construir a ANOVA, estabelecer as hipóteses e proceder ao teste F, a 5% de significância, para os dados do Exemplo 1. Exercício 5. Construir a ANOVA, estabelecer as hipóteses e proceder ao teste F, a 5% de significância, para os dados do Exercício 1.

Page 39: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

39

2.12 Contribuição marginal ou incremental de uma variável explicativa

Seja um modelo de três variáveis. Imagine que façamos a inclusão seqüencial de X2 e X3,

isto é, primeiro fazemos a regressão entre Y e X2 e avaliamos sua significância e então acrescentamos X3 ao modelo para verificar se este contribui com algo (obviamente, a ordem de entrada pode ser invertida). Com contribuição, queremos dizer que desejamos saber se a inclusão da variável no modelo aumenta a SQE (e, por conseqüência, R²) “significativamente” em relação à SQR. Essa é a contribuição marginal ou incremental de uma variável explicativa.

A questão da contribuição marginal é importante na prática. Na maioria das pesquisas, o pesquisador pode não estar totalmente convencido de que valha a pena acrescentar uma variável X ao modelo sabendo que várias outras variáveis X já estão presentes no modelo. Não se quer incluir variáveis que contribuam muito pouco para a SQE. Contudo, também não se quer excluir variáveis que aumentem substancialmente a SQE. Mas como decidir se uma variável X reduz significativamente a SQR? A técnica da ANOVA pode ser empregada para responder essa pergunta.

Primeiramente, fazemos a regressão entre Y e X2, produzindo a tabela de ANOVA abaixo:

CV GL SQ QM Regressão (devido a X2) 1 Q1=SQE QME

Resíduos n-2 SQR QMR Total n-1 SQT

Após, acrescentamos X3, e produzimos outra tabela de ANOVA:

CV GL SQ QM Regressão (devido a X2 e X3) 2 Q3=SQE QME

Resíduos n-3 Q4=SQR QMR Total n-1 Q5=SQT

Combinando estas duas tabelas, obtemos:

CV GL SQ QM F Regressão (devido a X2) 1 Q1 Q1 /1 Regressão (devido a X3) 1 Q2 = Q3 – Q1 Q2 /1 (n-3)Q2 /Q4

Regressão (devido a X2 e X3) 2 Q3 Q3 /2 Resíduos n-3 Q4 = Q5 – Q3 Q4 /(n-3)

Total n-1 Q5 A estatística F segue distribuição F com “1” e “n-3” graus de liberdade. Se seu valor for

maior que ( )3;1; −nFα , concluímos que o acréscimo de X3 ao modelo aumenta significativamente a

SQE, e portanto, R². Assim, deve-se acrescentar X3 ao modelo. Este teste também poderia ser reformulado em termos dos valores R²:

( )( ) ( )modelonovodoparâmetrosdennR

sregressorenovosdenRRF

novo

velhonovo

°−−

°−=

2

22

1.

Observação: o mesmo procedimento poderia ser usado para testar a adição de um grupo de variáveis simultaneamente, com as devidas correções dos graus de liberdade.

Page 40: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

40

Exemplo 6. Para se estudar o comportamento do consumo pessoal nos EUA em certo período, observou-se as variáveis despesa de consumo pessoal (Y), renda pessoal disponível (X2) e tempo medido em anos (X3). Observou-se 15 anos (1956 a 1970). Primeiramente, regrediu-se Y contra X2, obtendo-se os seguintes resultados:

( ) ( )

9977,0²9978,0²

2982,777259,2

8812,0762,12ˆ2

==

=

+=

RR

t

XY ii

CV GL SQ QM F

Regressão 1 65898,2353 65898,2353 5947,494 Resíduos 13 144,0340 11,0800

Total 14 66042,2693 Ao se incluir X3 no modelo, obteve-se:

( ) ( ) ( )

9986,0²9988,0²

2246,39060,140811,4

7363,27266,01603,53ˆ32

==

=

++=

RR

t

XXY iii

CV GL SQ QM F

Regressão 2 65965,1000 32982,5500 5129,319 Resíduos 12 77,1693 6,4302

Total 14 66042,2693

Testar se vale a pena acrescentar X3 ao modelo, para 5% de nível de significância.

Page 41: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

41

Exemplo 7. Seja um conjunto de dados com 20 observações e 3 variáveis independentes (X2, X3 e X4). Em um primeiro momento, ajustou-se a regressão entre Y e X2, obtendo-se R² = 0,7111. Após, ajustou-se o modelo com todas as variáveis independentes, obtendo-se R² = 0,8013. Testar se o acréscimo de X3 e X4 aumentou significativamente a SQE, a 5%. Exercício 6. Com os dados do Exemplo 1, construa a tabela ANOVA para analisar se a inclusão de variável X3 na regressão que já possui X2 é significativa a 5% e interprete o resultado.

2.13 Previsão no MRLM

No contexto de previsão de valores da variável dependente, temos novamente 2 tipos de

previsão: média e individual. Dado o vetor de valores das variáveis X para os quais queremos prever Y:

[ ]kXXX 00302'0 1 …=X ,

desejamos prever

kk XXXY 003302210ˆˆˆˆˆ ββββ ++++= …

que, na forma matricial, é o mesmo que

βX'0ˆ

0 =Y .

Este é o valor estimado para Y tanto na previsão média como individual. A diferença está

nas variâncias para os dois tipos de previsão:

Previsão da média: ( ) 00 XXXX 1'22 'ˆˆ −= σσ m

Previsão individual: ( )[ ]00 XXXX 1'22 '1ˆˆ −+= σσ i

Conseqüentemente, os intervalos de confiança para essas previsões, são:

IC para previsão média: ( ) ( )

±=−×

−m

kntYXXYEparaIC σα α ˆˆ:|%1100

2;

00

IC para previsão individual: ( )

±=−×

−i

kntYXXYparaIC σα α ˆˆ:|%1100

2;

00

Page 42: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

42

Exemplo 8. No Exemplo 1, a empresa quer saber quanto tempo deveria esperar em média para que um moto-boy retorne de uma tarefa com 3 entregas e 80km a percorrer. Calcule o IC 99% para E(Y|X=X0). Exercício 7. Para o Exemplo 1, construa um intervalo com 95% de confiança para o tempo médio que a empresa deve esperar no caso de um moto-boy sair com 4 entregas e 70km a percorrer.

2.14 Modelo de regressão polinomial

Suponha que desejamos relacionar custo marginal de produção (Y) com quantidade

produzida (X). Poderíamos ajustar uma parábola a esta relação, como abaixo:

O modelo que expressa essa relação é dado por:

iiii eXXY +++= 2210 βββ ,

que é a regressão polinomial de 2° grau, e pode ser ajustada normalmente por MQO. A forma geral da regressão polinomial de k-ésimo grau é:

ikikiii eXXXY +++++= ββββ …2

210

Page 43: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

43

2.15 Variáveis Dummies

Na análise de regressão, a variável dependente, que é de natureza quantitativa, é

influenciada por variáveis independentes quantitativas, mas também por outras que são de natureza qualitativa, ou nominal, como sexo, raça, cor, religião, nacionalidade, região geográfica, etc. Uma maneira de inserir essas variáveis no modelo de regressão é através das variáveis dummies.

As variáveis dummies são também chamadas de variáveis indicadoras, binárias, categóricas, qualitativas ou dicotômicas, e seus valores são geralmente codificados como 0 e 1.

2.15.1 Regressão somente com variáveis dummies (Modelos ANOVA) Um modelo de regressão pode conter regressores que sejam de natureza exclusivamente

binária. Como um exemplo, considere o seguinte modelo:

iii eDY ++= 221 ββ

Onde: Y: salário anual de um professor universitário;

=femininosexodose

masculinosexodoseD i ,0

,12

Este modelo nos permite saber se o sexo faz alguma diferença no salário dos professores

universitários, obviamente desconsiderando a influência de variáveis como idade, cursos de pós-graduação e anos de experiência. Fazendo as suposições clássicas sobre os resíduos, obtém-se que:

Salário médio professora: ( ) 12 0| β==ii DYE

Salário médio professor: ( ) 212 1| ββ +==ii DYE

O coeficiente 2β será a diferença de salário dos homens em relação às mulheres, por isso é chamado de coeficiente diferencial de intercepto, e o teste para verificar se há diferença nos salários médios para homens e mulheres é:

=

0:

0:

21

20

β

β

H

H

que pode ser verificado pelo teste t usual. Exemplo 9. Sejam os dados hipotéticos dos salários de 10 professores universitários, e o sexo de cada um.

Y D Y² D² YD 22 1 484 1 22 19 0 361 0 0 18 0 324 0 0

21,7 1 470,89 1 21,7 18,5 0 342,25 0 0 21 1 441 1 21

20,5 1 420,25 1 20,5 17 0 289 0 0

17,5 0 306,25 0 0 21,2 1 449,44 1 21,2 196,4 5 3888,08 5 106,4

Page 44: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

44

Estimar o modelo, e testar se existe diferença nos salários médios entre os sexos, a 5%. Para se inserir uma variável qualitativa com mais de duas categorias, deve-se criar mais de uma variável dummy. Por exemplo, suponha que se queira verificar se existe diferença entre os salários dos professores segundo o nível de pós-graduação (mestrado, doutorado e pós-doutorado). O modelo seria:

iiii eDDY +++= 33221 βββ

Onde: Y: salário anual de um professor universitário;

=..,0

,12 cc

doutoradoseD i e

=..,0

,13 cc

doutoradopósseD i

Observe que assim, a categoria “mestrado” já está expressa nas duas variáveis dummies, sendo que o valor correspondente a essa categoria é o par (0,0), por isso ela é chamada de categoria de referência.

Page 45: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

45

Observações no uso de variáveis dummies: - Se uma variável qualitativa tem m categorias, devemos introduzir no modelo m – 1 variáveis dummies; - A categoria para o qual não se designa uma variável binária é a categoria de referência e todas as comparações são feitas em relação a ela; - O valor do intercepto é o valor médio da categoria de referência; - Os coeficientes angulares, chamados de coeficientes diferencias de intercepto, dão a diferença da categoria que recebe valor 1 em relação a variável binária; - A categoria de referência é arbitrária ao pesquisador, deve-se estar atento na hora das interpretações. Também se pode ter mais de uma variável qualitativa no mesmo modelo. Exemplo 10. A partir de uma amostra de 528 americanos, foi calculada uma regressão com os seguintes resultados.

0006,00182,00000,0

4462,33688,29528,21

4854,04642,04015,0

6729,10997,18148,8ˆ32

=

−=

=

−+=

p

t

ep

DDY iii

Onde Y=salário-hora em $;

=..,0

,12 cc

casadoseD i e

=..,0

,13 cc

SulnomoraseD i . Interpretar os resultados.

2.15.2 Regressão com variáveis quantitativas e dummies (Modelos ANCOVA) De modo geral, na maioria dos estudos econômicos, um modelo de regressão contém

algumas variáveis explanatórias quantitativas e outras qualitativas. Ainda considerando o exemplo dos salários dos professores universitários, suponha que temos também uma variável quantitativa. Assim: Y: salário anual de um professor universitário; X: anos de experiência;

=femininosexodose

masculinosexodoseDi ,0

,1.

Page 46: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

46

2

1,

0,i

mulherD

homem

=

3

1,

0, .i

ensino superiorD

c c

=

Queremos investigar um modelo de regressão do tipo:

iiii eXDY +++= 321 βββ

Nesse caso, temos o salário médio de professores de ambos os sexos são: Salário médio professora: ( ) iiii XDXYE 310,| ββ +==

Salário médio professor: ( ) ( ) iiii XDXYE 3211,| βββ ++==

Graficamente: Exemplo 11. Suponha que você gostaria de regredir despesas anuais com saúde (Y), renda anual (X) e nível de escolaridade (fundamental, médio e superior). Como seria o modelo? Faça o gráfico.

2.15.3 Efeitos de interação com o uso de variáveis binárias Considere o problema a seguir, onde possuímos uma variável quantitativa e duas

qualitativas binárias:

iiiii eXDDY ++++= βααα 33221

Y: despesa anual com roupas; X: renda anual; Neste modelo, está implícita a premissa de que o efeito diferencial da variável binária sexo é

constante nas duas categorias de escolaridade e que o efeito diferencial da variável binária escolaridade também é constante entre os dois sexos. Ou seja, se o gasto anual com roupas é maior para mulheres que para homens, isso ocorre sejam elas graduados ou não. Do mesmo modo, se pessoas com ensino superior gastam mais com roupas que as que não possuem, isso se verificará tanto para homens quanto para as mulheres.

Page 47: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

47

Em muitas aplicações, premissas desse tipo são insustentáveis. Uma mulher graduada pode gastar mais com roupas que um homem graduado. Em outras palavras, pode haver uma interação entre as duas variáveis qualitativas. Portanto, seu efeito sobre Y pode não ser apenas aditivo, como no modelo acima, mas também multiplicativo, como no modelo a seguir:

Nesse caso, o modelo com a interação das variáveis qualitativas é representado por:

iiiiiii eXDDDDY +++++= βαααα 32433221

onde,

2α : efeito diferencial de ser mulher;

3α : efeito diferencial de ter nível superior;

4α : efeito diferencial de ser mulher com nível superior. Exemplo 12. Regrediu-se salários-hora (Y), contra anos de escolaridade (X), sexo (D2, 1 se mulher) e raça (D3, 1 se não branco e não hispânico), para 528 americanos. Os resultados estão abaixo:

05,0)08,0(05,005,005,005,0

8028,01289,27327,13606,226100,0ˆ3232

<≅><<>=

++−−−=

p

XDDDDY iiiiii

Fazer o gráfico e interpretar os resultados. Observação: Neste exemplo, estamos supondo que a taxa de aumento dos salários-hora em relação à escolaridade (de cerca de 80 centavos de dólar por ano adicional de escolaridade) não varia com o gênero e raça. Mas pode ser que não seja este o caso. Para testar isso, pode-se incluir coeficientes diferenciais angulares:

iiiiiiiiiii eXDXDXDDDDY +++++++= 3322132433221 βββαααα

Page 48: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

48

2.15.4 O emprego de variáveis binárias em análises sazonais Muitos dados econômicos são formados a partir de dados mensais ou trimestrais que

apresentam padrões sazonais (movimentos oscilatórios regulares). Exemplos disso são as vendas das lojas no Natal e em outras épocas, a demanda por passagem aéreas, etc. Através das variáveis binárias, podemos inserir essa informação no modelo. Exemplo 13. Estudaram-se as vendas trimestrais de geladeiras (Y), em milhares de unidades, no período de 1978 a 1995 nos EUA. Também se observou, em cada trimestre, os gastos com bens duráveis (X), em bilhões de dólares. Ajustou-se o seguinte modelo:

05,005,005,005,005,0

7734,20804,862643,3254976,2422440,456ˆ432

<><<<=

+−++=

p

XDDDY iiiii

onde

=contráriocaso

jtrimestreseD j ,0

,1. Interpretar os resultados.

2.15.5 Modelos Log-Lin e Variáveis Dummies Já estudamos o modelo log-lin, que são aqueles em que a variável dependente é o logaritmo natural de Y, e as variáveis independentes estão em suas escalas naturais. Nestes modelos, os coeficientes angulares das variáveis independentes, após serem multiplicados por 100, são interpretados como variação percentual de Y para uma variação de uma unidade de X. Pode-se inserir variáveis independentes dummies nestes modelos, entretanto, a interpretação dos coeficientes angulares destas variáveis não é a mesma. Para se obter a variação percentual de Y devida a mudança de categorias na variável dummy, deve-se calcular ( )100 exp( ) 1β − , onde β é o

coeficiente angular da variável dummy. Exemplo 14. A certo conjunto de dados ajustou-se o modelo de regressão linear múltipla:

ln( ) 2,9298 0,0546 0,1341Y X D= + + t = (481,524) (48,3356) (27,2250) n = 15

onde Y é o salário inicial de professores universitários, X são os anos de experiência, e D é uma variável indicadora do sexo (D = 1 se homem). Mantendo-se D constante, o salário dos professores cresce 5,46% a cada ano a mais de experiência. Mas não se pode dizer que mantendo X constante, o salário é 13,41% maior para homens em relação a mulheres. Fazendo-se ( )100 exp(0,1341) 1 14,35%− = , ou seja, o salário dos

professores é 14,35% maior do que o salário das professoras.

Page 49: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

49

Exercício 8: (ANPEC – 2003) O método dos mínimos quadrados ordinários foi empregado para estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda entre 526 indivíduos:

,526,441,0

,00058,0029,0080,0297,0417,0)log(

2

2

)00010,0()005,0()007,0()036,0()099,0(

==

+−++−=

nR

uexperexpereducsexorenda

em que sexo é uma variável dicotômica (valor 1, se for homem e 0, caso contrário), educ é o número de anos de escolaridade, exper é experiência profissional, também medida em anos. Os números entre parênteses são os erros-padrão das estimativas )4.,,.,..1,0( =is

ib . Com base nos

resultados acima, responda V ou F. a) um ano a mais de escolaridade, mantidos constantes todos os demais fatores, aumenta em 0,08% a renda de um indivíduo; b) a significância conjunta das variáveis educ e exper não pode ser medida por meio da estatística t. Para isto, o teste F deve ser utilizado; c) o modelo é incapaz de captar diferenças nos retornos da educação entre homens e mulheres; d) a renda dos homens é 29,7% menor que a renda das mulheres.

Page 50: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

50

3 VIOLAÇÕES DAS PREMISSAS DO MODELO DE REGRESSÃO

3.1 Não-normalidade dos resíduos

Vimos que os testes de hipóteses e intervalos de confiança que estudamos somente podem

ser aplicados supondo-se normalidade aos resíduos. Entretanto, essa suposição deve ser verificada, para se avaliar se essas técnicas de inferência podem ser realmente aplicadas ou não.

3.1.1 Detecção

Para fazer a verificação da normalidade dos resíduos, três técnicas são mais conhecidas: histograma dos resíduos, gráfico de probabilidade normal e testes não-paramétricos. - Histograma dos resíduos: Trata-se de um simples gráfico que é usado para conhecer algo da forma da função de densidade de probabilidade de uma variável aleatória. No eixo horizontal, dividimos os valores da variável (no caso, dos resíduos) em intervalos adequados e, em cada um, traçamos retângulos cuja altura é dada pelo número de observações (isto é, sua freqüência) nesse intervalo de classe. A partir desse gráfico, devemos tentar verificar se a forma de sino na Normal se aproxima da forma encontrada no histograma. Exemplos de histogramas gerados pelo SPSS:

6,00000000004,00000000002,00000000000,0000000000

resid1

100

80

60

40

20

0

Fre

qu

en

cy

7,00000000006,00000000005,00000000004,00000000003,00000000002,00000000001,00000000000,0000000000

resid2

200

150

100

50

0

Fre

qu

en

cy

- Gráfico de probabilidade normal: No eixo horizontal, marcamos os valores da variável que nos interessam (no caso, os resíduos) e no eixo vertical representamos o valor esperado para essa variável caso ela fosse normalmente distribuída (no Excel é o contrário). Se a variável for, de fato, normalmente distribuída, o gráfico tomará a forma de uma reta.

Page 51: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

51

Exemplos de gráficos de probabilidade normal gerados pelo SPSS:

1,00,80,60,40,20,0

Observed Cum Prob

1,0

0,8

0,6

0,4

0,2

0,0

Ex

pe

cte

d C

um

Pro

b

Normal P-P Plot of resid1

1,00,80,60,40,20,0

Observed Cum Prob

1,0

0,8

0,6

0,4

0,2

0,0

Exp

ecte

d C

um

Pro

b

Normal P-P Plot of resid2

Exemplo de gráfico de probabilidade normal gerado pelo Excel:

Plotagem de probabilidade normal

15

17

19

21

23

25

27

29

31

0 20 40 60 80 100

Percentil da amostra

Y

- Testes não-paramétricos: Existem vários testes utilizados para verificar se um conjunto de dados é normalmente distribuído, e estão disponíveis na maioria dos softwares estatísticos. Alguns deles são: Anderson-Darlin, Qui-quadrado, Jarque-Bera e Kolmogorov-Smirnov. A hipótese nula desses testes é que os dados provêm de uma distribuição normal, contra a alternativa de que os dados não provêm de uma distribuição normal. Ao pedir esses testes no software, devemos observar se o valor-p é menor que o nível de significância adotado. Se for, a suposição de normalidade não está satisfeita.

Page 52: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

52

Exemplo do teste Kolmogorov-Smirnov no SPSS:

One-Sample Kolmogorov-Smirnov Test

resid1 resid2

N 103 103

Mean 2,937384659921 1,048518670813 Normal Parameters(a,b)

Std. Deviation 1,0099431827460 ,9817551636487

Absolute ,057 ,189

Positive ,057 ,189

Most Extreme Differences

Negative -,036 -,146

Kolmogorov-Smirnov Z ,577 1,917

Asymp. Sig. (2-tailed) ,894 ,001

a Test distribution is Normal. b Calculated from data.

3.1.2 Conseqüências

Já vimos que a premissa de normalidade não é essencial se o objetivo for apenas estimar o modelo. Além disso, demonstra-se que os estimadores de MQO são os melhores estimadores lineares não tendenciosos quer os resíduos sejam normais quer não.

Entretanto, se os resíduos não forem normais, os testes e intervalos de confiança baseados nas distribuições t, F e Qui-quadrado serão inválidos.

3.1.3 Medidas corretivas Demonstra-se que, mesmo se os resíduos não forem normais, mas forem homocedásticos, os estimadores de MQO seguem distribuição assintoticamente normal. Ou seja, se a amostra for grande, os habituais procedimentos de inferência ainda são válidos. Infelizmente, não se tem um consenso sobre quão grande uma amostra deve ser para que a normalidade assintótica seja válida. Alguns autores consideram n = 30 como sendo um tamanho de amostra mínimo satisfatório. Quando não se pode aumentar o tamanho da amostra, existe o recurso de proceder transformações na variável Y, como tomar o logaritmo ou a raiz quadrada de Y. Exemplo 1. Procedeu-se um estudo sobre gastos com pesquisa e desenvolvimento (PD) e as vendas (V) de 18 setores industriais dos EUA. Ajustou-se o modelo eVPD ++= 21 ββ no Excel, os resultados estão abaixo.

Estatística de regressão

R-Quadrado 0,478303

R-quadrado ajustado 0,445697

Erro padrão 2759,153

Observações 18

ANOVA

gl SQ MQ F F de significação

Regressão 1 1,12E+08 1,12E+08 14,66916 0,001476

Resíduo 16 1,22E+08 7612927

Total 17 2,33E+08

Page 53: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

53

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 192,9931 990,9858 0,194749 0,848041 -1907,8 2293,789

VENDAS 0,0319 0,008329 3,830033 0,001476 0,014244 0,049557

Teste de Kolmogorov-Smirnov:

valor-p = 0,286

Ajustou-se também o modelo ( ) eVPD ++= 21ln ββ , obtendo-se os seguintes resultados:

Estatística de regressão

R-Quadrado 0,540983

R-quadrado ajustado 0,512295

Erro padrão 1,121648

Observações 18

ANOVA

gl SQ MQ F F de significação

Regressão 1 23,72403 23,72403 18,85711 0,000504

Resíduo 16 20,12951 1,258094

Total 17 43,85353

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 5,790005 0,402854 14,37245 1,45E-10 4,935991 6,644018

VENDAS 1,47E-05 3,39E-06 4,342478 0,000504 7,53E-06 2,19E-05

Teste de Kolmogorov-Smirnov: valor-p = 0,898

Plotagem de probabilidade normal

0

2000

4000

6000

8000

10000

12000

14000

0 20 40 60 80 100 120

Percentil da amostra

PD

Plotagem de probabilidade normal

0

2

4

6

8

10

0 20 40 60 80 100 120

Percentil da amostra

LN

(PD

)

Page 54: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

54

3.2 Multicolinearidade

Uma das premissas do modelo de regressão é que: “não existe multicolinearidade perfeita,

ou seja, não há relações lineares perfeitas entre as variáveis explicativas”. No caso da regressão com k variáveis envolvendo as variáveis explanatórias kXXX ,,, 21 … (onde 11 =X para todas as

observações a fim de levar em conta o intercepto), diz-se que existe uma relação linear exata se a seguinte condição for atendida:

02211 =+++ kk XXX λλλ … ,

onde os iλ são constantes tais que nem todas são zero simultaneamente.

Entretanto, a multicolinearidade não ocorre apenas com relações perfeitas, e também ocorre quando as variáveis X são intercorrelacionadas, mas de um modo menos que perfeito, como a seguir:

02211 =++++ ikk XXX υλλλ … , onde iυ é um erro aleatório.

Assim, suponha que a variável X2 possa ser expressa com um alto grau de explicação por uma composição linear das demais variáveis, nesse caso teríamos:

ikikii

i

XXXX υ

λλ

λ

λ

λ

λ

λ

222

33

2

112

1−−−−= …

O que é o mesmo que regredir X2 sobre as demais variáveis na forma:

ikikiii uXXXX +++++= αααα …331212 .

Como exemplo numérico, vejamos os seguintes dados hipotéticos:

X2 X3 X4

10 50 52

15 75 75

18 90 97

24 120 129

30 150 152

Observe que ii XX 23 5= , portanto há colinearidade perfeita entre essas duas variáveis, e

neste caso o coeficiente de correlação é igual a 1. A variável X4 foi criada a partir de X3 simplesmente somando a ele os seguintes números: 2, 0, 7, 9, 2. Assim, não há colinearidade perfeita entre X2 e X4, mas essas duas variáveis estão estreitamente relacionadas já que o coeficiente de correlação entre elas é 0,9959.

Em modelos de regressão do tipo ikikiii eXXXY +++++= ββββ …2

210 , a relação

existente entre as variáveis independentes não é linear e rigorosamente falando, não viola a hipótese de ausência de multicolinearidade. Entretanto, em geral é observada uma alta correlação entre os regressores.

Page 55: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

55

3.2.1 Conseqüências

1. Se a multicolinearidade é perfeita, os coeficientes da regressão são indeterminados e seus erros-padrão são infinitos.

Para exemplificar, seja um modelo de 3 variáveis, e as seguintes observações:

Y X2 X3=λ X2 10 2 2λ 15 3 3λ 18 4 4λ 30 4 4λ

Onde λ é uma constante não nula.

Nesse caso, a matriz

=

²454513

454513

13134

'

λλλ

λ

λ

XX tem determinante:

( ) 0²7605²8100²7605²7605²7605²8100'det =−−−++= λλλλλλXX e por isso a sua inversa não existe, o que nos impede de estimar o modelo.

Há uma razão intuitiva para isto. Lembrando o significado de 2β : ele nos dá a taxa de variação de Y quando X2 varia uma unidade, mantendo-se X3 constante. Mas se as duas variáveis independentes foram perfeitamente colineares, não há modo de manter X3 constante: quando X2 variar, X3 também o fará, a uma taxa de λ . O que quer dizer, então, que não há forma de isolar as influências das duas variáveis na amostra dada.

2. Se a multicolinearidade é “imperfeita” mas “alta”, os coeficientes podem ser determinados, e os estimadores MQO ainda possuem a propriedade de melhores estimadores lineares não-viesados. Entretanto, os estimadores MQO têm grandes variâncias, o que diminui a precisão na estimação.

Seja um modelo de regressão múltipla de 3 variáveis. Além da forma matricial de cálculo

das variâncias dos estimadores, também pode-se ter as seguintes expressões:

( )∑ −=

223

22

22ˆ

12 rx i

σσ

β e

( )∑ −=

223

23

22ˆ

13 rx i

σσ

β.

Assim, percebe-se que, quando 23r tende (em termos absolutos) a 1, ou seja, quando a

colinearidade entre as variáveis X aumenta, as variâncias dos dois estimadores aumentam até o limite, que é o infinito.

A velocidade com que as variâncias aumentam pode ser mensurada através do Fator de Inflação de Variância (FIV), definido por:

( )223

1

1FIV

r=

Se não há colinearidade, então FIV = 1, e quanto maior a colinearidade maior o FIV.

Page 56: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

56

A figura abaixo mostra o quanto as variâncias dos estimadores aumentam à medida que a correlação entre as variáveis independentes aumenta.

Para um modelo de k variáveis, pode-se escrever as variâncias dos coeficientes angulares

parciais como:

( )∑ −=

22

22ˆ

1 jj Rxj

σσ

β,

onde 2

jR é o coeficiente múltiplo de determinação da regressão de jX como variável dependente e

os outros k – 2 X como variáveis independentes. Nesse caso, FIV será:

( )21

1

jj R

FIV−

= .

O inverso do FIV é conhecido como Tolerância (TOL).

jj FIV

TOL1

=

3. Por causa da conseqüência 2, os intervalos de confiança tendem a ser bastante amplos,

levando a aceitação de 0:0 =iH β .

4. Também por causa da conseqüência 2, os testes t de um ou mais coeficientes tendem a ser

estatisticamente não significativos. 5. Apesar das conseqüências 3 e 4, o R² pode ser bastante alto.

Nessas situações o R² pode ser tão alto que, com base no teste F, somos levados a rejeição da hipótese 0: 320 ==== kH βββ … . Na verdade, esse é um dos indícios de multicolinearidade:

valores t insignificantes, mas um alto R² e um valor de F significativo.

6. As estimativas dos coeficientes e dos erros-padrão podem ser muito sensíveis a pequenas variações nos dados.

Considere a pequena variação nos dados das duas tabelas a seguir:

Page 57: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

57

Y1 X2 X3 Y2 X2 X3

1 2 4 1 2 4

2 0 2 2 0 2

3 4 12 3 4 0

4 6 0 4 6 12

5 8 16 5 8 16

Da primeira tabela, obtemos

)9747,0()1371,0()2628,0(:

)0851,0()1848,0()7737,0(:

003,04463,01939,1 321

p

ep

XXY ++=

Nesse caso temos também que R2 = 0,8101, r23 = 0,5523. Da segunda tabela, temos

)8491,0()2781,0()2469,0(:

)1252,0()2721,0()7480,0(:

0270,04014,02101,1 322

p

ep

XXY ++=

sendo observados que R2 = 0,8143, r23 = 0,8285.

3.2.2 Detecção

Primeiramente, deve-se ter em mente que a multicolinearidade é uma questão de grau, e não de tipo. A distinção significativa não é entre a presença e ausência de multicolinearidade, mas entre seus vários graus. Além disso, ela é uma característica da amostra, e não da população. Portanto, medimos seu grau em uma amostra específica.

Não há um método único para detectar multicolinearidade, e sim algumas regras práticas. 1. R² alto, mas poucas razões t significativas. Consideraremos um R² alto se for maior que 0,8. Neste caso, o teste F rejeitará, na maioria das vezes, a hipótese de que os coeficientes parciais angulares são simultaneamente iguais a zero, mas os testes t individuais mostrarão que nenhum ou muito poucos desses coeficientes são significativamente diferentes de zero. Este é um critério sensato, mas é exigente demais. 2. Altas correlações entre pares de regressores. No modelo de 3 variáveis, olharemos para 23r , já no modelo de 4 variáveis, para 342423 ,, rrr ,

e analogamente para os demais modelos. Consideraremos a correlação de ordem zero alta se for em módulo maior que 0,8. Para o modelo de 3 variáveis, esse é um bom critério. Porém, para mais variáveis a correlação alta é uma condição suficiente mas não necessária para a multicolinearidade. 3. Exame das correlações parciais entre regressores. Seja um modelo de 4 variáveis. Se R² é alto, mas 2

23.142

24.132

34.12 ,, rrr são baixos, isto pode

sugerir que as variáveis independentes são estreitamente intercorrelacionadas. Este exame não é infalível e é criticado por vários autores.

Page 58: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

58

4. Regressões auxiliares. Como a multicolinearidade decorre do fato de que um ou mais regressores são combinações lineares exatas ou aproximadas de outros regressores, uma forma de verificar qual das variáveis X se relaciona a outras X é fazer regressões de cada Xi contra os demais X e calcular os respectivos R², que aqui designamos por 2

iR . Então, pode-se calcular a estatística de teste

( )

( ) ( ) ( )1;22

2

~1/1

2/+−−

+−−

−= knk

i

ii F

knR

kRF

Onde k é o número de variáveis do modelo com o Y. Se o F calculado for maior que o tabelado, considera-se que Xi é colinear em relação aos outros X. Então se terá que fazer algo para corrigir a multicolinearidade. Em lugar de testar formalmente as regressões auxiliares, pode-se adotar a Regra prática de Klein: a multicolinearidade só será problema sério se todos os 2

iR forem maiores que o R² geral,

isto é, aquele obtido na regressão entre o Y e todos os X. 5. Índice condicional. Através de álgebra matricial, definiu-se o índice condicional (IC), que vem sendo muito utilizado para diagnosticar a multicolinearidade. Ele é calculado pela maioria dos softwares estatísticos, como o SPSS. É sempre um número positivo, e é interpretado da seguinte forma: se for menor que 10, a multicolinearidade não é preocupante; se estiver entre 10 e 30, é moderada a forte; se for maior que 30, será grave. 6. Tolerância e fator de inflação de variância. Já vimos o FIV e a TOL. Quanto maior o FIV, e por conseqüência, menor a TOL, maior a multicolinearidade. Como regra prática, se o FIV de uma variável for maior que 10, o que acontece se 9,02 >iR , diz-se que essa variável é altamente colinear.

Exemplo 2. Considere uma regressão do consumo (Y) em função da renda (X2) e riqueza (X3), com os dados abaixo:

Y X2 X3

70 80 810

65 100 1009

90 120 1273

95 140 1425

110 160 1633

115 180 1876

120 200 2052

140 220 2201

155 240 2435

150 260 2686

Através do Excel, obtemos os seguintes resultados:

Estatística de regressão

R múltiplo 0,98158

R-Quadrado 0,96350

R-quadrado ajustado 0,95308

Erro padrão 6,80804

Observações 10

Y X2 X3

Y 1

X2 0,98085 1

X3 0,97810 0,99896 1

Page 59: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

ANOVA

gl SQ MQ F F de significação

Regressão 2 8565,55407 4282,77704 92,40196 0,00001

Resíduo 7 324,44593 46,34942

Total 9 8890,00000

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 24,77473 6,75250 3,66897 0,00798 8,80761 40,74186

X2 0,94154 0,82290 1,14417 0,29016 -1,00431 2,88738

X3 -0,04243 0,08066 -0,52606 0,61509 -0,23318 0,14831

Também é interessante observamos o resultado das regressões entre Y e cada um dos X separadamente: - Regressão entre Y e X2

Estatística de regressão

R-Quadrado 0,96206

R-quadrado ajustado 0,95732

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 24,45455 6,41382 3,81279 0,00514 9,66426 39,24483

X2 0,50909 0,03574 14,24317 0,00000 0,42667 0,59151

- Regressão entre Y e X3

Estatística de regressão

R-Quadrado 0,95668

R-quadrado ajustado 0,95126

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 24,41104 6,87410 3,55116 0,00750 8,55935 40,26274

X3 0,04976 0,00374 13,29166 0,00000 0,04113 0,05840

Por último, temos a regressão auxiliar entre X2 e X3:

Estatística de regressão

R-Quadrado 0,99793

R-quadrado ajustado 0,99767

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção -0,38627 2,89796 -0,13329 0,89726 -7,06897 6,29643

X3 0,09792 0,00158 62,04047 0,00000 0,09428 0,10156

Fazer o teste F para verificar se as variáveis independentes são colineares, a um nível de 5% de significância. Calcular FIV, TOL, e com base em todos os indícios, concluir sobre multicolinearidade.

Page 60: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

60

Obs: Saída do SPSS para o mesmo Exemplo

Model Summary

,982a ,964 ,953 6,80804

Model1

R R Square

Adjusted

R Square

Std. Error of

the Estimate

Predictors: (Constant), X3, X2a.

ANOVAb

8565,554 2 4282,777 92,402 ,000a

324,446 7 46,349

8890,000 9

Regression

Residual

Total

Model1

Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), X3, X2a.

Dependent Variable: Yb.

Coefficientsa

24,775 6,752 3,669 ,008

,942 ,823 1,814 1,144 ,290 ,002 482,128

-,042 ,081 -,834 -,526 ,615 ,002 482,128

(Constant)

X2

X3

Model1

B Std. Error

Unstandardized

Coefficients

Beta

Standardized

Coefficients

t Sig. Tolerance VIF

Collinearity Statistics

Dependent Variable: Ya.

Collinearity Diagnosticsa

2,930 1,000 ,01 ,00 ,00

,070 6,483 ,98 ,00 ,00

,000 166,245 ,00 1,00 1,00

Dimension1

2

3

Model1

Eigenvalue

Condition

Index (Constant) X2 X3

Variance Proportions

Dependent Variable: Ya.

3.2.3 Medidas corretivas

1. Utilização de informações “a priori”. Seja o exemplo do consumo versus renda e riqueza. Imagine que saibamos “a priori” que β3 = 0,1β2, ou seja, que a taxa de variação do consumo em relação à riqueza é um décimo da taxa correspondente em relação à renda. Então podemos calcular a seguinte regressão:

eXeXXY ++=+++= 2132221 1,0 βββββ , onde 32 1,0 XXX +=

A informação a priori pode vir de trabalhos anteriores nos quais o problema de colinearidade é menos grave ou da teoria do campo de estudo. 2. Combinação de dados de corte transversal e séries temporais. Corte transversal = pesquisa feita em um único momento do tempo. Séries temporais = dados são coletados em momentos diferentes no tempo.

Page 61: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

61

Imagine que dispomos de uma série temporal do n° de carros vendidos (Y), seus preços médios (P) e a renda dos consumidores (R). Sabe-se que preço e renda tendem a registrar alta colinearidade, nas séries temporais. Seja também o modelo: eRPY +++= 321 βββ .

Se em determinado momento, se fizer uma pesquisa relacionando consumo e renda, pode-se chegar a uma estimativa bastante confiável de 3β , pois os preços estarão praticamente constantes.

Com essa estimativa, reescreve-se o modelo como: ePY ++= 21

* ββ ,

Onde RYY 3* β−= , isto é, Y* é Y sem o efeito da renda.

3. Excluir variáveis. Deve-se tomar o cuidado para não cair em um “viés de especificação”, que decorre da especificação incorreta do modelo empregado. As conseqüências do viés de especificação são que as estimativas de MQO se tornam viesadas. 4. Transformação de variáveis. Seja uma série temporal do consumo versus renda e riqueza:

tttt eXXY +++= 33221 βββ

Ao longo do tempo, renda e riqueza tendem a evoluir na mesma direção, ocasionando multicolinearidade. Pode-se então tomar a primeira diferença:

( ) ( ) ttttttt uXXXXYY +−+−+=− −−− 1,3331,22211 βββ

Essa transformação normalmente resolve a multicolinearidade, mas pode gerar autocorrelação dos resíduos. Além disso, perde-se uma observação. Outra transformação usada na prática é a transformação proporcional. Seja uma série temporal entre consumo (Y), PNB (X2) e população (X3):

tttt eXXY +++= 33221 βββ

Em geral PNB e população crescem ao longo do tempo, gerando multicolinearidade. Pode-

se expressar esse modelo em termos “per capita”:

t

t

t

t

tt

t

X

e

X

X

XX

Y

33

3

22

31

3

1+++

= βββ

A desvantagem dessa transformação é que ela pode gerar heteroscedasticidade.

5. Dados novos. Ou seja, aumentar o tamanho da amostra. Deve-se cuidar se a conjuntura econômica não se modificou. 6. Regressões polinomiais. Exemplo: iiii eXXY +++= 2

210 βββ .

Pode-se ajustar o modelo: ( ) ( ) iiii eXXXXY +−+−+=2

210 βββ .

Ao subtrair a média, geralmente a multicolinearidade reduz. 7. Outras técnicas.

Há muitas outras técnicas sugeridas e ainda sendo pesquisadas para resolver multicolinearidade, como análise fatorial e regressão de cumeeira.

Page 62: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

62

Exercício 1. Foi feito um estudo com 20 mulheres saudáveis relacionando quantidade de gordura corporal (Y), com medidas do tríceps (X1), circunferência da coxa (X2) e circunferência do antebraço (X3). A regressão resultou nos seguintes resultados:

Estatística de regressão

R-Quadrado 0,801359

Observações 20

ANOVA

gl SQ MQ F F de

significação

Regressão 3 396,9846 132,3282 21,51571 7,34E-06

Resíduo 16 98,40489 6,150306

Total 19 495,3895

Coeficientes Erro

padrão Stat t valor-P 95% inferiores 95%

superiores

Interseção 117,0847 99,7824 1,1734 0,257808 -94,4445 328,6139

X1 4,334092 3,015511 1,437266 0,169911 -2,05851 10,72669

X2 -2,85685 2,582015 -1,10644 0,284894 -8,33048 2,61678

X3 -2,18606 1,595499 -1,37014 0,189563 -5,56837 1,196247

Correlações simples:

X1 X2 X3

X1 1

X2 0,923843 1

X3 0,457777 0,084667 1

Regressões auxiliares: Variável dependente R²j

X1 0,9986

X2 0,9982

X3 0,9904

Há indícios de que a multicolinearidade afeta esses dados? Se sim, como poderia ser corrigido?

Page 63: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

63

3.3 Heterocedasticidade

Uma das premissas do modelo de regressão linear clássico é a de que os termos de erro ie

da FRP sejam homocedásticos; isto é, devem ter todos a mesma variância. Simbolicamente: Homocedasticidade: ( ) ieVar i ∀= ,2σ

Heterocedasticidade: ( ) 2iieVar σ=

Graficamente, temos: Essa característica pode ser observada em diversos tipos de dados, por exemplo: a

variabilidade do número de erros de digitação que um operador comete tende a diminuir com o passar do tempo; a variabilidade dos valores depositados numa conta poupança tende a aumentar com o aumento da renda dos clientes; presença de outliers (valores discrepantes).

Seja um modelo de regressão simples: iii eXY ++= 21 ββ . Se a heterocedasticidade estiver

presente, o estimador de MQO de 2β continuará sendo:

∑∑

=22

ˆx

xyβ

mas agora a sua variância é dada por:

∑∑

=2

222ˆ2

i

ii

x

x σσ

β

ao invés da expressão na presença da homocedasticidade: ∑

=2

22ˆ2 x

σσ

β.

Estudamos que, na presença de homocedasticidade, o estimador de MQO é o melhor estimador linear não-tendencioso. Pode-se demonstrar que, na presença e heteroscedasticidade, o estimador de MQO ainda é linear e não-tendencioso. Além disso, é consitente e segue distribuição normal assintótica. Mas é o “melhor” estimador, isto é, possui a variância mínima dentre todos os estimadores não-tendenciosos? A resposta é não e a justificativa é dada a seguir.

Page 64: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

64

3.3.1 Método dos Mínimos Quadrados Generalizados (MQG)

Seja o modelo de duas variáveis: iii eXY ++= 21 ββ , que escreveremos como:

iiii eXXY ++= 201 ββ ,

Onde 10 =iX para todas as observações.

Supondo que as variâncias heterocedásticas 2iσ são conhecidas, divindo a expressão acima

por elas, obtemos:

i

i

i

i

i

i

i

i eXXY

σσβ

σβ

σ++= 2

01 ,

***2

*0

*1

*iiii eXXY ++= ββ

Obs: A notação *

iβ é usada apenas para diferenciar os parâmetros do modelo transformado

dos parâmetros de MQO, iβ .

Neste modelo transformado, tem-se que:

( ) [ ]( ) [ ]( ) 111 2

2

2

2

22** ===

== i

ii

ii

iii eE

eEeEeVar σ

σσσ

Ou seja, a variância dos resíduos do modelo transformado é uma constante, o que implica que o modelo é homocedástico. Assim, se aplicarmos MQO ao modelo transformado, ele gerará estimadores que são os melhores estimadores lineares não tendenciosos. Por isso os estimadores de MQO no modelo original não são os “melhores”, e sim os estimadores de MQO do modelo transformado. O MQG são os MQO aplicados a variáveis transformadas que satisfazem as premissas do modelo clássico.

Para obter os estimadores de MQG, minimizamos ( )∑2*

ie , obtendo-se:

( )( ) ( )( )( )( ) ( )22

*2

ˆ

∑∑∑∑∑∑∑

−=

iiiii

iiiiiiii

XX

YXYX

ωωω

ωωωωβ

e sua variância é:

( ) ( )( )( ) ( )22

*2

ˆ

∑∑∑∑

−=

iiiii

i

XXVar

ωωω

ωβ

onde, 21 ii σω = . Ou seja, no MQG o peso de cada observação é inversamente proporcional à sua

variância.

3.3.2 Conseqüências

- Se determinado problema é afetado pela heterocedasticidade, e ignoramos esse fato, continuando a utilizar o MQO tradicional, então as variâncias dos estimadores vão ser viesadas. Em conseqüência, todas as conclusões ou inferências que podemos fazer com base nos testes de hipóteses e intervalos de confiança podem ser enganosas.

Page 65: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

65

- Se usarmos as fórmulas de MQO que consideram a heterocedasticidade, o estimador não será o melhor estimador que poderia ser utilizado, pois o melhor é o MQG. Ou seja, a variância do MQO que considera a heteroscedasticidade é maior que a do MQG. Assim, os testes de hipóteses e intervalos de confiança nos darão resultados inexatos, e o que parece ser estatisticamente insignificante, pode na verdade ser significante.

3.3.3 Detecção

Há métodos formais e informais para detectar a heterocedasticidade. Não há regras firmes e prontas, e sim, apenas algumas regras práticas. - Método gráfico:

Faz-se um gráfico de dispersão entre Y e e . Se não for observado algum padrão sistemático, então se pode assumir que não há heterocedasticidade:

Caso contrário, há indícios de heterocedasticidade: Pode-se fazer também gráficos entre cada variável X e os resíduos. A maneira de concluir sobre a heterocedasticidade é a mesma. - Teste de Goldfeld-Quandt:

Esse método formal é aplicável quando se pressupõe que 2iσ se relaciona positivamente

com uma das variáveis explicativas. Seja o modelo iii eXY ++= 21 ββ , e imagine que: 222ii Xσσ = ,

onde 2σ é uma constante. Ou seja, 2iσ é porporcional ao quadrado da variável X.

Esse método consiste nas seguintes etapas: 1. Ordenar as observações de forma crescente de acordo com os valores Xi; 2. Omitir as c observações centrais e dividir as (n-c) observações em dois grupos; 3. Ajustar duas regressões, uma para cada grupo de (n-c)/2 observações, e obter SQR1 e

SQR2. A primeira dessas somas corresponde ao grupo de valores menores Xi, e a segunda de valores maiores. Cada uma dessas somas tem (n-c-2k)/2 gl;

4. Calcular a estatística de teste:

( ) ( )gl

kcnkcnF

glSQR

glSQRFcalc

−−−−=

2

2;

2

2~

/

/

1

2

Page 66: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

66

As hipóteses desse teste são:

=

)(:

)(:

211

210

sticidadeheterocedaSQRSQRH

icidadehomocedastSQRSQRH

Rejeita-se H0 se Fcalc > Ftab. A escolha do valor c é muito importante para o bom desempenho do teste. Os autores do

teste sugerem que c=8 se n for em torno de 30, e de 16 se n=60, para modelos de 2 variáveis. Mas outro autor sugere que c=4 se n=30 e c=10 se n=60 são valores satisfatórios na prática.

No caso de modelos de 3 variáveis ou mais, deve-se escolher qualquer uma das variáveis X para fazer a ordenação da primeira etapa. Exemplo 3. Sejam as despesas de consumo (Y) e a renda (X) de 30 famílias. A análise desses dados pelo Excel forneceu os seguintes resultados: RESUMO DOS RESULTADOS

Estatística de regressão

R-Quadrado 0,9466

R-quadrado ajustado 0,9447

Erro padrão 9,1830

Observações 30

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 9,2903 5,2314 1,7759 0,0866 -1,4257 20,0063

X 0,6378 0,0286 22,2872 0,0000 0,5792 0,6964

X Plotagem de resíduos

-30

-20

-10

0

10

20

30

0 100 200 300

X

Resíd

uo

s

Após ordenar as observações, ajustou-se um modelo para as primeiras 13 observações, obtendo-se: SQR = 377,17. Já para as 13 últimas observações, obteve-se SQR = 1536,8.

Proceda o teste de Goldfeld-Quandt, a 1%, e com base em todos os indícios apresentados, conclua sobre heterocedasticidade.

Page 67: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

67

Exercício 2. Você dispõe dos seguintes dados: SQR1 baseada nas primeiras 30 observações = 55 e gl = 25. SQR2 baseada nas 30 últimas observações = 140 e gl = 25. Realize o teste de heteroscedasticidade de Goldfeldt-Quandt em nível de significância de 5%.

- Teste geral de heterocedasticidade de White: O teste de White pressupõe que as variâncias dos resíduos se relacionam funcionalmente aos regressores, aos seus quadrados ou a seus produtos cruzados.

Seja o modelo de 3 variáveis: iiii eXXY +++= 33221 βββ .

O teste de White é conduzido do seguinte modo: 1. Com os dados pertinentes, estimar o modelo acima e obter os resíduos estimados, ie .

2. Calcular a seguinte regressão (auxiliar):

( ) iiiiiiii uXXXXXXe ++++++= 326235

22433221

2ˆ αααααα

Isto é, uma regressão dos quadrados dos resíduos da regressão original contra os regressores X originais, seus quadrados e seus produtos cruzados. Para um modelo de k variáveis, é análogo. 3. Obter o R² da regressão anterior, e calcular a estatística de teste 2nRW = , onde n é o tamanho de amostra. Demonstra-se que 2~ glW χ assintoticamente, onde gl = n° de regressores

(excluindo o intercepto) da regressão auxiliar. 4. Se o valor de 2

;αχ glW > , conclui-se que há heterocedasticidade. Caso contrário, não há

heterocedasticidade. Exemplo 4. Sejam os dados de consumo e renda para as 30 famílias. Para fazer o teste de White, ajustou-se o seguinte modelo:

( ) iiii uXXe +++= 2321

2ˆ ααα

obtendo-se um R² de 0,1777. Conduza o teste de White para heterocedasticidade, a 5% de significância.

Page 68: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

68

3.3.4 Medidas corretivas

Há duas abordagens para a correção: quando os 2iσ são conhecidos e quando não são.

- Quando 2

iσ são conhecidos – MQG:

Já vimos que, quando 2iσ são conhecidos, pode-se aplicar o método dos mínimos quadrados

generalizados, pois os estimadores assim obtidos são os melhores estimadores lineares não tendenciosos. Exemplo 5. Imagine que desejamos estudar a relação entre remuneração média por empregado (Y) e o tamanho da empresa (X), medido através das classes de n° de empregados: 1 (1 a 4 empregados), ..., 9 (1000 a 2499 empregados). Os dados estão abaixo:

Y X iσ iii YY σ=* iiX σ1*

0 = iii XX σ=*

3396 1 743,7 4,5664 0,0013 0,0013

3787 2 851,4 4,4480 0,0012 0,0023

4013 3 727,8 5,5139 0,0014 0,0041

4104 4 805,06 5,0978 0,0012 0,0050

4146 5 929,9 4,4585 0,0011 0,0054

4241 6 1080,6 3,9247 0,0009 0,0056

4387 7 1243,2 3,5288 0,0008 0,0056

4538 8 1307,7 3,4702 0,0008 0,0061

4834 9 1112,5 4,3452 0,0009 0,0081

Para se ajustar o modelo iii eXY ++= 21 ββ por MQG, deve-se fazer

***2

*0

*1

*iiii eXXY ++= ββ ,

que é um modelo de 3 variáveis mas sem intercepto. Os resultados do Excel são:

RESUMO DOS RESULTADOS

Estatística de regressão

R-Quadrado 0,999276

Erro padrão 0,134811

Observações 9

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 0 #N/D #N/D #N/D #N/D #N/D

X0* 3408,259 80,77021 42,19698 1,1E-09 3217,267 3599,25

X* 153,5922 16,91468 9,080406 4,03E-05 113,5953 193,589

Page 69: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

69

- Quando 2iσ não são conhecidos:

1) Tranformações: A partir de alguns pressupostos sobre o padrão de heterocedasticidade, pode-se transformar o modelo para corrigir o problema.

Seja o modelo: iii eXY ++= 21 ββ :

a) Quando a variância do erro é proporcional a X² ( 222

ii Xσσ = ), divide-se todo o modelo por X:

iii

i

ii

i uXX

e

XX

Y++=++= 212

1 1βββ

β

Assim, ( ) [ ]( ) 22

2

21

σ==

= i

ii

ii eE

XX

eEuVar , ou seja, tem-se homocedasticidade.

Para voltar ao modelo original, basta multiplicar a equação estimada por X.

b) Quando a variância do erro é proporcional a X ( ii X22 σσ = ), divide-se todo o modelo por X :

ii

ii

ii

ii

i uXXX

eX

XX

Y++=++= 212

1 1βββ

β

Assim, ( ) [ ]( ) 22

2

1σ==

= i

ii

ii eE

XX

eEuVar .

Essa transformação só pode ser utilizada se os valores de X forem positivos. Observe que o

modelo transformado não tem intercepto. Para voltar ao modelo original, deve-se multiplicar por

X . c) Em geral, ajustar um modelo log-log ( ) ( ) iii eXY ++= lnln 21 ββ ao invés das variáveis em suas

escalas originais, reduz a heterocedasticidade. 2) Estimadores robustos: Há também estimadores modificados disponíveis em alguns pacotes estatísticos que corrigem para a heterocedasticidade, desenvolvidos por White. Entretanto, só pode ser utilizados para amostras grandes.

Page 70: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

70

Exercício 3. Sejam os dados de gastos com pesquisa e desenvolvimento e as vendas, trabalhado na seção de não-normalidade. Alguns resultados adicionais estão produzidos: Regressão com as 7 primeiras observações: SQR1 = 412586 Regressão com as 7 últimas observações: SQR2 = 97356910 Regressão auxiliar para teste de White: R² = 0,2896

V Plotagem de resíduos

-8000

-6000

-4000

-2000

0

2000

4000

6000

8000

100000

50

00

0

10

00

00

15

00

00

20

00

00

25

00

00

30

00

00

V

Resíd

uo

s

Verifique se a heterocedasticidade afeta esse problema e, caso afirmativo, indique qual seria o método de correção mais indicado.

Page 71: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

71

3.4 Autocorrelação

Uma das premissas do modelo clássico de regressão era:

( ) jieeE ji ≠∀= ,0 .

Dito de forma simples, o modelo clássico pressupõe que o termo de erro relacionado a qualquer das observações não é influenciado pelo termo de erro de qualquer outra observação. Quando há autocorrelação, então:

( ) jieeE ji ≠≠ ,0

Há dois tipos de autocorrelação: no tempo (em dados de séries temporais) e no espaço (em dados de corte transversal), embora ela seja mais comum no primeiro caso. Exemplos: observando-se índices de preços de ações diariamente, não é raro verificar que esses índices sobem ou descem por vários dias seguidos (autocorrelação no tempo); ao regredir despesas de consumo com renda das famílias, o aumento de despesa de consumo de uma família pode levar a vizinha a aumentar o consumo também, para não ficar para trás (autocorrelação no espaço). Os gráficos abaixo apresentam alguns padrões plausíveis de presença e de ausência de autocorrelação serial:

Além de ser classificada como no tempo e no espaço, a autocorrelação também pode ser positiva ou negativa. A autocorrelação positiva se caracteriza quando os resíduos evoluem para cima ou para baixo durante longos períodos, já na negativa, há oscilações constantes. Os gráficos a seguir ilustram os dois processos.

Page 72: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

72

Para avaliar os efeitos da autocorrelação no modelo de regressão, voltemos novamente ao modelo de duas variáveis:

ttt eXY ++= 21 ββ .

O subscrito t está sendo usado para destacar que estamos lidando com séries temporais. Para avançar, precisamos imaginar o mecanismo que gera te . Como ponto de partida,

podemos supor que o termo de erro seja gerado pelo seguinte mecanismo:

ttt uee += −1ρ , com 11 <<− ρ ,

Onde ρ é conhecido como coeficiente de autocorrelação, e tu é o termo de erro que atende as

premissas clássicas de um modelo de regressão (média zero, homocedasticidade e independência). Na linguagem de séries temporais, tu geralmente é chamado de ruído branco.

O esquema anterior é conhecido como esquema auto-regressivo de primeira ordem de Markov – AR(1). A denominação auto-regressivo é usada porque o esquema pode ser interpretado como uma regressão de te contra ele mesmo com defasagem de um período. É de primeira ordem

porque apenas o resíduo do período anterior influencia no resíduo atual. Poderia-se ter esquemas AR(2), AR(3) e assim por diante.

Na presença da autocorrelação de primeira ordem, o estimador de MQO de β2, como de hábito, é:

∑∑

=22

ˆt

tt

x

yxβ

Mas sua variância é:

( )

++++=

∑∑∑

∑∑

∑−−−

211

2

222

1

2

2

12 2221ˆt

nn

t

tt

t

tt

tAR x

xx

x

xx

x

xx

xVar ρρρ

σβ …

Lembrando que, no modelo tradicional essa variância era:

( )∑

=2

2

txVar

σβ

Percebe-se que a primeira é igual a segunda multiplicada por um termo que depende de ρ . Obviamente, se 0=ρ , as duas coincidem.

Imagine que continuamos a empregar o estimador de MQO, 2β , e que ajustamos a variância

habitual levando em conta o esquema AR(1). Quais são, agora, as propriedades de 2β ? Pode-se demonstrar que ele ainda é linear e não tendencioso. Também é consistente e com distribuição normal assintótica. Entretanto, ele não é mais o MELNT (não é eficiente), assim como na heterocedasticidade.

Para encontrar o MELNT na presença de autocorrelação, devemos novamente recorrer ao MQG. Continuando com o modelo de duas variáveis, e admitindo o processo AR(1), podemos mostrar que o MELNT é dado pela expressão:

( )( )

( )

1 12

22

12

ˆ

n

t t t tMQG t

n

t tt

x x y yC

x x

ρ ρ

β

ρ

− −

=

−=

− −

= +

Em que C é um fator de correção que, na prática, pode ser desconsiderado.

Page 73: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

73

Esse estimador possui variância mínima, a qual é dada por:

( )( )

2

22

12

ˆ MQGn

t tt

Var Dx x

σβ

ρ −=

= +

−∑

Em que D também é um fator de correção que pode ser desconsiderado.

3.4.1 Conseqüências - Se determinado problema é afetado pela autocorrelação, e ignoramos esse fato,

continuando a utilizar o MQO tradicional, então: 1. A variância residual provavelmente subestimará o verdadeiro 2σ . 2. Em conseqüência, R² será superestimado.

3. Mesmo que 2σ não seja subestimado, ( )2βVar pode subestimar ( ) 12ˆ

ARVar β .

4. Portanto, os habituais testes de significância, não serão mais válidos e provavelmente nos levarão a conclusões extremamente equivocadas quanto à significância dos coeficientes.

- Se usarmos as fórmulas de MQO que consideram a presença de autocorrelação, o

estimador não será o melhor estimador que poderia ser utilizado, pois o melhor é o MQG. Ou seja, a variância do MQO que considera a autocorrelação é maior que a do MQG. Assim, os testes de hipóteses e intervalos de confiança nos darão resultados inexatos, e o que parece ser estatisticamente insignificante, pode na verdade ser significante.

3.4.2 Detecção - Método gráfico: 1. Plotagem seqüencial no tempo: Faz-se um gráfico de dispersão com o tempo ou n° da observação do eixo X e os resíduos no eixo Y. Se observar que os resíduos seguem algum padrão não-aleatório, há indícios de autocorrelação. 2. Plotar te versus 1−te : Ou seja, os resíduos no período t contra seu valor em t-1. Se houver

autocorrelação, observaremos padrões como estes:

Page 74: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

74

- O teste de Durbin-Watson: Esse teste é muito popular e já está incorporado na maioria dos pacotes estatísticos, como o SPSS. A estatística d de Durbin-Watson é definida por:

( )

=

=

−−

=n

tt

n

ttt

e

eed

1

2

2

21

ˆ

ˆˆ

É importante estar atento às premissas subjacentes desse teste:

a) O modelo possui intercepto. Se não possuir deve-se refazer a regressão incluindo o mesmo. b) Os regressores são fixos em amostragem repetida (não-aleatórios); c) Os termos de erro são gerados pelo esquema AR(1); d) Os resíduos seguem distribuição Normal; e) O modelo não inclui valores defasados da variável independente como uma das variáveis

explanatórias; f) Não há observações faltantes.

Seja o estimador do coeficiente de autocorrelação:

=

=

=n

tt

n

ttt

e

ee

1

2

21

ˆ

ˆˆ

ρ . Demonstra-se que:

( )ρ12 −≈d . Logo: 40 ≤≤ d , pois 11 +≤≤− ρ .

Os procedimentos para a execução do teste de Durbin-Watson são: 1.Rodar a regressão por MQO e obter os resíduos estimados; 2.Calcular a estatística d; 3.Anotar os valores críticos dL e dU (Tabela D) baseado no número de observações (n), no

número de regressores (k’ = k-1) e no nível de significância; 4.Decidir conforme a tabela abaixo: Hipótese nula Decisão Se Ausência de autocorrelação positiva Rejeitar

Ldd <<0 Ausência de autocorrelação positiva Sem decisão

UL ddd ≤≤

Ausência de autocorrelação negativa Rejeitar 44 <<− ddL Ausência de autocorrelação negativa Sem decisão

LU ddd −≤≤− 44

Ausência de autocorrelação positiva ou negativa Não rejeitar UU ddd −<< 4

A figura a seguir ilustra as regiões de rejeição, aceitação e indecisão do teste:

Page 75: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

75

Caso a estatística do teste seja encontrada em alguma das regiões de indecisão, pode-se recorrer ao teste d modificado. Dado o nível de significância α : 1. 0:0 =ρH versus 0:1 >ρH . Rejeita-se 0H ao nível α se Udd < . Isto é, há autocorrelação

positiva estatisticamente significativa. 2. 0:0 =ρH versus 0:1 <ρH . Rejeita-se 0H ao nível α se ( ) Udd <−4 . Isto é, há autocorrelação

negativa estatisticamente significativa. 3. 0:0 =ρH versus 0:1 ≠ρH . Rejeita-se 0H ao nível α2 se Udd < ou se ( ) Udd <−4 . Isto é, há

autocorrelação, seja positiva ou negativa, estatisticamente significativa. Exemplo 6. Têm-se dados relativos a índices de remuneração real por hora (Y) e produção por hora (X), anualmente, no período de 1959 a 1998 nos EUA (n=40). A análise no Excel forneceu:

Resíduos x Ano

-6

-4

-2

0

2

4

6

0 10 20 30 40 50

N° da observação (ano)

Resíd

uo

s

Resíduos t x Resíduos t-1

-6

-4

-2

0

2

4

6

-6 -4 -2 0 2 4 6

Resíduo t-1

Resíd

uo

t

A estatística d de Durbin-Watson foi igual a 0,1229. Testar, a 5% de significância, se existe autocorrelação e, com base em todos os indícios, concluir se esse problema afeta esses dados.

Page 76: Apostila_ESTATÍSTICA_ECONOMICA_VANESSA_2008_Completa_e_final

MAT02207 – Estatística Econômica – Prof. Vanessa Leotti

76

Exemplo 7. Seja um problema com n = 50, 4 variáveis regressoras e d = 1,43. A 5% de significância, teste se existe autocorrelação positiva. Exercício 4. Considere um conjunto de dados com 32 observações, com o qual se ajustou um MRLS e obteve-se d = 0,1380. Teste a 5% de significância de a autocorrelação afeta esse problema.

3.4.3 Medidas corretivas

1. Primeiro, deve-se tentar verificar se se trata de uma autocorrelação pura, e não de um erro de especificação do modelo. Às vezes, observamos padrões nos resíduos porque o modelo foi especificado de forma equivocada – isto é, foram excluídas algumas variáveis importantes – ou porque sua forma funcional é incorreta.

2. Se se tratar de autocorrelação pura, e ρ for conhecido, utiliza-se MQG. Seja o modelo de

duas variáveis:

ttt eXY ++= 21 ββ

O mesmo modelo, mas no período t-1 é: 11211 −−− ++= ttt eXY ββ . Multiplicando-se por ρ em

ambos os lados obtém-se: 11211 −−− ++= ttt eXY ρρβρβρ , e subtraindo-se do modelo original:

( ) ( ) ( ) ( )( ) ( ) ttt

tttttt

uXX

eeXXYY

+−+−=

−+−+−=−

−−−

121

11211

1

1

ρβρβ

ρρβρβρ

Fazendo-se ( )1

*−−= ttt YYY ρ , ( )ρββ −= 11

*1 , ( )1

*−−= ttt XXX ρ e 2

*2 ββ = , pode-se estimar

.MQOpor,**2

*1

*ttt uXY ++= ββ

Esta regressão é conhecida como a equação em diferenças generalizadas. Nesse processo de obtenção das diferenças, sempre perdemos a primeira observação.

3. Se se tratar de autocorrelação pura, e ρ não for conhecido, deve-se usar técnicas de séries

temporais.