05 tópico 4 - multicolinearidade

40
Econometria Tópico 3 – Regressão Múltipla Quebra dos pressupostos: Multicolinearidade Ricardo Bruno N. dos Santos Professor Adjunto da Faculdade de Economia e do PPGE (Economia) UFPA

description

Vídeos exemplos da Aula de Econometria do Curso de Economia da Universidade Federal do Pará. Assunto: Multicolinearidade

Transcript of 05 tópico 4 - multicolinearidade

Page 1: 05   tópico 4 - multicolinearidade

EconometriaTópico 3 – Regressão Múltipla

Quebra dos pressupostos: Multicolinearidade

Ricardo Bruno N. dos SantosProfessor Adjunto da Faculdade de Economia

e do PPGE (Economia) UFPA

Page 2: 05   tópico 4 - multicolinearidade

Lembre-se que os vídeos necessários para oacompanhamento dessa apresentação são todos osvídeos que iniciam por 05, e encontram-se dentro dapasta Vídeos no mediafire.

Link do mediafire:

http://www.mediafire.com/?q1dbpxh1b4uxo

No Slideshare:

Page 3: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeA hipótese 8 do MCRL enfatiza que não há

multicolinearidade entre as variáveis independentespresentes no modelo de regressão. Aqui estaremosinteressados em verificar:

1) Qual a natureza da multicolinearidade?

2) A multicolinearidade é realmente um problema?

3) Quais são suas consequências práticas?

4) Como é detectada?

5) Que medidas podem ser tomadas para atenuar oproblema da multicolinearidade?

Page 4: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeCom relação a sua natureza a multicolinearidade surgiuinicialmente com o conceito da existência de uma linearidade“perfeita” ou exata entre duas variáveis independentes.

A principal causa da multicolinearidade é influenciar nos errospadrão dos coeficientes, fazendo com que tais sejammenores. Portanto, seu principal impacto é dificultar aestimação dos parâmetros da equação.

Vejamos agora um exemplo concreto de multicolinearidadeperfeita e uma outra não perfeita, porém, alta.

Page 5: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadePodemos estabelecer o grau de multicolinearidade conformeobservação gráfica das correlações indicadas por Gujarati:

Page 6: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadePodemos observar o seguinte impacto da multicolinearidadeperfeita sobre os coeficientes e erros padrões de X:

𝛽2 = 𝑦𝑖𝑥2𝑖 𝑥3𝑖

2 − 𝑦𝑖𝑥3𝑖 𝑥2𝑖𝑥3𝑖

𝑥2𝑖2 𝑥3𝑖

2 − 𝑥2𝑖𝑥3𝑖2

e

𝑣𝑎𝑟 𝛽2 =𝜎2

𝑥2𝑖2 1 − 𝑟23

2

Page 7: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeOu seja, se a multicolinearidade for perfeita os coeficientes deregressão das variáveis X serão indeterminados e seus errospadrão infinitos. Se a multicolinearidade for menos queperfeita, os coeficientes de regressão, embora sejamdeterminados, possuirão grande erro padrão, o que impede aprecisão ou exatidão dos coeficientes.

Page 8: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeFontes da multicolinearidade:

1) Método da coleta de dados empregado.

2) Restrições ao modelo ou à população que está sendoamostrada. Exemplo, regressão do consumo deeletricidade contra renda (X2) e o tamanho da casa (X3),há uma restrição física na população, no sentido de que asfamílias com renda mais altas em geral têm casas maiores.

3) Especificação do modelo.

4) Um modelo sobredeterminado. Quando em um modeloexistem mais variáveis que informações.

Page 9: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeEstimação na presença de multicolinearidade

Para o modelo

𝑦𝑖 = 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + 𝑢𝑖

Teremos

𝛽2 = 𝑦𝑖𝑥2𝑖 𝑥3𝑖

2 − 𝑦𝑖𝑥3𝑖 𝑥2𝑖𝑥3𝑖

𝑥2𝑖2 𝑥3𝑖

2 − 𝑥2𝑖𝑥3𝑖2

𝛽3 = 𝑦𝑖𝑥3𝑖 𝑥2𝑖

2 − 𝑦𝑖𝑥2𝑖 𝑥2𝑖𝑥3𝑖

𝑥2𝑖2 𝑥3𝑖

2 − 𝑥2𝑖𝑥3𝑖2

Page 10: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeSuponha que 𝑋3𝑖 = 𝑋2𝑖

Substituindo na equação teremos:

𝛽2 = 𝑦𝑖𝑥2𝑖 2 𝑥2𝑖

2 − 𝑦𝑖𝑥2𝑖 𝑥2𝑖𝑥2𝑖

𝑥2𝑖2 2 𝑥2𝑖

2 − 2 𝑥2𝑖𝑥2𝑖2

=0

0Tanto o estimador beta 2 quanto o beta 3 serãoindeterminados nesse caso.

Agora porque isso acontece?

Page 11: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeDevemos lembrar do significado do estimador 𝛽2. Ele nosfornece a variação do valor médio de Y quando X2 varia umaunidade, mantendo X3 constante. Porém como X2 e X3 sãouma relação linear perfeita, a medida que um varia o outrotambém irá variar, variação esta medida por . Ou seja, nãopodemos distinguir diferenças entre o X2 e o X3.

Considerando a relação perfeita entre X2 e X3 podemostambém estabelecer que:

𝑦𝑖 = 𝛽2𝑥2𝑖 + 𝛽3(𝑥2𝑖) + 𝑢𝑖

𝑦𝑖 = ( 𝛽2 + 𝛽3)𝑥2𝑖 + 𝑢𝑖

𝑦𝑖 = 𝛼𝑥2𝑖 + 𝑢𝑖

Page 12: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeCom isso:

𝛼 = 𝛽2 + 𝛽3 = 𝑦𝑖𝑥2𝑖

𝑥2𝑖2

Estimação na presença de multicolinearidade “alta”, mas“imperfeita”

A primeira situação é algo muito raro em se verificar em setratando de dados econômicos.

Porém, o que pode ser muito comum é uma colinearidadeentre duas variáveis que seja alta, podemos identificar issopela seguinte relação:

𝑥3𝑖 = 𝑥2𝑖 + 𝑣𝑖

Page 13: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeAgora, a relação entre X3 e X2 está adicionada a um erroaleatório v, nesses termos temos, evidentemente, queconsiderar que ≠ 0 e 𝑥2𝑖𝑣𝑖 = 0.

O valor do estimador beta 2 então será

𝛽2 = 𝑦𝑖𝑥2𝑖 2 𝑥2𝑖

2 + 𝑣𝑖2 − 𝑦𝑖𝑥2𝑖 + 𝑦𝑖𝑣𝑖 𝑥2𝑖

2

𝑥2𝑖2 2 𝑥2𝑖

2 + 𝑣𝑖2 − 2 𝑥2𝑖

2 2

Agora a equação pode ser estimada. No entanto, conformepreviamente observado, o problema residirá agora no errodos estimadores que será supereistimado.

Page 14: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeConsequências teóricas da Multicolinearidade

Como foi visto o maior problema da multicolinearidadeocorrerá apenas, quando ela for perfeita, ou seja, podemossubentende que a multicolinearidade será um fenômeno quese apresentará na sua forma “alta” e não perfeita.

Quando ocorre uma alta colinearidade entre duas variáveisindependentes, gerando o efeito da multicolinearidade, osestimadores poderão, portanto, ser obtidos e elesconservarão a propriedade sendo não viesados.

Page 15: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeGoldber acrescentou outro problema que acarreta emmulticolinearidade, trata-se da micronumerosidade. A mesmaocorre quando o número de observações é muito próximo aonúmero de variáveis no modelo. Poderíamos associar isso aoexercício feito sobre o capítulo 7, quando o número devariáveis era igual ao número de observações do modelo,impedindo o cálculo dos erros padrão dos estimadores e davariância do resíduo.

Muitas das vezes se é resolvido o problema damicronumerosidade, aumentando o tamanho da amostra,resolvemos o problema da multicolinearidade.

Page 16: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeConsequências práticas da multicolinearidadeAs principais consequências listadas por Gujarati são:a) Embora sejam MELNT, os estimadores de MQO têm GRANDE

VARIÂNCIAS e COVARIÂNCIAS, tornando difícil uma estimaçãoprecisa e confiante;

b) Devido a consequência (a), os INTERVALOS DE CONFIANÇAtendem a ser muito mais amplos, levando à aceitação imediatada “hipótese nula H0” (ou seja, de que o verdadeirocoeficiente populacional seja igual a zero).

c) Também devido a consequência (a), a razão t de um ou maiscoeficientes tende a ser estatisticamente insignificante.

d) Embora a razão t de um ou mais coeficientes sejaestatisticamente insignificante, o R2, a medida geral daqualidade do ajustamento, pode ser muito alto.

e) Os estimadores de MQO e seus erros padrão podem sersensíveis a pequenas alterações nos dados.

Page 17: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadePara exemplificar isso, podemos estabelecer considerando afórmula das variâncias que:

𝑣𝑎𝑟 𝛽2 =𝜎2

𝑥2𝑖2 1 − 𝑟23

2

𝑣𝑎𝑟 𝛽3 =𝜎2

𝑥3𝑖2 1 − 𝑟23

2

E

𝑐𝑜𝑣 𝛽2, 𝛽3 =𝑟23𝜎2

1 − 𝑟232 𝑥2𝑖

2 𝑥3𝑖2

Page 18: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeSe aplicarmos o limite de 𝑟23 → 1 então teremos:

lim𝑟23→1

𝑣𝑎𝑟( 𝛽2) = ∞

lim𝑟23→1

𝑣𝑎𝑟( 𝛽3) = ∞

lim𝑟23→1

𝑐𝑜𝑣( 𝛽2, 𝛽3) = ∞

Tendo de porte dessa informação, podemos identificar avelocidade em que esse aumento das variâncias ecovariâncias estão ocorrendo. Tal aspecto ajudou aimplementar o fator de inflação da variância (FIV), que édefinido como:

𝐹𝐼𝑉 =1

1 − 𝑟232

Page 19: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeO FIV mostra como a variância de um estimador é inflada pelapresença da multicolinearidade. Quando 𝑟23

2 aproxima-se de1, o FIV aproxima-se do infinito. Ou seja, quando acolinearidade aumenta, a variância de um estimador aumentae, no limite, pode tornar-se infinita. Se não houvercolinearidade entre X2 e X3 o FIV será 1. Assim as equaçõesde variância podem ser expressas também a partir do FIV.

𝑣𝑎𝑟 𝛽2 =𝜎2

𝑥2𝑖2 𝐹𝐼𝑉

𝑣𝑎𝑟 𝛽3 =𝜎2

𝑥3𝑖2 𝐹𝐼𝑉

Que mostra que as variâncias de 𝛽2 e 𝛽3 são diretamenteproporcionais ao FIV.

Page 20: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeÉ mostrada na Tabela 10.1 como evolui a Variância, o FIV e aCovariância a medida que aumenta-se a colinearidade(correlação) entre as variáveis X2 e X3.

Page 21: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeEntão, graficamente o comportamento da variância doestimador beta 2 tem um comportamento de crescimentoexponencial a medida que a colinearidade se aproxima de 1.

Page 22: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeOutro indicado útil utilizado é o TOL, que é conhecido comoTOLERÂNCIA, trata-se da relação inversa da FIV, ou seja:

𝑇𝑂𝐿𝑗 =1

𝐹𝐼𝑉𝑗= (1 − 𝑅𝑗

2)

Ou seja, quando 𝑅𝑗2 = 1 (colinearidade perfeita), 𝑇𝑂𝐿𝑗 = 0 e

𝑅𝑗2 = 0 (ausência de colinearidade), 𝑇𝑂𝐿𝑗 = 1.

Page 23: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeINTERVALOS DE CONFIANÇA MAIS AMPLOS.

Dado os erros padrão grandes, os intervalos de confiança dosparâmetros populacionais relevantes tendem a ser maiores,como podemos ver na Tabela 10.2 abaixo.

Page 24: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadePor exemplo, quando 𝑟23 = 0,95, o intervalo de confiança

para 𝛽2 é maior que quando 𝑟23 = 0 por um fator de 10,26,ou cerca de 3.

Dessa forma, em casos de alta multicolinearidade, os dadosda amostra podem ser compatíveis com um conjunto diversode hipóteses. A probabilidade de aceitar uma hipótese falsa(erro tipo II) aumenta.

Page 25: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeRAZÕES t “INSIGNIFICANTES”

Ou seja, individualmente a estatística t é importante para se

verificar a significância do estimador, pois, 𝑡 = 𝛽𝑖/𝑒𝑝( 𝛽𝑖).Porém, podemos observar que diante da multicolinearidade,os erros padrão aumentam consideravelmente, tornando osvalores t menores. Em tais casos, aceita-se cada vez mais ahipótese nula de que o verdadeira valor populacional é zero.

Page 26: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeALTO VALOR DE 𝑅2, MAS POUCA RAZÕES t SIGNIFICATIVAS.

Vamos considerar o modelo de regressão linear com kvariáveis:

𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ + 𝛽𝑘𝑋𝑘𝑖 + 𝑢𝑖

Em casos de alta colinearidade, é possível constatar, como jáverificado anteriormente, que um ou mais coeficientesangulares parciais são não significantes individualmente,baseado no teste t. Nessas situações, o 𝑅2 pode ser tão alto,como 0,9, que de acordo como teste F podemos rejeitarconvicentemente a hipótese de que 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0.De fato, esse é um dos indícios de multicolinearidade.

Page 27: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeSENSIBILIDADE DOS ESTIMADORES DE MQO E DE SEUS ERROSPADRÃO A PEQUENAS ALTERAÇÕES NOS DADOS.

Considerando uma alta colinearidade (e não a perfeita), épossível estimar os coeficientes de regressão, mas asestimativas e seus erros padrão tornam-se muito sensíveis atémesmo à menor alteração nos dados.

O autor faz uso de uma tabela com 5 informações, onde sãoalteradas apenas a ordem de algumas observações da variávelX3. Trata-se das tabelas 10.3 e 10.4.

No slide a seguir encontram-se as tabelas e as estimativasantes e depois da modificação dos dados:

Page 28: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade

Os Resultados de cada modelo são:

Page 29: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeDetecção da MULTICOLINEARIDADE

Segundo Kmenta:

1 – A multicolinearidade é uma questão de grau e não detipo. A distinção significativa não é entre a presença e aausência da mesma, mas entre seus vários graus.

2 – Uma vez que a multicolinearidade refere-se à condiçãodas variáveis explanatórias que se supõe não seremestocásticas, ela é uma característica da amostra, e não dapopulação.

Ou seja, não são realizado testes para a multicolinearidade,mas é medido o grau da multicolinearidade em uma amostraespecífica.

Page 30: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeCom isso, podemos estabelecer algumas observações ouregras a serem utilizadas para identificar a presença ofenômeno da multicolinearidade em uma amostra de dados.

Vejamos os principais:

1) 𝑅2 alto, mas poucas razões t significativas. É um dos maisclássicos e diretos sintomas da presença daMulticolinearidade. Evidencia-se como 𝑅2 alto aquelescom valor acima de 0,8.

2) Altas correlações entre os pares das variáveisindependentes. Se for observadas correlações acima de0,8 entre os regressores, devemos ligar o sinal de alertasobre a presença da multicolinearidade.

Page 31: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade3) Regressões auxiliares. É uma das verificações mais comuns,trata-se de uma forma de se descobrir qual variável X estámais relacionada a outras variáveis X. A dinâmica do testeconsiste em tirarmos a variável dependente do modelo (Y) eelencar (de forma alternada) outra variável independente eutiliza-la como dependente contra as demais em um novomodelo. Se o R2 desse novo modelo for maior que o R2 domodelo que inclui a variável Y, então há fortes indícios dapresença da multicolinearidade.

Page 32: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeSe tivermos o seguinte modelo:𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + 𝛽4𝑋4𝑖 + 𝑢𝑖

𝑅𝑦2

E

𝑋2𝑖 = 𝛼1 + 𝛼2𝑋3𝑖 + 𝛼3𝑋4𝑖 + 𝑣𝑖

𝑅𝑋2

2

Se o 𝑅𝑋2

2 > 𝑅𝑦2, então temos forte evidência da existência da

Multicolinearidade.

Tal regressão pode ser ainda feita considerando as outrasvariáveis X (X3 e X4) como variáveis dependentes.

Page 33: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade4) TOL e FIV.

5) Diagrama de dispersão.

Page 34: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade

Page 35: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeMedidas Corretivas

Deixa para lá (Não fazer nada). Gujarati remete a um exemplodo Blanchard indicando que a multicolinearidade é algoinerente dos dados (Micronumerosidade) e muitas das vezesnão temos escolha sobre os dados disponíveis para a análiseempírica.

1) Ter uma informação a priori. É tratado o exemplo sobreconsumo (Y) sendo afetado por riqueza (X2) e renda (X3). Ora,se temos a informação de que há um forte grau entre asvariáveis X2 e X3, porque manter as duas no modelo, bastarodar o modelo apenas com uma. O conhecimento de vastaliteratura é que nos propicia diversos elementos para definirse duas variáveis específicas irão relacionar a algo comum ounão.

Page 36: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade2) Combinar dados de corte transversal com séries de tempo.Esse tipo de medida é uma tentativa de aumentar o númerode observações na amostra. Empilhar os dados dessa forma éconhecido como montagem de um painel.

3) Exclusão de variável(is) e viés de especificação. Excluir umadas variáveis que está causando a colinearidade é a saídamais comum adotada por quem modela. Porém, em algumassituações essa decisão nos leva a tomar decisões polêmicas.Um dos exemplos citados no livro e a relação que pode existirentre renda e riqueza. Se a teoria econômica informa queessas variáveis devem ser estimadas em conjunto, e verifica-se que ambas possuem forte correlação (colinearidade) entãoo que devemos atender, a situação em que a teoria define apresença da mesma, ou então tirar a variável do modelo?

Page 37: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeQuando acontece esse empasse, o que permite mantes duasvariáveis no mesmo modelo e a transformação das mesmas.

4) Transformação de variáveis. Usar artifícios como tirar o log,definir uma primeira diferença, ou ate estipular umatransformação proporcional são artifícios que podem serutilizados para modificar variáveis do modelo.

5) Inserir novos dados. É um artifício muito interessante, noentanto inserir novas informações na amostra pode semostrar um processo caro e demorado, o que torna algopouco comum de ser feito.

Page 38: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

Multicolinearidade6) Reduzindo a colinearidade em regressões polinomiais;

7) Uso da análise multivariada para criação de fatores.

Page 39: 05   tópico 4 - multicolinearidade

Quebra dos pressupostos:

MulticolinearidadeExemplo: Uso dos dados de Longley.

No Gretl será realizado a partir da tabela 10.7, a mesmaestará disponível no mediafire com o nome “Gujarati - Tabela10.7 - Dados de Longley.gdt”

Page 40: 05   tópico 4 - multicolinearidade

FIM DO TÓPICO

3