Modelos dinâmicos Bayesianos para dados de painel usando ...

Modelos dinamicos Bayesianos para dados

de painel usando distancias economicas

Larissa de Carvalho Alves

Universidade Federal do Rio de Janeiro

Instituto de Matematica

Departamento de Metodos Estatsticos

2010

Modelos dinamicos Bayesianos para dadosde painel usando distancias economicas

Larissa de Carvalho Alves

Dissertacao submetida ao Corpo Docente do Instituto de Matematica - Departamento

de Metodos Estatsticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte

dos requisitos necessarios a obtencao do grau de Mestre em Estatstica.

Aprovada por:

Prof. Helio S. Migon.

PhD - UFRJ - Orientador.

Esther Salazar.

D.Sc. - SAMSI - Co-orientadora.

Prof. Alexandra M. Schmidt

PhD - UFRJ.

Prof. Juliano J. Assuncao

D.Sc. - Puc-Rio.

Rio de Janeiro, RJ - Brasil

2010

ii

FICHA CATALOGRAFICA

Alves, Larissa de Carvalho.

Modelos dinamicos Bayesianos para dados de painel usando distancias economicas

Larissa de Carvalho Alves.

Rio de Janeiro: UFRJ, IM, DME, 2010.

Dissertacao - Universidade Federal do Rio de Janeiro, IM, DME.

1. Introducao. 2. Distancias Economicas.

3. Modelos Espaco Temporais com Distancias Economicas.

4. Aplicacoes.

5. Conclusoes e Trabalhos Futuros.

(Mestrado-UFRJ/IM/DME) I. Migon, Helio S.

II. Universidade Federal do Rio de Janeiro III. Ttulo.

iii

A Deus, autor e consumador da minha fe.

A minha famlia.

A minha avo Georgeta. (in memorian)

iv

Eu te agradeco, Deus

Por se lembrar de mim, e pelo teu favor

E o que me faz crescer;

Eu vivo pela fe, e nao vacilo;

Eu nao paro, eu nao desisto,

Eu sou de Deus, eu sou de Cristo.

Voce mudou a minha historia

E fez o que ninguem podia imaginar

Voce acreditou e isso e tudo

So vivo pra voce Nao sou do mundo, nao.

A honra, a gloria, a forca

O louvor a Deus

E o levantar das minhas maos

E pra dizer que te pertenco, Deus.

(. . .)

Eu te agradeco, Deus

Que no deserto nao me deixou morrer

E nem desanimar

E como aquela mae, que nao desiste

voce nao se esqueceu, voce insiste...

Voce mudou a minha historia

E fez o que ninguem podia imaginar

Voce acreditou e isso e tudo

So vivo pra voce Nao sou do mundo, nao.

A honra, a gloria, a forca

O louvor a Deus

E o levantar das minhas maos

E pra dizer que te pertenco, Deus.

Eu te Agradeco, Kleber Lucas.

v

Agradecimentos

Primeiramente, agradeco a Deus por sua imensa misericordia e graca, pelo socorro

bem presente nas tribulacoes.

A minha famlia, a base de tudo. Aos meus pais, pelo amor incondicional, dedicacao

e oracoes. Pelo financiamento dos meus estudos e por sempre acreditarem que eu era

capaz. A minha irma, pela amizade, pelos conselhos e por tantas duvidas tiradas.

Apesar de neste momento estar tao longe, foi uma irma e tanto quando se trata das

noites viradas para estudar e do compartilhamento do computador. As minhas tias, tios,

primas e primos pela forca passada mesmo por telefone e por sempre torcerem pelo meu

sucesso. A minha avo Georgeta (in memorian), que apesar de ter partido ano passado e

estar deixando enormes saudades, tal acontecimento tem me dado forcas para prosseguir.

Obrigada vo por ter cedido parte da sua vida para cuidar de mim, por ter deixado todos

os filhos em Salvador e vindo para o Rio por mim e pela minha irma, serei eternamente

grata a senhora.

Ao Cesar pelo amor, compreensao e amizade. Por me apoiar em cada decisao tomada

e por me fazer a cada dia mais feliz.

Aos meus amigos e companheiros do DME que compartilharam comigo experiencias,

momentos de dificuldade e de alegria e fizeram esta caminhada menos sofrida e mais

divertida. Em especial, agradeco a minha turma Joao, Kelly, Nassif, Targino e Thiago

voces sao a turma que qualquer um gostaria de fazer parte, muito obrigada, voces sao

muito especiais. Em mais que especial, a Panela (Camilinha, Joao e Kelly) que unida

jamais sera vencida, que crise mundial nao afeta, nem uma marolinha, rs. Nao tenho

nem palavras para dizer o quanto voces foram e serao especiais em todos os momentos.

vi

Aos meus velhos amigos capianos por quase sempre compreenderem minha ausencia

nos eventos, aniversarios, Cha das 5, despedidas e recepcoes. Voces sao inesquecveis.

Aos meus velhos amigos de graduacao por passarem comigo uma importante fase da

minha vida e marcarem cada uma delas de forma especial. Aos meus irmaos em Cristo,

Geisa, Romario, Ana Paula e Fernando, pelas oracoes e conselhos.

A todos os meus professores de graduacao que me passaram com grande sabedoria seus

conhecimentos matematicos. Em particular, obrigada Rubinho, Jair, Monica, Luziane e

Ivo. A todos os professores do programa de pos-graduacao do DME-UFRJ, pelo valioso

conhecimento transmitido, pelas maravilhosas aulas e toda a disponibilidade para ajudar.

Em especial, a Alexandra pelos conselhos e ajuda nos momentos de dificuldade.

Ao meu orientador, professor Helio Migon, pela experiencia passada e pela ajuda no

desenvolvimento deste trabalho.

A minha co-orientadora Esther Salazar, por toda a experiencia computacional que

hoje possuo, pela paciencia infinita ao longo deste ano, pelas muitas horas de dedicacao,

pela ajuda e organizacao na resposta aos e-mails depois da sua viagem.

Por fim, agradeco aos professores Alexandra Schmidt e Juliano Assuncao por

aceitarem participar da banca, ao Conley, por fonecer os dados de uma das aplicacoes

deste trabalho e a Capes por ter financiado este estudo.

vii

Resumo

Neste trabalho apresentamos um modelo econometrico espaco-temporal para dados

de painel, onde os elementos correspondem a agentes economicos. A dependencia espacial

entre agentes e caracterizada por funcoes de distancias economicas que sao incorporadas

tanto na estrutura de media como na estrutura de covariancia do modelo.

Partimos de modelos de regressao simples e motivamos a utilizacao de modelos

econometricos espaciais, distancias entre agentes e adicionalmente, para acomodar

possveis outliers, introduzimos um modelo de regressao t-Student. Temos como objetivo

incorporar relacoes entre setores da economia que sao dadas por suas similaridades e alem

disso fazer a estimacao dos modelos lancando mao de uma abordagem completamente

Bayesiana. Vamos utilizar o modelo proposto e suas variacoes, para modelar dois

conjuntos de dados. Na primeira aplicacao estudamos a producao mensal dos movimentos

comuns entre vinte setores industriais dos EUA. A segunda aplicacao refere-se a setores

da economia brasileira, na qual as observacoes sao dadas por ndices de crescimento do

Produto Interno Bruto.

Palavras-chave: Econometria espacial; Distancias economicas; Inferencia bayesiana;

Modelos dinamicos; Metodos MCMC

viii

Abstract

In this work we present an econometric spatio-temporal models for panel data, where

the elements correspond to economic agents. The spatial dependence between agents

is characterized by functions of economic distances that are incorporated into both the

mean structure as the covariance structure of the model.

We start with a simple regression model and motivate the use of spatial econometric

models, distances between agents and, additionally, we introduce a Student-t model

to accommodate possible outliers. Our goal is to incorporate relationships between

economic sectors that are given by their similarities and also to estimate the models using

a fully Bayesian approach. We use the proposed model and its variations, to analyze two

datasets. In the first application, we study the monthly production of twenty industries

in the U.S.. The second application refers to sectors of the Brazilian economy where the

observations are growth rates of Gross Domestic Product.

Keywords: Spacial econometrics; Economic distances; Bayesian inference; Dynamic

models; MCMC methods

ix

Sumario

1 Introducao 2

1.1 Modelos Dinamicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Modelos Espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Modelos Espaco-Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4 Selecao de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5 Organizacao da Dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Distancias Economicas 11

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 Construcao de Distancias Economicas . . . . . . . . . . . . . . . . . . . . 13

2.2.1 Aplicacao a matrizes de insumo-produto norte-americanas . . . . 14

2.2.2 Aplicacao a matrizes brasileiras de insumo-produto . . . . . . . . 24

3 Modelos Espaco-Temporais com Distancias Economicas 31

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2.1 Especificacoes para G(Dt) e (Dt) . . . . . . . . . . . . . . . . . 35

3.2.2 Nao separabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2.3 Acomodacao de outliers . . . . . . . . . . . . . . . . . . . . . . . 39

3.2.4 Funcao de verossimilhanca . . . . . . . . . . . . . . . . . . . . . . 41

3.3 Procedimento de Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4 Modelando Series Temporais Nao Estacionarias . . . . . . . . . . . . . . 43

3.5 Estudo Numerico Baseado em Dados Artificiais Normais . . . . . . . . . 47

x

3.5.1 Variancia explicada . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.5.2 Algoritmo para o calculo da variancia de zt e t . . . . . . . . . . 51

3.5.3 Resultados da variancia explicada . . . . . . . . . . . . . . . . . . 52

3.5.4 Comparacao entre modelos . . . . . . . . . . . . . . . . . . . . . . 54

3.5.5 Resultados a posteriori . . . . . . . . . . . . . . . . . . . . . . . . 55

3.6 Estudo Numerico Baseado em Dados Artificiais t-Student . . . . . . . . . 60

3.6.1 Regressao t-Student . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.6.2 Contaminacao dos dados . . . . . . . . . . . . . . . . . . . . . . . 64

4 Aplicacoes 67

4.1 Atividades da Economia Norte-Americana . . . . . . . . . . . . . . . . . 68

4.1.1 Analise descritiva dos dados . . . . . . . . . . . . . . . . . . . . . 68

4.1.2 Modelos propostos . . . . . . . . . . . . . . . . . . . . . . . . . . 73

4.1.3 Principais resultados . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.2 Setores da Economia Brasileira . . . . . . . . . . . . . . . . . . . . . . . 85

4.2.1 Analise descritiva dos dados . . . . . . . . . . . . . . . . . . . . . 85

4.2.2 Modelos propostos . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.2.3 Principais resultados . . . . . . . . . . . . . . . . . . . . . . . . . 94

5 Conclusoes e Trabalhos Futuros 101

A Metodos de Simulacao Estocastica 104

A.1 Algoritmo de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . 104

A.2 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

A.3 Filtro de Kalman e FFBS . . . . . . . . . . . . . . . . . . . . . . . . . . 106

A.4 Distribuicoes condicionais completas . . . . . . . . . . . . . . . . . . . . 107

B Cadeias dos Parametros a Posteriori 110

B.1 Para Aplicacao dos Dados Norte-Americanos . . . . . . . . . . . . . . . . 110

B.2 Para Aplicacao dos Dados Brasileiros . . . . . . . . . . . . . . . . . . . . 113

xi

Lista de Tabelas

2.1 Setores norte-americanos manufaturados indexados por dois dgitos do

codigo SIC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Atividades da economia brasileira . . . . . . . . . . . . . . . . . . . . . . 26

3.1 Probabilidade de 6= 1 a posteriori para diferentes valores de . . . . . . 45

3.2 Probabilidade de i 6= 1 a posteriori para diferentes setores . . . . . . . . 46

3.3 Comparacao de modelos pelo EMQ e EMA . . . . . . . . . . . . . . . . . 55

3.4 Estatsticas dos valores das amostras de , 2, 2, e . . . . . . . . . . 60

3.5 Estatsticas das amostras dos parametros para diferentes prioris para . 62



4.1 Analise exploratoria dos dados transformados . . . . . . . . . . . . . . . 72

4.2 Criterios de comparacao de modelos . . . . . . . . . . . . . . . . . . . . . 76

4.3 Estatsticas dos valores das amostras dos parametros. . . . . . . . . . . . 80

4.4 Analise exploratoria dos dados tranformados . . . . . . . . . . . . . . . . 88

4.5 Criterios de comparacao dos modelos simples . . . . . . . . . . . . . . . . 90

4.6 Criterios de comparacao dos modelos intermediarios . . . . . . . . . . . . 93

4.7 Criterios de comparacao de modelos completos . . . . . . . . . . . . . . . 95

4.8 Estatsticas dos valores das amostras dos parametros para os modelos 1 e 2 96

xii

Lista de Figuras

1.1 Ciclo de inferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1 Grafico CMDS das distancias economicas do insumo entre setores norte-

americanos, para o ano de 1987. . . . . . . . . . . . . . . . . . . . . . . . 18

2.2 Grafico CMDS das distancias economicas do produto entre setores norte-

americanos, para o ano de 1987. . . . . . . . . . . . . . . . . . . . . . . . 18

2.3 Imagem e representacao CMDS dos setores norte-americanos relativo as

distancias economicas sob a otica do produto, ao longo dos anos. . . . . . 20

2.4 Imagem e representacao CMDS dos setores norte-americanos relativo as

distancias economicas sob a otica do insumo, ao longo dos anos. . . . . . 21

2.5 Imagem das distancias economicas de insumo entre setores norte-

americanos interpoladas por spline cubico. . . . . . . . . . . . . . . . . . 23

2.6 Imagem das distancias economicas de produto entre setores norte-

americanos interpoladas por spline cubico. . . . . . . . . . . . . . . . . . 24

2.7 Imagem das distancias economicas de produto entre setores brasileiros ao

longo dos anos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.8 Imagem das distancias economicas de insumo entre setores brasileiros ao

longo dos anos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.9 Imagem das distancias economicas de produto entre setores brasileiros

interpoladas por spline cubico. . . . . . . . . . . . . . . . . . . . . . . . . 30

3.1 Relacao graus de liberdade e curtose . . . . . . . . . . . . . . . . . . . . . 40

3.2 Plot das posicoes dos 20 agentes . . . . . . . . . . . . . . . . . . . . . . . 48

3.3 Matriz de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

xiii

3.4 Serie dos agentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.5 Porcentagem da variancia explicada para os agentes 2, 10 e 15 ao longo

do tempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.6 Porcentagem da variancia explicada para os tempos 50 e 100 ao longo dos

locais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.7 Tracos das cadeias a posteriori dos parametros. . . . . . . . . . . . . . . 58

3.8 Serie dos agentes 9 e 15 e seus intervalos de credibilidade. . . . . . . . . 59

3.9 Verificacao de Outliers. (Acima) Serie temporal do agente 3. (Abaixo)

Box-plots das amostras a posteriori de 13t (t = 1, . . . , 100). . . . . . . . . 63

3.10 Series dos agentes contaminados . . . . . . . . . . . . . . . . . . . . . . . 64





4.1 Series temporais dos ndices mensais de crescimento da producao

industrial de seis setores. . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.2 Series temporais das taxas mensais de crescimento da producao industrial

de seis setores - series tranformadas e padronizadas. . . . . . . . . . . . . 70

4.3 Serie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de

95% modelado pela classe t-Student. . . . . . . . . . . . . . . . . . . . . . 78

4.4 Serie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de

95% modelado pela classe Normal. . . . . . . . . . . . . . . . . . . . . . . 79

4.5 Comparacao das series temporais yt e zt correspondentes aos agentes 3

-SIC22- (Acima) e 18 -SIC37- (Abaixo), considerando o modelo normal

(iii). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4.6 (Acima) Comparacao das series temporais de yt e zt correspondente

ao agente 3 -SIC22- considerando o modelo t-Student (ii). (Abaixo)

Verificacao de outliers: box-plots das amostras a posteriori de 13t . . . . . 83

xiv

4.7 (Acima) Comparacao das series temporais de yt e zt correspondente

ao agente 18 -SIC37- considerando o modelo t-Student (ii). (Abaixo)

Verificacao de outliers: box-plots das amostras a posteriori de 118t. . . . . 84

4.8 Series temporais do crescimento dos ndices trimestrais do PIB de seis

setores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

4.9 Series temporais das taxas trimestrais de crescimento do PIB de seis

setores - series tranformadas e padronizadas. . . . . . . . . . . . . . . . . 87

4.10 Porcentagem da variancia explicada pelo latente e pelo erro considerando

o setor 04 para o modelo t-Student simples. . . . . . . . . . . . . . . . . . 91

4.11 Porcentagem da variancia explicada pelo latente e pelo erro considerando

o setor 09 para o modelo t-Student simples. . . . . . . . . . . . . . . . . . 91

4.12 (Acima) Comparacao das series temporais de yt e zt correspondente ao

setor 4 considerando o modelo 1. (Abaixo) Verificacao de outliers: box-

plots das amostras a posteriori de 14t . . . . . . . . . . . . . . . . . . . . 97










xv

Captulo 1

Introducao

Econometria espacial e uma area de estudo, ramo da econometria, que lida com

interacoes de estruturas espaciais em modelos de regressao linear com dados transversais

e de painel. Por painel entende-se observacoes repetidas no tempo para um numero fixo

de agentes. Ultimamente, estudos sobre a econometria espacial tem crescido muito, uma

vez que sao consideradas relacoes entre agentes. Essas relacoes sao descritas por medidas

observaveis de distancias economicas, por exemplo quando consideramos firmas ou setores

da economia como unidades observacionais e a distancia entre agentes como o volume

de comercio exterior. Anselin (1988) afirma que antigamente modelos que incorporavam

o espaco eram especializados em poucas e especficas areas, porem a ideia de interacao

espacial vem crescendo rapidamente tanto do ponto de vista aplicado como teorico.

O preco da venda de casas em um determinado local, por exemplo, pode ser

influenciada por externalidades espaciais. Nesse caso as covariaveis do modelo

explicariam o preco de cada casa a partir das suas caractersticas e a dependencia espacial

ocorreria pois, precos de casas vizinhas, ou ate mesmo sua localizacao, influenciariam o

valor da casa a ser vendida. Variaveis nao observaveis ainda podem ser consideradas,

como a urbanizacao e o desenvolvimento de uma determinada cidade, que levariam ao

aumento dos precos das casas nessa regiao e em regioes proximas. Para mais exemplos

ver LeSage e Pace (1991), Conley e Dupor (2003) e Conley e Topa (2002).

O desenvolvimento de metodos na literatura econometrica para especificar, estimar

e testar modelos que incorporam interacoes espaciais motivam ainda mais estudos nessa

1

area. Neste sentido Chen e Conley (2001) propoem um modelo semiparametrico para

dados de painel incorporando distancias economicas na sua estrutura. Por outro lado,

Conley e Dupor (2003) definem distancias economicas para esse tipo de modelagem. Eles

constroem diferentes medidas a partir da relacao de insumo e produto entre diferentes

setores, utilizando tabelas de insumo produto, onde os elementos (i, j) sao os valores das

mercadorias do setor i utilizadas no setor j.

O presente trabalho propoe um modelo econometrico baseado em um modelo dinamico

espacial para lidar com esse tipo de problema, cujos elementos correspondem a agentes

economicos. Partimos de modelos de regressao simples e motivamos a utilizacao de

modelos econometricos espaciais e distancias economicas entre agentes, onde estas

ultimas tem influencia tanto na estrutura de medias como na estrutura de covariancia.

Adicionalmente, para acomodar a presenca de possveis outliers, um modelo de regressao

t-Student e apresentado. Os modelos propostos podem ser vistos com uma extensao do

modelo apresentado em Chen e Conley (2001).

Uma forma simples de obter matrizes de distancias economicas e associa-las a matrizes

de distancias Euclidianas onde, quanto maior a medida Euclidiana entre dois agentes

menor e o peso relacionado. Nos baseamos nas metricas propostas por Conley e Dupor

(2003), que sao funcoes de distancias Euclidianas, para a construcao das distancias

economicas. Diversas interpretacoes para as metricas economicas podem ser sugeridas

dependendo do agente considerado. Por exemplo, se os agentes correspondem a setores,

pode-se dizer que os agentes estao proximos se usam insumos nas mesmas proporcoes

e longe se utilizam insumos em proporcoes diferentes. Se os agentes correspondem a

empresas, as medidas de sobreposicao em seus mercados podem ser medidas de distancias

economicas.

Dois conjuntos de dados sao modelados utilizando os modelos propostos. Na primeira

aplicacao os agentes correspondem a vinte setores industriais norte-americanos, as

distancias economicas sao baseadas em tabelas de insumo-produto e as observacoes sao

dadas pelo ndice de crescimento da producao industrial mensal entre os agentes. A

segunda aplicacao refere-se a doze setores da economia brasileira, na qual as observacoes

sao dadas por ndices de crescimento do Produto Interno Bruto (PIB) e as distancias

2

economicas sao construdas segundo tabelas do Instituto Brasileiro de Geografia e

Estatstica (IBGE).

E de suma importancia introduzir a estrutura e a ideia geral de tres tipos de

modelagens: modelos dinamicos, modelos espaciais e modelos espaco-temporais. Em

Migon et al. (2008) tais modelos sao incorporados a estruturas hierarquicas. Nas secoes

que seguem apresentaremos de forma resumida uma ideia geral desses modelos. Alem

disso, sao expostos criterios para selecao de modelos, dado que variacoes do modelo

proposto sao apresentadas ao longo do trabalho.

1.1 Modelos Dinamicos

Os modelos lineares dinamicos sao caracterizados pela modelagem de processos

indexados ao longo do tempo e sao representados por um par de equacoes, denominadas

de equacao de observacoes e equacao de evolucao dos parametros, que podem ser vistas

abaixo:

yt = Ftt + t, N(0, Vt) (1.1a)

t = Gtt1 + t, t N(0,Wt) t = 1, . . . , T. (1.1b)

onde yt e uma sequencia de observacoes ao longo do tempo condicionalmente

independentes, Ft e uma matriz conhecida k- dimensional que acomoda variaveis

explicativas, nvel, tendencia, sazonalidade, etc, t e o vetor de parametros, Gt e uma

matriz conhecida que descreve a evolucao dos parametros e Vt e Wt representam as

matrizes de covariancia dos erros associados a observacao e ao vetor de parametros,

respectivamente. Pode-se tambem definir o modelo atraves da quadrupla {Ft, Gt, Vt,Wt}.

Encontramos casos particulares da modelagem de processos indexados ao longo do

tempo em West e Harrison (1997). Por exemplo, o modelo mais simples de series

temporais e o modelo polinomial de primeira ordem, no qual F t = 1 e Gt = 1, logo

este modelo fica caracterizado pela quadrupla {1, 1, Vt,Wt}.

Do ponto de vista Bayesiano o processo de inferencia funciona de forma sequencial,

intercalando passos de evolucao, que sao feitos atraves da equacao do sistema, e passos

3

de atualizacao, feitos atraves da incorporacao da informacao obtida em yt usando o

Teorema de Bayes. Tal ciclo pode ser visto na Figura 1.1. O processo ocorre de forma

que quando chegamos ao tempo t, nossa informacao esta resumida em Dt e e baseado

nesse conjunto que faremos inferencia. E de grande interesse, nessa classe de modelos,

predizer o comportamento futuro da serie, portanto, tem-se particular interesse nas

distribuicoes preditivas, que possibilitam fazer planos a longo, medio e curto prazos e

tomar decisoes apropriadas.

t1|Dt1EV OLUCAO t|Dt1

ATUALIZACAO t|Dt

posteriori priori posteriori

yt|Dt1previsao

Figura 1.1: Ciclo de inferencia.

1.2 Modelos Espaciais

A classe de modelos espaciais esta associada a observacoes tomadas em varios locais

identificados em algum domnio espacial. Estamos tratando, portanto, de observacoes

que variam no espaco.

De acordo com a natureza das observacoes associadas ao espaco em que sao observadas

a estatstica espacial e dividida em tres areas:

(i) Geoestatstica: lidam com observacoes pontuais de uma quantidade contnua

variando sobre uma regiao e podem ser encontradas em diferentes areas da ciencia

tais como meio ambiente, mercado imobiliario, geologia, processamento de imagens,

dentre outras.

(ii) Dados de area: sao baseados em observacoes avaliadas em regioes, obtidas a partir

de um numero finito de localizacoes que compreendem toda a regiao sob estudo.

4

Exemplos relacionados aos dados de area sao a presenca de especies de uma planta

num quadrado, o numero de casos de dengue nos bairros de uma cidade, dentre

outros.

(iii) Processos pontuais sao observacoes discretas de pontos especficos em um mapa.

Exemplos relacionados a processos pontuais sao localizacoes dos ninhos de aves

em um habitat adequado ou ainda a explicacao de localizacoes de crateras lunares

atraves de meteoros ou vulcanismo.

Essa divisao da estatstica espacial esta especificada em Cressie (1993), porem, nos

sera util aspectos da modelagem de dados provenientes da area de geoestatstica.

De modo geral, quando consideramos estrutura espacial esperamos que para

localizacoes proximas, o processo se comporte de forma semelhante. Diferentemente,

quando ocorre o aumento das distancias entre as localizacoes as observacoes se tornam

menos relacionadas. Neste contexto, os objetivos em modelos espaciais sao a estimacao

dos parametros do modelo e a previsao para localizacoes ou conjunto de localizacoes nao

observadas.

No contexo de geoestatstica tem-se que {y(e) : e G} e uma realizacao parcial do

processo aleatorio {Y (e) : e G}, na qual s varia continuamente ao longo da regiao

G

Famlia Exponencial Potencia:

(d;) = exp{(d/)}

onde > 0 e parametro de escala, d e a distancia euclidiana entre dois pontos quaisquer

em G e 0 < 2. Quando = 1 obtem-se o caso particular da funcao de correlacao

exponencial e = 2 obtem-se a funcao de correlacao exponencial potencia quadratica.

Famlia Matern:

(d;;) =1

21()(2d)(2

d),

onde > 0 e o parametro de escala e e o parametro de forma. A funcao () e a funcao

Gama usual e e a funcao modificada de Bessel do terceiro tipo de ordem .

Futuramente lancaremos mao de alguns conceitos geoestatsticos adaptando-os de

forma apropriada as ideias principais da econometria. Do ponto de vista econometrico

espacial ei representa um vetor l dimensional de quantidades economicas associadas ao

agente economico i. Como as medidas economicas podem variar no tempo, e natural

indexar o vetor de quantidades economicas no tempo, {ei,t}Ni=1.

1.3 Modelos Espaco-Temporais

Ainda podemos modelar processos que variam tanto no tempo como no espaco, para

isso e preciso considerar modelos que capturem a estrutura de covariancia existente nas

observacoes. Considerar a modelagem de um processo tambem ao longo de diferentes

instantes de tempo, alem da variacao no espaco, torna a estrutura de covariancia mais

complexa. As equacoes do sistema em (1.1) ja nos fornecem uma dinamica temporal.

Resta-nos entao incorporar a estrutura espacial que normalmente e inserida na matriz de

covariancia da equacao de evolucao dos parametros.

Uma importante questao em modelos espaco-temporais e a nocao de separabilidade

ou nao separabilidade da estrutura de covariancia. Especificar uma funcao de covariancia

separavel e uma das formas mais simples de se obter uma covariancia valida para

processos que variam no espaco e no tempo, porem, a hipotese de separabilidade induz

6

limitacoes na estrutura de correlacao, ja que muitas areas de aplicacao apresentam

correlacoes espaciais que variam temporalmente. Schmidt e Sanso (2006) discutem a

modelagem Bayesiana da estrutura de covariancia em processos espaco-temporais.

E muito comum denotar as localizacoes onde as medidas sao feitas por e e os tempos

de medicao por t. Utilizaremos futuramente uma modelagem espaco-temporal, porem,

as localizacoes serao tratadas como agentes economicos e as observacoes sao realizadas

nesses agentes a cada instante de tempo, que sera medido discretamente. Alem disso, mais

detalhes com relacao a estrutura de covariancia do modelo proposto estao especificados

na Subsecao 3.2.2.

1.4 Selecao de Modelos

No Captulo 3, modelos serao propostos para dois conjuntos de dados reais. Assim,

surge a necessidade de metodos que possibilitem selecionar qual dos modelos propostos

melhor se ajusta aos dados. Os principais criterios utilizados sao: Deviance Information

Criterion (DIC), de Spiegelhalter et al. (2002) e regras escore, de Gneiting et al. (2007).

Spiegelhalter et al. (2002) propoem um criterio Bayesiano para escolha entre modelos

hierarquicos que considera tanto o ajuste do modelo como a sua complexidade. Para um

modelo de probabilidade p(y|) com dados observados y = (y1, . . . , yn), temos:

DIC = E[D(|y)] + pD (1.2)

no qual D() e a forma geral da deviance Bayesiana que e dada por:

D() = 2log[p(y|)] + 2log[f(y)] (1.3)

onde f(y) e um fator de padronizacao. Segundo Spiegelhalter et al. (2002), para

comparacao de modelos, e suficiente assumir f(y) = 1. A bondade de ajuste e medida

pelo termo E[D(|y)] da equacao (1.2), ja a complexidade do modelo e medida pelo

numero de parametros, definido por:

pD = E[D(|y)]D(E[|y]) (1.4)

De acordo com esse criterio prefere-se o modelo com menor DIC.

7

Gneiting et al. (2007) propoem um criterio cujo objetivo e verificar a bondade de

ajuste. Regras escore, em um contexto Bayesiano, sao consideradas como medidas de

comparacao de modelos nesse caso. O escore medio e definido por:

S() =1

NT

Tt=1

Ni=1

S(P, yit) (1.5)

onde P = p(y|) e o modelo parametrico e S alguma regra escore propria.

Gneiting et al. (2007) discutem uma serie de regras escore, em particular vamos

considerar o escore logartmico(LS) e o escore probabilstico de posto contnuo (CRPS).

Ambos escores sao orientados positivamente, ou seja, o modelo com maior S() e

considerado melhor.

O LS e dado por:

LS(P, yit) = log p(yrep = yit|y) (1.6)

onde yrep e denotado por uma replica do vetor de observacoes. Em palavras, LS e o

logaritmo da densidade preditiva e Gschlol e Czado (2005) aproximam essa medida por

uma amostra a posteriori do algoritmo MCMC.

O CRPS pode ser expresso como:

CRPS(P, yit) =1

2E|yrep,it yrep,it| E|yrep,it yit| (1.7)

onde yrep,it e yrep,it sao replicas independentes da distribuicao preditiva a posteriori,

p(|y). Gschlol e Czado (2005) tambem estimam o CRPS de forma simples utilizando

as sadas do MCMC.

1.5 Organizacao da Dissertacao

A presente dissertacao esta organizada como descrito a seguir. O Captulo 2 introduz

distancias economicas por meio de exemplos e apresenta uma forma simples de obter essas

medidas. Basicamente, e feita a descricao de metricas economicas para a construcao de

matrizes de distancias economicas para dois conjuntos de dados. O Captulo 3 tem como

objetivo apresentar o modelo proposto que incorpora as matrizes exogenas de distancias

8

economicas, construdas no captulo anterior, em sua estrutura. Caractersticas relevantes

e interpretacoes do modelo sao exibidas, alem de variacoes que consideram um modelo

mais geral e modelos mais simples. O procedimento de inferencia, sob o paradigma

Bayesiano e apresentado. Dados artificiais sao gerados e estudos simulados sao feitos onde

metodos de Monte Carlo via cadeias de Markov (MCMC) sao usados para fazer inferencia.

No Captulo 4 duas aplicacoes sao apresentadas para modelar, primeiramente, ndices

de crescimento mensal da producao industrial norte-americana e em seguida ndices de

crescimento trimestral do PIB brasileiro. Finalmente, concluiremos a dissertacao com

uma breve descricao das possveis propostas de extensoes para o presente trabalho.

9

Captulo 2

Distancias Economicas

Este captulo trata principalmente da descricao de metodos para a construcao de

matrizes de distancias economicas. Foram construdas matrizes de distancias para dois

conjuntos de dados. Primeiro, para dados norte-americanos usados por Chen e Conley

(2001) e depois para dados brasileiros obtidos no Sistema de Contas Nacionais do Instituto

Brasileiro de Geografia e Estatstica - IBGE. E usado um metodo de interpolacao cubica

para que tais matrizes se tornem temporalmente compatveis com as series de dados

que futuramente serao descritos. Alem disso, sao citados exemplos que abrangem areas

distintas para motivar e introduzir a utilizacao dessas matrizes.

2.1 Introducao

Econometria espacial e o ramo da econometria que lida com interacoes de

estruturas espaciais em modelos de regressao linear com dados transversais e de painel.

Ultimamente, estudos sobre a econometria espacial tem crescido muito, uma vez que sao

consideradas relacoes entre agentes. Essas relacoes sao descritas por medidas observaveis

de distancias economicas que podem ser associadas a pesos econometricos.

Uma forma simples de obter matrizes de distancias economicas e associa-las a matrizes

de distancias Euclidianas, onde quanto maior a medida Euclidiana entre dois agentes,

mais afastados estao um do outro, menor e o peso relacionado e, consequentemente,

menor a correlacao existente entre eles.

10

LeSage e Pace (1991) fornecem exemplos com respeito a diversas matrizes de

distancias economicas, entre eles o que descreveremos a seguir, em que os elementos

da matriz de distancias economicas sao funcoes de distancias Euclidianas. Considere

um conjunto de sete regioes, tres delas a direita do centro comercial e tres delas a

esquerda, alem disso, existe uma unica rodovia que une todas as sete regioes. Pode-

se analisar o tempo de viagem para o centro comercial considerando como variaveis

explicativas a distancia das regioes ao centro e a densidade da populacao de cada local, ou

seja, ha dependencia espacial entre as sete regioes baseada, principalmente, na distancia

euclidiana entre elas.

Outro exemplo onde observa-se inclusao de externalidades espaciais, agora baseada

em distancias economicas, e o caso de vendas de casas em um determinado local. Nesse

caso, as covariaveis explicam o preco de cada casa a partir das suas caractersticas, e

ha dependencia espacial, pois precos de casas vizinhas ou, ate mesmo sua localizacao,

influenciam no valor da casa a ser vendida.

Ainda pode-se falar de firmas ou setores da economia como unidades observacionais

(agentes) e a distancia entre agentes como o volume de comercio exterior. Se os agentes

correspondem a empresas, as medidas de sobreposicao em seus mercados de varejo podem

ser medidas de distancias economicas. Se os agentes sao pases, as medidas dos volumes

do comercio ou o custo de transporte entre os pases pode ser uma metrica de distancia

economica apropriada.

O desenvolvimento de metodos na literatura econometrica para especificar, estimar

e testar modelos que incorporam interacoes espaciais motivam ainda mais estudos nessa

area. Neste sentido Chen e Conley (2001) propoem um modelo semiparametrico para

dados de painel incorporando distancias economicas na sua estrutura. Por outro lado,

Conley e Dupor (2003) definem distancias economicas para esse tipo de modelagem.

Alem disso, Kakamu e Polasek (2007) abordam problemas da analise de ciclos de negocios

regionais na Uniao Europeia a partir de uma nova perspectiva econometrica, utilizando

uma classe de modelos espaco-temporais com conceito de vizinhos mais proximos. Para

tanto, sao construdas e analisadas diferentes tipos de matrizes de pesos.

11

Com o interesse de comparar matrizes de distancias economicas, ressaltando

semelhancas e diferencas entre elas, lancamos mao, neste captulo, de analises graficas.

Uma delas e utilizada por Conley e Topa (2002) e por Conley e Dupor (2003), e consiste

em representar visualmente as metricas economicas por meio de uma configuracao de

pontos no plano. Para isso e usado um metodo chamado escala multidimensional

classica (do ingles CMDS). Esses graficos facilitam a identificacao de clusters de agentes e

permite a visualizacao de objetos multidimensionais no plano. Um outro artifcio grafico

apresentado utiliza intensidade de cores para quantificar a distancia entre os agentes,

permitindo, entao, a analise dos pesos econometricos entre os agentes.

2.2 Construcao de Distancias Economicas

Nesta secao descrevemos metricas para a construcao de matrizes de pesos economicos,

uma delas sugerida por Conley e Dupor (2003). Para o primeiro conjunto de dados,

as matrizes de distancias sao baseadas no grau de similaridade de relacoes de insumo-

produto dos setores da economia dos EUA, caracterizando assim as interacoes existentes

entre eles. Para os dados brasileiros a mesma metrica e utilizada, a partir da matriz

brasileira de insumo-produto obtidas no IBGE. Conceitualmente, insumo-produto e a

combinacao de fatores de producao, diretos (materias-primas) e indiretos (mao-de-obra,

energia, tributos), que entram e saem na elaboracao de certa quantidade de bens ou

servicos. Portanto, as relacoes de insumo-produto e as matrizes utilizadas nas aplicacoes

apresentam os bens e servicos utilizados por cada setor.

Desde o trabalho de Anselin (1988), interacoes espaciais tornaram-se uma das

preocupacoes na economia. Uma forma de representar essas interacoes e por meio da

construcao de matrizes de distancias economicas, e para isso metricas de construcao

devem ser sugeridas.

Independente da area de aplicacao, os componentes utilizados para o estudo de

interacoes espaciais e, consequentemente, para a construcao de distancias economicas

serao denominados agentes. Torna-se cada vez mais raro analises que reflitam a estrutura

12

de agentes unicos, pois modelos de agentes unicos podem fornecer uma estrutura pobre

para analisar os dados em questao.

Conley e Topa (2002) analisam padroes espaciais de desemprego em Chicago e as

diferentes metricas de distancias social e economica refletem a estrutura das redes de

agentes sociais, que levam em conta agentes de natureza geografica, ocupacional, etnica,

sociologica, etc. Nesse caso cada matriz e construda baseada em um agente, e em seguida

combinacoes entre as matrizes de distancias economicas sao propostas. Um outro exemplo

pode ser visto em Conley e Dupor (2003), em que um metodo econometrico espacial

para caracterizar movimentos comuns da produtividade da economia norte-americana

e apresentado. Eles usam relacoes de input-output para obterem medidas de distancia

economica, que sao usadas para caracterizar interacoes entre setores.

Para a construcao de distancias economicas os agentes, que agregam informacoes

relevantes, sao associados a vetores. Entao N agentes nos reporta a uma estrutura N -

dimensional.

Como ja foi dito, uma metrica simples para a construcao das matrizes de distancias

economicas e a distancia Euclidiana ou funcoes dela. Dessa forma, seja DEij a distancia

Eucludiana entre o vetor ei referente ao agente i de dimensao l e o vetor ej de dimensao

l referente ao agente j, onde i, j = 1, . . . , N :

DEij =

lp=1

(eip ejp)2

Entao, quanto menor o valor de DEij mais proximo o agente i estara do agente j.

Nota-se que Dij = Dji e Dij = 0 se i = j.

2.2.1 Aplicacao a matrizes de insumo-produto norte-

americanas

Conley e Dupor (2003) constroem diferentes medidas de distancia economica

utilizando dados de tabelas de insumo-produto, onde os elementos (i, j) sao os valores

das mercadorias do setor i utilizadas no setor j. Nos EUA, essas tabelas, retratando

13

a economia americana, sao preparadas e divulgadas pelo Departamento de Analise

Economica a cada cinco anos. A partir da relacao entre diferentes setores e definida

a distancia economica pelo grau de similaridade na estrutura insumo-produto. Seja t

a tabela de insumo-produto observada no ano t. Sao nessas tabelas e nas matrizes

de distancia economica, contrudas a partir delas, que sera baseada a caracterizacao da

produtividade de setores com movimentos comuns na aplicacao desenvolvida no Captulo

4.

A primeira medida definida nesse artigo diz que dois setores sao proximos se seus

produtos sao utilizados pelos mesmos setores e uma outra medida e baseada na tecnologia

de cada setor, ou seja, setores com tecnologias similares utilizam insumos semelhantes e

nas mesmas proporcoes. Em suma, as duas medidas de distancias economicas sustentam

que duas atividades economicas sao proximas se compram ou vendem bens em proporcoes

similares.

Alem disso, setores sao indexados segundo seus vetores de insumo e produto, e assim,

suas posicoes correspondem a esses vetores. Portanto, setores com estruturas vetoriais

similares sao proximos e aqueles com estruturas distintas estao distantes. Conley e Dupor

(2003) ainda consideram a covariancia entre diferentes setores modelada como funcao

desses ndices e devido ao grande numero de setores eles modelam a covariancia como

funcao da distancia Euclidiana. Dessa forma, tratamos uma tabela que possui N setores

como N -dimensional.

Neste artigo sao definidas duas metricas, distancias pela otica do insumo e do produto

entre os setores i e j no tempo t com elementos DIt (i, j) e DPt (i, j), respectivamente. Para

a distancia segundo os insumos, e feita a padronizacao Bt(i, j) = t(i, j)/[N

p=1 t(p, j)]

que e invariante, alterando somente a escala dos valores na matriz de distancias

economicas final. Assim e definido:

DIt (i, j) =

{Np=1

[Bt(p, i)Bt(p, j)]2}1/2

(2.1)

14

De forma analoga para a distancia pela otica do produto, considere a padronizacao

t(i, j) = t(i, j)/[N

p=1 t(i, p)], tambem invariante. Entao, os elementos da matriz

de distancia sao definidos por:

DPt (i, j) =

{Np=1

[t(i, p)t(j, p)]2}1/2

(2.2)

Ambas as matrizes contrudas sao simetricas e nao-negativas.

Os N = 20 setores presentes nas tabelas de insumo-produto dos anos de 1972, 1977,

1982, 1987 e 1992 sao os setores de manufaturados indexados por dois dgitos do codigo

SIC1 e podem ser vistos na Tabela 2.1.

A metrica descrita acima e adotada e aplicada as tabelas de insumo-produto da

economia norte-americana composta pelos 20 setores da Tabela 2.1. Dessa forma,

obtemos matrizes de distancia economica do ponto de vista do insumo e do produto.

Adicionalmente, uma outra matriz de distancia (Dmt ) pode ser considerada como uma

mistura das distancias insumo e produto a partir da inclusao de um parametro de mistura

, que varia entre 0 e 1. Logo,

Dmt (i, j) = DIt (i, j) + (1 )DPt (i, j) (2.3)

O parametro poderia ser estimado e neste ponto teramos como objetivo encontrar o

valor de que nos retornasse a combinacao otima das matrizes de insumo e produto.

Porem, as matrizes de distancia economica calculadas serao utilizadas como exogenas no

modelo que sera proposto. Portanto, iremos assumir = 0 quando o interesse estiver

voltado para a matriz baseada no produto e = 1 quando desejarmos Dmt (i, j) = DIt (i, j).

As Figuras 2.1 e 2.2 apresentam a configuracao do grafico CMDS para as distancias

economicas, sob a otica do insumo e do produto no ano de 1972, respectivamente. A

localizacao de cada setor pode ser vista a partir do seu codigo SIC. E notavel nas Figuras

1Standard Industrial Classification Codes (SIC Code) e a tentativa de classificar as industrias de

acordo com semelhancas de produtos, servicos e sistemas de producao e entrega. SIC Codes organiza

industrias em um crescente nvel de detalhes que vao desde setores economicos gerais ate segmentos

especficos da industria. Os dois dgitos do codigo SIC sao subunidades dos principais setores industriais

e sao identificados por dois dgitos numericos.

15

Tabela 2.1: Setores norte-americanos manufaturados indexados por dois dgitos do codigo

SIC.

SIC Code Setores

SIC 20 Alimento

SIC 21 Tabaco

SIC 22 Textil

SIC 23 Vestuario

SIC 24 Madeira

SIC 25 Moveis

SIC 26 Papel

SIC 27 Imprensa

SIC 28 Produtos Qumicos

SIC 29 Petroleo

SIC 30 Plastico e borracha

SIC 31 Couro

SIC 32 Pedra, vidro e argila

SIC 33 Metais Primarios

SIC 34 Metalurgico

SIC 35 Maquinas nao eletricas

SIC 36 Maquinas eletricas

SIC 37 Transporte

SIC 38 Instrumentos

SIC 39 Diversos

2.1 e 2.2 a presenca de alguns clusters. Por exemplo, os setores de bens duraveis estao

proximos segundo a distancia construda sob a otica do insumo. Ainda nessa metrica,

metais primarios (SIC 33) e metalurgico (SIC 34) estao relativamente afastados dos

demais setores e proximos um do outro. Na distancia baseada no produto o setor

de couro (SIC 31) esta proximo dos setores de textil (SIC 22) e diversos (SIC 39).

Algumas distancias relativas ao mesmo setor variam sobre as duas metricas. Considere

a localizacao relativa de dois bens duraveis, como tansporte (SIC 37) e instrumentos

(SIC 38). Esses setores estao proximos sob a otica do insumo, porem suas sadas se

16

encaminham para diferentes clientes. Entao, eles estao relativamente afastados sob o

ponto de vista do produto. Transporte, na verdade, esta afastado da maioria dos setores,

quando falamos de distancia baseada no produto, pois grande parte da producao deste

setor e destinado a ele mesmo.

0.2 0.0 0.2 0.4 0.6

0.

20.

00.

20.

40.

6

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22

S23

S24

S25

S26S27

S28

S29

S30

S31S32

S33S34S35S36

S37S38S39

Figura 2.1: Grafico CMDS das distancias economicas do insumo entre setores norte-

americanos, para o ano de 1987.

0.2 0.0 0.2 0.4 0.6

0.

6

0.4

0.

20.

00.

20.

40.

6

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22

S23

S24 S25

S26S27

S28S29 S30

S31

S32

S33S34

S35S36S37

S38

S39

Figura 2.2: Grafico CMDS das distancias economicas do produto entre setores norte-

americanos, para o ano de 1987.

17

Alem da configuracao CMDS, imagens das distancias economicas entre os setores

considerando o ponto de vista do produto e do insumo para os anos de 1972, 1977, 1982,

1987, 1992 podem ser vistas nas Figuras 2.3 e 2.4, respectivamente. Quanto mais fortes

as cores, menores sao as distancias economicas entre os setores e maior e o peso associado.

Nota-se que ha uma grande disparidade entre a matriz do ano de 1982 e as matrizes dos

demais anos tanto para o produto como para o insumo. Isso se da pois ao longo da decada

de 1980, os EUA sofreram um perodo de instabilidade economica, principalmente, por

sua ineficacia em responder a novos concorrentes que surgiam no mercado internacional.

A economia norte-americana passou a perder espaco para concorrentes como pases da

Europa Ocidental e Asia, como Alemanha e Japao, nos mercados interno e externo.

Essa recessao norte-americana de 79/82, e considerada a mais grave desde a Grande

Depressao de 1930. Apesar da crise influenciar um aumento na correlacao entre os setores

pode-se ver que o setor de tabaco (SIC 21), nao segue os demais. Alem disso, pode-

se notar, nas imagens baseadas no produto, que os setores de comida (SIC20), tabaco

(SIC21), textil (SIC22) e vestuario (SIC23) estao mais afastados (pouco correlacionados)

dos demais setores. O mesmo pode ser visto para as matrizes baseadas no insumo, com

mais intensidade.

A divulgacao das tabelas de insumo-produto a cada cinco anos nos leva a obter

matrizes de distancias economicas que variam no tempo. Isso e, a diferenca estrutural

entre as matrizes obtidas, notada pela analise da matriz de 1982, nos motiva a incluir

na modelagem futura diferentes matrizes para cada instante de tempo. Porem, a serie

temporal dos setores utilizados tem variacao mensal, e dado que as matrizes construdas

nao sao compatveis na escala temporal com os dados, um metodo de interpolacao foi

utilizado.

18

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0.4 0.2 0.0 0.2 0.4 0.6

0.

6

0.4

0.

20.

00.

20.

40.

60.

8

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22S23

S24S25

S26S27S28S29 S30

S31

S32

S33S34S35S36

S37S38S39

imagem 1977 CMDS 1977

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.0 0.8 0.6 0.4 0.2 0.0

0.

4

0.3

0.

2

0.1

0.0

0.1

0.2

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22S23

S24

S25

S26

S27S28

S29S30

S31

S32

S33

S34S35

S36S37

S38S39


0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0.4 0.2 0.0 0.2 0.4 0.6

0.

6

0.4

0.

20.

00.

20.

40.

6

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22S23

S24

S25S26

S27S28S29

S30S31S32

S33S34

S35S36S37

S38 S39


Figura 2.3: Imagem e representacao CMDS dos setores norte-americanos relativo as

distancias economicas sob a otica do produto, ao longo dos anos.

19

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

0.2 0.0 0.2 0.4 0.6

0.

20.

00.

20.

4

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22

S23

S24

S25

S26S27

S28

S29

S30

S31S32

S33

S34

S35S36S37

S38S39


0 5 10 15 20

510

1520

X Coord

Y C

oord

0.1

0.2

0.3

0.4

0.5

0.6

0.1 0.0 0.1 0.2 0.3 0.4

0.

2

0.1

0.0

0.1

0.2

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22

S23

S24

S25

S26

S27

S28

S29

S30

S31

S32

S33

S34S35

S36

S37

S38

S39


0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0.2 0.0 0.2 0.4

0.

4

0.2

0.0

0.2

0.4

CMDS

coordenada 1

coor

dena

da 2

S20

S21

S22

S23 S24

S25S26

S27

S28S29

S30S31

S32

S33S34

S35

S36S37

S38S39


Figura 2.4: Imagem e representacao CMDS dos setores norte-americanos relativo as

distancias economicas sob a otica do insumo, ao longo dos anos.

Para obtermos matrizes de distancias economicas mensalmente vamos utilizar

metodos de interpolacao por spline. O metodo de interpolacao por spline cubico foi

20

escolhido porque fornece valores interpolados mais suaves ao longo do tempo com relacao

ao spline linear e quadratico. Entao, para p = 3 considere a funcao f(x) tabelada nos

pontos x0, x1, . . . , xl. Uma funcao Sp(x) e denominada spline de grau p com nos nos

pontos xi, i = 0, 1, . . . , l se satisfaz as seguintes condicoes:

(i) em cada subintervalo [xi, xi+1], i = 0, 1, . . . , (l 1), Sp(x) e um polinomio de grau

p,

(ii) Sp(x) e contnua e tem derivada contnua ate ordem (p 1) em [a, b].

Se alem disso, Sp(x) tambem satisfaz a condicao:

(iii) Sp(xi) = f(xi), i = 0, 1, . . . , l entao sera denominada spline interpolante.

Portanto, S3(x), e uma funcao polinomial por partes, contnua, onde cada parte,

sk(x) = ak(x xk)3 + bk(x xk)2 + dk, e um polinomio de grau 3 no intervalo [xk1, xk],

k = 1, 2, . . . , l.

Segundo a teoria de interpolacao por spline, vamos assumir os anos 1972, 1977, 1982,

1987 e 1992 como nos. Entao, consideramos as matrizes de distancias economicas, obtidas

por meio das tabelas, como as matrizes dos meses de janeiro de cada ano, ou seja, a matriz

construda pela tabela do ano de 1972 e identificada como uma matriz de distancias

economicas do mes de janeiro do ano de 1972. Dessa forma as demais matrizes, dos

meses faltantes, entre os nos serao estimadas por interpolacao via spline cubico. As

Figuras 2.5 e 2.6 mostram as imagens de algumas das matrizes de distancias economicas

estimadas por spline cubico tanto para a metrica de insumo como de produto. Mais uma

vez cores mais fortes indicam menores distancias e, consequentemente, maiores pesos.

Embora as imagens se parecam, os valores variam suavemente e algumas similaridades

se conservam ao longo do tempo.

21

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

janeiro1972 janeiro1973 janeiro1974

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

janeiro1975 janeiro1976 janeiro1977

Figura 2.5: Imagem das distancias economicas de insumo entre setores norte-americanos

interpoladas por spline cubico.

22

0 5 10 15 20

510

1520

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

1.4

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

1.4

janeiro1972 abril1972 julho1972

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

1.4

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

0 5 10 15 20

05

1015

20

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

janeiro1973 julho1973 janeiro1974

Figura 2.6: Imagem das distancias economicas de produto entre setores norte-americanos


2.2.2 Aplicacao a matrizes brasileiras de insumo-produto

Matrizes insumo-produto sao instrumentos da contabilidade social que permitem

conhecer fluxos de bens e servicos produzidos em cada setor da economia, destinados

a servir de insumos a outros setores e para atender a demanda final. Essas matrizes,

produzidas pelo IBGE desde a decada de 1970, sao elaboradas a partir dos dados das

Contas Nacionais do Brasil. Seus objetivos iniciais eram a criacao de um marco estrutural

para o Sistema de Contas Nacionais e de uma ferramenta que ajudasse o desenvolvimento

das estatsticas economicas necessarias a construcao de tabelas macroeconomicas.

23

O uso de matrizes de insumo-produto difundiu-se muito nos ultimos anos, e hoje

e considerada um instrumento de grande utilidade para analisar os efeitos estruturais

de choques na economia, bem como para fazer projecoes sobre o comportamento de

atividades.

Uma matriz de insumo-produto e entendida normalmente como uma matriz de

coeficientes tecnicos diretos que apresenta o quanto determinado setor economico

necessita consumir dos demais setores para que possa produzir uma unidade monetaria

adicional. O calculo da matriz de coeficientes tecnicos diretos e baseado nas tabelas

de producao e consumo intermediario das Tabelas de Recursos e Usos - TRU. Estas

tabelas devem sofrer alteracoes para se adequarem as caractersticas de um modelo de

insumo-produto.

A partir do calculo dos coeficientes tecnicos diretos e das matrizes de insumo-produto,

modelos sao propostos e diversas matrizes podem ser extradas, uma delas e a matriz dos

coeficientes tecnicos intersetoriais. Pelo fato desta matriz nos fornecer a dependencia

direta, atividade por atividade, a selecionamos para, a partir dela, obtermos uma matriz

de distancias economicas. Detalhes de modelos e calculos para obtencao de matrizes

podem ser vistos no endereco http://www.ipeadata.gov.br.

As atividades economicas utilizadas nas matrizes calculadas pelo IBGE, inclusive

nas matrizes dos coeficientes tecnicos que utilizaremos, podem ser descritas segundo

diferentes nveis. As desigualdades nas descricoes das atividades, baseada nos nveis,

leva-nos a atividades mais agregadas ou menos agregadas, dependendo do nvel. Na

Secao 4.2 do Captulo 4 definimos os dados com os quais utilizaremos as matrizes dos

coeficientes tecnicos intersetoriais e vale ressaltar que deve haver compatibilidade entre

os setores que compoem as matrizes e os setores analisados nos dados. Para atingir essa

compatibilidade a CNAE (Classificacao Nacional de Atividades Economicas) apresenta a

padronizacao nacional dos codigos de atividades economicas. A partir disso, agregamos

os setores desagregados das matrizes de coeficientes tecnicos intersetoriais, somando

atividades pertencentes a mesma descricao, para atingir a igualdade desejada. A Tabela

2.2 nos fornece o codigo e a descricao das atividades nvel 12 que utilizaremos.

24

Tabela 2.2: Atividades da economia brasileira

Codigo da Atividade nvel 12 Descricao da Atividade nvel 12

01 Agropecuaria

02 Industria extrativa mineral

03 Industria de transformacao

04 Producao e distribuicao de eletricidade, gas e agua

05 Construcao

06 Comercio

07 Transporte armazenagem e correio

08 Servicos de informacao

09 Intermediacao financeira, seguros e previdencia complementar

10 Atividades imobiliarias e aluguel

11 Outros servicos

12 Administracao, saude e educacao publicas

As matrizes de coeficientes tecnicos intersetoriais referentes aos anos 1992, 1993, 1994,

1995, 1996, 2000, 2005 e contendo os 12 setores apresentados, foram obtidas. A partir

delas as matrizes de distancias economicas foram construdas baseadas nas metricas de

insumo e produto propostas por Conley e Dupor (2003) pelas equacoes em (2.1) e (2.2).

As matrizes de distancias economicas nos fornecem as relacoes existentes entre os 12

setores da economia brasileira considerados, ou seja, se o elemento Dt(i, j) for pequeno

temos que a distancia economica entre o setor i e o setor j e pequena, e portanto a

relacao entre eles e forte. Podemos observar essas relacoes de forma grafica por meio

das Figuras 2.7 e 2.8. A primeira delas nos mostra as imagens e os graficos CMDS das

matrizes de distancias economicas sob a otica do produto nos anos de 1993, 1996, 2005. A

segunda figura, com a mesma variacao temporal que a primeira, apresenta as distancias

25

economicas baseadas na metrica do insumo. Em ambas as figuras temos que as cores

mais fortes representam menores distancias e, portanto, maiores pesos econometricos.

Observe que independente da otica sob a qual as matrizes de distancias economicas

estao baseadas, o setor de producao e distribuicao de eletricidade e agua (setor 04) se

matem afastado dos demais ao longo dos anos. No grafico das imagens e possvel notar

tal afastamento devido a faixa mais clara presente ao longo do setor 04, e no grafico

CMDS notamos pela grande distancia fsica de S4dos demais setores. Alem disso,

pode-se notar que o setor de atividades imobiliarias e aluguel (setor 10) esta distante dos

outros setores, sob a otica do insumo. Ja sob a otica do produto esse setor esta inserido

em um cluster formado pelos setores de intermediacao financeira, seguros e previdencia

complementar (setor 09) e outros servicos (setor 11).

As matrizes aqui calculadas serao utilizadas como matrizes de distancia exogenas

na aplicacao desenvolvida no Captulo 4. Vale ressaltar que e necessario haver

compatibilidade temporal entre as matrizes calculadas e a serie temporal dos dados,

que sao trimestrais. Portanto, o metodo de interpolacao por spline sera utilizado

para encontrarmos matrizes intermediarias e dessa forma transforma-las em matrizes

trimestrais.

O metodo de interpolacao por spline cubico, que ja foi descrito anteriormente, tem

como ponto de partida os nos da interpolacao. Dessa forma, vamos assumir as matrizes

dos anos de 1992, 1993, 1994, 1995, 1996, 2000, 2005 como nos referentes ao primeiro

trimestre de cada um deses anos. As matrizes referentes aos trimestres entre os nos serao

estimadas por interpolacao via spline cubico. A Figura 2.9 mostra as imagens de algumas

matrizes de distancias economicas estimadas segundo a metrica de produto.

26

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0.2 0.0 0.2 0.4

0.

4

0.3

0.

2

0.1

0.0

CMDS

coordenada 1

coor

dena

da 2

S1

S2S3

S4

S5

S6S7 S8

S9 S10S11

S12

1993 CMDS 1993

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.3 0.2 0.1 0.0 0.1 0.2 0.3

0.

10.

00.

10.

2

CMDS

coordenada 1

coor

dena

da 2 S1

S2S3

S4

S5

S6S7

S8

S9 S10S11

S12

1996 CMDS 1996

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0.2 0.0 0.2 0.4

0.

2

0.1

0.0

0.1

0.2

0.3

0.4

CMDS

coordenada 1

coor

dena

da 2

S1

S2

S3

S4

S5S6

S7

S8 S9S10

S11

S12

2005 CMDS 2005

Figura 2.7: Imagem das distancias economicas de produto entre setores brasileiros ao

longo dos anos.

27

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

0.2 0.0 0.2 0.4 0.6

0.

20.

00.

20.

40.

6

CMDS

coordenada 1

coor

dena

da 2

S1

S2

S3

S4

S5

S6

S7

S8

S9

S10

S11

S12

1992 CMDS 1993

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1

0.2 0.0 0.2 0.4 0.6 0.8

0.

20.

00.

20.

4

CMDS

coordenada 1

coor

dena

da 2

S1

S2

S3

S4

S5

S6

S7

S8

S9

S10S11

S12

1995 CMDS 1996

0 2 4 6 8 10 12 14

02

46

810

12

X Coord

Y C

oord

0.2

0.4

0.6

0.2 0.1 0.0 0.1 0.2 0.3 0.4

0.

2

0.1

0.0

0.1

0.2

0.3

0.4

0.5

CMDS

coordenada 1

coor

dena

da 2

S1

S2

S3

S4

S5

S6

S7

S8S9

S10

S11

S12

2005 CMDS 2005

Figura 2.8: Imagem das distancias economicas de insumo entre setores brasileiros ao

longo dos anos.

28

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

1otrimestre1992 3otrimestre1992 1otrimestre1993

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

0 5 10 15

02

46

810

1214

X Coord

Y C

oord

0.2

0.4

0.6

0.8

2otrimestre1993 4otrimestre1993 1otrimestre1994

Figura 2.9: Imagem das distancias economicas de produto entre setores brasileiros


29

Captulo 3

Modelos Espaco-Temporais com

Distancias Economicas

Neste captulo um modelo econometrico espacial dinamico e proposto. Esse

modelo trata da dependencia econometrica espacial atraves da interacao entre unidades

observacionais e da dependencia temporal atribuindo a cada unidade uma serie temporal.

Alem disso, foi incoporado ao modelo a ideia, ja tratada no Captulo 2, de distancias

economicas, que irao influenciar tanto na estrutura de medias como na estrutura de

covariancia.

3.1 Introducao

Neste captulo serao desenvolvidos modelos econometricos espaco-temporais para

dados de painel, cujos elementos correspondem a agentes economicos. Por painel entende-

se observacoes repetidas no tempo para um numero fixo de agentes. Exemplos com este

tipo de dados incluem observacoes trimestrais sobre variaveis de setores especficos ou

ainda dados de precos semanais para empresas em uma regiao. Dados de painel para

modelos espaciais e econometricos espaciais tem sido amplamente utilizados na literatura.

Baltagi et al. (2003), Case (1991) e Kapoor et al. (2004) utilizam modelos, para dados

de painel, com correlacao espacial no erro. Baltagi et al. (2003) abordam modelos de

regressao com essas caractersticas e fazem testes de multiplicadores de Lagrange para

30

permitir correlacao espacial do erro bem como efeitos aleatorios. Ja Case (1991) discute

processos economicos que dao origem a padroes espaciais nos dados. Kelejian e Prucha

(1999) e Bell e Bockstael (2000) sugerem respectivamente, um estimador de momentos

generalizados, computacionalmente simples e independente do tamanho da amostra,

para o parametro autorregressivo de um modelo espacial, e a primeira aplicacao em

econometria espacial para as tecnicas desenvolvidas por Kelejian e Prucha (1999) para

dados de painel de grandes dimensoes.

Muitos modelos tradicionais em econometria nao consideram interacoes entre agentes

economicos. Nesses casos, frequentemente, e assumido que o resultado de um agente nao e

afetado pelo resultado dos demais. No entanto, as decisoes economicas sao caracterizadas

por um significativo grau de interdependencia. Portanto, sob a forma de dependencia

espacial, modelos econometricos incorporam similaridades entre agentes ou especialidades

geograficas, como medidas que sao incorporadas na estrutura de covariancia ou ainda na

media do processo. Exemplos seguindo essa abordagem podem ser vistos principalmente

em Anselin (1988), que trata de modelos e metodos da econometria espacial. Anselin

(1988) motivou uma serie de estudos mais aprofundados na area como: Anselin et al.

(2004), que apresentam importantes avancos na area econometrica espacial, LeSage e

Pace (2004), que tratam tambem de econometria espaco-temporal e Gamerman e Moreira

(2004), que descrevem procedimentos para realizar inferencia Bayesiana em modelos

multivariados econometricos com componente espacial, entre outros. Baltagi et al. (2007)

reune uma serie de estudos que se relacionam tanto para o desenvolvimento teorico de

modelos espaciais na economia para a analise de dados espacialmente dependentes, como

para aplicacoes as diferentes questoes economicas.

Agentes que se encontram em um espaco Euclidiano foram modelados. As distancias

entre eles, inicialmente, sao determinadas simplesmente pela distancia Euclidiana e mais

tarde por uma metrica economica. A metrica atribuda pode, por exemplo, mostrar

que os agentes estao proximos, se eles usam insumos nas mesmas proporcoes, e longe,

se utilizam insumos em proporcoes diferentes, caso os agentes correspondam a setores

economicos.

31

Nosso modelo de geracao de dados e dinamico com um parametro de estados

autorregressivo onde media e matriz de variancia sao funcoes de distancias economicas

entre agentes. Portanto, levaremos em consideracao a dependencia espacial entre os

agentes por meio de distancias economicas que serao incorporadas tanto na media como

na estrutura de variancia do modelo. Alem disso, ambos os termos sao influenciados

por funcoes de distancias economicas entre agentes que variam ao longo do tempo. A

estrutura incorporada na media e padronizada e, devido a isso, carrega uma interpretacao

de interdependencia temporal e entre agentes com pesos atribudos. Ja a distancia

incorporada na variancia e dotada de princpios espaciais para a estrutura de covariancia,

ou seja, usamos representacoes de estruturas estatsticas da literatura para particularizar

as funcoes de distancias economicas presentes no modelo. As distancias economicas foram

calculadas segundo a metrica economica descrita no Captulo 2 e serao exogenamente

incorporadas ao modelo.

A principal contribuicao deste trabalho consiste na abordagem de Chen e Conley

(2001) com algumas alteracoes na modelagem. Adicionalmente, a fim de acomodar a

ocasional presenca de outliers um modelo de regressao t-Student tambem e apresentado.

A estimacao dos modelos sera feita lancando mao de uma abordagem completamente

Bayesiana. E avaliada a sensibilidade para a especificacao de distribuicoes a priori para

os hiperparametros e, finalmente, exemplos utilizando dados artificiais sao apresentados.

Neste caso a metrica economica utilizada se resume a distancia Euclidiana.

O restante do captulo esta organizado da seguinte forma. A Secao 3.2 descreve

o modelo proposto, algumas das suas caractersticas, apresenta especificacoes para as

funcoes de distancias economicas e interpretacoes para elas. A Secao 3.3 apresenta nossa

estrategia de estimacao, ou seja, apresenta o procedimento de inferencia, todo sob o

enfoque Bayesiano. A Secao 3.4 discute a possibilidade de modelagem de series nao

estacionarias e apresenta um exemplo simulado para verificacao da proposta. As Secoes

3.5 e 3.6 apresentam estudos simulados com dados artificiais tanto para o modelo proposto

como para sua extensao, que trata da acomodacao de possveis outliers.

32

3.2 Modelo Proposto

Considere um conjunto de N agentes economicos tal que yit < e xit

onde g() e uma funcao contnua partindo de

(1) particularmente, para dados artificiais, consideramos Dt invariante no tempo, ou

seja, Dt = D t e portanto G(D) = W ;

(2) incorporar pesos espaciais variando no tempo na estrutura das medias significa

Gt(D) = tW ;

(3) para o caso geral, que utilizaremos na modelagem dos dados reais, definimos

G(Dt) = Wt.

Inicialmente a matriz de distancias economicas W sera associada a matriz de distancias

euclidianas entre dois setores economicos.

Alem disso, consideramos (D) = 2R(D) tal que a funcao de covariancia C()

e representada por C(D(i, j)) = 2exp{eiej

}. Neste caso estamos considerando

funcao de correlacao exponencial.

Para evitar singularidade ou processos explosivos, o parametro espacial tem que ser

restrito. Assim, para garantir a estacionariedade padronizamos por linhas a matriz Dt,

de tal forma que

j=1,...,N D(i, j) = 1, e fizemos que 1 < < 1. Apesar disso, quando

assume os valores 1 ou 1 temos um processo autorregressivo com razes unitarias

e, consequentemente, nao estacionario. O tratamento de series nao estacionarias esta

detalhado na Secao 3.4.

Alem da garantia da estacionariedade, a padronizacao por linhas da matriz Dt nos

fornece uma importante interpretacao para a equacao de sistema do modelo. Podemos

explorar tal interpretacao algebricamente. Para tanto, considere o caso particular de 4

setores e a matriz de distancias economicas, Dt = D t, fixada no tempo para facilitar a

interpretacao. Observe que a matriz D exposta abaixo ja esta padronizada.

D =

0 0.22 0.11 0.67

0.84 0 0.11 0.05

0.29 0.42 0 0.29

0.21 0.74 0.05 0

35

Da equacao de sistema temos:

z1t = (0.22z2,t1 + 0.11z3,t1 + 0.67z4,t1)

z2t = (0.84z1,t1 + 0.11z3,t1 + 0.05z4,t1)

z3t = (0.29z1,t1 + 0.42z2,t1 + 0.29z4,t1)

z4t = (0.21z1,t1 + 0.74z2,t1 + 0.05z3,t1)

Uma analise algebrica nos permite notar que zt pode ser expressa como uma

combinacao linear dos elementos zt1. A matriz padronizada D, fornece a porcentagem

de influencia da variavel latente de cada setor no tempo anterior, na variavel latente

dos setores no tempo atual, ou seja, quais setores no tempo anterior tem mais influencia

em determinados setores no tempo atual. Observando as equacoes acima vemos, por

exemplo, que o primeiro setor no tempo atual e bastante influenciado pelo quarto setor

no tempo anterior. Ja o segundo setor no tempo atual tem uma influencia de 84% do

primeiro setor no tempo anterior.

3.2.2 Nao separabilidade

Analisaremos agora as propriedades de separabilidade do modelo espaco-temporal

proposto. Funcoes de covariancia espaco-temporais sao separaveis se podem ser escritas

como produto ou soma de uma funcao de covariancia puramente espacial e uma funcao

de covariancia puramente temporal. Ou seja, considere Z(s, t) um processo aleatorio

indexado no espaco e no tempo. Entao, o processo e separavel se

Cov(Z(s1, t1), Z(s2, t2)) =

Covs(u|)Covt(k|) ouCovs(u|) + Covt(k|)em que

yt = zt + t, t N(0, 2IN)

zt = Dzt1 + t, t N(0, 2R(D))

com || < 1. Entao a covariancia entre os setores i e j nos tempos t e t + k e dada da

seguinte forma:

Cov(yit, yj,t+k) = {kV ar(zt)Dk}ij (3.2)

Demonstracao. A demonstracao sera feita por inducao finita. Para k = 1 verificamos

facilmente que a equacao (3.2) e valida.

Cov(yt, yt+1) = E(ztzt+1) = E[zt(Dzt + t+1)

]

= E(ztzt)D

+ E(ztt+1) = V ar(zt)D

Assumiremos que (3.2) e verdade para k = h e iremos mostrar que vale para k = h+1.

Fazendo k = h+ 1, temos:

Cov(yt, yt+h+1) = E(ztzt+h+1) (3.3)

Por outro lado, da equacao de evolucao do modelo obtemos:

zt+h = Dzt+h1 + t+h

= D(Dzt+h2 + t+h1) + t+h

= 2D2zt+h2 + Dt+h1 + t+h...

= hDhzt +hl=1

l1Dl1t+hl+1 (3.4)

Substituindo (3.4) em (3.3) obtemos:

Cov(yt, yt+h+1) = E(zt(h+1Dh+1zt +

h+1l=1

l1Dl1t+hl+2))

= h+1V ar(zt)Dh+1

Logo, por inducao, (3.2) vale para todo k 1.

37

Observando a proposicao acima podemos concluir que o modelo proposto e nao

separavel. Mesmo nao sendo possvel explicitar V ar(zt) a nao separabilidade e notada

pelo fato de nao conseguirmos separar em duas funcoes distintas aquilo que depende

so do tempo e so do espaco no termo Dh+1, onde a matriz D e funcao das distancias

economicas e h+ 1 e funcao do tempo.

3.2.3 Acomodacao de outliers

Geralmente, presume-se que modelos espaco-temporais seguem uma distribuicao

normal. Entretanto, a existencia de possveis outliers mostra que a distribuicao normal

nao e uma escolha adequada, principalmente quando tratamos de dados economicos. A

distribuicao t-Student e uma escolha alternativa para acomodar outliers, pois fornece

caudas mais flexveis, ou seja, possui caudas mais pesadas do que a distribuicao normal.

Uma alternativa para se analisar a forma da curva de uma funcao de distribuicao e

compara-la com a distribuicao normal, ou seja, analisa-la quanto a curtose. Sabe-se que a

distribuicao t-Student tambem e chamada de distribuicao de cauda pesada e dependendo

do valor de seus graus de liberdade ela se aproxima da distribuicao normal, portanto,

podemos associar os graus de liberdade de uma distribuicao t-Student a sua curtose. Seja

K() = m4()m22()

3 = 6(4) , para > 4 e mn() o n-esimo momento central, a curtose

da distribuicao t-Student com graus de liberdade. A figura 3.1 nos mostra a relacao

existente entre a curtose e os graus de liberdade da distribuicao t-Student. Observe que

quanto maior os graus de liberdade menor e a curtose associada a eles, mostrando que

valores pequenos para a curtose indicam que a distribuicao t-Student se aproxima de

uma normal.

Do ponto de vista da modelagem, a distribuicao t-Student pode ser construda como

uma mistura de normais. Ver, por exemplo, Andrews e Mallows (1974) e West (1984)

para mais detalhes. Esta representacao e muito util porque a componente de mistura

facilita a acomodacao de outliers e a estrutura hierarquica facilita o procedimento de

inferencia.

38

10 20 30 40 50

01

23

45

6

graus de liberdade

curt

ose

4

Figura 3.1: Relacao graus de liberdade e curtose

Portanto, segundo Chen et al. (2010) que utilizam na modelagem uma mistura de

escala de representacao Gaussiana hierarquica, seja t t(0, 2IN) com graus de

liberdade, ou equivalentemente,

t|t, 2, N(

0, 2( 2

diag(1it )

))(3.5)

it| Ga(

2,

2

), (3.6)

assumindo > 4 para garantir que os quatro primeiros momentos de t existam.

Choy e Chan (2008) sugerem diversas distribuicoes para identificar outliers e as

modela utilizando mistura de distribuicoes. A distribuicao t-Student e modelada

hierarquicamente de tal forma que a variancia depende apenas de um parametro de

mistura. No nosso caso, o parametro de mistrura latente e dado por 1it = (11t , . . . ,

1Nt)

e os graus de liberdade estao diretamente relacionados com a variancia, como pode ser

visto na equacao (3.5).

39

Entao, o modelo 3.1 pode ser reescrito da seguinte forma:

yt = xtt + zt + t, t N(

0, 2( 2

diag(1it )

))(3.7a)

it| Ga(

2,

2

)(3.7b)

zt = G(Dt)zt1 + t, t N(0,(Dt)) (3.7c)

t = Gt1 + t, t N(0, 2Ik) (3.7d)

onde 1it = (11t , . . . ,

1Nt) e o parametro de mistura.

Nota-se que o modelo em (3.7) e o caso geral do modelo em (3.1), ou seja, basta

tomarmos em (3.7) que obtemos o modelo normal.

3.2.4 Funcao de verossimilhanca

Como o modelo em (3.1) e um caso particular do modelo em (3.7), vamos definir

a funcao de verossimilhanca para o caso mais geral. Sejam y = (y1, . . . , yT ) o

vetor de observacoes, z = (z1, . . . , zT ) a componente latente, = (1, . . . , T ) os

coeficientes de regressao, 1it = (11t , . . . ,

1Nt) o parametro de mistura e =

(2, 2, 2, , z0, 0, , , 1it ) o vetor parametrico. A funcao de verossimilhanca e dada

por

l(, z, ; y) =Tt=1

p(yt|, zt, t) =

=Tt=1

2( 2 diag(1it ))1/2 exp

{1

2(yt xtt zt)

(2( 2

diag(1it )

))1(yt xtt zt)

}

40

3.3 Procedimento de Inferencia

O procedimento de inferencia foi feito sob o enfoque Bayesiano, assim assumimos uma

distribuicao a priori ao vetor parametrico a fim de obtermos a distribuicao a posteriori.

E razoavel assumir que os parametros sao independentes a priori, entao a distribuicao

conjunta e dada pelo produto das marginais. Para os parametros de variancia assumimos

distribuicoes a priori gama invertida: 2 GI(a/2, b/2); 2 GI(c/2, d/2); 2

GI(e/2, f/2). Segue as distribuicoes a priori para os demais parametros: GI(2, h);

exp(l)I(4,); z0 N(mz0 , Cz0); 0 N(m0 , C0), onde a, b, c, d, e, f , g, l sao

hiperparametros conhecidos e h = max(dist)/ 2log(0.05) (ver Schmidt e Gelfand

(2003) para mais detalhes). Alem da distribuicao a priori exponencial truncada para

, na Subsecao 3.6.1, sugerimos outras duas distribuicoes a priori para esse parametro e

comparamos seus resultados a posteriori por meio de estatsticas pontuais. A distribuicao

a priori para o parametro sera analisada com mais detalhes na Secao 3.4, na qual

discutiremos a possibilidade de modelarmos series nao estacionarias.

Dessa forma, utilizando o teorema de Bayes consegue-se encontrar a distribuicao a

posteriori que e proporcional ao produto da verossimilhanca pela distribuicao a priori

dos parametros, que supomos independentes. Entao a distribuicao a posteriori conjunta

e proporcional a

p(, z, |y) l(, z, ; y) p(, z, ) (3.8)

Tt=1

p(yt|, zt, t)

p(z0|mz0 , Cz0)p(0|m0 , C0)Tt=1

p(zt|zt1)Tt=1

p(t|t1)

Tt=1

p(it|/2, /2)p()p(2)p( 2)p(2)p()p().

Devido ao fato de nao conseguirmos amostrar dessa distribuicao, lancamos mao do

metodo de simulacao estocastica, metodo MCMC, para obter amostras a posteriori dos

parametros de interesse combinando tecnicas como o amostrador de Gibbs e o algoritmo

de Metropolis-Hastings. Para os parametros 2, 2, 2, it, z0, 0 obtivemos distribuicoes

41

condicionais completas com forma fechada, entao utilizamos o Amostrador de Gibbs para

amostrar de tais parametros. Como os parametros e nao possuem distribuicao

condicional completa fechada utilizamos passos de Metrolis-Hastings com densidades

propostas seguindo uma distribuicao log-normal e log-normal truncada, respectivamente.

Alem disso, para os parametros de estados latentes utilizamos primeiramente o Filtro

de Kalman e em seguida o algoritmo FFBS de Fruhwirth-Schnatter (1992) e Carter

e Kohn (1994). Os algoritmos e as distribuicoes condicionais completas podem ser

vistos no Apendice A. Todas as rotinas computacionais foram escritas na linguagem

de programacao R versao 2.7.1.

3.4 Modelando Series Temporais Nao Estacionarias

Quando lidamos com dados reais as series temporais podem ser nao estacionarias.

Diversas areas que tratam de modelos autorregressivos de series temporais incorporam

a nao estacionariedade utilizando metodos usuais, como uma componente que descreve

tendencias nao estacionarias. Huerta e West (1999) exploram modelos AR e tratam da

nao estacionariedade de series temporais quando falam das

Modelos dinâmicos Bayesianos para dados de painel usando ...

Documents

Transcript of Modelos dinâmicos Bayesianos para dados de painel usando ...

ANÁLISE DE SINAIS DINÂMICOS - eesc.usp.br · 8 Análise de Sinais Dinâmicos 2.1 - Classificação de Sinais Sinais dinâmicos são geralmente classificados como deterministicos

Metodos Bayesianos para Modelos´ Ocultos de Markov en ...

Painéis dinâmicos no Axure

Métodos Bayesianos [5mm] [width=2in]../Images/thomas-bayes

Sistemas Dinâmicos Parte 1

Dinâmica e Sistemas Dinâmicos - CORE

Reconstruindo Mapas Regulatórios Dinâmicos

Usando o MATLAB TM para Estimar Parâmetros de Sistemas ...palhares/ajuste_curvas_matlab.pdf · Usando o MATLAB TM para Estimar Parâmetros de Sistemas Dinâmicos Uma abordagem via

Controle Digital de Sistemas Dinâmicos

Modelos bayesianos de previsão aplicados á análise do ... · MODELOS BAYESIANOS DE PREVISÃO APLICADOS À ANÁLISE DO COMPORTAMENTO DA PRODUÇÃO INDUSTRIAL DE MINAS GERAIS* Rogério

Modelos Dinamicos Bayesianos para^ Processos …Modelos Dinamicos Bayesianos para^ Processos Pontuais Espac»o-Temporais Edna Afonso Reis Tese de Doutorado submetida ao Programa de

Estruturas Sob Efeitos Dinâmicos

Sistemas Dinâmicos 1.pdf

Efeitos Dinâmicos

CSS´s Dinâmicos - InfoTech 2012

MTODOS BAYESIANOS PARA ANLISE DE DADOS DE …repositorio.ufla.br/bitstream/1/4301/1/TESE_Métodos bayesianos... · GRAZIELA DUTRA ROCHA GOUVÊA 2010 . GRAZIELA DUTRA ROCHA GOUVÊA

Estimando modelos dinâmicos utilizando o ... - est.ufmg.brposgrad/mestrado/dissertacao_renan_xavier_cortes.pdf · RenanXavierCortes Estimando modelos dinâmicos utilizando o INLA

Serviços Dinâmicos em Pequenos Dispositivos

Modelos hier´arquicos bayesianos para estudar a distribuic ......Modelos hier´arquicos bayesianos 5 dessa planta sendo equivalente a popula¸cao sob risco nessa area, enquanto que

Relatórios Dinâmicos