Processos Estocásticos em Finanças

248
Processos Estoc´ asticos em Finan¸ cas Fernando Antonio Lucena Aiube Pontif´ ıcia Universidade Cat´olica do Rio de Janeiro http://www.ind.puc-rio.br/pagina professores.aspx?id=faiube [email protected] Petr´ oleo Brasileiro SA [email protected] 26 de mar¸ co de 2010

description

Processos Estocásticos em FinançasFernando Antonio Lucena AiubePUC-RJ

Transcript of Processos Estocásticos em Finanças

Page 1: Processos Estocásticos em Finanças

Processos Estocasticos em Financas

Fernando Antonio Lucena Aiube

Pontifıcia Universidade Catolica do Rio de Janeirohttp://www.ind.puc-rio.br/pagina professores.aspx?id=faiube

[email protected]

Petroleo Brasileiro [email protected]

26 de marco de 2010

Page 2: Processos Estocásticos em Finanças

Sumario

Prefacio ix

1 Conceitos Preliminares 1

1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Conceitos em probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Algumas distribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Variaveis aleatorias multidimensionais . . . . . . . . . . . . . . . . . . . . 13

1.5 Transformacao de densidade de probabilidade . . . . . . . . . . . . . . . 24

1.6 Desigualdades em probabilidade e teoremas limites . . . . . . . . . . . . 27

1.7 Inferencia estastıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.8 Apendice - Desigualdades de Chebyshev e Markov . . . . . . . . . . . . . 35

1.8.1 Desigualdade de Chebyshev . . . . . . . . . . . . . . . . . . . . . 35

1.8.2 Desigualdade de Markov . . . . . . . . . . . . . . . . . . . . . . . 36

2 Econometria em Financas 37

2.1 Processos estocasticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.2 Conceitos basicos em series temporais . . . . . . . . . . . . . . . . . . . . 39

2.3 Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.4 Formulacao dos modelos Box e Jenkins . . . . . . . . . . . . . . . . . . . 45

2.5 Series financeiras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.5.1 Series de retornos . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.5.2 Modelos para as series de retornos . . . . . . . . . . . . . . . . . . 54

2.5.3 Testes para estacionariedade . . . . . . . . . . . . . . . . . . . . . 56

2.5.4 Testes para autocorrelacao . . . . . . . . . . . . . . . . . . . . . . 57

2.6 Volatilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.6.1 Modelos de volatilidade condicional lineares . . . . . . . . . . . . 59

2.6.2 Modelos de volatilidade condicional nao lineares . . . . . . . . . . 64

2.6.3 Teste para GARCH linear . . . . . . . . . . . . . . . . . . . . . . 66

2.6.4 Teste para GARCH nao linear . . . . . . . . . . . . . . . . . . . . 66

2.6.5 Testes de adequacao do modelo . . . . . . . . . . . . . . . . . . . 67

2.7 Volatilidade estocastica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.8 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

2.9 Resumo e consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . 70

2.10 Apendice - Funcao de Autorcorrelacao Parcial . . . . . . . . . . . . . . . 70

2.10.1 Funcao de Autocorrelacao Parcial . . . . . . . . . . . . . . . . . . 70

i

Page 3: Processos Estocásticos em Finanças

ii SUMARIO

3 Calculo Estocastico 733.1 Processo Browniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.1.1 Propriedades do processo Browniano . . . . . . . . . . . . . . . . 753.1.2 Variacao quadratica . . . . . . . . . . . . . . . . . . . . . . . . . . 773.1.3 Regras basicas de operacionalizacao . . . . . . . . . . . . . . . . . 78

3.2 Valor esperado condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 843.2.1 Conceito basico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 843.2.2 Nocao de σ-algebra . . . . . . . . . . . . . . . . . . . . . . . . . . 853.2.3 Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853.2.4 Espaco e medida de probabilidade . . . . . . . . . . . . . . . . . . 863.2.5 Regras basicas de operacionalizacao . . . . . . . . . . . . . . . . . 86

3.3 Processos martingais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 903.4 Integracao estocastica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.4.1 Integral de Reimann . . . . . . . . . . . . . . . . . . . . . . . . . 933.4.2 Integral de Reimann-Stieltjes . . . . . . . . . . . . . . . . . . . . 943.4.3 Integral de Ito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.5 Formula de Ito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 993.6 Exemplos de EDE´s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

3.6.1 Processo geometrico Browniano . . . . . . . . . . . . . . . . . . . 1053.6.2 Equacao de Langevin . . . . . . . . . . . . . . . . . . . . . . . . . 1063.6.3 Processo de Ornstein-Uhlenbeck . . . . . . . . . . . . . . . . . . . 107

3.7 Resumo e consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . 1093.8 Apendice - Variacao quadratica, condicoes de Lipshitz e Holder . . . . . . 111

3.8.1 Variacao quadratica . . . . . . . . . . . . . . . . . . . . . . . . . . 1113.8.2 Condicoes de Lipshitz e Holder . . . . . . . . . . . . . . . . . . . 112

4 Modelo de Black, Merton e Scholes 1134.1 Conceitos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.2 Modelo de Black e Scholes . . . . . . . . . . . . . . . . . . . . . . . . . . 1174.3 Modelo de Merton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1244.4 Modelo de Margrabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1274.5 Gregas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.6 Volatilidade implıcita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1304.7 Resumo e consideracoes adicionais . . . . . . . . . . . . . . . . . . . . . . 1324.8 Apendice - Solucao da EDP de BMS . . . . . . . . . . . . . . . . . . . . 134

4.8.1 Solucao da EDP de BMS . . . . . . . . . . . . . . . . . . . . . . . 1344.8.2 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . 1424.8.3 Solucao da equacao do calor . . . . . . . . . . . . . . . . . . . . . 1434.8.4 Resultados basicos . . . . . . . . . . . . . . . . . . . . . . . . . . 145

5 Mudanca de Medida 1475.1 Conceitos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1485.2 Mudanca de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.3 Mudando a medida do Browniano . . . . . . . . . . . . . . . . . . . . . . 1515.4 Teorema de Girsanov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1535.5 Aprecamento pela medida martingal . . . . . . . . . . . . . . . . . . . . 1575.6 Teoremas fundamentais de financas . . . . . . . . . . . . . . . . . . . . . 161

Page 4: Processos Estocásticos em Finanças

SUMARIO iii

5.7 Replicando para o aprecamento . . . . . . . . . . . . . . . . . . . . . . . 1645.8 Extensoes do modelo de BMS . . . . . . . . . . . . . . . . . . . . . . . . 1665.9 Derivativos exoticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

5.9.1 Opcoes com barreiras . . . . . . . . . . . . . . . . . . . . . . . . . 1695.9.2 Opcoes Lookback . . . . . . . . . . . . . . . . . . . . . . . . . . . 1705.9.3 Opcoes Asiaticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

5.10 Resumo e consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . 1705.11 Apendice - Metodo de Monte-Carlo . . . . . . . . . . . . . . . . . . . . . 171

6 Equacoes Diferenciais Estocasticas 1756.1 Conceitos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1766.2 Calculo estocastico multivariado . . . . . . . . . . . . . . . . . . . . . . . 1786.3 Gerador de difusao de Ito . . . . . . . . . . . . . . . . . . . . . . . . . . 1816.4 Equacao de Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . . . . 1846.5 Equacao de Fokker-Planck . . . . . . . . . . . . . . . . . . . . . . . . . . 1886.6 Equacao de Feynman-Kac . . . . . . . . . . . . . . . . . . . . . . . . . . 1896.7 Equacoes diferenciais estocasticas . . . . . . . . . . . . . . . . . . . . . . 191

6.7.1 Definicoes basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 1916.7.2 Solucao forte da EDE . . . . . . . . . . . . . . . . . . . . . . . . . 1926.7.3 Solucao geral da EDE . . . . . . . . . . . . . . . . . . . . . . . . 193

6.8 Resumo e consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . 1976.9 Apendice - Densidade implıcita e volatilidade local . . . . . . . . . . . . . 198

6.9.1 Densidade implıcita . . . . . . . . . . . . . . . . . . . . . . . . . . 1986.9.2 Volatilidade local . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

7 Derivativos Americanos 2037.1 Conceitos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2037.2 Aprecamento do derivativo . . . . . . . . . . . . . . . . . . . . . . . . . . 2057.3 Aprecamento da opcao de venda . . . . . . . . . . . . . . . . . . . . . . . 2077.4 Fronteira otima de exercıcio . . . . . . . . . . . . . . . . . . . . . . . . . 2087.5 Solucoes Numericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

7.5.1 Metodo binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . 2117.5.2 Derivativos Americanos e Bermudianos . . . . . . . . . . . . . . . 217

7.6 Propriedades das opcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . 2187.7 Resumo e consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . 2217.8 Apendice - Metodo binomial de CRR . . . . . . . . . . . . . . . . . . . . 221

Page 5: Processos Estocásticos em Finanças

iv SUMARIO

Page 6: Processos Estocásticos em Finanças

Lista de Figuras

1.1 Funcao densidade da distribuicao normal padrao . . . . . . . . . . . . . . 81.2 Funcao densidade da distribuicao lognormal . . . . . . . . . . . . . . . . 101.3 Funcao densidade da distribuicao gama . . . . . . . . . . . . . . . . . . . 111.4 Funcoes densidades das distribuicoes t de Student e normal . . . . . . . . 121.5 Densidades Cauchy, t de Student e normal . . . . . . . . . . . . . . . . . 131.6 Densidade normal bivariada com X e Y independentes . . . . . . . . . . 221.7 Distribuicao normal: (a) e (b) X e Y independentes, (c) e (d) ρX,Y = 0, 8 231.8 Regioes de integracao da funcao densidade . . . . . . . . . . . . . . . . . 261.9 Regioes de integracao da funcao densidade . . . . . . . . . . . . . . . . . 27

2.1 Exemplo da evolucao da variavel Yt . . . . . . . . . . . . . . . . . . . . . 392.2 Duas realizacoes do passeio aleatorio yt = 5 + εt . . . . . . . . . . . . . . 402.3 Precos do petroleo de jan 1985 a mai 2008 . . . . . . . . . . . . . . . . . 432.4 Histograma das sub-amostras dos precos . . . . . . . . . . . . . . . . . . 442.5 Retornos do petroleo de jan 1985 a mai 2008 . . . . . . . . . . . . . . . . 452.6 Histograma das sub-amostras dos retornos . . . . . . . . . . . . . . . . . 462.7 Processo yt = 0, 6yt−1 + εt: (a) simulacoes, (b) FAC . . . . . . . . . . . . 49

3.1 Trajetoria do processo Browniano . . . . . . . . . . . . . . . . . . . . . . 763.2 Grafico com dez trajetorias do processo Browniano . . . . . . . . . . . . 773.3 Trajetorias do processo geometrico Browniano . . . . . . . . . . . . . . . 833.4 Simulacoes do processo geometrico de reversao . . . . . . . . . . . . . . . 109

4.1 Diagrama de posicao de uma opcao de compra . . . . . . . . . . . . . . . 1144.2 Diagrama de posicao de uma opcao de venda . . . . . . . . . . . . . . . . 1154.3 Opcao de compra para K = 7, r = 5% e σ = 25% . . . . . . . . . . . . . 1234.4 Opcao de venda para K = 7, r = 5% e σ = 25% . . . . . . . . . . . . . . 1234.5 Comportamento do Vega com o preco do ativo (K = 7, r = 5% e σ = 25%)1304.6 Volatilidade implıcita - grafico smirk . . . . . . . . . . . . . . . . . . . . 132

7.1 Opcao de venda para τ = 2, K = 7, r = 5% e σ = 25% . . . . . . . . . . 2067.2 Transicao suave na curva (b) compatıvel com a aus encia de arbitragem . 2097.3 Fronteira otima de exercıcio para uma opcao de venda Americana . . . . 2107.4 Arvore binomial com 2 perıodos e 3 estados terminais . . . . . . . . . . . 2147.5 Arvore binomial com os precos do derivativo em cada no . . . . . . . . . 2157.6 Arvore binomial com M perıodos e M + 1 nos no vencimento . . . . . . . 216

v

Page 7: Processos Estocásticos em Finanças

vi LISTA DE FIGURAS

Page 8: Processos Estocásticos em Finanças

Lista de Tabelas

1.1 Distribuicao Exemplo 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2 Distribuicao marginal de X . . . . . . . . . . . . . . . . . . . . . . . . . 151.3 Distribuicao marginal de Y . . . . . . . . . . . . . . . . . . . . . . . . . . 151.4 Distribuicao condicional de X|Y = 0 . . . . . . . . . . . . . . . . . . . . 151.5 Distribuicao condicional de X|Y = 1 . . . . . . . . . . . . . . . . . . . . 161.6 Distribuicao condicional de X|Y = 2 . . . . . . . . . . . . . . . . . . . . 161.7 Distribuicao Exercıcio 1.5 . . . . . . . . . . . . . . . . . . . . . . . . . . 20

7.1 Valores dos portfolios A e B na data atual e no vencimento . . . . . . . . 2197.2 Valores dos portfolios A e B na data atual e no vencimento . . . . . . . . . . 220

vii

Page 9: Processos Estocásticos em Finanças

viii LISTA DE TABELAS

Page 10: Processos Estocásticos em Finanças

Prefacio

.........................Em construcao.....

ix

Page 11: Processos Estocásticos em Finanças

Capıtulo 1

Conceitos Preliminares

Este primeiro Capıtulo trata dos conceitos fundamentais como o de variaveis aleato-rias e suas propriedades, distribuicoes das variaveis aleatorias e teoremas limites. Asdisciplinas que abordam tais assuntos estao em teoria de probabilidade e matematicaestatıstica. O leitor que esta familiarizado com tais assuntos e nao sente dificulade emresolver os exercıcios apresentados, pode iniciar os estudos pelo Capıtulo 2. Os con-ceitos apresentados no primeiro capıtulo podem ser encontrados em varios textos dentreos quais citamos Hogg e Craig(1990) [52], Pestman (1998) [82], Casella e Berger (2001)[22] e Meucci (2005) [74].

1.1 Introducao

No mundo real o resultado de um evento (experimento) ou de um jogo e incerto. Oarremesso de uma moeda ou de um dado sao experimentos em que os resultados naosao previsıveis. Da mesma forma podemos imaginar que o ındice da bolsa de valoresamanha pode aumentar ou diminuir dependendo dos eventos economicos e polıticos quese sucederao ate o proximo dia.

Os experimentos aleatorios sao denominados eventos aleatorios (ou simplesmenteeventos). Tais eventos produzem resultados. Ao conjunto de todos os possıveis resul-tados denominamos espaco amostral Ω. Aos resultados dos eventos podemos associarnumeros. Por exemplo, no caso de uma moeda podemos descrever os resultados poruma variavel aleatoria X = X(ω) ∈ 0, 1, onde 1 representa o resultado cara e 0representa o resultado coroa e ω pertence ao espaco dos resultados Ω = cara, coroa.Em termos matematicos X = X(ω) e uma funcao real definida no espaco Ω. Portanto,uma variavel aleatoria associa um numero com cada possıvel resultado de um evento.

Se a moeda do evento e equilibrada entao, baseados em evidencias empıricas, pode-mos dizer que as probabilidades de ocorrencia de tais eventos sao dadas por

P (ω : X(ω) = 0) = P (ω : X(ω) = 1) = 0, 5

Portanto, a variavel aleatoria X assume um valor associado ao evento. As propriedadesda variavel aleatoria sao descritas em termos dos valores que pode assumir, ou seja, desua distribuicao. A distribuicao estao associados o espaco de eventos Ω e a probabili-dade de ocorrencia dos eventos P .

1

Page 12: Processos Estocásticos em Finanças

1.2 Conceitos em probabilidade

Sejam A e B dois eventos tais que A e B ∈ Ω, entao a ocorrencia de um evento ou outroe dado pelos resultados contidos na uniao dos conjuntos que descrevem os eventos A eB, e sua probabilidade de ocorrencia e descrita por:

P (A ∪B) = P (A) + P (B)− P (A ∩B)

Se A e B sao disjuntos, A ∩B = ∅, entao:

P (A ∪B) = P (A) + P (B)

Seja Ac o complementar de A, entao: P (Ac) = 1 − P (A). Alem disso, P (Ω) = 1 eP (∅) = 0.

Dois eventos A e B podem ser dependentes no sentido de que a ocorrencia de umira alterar a probabilidade de ocorrencia de outro. Assim sendo, o conhecimento daocorrencia de um evento ira ajudar a prever melhor a ocorrencia de outro evento. Defin-imos entao o conceito de probabilidade condicional. A probabilidade de ocorrer A dadoque ocorreu B e definida por

P (A|B) =P (A ∩B)

P (B)e P (B|A) =

P (A ∩B)

P (A)(1.1)

Das equacoes acima podemos escrever

P (A|B) =P (B|A)P (A)

P (B)ou P (B|A) =

P (A|B)P (B)

P (A)

Se B1, B2, . . . Bn sao eventos disjuntos, temos P (A) =∑n

i=1 P (A|Bi)P (Bi)

P (Bi|A) =P (A|Bi)P (Bi)

P (A)i = 1, 2 . . . n (1.2)

P (Bi|A) =P (A|Bi)P (Bi)∑ni=1 P (A|Bi)P (Bi)

i = 1, 2 . . . n (1.3)

que e conhecida com Teorema de Bayes.

Duas variaveis aleatorias sao independentes se

P (X ∈ A, Y ∈ B) = P (X ∈ A)P (Y ∈ B) (1.4)

para AeB ∈ Ω. Os eventos X ∈ A e Y ∈ B sao ditos independentes. Neste casoP (A|B) = P (A). Ou seja, a ocorrencia de B em nada afeta a ocorrencia de A. Quandoduas variaveis aleatorias sao independentes e possuem a mesma distribuicao dizemosque sao iid (independentes e identicamente distribuıdas).

Exemplo 1.1. Considere A o conjunto dos eventos produzidos pelo lancamento de umdado em que o resultado seja menor ou igual a 4. Considere B o conjunto dos eventosdo lancamento do dado em que o resultado seja igual ou superior a 2 e inferior a 6.Calcule P (A ∪B) e P (B|A).

2

Page 13: Processos Estocásticos em Finanças

Solucao: Os conjuntos A e B sao tais que A = 1, 2, 3, 4 e B = 2, 3, 4, 5. A in-tersecao dos dois conjuntos e A ∩ B = 2, 3, 4. Como os eventos sao independentestemos que P (A) = 4

6, P (B) = 4

6e P (A ∩B) = 3

6. Usando a relacao acima temos que

P (A ∪B) = 46

+ 46− 3

6= 5

6.

A probabilidade de ocorrer o evento B dado que aconteceu o evento A sera conformea equacao (1.1)

P (B|A) =P (A ∩B)

P (A)=

3646

=3

4

Funcao distribuicao e densidade Uma variavel aleatoria pode ser interpretada apartir dos resultados dos eventos a ela associado. Conhecer uma variavel aleatoriasignifica saber quais os numeros associdados aos eventos e a lei de probabilidade quegoverna tais eventos. A lei de probabilidade e denominada de distribuicao de probabi-lidade. A maneira mais usual de descrevermos a distribuicao de probabilidade de umavariavel aleatoria X e atraves da funcao densidade fX (x). A funcao densidade e talque fX (x) ≥ 0. E definida de forma que a area sob a funcao densidade fornece a pro-babilidade de ocorrer um evento associado ao intervalo que delimita esta area, isto e

P X ∈ [a, b] =

∫ b

a

fX (x) dx

Se a variavel aleatoria esta definida no eixo real entao∫ ∞−∞

fX (x) dx = 1

A segunda maneira de descrevermos uma distribuicao de probabilidade de umavariavel aleatoria X e atraves do conceito de funcao distribuicao FX (x), assim definida

FX (x) = P (X ≤ x) = P (ω : X (ω) ≤ x) x ∈ R (1.5)

Para uma variavel aleatoria do tipo discreto temos a funcao distribuicao:

FX (x) =∑k:xk≤x

pk x ∈ R (1.6)

onde 0 ≤ pk ≤ 1 para todo k e∑∞

k=1 pk = 1. As distribuicoes binomial e Poisson saoexemplos de distribuicoes de variaveis aleatorias do tipo discreto.

Para uma variavel aleatoria do tipo contınuo que tenha funcao densidade fX (x), afuncao distribuicao e dada por

FX (x) = P (X ≤ x) =

∫ x

−∞fX (x) dx x ∈ R (1.7)

onde fX (x) ≥ 0 para todo x ∈ R e∫∞−∞ fX (x) dx = 1. As distribuicoes normal, expo-

nencial, gama e uniforme sao alguns exemplos de variaveis aleatorias do tipo contınuo.

3

Page 14: Processos Estocásticos em Finanças

Momentos de uma variavel aleatoria O primeiro momento E (X) uma variavelaleatoria do tipo contınuo e dado por:

µX = E (X) =

∫ ∞−∞

xfX (x) dx (1.8)

onde µX e a media ou valor esperado de X.

O segundo momento E (X2) e definido por

E(X2)

=

∫ ∞−∞

x2fX (x) dx (1.9)

O segundo momento define uma importante medida de dispersao denominada variancia,V ar (X):

V ar (X) = E[(X − E (X))2] = E

(X2)− E2 (X) (1.10)

A variancia tambem pode ser definida como

V ar(X) =

∫ ∞−∞

(x− µX)2 fX (x) dx (1.11)

O desvio padrao e definido como a raız quadrada da variancia.

O terceiro momento centrado na media e uma medida da simetria da distribuicao. As-sim, define-se o coeficiente de assimetria Sk, como sendo o terceiro momento de Xcentrado na media e normalizado pelo desvio padrao elevado ao cubo (ou pela varianciaelevada a potencia 3

2):

Sk (X) =E

[X − E (X)]3

E

[X − E (X)]2 3

2

(1.12)

As distribuicoes simetricas em relacao a media possuem coeficiente de assimetria nulo.O coeficiente de assimetria positivo significa que a funcao densidade possui mais massaa esquerda. O coeficiente de assimetria negativo indica que a funcao densidade possuisua massa concentrada do lado direito.

O quarto momento centrado na media guarda a informacao do peso da cauda em relacaoa massa de toda a funcao densidade. A medida de curtose Ku da distribuicao prove estainformacao. Ela e definida como o quarto momento centrado na media e normalizadopelo desvio padrao elevado a potencia 4 (ou pela variancia elevada a potencia 2).

Ku (X) =E

[X − E (X)]4(

E

[X − E (X)]2)2 (1.13)

A curtose destaca a importancia das caudas. Ou seja, informa o quao provavel e aocorrencia de valores da variavel aleatoria nas regioes distantes da porcao central dadistribuicao. Um valor elevado de curtose indica que a distribuicao possui caudas pe-sadas. O valor de referencia e a curtose da distribuicao normal, que e 3. Assim e comumreferir-se a distribuicoes com caudas pesadas aquelas distribuicoes com valores de cur-tose superiores a 3. Ou tambem e usual mencionar o excesso de curtose para esses casos,

4

Page 15: Processos Estocásticos em Finanças

significando o quanto excede a 3 a curtose da distribuicao.

O momento de ordem m de uma distribuicao E (Xm) e definido por

E (Xm) =

∫ ∞−∞

xmfX (x) dx (1.14)

O momento de uma funcao real g (x) e definido por

E (g (x)) =

∫ ∞−∞

g (x) fX (x) dx (1.15)

O quantil α de uma distribuicao de uma variavel aleatoria X e definido por

FX (xα) = α

O quantil α = 0, 5 (ou quantil 50%) e chamado de mediana da distribuicao de proba-bilidade. Uma distribuicao de probabilidade e simetrica em relacao a um valor a se esatisfeita a condicao

fX (a− x) = fX (a+ x) ∀x

Para uma distribuicao simetrica temos a = E (x), ou seja, a media e a mediana saocoincidentes. A moda de uma variavel aleatoria e o valor de X para o qual fX (x) emaximo local. Sera unimodal para o caso de apenas um maximo.

Exercıcio 1.1. Escreva a media, a variancia, o m-esimo momento e a esperanca deg (x) para a variavel aleatoria X do tipo discreto.

Funcao geradora de momentos e funcao caracterıstica Vimos que a descricao deuma variaevel aleatoria X pode ser feita pelas funcoes densidade ou funcao distribuicao.Uma terceira maneira e atraves da funcao geradora de momentos. Posteriormente ver-emos um quarto modo de descrever as propriedades de uma variavel aleatoria, trata-seda funcao caracterıstica.

O conceito de funcao geradora de momentos e muito importante na analise de processosestocasticos e na demonstracao de teoremas relacionados a convergencia. Suponha queo valor esperado de E (eux) exista, entao

E(euX)

=

∫ ∞−∞

euxfX (x) dx (1.16)

E(euX)

=∑x

euxfX (x) (1.17)

definem os valores esperados para distribuicoes contınuas e discretas, respectivamente.Estes valores esperados sao funcoes da variavel u e sao denominados de funcoes geradorasde momentos, ou seja

MX (u) = E(euX)

(1.18)

5

Page 16: Processos Estocásticos em Finanças

Nem toda distribuicao possui funcao geradora. Entretanto, quando uma distribuicaopossui funcao geradora ela e unica e permite a caracterizacao completa da distribuicaoda variavel aleatoria. Observe que

dMX (u)

du= M ′

X (u) =

∫ ∞−∞

xeuxfX (x) dx (1.19)

dMX (u)

du= M ′

X (u) =∑x

xeuxfX (x) (1.20)

Fazendo u = 0 nas equacoes (1.19) e (1.20) obtemos o primeiro momento da distribuicao

M ′X (0) = E (X) = µ

O segundo momento e obtido a partir da segunda derivada de MX (u):

M ′′X (u) =

∫ ∞−∞

x2euxfXdx (1.21)

M ′′X (u) =

∑x

x2euxfX (x) (1.22)

Temos portantoE(X2)

= M ′′X (0)

E analogamenteE (Xm) = M

(m)X (0)

Vamos definir o valor esperado E(eiuX

)) onde i e o numero imaginario

√−1. A

funcao φX (u) = E(eiuX

)existe para toda a distribuicao e e denominada funcao carac-

terıstica. Assim temos

φX (u) =

∫ ∞−∞

eiuxfX (x) dx (1.23)

φX (u) =∑x

eiuxfX (x) (1.24)

as funcoes caracterısticas das distribuicoes contınuas e discretas, respectivamente. Cadadistribuicao possui uma funcao caracterıstica que permite a obtencao dos seus momentose portanto, a completa descricao da distribuicao. Assim temos: iE (X) = φ′ (0) ei2E (X2) = φ′′ (0). As transformacoes integrais como Laplace e Fourier sao similares aosconceitos acima de MX (u) e φX (u). Mais apropriadamente, a funcao caracterıstica e atransformada de Fourier da funcao densidade de probabilidade (veja estes conceitos nasecao 4.8.2).

1.3 Algumas distribuicoes

Distribuicao de Bernoulli Seja X uma variavel aleatoria que pode assumir os val-ores 0 e 1. Seja P (X = 1) = p, dizemos que X tem uma distribuicao de Bernoullicom parametro p (0 < p < 1)). A media e a variancia de X sao E (X) = p eV ar (X) = p (1− p).

6

Page 17: Processos Estocásticos em Finanças

Distribuicao binominal A funcao densidade de uma variavel aleatoria X com dis-tribuicao binomial e parametros n e p e dada por

fX (x) =

(n

x

)px (1− p)n−x (1.25)

veja no Exemplo 1.1 abaixo o calculo da funcao geradora de momentos da distribuicaobinomial.

Exemplo 1.2. Encontre a funcao geradora de momentos da distribuicao binomial de-scrita pela equacao (1.25).

Solucao: A funcao geradora, de acordo com a equacao (1.18), sera dada por

MX (u) =∑x

eux(n

x

)px (1− p)n−x

MX (u) =∑x

(n

x

)(peu)x (1− p)n−x

MX (u) = [(1− p) + peu]n

Derivando a equacao acima em relacao a t, temos

M ′X (u) = n [(1− p) + peu]n−1 peu

Logo o primeiro momento sera µ = E (X) = M ′ (0) = np

A segunda derivada da funcao geradora e

M ′′X (u) = n (n− 1)

[(1− p) p2e2u + peu

]n−2p2e2u + np [(1− p) + peu]n−1 eu

M ′′X (0) = n (n− 1) p2 + np

E a variancia sera

V ar (X) = σ2 = M ′′X (0)− (np)2 = np (1− p)

Distribuicao de Poisson Uma variavel aleatoria X definida no conjunto 0, 1, . . .tem uma distribuicao de Poisson com parametro λ > 0 se

fX (x) = P (X = x) =λx

x!e−λ para x = 0, 1, . . . (1.26)

A media e a variancia de X sao: E (X) = λ e V ar (X) = λ. Em uma distribuicao binom-inal que tenha o parametro n suficientemente grande e o parametro p muito pequeno, amesma pode ser aproximada por uma distribuicao de Poisson tal que

(nx

)px (1− x)n−x ≈

λx

x!e−λ e λ = np, x = 0, 1, . . ..

7

Page 18: Processos Estocásticos em Finanças

Distribuicao Normal A distribuicao normal e a mais comumente utilizada para de-screver uma variavel aleatoria que assume valores no eixo R e que sejams simetricos emrelacao a moda. Se X e uma variavel aleatoria com distribuicao Normal escrevemos queX ∼ N (µ, σ2), onde µ e a media e σ o desvio padrao de X. A sua funcao densidade edada por

fX (x) =1√2πσ

exp

[−(x− µ)2

2σ2

]x ∈ R (1.27)

A funcao geradora de momentos e a funcao caracterıstica de uma distribuicao normalsao respectivamente

M (u) = eµu+σ2u2

2 φX (t) = eiµu−σ2

2u

A Figura 1.1 mostra a funcao densidade da distribuicao normal padronizada, isto e, commedia µ = 0 e desvio padrao σ = 1.

Figura 1.1: Funcao densidade da distribuicao normal padrao

Exemplo 1.3. Encontre os primeiro e segundo momentos de uma variavel aleatoriaX ∼ N (µ, σ2) usando a funcao geradora M (u).

8

Page 19: Processos Estocásticos em Finanças

Solucao: Sabemos que os momentos sao dados pelas derivadas de M (t). Entao temosque

M ′ (u) = exp

(µu+

σ2u2

2

)(µ+ σ2u

)M ′′ (u) = exp

(µu+

σ2u2

2

)(µ+ σ2u

)2+ exp

(µu+

σ2u2

2

)σ2

E (X) = M ′ (0) = µ

E(X2)

= M ′′ (0) = µ2 + σ2

Distribuicao uniforme A distribuicao uniforme e utilizada para modelar eventos quesejam equiprovaveis dentro do range de valores que a variavel aleatoria assume. Se Xe uma variavel aleatoria com distribuicao uniforme escrevemos X ∼ U (a, b), onde b e asao parametros (a < b) tais que

fX(x) =

1b−a se x ∈ (a, b)

0 caso contrario.(1.28)

Exercıcio 1.2. Calcule a media e a variancia de X ∼ U (a, b) conforme definido naequacao (1.28). Calcule a probabilidade P (c ≤ X ≤ d) onde [c, d] e um subintervalo de[a, b].

Distribuicao Lognormal Uma importante distribuicao de probabilidade em financase a distribuicao Lognormal. Em varias situacoes a literatura utiliza tal distribuicaomodelando os precos de ativos financeiros, tal como os precos de acoes no mercado. Oscapıtulos seguintes tratarao com detalhes este fato. Uma variavel aleatoria X possuidistribuicao lognormal com parametros µ e σ se sua funcao densidade e dada por

fX (x) =1

xσ√

2πexp

[−(lnx− µ)2

2σ2

]x > 0 (1.29)

Se X possui distribuicao lognormal, entao Y = ln (X) e normalmente distribuıda talque Y ∼ N (µ, σ2). A media e a variancia de X, sao respectivamente,

E (X) = E(eY)

= eµ+σ2

2 (1.30)

V ar (X) = V ar(eY)

= e2µ+σ2(eσ

2 − 1)

(1.31)

A Figura 1.2 mostra a funcao densidade da distribuicao lognormal com parametros µ = 0e σ = 0, 5.

Exercıcio 1.3. Seja Y = ln (X) onde Y ∼ N (µ, σ2) e portanto X e lognormal. Mostreque a media e a variancia de X sao dadas pelas equacoes (1.30) e (1.31), respectiva-mente.

9

Page 20: Processos Estocásticos em Finanças

Figura 1.2: Funcao densidade da distribuicao lognormal

Distribuicao Gama Uma variavel aleatoriaX possui distribuicao Gama com parametrosα > 0 e β > 0 se sua funcao densidade e tal que

fX (x) =βα

Γ (α)xα−1e(−βx) x > 0 (1.32)

onde a funcao Gama e definida por

Γ (u) =

∫ ∞0

xu−1e−xdx u > 0

A Figura 1.3 mostra a funcao densidade da distribuicao gama com parametros α = 2 eβ = 1.

Exercıcio 1.4. Seja X uma variavel aletoria com distribuicao Gama com parametrosα e β, conforme equacao (1.32). Calcule a media e a variancia de X. Note que paraα = 1 e β = λ tem-se a distribuicao Exponencial.

Distribuicao t de Student Tal como a normal, a distribuicao t de Student e utilizadapara modelar eventos que assumem valores no eixo R e que sejam simetricos em relacaoa moda. Possui um formato analogo ao de uma normal porem apresenta mais peso nascaudas. Este peso e funcao do parametro ν, denominado graus de liberdade. Exatamentepor possuir esta propriedade, a literatura adota a distribuicao t de Student como umadistribuicao que retrata melhor o comportamento dos retornos de ativos financeiros. Um

10

Page 21: Processos Estocásticos em Finanças

Figura 1.3: Funcao densidade da distribuicao gama

fato estilizado1 nas series de retornos e a presenca de caudas pesadas. Este efeito podeser capturado pela distribuicao t de Student. Dizemos entao que X possui distribuicaot de Student e escrevemos X ∼ St (ν, µ, σ2), onde ν representa o numero de graus deliberdade, µ e a media e σ2 esta relacionado a variancia da distribuicao. A funcaodensidade e dada por

fX (x) =Γ(ν+1

2

)Γ(ν2

) 1√νπσ

(1 +

1

ν

(x− µ)2

σ2

)− ν+12

(1.33)

A variancia de X, definida para ν > 2, e dada por V ar (X) =√

νν−2

σ. A assimetria

e zero e a curtose, definida para ν > 4, e Ku (X) = 3 + 6ν−4

. Para ν da ordem de30 a distribuicao t de Student praticamente sobrepoe-se a distribuicao normal que temos mesmos parametros de µ e σ2. Baixos valores de ν significam excesso de curtose ecaudas bem mais espessas que a normal. A Figura 1.4 mostra as funcoes densidades dasdistribuicoes t de Student com parametros µ = 0, σ = 1, ν = 3 e normal padronizada.Observe o efeito das caudas pesadas da distribuicao t de Student sobre a normal. Esteefeito diminui a medida que o numero de graus de liberdade aumenta. Para ν = 30, porexemplo, as duas distribuicoes praticamente se sobrepoem.

1Os fatos estilizados sao regularidades estatısticas observadas em um grande numero de series finan-ceiras de retornos, a partir de estudos empıricos em diversos mercados.

11

Page 22: Processos Estocásticos em Finanças

Figura 1.4: Funcoes densidades das distribuicoes t de Student e normal

Distribuicao de Cauchy Uma variavel aleatoria X possui distribuicao de Cauchycom parametros µ e σ se sua funcao densidade e dada por

fX (x) =σ

π[σ2 + (x− µ)2] para x ∈ R (1.34)

Os parametros µ e σ sao tais que −∞ < µ <∞ e σ > 0. Tal como a distribuicao normale t de Student, a distribuicao de Cauchy esta definida em R e distribui-se simetricameteem relacao a moda. E utilizada para modelar eventos extremos ja que possui caudasmais pesadas (excesso de curtose) que as da distribuicao t de Student. Os momentosde X nao estao definidos pois os mesmos envolvem a integracao da funcao densidade daequacao (1.34) que nao converge. A mediana e a moda de X e o parametro µ. A Figura1.5 mostra as funcoes densidades das distribuicoes Cauchy com parametros µ = 0, σ = 1;t de Student com parametros µ = 0, σ = 1, ν = 3 e normal padronizada. Observe quea distribuicao Cauchy apresenta caudas mais pesadas que as demais.

Exercıcio 1.5. Uma variavel aleatoria possui distribuicao Exponencial com parametroλ > 0 se sua funcao densidade e tal que fX (x) = λ exp (−λx) , x ≥ 0. Calcule amedia e a variancia de X. Escreva a funcao distribuicao FX (x).

12

Page 23: Processos Estocásticos em Finanças

Figura 1.5: Densidades Cauchy, t de Student e normal

1.4 Variaveis aleatorias multidimensionais

Variaveis discretas Considere uma variavel aleatoria no espaco de dimensao dois es-crita como um vetor aleatorio (X, Y ) em que X e Y podem assumir os valores x0, . . . , xne y0, . . . , yn, respectivamente.

As distribuicoes de probabilidade das variaveis aleatorias X e Y sao dadas por

pi = P (X = xi) i = 0, 1, . . . , n (1.35)

qj = P (Y = yj) j = 0, 1, . . . , n (1.36)

Agora considere o evento em que X = xi e Y = yj. A probabilidade deste evento e

rij = P (X = xi ∩ Y = yj)

em que rij define a distribuicao de probabilidade conjunta do vetor aleatorio (X, Y ).Podemos escrever que

pi =n∑j=0

rij i = 0, . . . , n qj =n∑i=0

rij j = 0, . . . , n (1.37)

As distribuicoes de probabilidades pi e qj constituem as distribuicoes marginais da dis-tribuicao conjunta (X, Y ). Pela definicao de probabilidade condicional em (1.1), pode-mos definir as distribuicoes condicionais de X|Y e de Y |X como

P (X = xi|Y = yj) =rijqj

i = 0, 1, . . . , n (1.38)

13

Page 24: Processos Estocásticos em Finanças

P (Y = yj|X = xi) =rijpi

j = 0, 1 . . . , n (1.39)

Uma vez que definimos as distribuicoes condicionais, podemos definir o valor esperadocondicional

E (X|Y = yj) =n∑i=0

xirijqj

(1.40)

E (Y |X = xi) =n∑j=0

yjrijpi

(1.41)

Observe que o valor esperado condicional e uma variavel aleatoria pois a condicao varia,assim para E (X|Y ) podemos admitir os seguintes valores para esta variavel aleatoria:E (X|Y = y0), E (X|Y = y1) . . . E (X|Y = yn).

Portanto, se E (X|Y ) e uma variavel aleatoria, podemos calcular a sua media, ou seja,E (E (X|Y )). Assim temos

E (E (X|Y )) =n∑j=0

E (X|Y = yj)P (Y = yj)

Usando as definicoes de cada termo do somatorio acima dados em (1.40) e (1.36), temos:

E (E (X|Y )) =n∑j=0

n∑i=0

xirijqjqj =

n∑j=0

n∑i=0

xirij

E (E (X|Y )) =n∑i=0

xi

n∑j=0

rij

Usando a equacao (1.37) que define o somatorio interno acima, temos:

E (E (X|Y )) =n∑i=0

xipi = E (X)

Da mesma forma que provamos que E (E (X|Y )) = E (X) prova-se que E (E (Y |X)) =E (Y ). Da definicao de independencia entre eventos aleatorios na equacao (1.4) temosque se o evento X = xi e independendete de Y = yi, entao a probabilidade conjunta rije dada por

rij = P (X = xi ∩ Y = yi) = P (X = xi)P (Y = yi) = piqi

Exemplo 1.4. Sejam X e Y duas variaveis aleatorias com funcao densidade conjuntafXY (x, y) descrita na tabela acima. Encontre as duas funcoes densidades marginais eas medias condicionais: E (X|Y = 0), E (X|Y = 1) e E (X|Y = 2).

14

Page 25: Processos Estocásticos em Finanças

Tabela 1.1: Distribuicao Exemplo 1.2

(x, y) (0,0) (0,1) (0,2) (1,0) (1,1) (1,2) (2,0) (2,1) (2,2)

fXY (x, y) 127

227

327

527

627

427

327

227

127

Solucao: Usando a notacao do texto, temos que pi e qj representam as distribuicoes(ou densidades) marginais de X e Y , respectivamente. Logo temos

pi =2∑j=0

rij i = 0, 1, 2

qj =2∑i=0

rij j = 0, 1, 2

aqui rij equivale a fXY (x, y). Assim, temos a Tabela 1.2

Tabela 1.2: Distribuicao marginal de X

x 0 1 2

pi627

1527

627

A distribuicao marginal de Y esta descrita na Tabela 1.3.

Tabela 1.3: Distribuicao marginal de Y

y 0 1 2

qj927

1027

827

A distribuicao condicional de X|Y = 0 esta descrita na Tabela 1.4 e foi calculadaconforme as equacoes (1.38) e (1.37): O primeiro valor de probabilidade condicional

Tabela 1.4: Distribuicao condicional de X|Y = 0

x 0 1 2

P (X|Y = 0) 19

59

39

desta tabela e dado porrijqj

=127927

. A distribuicao condicional de X|Y = 1 esta descrita

na Tabela 1.5.

15

Page 26: Processos Estocásticos em Finanças

Tabela 1.5: Distribuicao condicional de X|Y = 1

x 0 1 2

P (X|Y = 1) 210

610

210

Tabela 1.6: Distribuicao condicional de X|Y = 2

x 0 1 2

P (X|Y = 2) 38

48

18

A distribuicao condicional de X|Y = 2 esta descrita na Tabela 1.6.As medias condicionais serao:

E (X|Y = 0) = 0× 1

9+ 1× 5

9+ 2× 3

9=

11

9

E (X|Y = 1) = 0× 2

10+ 1× 6

10+ 2× 2

10= 1

E (X|Y = 2) = 0× 3

8+ 1× 4

8+ 2× 1

8=

6

8

A media incondicional E (X) e a ponderacao das medias condicionais acima pelas prob-abilidades P (Y = 0), P (Y = 1) e P (Y = 2), tal que

E (X) =11

9× 9

27+ 1× 10

27+

6

8× 8

27= 1

Observe tambem que a media incondicional E (X) pode ser obtida diretamente da Tabela1.2 que fornece a distribuicao marginal de X:

E (X) = 0× 6

27+ 1× 15

27+ 2× 6

27= 1

Variaveis contınuas Sejam X e Y variaveis aleatorias do tipo contınuo, distribuıdastal que x ∈ R e y ∈ R. A funcao distribuicao conjunta de (X, Y ) e dada por

FX,Y = P (X ≤ x, Y ≤ y)

Se as derivadas parciais com relacao a x e y existem, entao a funcao densidade conjuntade (X, Y ) e dada por

fXY (x, y) =∂2FX,Y (x, y)

∂x∂y

A funcao distribuicao pode ser definida por

FXY (x, y) =

∫ x

−∞

∫ y

−∞fXY (x, y) dxdy

16

Page 27: Processos Estocásticos em Finanças

Analogamente ao caso discreto, as funcoes densidades marginais (ou simplesmente asdistribuicoes marginais) de X e Y sao respectivamente:

fX (x) =

∫ ∞−∞

fXY (x, y) dy (1.42)

fY (y) =

∫ ∞−∞

fXY (x, y) dx (1.43)

Se as variaveis aleatorias sao independentes podemos escrever

FXY = FX (x)FY (y)

onde FX (x) e FY (y) sao funcoes distribuicoes marginais de X e Y , respectivamente.

Da mesma forma, a densidade conjunta e dada por

fXY (x, y) = fX (x) fY (y)

onde fX (x) e fY (y) sao as densidades marginais de X e Y , respectivamente.

Seguindo o caso discreto, as funcoes densidades condicionais sao definidas por

fX (x|y) =fXY (x, y)

fY (y)(1.44)

fY (y|x) =fXY (x, y)

fX (x)(1.45)

As variaveis aleatorias E (X|Y ) e E (Y |X) sao escritas como

E (X|Y = y) =

∫ ∞−∞

xfX (x|y) dx

E (Y |X = x) =

∫ ∞−∞

yfY (y|x) dy

Sao validas as propriedades para as variaveis aleatorias X, Y e Z:

(i) E (E (X|Y )) = E (X) e E (E (Y |X)) = E (Y )

(ii) E (X + Y |Z) = E (X|Z) + E (Y |Z)

(iii) E (XY ) = E (XE (Y |X))

Se X e Y sao independentes temos que E (X|Y ) = E (X) e E (XY ) = E (X)E (Y ).

A variancia condicional de X dado Y e definida por

V ar (X|Y = y) = E[(X − E (X|y))2 |y

]=

∫ ∞−∞

(x− E (X|y))2 fX (x|y) dx

17

Page 28: Processos Estocásticos em Finanças

Tambem podemos escrever

V ar (X|Y ) = E(X2|y

)− (E (X|y))2

Das equacoes (1.44) e (1.43), temos que

fX (x|y) =fXY (x, y)

fY (y)=

fXY (x, y)∫fXY (x, y) dx

Usando a equacao (1.45), temos

fX (x|y) =fY (y|x) fX (x)∫fY (y|x) fX (x) dx

(1.46)

A equacao (1.46) e o teorema de Bayes que fornece a densidade condicional de X emtermos das densidades condicional de Y e da densidade marginal de X.

Exemplo 1.5. Sejam X e Y duas variaveis aleatorias com funcao densidade conjuntadada por

fXY (x, y) =

12

se 0 < x < y < 2

0 caso contrario.

(i) Encontre as funcoes densidades marginais

(ii) Encontre a funcoes densidades condicionais

(iii) Calcule a variavel aleatoria E (X|Y ) (media condicional)

(iv) Calcule a variancia condicional V ar (X|Y )

(v) Calcule P(1 < X < 3

2|Y = 3

2

)e P

(1 < X < 3

2

)Solucao: Vamos denominar o espaco onde a funcao densidade conjunta e definida porA = (x, y) : 0 < x < y < 2.

(i) As densidades marginais de X e de Y sao:

fX (x) =

∫ 2

x

1

2dy =

12

(2− x) 0 < x < 2

0 caso contrario

fY (y) =

∫ y

0

1

2dx =

1

2y 0 < y < 2

(ii) As densidades condicionais de X e Y sao

fX (x|y) =

fXY (x,y)fY (y)

=12y2

= 1y

0 < x < y 0 < y < 2

0 caso contrario

fY (y|x) =

fXY (x,y)fX(x)

=12

2−x2

= 12−x 0 < x < y 0 < y < 2

0 caso contrario

18

Page 29: Processos Estocásticos em Finanças

(iii) A media condicional E (X|Y ) e dada por

E (X|Y ) =

∫xfX (x|y) dx =

∫ y

0

x1

ydx =

y

20 < y < 2

(iv) A variancia condicional V ar (X|Y )

V ar (X|Y ) = E[(X − E (X|Y ))2 |y

]=

∫ y

0

(x− E (X|y))2 fX (x|y) dx

=

∫ y

0

(x− y

2

)2 1

ydx =

1

12y2 0 < y < 2

(v) O valor da probabilidade P(1 < X < 3

2|Y = 3

2

)e dada por

P (x1 < X < x2|Y = y1) =

∫ x2

x1

fX (x|y) dx

P

(1 < x <

3

2|Y =

3

2

)=

∫ 32

1

1

ydx

P

(1 < x <

3

2|Y =

3

2

)=

132

×(

3

2− 1

)=

1

3

O valor da probabilidade incondicional P(1 < X < 3

2

)e dada por

P (x1 < X < x2) =

∫A

∫fXY (x, y) dxdy

P

(1 < X <

3

2

)=

∫ 32

1

∫ 2

x

1

2dydx =

3

16

Definicao 1.1. (Covariancia) A covariancia entre duas variaveis aletorias X e Y edada por

Cov (X, Y ) = E [(X − E (X)) (Y − E (Y ))] (1.47)

Definicao 1.2. (Correlacao) O coeficiente de correlacao e dado por

ρXY =Cov (X, Y )√

V ar (X)√V ar (Y )

(1.48)

O coeficiente de correlacao e tal que −1 < ρXY < 1 para quaisquer variaveisaleatorias X e Y . Se ρXY = ±1 entao exite uma relacao linear entre X e Y tal queY = aX + b, sendo a e b duas constantes. Se X e Y sao independentes, ρXY = 0. Ocoeficiente de correlacao define o quao as variaveis aleatorias X e Y estao associadaslinearmente. Dizemos que X e Y sao descorrelatadas se ρXY = 0. Segue da definicao deρXY que caso X e Y sejam descorrelatadas (ρXY = 0) entao E (X, Y ) = E (X)E (Y ),que e o caso de independencia. Portanto, se X e Y sao independentes, sao tambemdescorrelatados. Se X e Y sao descorrelatados nao sao necessariamente independentes.

19

Page 30: Processos Estocásticos em Finanças

Tabela 1.7: Distribuicao Exercıcio 1.5

(x, y) (-1,-2) (-1,0) (-1,2) (0,-2) (0,0) (0,2) (1,-2) (1,0) (1,2)

fXY (x, y) 127

327

127

327

527

327

427

327

427

Exercıcio 1.6. Sejam X e Y duas variaveis aleatorias com funcao densidade descritana Tabela abaixo. Mostre que ρX,Y = 0 e verifique que X e Y nao sao independentes.

Exemplo 1.6. A funcao densidade conjunta de (XY ) e dada por

fXY (x, y) =

32

(x2 + y2) 0 < x < 1 0 < y < 1

0 caso contrario

Calcule o coeficiente de correlacao ρXY .

Solucao: A media incondicional e dada por

E (X) =

∫ 1

0

∫ 1

0

x3

2

(x2 + y2

)dxdy =

3

8

O segundo momento E (X2) e dado por

E(X2)

=

∫ 1

0

∫ 1

0

x2 3

2

(x2 + y2

)dxdy =

7

15

A variancia de X e

V ar (X) = E(X2)− E2 (X) =

7

15−(

5

8

)2

=73

960

A simetria das variaveis aleatorias X e Y permite concluir que E (Y ) = 58

e V ar (Y ) =73960

. O momento de E (XY ) e dado por

E (XY ) =

∫ 1

0

∫ 1

0

xy3

2

(x2 + y2

)dxdy =

3

8

A covariancia de X e Y e dada por

Cov (X, Y ) = E (XY )− E (X)E (Y ) =3

8− 5

8

5

8= − 1

64

Finalmente o coeficiente de correlacao definido na equacao (1.33) e

ρXY =− 1

64√73960

√73960

= −15

73

20

Page 31: Processos Estocásticos em Finanças

Exercıcio 1.7. Calcule o coeficiente de correlacao entre X e Y para a funcao densidadeconjunta definida no Exemplo 1.5.

Exercıcio 1.8. Considere X e Y variaveis aleatorias com variancia finita e sejam α eβ ∈ R. Mostre que Cov (X + α, Y + β) = Cov (X, Y ).

Definicao 1.3. (Densidade Normal Multivariada) Considere o vetor aleatorio mul-tivariadoX = (X1, X2, . . . , Xn)> de dimensao n cuja media e o vetor µ = (µ1, µ2, . . . , µn)>;o vetor x = (x1, x2, . . . , xn)> e a matriz de covariancia Σ = (σij). Entao x tem umadistribuicao normal multivariada se a densidade conjunta e dada por

fX (x) =1√

(2π)n |Σ|exp

[−1

2(x− µ)>Σ−1 (x− µ)

](1.49)

onde |Σ| e Σ−1 representam o determinante e a inversa de Σ e (x− µ)> e o transpostodo vetor x − µ. Cada densidade marginal fXi (xi) possui distribuicao normal tal queXi ∼ N (µ, σ2) em que σ2

i = Σii. Se as variaveis aleatorias Xi sao descorrelatadas amatriz Σ sera diagonal com Σij = 0 para i 6= j.

Considere a distribuicao normal multivariada em que o vetor X e separado em doisconjuntos P e Q com dimensoes p e q = n− p, respectivamente. Entao escrevemos que

X =

(XP

XQ

)µ =

(µPµQ

)Σ =

(ΣP ΣPQ

ΣQP ΣQ

)A distribuicao marginal de XP e normal tal que XP ∼ N (µP ,ΣP ). A distribuicaocondicional de XQ dado xP e normal tal que

XQ|xP ∼ N (µQ|xP ,ΣQ|xP )

ondeµQ|xP = µQ + ΣQPΣ−1

P (xP − µP )

ΣQ|xP = ΣQ −ΣQPΣ−1P ΣPQ

Como visto anteriormente duas variaveis aleatorias com distribuicao normal conjuntasao independentes se e somente se sua covariancia e zero:

(Xi, Xj) sao independentes⇔ Cov (Xi, Xj) = 0 (1.50)

Definicao 1.4. (Densidade Normal Bivariada) Sejam as variaveis X e Y comdistribuicoes normais tais que X ∼ N (µX , σ

2X) e Y ∼ N (µY , σ

2Y ), onde −∞ < µX <∞,

−∞ < µY < ∞, σX > 0 e σY > 0. Define-se que o vetor aleatorio (X, Y ) possuidistribuicao normal bivariada se a funcao densidade conjunta e dada por

fXY (x, y) =1

2πσXσY√

(1− ρ2XY )×

exp

− 1

2 (1− ρ2XY )

[(x− µX)2

σ2X

− 2ρ (x− µX) (y − µY )

σXσY+

(y − µY )2

σ2Y

]onde −1 < ρXY < 1, x ∈ R e y ∈ R.

21

Page 32: Processos Estocásticos em Finanças

As funcoes densidades marginais de X e Y sao

fX (x) =1√

2πσXexp

[−(x− µX)2

2σ2X

]

fY (y) =1√

2πσYexp

[−(y − µY )2

2σ2Y

]Vamos rever a consideracao da equacao (1.48) sob outra perspectiva. Para que X e Ysejam independentes e necessario fXY (x, y) = fX (x) fY (y). Isto somente ocorrera seρXY = 0, e isto significa tambem descorrelacao. Portanto, em uma distribuicao normalbivariada, X e Y sao independentes se e somente se X e Y sao descorrelatados. AFigura 1.6 mostra a densidade de uma distribuicao normal bivariada em que X e Y saoindependentes.

Figura 1.6: Densidade normal bivariada com X e Y independentes

A Figura 1.7 mostra na parte superior esquerda o mesmo grafico da Figura 1.6.Ainda na parte superior a direita temos uma simulacao com 1.000 pontos mostrandosduas distribuicoes normais independentes (descorrelacionadas). Na Figura 1.7 na parteinferior temos uma distribuicao normal bivariada em que o coeficiente de correlacao eρX,Y = 0, 8. No canto inferior direito temos uma simulacao com 1.000 pontos em queρX,Y = 0, 8.

Exemplo 1.7. Sejam X1 ∼ N (1, 2), X2 ∼ N (2, 1) e ρ1,2 = 0, 5. Escreva a matriz Σ,defina a funcao densidade de (X1, X2) e especifique a distribuicao condicional de X2|X1.

22

Page 33: Processos Estocásticos em Finanças

Figura 1.7: Distribuicao normal: (a) e (b) X e Y independentes, (c) e (d) ρX,Y = 0, 8

Solucao: A matriz Σ e dada por

Σ =

(σ2

1 ρσ1σ2

ρσ1σ2 σ22

)=

(2

√2

2√2

21

)

A funcao densidade e dada por

fXY (x, y) =1

2π√

2√

1− 0, 25×

exp

[1

2 (1− 0, 25)×

((x1 − 1)2

2− (x1 − 1) (x2 − 2)√

2+ (x2 − 2)2

)]

fXY (x, y) =1

π√

6× exp

[1

3

((x1 − 1)2 −

√2 (x1 − 1) (x2 − 2) + 2 (x2 − 2)2

)]A distribuicao condicional X2|x1 e tal que

X2|x1 ∼ N(µ2|x1, σ

22|x1

)onde

µ2|x1 = 2 +

√2

4(x1 − 1)

σ22|x1 =

3

4

23

Page 34: Processos Estocásticos em Finanças

Soma de variaveis aleatorias O valor esperado da soma de variaveis aleatorias (dotipo discreto ou contınuo) e igual a soma do valor esperado de cada variavel aleatoria.Em outras palavras

E

(n∑i=1

Xi

)=

n∑i=1

E (Xi) (1.51)

esta verificacao e imediata a partir da definicao de valor esperado.

A variancia da soma de variaveis aleatorias e dada por

V ar

(n∑i=1

Xi

)=

n∑i=1

V ar (Xi) + 2∑n

i,j=1i<j

Cov (Xi, Xj) (1.52)

Se as variaveis aleatorias sao descorrelatadas o termo da covariancia desaparece e entaopode-se dizer que a variancia da soma de variaveis aleatorias descorrelatadas e igual asoma das variancias de cada variavel aleatoria. Para variaveis aleatorias iid, com mediaµ e variancia σ2, pode-se afirmar

E

(n∑i=1

)= nµ V ar

(n∑i=1

Xi

)= nσ2

Exemplo 1.8. Considere que os retornos de dois ativos A e B tenham distribuicoes taisque RA ∼ N (2, 4) e RB ∼ N (1, 2). A correlacao entre A e B e ρ = −0, 4. Encontre amedia e variancia de um portfolio formado pelos ativos A e B.

Solucao: O valor esperado para o retorno do portfolio formado pelos dois ativos, con-forme equacao (1.51), e E (RA +RB) = E (RA) + E (RB) = 3.

A variancia, conforme equacao (1.52), e

V ar (RA +RB) = V ar (RA) + V ar (RB) + 2 Cov (RA, RB)︸ ︷︷ ︸=ρ√V ar(RA)

√V ar(RB)

= 4 + 2 + 2× (−0, 4)×√

4√

2

= 3, 737

1.5 Transformacao de densidade de probabilidade

Considere X um vetor aleatorio multivariado de dimensao n cuja funcao densidade econhecida. Seja g : Rn → R uma funcao contınua. Desejamos expressar a densidadeg (X) em termos da densidade de X. Os exemplos abaixo esclarecem os procedimentospara a transformacao da funcao densidade.

Exemplo 1.9. Seja a funcao densidade de X dada por fX (x) = 1 0 < x < 1. Encontrea funcao densidade de Y = X2.

24

Page 35: Processos Estocásticos em Finanças

Solucao: Buscamos encontrar a funcao densidade de Y tal que

FY (y) = P (Y ≤ y) = P(X2 ≤ y

)= P (−√y ≤ X ≤ √y)

Como a variavel X esta definida no intervalo (0, 1), temos

FY (y) = P (Y ≤ y) = P (0 < X ≤ √y) =

∫ √y0

1dx =√y

Logo escrevemos

FY (y) =

0 y ≤ 0√y 0 < y < 1

1 y ≥ 1

A funcao densidade sera

fY (y) =

1

2√y

0 < y < 1

0 caso contrario

Exemplo 1.10. Sejam X e Y variaveis aleatorias cuja funcao densidade conjunta edada por

fX,Y (x, y) =

1 0 < x < 1, 0 < y < 1

0 caso contrario

Encontre a funcao densidade de Z = X + Y .

Solucao: Temos que

FZ (z) = P (Z < z) = P (X + Y < Z) = P [(X, Y ) ∈ A]

onde A = (X, Y ) : x+ y < z. Entao temos para 0 ≤ z < 1 (equivale a area A1 daFigura 1.8).

FZ (z) = P (Z < z) =

∫A

∫fX<Y (x, y) dxdy =

∫ z

0

∫ z−x

0

1dydx =z2

2

Para 1 ≤ z < 2, temos (equivale a area A2 na Figura 1.8)

FZ (z) = P (Z < z) = 1−∫ 1

z−1

∫ 1

z−x1dydx = 1− (2− z)2

2

Logo escrevemos:

FZ (z) =

0 z < 0z2

20 ≤ z < 1

1− (2−z)2

21 ≤ z < 2

1 z ≥ 2

25

Page 36: Processos Estocásticos em Finanças

Figura 1.8: Regioes de integracao da funcao densidade

E a funcao densidade sera

fZ (z) =

z 0 < z < 1

2− z 1 ≤ z < 2

0 caso contrario

Exemplo 1.11. Considere o mesmo enunciado do Exemplo 1.10. Encontre a funcaodensidade Z = XY .

Solucao: Vamos encontrar a funcao distribuicao de Z, FZ (z). Esta funcao dis-tribuicao sera zero para z ≤ 0, pois a variavel aleatoria Z nao esta definida para taisvalores. Para z ≥ 1 a funcao distribuicao assume valor 1. Resta agora definir a funcaopara 0 < z < 1, assim temos:

FZ (z) = P (Z < z) = P (XY < z)

Os valores da variavel aleatoria Z sao definidas pelo produto de X e Y , ou seja, y = zx.

LogoFZ (z) = P (Z < z) = P [(X, Y ) ∈ A]

onde A = (x, y) : xy < z. Veja na Figura 1.9 as areas A1 e A2 que estao sendointegradas:

26

Page 37: Processos Estocásticos em Finanças

Figura 1.9: Regioes de integracao da funcao densidade

FZ (z) = P (Z < z) =

∫ ∫fX,Y (x, y) dxdy = Area A1 + Area A2

=

∫ z

0

∫ 1

0

1dydx+

∫ 1

z

∫ zx

0

1dydx = z + z ln1

z

Logo a funcao densidade de Z e dada por

fZ (z) =

ln 1

z0 ≤ z < 1

0 caso contrario

1.6 Desigualdades em probabilidade e teoremas lim-

ites

Definicao 1.5. (Desigualdade de Chebyshev) Seja X uma variavel aleatoria commedia µ e variancia σ2. Seja tambem k > 0, entao pode-se escrever que

P (|X − µ| ≥ kσ) ≤ 1

k2(1.53)

Em outras palavras, a desiguladade de Chebyshev estabelece um limite superiorpara a probabilidade da variavel aleatoria situar-se em determinada faixa de valores. Ademonstracao deste resultado esta no Apendice deste capıtulo.

27

Page 38: Processos Estocásticos em Finanças

Definicao 1.6. (Desigualdade de Markov) Seja f (x) uma funcao nao negativa ecrescente de uma variavel aleatoria X definida no intervalo x ≥ 0. Seja c ≥ 0, entaopode-se escrever

P (|X| ≥ c) ≤ E [f (X)]

f (c)

Este tambem e um resultado que fornece limites para os resultados dos valores daprobabilidade de X situar-se em uma faixa de valores. A demonstracao esta feita noApendice do capıtulo.

Definicao 1.7. (Desigualdade dos momentos) Sao validas as seguintes desigual-dades:

(i) Desigualdade de Schwarz: [E (XY )]2 ≤ E (|X|2)E (|Y |2)

(ii) Desigualdade de Jensen: Seja f uma funcao convexa em R. Considere que E (|X|)e E [|f (X) |] sejam finitas, entao f [E (X)] ≤ E [f (X)].

Os teoremas limites estao fundamentados em criterios de convergencia para umasequencia de variaveis aleatorias.

Definicao 1.8. (Convergencia em Probabilidade) Uma sequencia de variaveisaleatorias X1, X2, . . . converge em probabilidade para uma variavel aleatoria X separa ε > 0 ocorre

limN→∞

P (|XN −X| > ε) = 0

Definicao 1.9. (Convergencia de ordem p) Uma sequencia de variaveis aleatoriasX1, X2 . . . tal que E [|XN |p] <∞, N = 1, 2, . . . converge no primeiro momento comordem p (1 ≤ p <∞) para a variavel aletoria X, se

limN→∞

E [|XN −X|p] = 0

Para o caso em que p = 2 temos o caso da convergencia media quadratica. Este con-ceito de convergencia sera utilizado para a definicao de integral no ambiente estocastico.

Definicao 1.10. (Convergencia quase certa) Uma sequencia de variaveis aleatoriasX1, X2 . . . converge com probabilidade 1 ou quase certamente (q.c.) para X se

P[

limN→∞

XN = X]

= 1

Definicao 1.11. (Convergencia em distribuicao) Seja a sequencia de variaveisaleatorias X1, X2 . . .. Considere que FXi (X) e a funcao distribuicao de Xi. A sequenciaacima converge para X com funcao distribuicao FX (x) se

limN→∞

FXN = limN→∞

P (XN ≤ x) = P (X ≤ x) = FX (x)

Teorema 1.1. (Lei fraca dos grandes numeros) Considere XN a media de umaamostra de tamanho N de uma variavel aletoria X que tem media µ e variancia σ2. SejaX1, X2 . . . uma sequencia iid desta variavel aleatoria. Sabemos que XN = 1

N

∑Ni=1Xi.

A sequencia X1, X2 . . . converge em probabilidade para µ se

P (|XN − µ| > ε) = 0

onde ε > 0.

28

Page 39: Processos Estocásticos em Finanças

Prova. A variancia de XN e σ2

N. A desigualdade de Chebyshev garante que

P [|X − µ| ≥ kσ] ≤ 1

k2

Temos que provar que limN→∞ P(|XN − µ| > ε

)= 0.

Considere P(|XN − µ| > ε

). Entao tomando k = N

12 εσ

, temos

P(|XN − µ| > ε

)= P

(|XN − µ| ≥ ε

)= P

(|XN − µ| >

N12

)e a desigualdade de Chebyshev garante que tal probabilidade deve ser menor ou iguala 1

k2 = σ2

Nε2. Logo P

(|XN − µ| > ε

)≤ σ2

Nε2. Tomando o limite quanto N → ∞ temos o

resultado desejado. Esta e a lei fraca dos grandes numeros.

Teorema 1.2. Seja X1, X2 . . . uma sequencia de variaveis aleatorias com media µ.A correspondete sequencia

X1, X2, . . .

converge quase certamente (converge com pro-

babilidade 1) para µ.

Teorema 1.3. Seja X1, X2 . . . uma sequencia de variaveis aleatorias com parametros

µi = E (Xi) e σ2i = V ar (Xi) sob a condicao de que

∑∞i=1

(σii

)2< ∞. A sequencia

Y1, Y2 . . . tal que YN = XN − 1N

∑Ni=1 µi converge quase certamente (convergencia com

probabilidade 1) para zero.

Estes dois ultimos teoremas representam a lei forte dos grandes numeros, pois ocriterio de convergencia e o criterio quase certamente (convergencia com probabilidade1).

O Teorema Central do Limite e um importante resultado da Teoria de Probabilidadeque estabelece que se X1, X2, . . . , XN sao os elementos de uma amostra aleatoria detamanho N de qualquer distribuicao que tenha variancia finita σ2 e media µ, entao a

variavel aleatoria√N(X−µ)

σtem como limite uma distribuicao normal com meida zero e

variancia 1. A partir deste teorema pode-se inferir probabilidades sobre X.

Teorema 1.4. (Teorema Central do Limite) Seja X1, X2 . . . uma sequencia devariaveis aleatorias iid de uma distribuicao com media µ e variancia σ2. Entao avariavel aleatoria

YN =

∑Ni=1 Xi −Nµ√

Nσ=

√N(XN − µ

tem uma distribuicao que tende para uma normal com media zero e variancia 1 quandoN →∞.

Exemplo 1.12. Seja X a media de uma amostra aleatoria de tamanho 1800 extraıda deuma distribuicao Gama de parametros α = 2 e β = 3. Avalie o valor de P

(5, 8 < X < 6, 2

).

29

Page 40: Processos Estocásticos em Finanças

Solucao: A solucao do Exercicio 1.4 fonece o valor da media e variancia da distrbuicaoGama. A media e dada por µ = αβ e a variancia σ2 = αβ2. Isto e µ = 6 e σ2 = 18.Logo pode-se escrever com base no Teorema Central do Limite que

P(5, 8 < X < 6, 2

)= P

(√N (5, 8− µ)

σ<

√N(X − µ

<

√N (6, 2− µ)

σ

)= P

(−2 < 10

(X − 6

)< 2)

= 0.9545

Exercıcio 1.9. Considere X a media de uma amostra aleatoria de tamanho 100 extraıdade uma distribuicao uniforme tal que U ∼ (0, 2).Avalie P

(1, 95 < X < 2, 05

).

1.7 Inferencia estastıstica

Um importante assunto em financas e o tratamento de dados obtidos em mercados apartir de negociacoes de ativos entre os agentes. Estes dados permitem inferir sobreas propriedades de determinada variavel sobre a qual estamos analisando o comporta-mento. Por exemplo, podemos a partir de uma serie historica de precos do petroleoconcluir que a distribuicao lognormal descreve bem esta variavel? Se afirmativo quaisos valores dos parametros desta distribuicao? Note que buscamos descrever a variavelpreco do petroleo inferindo sobre o tipo da distribuicao e os parametros que a definem.O assunto que trata tais questoes em estatıstica e denominado inferencia estatıstica.Nesta secao vamos apenas destacar alguns conceitos relevantes. O Capıtulo 2 sera maisabrangente e apresentara com detalhes a aplicacao de conceitos estatısticos aos dadosde precos.

Os conceitos de populacao e amostra ja nos sao familiares, vamos definir o conceitode estatıstica. Sejam X1, . . . , XN uma amostra aleatoria de uma variavel X, qualquerfuncao que seja dependente unicamente da amostra e denominada de estatıstica. Porexemplo, X = 1

N

∑Ni=1Xi, e uma estatıstica, a mediana de uma amostra e tambem

uma estatıstica. Outro exemplo importante e a estatıstica 1N

∑Ni=1

(Xi − X

)2que esta

relaciona ao segundo momento da distribuicao de X.

SejaX1, . . . , XN uma amostra da variavel aleatoriaX, considere entao que as variaveisX1, . . . , XN sao independentes. Isto significa que cada valor Xi e obtido por um sorteio apartir da funcao densidade que representa X independentemente de outro valor sorteadoXj, i 6= j. Esta amostra e dita iid pois as variaveis aleatorias sao independentes e iden-ticamente distribuıdas (tem a mesma origem).

A partir deste conjunto de variaveis aleatorias ou amostra iid podemos escrever quea densidade conjunta e o produto das funcoes densidades individuais a semelhanca do

30

Page 41: Processos Estocásticos em Finanças

conceito de probabilidade de eventos independentes na equacao (1.4).

Mais especificamente vamos considerar que cada variavel aleatoria seja oriunda dafuncao densidade que tenha θ como parametro que define a distribuicao. Assim a funcaodensidade conjunta, sera

f (x1, . . . , xN ; θ) =N∏i=1

f (xi; θ) (1.54)

A funcao densidade conjunta tambem e conhecida como funcao de verossimilhancade θ. A questao central e definir o parametro θ, ou melhor inferir sobre θ, dada aobservacao amostral. Entao escrevemos que a versossimilhanca e

L (θ; x) =N∏i=1

f (xi; θ) (1.55)

A funcao de verossimilhanca sera utilizada como uma das metodologias para es-timacao do parametro θ. O verdadeiro valor de θ somente podera ser obtido se tivessemosacesso a toda a populacao dos dados. Na pratica isto e impossıvel, conhecemos apenasparte da populacao, ou seja, uma amostra. Por isto que estimacao do parametro θ efuncao da amostra. Dizemos entao que θ e um estimador do verdadeiro parametro θ.O range de valores que o estimador pode assumir e denominado de espaco parametricoΘ. Se por exemplo o parametro que estamos estimando e a media de uma distribuicaonormal, o espaco parametrico sera o conjutno dos reais, tal que θ ∈ R. Se o parametrofor a variancia o espaco parametrico sera o conjunto dos reais positivos, θ ∈ R+.

Um estimador θ e nao tendencioso se o seu valor esperado e o verdadeiro parametroθ, ou seja

E(θ)

= θ (1.56)

Exemplo 1.13. Considere X1, . . . , XN , uma amostra iid da variavel aleatoria X demedia µ e variancia σ2. Seja a estatıstica

X =1

N

N∑i=1

Xi

Calcule E(X)

e V ar(X).

Solucao: O valor esperado de X e

E(X)

= E

[1

N

N∑i=1

Xi

]=

1

N

N∑i=1

E (Xi) =1

N(Nµ) = µ

A variancia de X

V ar(X)

= V ar

(1

N

N∑i=1

Xi

)=

1

N2

N∑i=1

V ar (Xi) =1

N2Nσ2 =

1

Nσ2

31

Page 42: Processos Estocásticos em Finanças

Logo o estimador X e um estimador nao tendencioso da media µ da variavel aleatoriaX.

Exemplo 1.14. Retome o enunciado do Exemplo 1.13. Seja a estatıstica

σ2 =1

N

N∑i=1

(Xi − X

)2

Verifique se σ2 e um estimador nao tendencioso da variancia σ2 de X.

Solucao: O valor esperado de σ2 e E (σ2) = E[

1N

∑Ni=1

(Xi − X

)2]. Vamos trabalhar

no somatorio acima, tal que o mesmo pode ser obtido conforme abaixo∑(Xi − µ)2 =

∑[(Xi − X

)+(X − µ

)]2=∑(

Xi − X)2 − 2

∑(Xi − X

) (X − µ

)+∑(

X − µ)2

Mas∑(

Xi − X)

=∑Xi −NX = 0, logo∑(Xi − µ)2 =

∑(Xi − X

)2+N

(X − µ

)2

ou ainda ∑(Xi − X

)2=∑

(Xi − µ)2 −N(X − µ

)2

Entao o valor esperado acima pode ser assim reescrito

E(σ2)

= E

1

N

[N∑i=1

(Xi − µ)2 −N(X − µ

)2

]ou ainda

E(σ2)

=1

N

N∑i=1

E (Xi − µ)2 − E[(X − µ

)2]

Sabemos que

E[(Xi − µ)2] = σ2 e pelo Exemplo 1.13: E

[(X − µ

)2]

= V ar(X)

=σ2

N

Levando estes resultados na ultima equacao, ficamos com

E(σ2)

=1

NNσ2 − σ2

N

=N − 1

Nσ2

E portanto o estimador σ2 definido pela estatıstica acima e tendencioso.

32

Page 43: Processos Estocásticos em Finanças

No exemplo 1.14 se definıssemos a estatıstica S2 = 1N−1

∑Ni=1

(Xi − X

)2encon-

trarıamos E(S2)

= σ2, ou seja, S2 e um estimador nao tendencioso. Embora σ2 seja

tendencioso observe que limN→∞E (σ2) = limN→∞NN−1

σ2 = σ2, ou seja, assintotica-mente σ2 nao e tendencioso. Isto significa que para grandes amostras pode-se usar σ2

ou S2 como estimadores para a variancia σ2 de X. Um estimador θ que converge assin-toticamente para θ e dito um estimador consistente de θ.

Seja X1, . . . , XN uma amostra aleatoria iid de uma variavel aleatoria X com funcaodensidade f (x; θ) tal que θ ∈ Θ. A funcao de verossimilhanca e dada pela equacao (1.55).O estimador de maxima verossimilhanca e o valor de θ ∈ Θ tal que θ maximiza a funcaoa funcao L (θ; x). Na pratica iremos maximizar o lnL (θ; x) ja que o valor que maximizaL (·) tambem maximiza o seu logarıtmo.

Exemplo 1.15. Seja X1, . . . , XN uma amostra iid de uma distribuicao normal N (θ, 2),onde θ ∈ R. Determine o estimador de maxima verossimilhanca da media.

Solucao: A funcao densidade conjunta e

f (x1, . . . , xN) = f (x1; θ) f (x2; θ) , . . . , f (xN ; θ)

onde f (xi; θ) = 12√

2πexp

(− (xi−θ)2

4

). A funcao verossimilhanca e

L (θ; x) =N∏i=1

f (xi; θ)

=

(1

2√

)Nexp

(N∑i=1

−(xi − θ)2

4

)

Tomando o logarıtmo

lnL (θ; x) = N ln1

2√

2π−

N∑i=1

(xi − θ)2

4

A condicao de primeira ordem para o maximo do lnL (θ;x) e

d lnL (θ; x)

dθ= −

N∑i=1

2(xi − θ

)4

(−1) = 0

ou aindaN∑i=1

(xi − θ

)= 0⇒ θ =

1

N

N∑i=1

xi = X

A condicao de segunda ordem e imediata.

33

Page 44: Processos Estocásticos em Finanças

Exemplo 1.16. Seja X1, . . . , XN uma amostra aleatoria iid de uma variavel X comfuncao densidade dada por

f (x; θ) =

θxθ−1 0 < x < 1 e θ ∈ R+

0 caso contrario

Determine o estimador de maxima verossimilhanca de θ.

Solucao: A funcao de verossimilhanca e

L (θ; x) = θxθ−11 . . . θxθ−1

N

= θNN∏i=1

xθ−1i

O logarıtmo da verossimilhanca e

lnL (θ; x) = N ln θ + (θ − 1)N∑i=1

lnxi

Tomando a condicao de primeira ordem do maximo

d lnL (θ; x)

dθ= N

1

θ+

N∑i=1

lnxi = 0⇒ θ =−N∑Ni=1 lnxi

A condicao de segunda ordem e imediata.

Exercıcio 1.10. Seja X1, . . . , XN uma amostra aleatoria iid de uma variavel aleatoriaX com distribuicao normal X ∼ (µ, σ2). Mostre que os estimadores de maxima verossim-

ilhanca θ1 e θ2 de µ e σ2, respectivamente sao θ1 = X e θ2 = 1N

∑Ni=1

(Xi − X

)2, onde

X = 1N

∑Ni=1 Xi.

Exercıcio 1.11. Seja X1, . . . , XN uma amostra aleatoria iid de uma variavel com dis-tribuicao de Poisson conforme equacao (1.26) e aqui reescrita em termos do parametroθ

f (x; θ) =θx

x!e−θ para x = 0, 1, . . . e θ > 0

Encontre o estimador de maxima verossimilhanca de θ.

Alem da estimacao por maxima verossimilhanca, existem outras metodologias paraestimacao dos parametros, como por exemplo o metodo dos momentos onde os mo-mentos amostrais sao igualados aos momentos populacionais. Em geral estimacaoparametrica e acompanhada da estimacao por intervalo, onde e analisada a distribuicaoque o parametro θ possui e consequentemente define-se um intervalo de confianca parao valor estimado do parametro. Todos estes topicos podem ser encontrados nas re-ferencias mencionadas no inıcio do capıtulo. Para os objetivos deste livro a estimacaopor verossimilhanca e suficiente. Sua aplicacao a series financeiras sera vista no proximocapıtulo.

34

Page 45: Processos Estocásticos em Finanças

1.8 Apendice - Desigualdades de Chebyshev e Markov

1.8.1 Desigualdade de Chebyshev

Primeiramente vamos demonstrar uma proposicao e em seguida usar tal resultado mostrandoa desiguldade de Chebyshev.

Proposicao 1.1. Seja f (X) uma funcao nao negativa de uma variavel aleatoria X.Considere que exista o valor esperado E [f (X)] entao para c > 0, pode-se escrever

P [f (X) ≥ c] ≤ E [f (X)]

c

Prova. Seja o conjunto A formado por valores de x tais que f (x) ≥ c, isto e, A =x|f (x) ≥ c e seja gX (x) a funcao densidade de X. Entao

E [f (X)] =

∫ ∞−∞

f (z) gX (z) dz =

∫Af (z) gX (z) dz +

∫Acf (z) gX (z) dz

Como os integrandos sao funcoes positivas, o resultado de ambas integrais sera umnumero positivo. Consequentemente pode-se escrever

E [f (X)] ≥∫Af (z) gX (z) dz

Como esta ultima integral esta no conjunto A e como neste caso f (x) ≥ c, permanecevalida a desigualdade se substituirmos f (x) por c, isto e

E [f (X)] ≥∫AcgX (z) dz = c

∫AgX (z) dz = cP (X ∈ A) = cP [f (x) ≥ c]

Entao como primeiro resultado pode-se escrever

P [f (x) ≥ c] ≤ E [f (x)]

c

Proposicao 1.2 (Desigualdade de Chebyshev). Seja X uma variavel aleatoria commedia µ e variancia σ2. Seja tambem k > 0, entao pode-se escrever que

P (|X − µ| ≥ kσ) ≤ 1

k2

Prova. Agora vamos usar o resultado da proposicao anterior. Considere que a funcaonao negativa seja f (x) = (x− µ)2 e que c2 = k2σ2, onde σ2 e a variancia de X. Entaotemos de acordo com o resultado acima

P[(X − µ)2 ≥ k2σ2

]≤E[(X − µ)2]k2σ2

Observe que a funcao f (x) foi escolhida de tal modo que o numerador do lado direitoresultasse na variancia. Temos entao

P[(X − µ)2 ≥ k2σ2

]≤ 1

k2

35

Page 46: Processos Estocásticos em Finanças

ou ainda

P [|X − µ| ≥ kσ] ≤ 1

k2

que e o esultado da desigualdade de Chebyshev. Apesar da demonstracao ter sido feitapara a variavel aleatoria X em tempo contınuo, a mesma demonstracao pode ser feitapara o caso discreto.

1.8.2 Desigualdade de Markov

Proposicao 1.3 (Desigualdade de Markov). Seja f (x) uma funcao nao negativa ecrescente de uma variavel aleatoria X definida no intervalo x ≥ 0. Seja c ≥ 0, entaopode-se escrever

P (|X| ≥ c) ≤ E [f (X)]

f (c)

Prova. O valor esperado E [f (|X|)] esta calculado abaixo

E [f (|X|)] =

∫ ∞−∞

f (|z|) gX (z) dz

Separando o segundo membro em duas integrais, temos:

E [f (|X|)] ≥∫ ∞c

f (|z|) gX (z) dz +

∫ −c−∞

f (|z|) gX (z) dz

Esta desigualdade deve-se ao fato de que f (x) e nao negativa em x ≥ 0. Por outro ladoo segundo membro acima e maior ou igual que

f (|c|)∫ ∞c

gX (z) dz + f (|c|)∫ −c−∞

gX (z) dz

Esta desigualdade deve-se ao fato de que f (x) e crescente em x ≥ 0. O ultimo resultadoe igual a

f (|c|)[∫ ∞

c

gX (z) dz +

∫ −c−∞

gX (z) dz

]=

f (|c|)P (|X| ≥ c)

Reescrevento o resultado temos

P (|X| ≥ c) ≤ E [(f (x))]

f (c)

Note que a desigualdade de Chebyshev pode ser obtida da desigualdade de Markov paraos casos especıficos em que f (x) e crescente.

36

Page 47: Processos Estocásticos em Finanças

Capıtulo 2

Econometria em Financas

O Capıtulo 1 foi dedicado a uma breve revisao de alguns conceitos fundamentais de teo-ria de probabilidade e matematica estatıstica que sao uteis no desenvolvimento de umcurso em processos estocasticos e por conseguinte em financas. Este segundo capıtuloapresenta os conceitos basicos em processos estocasticos com enfoque em econometria deseries financeiras. Iniciaremos com os conceitos de forma intuitiva sem o formalismo quese apresenta em muitos textos. Nosso objetivo final e usar estes conceitos para modelarvariaveis tais como precos, retornos, volatilidade, etc. Veremos o processo estocasticobasico denominado passeio aleatorio, em seguida virao os processos auto-regressivose media-moveis e formalizaremos a metodologia Box-Jenkins. Passaremos entao pelaanalie de alguns fatos estilizados em series financeiras. Ao final o leitor estara apto amodelar series financeiras por modelos AR-GARCH (auto-regressivo com volatilidadeGARCH). Dada a relevancia da volatilidade no aprecamento de derivativos, entendemosque os conceitos aqui expostos sao fundamentais para a compreensao mais abrangenteda teoria em financas. Este capıtulo representa os conceitos fundamentais de disciplinascomo series temporais e econometria de series financeiras.

A literatura nestas disciplinas e vasta. O leitor pode aprofundar os conceitos prelim-inares deste capıtulo em referencias como Campbell, Lo e McKinlay (1997) [19], Enders(1995) [35], Franses e van Dijk (2000) [39], Gourieroux (2001) [44], Tsay (2002) [98],Hamilton (1994) [46], dentre outros. Em lıngua portuguesa referimo-nos a Morettin eToloi (2004) [76].

2.1 Processos estocasticos

Definicao 2.1. (Serie temporal) Serie temporal e qualquer conjunto de observacoesordenado no tempo. A abordagem da analise pode ser no domınio do tempo com modelosparametricos ou no domınio da frequencia com modelos nao parametricos.

As series temporais podem ser classificadas em:

(i) Discretas - quando o conjunto de observacoes for finito ou infinito enumeravel;

(ii) Contınuas - quando o conjunto for infinito nao enumeravel;

(iii) Estocasticas - quando houver um componente aleatorio;

37

Page 48: Processos Estocásticos em Finanças

(iv) Determinıstica - quando nao houver componente aleatorio e o modelo puder serdefinido por funcoes determinısticas;

(v) Multivariadas - quando a serie temporal e representada por um vetor;

(vi) Multidimensional - quanto t assume dimensao superior a 1.

Definicao 2.2. (Processo estocastico) Um processo estocastico X e uma colecao devariaveis aleatorias

(Xt, t ∈ [0, T ]) = (Xt (ω) , t ∈ [0, T ] , ω ∈ Ω)

definidas em algum espaco Ω. O conjunto [0, T ] representa um conjunto infinito deinstantes de tempo.

O valor de X esta associado ao instante de tempo t e a possıveis realizacoes ω. Estasrealizacoes representam os estados da natureza. Assim, para um instante de tempo tfixo a variavel aleatoria e

Xt = Xt(ω), ω ∈ Ω

Para um determinado estado da natureza, ω ∈ Ω, a variavel aleatoria e uma funcao dotempo

Xt = Xt(ω), t ∈ [0, T ]

esta funcao e denominada realizacao, trajetoria ou caminho do processo de X.

Exemplo 2.1. Seja Yt o nıvel de um reservatorio de um tanque de combustıvel medidoem relacao a um marco zero. A medicao do nıvel do reservatorio e feita diariamente.O nıvel do combustıvel oscila a cada dia de acordo com o consumo e com a reposicaodo mesmo. A Figura 2.1 apresenta a evolucao da variavel Yt. Esta realizacao mostraa evolucao do nıvel para um estado da natureza, digamos ω1 em que a economia naoapresentara grandes oscilacoes. Portanto, este estado da natureza representa um cenarioem que a demanda e normal. Esta representada outra evolucao do nıvel para um estadoω2 mostrando o caso em que a demanda e maior, referente a um cenario mais favoravelda economia. As evolucoes estao defasadas no nıvel por um valor que representa oaquecimento da demanda por combustıvel. Temos portanto que para cada instante detempo t existem dois estados possıveis para o nıvel do reservatorio: Yt(ω1) e Yt(ω2).

Definicao 2.3. (Ruıdo branco) Seja εt uma sequencia de variaveis aleatoriasindependentes e identicamente distribuıdas (iid) com media zero e variancia σ2

ε . Estasequencia e denominada ruıdo branco (RB). Assim temos εt ∼ iid tal que E (εt) = 0;V ar (εt) = σ2

ε ; Cov (εt, εt+k) = 0 ∀k 6= 0.

Definicao 2.4. (Passeio aleatorio) Considere εt um ruıdo branco tal que εt ∼ iid (0, σ2ε ).

Considere yt tal que

yt = yt−1 + εt (2.1)

O processo descrito por yt define um passeio aleatorio (random walk).

38

Page 49: Processos Estocásticos em Finanças

Figura 2.1: Exemplo da evolucao da variavel Yt

Seja o valor inicial de yt igual a y0. Entao seus valores subsequentes serao:

y1 = y0 + ε1

y2 = y0 + ε1︸ ︷︷ ︸y1

+ε2

...

yt = y0 + ε1 + . . .+ εt

Ou seja, temos que

yt = y0 +t∑i=1

εi (2.2)

A Figura 2.2 mostra a realizacao de dois passeios aleatorios conforme a equacao (2.1),ambos iniciando em y0 = 5.

2.2 Conceitos basicos em series temporais

Definicao 2.5. (Autocovariancia) Autocovariancia γk: E a covariancia entre duasvariaveis da serie defasadas por k intervalos de tempo, isto e:

γk = Cov (yt, yt−k) = E [(yt − E (yt)) (yt−k − E (yt−k))] (2.3)

39

Page 50: Processos Estocásticos em Finanças

Figura 2.2: Duas realizacoes do passeio aleatorio yt = 5 + εt

A definicao na equacao (2.3) e equivalente a

γk = Cov (yt, yt−k) = E (ytyt−k)− E (yt)E (yt−k)

Em um processo estacionario as medias E (yt) e E (yt−k) sao iguais: E (yt) = E (yt−1) =µ. Neste caso a equacao (2.3) pode ser assim reescrita

γk = Cov (yt, yt−k) = E [(yt − µ) (yt−k − µ)]

Para uma amostra y1, y2, . . . , yN , temos o estimador de γk:

γk =1

N

N−k∑t=1

(yt − y) (yt+k − y) (2.4)

onde y = 1N

∑Nt=1 yt e γk e um estimador nao tendencioso1 de γk na equacao (2.3).

Definicao 2.6. (Funcao de autocorrelacao) Funcao de autocorrelacao (FAC) edefinida por

ρk =γkγ0

=Cov (yt, yt+k)

V ar (yt). (2.5)

onde γ0 e a variancia da serie.

1Um estimador θ e dito um estimador nao tendencioso de θ se o valor esperado de θ e igual aoverdadeiro valor θ, ou seja, E

(θ)

= θ.

40

Page 51: Processos Estocásticos em Finanças

O estimador de ρk e

ρk =γkγ0

(2.6)

Observe que para o processo εt (RB) temos que γk = 0 ∀k 6= 0, consequentementeρk = 1 se k = 0 e ρk = 0 se k 6= 0.

Definicao 2.7. (Funcao de autocorrelacao parcial) A funcao de autocorrelacaoparcial (FACP) e a correlacao entre as variaveis yt e yt+k dado que sao conhecidosyt+1,yt+2,. . . , yt+k−1.

Veja no Apendice detalhes sobre o calclulo da FACP. Veremos na secao testes es-tatısticos para identificacao da FAC e FACP.

Exemplo 2.2. Seja yt um passeio aleatorio como definido nas equacoes (2.1) e (2.2).Calcule E (yt), V ar (yt).

Solucao: Media E (yt); aplicando o operador valor esperado em ambos os lados daequacao (2.2), podemos escrever

E (yt) = E (y0) + E

(t∑i=1

εi

)

= y0 +t∑i=1

E (εi)

= y0 pois a media do RB e zero por definicao

Variancia V ar (yt); aplicando o operador variancia a ambos os lados da equacao (2.2),podemos escrever

V ar (yt) = V ar (y0 + ε1 + . . .+ εt)

=t∑i=1

V ar (εi)

= tσ2ε

Em series temporais e usual trabalhar com operadores que defasam uma variavel.Define-se entao o operador lag L como um operador linear tal que:

Liyt = yt−i (2.7)

Sao validas as seguintes propriedades do operador L:

(i) O lag de uma constante e a propria constante Lc = c

(ii) O operador lag segue a propriedade distributiva em relacao a soma (Li + Lj) yt =Liyt + Ljyt = yt−i + yt−j

41

Page 52: Processos Estocásticos em Finanças

(iii) E valida a propriedade associativa da multiplicacao LiLjyt = Li (Ljyt) = Li (yt−j) =yt−i−j. Ou ainda LiLjyt = Li+jyt = yt−i−j

(iv) Potencias negativas de L significam um operador de avanco, L−iyt = Ljyt fazendoj = −i. Entao L−iyt = Ljyt = yt−j = yt+i

(v) Se |a| < 1 a soma infinita (1 + aL+ a2L2 + . . .) yt = yt1−aL

(vi) Se |a| > 1 a soma infinita(1 + (aL)−1 + (aL)−2 + . . .

)yt = − aL

1−aLyt

Exercıcio 2.1. Mostre a validade das propriedades (v) e (vi) acima, do operador L.

2.3 Estacionariedade

Definicao 2.8. (Estacionariedade) Quando o processo estocastico que gerou a seriede observacoes e invariante no tempo diz-se que e estacionario. Um processo e estri-tamente estacionario se a distribuicao conjunta de y1, . . . , yt e identica a distribuicaoconjunta de y1+k, . . . , yt+k para todo t, sendo k e um inteiro positivo. Ou seja, a estaci-onariedade estrita requer que a funcao distribuicao conjunta de y1, . . . , yt seja a mesmamediante uma defasagem no tempo.

Esta e uma definicao rigorosa para a estacionariedade. Uma definicao menos rigorosade estacionariedade e denominada de estacionariedade de segunda ordem ou estacionari-edade fraca. Um processo e estacionario de segunda ordem se a media e a variancia de ytsao identicas para qualquer t e a covariancia e funcao apenas da defasagem. Em outraspalavras, a estacionariedade de segunda ordem requer: (i) E (yt) = µ, seja constante e(ii) Cov (yt, yt−k) = γk, seja funcao apenas de k.

Exemplo 2.3. Considere o processo estocastico εt ∼ RB (0, σ2ε ). O que dizer da estaci-

onariedade de segunda ordem de εt?

Solucao: Observe que µ = E (εt) = 0, V ar (εt) = σ2ε e ainda Cov (εt, εs) = 0 para

t 6= s sao constantes, logo o ruıdo branco e estacionario de segunda ordem.

Exemplo 2.4. Considere o processo estocastico passeio aleatorio definido por yt =yt−1 + εt. O que dizer da estacionariedade de segunda ordem?

Solucao: O Exemplo 2.2 apresentou o calculo da media e variancia do processo de yt.Foi visto que V ar (yt) = tσ2

ε , portanto o segundo momento e uma funcao do tempo naosendo pois constante (ou seja, nao e invariante). Consequentemente o processo de ytnao e estacionario.

42

Page 53: Processos Estocásticos em Finanças

Vamos verificar o que ocorre com dados empıricos no que se refere a definicao deestacionariedade. Tomemos uma serie financeira. Seja entao uma amostra dos precosdiarios do petroleo (primeiro contrato futuro) negociados no NYMEX desde janeiro de1985 ate maio de 2008. Esta amostra contem 5853 dados de precos. A Figura 2.3mostra a evolucao dos precos neste perıodo. Agora vamos dividir a amostra completa

Figura 2.3: Precos do petroleo de jan 1985 a mai 2008

em duas sub-amostras de tamanhos iguais. A primeira sub-amostra abrange o perıodode janeiro de 1985 a agosto de 1996 e a segunda sub-amostra, desta ultima data ateo final do perıodo. A media e o devio padrao dos precos da primeira subamostra saoµ1 = US$19, 9/barril e σ1 = US$4, 28/barril, respectivamente. Para a segunda sub-amostra os mesmos parametros sao µ2 = US$38, 4/barril e σ2 = US$22, 4/barril. Estesresultados eram esperados ja que e visıvel pela Figura 2.3 que os precos tem uma altavertiginosa na parte final da amostra. As duas sub-amostras tem medias completamentediferentes e o mesmo pode ser dito com respeito ao desvio padrao.

A Figura 2.4 mostra o histograma das duas sub-amostras: Fig 2.4(a) refere-se aprimeira sub-amostra e a Fig 2.4(b) refere-se a segunda. Pode-se notar que os padroesdestes histogramas sao bem diferentes. Isto significa que a amostra completa quando di-vidida nao guardou nenhuma similaridade em termos dos histogramas das sub-amsotras.Todos estes fatos sao sugestivos de que a distribuicao dos precos nao e estacionaria (ouinvariante). Esta bem clara uma tendencia crescente dos precos na segunda sub-amostra,fato este traduzido pela sua maior media.

Vejamos o que ocorre com a distribuicao dos retornos. O retorno de um ativo entreos instantes t e t − 1 e definido por Rt = Pt−Pt−1

Pt−1. Na secao 2.5 definiremos o retorno

43

Page 54: Processos Estocásticos em Finanças

Figura 2.4: Histograma das sub-amostras dos precos

com mais detalhes. A distribuicao completa dos retornos possui 5852 dados. A Figura2.5 mostra a evolucao da distribuicao completa dos retornos. A media da distribuicaodos retornos µR e o desvio padrao σR sao 0, 0267% e 2, 41%, respectivamente.

Adotando o mesmo procedimento que fizemos com a distribuicao dos precos, vamosdividir a amostra dos retornos em duas sub-amostras. A primeira sub-amostra tem re-torno e desvio padrao iguais a µR1 = −0, 0051% e σR1 = 2, 5%, respectivamente. Para asegunda amostra encontra-se µR2 = 0, 059% e σR2 = 2, 32%. Nota-se que as medias saopraticamente as mesmas, aproximadamente zero para as duas sub-amostras. Os desviospadroes sao bem similares. Conclusao identica chega-se ao compararmos as medias edesvios das sub-amostras com a amostra completa. A Figura 2.6 mostra os histogramasdas sub-amostras dos retornos. Observe que ambas possuem similaridades quanto as for-mas. Estes fatos sao sugestivos de que a distribuicao de retorno e invariante no tempo.Ou seja, as sub-amostras preservam os momentos (media e variancia) e o histograma dasdistribuicoes possuem formas bastante aproximadas. E um fato bem conhecido empiri-camente que a distribuicao de retorno dos ativos financeiros e estacionaria. Voltaremosa este assunto na secao 2.5.

44

Page 55: Processos Estocásticos em Finanças

Figura 2.5: Retornos do petroleo de jan 1985 a mai 2008

2.4 Formulacao dos modelos Box e Jenkins

A motivacao para o estudo de series temporais e definir o processo gerador de dados,fazer previsoes futuras da serie, identificar ciclos, tendencias ou sazonalidades de formaque a decisao que envolve a variavel em questao seja a mais acurada possıvel. Nestesentido apresentamos nesta secao os fundamentos da metodologia Box e Jenkins. Asbases desta formulacao podem ser encontradas no texto Box e Jenkins (1970).

A metodologia Box e Jenkins e a interpretacao e analise de uma serie temporal comosendo oriunda de uma realizacao de um processo estocastico. O objetivo e inferir sobreo processo gerador de dados. Busca-se identifica-lo baseado nas informacoes contidas naserie levando-se em consideracao a parcimonia do modelo, ou seja, tratando o modelocom o menor numero de parametros possıvel. A estrategia envolve a repeticao do pro-cesso de indenficacao ate encontrar o modelo que seja mais satisfatorio.

Os modelos Box e Jenkins sao tais que a serie yt e escrita como

Φp (L) yt = Θq (L) εt (2.8)

onde L e o operador lag, Φ e Θ sao polinominos de graus p e q, respectivamente e εt eRB (0, σ2

ε ). Mais apropriadamente

Φp (L) = 1− φ1L− φ2L2 − . . .− φpLp (2.9)

Θq (L) = 1− θ1L− θ2L2 − . . .− θqLq (2.10)

45

Page 56: Processos Estocásticos em Finanças

Figura 2.6: Histograma das sub-amostras dos retornos

O polinomio Φp (L) define a parte auto-regressiva (AR) do modelo enquanto o polinomioΘq (L) define a parte denominada media movel (MA). Assim, o modelo na equacao (2.6)e denominado ARMA(p, q). Por exemplo, o modelo ARMA(2, 3) e escrito como

Φ2 (L) yt = Θ3 (L) εt

Escrevendo em termos dos polinomios definidos nas equacoes (2.9) e (2.10), fica(1− φ1L− φ2L

2)yt =

(1− θ1L− θ2L

2 − θ3L3)εt

Aplicando o operador L a cada termo, teremos

yt − φ1yt−1 − φ2yt−2 = εt − θ1εt−1 − θ2εt−2 − θ3εt−3

Finalmente isolando yt obtem-se

yt = φ1yt−1 + φ2yt−2 − θ1εt−1 − θ2εt−2 − θ3εt−3 + εt

No caso em que Θq (L) = 1 temos o modelo ARMA(p, 0) ou melhor AR(p). Da mesmaforma, para o caso em que Φp (L) = 1 temos o modelo ARMA (0, q) ou simplesmenteMA (q).

A condicao de estacionariedade de um modelo AR (p) deve ser tal que as raızes dopolinomio Φp (L) = 0 devem estar fora do cırculo unitario. Para os modelos MA (q)a estacionariedade e trivial ja que se trata de uma soma de ruıdos brancos todos esta-cionarios. Para um modelo ARMA (p, q) as condicoes de estacionariedade sao aquelas

46

Page 57: Processos Estocásticos em Finanças

de um modelo AR(p).

A condicao de inversibilidade de um modelo AR(p) e trivial. Para um modelo MA(q)a inversibilidade ocorre sempre que as raızes do polinomio Θq (L) = 0 estiverem forado cırculo unitario. Ja um modelo ARMA (p, q) tem a inversibilidade sob as mesmascondicoes de um MA (q).

Pode-se resumir no quadro abaixo o comportamento dos modelos com relacao a es-tacionariedade e inversiblidade.

Modelo Condicoes

Φp (L) yt = εt Φp (L) = 0⇒ raızes fora do cırculo unitario⇒ estacionario e trivialmente inversıvel.

yt = Θq (L) εt Θq (L) = 0⇒ raızes fora do cırculo unitario⇒ inversıvel e trivialmente estacionario.

Φp (L) yt = Θq (L) εt Φp (L) . . . raızes fora do cıculo unitario ⇒ estacionario.Θq (L) . . . raızes fora do cırculo unitario ⇒ inversıvel.

Exemplo 2.5. Considere o modelo AR(1): yt = φyt−1 + εt, onde |φ| < 1 e εt ∼RB (0, σ2

ε ).

(i) o modelo e estacionario?

(ii) o modelo e inversıvel?

(iii) calcule a media µ = E (yt)

(iv) calcule γ0, γ1, . . . , γk e ρ0, ρ1, . . . , ρk

(v) escreva o modelo sob a forma inversa.

Solucao:

(i) Estacionariedade: escrevendo o processo em termos do polinomio Φ (L):

yt = φyt−1 + εt ⇒ yt − φyt−1 = εt ⇒ (1− φL) yt = εt

Logo temos que Φ (L) = 1−φL = 0⇒ L = 1φ

. Entao L > 1 se 0 < φ < 1 e L < −1se −1 < φ < 0. Neste caso as raızes do polinomio estao fora do cırculo unitario eo processo e estacionario, isto e, a estacionariedade ocorre se −1 < φ < 1. Como|φ| ≤ 1 o processo e estacionario.

(ii) Um processo auto-regressivo AR (p) e trivialmente inversıvel.

(iii) Media incondicional

E (yt) = φE (yt−1) + E (εt)

E (yt) = φE (yt−1) mas E (yt) = E (yt−1) pois e estacionario, logo

E (yt) = 0

47

Page 58: Processos Estocásticos em Finanças

(iv) Covariancias e correlacoesVariancia γ0:

γ0 = Var (yt) = φ2Var (yt−1) + σ2ε

Como Var (yt) = Var (yt−1) devido a estacionariedade, temos

γ0 = Var (yt) =σ2ε

1− φ2

Covariancia γk:

γk = Cov (yt, yt−k) = E (ytyt−k)− E (yt)E (yt−k) = E (ytyt−k)

Substituindo acima a expressao de yt, temos

γk = E (ytyt−k)

= E [(φyt−1 + εt) yt−k]

= E [φyt−1yt−k + εtyt−k]

Para k = 1, temos:

γ1 = E [φyt−1yt−1 + εtyt−1]

= φE(y2t−1

)+ E (εtyt−1) = φγ0

Consequentemente temos ρ1 = γ1

γ0= φ.

Para k = 2, temos:

γ2 = E [φyt−1yt−2 + εtyt−2]

= φE (yt−1yt−2) = φγ1 = φ (φγ0) = φ2γ0

Consequentemente temos ρ2 = γ2

γ0= φ2.

Para um k generico, temos:

γk = E [φyt−1yt−k + εtyt−k]

= φE [yt−1yt−k] + E [εtyt−k]

= φγk−1 = φ(φk−1γ0

)= φkγ0

Consequentemente temos ρk = γkγ0

= φk

(v) Invertendo o processo auto-regressivo

(1− φL) yt = εt ⇒ yt =1

1− φLεt

Mas sabemos das propriedades do operador L acima que

1

1− φL=(1 + φL+ φ2L2 + . . .

)Entao fazendo a substituicao, temos:

yt =(1 + φL+ φ2L2 + . . .

)εt

= εt + φεt−1 + φ2εt−2 + . . .

Ou seja, o processo AR(1) pode ser escrito como um MA (∞) observando que|φ| < 1.

48

Page 59: Processos Estocásticos em Finanças

Exemplo 2.6. Seja o processo AR(1) dado por yt = 0, 6yt−1 + εt, onde εt ∼ NID (0, 2),calcule a V ar (yt) e a FAC.

Solucao: Pelo Exemplo 2.5 temos que a variancia e dada por

V ar (yt) =σ2ε

1− φ2=

22

1− 0, 62= 6, 25

O calculo da FAC fornece ρ0 = 1, ρ1 = 0, 6, ρ2 = 0, 36, . . . , ρk = 0, 6k. Sendo φ = 0, 6,os valores de ρk decrescem com o lag k. A Figura 2.7 mostra o processo yt: a Fig2.7(a) apresenta tres trajetorias do processo iniciando em y0 = 1 e a Fig 2.7(b) mostrao grafico da FAC com o intervalo de confianca de 95%.

Figura 2.7: Processo yt = 0, 6yt−1 + εt: (a) simulacoes, (b) FAC

Exercıcio 2.2. Considere o modelo AR(1): yt = β + φyt−1 + εt onde |φ| < 1 e εt ∼RB (0, σ2

ε ):

(i) calule a media µ = E (yt)

(ii) calcule a variancia γ0 = V ar (yt)

(iii) calcule as covariancias γ1, . . . , γk

Exercıcio 2.3. Considere o modelo MA(1): yt = εt + εt−1, onde εt ∼ RB (0, σ2ε ):

49

Page 60: Processos Estocásticos em Finanças

(i) calcule a media µ = E (yt)

(ii) calcule a variancia γ0 = V ar (yt)

(iii) calcule a FAC

(iv) analise a inversibilidade

Exercıcio 2.4. Suponha que a receita das vendas de petroleo Rt seja modelada peloseguinte processo estocastico Rt = β + Rt−1 + εt onde εt ∼ N(0, σ2

ε ). O que dizer datendencia da receita? Se o processo fosse modelado por Rt = β+ϕRt−1+εt onde |ϕ| < 1,voce mudaria a sua resposta?

Exercıcio 2.5. Considere o modelo MA(1): yt = εt − θεt−1, onde εt ∼ RB (0, σ2ε )

(i) calcule a media µ = E (yt)

(ii) calcule a variancia γ0 = V ar (yt)

(iii) calcule a FAC

Exercıcio 2.6. Considere o modelo, onde onde εt ∼ RB (0, σ2ε )

yt = 0, 8yt−1 − 0, 3εt−1 + εt

(i) verifique se e estacionario e inversıvel

(ii) calcule a media e a variancia

(iii) calcule a FAC

(iv) escreva o modelo como um MA(∞)

Na pratica os processos sobre os quais fazemos inferencia atraves de uma serie tem-poral, sao geralmente nao estacionarios. Trataremos dos processos nao estacionarioshomogeneos, ou seja, processos cuja a diferenciacao produz processos estacionarios. Adiferenciacao e definida por ∆yt = yt − yt−1 = (1− L) yt.

Seja entao Zt um processo nao estacionario e yt um processo estacionario obtido deZt por diferenciacao sucessivas. Inversamente, pode-se dizer que Zt e obtido a partir deyt por integracao. Tem-se que

∆dZt = yt (2.11)

onde d representa o numero de diferenciacoes. O processo estacionario yt pode serrepresentado por um modelo ARMA(p, q), logo Φp (L) yt = Θq (L) εt, ou entao

Φp (L) ∆dZt = Θq (L) εt (2.12)

Dizemos que o modelo Zt e auto-regressivo-integrado-medias moveis, ouARIMA(p, d, q).

Exemplo 2.7. Seja o processo do passeio aleatorio definido por yt = yt−1 + εt, ondeεt ∼ NID (0, σ2

ε ). Obtenha o processo diferenciado de yt.

50

Page 61: Processos Estocásticos em Finanças

Solucao: A serie diferenciada e obtida fazendo-se

(1− L) yt = yt − yt−1 = εt

Ou seja, ∆yt = εt e o ruıdo branco, que e estacionario por definicao.

Exercıcio 2.7. Considere o modelo yt = 1, 5yt−1 − 0.5yt−2 + εt + 0, 6εt−1.

(i) identifique o modelo

(ii) escreva o modelo como um AR (∞).

Uma questao que se apresenta rotineira para um analista de series temporais e aidentificacao do modelo, ou melhor do processo gerador de dados. Para os modelosARMA(p, q) a estrategia de idenficacao da ordem p e q mais apropriada e atraves dafuncao de auto-correlacao parcial FACP. Desta forma busca-se a idenficacao do modelocomparando-se a FAC e FACP teoricas com aquelas oriundas do modelo.

As series temporais que apresentam comportamento nao estacionarios sao diferenci-adas ate que seja identificada a estacionariedade. Os testes de estacionariedade, comu-mente referidos como testes da raız unitaria, veremos adiante mais detalhes.

No caso de um ou mais modelos serem selecionados, baseados nos criterios da FACe FACP, pode-se investigar qual o modelo apresenta melhor ajuste dentro da amostra.Infelizmente a medida R2 nao e util para os modelos de series temporais lineares porestar relacionado somente aos valores dos parametros. Os criterios de selecao maisapropriados sao os criterios de informacao de Akaike (1974) [1] e Schwarz (1978) [90].O criterio de Akaike e referido como AIC (Akaike Information Criteria). O criterio deSchwarz e referido como BIC (Bayesian Information Criteria). Estes criterios comparamo ajuste dentro da amostra, que e medido pela variancia dos resıduos, contra o numerode parametros estimados. O criterio de Akaike e

AIC (k) = N ln σ2 + 2k (2.13)

onde k = p+ q + 1, σ2 = 1N

∑Nt=1 ε

2t , sendo εt os resıduos do modelo ARMA. Os valores

de p e q que minimizam AIC (k) sao as ordens apropriadas do modelo ARMA.

O cirterio de Schwarz (criterio BIC) e calculado por

BIC (k) = N ln σ2 + k lnN (2.14)

Como lnN > 2 para N > 8, a introducao de parametros e mais penalizada pelo criterioBIC que pelo criterio AIC. Portanto, usando o criterio BIC o modelo selecionadotende a ser mais parciomonioso que aquele oriundo do criterio AIC.

A modelagem de series temporais por modelos linearesARMA deve seguir as seguintesetapas:

51

Page 62: Processos Estocásticos em Finanças

(i) calculo de estatısticas basicas para serie temporal;

(ii) comparar o valor de tais estatısticas com valores teoricos caso estes sejam adequa-dos;

(iii) estimar os parametros para o modelo sugerido no passo anterior, observando casonecessario, os criterios AIC e BIC: deve-se buscar modelos que minimizem estescriterios de informacao

(iv) avaliar o modelo usando as medidas diagnosticas: deve-se analisar a serie deresıduos verificando se as propriedades sao coerentes com a distribuicao teoricade εt (tipo da distribuicao, independencia e descorrelacao da series).

(v) caso nao esteja adequado reespecificar o modelo;

(vi) usar o modelo para descrever a variavel e fazer previsoes.

Como dito anteriormente, os modelos ARIMA requerem previamente a identificacaodo parametro d (ordem de diferenciacao) atraves de testes de estacionariedade. A maio-ria dos softwares econometricos possuem os procedimentos diagnosticos tais como ostestes de normalidade, independencia e as funcoes de auto-correlacoes (FAC e FACP).

2.5 Series financeiras

Esta secao analisa o comportamento das series financeiras. As series financeiras ap-resentam comportamentos tıpicos como fraca dependencia linear e forte dependencianao-linear. Alem disso, apresentam caudas pesadas ou excesso de curtose. Os testesaqui descritos tem por objetivo identificar tais caracterısticas e os modelos propostos naliteratura buscam descrever estes comportamentos. O objetivo final e que o leitor sejacapaz de especificar um modelo para o comportamento dos retornos financeiros a partirde testes realizados com os dados empıricos.

2.5.1 Series de retornos

A maior parte dos estudos financeiros concentra-se na analise da serie de retornos aoinves do uso da serie de precos. A razao desta preferencia, conforme Campbell, Lo eMcKinlay (1997) [19], esta relacionada a dois fatos. Em primeiro lugar o retorno de umativo financeiro contem as informacoes que atendem aos interesses dos investidores. Emsegundo lugar a serie de retornos possui propriedades estatisticamente mais atrativasque a serie de precos.

O retorno de um ativo entre os instantes de tempo entre t− 1 e t e dado por

Rt =Pt − Pt−1

Pt−1

(2.15)

Ou ainda podemos escrever

Rt =PtPt−1

− 1⇒ 1 +Rt =PtPt−1

52

Page 63: Processos Estocásticos em Finanças

O retorno em k perıodos entre os intervalos t− k e t e dado por

Rt (k) =Pt − Pt−kPt−k

⇒ 1 +Rt (k) =PtPt−k

=PtPt−1

× Pt−1

Pt−2

× . . .× Pt−k+1

Pt−k

Ou ainda

1 +Rt (k) =k−1∏i=0

(1 +Rt−i) (2.16)

O retorno capitalizado continamente significa que os instantes t e t − ∆t tornam-semuito proximos com ∆t sendo infinitesimal. Neste caso Rt << 1. Definimos entao olog-retorno como:

rt = ln (1 +Rt) = ln

(PtPt−1

)= lnPt − lnPt−1

∼= Rt (2.17)

O retorno multiperıodo capitalizado continuamente entre t− k e t e dado por:

rt (k) = ln (1 +Rt (k)) = ln [(1 +Rt) (1 +Rt−1) . . . (1 +Rt−k+1)]

ou aindart (k) = ln (1 +Rt) + ln (1 +Rt−1) + . . .+ ln (1 +Rt−k+1)

o que resulta emrt (k) = rt + rt−1 + . . .+ rt−k+1 (2.18)

Definicao 2.9. (Fatos estilizados) Os fatos estilizados sao regularidades estatısticasobservadas em um grande numero de series financeiras de retornos, a partir de estudosempıricos em diversos mercados.

Pode-se resumir os principais fatos estilizados em:

(i) estacionariedade;

(ii) fraca dependencia linear e dependencia nao linear;

(iii) caudas pesadas da distribuicao ou excesso de curtose;

(iv) comportamento heterocedastico condicional.

O comportamento heterocedastico condicional reune caracterısticas como aglomera-dos de volatilidade e efeito alavanca. O efeito alavanca aponta para o efeito do compor-tamento dos choques. Choques negativos afetam a volatilidade condicional em maiormagnitude que os choques positivos.

Os fatos estilizados serao tratados ao longo desta subsecao atraves de testes es-tatısticos. Como os modelos de volatilidade condiconal constituem um assunto extensoe sao muito relevantes na modelagem das series de retornos, dedicamos inteiramente asecao 2.5.1 para a sua analise.

A distribuicao dos retornos escrita de forma mais geral envolve a analise das seriesde retornos rit onde i = 1, 2, . . . , N representa cada ativo e t = 1, . . . , T . Em varios

53

Page 64: Processos Estocásticos em Finanças

modelos tal como o CAPM (Capital Asset Pricing Model) o foco e a analise seccional(cross-section) onde observam-se os retornos em um instante de tempo r1t, . . . , rNt.Para a analise do comportamento de um ativo especıfico ritTt=1. Iremos nos deter

neste caso. E usual o tratamento do retorno como variaveis aleatorias contınuas e nestea funcao de densidade conjunta e dada por;

f (ri1, ri2, . . . , riT ; θ) = f (ri1) f (ri2|r1t) . . . f (riT |riT−1 . . . r1i)

f (ri1, ri2, . . . , riT ; θ) = f (ri1; θ)T∏t=2

f (rit; rit−1 . . . ri1; θ) (2.19)

O aspecto relevante e a observacao de como as distribuicoes do ativo evoluem no tempo,ou seja, a especificacao da distribuicao condicional. Por exemplo, uma das versoes dopasseio aleatorio RW , que sera vista adiante, pressupoe que a distribuicao condicional eigual a distribuicao incondicional f (rit|·) = f (rit). Assim, os retornos sao independentese consequentemente nao previsıveis.

Exercıcio 2.8. Uma consideracao usual para a distribuicao de retornos rt e

rt ∼ NID(µ, σ2

)Portanto, Rt sera uma distribuicao log-normal iid. Calcule a media e a variancia de Rt.

2.5.2 Modelos para as series de retornos

Os modelos para os retornos das series financeiras estao associados a sua capacidadede previsibilidade. Os modelos e a previsibilidade dos retornos constituem fatos intri-gantes em financas ao qual muitos pesquisadores tem devotado atencao. Nao ha umaconclusao definitiva sobre a questao e o debate academico continua aberto. A analiseda previsibilidade e considerada diante das informacoes passadas dos retornos e conse-quentemente da distribuicao dos retornos. Seguiremos a classificacao de Campbell, Lo eMcKinlay (1997) [19]. Esta classificacao baseia-se nos varios tipos de passeio aleatorioe na propriedade martingal. Assim, modelos para os retornos sao classificados comoRW1, RW2, martingal e RW3.

Modelo RW1: O modelo RW1 e a versao mais simples dentre as apresentadasacima e pressume que os retornos sao normais e iid. Em outras palavras:

lnPt = β + lnPt−1 + εt (2.20)

onde εt ∼ NID (0, σ2). Os logarıtmos dos precos constituem um passeio aleatorio comtendencia (drift). Escrito de outra forma, temos:

rt = β + εt (2.21)

Sob esta condicao nao ha possibilidade nenhuma de previsao quer seja na media ou nosmomentos superiores. Este modelo considera que a distribuicao dos retornos e a mesmaem qualquer instante t. O modelo RW1 contraria dois fatos estilizados quais sejam: a

54

Page 65: Processos Estocásticos em Finanças

distribuicao dos retornos nao e normal e os retornos apresentam variancia condicionalvariando com o tempo.

Modelo RW2 : O pressuposto de que os retornos sao iid no modelo RW1 e ques-tionavel como visto anteriormente. A hipotese de que os retornos sao identicamentedistribuıdos e relaxada no modelo RW2. Porem a condicao de independencia e man-tida. Entao podemos escrever:

lnPt = β + lnPt−1 + εt (2.22)

onde εt ∼ INID (0, σ2t ) onde INID significa independente nao identicamente dis-

tribuıdo. Ou ainda:rt = β + εt (2.23)

O modelo RW2 acomoda a possibilidade da variancia ser diferente ao longo do tempoque e uma caracterıstica empırica das series de retorno.

Modelo martingal: O modelo martingal esta relacionado ao jogo justo onde considera-se que e impossıvel lucrar em um jogo dadas as informacoes passadas. Ou melhor, oprocesso martingal considera que a melhor previsao para o valor da variavel aleatoriaamanha e o seu valor hoje. Formalmente definimos o modelo martingal abaixo.

Definicao 2.10. Seja rtTt=1 um processo descrito pela variavel aleatoria rt, dizemosque rt e martingal com relacao as informacoes por ele geradas se:

(i) E (|rt|) <∞

(ii) rt contem todas as informacoes geradas pelo seu processo

(iii) E (rt|rt−1, rt−2 . . .) = rt−1

A condicao (iii) estabelece que a previsao do valor de rt dada as informacoes em t−1e o seu valor em t − 1, ou seja, rt−1. Ainda podemos dizer que E (rt − rt−1|rt−1) = 0,entao e usual denomina-lo de diferenca martingal. Esta e a interpretacao do jogo justoonde os ganhos incrementais em qualquer instante de tempo, dada as informacoes pas-sadas do jogo, e zero.

Exercıcio 2.9. Considere o modelo rt = β + σtεt onde εt ∼ NID (0, 1) e σ2t = ω0 +

ω1r2t−1. Mostre que o processo rt − β e uma diferenca martingal.

Modelo RW3: O modelo RW3 relaxa a hipotese de independencia do modelo RW2considerando a dependencia e a descorrelacao dos incrementos. Assim, pode-se dizer queCov (εt, εt−k) = 0, porem Cov

(ε2t , ε

2t−k)6= 0. Este processo e descorrelatado mas nao

independente pois os quadrados dos resıduos sao correlacionados.

Exercıcio 2.10. Seja o modelo lnPt = β + lnPt−1 + νt onde νt = cε2t−1 + εt, ondeεt ∼ NID (0, σ2

ε ), e c e constante. Mostre que:

(i) Cov (νt, νt−k) = 0

(ii) Cov (rt, rt−k) = 0

55

Page 66: Processos Estocásticos em Finanças

2.5.3 Testes para estacionariedade

Na secao 2.3 vimos o conceito de estacionariedade. Entretanto apresentamos este con-ceito sob o aspecto qualitativo. Agora necessitamos formalizar os testes estatısticos quepermitem identificar a estacionariedade de uma serie de retorno. O teste mais usualpara verificacao da estacionariedade e o teste da raız unitaria. Considere inicialmente omodelo

yt = yt−1 + εt (2.24)

onde εt ∼ RB (0, σ2). Ja vimos que o processo yt e um passeio aleatorio. Se o coeficientede yt−1 do processo que se esta investigando e de fato 1 tem-se o que se chama de raızunitaria e fica caracterizada a nao estacionariedade. Seja entao

yt = ρyt−1 + εt (2.25)

A equacao (2.25) pode ser expressa de outra forma como

∆yt = yt − yt−1 = (ρ− 1) yt−1 + εt

ou ainda por∆yt = δyt−1 + εt (2.26)

onde δ = ρ − 1 e a equacao (2.26) define a serie yt diferenciada. Na serie diferen-ciada a hipotese da raız unitaria e δ = 0 ou ρ = 1 e neste caso ∆yt = εt, ou seja, aprimeira diferenca de yt e RB, que e estacionario. A serie yt e dita integrada de ordem 1.

Testes DF e ADF

Os testes da raız unitaria sao conhecidos na literatura por DF (Dickey e Fuller, seusautores), e ADF (Augmented Dickey e Fuller). O teste DF requer a verificacao dasregressoes descritas abaixo:

∆yt = δyt−1 + εt (2.27)

∆yt = β1 + δyt−1 + εt (2.28)

∆yt = β1 + β2t+ δyt−1 + εt (2.29)

As hipoteses nulas para as regressoes acima sao respectivamente:

(i) H0 : δ = 0, yt e um passeio aleatorio

(ii) H0 : δ = 0, yt e um passeio aleatorio com drift

(iii) H0 : δ = 0, yt e um passeio aleatorio com drift e tendencia

A hipotese alternativa para cada um dos casos acima e bilateral, HA : δ 6= 0.Se o ruıdo εt e auto-correlacionado os testes anteriores devem ser modificados para

∆yt = β1 + β2t+ δyt−1 +m∑i=1

αi∆yt−i + εt (2.30)

Este e o teste ADF e a hipotese nula e a mesma, ou seja, H0 : δ = 0 ou ρ = 1.

56

Page 67: Processos Estocásticos em Finanças

Dickey e Fuller (1979) [27] provaram que a estatıstica de teste nao e a estatıstica-tconvencional. Eles definiram os valoes crıticos com base na simulacao de Monte-Carlo.Mais recentemente MacKinnon (1991) [68] apresentou valores crıticos e p-valores paraum espectro maior de cenarios.

Teste Phillips-Perron (PP)

O teste PP utiliza uma correcao na estatıstica de teste baseado em um ajuste naoparametrico na forma desta estatıstica, o qual corrige a presenca de heterocedasticidadee/ou autocorrelacao nos resıduos. As regressoes sao as mesmas descritas acima sem apresenca do somatorio do teste ADF. Os valores crıticos permanecem os mesmos.

2.5.4 Testes para autocorrelacao

Ja vimos anteriormente que os testes Box-Pierce e Ljung-Box sao utilizados para detec-tar autocorrelacao. Iremos detalhar os procedimentos para realiza-los.

Testes Box-Pierce e Ljung-Box

Primeiramente escolha o lag k para verificar a autocorrelacao. As hiposteses dos testessao:

H0 : ρ1 = ρ2 = . . . = ρk = 0

HA : pelo menos um ρ nao e nulo

Calcule as estatısticas:

Q (k) = N

k∑j=1

ρ2j (ε) (2.31)

LB (k) = N (N + 2)k∑j=1

(N − j)−1 ρ2j (ε) (2.32)

onde εt representa o resıduo do modelo e ρj (ε) e dado por

ρj (ε) =

∑Nt=j+1 εtεt−j∑N

t=1 ε2t

para j = 1, 2, . . .. Em um modelo ARMA (p, q) as estatısticas em (2.31) e (2.32)distribuem-se como uma qui-quadrado com k − p − q graus de liberdade. Escolha onıvel de significancia α. Rejeite H0 se as estatısticas acima forem superiores que o valorcrıtico τ = χ2

α (k − p− q). Os testes acima sao plenamente validos se a distribuicao enormal e estacionaria. Em caso de uma (ou as duas) premissa(s) nao se verificar(em) apotencia do teste fica reduzida.

57

Page 68: Processos Estocásticos em Finanças

2.6 Volatilidade condicional

Na teoria de financas a incerteza ocupa um espaco preponderante. O risco, que quan-tifica a incerteza, esta presente em muitos modelos dentre os quais podemos mencionaro CAPM (Capital Asset Pricing Model). Em geral a nocao de risco esta associada avarianica dos retornos (como no CAPM) ou ao seu desvio padrao que se define comosendo a volatilidade historica da serie de retornos. A volatilidade e um dos parametrosde maior relevancia no aprecamento de opcoes. E uma variavel nao observavel direta-mente. Alem disso, esta relacionada a algumas propriedades ou a alguns fatos estilizadosque sao bem estabelecidos na literatura. Pode-se citar, por exemplo, que a volatilidadeem series financeiras nao e constante ao longo do tempo, e portanto responsavel pelo seucomportamento heterocedastico. Perıodos de alta volatilidade sao seguidos por perıodosde alta volatilidade. Ja aos perıodos de baixa volatilidade seguem-se perıodos amenos.Isto confere a propriedade a que a litereatura se refere como aglomerados de volatilidade.

Estas caracterısticas peculiares da volatilidade sao capturadas pelos modelos heterocedasticoscondicionais ARCH (Autoregressive Conditional Heterocedasticity) proposto por En-gel (1982) [36] e extendido por Bollerslev (1986) [10] e entao denominado de GARCH(Generalized Autoregressive Conditional Heterocedasticity). Nao obstante, algumas pro-priedades do comportamento da volatilidade ficaram ao largo dos modelos GARCHclassicos. Por exemplo, o seu comportamento assimetrico nao e capturado pelos mod-elos GARCH. Esta assimetria refere-se ao comportamento da volatilidade frente aosdiferentes efeitos de choques positivos ou negativos. Os choques negativos trazem maiorimpacto a volatilidade. Estas constatacoes trouxeram novos modelos dentro da cate-goria de modelos GARCH e foram denominados GARCH nao lineares. Assim e que apesquisa no final da decada de 80 e inıcio dos anos 90 foi profıcua em tais modelos.Alem dos modelos de volatilidade, acima mencionados, sera apresentado o modelo devolatilidade estocastica.

Ate o momento os modelos estuados eram da forma

yt = E (yt|It−1) + νt (2.33)

onde It−1 representa o conjunto de informacoes2 ate o instante t−1 e νt e o resıduo (aquiloque nao e explicado pelo modelo) que e homocedastico condicional e incondicionalmente,isto e

E(ν2t

)= E

(ν2t |It−1

)Agora admitiremos que a variancia condicional varie com o tempo. Este e um dosfatos estilizados das series financeiras. Aos perıodos de alta volatilidade seguem-seperıodos de volatilidade alta. Aos perıodos de baixa volatilidade seguem-se momentosde baixa volatilidade. A figura 2.5 mostra a presenca dos aglomerados de volatilidadena serie de precos do petroleo. O que esta secao trata essencialmente e a descricao destecomportamento. Entao podemos escrever a volatilidade condicional como

E(ν2t |It−1

)= ht (2.34)

2It−1 sao as informacoes contidas e reveladas pela serie yt ate o instante t − 1, ou sejayt−1, yt−2, . . . , y0.

58

Page 69: Processos Estocásticos em Finanças

onde ht representa a variancia do resıduo no instante t dadas as informacoes ate oinstante t− 1. Assim o modelo em (2.31) torna-se

yt = E (yt|It−1) + h12t εt (2.35)

onde εt ∼ NID (0, 1). Assim podemos dizer que νt|It−1 ∼ N (0, ht).

2.6.1 Modelos de volatilidade condicional lineares

Esta secao trata de alguns modelos da famılia GARCH que foram denominados GARCHlineares por nao capturarem os efeitos assimetricos dos choques. Tratam-se pricipale-mente dos modelos classicos propostos por Engle (1982) [36] e Bollerslev (1986) [10].

Modelo ARCH

O modelo de Engle (1982) [36] considera que a volatildade em t e uma funcao linear doquadrado do choque em t− 1, assim denominado ARCH(1).

yt = h12t εt (2.36)

ht = ω + αy2t−1

onde ω > 0 e α ≥ 0 sao condicoes que garantem a positividade de ht. Mais genericamentepode-se considerar o modelo ARCH(1) escrito como na equacao (2.36)

yt = a0 + a1yt−1 + νt (2.37)

νt = h12t εt

ht = ω + αν2t−1

onde εt e νt−1 sao independentes.

O modelo ARCH(1) pode ser analisado sob a otica de um processo autoregressivo emν2t . Somando e subtarindo ν2

t na variancia ht, temos:

ht + ν2t = ω + αν2

t−1 + ν2t

ν2t = ω + αν2

t−1 + ut (2.38)

onde ut = ν2t − ht = htε

2t − ht = ht (ε2t − 1). Ainda E (ut|It−1) = E (ht)E (ε2t − 1) = 0.

Em (2.38) o processo para ν2t e estacinario de segunda ordem se α < 1. Neste caso os

momentos em t e t− 1 sao iguais, ou seja

E(ν2t

)= ω + αE

(ν2t−1

)E(ν2t

)=

ω

1− α(2.39)

Ainda note que E (νt) = 0. Observe tambem em (2.36) que valores grandes de yt−1

(positivos ou negativos) sao seguidos por valores grandes de yt. O mesmo ocorre para

59

Page 70: Processos Estocásticos em Finanças

valores pequenos. Ou seja, o modelo captura os aglomerados de volatilidade. Alemdisso, a curtose de yt e dada por

Ky =3 (1− α2)

1− 3α2(2.40)

onde 1 > 3α2 e Ky sera maior que 3 o que significa que o modelo captura o excesso decurtose, um dos fatos estilizados das series de retornos financeiros.

Exercıcio 2.11. Mostre que para o modelo em (2.36) que a curtose e dada por

Ky =3 (1− α2)

1− 3α2

Exercıcio 2.12. Seja o modelo dado em (2.37):

(i) calcule a media condicional de yt

(ii) calcule a variancia condicional de yt

(iii) calcule a media incondicional de yt

(iv) calcule a variancia incondicional de yt

Exercıcio 2.13. Seja o modelo em (2.36).

(i) escreva o modelo AR(1) para y2t

(ii) calcule a FAC para y2t

Uma extensao natural do modelo ARCH(1) em (2.36) e o modelo ARCH(q) onde avariancia e escrita como:

ht = ω + α1y2t−1 + α2y

2t−2 + . . .+ αqy

2t−q (2.41)

Da mesma forma que anteriormente o modelo pode ser escrito como um AR(q) para y2t .

Neste caso a variancia incondicional de yt sera:

E(y2t

)=

ω

1− α1 − . . .− αq(2.42)

uma vez que sejam atendidas as condicoes de estacionariedade de segunda ordem.

Exercıcio 2.14. Mostre que a variancia incondicional de yt e dada pela equacao (2.42).

Para trabalhar com os modelos ARCH, modelando a volatilidade condicional dasseries de retorno, deve-se utilizar grandes valores de q o que torna os modelos poucosparciomoniosos trazendo complexidade para a estimacao dos parametros. Esta com-plexidade e oriunda das restricoes que se deve impor aos parametros para evitar a naonegatividade da variancia e buscando a estacionariedade do modelo.

Modelo GARCH

60

Page 71: Processos Estocásticos em Finanças

Bollerslev (1986) [10] propos o modelo GARCH (Generalized Autoregressive ConditionalHetercedasticity) atraves da inclusao da variancia do instante anterior ao modelo ARCH.O objetivo foi o de obter um modelo mais parciomonioso e sem os problemas de es-timacao do modelo ARCH. Seja entao o modelo na forma da equacao (2.36) para omodelo GARCH(1,1):

yt = h12t εt (2.43)

ht = ω + αy2t−1 + βht−1

onde ω > 0, α > 0 e β ≥ 0 garantindo que ht ≥ 0. Fazendo substituicoes recursivasdo termo ht−1 em (2.43) mostra-se a equivalencia deste modelo com o modelo ARCH(∞).

Acrescentando y2t em ambos os lados da expressao de ht temos que

y2t = ω + αy2

t−1 + βht−1 − ht + y2t

y2t = ω + αy2

t−1 + βht−1 + ut

onde ut = y2t − ht e ut−1 = y2

t−1 − ht−1, fazendo a substituicao

y2t = ω + αy2

t−1 + β(y2t−1 − ut−1

)+ ut

y2t = ω + (α + β) y2

t−1 − βut−1 + ut (2.44)

E o processo GARCH(1,1) pode ser escrito como um ARMA(1,1) que sera estacionariode segunda ordem se α + β < 1.

Exercıcio 2.15. Seja o modelo descrito em (2.43)

(i) calcule a media e a variancia condicionais de yt

(ii) calcule a media e a variancia incondicionais de yt

(iii) calcule a autocorrelacao ρ1 do modelo em (2.44)

Exercıcio 2.16. Mostre que a curtose de yt no modelo em (2.43) e dada por

Ky =3[1− (α + β)2]

1− (α + β)2 − 2α2

O modelo GARCH pode ser extendido para ordens superiores. Assim e modeloGARCH(p,q) dado por

ht = ω +

q∑i=1

αiy2t−i +

p∑j=1

βjht−j (2.45)

Alternativamente o modelo pode ser escrito como:

ht = ω + α (L) y2t + β (L)ht (2.46)

ondeα (L) = α1L+ . . .+ αqL

q

61

Page 72: Processos Estocásticos em Finanças

β (L) = β1L+ . . .+ βpLp

O modelo em (2.45) ou (2.46) sera estacionario de segunda ordem caso as raızes dopolinomio 1− α (L)− β (L) estiverem fora do cırculo unitario. A selecao da ordem p, qdo modelo deve ser feita minimizando os criterios de informacao tais como o AIC e BICdescritas pelas equacoes (2.13) e (2.14). Na maior parte dos casos praticos o modeloGARCH(1,1) atende as necessidades de modelagem.

Estimacao do modelo GARCH(1,1)

O modelo GARCH(1,1) na equacao (2.43) esta aqui reescrito

yt = h12t εt (2.47)

ht = ω + αy2t−1 + βht−1

onde sao observadas as mesmas restricoes dos parametros e εt ∼ NID (0, 1).A funcao distribuicao conjunta do modelo e dada por

f (y1, y2, . . . , yN) = f (y1) f (y2; y0, y1) . . . f (yN ; y0, . . . , yN−1)

f (y1, y2, . . . , yN) = f (y1)N∏t=2

f (yt; y0, . . . , yt−1) (2.48)

A funcao verossimilhanca do modelo e

L (Θ; y) = ln f (y1, y2, . . . , yN) = ln f (y1) +N∑t=2

ln f (yt; y0, . . . , yN−1)

onde Θ representa o vetor dos parametros Θ = [ω, α, β]. E a funcao de verossimilhancadado y1 sera:

L (Θ; y) =N∑t=2

ln f (yt|y0, . . . , yN−1) (2.49)

Por outro lado temos que a funcao densidade de εt e

f (εt|yt−1) =1√2π

exp

(−1

2ε2t

)Da equacao (2.47) temos que

g (yt) =yt

h12t

e g′ (yt) =1

h12t

(2.50)

E a funcao f (yt; y0, . . . , yN−1) sera escrita por

f (yt; y0, . . . , yN−1) = f (g (yt)) g′ (yt) (2.51)

Usando a equacao (2.50) na equacao (2.51), teremos:

f (yt; y0, . . . , yN−1) = f

(yt

h12

)1

h12t

(2.52)

62

Page 73: Processos Estocásticos em Finanças

Levando a equacao (2.52) na equacao (2.49), temos

L (Θ; y) =N∑t=2

ln f

(yt

h12t

)+

N∑t=2

lnh− 1

2t (2.53)

Mas f(yt/h

1/2t

)= 1√

2πexp

(−1

2

y2t

ht

)e o seu logarıtmo e

ln f

(yt

h12t

)= −1

2ln 2π − 1

2

y2t

ht

Levando este resultado em (2.53), finalmente teremos:

L (Θ; y) =N∑t=2

(−1

2ln 2π − 1

2

(y2t

ht

))− 1

2

N∑t=2

lnht

= −N2

ln 2π − 1

2

N∑t=2

lnht −1

2

N∑t=2

y2t

ht(2.54)

Os parametros em Θ sao obtidos pela maximizacao da funcao L (Θ; y) em (2.54).

A suposicao em (2.47) de que εt ∼ NID (0, 1), pode ser modificada. Bollerslev (1987)[11] sugere o uso de distribuicao com caudas mais pesadas para capturar o excesso decurtose. Considerando uma variavel aleatoria x com distribuicao t de Student com νgraus de liberdade (veja equacao (1.33)) e ainda εt = x√

ν(ν−2), a funcao densidade de εt

e

f (εt; ν) =Γ(ν+1

2

)Γ(ν2

)√(ν − 2) π

(1 +

ε2tν − 2

)− ν+12

(2.55)

para ν > 2 onde Γ(z) =∫∞

0yz−1e−ydy. E seguindo as mesmas etapas anteriores chegare-

mos a

f (yt; y0, . . . , yN−1) =N∏t=2

Γ(ν+1

2

)Γ(ν2

)√(ν − 2) π

1

h1/2t

[1 +

y2t

(ν − 2)ht

]− ν+12

(2.56)

Se o valor dos graus de liberdade for uma variavel exogena tem-se para a funcao verossim-ilhanca:

L (Θ; y) = −N∑t=2

[ν + 1

2ln

(1 +

y2t

(ν − 2)ht

)+

1

2lnht

](2.57)

Se o numero de graus de liberdade estiver sendo estimado, acrescente-se a funcao ante-rior a parcela que se segue ao produtorio em (2.56).

63

Page 74: Processos Estocásticos em Finanças

2.6.2 Modelos de volatilidade condicional nao lineares

Os efeitos dos choques na volatilidade condicional sao diferentes para choques positivosou negativos. Este e um fato estilizado. O efeito na volatilidade condicional de umchoque negativo e mais acentuado do que o de um choque positivo. Entretanto osmodelos ARCH e GARCH nas equacoes (2.36) e (2.43) respectivamente, consideram ochoque em t−1 elevado ao quadrado. Neste caso, os modelos sao indiferentes ao sinal dochoque e o efeito constatado empiricamente nao e capturado pelos modelos. Este efeitofoi observado por Black (1976) [8]. Quando a acao de uma empresa cai, a relacao entrea dıvida e o capital proprio aumenta, sugerindo um aumento da alavancagem. Simul-tanearmente a acao fica mais volatil. Estes dois fatos ficaram associados e o fenomenoficou conhecido como efeito alavanca. Os modelos GARCH nao lineares, que serao ap-resentados, foram estabelecidos com a finalidade de capturar o efeito alavanca.

Nos modelos que se seguem considere yt = h12t εt e a variancia ht sera especificada em

cada modelo.

Modelo EGARCH

O modelo EGARCH (ou exponential GARCH) foi proposto por Nelson (1991) [79].O EGARCH(1,1) e descrito por:

lnht = ω + αyt−1 + γ (|yt−1| − E (|yt−1|)) + β lnht−1 (2.58)

que ainda pode ser escrito por

lnht = ω + g (yt−1) + β lnht−1 (2.59)

onde α, ω, β e γ sao constantes e g (yt) e dada por

g (yt) = αyt + γ (|yt| − E (|yt|)) (2.60)

O uso do logarıtmo da variancia no modelo EGARCH flexibiliza as restricoes de posi-tividade imposta aos parametros. Vejamos os efeitos em ht para choques positivos ounegativos em t− 1:

g (yt−1) =

(α + γ) yt−1 − γE (|yt−1|) para yt−1 > 0

(α− γ) yt−1 − γE (|yt−1|) para yt−1 < 0

Note que a assimetria dos choques ocorre se γ 6= 0 e a presenca do efeito alavanca ocorrequando γ < 0. A funcao g (yt) possui media zero pois tanto yt como |yt| − E (|yt|)possuem media zero. A assimetria dos choques e garantida pela especificacao da funcao

g (yt) em (2.60). Se εt ∼ NID (0, 1) entao E (|ε|) =√

2π. Se εt e uma distribuicao t de

Student padronizada dada em (2.55), entao

E (|εt|) =2√ν − 2 Γ ((ν + 1) /2)

(ν − 1) Γ (ν/2)√π

Modelo TARCH

64

Page 75: Processos Estocásticos em Finanças

O modelo TARCH (Threshold ARCH) tambem foi concebido para considerar as diferencasna volatilidade condicional causadas por choques positivos e negativos. Na literaturapor vezes este modelo ora aparece com o nome GJR devido a Glosten, Jagannathan eRunkle (1993) [42] ora simplesmente TARCH devido a Zakoıan (1994) [103]. Essencial-mente os dois modelos tem a mesma finalidade e aqui serao tratados indistintamente deTARCH. O modelo TARCH(1,1) e escrito por

ht = ω + αy2t−1 + βht−1 + γy2

t−1 (1− I (yt−1 > 0)) (2.61)

Se o choque em t− 1 for positivo, yt−1 > 0, entao I (yt−1) = 1 e o impacto na varianciasera devido a α. Caso o choque seja negativo I (yt−1 = 0) o impacto na variancia seraα+γ. O efeito assimetrico fica caracterizado se γ 6= 0 e se γ > 0 fica constatado o efeitoalavanca. O modelo mais geral como TARCH(p,q) pode ser escrito por

ht = ω +

q∑i=1

αiy2t−1 +

p∑j=1

βjht−j +r∑

k=1

γky2t−k (1− I (yt−k > 0)) (2.62)

onde r representa a ordem do choque que impacta a volatilidade.

Modelo QGARCH

O modelo QGARCH (ou quadratic GARCH) tambem captura os efeitos de choquesde diferentes sinais. Foi proposto por Sentana (1995) [91] e pode ser escrito por

ht = ω + γyt−1 + αy2t−1 + βht−1 (2.63)

Deferencia do GARCH tradicional pela introducao do termo γyt−1. O modelo em (2.63)pode ser escrito por

ht = ω +

yt−1

+ α

)y2t−1 + βht−1 (2.64)

Para γ < 0 os choques negativos causarao um impacto em ht superior aos choques pos-itivos. Neste modelo o tamanho do choque tambem e capturado como influenciando avariancia.

Alem dos modelos aqui apresentados existem muitos outros que tornam a famıliaGARCH muito extensa. Citamos alguns outros modelos dentro dos GARCH nao lin-eares:

(i) LSTGARCH (Logistic Smooth Transition Garch) - Enquanto no modelo TARCHo efeito do choque positivo para o negativo e devido a mudanca abrupta de α paraα+γ, neste modelo ha uma mudanca suave de uma situacao para outra atraves dafuncao logıstica. Foi proposto por Hagerud (1997) [45] e Gonzales-Rivera (1998)[43].

(ii) GARCH com mudanca de regime - Outros modelos de volatilidade condicionallevam em consideracao a possibilidde de mudanca de regime. Rabemananjara eZakoıan (1993) [84] argumentam que choques negativos aumentam a volatilidade

65

Page 76: Processos Estocásticos em Finanças

condicional somente se o choque negativo (em valor absoluto) e grande em mag-nitude. Observaram que choques negativos e pequenos tem menor impacto sobrea volatilidade que choques positivos de magnitude igual. Nesta linha de trabalhopodemos ainda citar Fornari e Melle (1997) [38] e Anderson, Nam e Vahid (1999)[2].

2.6.3 Teste para GARCH linear

O teste para detectar heterocedasticidades condicional ou efeito ARCH nos resıduosde uma regressao foi proposto por Engle (1982) [36]. A volatilidade condicional seraconstante se todos os αi do modelo ARCH(q) em (2.41), aqui reescrito

ht = ω +

q∑i=1

αiy2t−i

forem nulos.

Teste ARCH-LM

Fazendo-se uma regressao em que

e2t = ω +

q∑i=1

αie2t−i + νt (2.65)

onde et sao os resıduos estimados da regressao, podemos testar a hipotese nula:

H0 : α1 = α2 = . . . = αq = 0 (sem efeito ARCH)

HA : presenca do efeito ARCH

O teste e baseado no princıpio dos multiplicadores de Lagrange. A estatıstica LM eLM = N × R2 distribuindo-se assitoticamente como uma χ2

α (q) sendo α o nıvel designificancia.

2.6.4 Teste para GARCH nao linear

Os testes propostos por Engle e Ng (1993) [37] verificam a presenca do efeito assimetricodos choques na volatilidade.

Teste do sinal do choque

Este teste verifica se magnitude do quadrado do choque em t e afetado pelo sinal dochoque em t− 1. Considere uma variavel dummy Nt−1 em que Nt−1 = 1 se o choque emt− 1 e negatio, isto e yt−1 < 0, e zero caso contrario. Faca a regressao

e2t = α0 + α1Nt−1 + νt (2.66)

Considere as hipoteses:H0 : α1 = 0

66

Page 77: Processos Estocásticos em Finanças

HA : α1 6= 0

Para α1 = 0 nao existe assimetria ou efeito alavanca. A estatıstica de teste e a estatısticat tradicional. Rejeite H0 se estatıstica t > tα(N − 2) onde α e o nıvel de significancia eN o tamanho da serie.

Teste do tamanho do choque

Neste teste e verificado se alem do sinal, o tamanho do choque em t−1 afeta o quadradodo choque em t. Faca a regressao

e2t = α0 + α1Nt−1et−1 + νt (2.67)

Nesta regressao e investigado se o choque negativo e se sua magnitude afetam e2t e con-

sequentemente a variancia condicional, o teste e analisado sob a estatıstica t.

Faca tambem a regressao

e2t = α0 + α1Pt−1et−1 + νt (2.68)

onde Pt−1 = 1−Nt−1. Neste caso investiga-se se o sinal e a magnitude do choque posi-tivo em t− 1 afetam simultaneamente a variancia condicional.

Tambem pode-se realizar o teste conjunto proposto em (2.66), (2.67) e (2.68). Facaa regressao

e2t = α0 + α1Nt−1 + α2Nt−1et−1 + α3Pt−1et−1 + νt (2.69)

As hipoteses sao

H0 : α1 = α2 = α3 = 0

HA = pelo menos um αi 6= 0

A estatıstica de teste e LM = N × R2 e e assitoticamente distribuıda sob uma dis-tribuicao χ2 (3). Rejeite H0 caso LM > χ2

α (3) sendo α o nıvel de significancia.

Variantes do teste de Engle e Ng (1993) [37] podem ser facilmente consideradas para osdiversos modelos GARCH nao lineares.

2.6.5 Testes de adequacao do modelo

A suposicao de que os resıduos sao independentes e identicamente distribuıdos deve sertestada apos o ajuste do modelo de variancia condicional. Assim os resıduos padroniza-dos εt nos modelos (2.36) e (2.43) devem ser testados. Verifique a independencia atravesdo teste Brock, Dechert, Scheinkman e LeBaron (1986) [16]. Verifique tambem a pre-senca de descorrelacao serial entre os resıduos estimados ao quadrado (ε2t ) atraves dostestes de McLeod e Li (1983) [72] ou atraves do teste ARCH-LM de Engle (1982) [36].Estes testes apontam para presenca do efeito ARCH remanescente no modelo ajustado.Obviamente o teste para identificar o tipo da distribuicao de εt deve ser analisado sob ahipotese da distribuicao adotada para os resıduos.

67

Page 78: Processos Estocásticos em Finanças

2.7 Volatilidade estocastica

Os modelos ate entao analisados consideram que a volatilidade em t e funcao dos choquese volatilidades passados. Portanto, dadas as informacoes em t− 1 a volatilidade condi-cional e determinıstica. Alem deste fato, os choques na serie yt e na volatilidade htpossuem a mesma natureza.

No modelo de volatilidade estocastica os choques simultaneos na media da serie yt ena volatilidade ht sao governados por processos descorrelatados. O modelo de volatil-idade estocastica foi proposto por Taylor (1986). Este modelo recebeu pouca atencaodevido as dificuldades de estimacao. No entanto, com a evolucao computacional e areducao do tempo de processamento, novas tecnicas de estimacao tem sido utilizadasrecentemente. Desta forma, o modelo de volatilidade estocastica tem recebido especialatencao principalmente no que se refere a metodologias de estimacao.

O modelo pode ser escrito como:yt = σtεt (2.70)

σ2t = k eht

ht = γht−1 + ηt

onde εt ∼ NID (0, 1), ηt ∼ NID(0, σ2

η

), |γ| < 1, E (εtηt−s) = 0 para s ≥ 0 e k e um

fator de escala. Isto significa que o processo seguido por ht e estacionario.

Exercıcio 2.17. Seja o modelo de volatilidade estocastica formulado em (2.70).

(i) calcule a media e variancia incondicionais de ht

(ii) calcule a media e variancia condicional de yt

(iii) calcule a media e a variancia incondicional de yt

(iv) calcule o quarto momento de yt e a curtose Ky

(v) calcule os demais momentos pares de yt, isto e, o sexto, oitavo, ... e o 2m-esimomomento.

(vi) calcule a covariancia de yt

(vii) calcule a correlacao de y2t

Comparando os resultados do exercıcio 2.15 (iii) e do exercıcio 2.17 (vii) observamosque os modelos GARCH(1,1) e volatilidade estocastica possuem FACs que sao um de-caimento exponencial para zero. Veja em Carnero, Pena e Ruiz (2004) [20]. um estudocomparativo entre os modelos GARCH e volatilidade estocastica. A maior diferencaentre os modelos GARCH e volatilidade estocastica recai sobre a estimacao. No mod-elo GARCH a estimacao e feita pela maximizacao da verossimilhanca. A funcao deverossimilhanca e construıda a partir de informacoes passadas de yt. No modelo devolatilidade estocastica yt|It−1 nao pode ser construıda a partir das informacoes pas-sadas de yt uma vez que ht esta sujeita a um processo de choques diferentes de yt.

68

Page 79: Processos Estocásticos em Finanças

Dentre as metodologias de estimacao para o modelo de volatilidade estocastica podemosmencionar:

(i) metodo dos momentos

(ii) metodos de maxima verossimilhanca, atraves de simulacao numerica usando amostragemponderada e Monte-Carlo cadeia de Markov (veja Shepard e Pitt (1997) [92], Sand-man e Koopman (1998) [87], Polson, Jacquier e Rossi (2002) [83] e Kim, Shepharde Chibb (1998) [61]).3

(iii) metodo de quase-maxima verossimilhanca (QMLE) (veja Nelson (1988) [78], Har-vey, Ruiz e Shephard (1994) [50]). Em Ruiz (1994) [85] veja que o QMLE econsistente e assintoticamente normal.

(iv) metodos de linearizacao

O metodo de quase maxima verossimilhanca esta implementado no software STAMP.O modelo realiza a estimacao dos componentes nao observaveis atraves do filtro deKalman dentro da abordagem da metodologia espaco-estado (veja Durbin e Koopman(2002) [33] e Harvey (1989) [49]).

Reescrevemos o modelo da equacao (2.70) tal qual foi implementado no software acima(veja Koopman, Harvey e Doornik (2000) [65]). Combinando a primeira e a segundaequacoes temos:

yt = k12 εt exp (ht/2) (2.71)

ht = γht−1 + ηt

Elevando ao quadrado a equacao e tomando o logarıtmo, temos:

ln y2t = ln k + ln ε2t + ht

Somando e subtraindo E (ln ε2t )

ln y2t = ln k + E

(ln ε2t

)+ ln ε2t − E

(ln ε2t

)+ ht

ln y2t = κ+ ht + ξt (2.72)

onde ξt = ln ε2t − E (ln ε2t ) e κ = ln k + E (ln ε2t ). Observe que nao ha necessidade deassumir uma distribuicao particular de εt. O metodo de quase-maxima verossimilhancaignora qual a correta distribuicao de ln y2

t ou ξt e adota como sendo normalmente dis-tribuıda. Fuller (1996) [40] propos a seguinte transformacao para yt:

ln y2t∼= ln

(y2t + cs2

y

)−

cs2y

y2t + cs2

y

para t = 1, . . . , N

onde s2y e a variancia amostral de yt e c e uma constante adotada como 0, 02 em varios

estudos, veja Breidt e Carriquiry (1996) [15] e Bollerslev e Wright (2001) [12].

3Broto e Ruiz (2002) [17] apresentam uma resenha sobre as metodologias de estimacao do modelode volatilidade estocastica.

69

Page 80: Processos Estocásticos em Finanças

2.8 Aplicacoes

2.9 Resumo e consideracoes finais

O segundo capıtulo deste texto foi dedicado a uma breve introducao a econometria deseries financeiras. Este e um capıtulo que e pouco usual em textos dedicados as disci-plinas de processos estocaticos, calculo estocastico e afins. O objetivo deste capıtulo eo de fazer uma ligacao entre o sera apresentado no futuro e a disciplina de econometria.Os conceitos da econometria classica foram gradativamente ampliados e hoje pode-sedizer que ha uma disciplina de econometria de series financeiras que e uma extensao dosmodelos Box-Jenkins para series temporais. Os modelos originais ARCH/GARCH deEngle (1982) e Bollerslev (1986) expandiram-se enormemente gerando modelos que hojesao referenciados como modelos da famılia GARCH. Este modelos constituem o pontomais relevante da modelagem de series financeiras. Destacamos atencao aos modelos devolatilidade estocastica que mais recentemente tem sido muito utilizados e revisitadospor pesquisadores que buscam solucionar os problemas referentes a sua estimacao. Osresultados favoraveis tem possibilitado o seu uso mais frequente.

A relevancia dos conhecimentos aqui apresentados esta no fato de que os modelos deprecos para tıtulos, acoes, commodities, etc necessitam ser estimados para validar suaadequacao aos dados empıricos historicos. Da mesma forma, os derivativos embutemem seus precos um premio de risco que pode ser estimado similarmente. Essencialmenteuma serie historica financeira e uma realizacao de um processo estocastico. O mod-elo assim ajustado a esta realizacao pode ser util em simulacoes e previsoes futuras davariavel modelada. A finalidade destas previsoes sao variadas sendo uteis, inclusive,para o aprecamento de derivativos atraves da simulacao de Monte-Carlo, por exemplo.

A comparacao da adequacao de dois modelos diferentes a uma determinada realizacao(serie historica da variavel preco) deve considerar diferentes aspectos. Devem ser com-parados: (i) os criterios de informacao AIC e BIC, (ii) a verossimilhanca dos modelos,(iii) os erros de previsao dentro e fora da amostra (iv) a estrutura a termo de precose volatilidades. Somente apos a ponderacao destes diferentes aspectos deve-se optarpor um dos modelos. Em suma, busca-se na analise de um processo estocastico, mode-los capazes de reproduzir os principais fatos estilizados presentes nas series financeirasempıricas, tornando-os aptos a fazer previsoes na suposicao de que tais fenomenos saopermanentes e ocorrerao no futuro.

2.10 Apendice - Funcao de Autorcorrelacao Parcial

2.10.1 Funcao de Autocorrelacao Parcial

A FACP para um processo estacionario com media zero pode ser obtido a partir daregressao

yt+k = φk1yt+k−1 + φk2yt+k−2 + . . .+ φkkyt + εt+k

70

Page 81: Processos Estocásticos em Finanças

Multiplicando ambos os lados por yt+k−j e calculando o valor esperado e dividindo pelavariancia, tem-se

ρj = φk1ρj−1 + φk2ρj−2 + . . .+ φkkρk−j

Entao para j = 1, 2, . . . , k, temos:

ρ1 = φk1ρ0 + φk2ρ1 + . . .+ φkkρk−1

ρ2 = φk1ρ1 + φk2ρ0 + . . .+ φkkρk−2

...

ρk = φk1ρk−1 + φk2ρk−2 + . . .+ φkkρ0 (2.73)

Para k = 1⇒ φ11 = ρ1

Para k = 2⇒ ρ1 = φ21 + φ22ρ1 e ρ2 = φ21ρ1 + φ22

Ou podemos escrever a ultima equacao em notacao matricial:[ρ1

ρ2

]=

[1 ρ1

ρ1 1

] [φ21

φ22

]cuja solucao para o estimador ρ22 e dada pela regra de Cramer:

φ22 =

∣∣∣∣ 1 ρ1

ρ1 ρ2

∣∣∣∣∣∣∣∣ 1 ρ1

ρ1 1

∣∣∣∣Para k = 3 temos as equacoes:

ρ1 = φ31 + φ32ρ1 + φ33ρ2

ρ2 = φ31ρ1 + φ32 + φ33ρ1

ρ3 = φ31 + φ32ρ1 + φ33

Em notacao matricial temos: ρ1

ρ2

ρ3

=

1 ρ1 ρ2

ρ1 1 ρ1ρ2 ρ1 1

φ31

φ32

φ33

cuja solucao para o estimador φ33 e dada por:

φ33 =

∣∣∣∣∣∣1 ρ1 ρ1

ρ1 1 ρ2

ρ2 ρ1 ρ3

∣∣∣∣∣∣∣∣∣∣∣∣1 ρ1 ρ2

ρ1 1 ρ1

ρ2 ρ1 1

∣∣∣∣∣∣E assim sucessivamente.

71

Page 82: Processos Estocásticos em Finanças

72

Page 83: Processos Estocásticos em Finanças

Capıtulo 3

Calculo Estocastico

A teoria de financas em tempo contınuo apoia-se essencialmente na disciplina de calculoestocastico. O calculo estocastico e a linguagem atual do aprecamento e gerencia-mento de riscos. Por isto e parte integrante da industria financeira, seguros e atuaria.E a materia fundamental para a pesquisa academica em financas nos seus diversosramos. Este capıtulo e dedicado aos conceitos introdutorios desta disciplina. Destaforma o Capıtulo 3 contem os principais conceitos necessarios para o desenvolvimentode metodologias que fazem uso desta disciplina. O destaque neste texto e o seu usopara o aprecamento. A sua compreensao e fundamental para o entendimento dos de-mais capıtulos. Para tal, apresentamos os conceitos sem o rigorismo matematico quemuitas vezes torna o texto enfadonho dificultando a sua leitura. Nao obstante, algumformalismo e requerido, e entendemos que aquilo que se segue e o mınimo necessario.

Definiremos o processo Browniano, o conceito de esperanca condicional e a propriedademartingal. A seguir veremos o conceito de integracao em ambiente estocastico e aformula (lema) de Ito1. Finalizaremos com a solucao de algumas equacoes diferenciaisestocasticas embora haja um capıtulo neste texto dedicado a este assunto. Tal como noscapıtulos anteriores apresentamos varios exemplos e propomos outros tantos exercıcios.Encorajamos o leitor a resolver todos eles para que o desenvolvimento subsequente fiquefacilitado.

A literatura nesta area alem de vasta apresenta diferentes abordagens, desde os textospuramente teoricos aos mais basicos. Recomendamos ao leitor interessado em aprofun-dar seus conhecimentos que consulte preferencialmente os textos dedicados as aplicacoesem financas tais como Mikosh (1999) [75], Neftci (2000) [77], Joshi (2003) [59], Baz eChacko (2004) [6], Baxter e Rennie (1996) [5]. Outros textos relevantes para o apren-dizado da disciplina e acessıveis sao Shreve (2004) [94], Øksendal (2003) [80], Steele(2000) [97], Elliot e Kopp (2005) [34], Bjork (2004) [7] e Klebaner (2001) [62].

1Seguindo a mesma observacao de Jarrow e Protter (2004) [58] preferimos a designacao de formulade Ito ao inves de lema como difundido da literatura. O termo formula ressalta a importancia doconceito para o calculo estocastico.

73

Page 84: Processos Estocásticos em Finanças

3.1 Processo Browniano

Antes da definicao do processo Browniano vejamos duas definicoes que ajudarao na suacompreensao. Sugerimos que o leitor reveja a definicao de processos estocasticos nasecao 2.1

Definicao 3.1. Seja X = (Xt, t ∈ [0, T ]) um processo estocastico. X e dito ser umprocesso com incrementos estacionarios se

Xt −Xsd= Xt+h −Xs+h

para todo t, s ∈ [0, T ] e t+ h, s+ h ∈ [0, T ].

A igualdaded= significa igualdade em distribuicao, ou seja, os processos definidos em

ambos os lados desta igualdade possuem a mesma distribuicao.

Definicao 3.2. Seja X = (Xt, t ∈ [0, T ]) um processo estocastico. X tem incrementosindependentes se para todo t1 < t2 . . . < tn, n > 1

Xt2 −Xt1 , . . . , Xtn −Xtn−1

sao variaveis aleatorias independentes.

O movimento Browniano ou processo padrao de Wiener e um importante conceitopara o desenvolvimento da teoria de processos estocasticos e consequentemente para aconstrucao da teoria de financas em tempo contınuo.

Definicao 3.3. (Processo Browniano padrao) Um processo estocastico B = (Bt, t ∈ [0,∞))e dito Browniano ou processo padrao de Wiener se:

(i) inicia em zero: B0 = 0,

(ii) tem incrementos estacionarios e independentes,

(iii) para todo t > 0, Bt ∼ N (0, t),

(iv) as realizacoes sao contınuas, sem saltos.

As variaveis aleatorias Bt − Bs e Bt−s possuem distribuicao N (0, t− s) para s < t.Este fato decorre da estacionariedade dos incrementos. Isto e, Bt − Bs tem a mesmadistribuicao que Bt−s − B0 = Bt−s que e normal com media zero e variancia t − s.

Enfatizamos que a identidade em distribuicao Bt (ω) − Bs (ω)d= Bt−s (ω) nao significa

que os valores sejam iguais. Em geral Bt (ω)−Bs (ω) 6= Bt−s (ω). Isto significa que nao

podemos substituird= por =.

74

Page 85: Processos Estocásticos em Finanças

3.1.1 Propriedades do processo Browniano

Dentre as propriedades do processo Browniano vamos examinar primeiramente aquelasoriundas diretamente da definicao acima, ou seja, aquelas relacionadas diretamente aosprimeiros momentos do processo:

(i) a media de Bt e zero, isto e, E (Bt) = 0,

(ii) a variancia de Bt e V ar (Bt) = E[(Bt − E (Bt))

2] = E [B2t ] = t,

(iii) a covariancia de Bt e Bs e dada por

Cov (Bt, Bs) = E [(Bt − E (Bt)) (Bs − E (Bs))]

= E [BtBs]

= E [((Bt −Bs) +Bs)Bs]

= E [(Bt −Bs)Bs] + E[B2s

]= E (Bt −Bs)E (Bs) + E

(B2s

)= 0 + s = s para 0 ≤ s < t

Na terceira igualdade somamos e subtraımos Bs considerando a suposicao de que s < t.Note que a passagem da quarta para a quinta igualdade foi realizada sob a condicao deque os processos Bt − Bs e Bs sao independentes, uma vez que s < t. Se a suposiaofosse t > s o resultado acima seria t, entao podemos escrever que

Cov (Bt, Bs) = E (BtBs) = min (t, s) (3.1)

A Figura 3.1 mostra uma trajetoria do processo Browniano. A Figura 3.2 mostraum conjunto de dez trajetorias para o processo Browniano. Observando uma trajetoriaqualquer, e facil reconhecer as irregularidades presentes. Estas irregularidades sao con-senquencias da propriedade de que o processo Browniano possui incrementos indepen-dentes. Por outro lado, sabemos que sob o ponto de vista do calculo classico uma funcaoe diferenciavel em um ponto se os limites a esquerda e a direita neste ponto sao iguais(a funcao tem um formato de uma curva “suave”. Examinando uma trajetoria do movi-mento Browniano pode-se constatar que tal fato nao ocorre.

Disto decorre que o processo Browniano nao e integravel sob o ponto de vista classico.Entao temos a necessidade do desenvolvimento de conceitos que permitam a integracaode tais trajetorias. Tais conceitos foram reunidos na disciplina da matematica denom-inada calculo estocastico ou calculo de Ito. Sob a abordagem desta disciplina, a inte-gracao das variaveis estocasticas nao e a integral de Riemann que usualmente conhece-mos. O conceito de integracao estocastica sera apresentado ainda neste capıtulo.

Outra propriedade do processo Browniano e auto-similaridade. Esta propriedadequer dizer que se fizermos sucessivas ampliacoes para vizualizarmos um trecho (ouporcao) de uma trajetoria do processo Browniano, iremos observar que as figuras ap-resentarao formas similares, porem nao identicas. Em resumo, podemos acrescentar aspropriedades anteriores duas outras:

75

Page 86: Processos Estocásticos em Finanças

Figura 3.1: Trajetoria do processo Browniano

(iv) o processo Browniano nao e diferenciavel em nenhum trecho de sua trajetoria,

(v) o processo Browniano e auto-similar.

Diante da existencia da integral estocastica, admitiremos (inicialmente sem demon-strar) que faz sentido o conceito de diferencial do processo Browniano. Usaremos paratal a notacao dBt, que significa o incremento do movimento Browniano. Analogamenteao processo Browniano Bt, o seu incremento e definido por dBt ∼ N (0, dt), assim temos:

E (dBt) = 0 (3.2)

V ar (dBt) = E(dB2

t

)= dt (3.3)

Para o melhor entendimento da equacao (3.3) veja o conceito de variacao quadraticana secao seguinte. Veja tambem a demonstracao da variacao quadratica do Brownianofeito no Apendice deste capıtulo.

As trajetorias do processo Browniano nao possuem variacoes limitadas no intervalo[0, T ]. Isto significa dizer que

supτ

n∑i=1

∣∣Bti (ω)−Bti−1(ω)∣∣ =∞ (3.4)

onde o supremo e avaliado para todas as possıveis particoes

τ : 0 = t0 < t1 < . . . tn = T

76

Page 87: Processos Estocásticos em Finanças

Figura 3.2: Grafico com dez trajetorias do processo Browniano

Esta ultima propriedade completa o conjunto das principais propriedades do processoBrowniano:

(vi) o processo Browniano nao e de variacao limitada.

Em resumo, podemos dizer que o movimento Browniano possui as seguintes pro-priedades:

(i) B0 = 0,

(ii) Bt e contınuo em t tal que Bt ∼ N (0, t),

(iii Bt nao e diferenciavel sob o ponto de vista classico,

(iv) Bt nao e um processo de variacao limitada,

(v) Bt −Bs e Bt−s sao iguais em distribuicao e possuem media zero e variancia t− s.

3.1.2 Variacao quadratica

Definicao 3.4. (Variacao quadratica) Seja f (t) uma funcao definida em 0 ≤ t ≤ T .Seja τ uma particao

τ : 0 = t0 < t1 < . . . tn = T

77

Page 88: Processos Estocásticos em Finanças

seja δ = max0≤i≤n−1 (ti+1 − ti). A variacao quadratica de f no intervalo [0, T ] e definidapor [f, f ] (T ) tal que

[f, f ] (T ) = limδ→0

n−1∑i=0

[f (ti+1)− f (ti)]2 (3.5)

O processo Browniano, alem das propriedades ja enunciada, possui variacao mediaquadratica, ou seja o limite da equacao (3.5) existe. Tratamos desta importante pro-priedade neste secao e a destacamos na forma do teorema abaixo.

Teorema 3.1. (Variacao quadratica do Browniano) Seja Bt, 0 ≤ t ≤ T , umaprocesso Browninao padrao, entao [B,B] (T ) = T , ou seja

[B,B] (T ) = limδ→0

n−1∑i=0

(Bti+1

−Bti

)2= T (3.6)

A demonstracao do teorema 3.1 esta apresentada no Apendice deste capıtulo. Estapropriedade e a convergencia media quadratica ou convergencia L2. Na secao 1.6 vimosa definicao de convergencia de ordem p, isto e Lp. Voltaremos a este assunto na definicaoda integral de Ito.

3.1.3 Regras basicas de operacionalizacao

Apresentaremos nesta subsecao as regras fundamentais para operacionalizacao de calculosno ambiente estocastico. Todas elas decorrem das propriedades do processo Brownianovistas acima, das equacoes (3.2) e (3.3) e da variacao quadratica do processo Browniano.Assim podemos escrever que

E (dtdBt) = dtE (dBt) = 0 (3.7)

Tal qual usualmente utilizamos no calculo classico aqui vamos considerar que potenciasde dt superiores a um serao aproximadamente iguais a zero, ou seja, (dt)n ∼= 0 paran > 1. Assim podemos prosseguir um pouco mais e escrever

V ar(dB2

t

)= E

(dB4

t

)− E2

(dB2

t

)= 3dt2 − dt2 = 0 (3.8)

A igualdade acima e oriunda do fato de que o quarto momento de uma normal e 3multiplicado pela variancia ao quadrado (veja equacao (1.13)). Podemos ainda escreverque

E[(dBtdt)

2] = E(dB2

t

)dt2 = 0 (3.9)

Desta ultima equacao e da equacao (3.7) podemos escrever que

V ar (dBtdt) = E[(dBtdt)

2]− E2 (dBtdt) = 0− 0 = 0 (3.10)

Considere agora uma funcao do Browniano, f (Bt). Observe que o valor esperado deuma variavel que tem variancia nula e a propria variavel (e portanto determinıstica enao e uma variavel aleatoria). Em outras palavras

E [f (Bt)] = f (Bt) se V ar [f (Bt)] = 0 (3.11)

78

Page 89: Processos Estocásticos em Finanças

Agora com as propriedades acima podemos concluir sobre as regras basicas de opera-cionalizacao para utilizacao em calculos no ambiente estocastico. Da equacao (3.10)vemos que a variancia de dBtdt e zero. Por outro lado, o valor esperado de dBtdt e zero.Portanto da equacao (3.11) tiramos a primeira regra basica:

Regra 1: dBtdt = 0 (3.12)

A segunda regra basica decorre das equacoes (3.3) e (3.8) e pelas mesmas razoesexplıcitas em (3.11) temos

Regra 2: dB2t = dt (3.13)

A terceira regra basica ja foi apresentada e utilizada acima. Aqui apenas enfatizamosa sua aplicacao no caso mais usual

Regra 3: dt2 = 0 (3.14)

Exemplo 3.1. Ponte Browniano (Brownian bridge):Considere o processo Xt = Bt − tB1, para 0 ≤ t ≤ 1. Calcule a media e a funcaocovariancia de Xt.

Solucao: Pela definicao acima o tempo t, onde esta definido o processo, assume val-ores entre zero e um: 0 ≤ t ≤ 1. Entao vamos calcular os valores X0 e X1:

X0 = B0 − 0×B1 = 0

X1 = B1 − 1×B1 = 0

O processo X assume os mesmos valores no instante inicial e final. Todas as trajetoriasligam estes dois pontos, por isto o nome de ponte. O valor esperado de X e:

E (Xt) = E (Bt − tB1) = 0

O segundo momento de X e dado por

E(X2t

)= E

[(Bt − tB1)2]

= E[B2t + t2B2

1 − 2tBtB1

]= E

(B2t

)+ t2E

(B2

1

)− 2tE (BtB1)

= t+ t2 − 2× t× t = t− t2

Logo a variancia de X sera

V ar (Xt) = E(X2t

)− E2 (Xt) = t− t2

A covariancia entre Xt e Xs, t < s, t < 1, e s ≤ 1, sera

Cov (Xt, Xs) = E (XtXs) = E [(Bt − tB1) (Bs − sB1)]

= E[BtBs − sB1Bt − tB1Bs + stB2

1

]= E (BtBs)︸ ︷︷ ︸

veja equacao (3.1)

−sE (B1Bt)︸ ︷︷ ︸t<1

−t E (B1Bs)︸ ︷︷ ︸s<1

+stE(B2

1

)︸ ︷︷ ︸=1

= min (t, s)− st− ts+ st

= min (t, s)− st

79

Page 90: Processos Estocásticos em Finanças

Observe que se t = s, entao Cov (Xt, Xs) = V ar (Xt) = t− t2.

Definicao 3.5. (Processo aritmetico Browniano) O processo aritmetico Browni-ano (ou processo aritmetico Browninano com drift) e definido por Xt = x + µt + σBt,para t ≥ 0, σ > 0, X0 = x e µ ∈ R. Os parametros µ e σ definem e a tendencia e avolatilidade do processo, respectivamente.

Exercıcio 3.1. Seja o processo aritmetico Xt definido acima. Calcule o valor esperado ea funcao covariancia para Xt. Faca a simulacao de uma trajetoria do processo aritmeticoBrowniano plotando-o em um grafico St versus t.

Definicao 3.6. (Processo geometrico Browniano) O processo geometrico Browni-ano (ou movimento geometrico Browniano) e definido por Xt = x exp (µt+ σBt), parat ≥ 0, µ ∈ R, σ > 0 e X0 = x. Os parametros µ e σ definem e a tendencia e avolatilidade do processo, respectivamente.

O processo estocastico geometrico Browniano e um processo que ocupa um papelde destaque na teoria de financas. Foi utilizado pioneiramente por Black e Scholes(1973) e Merton (1973) para modelar a evolucao ou a dinamica do preco de uma acao.Xt representa o preco de uma acao que e uma funcao exponencial, logo sera semprepositivo. O expoente e um processo aritmetico Browniano tal qual definido acima. Noteque o expoente e uma distribuicao normal que tem media µt e variancia σ2t.

Exemplo 3.2. Seja Xt um processo geometrico Browniano como acima. Calcule o valoresperado e a funcao covariancia para Xt. Considere X0 = x = 1.

Solucao: De acordo com a equacao (1.30) podemos escrever que o valor esperado deXt e

E (Xt) = E [exp (µt+ σBt)] = exp

[E (µt+ σBt) +

1

2V ar (µt+ σBt)

]= exp

[(µ+

1

2σ2

)t

]A covariancia entre Xt e Xs envolve um pouco mais de trabalho algebrico, vejamosentao:

Cov (Xt, Xs) = E [(Xt − E (Xt)) (Xs − E (Xs))]

= E (XtXs)− E (Xt)E (Xs)

80

Page 91: Processos Estocásticos em Finanças

A segunda parcela do segundo membro da ultima equacao ja foi calculada anteriormente.Abaixo vamos calcular a primeira parcela do segundo membro.

E (XtXs) = E [exp (µt+ σBt) exp (µs+ σBs)]

= E [exp (µ (t+ s) + σ (Bt +Bs))]

= exp

[E (µ (t+ s) + σ (Bt +Bt)) +

1

2V ar (µ (t+ s) + σ (Bt +Bs))

]= exp

[µ (t+ s) +

1

2σ2 (t+ s+ 2 min (s, t))

]considerando s ≤ t, temos:

= exp

[µ (s+ t) +

1

2σ2 (t+ s+ 2s)

]Agora podemos calcular a covariancia:

Cov (Xt, Xs) = exp

[µ (s+ t) +

1

2σ2 (t+ 3s)

]− exp

[(µ+

1

2σ2

)t

]exp

[(µ+

1

2σ2

)s

]trabalhando algebricamente a expressao acima chegaremos a

= exp

[(µ+

1

2σ2

)(t+ s)

] [exp

(σ2s)− 1]

para s ≤ t

Note que se t = s teremos

Cov (Xt, Xs) = V ar (Xt) = e(µ+ 12σ2)(2t)

[eσ

2t − 1]

= e2µt+σ2t[eσ

2t − 1]

Exercıcio 3.2. Considere o processo Xt = Bt+δ−Btδ

, onde δ > 0 e uma constante.Calcule a media e a funcao covariancia de Xt.

Vimos que o processo aritmetico Browniano e dado por Xt = µt+ σBt, onde t ≥ 0,σ > 0 e µ ∈ R. O parametro µ fornece a tendencia (drift) do processo. O parametroσ e a volatilidade do processo e esta associado a dispersao de Xt em relacao a mediaE (Xt). A media e a variancia de Xt sao µt e σ2t, respectivamente; em outras palavras,Xt ∼ N (µt, σ2t). Desta forma, os valores de Xt podem ser positivos ou negativos.Assim e claro que este processo nao e um bom modelo para representar precos de ativos.Outra forma de expressar o processo aritmetico Browniano e escreve-lo em sua formadiferencial.

dXt = µdt+ σBt para t ≥ 0 (3.15)

O processo na equacao (3.15) esta descrito na forma de uma equacao diferencial es-tocastica (EDE). Podemos discretizar esta equacao entre dois instantes de tempo tk etk−1, como

Xtk −Xtk−1= µ (tk − tk−1) + σ

(Btk −Btk−1

)81

Page 92: Processos Estocásticos em Finanças

Ou ainda podemos escrever ∆Xt = µ∆t + σ∆Bt. Se tomarmos o instante inicial tk−1

como zero (fazendo X0 = x = 0) e o instante tk como um instante generico t, teremos

Xt = µt+ σBt (3.16)

Desta forma e facil ver que as duas formas de expressar o processo aritmetico Brownianose equivalem.

O processo geometrico Browniano tambem pode ser descrito na forma de umaequacao diferencial estocastica por

dXt

Xt

= µdt+ σdBt para t ≥ 0 e X0 = x (3.17)

onde µ ∈ R e σ > 0. Veremos adiante que a solucao da EDE (3.17) e o processo descritopor

Xt = xe(µ−0,5σ2)t+σBt (3.18)

O segundo membro da equacao (3.17) e o processo aritmetico Browniano em sua formadiferencial. Se discretizarmos a equacao (3.17) para os instantes tk e tk−1 temos

Xtk −Xtk−1

Xtk−1

= µ (tk − tk−1) + σ(Btk −Btk−1

)Se Xt representa o preco de um ativo em t tal qual definido em (3.17), entao o primeiromembro representa o retorno de um ativo entre os instantes tk e tk−1. O segundo mem-bro representa o processo aritmetico Browniano na forma diferencial. O retorno desteativo (primeiro membro) e normalmente distribuıdo com media µ∆t e variancia σ2∆t(segundo membro), onde ∆t e o intervalo de tempo para o qual o retorno e calculado.E imediato pelas definicoes que a distribuicao de precos e lognormal.

A Figura 3.3 mostra o grafico do processo geometrico definido por Xt = e0,05t+0,1Bt ,com X0 = x = 1 onde foram simuladas cinco trajetorias. O grafico tambem mostra atendencia de Xt, ou seja E (Xt) (linha reta pontilhada). Alem disso estao tracadas asenvoltorias (linhas solidas) representadas por E (Xt) ± 2

√V ar (Xt), ou seja, a media

mais ou menos dois desvios. Note a clara tendencia (drift) do processo.

Exemplo 3.3. Considere que X seja o preco de uma acao que segue um processogeometrico Browniano com drift α ∈ R e volaltilidade σ > 0. Da mesma forma Yrepresenta outra acao que segue um processo geometrico Browniano com drift β ∈ R evolatilidade ν > 0. A correlacao entre os Brownianos dos dois processos e ρ, ou melhor,dBXdBY = ρdt. Resolva os itens abaixo:

(i) Escreva as equacoes dos dois processos na forma diferencial,

(ii) Calcule a correlacao entre os retornos dos dois ativos,

(iii) Calcule o valor esperado E(dXtXt

+ dYtYt

)e a variancia V ar

(dXtXt

+ dYtYt

).

82

Page 93: Processos Estocásticos em Finanças

Figura 3.3: Trajetorias do processo geometrico Browniano

Solucao:

(i) As equacoes dos processos geometricos na forma diferencial para t ≥ 0 sao

Ativo X:dXt

Xt

= αdt+ σdBXt Ativo Y:dYtYt

= βdt+ νdBYt

(ii) A correlacao e calculada a partir da covariancia entre os retornos, que por sua veze dada pela covariancia entre dXt

Xte dYt

Yt, isto e

Cov (RX , RY ) = Cov

[dXt

Xt

,dYtYt

]= Cov [αdt+ σdBXt , βdt+ νdBYt ]

= σνCov (dBXt , dBYt)

= σνρdt

Agora podemos calcular a correlacao:

Cor (RX , RY ) =Cov (RX , RY )√

V ar (RX)√V ar (RY )

=σνρdt

σdt12νdt

12

= ρ

83

Page 94: Processos Estocásticos em Finanças

(iii) O valor esperado e a variancia sao dados por:

E

(dXt

Xt

+dYtYt

)= (α + β) dt

V ar

(dXt

Xt

+dYtYt

)= V ar

(dXt

Xt

)+ V ar

(dYtYt

)+ 2Cov

(dXt

Xt

,dYtYt

)= σ2dt+ ν2dt+ 2σνρdt

=(σ2 + ν2 + 2σνρ

)dt

3.2 Valor esperado condicional

O conceito de valor esperado condicional e o alicerce para o aprecamento de contratos emfinancas. Usaremos doravante este conceito em varios topicos ao longo deste texto. Istomostra a sua importancia. Dividiremos esta secao em quatro subsecoes. Na primeirasubsecao vamos recordar o que vimos no capıtulo 1, isto e o conceito basico de valoresperado condicional. Na subsecao dois daremos uma breve nocao do conceito de σ-algebra. Na subsecao tres trabalharemos especificamente o conceito de valor esperadocondicional que e usado nas tecnicas de aprecamento. Por ultimo introduziremos osconceitos de espaco e medida de probabilidade.

3.2.1 Conceito basico

Vimos na secao 1.2 o conceito de probabilidade condicional. Na equacao (1.1) vimosque a probabilidade de ocorrencia de um evento A dado que ocorreu outro evento B edefinido por

P (A|B) =P (A ∩B)

P (B)

A interpretacao do resultado acima significa que a ocorrencia do evento B restringe oespaco de ocorrenica do resultado, ou seja, a ocorrencia de A fica restrita as possıveisocorrenicas do conjunto B. Por esta razao o resultado deve ser normalizado pelo valorda probabilidade de B. Sugerimos que leitor reveja o exemplo 1.2.

A secao 1.4 define o valor esperado condicional de uma variavel aleatoria X dado queconchecemos o valor da variavel aleatoria Y . Veja a equacao (1.40). O valor esperadocondicional E (X|Y ) e uma variavel aleatoria, isto porque a variavel aleatoria Y podeassumir diferentes valores. O valor esperado condicional assumira tantos valores quantoaqueles que assumir a variavel aleatoria Y . Assim se Y assume poucos valores a variavelaleatoria E (X|Y ) ficara restrita tambem a poucos valores. O valor esperado da variavelaleatoria E (X|Y ) e o valor esperado incondicional de X. Este resultado foi provado nasecao 1.4. Escrevendo-o novamente temos

E (E (X|Y )) = E (X)

Intuitivamente significa dizer que o valor esperado de X dado Y e uma aproximacao dovalor esperado de X. O exemplo 1.6 mostra esta propriedade, volte um pouco e reveja-o.

84

Page 95: Processos Estocásticos em Finanças

3.2.2 Nocao de σ-algebra

O conceito de valor esperado condicional de X dada a ocorrencia de uma variavelaleatoria Y foi definido anteriormente. A variavel aleatoria E (X|Y ) foi construıdasob o conceito de uma variavel aleatoria discreta. Vamos imaginar agora que tenhamoso valor esperado condicional para cada variavel aleatoria associada a um estado ωi danatureza, tal que ωi ∈ Ω. Vamos imaginar uma colecao de estados ω e a esta colecaovamos denominar por σ (Y ). Esta colecao de valores de Y em funcao dos estados danatureza revela a informacao sobre a variavel aleatoria Y em funcao de cada estadoωi ∈ Ω. Assim o valor esperado condicional pode ser escrito mais genericamente sob aforma

E (X|Y ) = E (X|σ (Y ))

Esta colecao de valores σ (Y ) e denominada de σ-algebra. Podemos entao formalizareste conceito.

Definicao 3.7. (σ-algebra) Define-se a σ-algebra F , por um colecao de subconjuntosde Ω satisfazendo:

(i) Nao e vazio: ∅ ∈ F e Ω ∈ F ,

(ii) Se A ∈ F , entao Ac ∈ F ,

(iii) Se A1, A2, . . . ,∈ F , entao∞⋃i=1

Ai ∈ F e∞⋂i=1

Ai ∈ F .

Por exemplo a colecao F1 = ∅,Ω e uma σ-algebra. A colecao F2 = ∅,Ω, A,Ace outra σ-algebra. Para uma variavel aletoria Y , assumindo valores discretos, denom-inamos por σ (Y ) a σ-algebra gerada por Y . Agora imagine o caso em que a variavelaletoria Y e uma variavel aletoria multivariada, Y, neste caso a σ-algebra σ (Y) e aσ-algebra gerada pelo vetor aletorio Y. E assim esta σ-algebra contem a informacaoessencial sobre a estrutura deste vetor aleatorio. Vamos mais alem um pouco. Imagineum processo estocastico Y definido na secao 2.1, denominamos de σ (Y ) a σ-algebragerada por Yt (ω) que contem as informacoes geradas pelos estados ωi ∈ Ω em cadainstante de tempo t ∈ [0, T ].

Seja por exemplo o processo Browniano B = (Bs, s ≤ t) definido em [0, T ]. Podemosescrever que a σ-algebra gerada por B ate o instante t como F t = σ (B) = σ (Bs, s ≤ t).Esta σ-algebra contem a informacao essencial sobre a estrutura do processo estocasticoB em [0, t].

Seja para uma variavel aletoria Y , um vetor aleatorio Y, ou um processo estocasticoY a σ-algebra σ (Y ) contem as informacoes geradas por Y .

3.2.3 Valor esperado

O conceito de valor esperado condicional de X foi estabelecido em termos da ocorrenciada variavel aleatoria Y . Agora passaremos a considerar o valor esperado condicional

85

Page 96: Processos Estocásticos em Finanças

em termos das informacoes gerada pela variavel aletoria Y , pelo vetor multivariado You pelo processo estocastico Y . Denominaremos este valor esperado condicional porE (X|F). Novamente, este valor esperado e uma variavel aleatoria, pois F contemas informacoes geradas por pela ocorrencia dos possıveis estados da natureza ωi ∈ Ω.Da mesma forma que anteriormente, o valor esperado E (X|F) e uma aproximacao deE (X). Agora podemos escrever de forma mais geral que

E (X|Y ) = E (X|σ (Y )) = E (X|F) (3.19)

Podemos dizer que calcular o valor esperado esta associado a nocao de prever o valorde uma variavel aleatoria. O valor esperado condicional e precisamente a operacao quebusca calcular a previsao, dada uma quantidade de informacao associada a variavel.Esta informacao e a colecao de subconjuntos de Ω denominados σ-algebra.

Por exemplo, seja St um processo estocastico que descreve o preco de um ativo emcada instante de tempo t. Suponha que desejamos prever o preco deste ativo em u > tcondicionada as informacoes disponıveis ate o tempo t. Escrevemos para tal E(Su|F t).Podemos entender o conceito acima como o valor esperado condicional as informacoesgeradas pelo processo estocastico de St (ate o instante t).

3.2.4 Espaco e medida de probabilidade

Duas importantes definicoes que unem os conceitos de eventos na teoria de probabili-dade e o de σ-algebra sao o de medida de probabilidade e o de espaco de probabilidade.

Definicao 3.8. (Medida de probabilidade) Considere que F e uma σ-algebra definidaem Ω. A medida de probabilidade P e uma funcao P : F → [0, 1] tal que

(i) P (Ω) = 1

(ii) Ai ∩ Aj = ∅ para i 6= j, entao P (A1 ∪ A2 . . .) = P (A1) + P (A2) + . . .

A tripla (Ω,F , P ) e chamada de espaco de probabilidade e os conjuntos pertencentesa F sao denominados eventos. Diz-se que o evento A ocorre quase certamente (q.c.)sempre que P (A) = 1.

3.2.5 Regras basicas de operacionalizacao

A seguir iremos colocar algumas propriedades do valor esperado condicional de talforma que possamos realizar a maior parte das operacoes que envolvem este conceito.Primeiramente considere que o valor esperado do modulo da variavel aleatoria X e finito,E (|X|) < ∞. A partir deste fato garante-se a existencia de E (X|F). De certa formaas regras abaixo generalizam alguns dos conceitos que usamos no capıtulo 1. Nao nospreocuparemos em demonstra-las mas o leitor pode faze-lo como exercıcio; algumas saoimediatas aplicacoes de definicoes e outras ja foram demonstradas ao longo do texto.

86

Page 97: Processos Estocásticos em Finanças

(i) O valor esperado condicional e uma operacao linear no sentido que

E [(c1X1 + c2X2) |F ] = c1E(X1|F) + c2E(X2|F) (3.20)

(ii) O valor esperado da variavel E (X|F) e o valor esperado incondicional de X

E (X) = E [E (X|F)] (3.21)

(iii) Se X e F sao independentes

E (X|F) = E (X) (3.22)

(iv) Se a σ-algebra gerada pela variavel aleatoriaX esta contida em F entao esta ultimacontem toda a informacao sobre e X e os valores assumidos por X nao possueminformacao adicional sobre esta variavel. Toda a incerteza existente acerca de Xfoi revelada por F e portanto X e uma variavel determinıstica.

E (X|F) = X (3.23)

(v) Se F e G sao σ-algebras tais que F ⊂ G, entao

E (X|F) = E [E (X|G) |F ] (3.24)

E (X|F) = E [E (X|F) |G] (3.25)

Os exemplos que se seguem sao importantes aplicacoes das regras acima. Entenda-osclaramente pois teremos aplicacoes semelhantes corriqueiramente.

Exemplo 3.4. Suponha que St seja um processo estocastico que descreve o preco de umativo em cada instante t ∈ [0, T ]. Como se relacionam as informacoes geradas por Stpara cada instante tk, k ∈ N?

Solucao: Vamos denominar de F tk o conjunto de informacaoes relativas ate o instante

tk. A medida que transcorre o tempo, a evolucao do preco do ativo St gera as informacoesinerentes a sua realizacao. Assim para tk+1 as informacoes sao mais abrangentes econtem aquelas relativas ao instante tk, ou seja, F tk⊂ F tk+1

. Entao para t0, t1, . . . , tk . . .podemos escrever

Ft0 ⊆ Ft1 . . . ⊆ Ftk ⊆ Ftk+1⊆ . . .

Exemplo 3.5. Seja B o processo Browniano padrao tal qual definido na secao 3.1.Considere uma estrutura de informacao crescente como no exemplo 3.4. Denomine cadaestrutura de informacao pela σ-algebra Fs = σ (Bx, x ≤ s). A notacao usada significadizer que a σ-algebra foi gerada pelo Browniano ate o instante s. Avalie a esperancacondicional E (Bt|Fs).

87

Page 98: Processos Estocásticos em Finanças

Solucao: Note que o instante t pode ser tal que s ≥ t ou s < t. Entao vamos avaliara esperanca condicional sob estas duas consideracoes:

(i) Considere s ≥ t e neste caso Fs ⊇ Ft. Ou seja a informacao suportada pelaσ-algebra e mais abrangente que as informacoes geradas pelo Browniano ate t eportanto conhecemos tudo sobre o processo estocastico. Neste caso trata-se de umavariavel determinıstica. A equacao (3.23) aplica-se a esta situacao, entao

E (Bt|Fs) = Bt

(ii) Considere s < t. Agora vamos usar um artifıcio de somar e diminuir Bs:

E (Bt|Fs) = E [(Bt −Bs) +Bs] |Fs

Usando o fato de que o valor esperado condicional e linear, veja a equacao (3.62),podemos escrever:

E (Bt|Fs) = E [(Bt −Bs) |Fs] + E (Bs|Fs)

Vamos analisar cada parcela do segundo membro separadamente. Na primeiraparcela temos que o incremento do Browniano Bt − Bs e independente das in-formacoes geradas por Bs, ou ainda, pelas informacoes contidas na σ-algbra Fs.Assim a regra contida na equacao (3.22) se aplica, isto e

E [(Bt −Bs) |Fs] = E (Bt −Bs) = 0

A segunda parcela recae novamente no caso da equacao (3.23) onde toda a in-formacao gerada pelo processo esta contida na σ-algebra, ou seja, σ (Bs) ⊂ Fs,portanto:

E (Bs|Fs) = Bs

Juntando o que apuramos nos itens (i) e (ii) concluimos que o valor esperado condicionaldo Browniano dependera de t e s, prevalecendo o que for menor:

E (Bt|Fs) = Bmin(t,s)

Exemplo 3.6. Considere o processo estocastico aritmetico Browniano Xt = µt + σBt

onde µ ∈ R, X0 = x = 0 e σ > 0. Avalie a esperanca condicional E (Xt|Fs).

Solucao: Usando a propriedade de linearidade do valor esperado condicional, temos:

E (Xt|Fs) = E [(µt+ σBt) |Fs]= µt+ σE (Bt|Fs)

usando o resultado do exemplo anterior

= µt+ σBmin(s,t)

88

Page 99: Processos Estocásticos em Finanças

Seguem duas definicoes uteis para o entendimento da proxima secao bem como paraajudar a compreensao dos exemplos seguintes.

Definicao 3.9. (Filtracao) Uma colecao de σ-algebras Ft em Ω e denominada umafiltracao se, para todo 0 ≤ s ≤ t, temos Fs ⊂ Ft. Isto significa que em uma filtracaocada σ-algebra subsequente abrange a anterior em termos do conteudo de informacao.

Seja F uma σ-algebra. Entao qualquer conjunto de F e dito mensuravel. Uma funcaoX (ω) em Ω e dita F -mensuravel se todos os conjuntos X (ωi) = xi , i = 1, . . . , k saomembros de F . Em outras palavras, a informacao contida em F e suficiente paradescrever (ou para determinar) X.

Definicao 3.10. (Processo adaptado) Dizemos que um processo estocastico Zt eadaptado a filtracao Ft se a σ-algebra gerada por Z esta contida em F , ou seja, σ (Zt) ⊂Ft. Todo processo estocastico Zt e sempre adaptado a sua filtracao natural, ou seja,Ft = σ (Zs) para s ≤ t. Um procsso estocastico Z e adaptado se, para todo t, Zt eFt-mensuravel.

Exemplo 3.7. Seja X um processo estocastico definido por Xt = σBt. Seja Zt = X2t

calcule o valor esperado condicional de Zt considerando a filtracao Ft = σ (Bs, s ≤ t),isto e, avalie E (Zt|Fs).

Solucao: A informacao gerada pelo processo Z esta diretamente relacionada ao doprocesso X que por sua vez esta atrelada ao Browniano Bt. A filtracao natural deZ e digamos Gt = σ (Zs, s ≤ t). O problema pede que calculemos o valor esperadocondicional a filtracao natural do Browniano. Podemos notar que para cada instantede tempo t temos que Gt ⊂ Ft. De fato, com as informacoes de Zt conseguimos saberB2t ou ainda |Bt|. Isto significa que nao recuperamos a informacao de Bt, ou seja Ft e

mais abrangente pois temos as informacoes geradas pelo processo Bt. Assim a filtracaonatural de Bt contem aquela de Zt. Dito isto, vamos aos calculos com esta filtracaomais abrangente.

E (Zt|Fs) = E(X2t |Fs

)= E

(σ2B2

t |Fs)

= σ2E(B2t |Fs

)somando e subtraindo Bs, temos

= σ2E

[(Bt −Bs) +Bs]2 |Fs

= σ2E

[(Bt −Bs)

2 +B2s + 2Bs (Bt −Bs)

]|Fs

aplicando a linearidade equacao (3.62)

= σ2E[(Bt −Bs)2 |Fs

]+ σ2E

(B2s |Fs

)+ 2σ2E [Bs (Bt −Bs)] |Fs

analisando cada termo separadamente

(i) O primeiro termo e σ2E[(Bt −Bs)

2 |Fs]. O termo (Bt −Bs)

2 e independente deFs, logo temos

σ2E[(Bt −Bs)

2 |Fs]

= σ2E[(Bt −Bs)

2] = σ2 (t− s)

89

Page 100: Processos Estocásticos em Finanças

(ii) O segundo termo e imediato

σ2E(B2s |Fs

)= σ2B2

s

(iii) O terceiro termo envolve Bs que e adaptado a filtracao natural Fs, logo temos

2σ2E [Bs (Bt −Bs)] |Fs = 2σ2BsE [(Bt −Bs) |Fs]Bt −Bs e independente de Fs= 2σ2BsE (Bt −Bs)

= 0

Em resumo temos queE (Zt|Fs) = σ2 (t− s) + σ2B2

s

Exercıcio 3.3. Considere o processo estocastico Xt = B2t − t, avalie o valor esperado

condicional E (Xt|Fs) onde Ft = σ (Bs, s ≤ t). (Sugestao: considere as mesmas etapasdo exemplo 3.5 justificando cada operacao realizada).

3.3 Processos martingais

Na subsecao 2.5.2 apresentamos o modelo para serie de retornos em financas sob a oticada propriedade martingal. Na oportunidade a propriedade martingal foi utilizada comoum dos possıveis modelos para descrever a serie de retornos. Nesta secao iremos apro-fundar os conceitos de que necessitamos para tratarmos desta importante propriedadepara o aprecamento de contratos de derivativos em financas.

Historicamente o conceito de aprecamento de derivativos iniciou-se pelo que chamare-mos de metodologia classica com os artigos seminais de Black e Scholes (1973) e Merton(1973). Posteriormente ganhou uma direcao diferente e nesta direcao a propriedademartingal tem um papel fundamental. Teremos a oportunidade de nos aprofundarmosnos detalhes de ambas metodologias e os capıtulos 4 e 5 sao dedicados a estes temas.

O valor esperado condicional relativo a uma filtracao (ou conjunto de informacoes)pode alterar se mudarmos a filtracao. Imagine que estejamos calculando a previsao deX segundo um conjunto de informacoes G, isto e E (X|G). Se X e G nao sao relaciona-dos a previsao de X sera cercada de incerteza. Melhor se tivessemos um conjunto deinformacoes F que estivesse relacionada aos valores passados de X. O conjunto de in-formacoes que conta sobre o passado de X certamente ajudara a prever melhor o futurode X, reduzindo a incerteza na previsao.

Como foi dito anteriormente a propriedade martingal esta relacionada ao jogo justo.Por outro lado sabemos que o valor esperado esta relacionado a previsao de realizacoesfuturas da variavel aleatoria ou do processo estocastico. O valor esperado, condicional asinformacoes existentes fornece o valor da previsao sujeita a tais informacoes. Quando amelhor previsao que podemos fazer de uma variavel, acerca de seu valor futuro, e o valor

90

Page 101: Processos Estocásticos em Finanças

atual desta variavel dizemos que se trata de um processo martingal. Ou tecnicamenteE (Xt|Fs) = Xs para s < t.

Definicao 3.11. (Processo martingal) Um processo estocastico Y = (Yt, t ≥ 0) edenominado martingal com respeito a filtracao (Ft, t ≥ 0) se:

(i) E (|Yt|) <∞ para t ≥ 0

(ii) Y e adaptado a Ft

(iii) E (Yt|Fs) = Ys para 0 ≤ s < t.

Exemplos e exercıcios para a verificacao da propriedade martingal sao necessariospara a fixacao deste conceito.

Exemplo 3.8. Verifique se o processo Browniano Bt e martingal em relacao a filtracaonatural Fs = σ (Bx, x ≤ s).

Solucao: No exemplo 3.5 calculamos o valor esperado condicional em relacao a fil-tracao natural do Browniano. Para o caso em que s < t encontramos E (Bt|Fs) = Bs.As demais condicoes da definicao acima sao satisfeitas e portanto o Browniano e mar-tingal em relacao a sua filtracao natural.

Exemplo 3.9. Verifique se o processo B2t e martingal em relacao a filtracao Ft =

σ (Bs, s ≤ t).

Solucao: Estamos diante de uma situacao analoga a do exemplo 3.7. A diferenca eque nao temos o parametro σ associado ao processo. Para o caso em s < t chegaremosao resultado E (B2

t |Fs) = t − s + B2s . Claramente o processo nao e martingal pois a

condicao (iii) da definicao acima nao foi atendida.

Definicao 3.12. (Processo submartingal e supermartingal) Seja (Ω,F , P ) um espco deprobabilidade, Ft uma filtracao e Mt um processo estocastico adaptado e 0 ≤ t ≤ T :

(i) Se E (Mt|Fs) ≥Ms para 0 ≤ s ≤ t, diz-se que o processo e submartingal;

(ii) Se E (Mt|Fs) ≤Ms para 0 ≤ s ≤ t, diz-se que o processo e supermartingal.

Considere que Y e martingal como definido acima. Considere a previsao das variacoesde Y em um intervalo de tempo ∆t > 0. Podemos escrever E (Yt+∆t − Yt|Ft) =E (Yt+∆t|Ft) − E (Yt|Ft). Sabemos que E (Yt|Ft) = Yt. Como Y e martingal temosE (Yt+∆t|Ft) = Yt, logo E (Yt+∆t − Yt|Ft) = 0. Isto significa que a melhor previsaopara as variacoes de Y e zero. Ou seja, que as direcoes de futuros movimentos sao

91

Page 102: Processos Estocásticos em Finanças

impossıveis de prever. Em outras palavras, se as trajetorias de determinado processoexibem tendencias, o processo nao e martingal. Isto significa dizer que o valor esperadode um processo martingal e constante. Outra forma para este resultado pode assim serescrita E (Ys) = E [E (Yt|Fs)] = E (Yt). Vimos no exemplo 3.9 que o processo B2

t exibeuma tendencia. Para retirarmos a tendencia do processo B2

t basta subtrairmos o termot e o novo processo Zt = B2

t − t e um processo martingal. Portanto para s < t o valoresperado sera

E (Zt|Fs) = E(B2t − t|Fs

)= B2

s − s = Zs

E assim tem-se o processo martingal. Portanto temos uma regra pratica adicional. Severificarmos que o processo nao e martingal (seu valor esperado condicional nao e cons-tante e exibe uma tendencia), para torna-lo martingal, basta retirarmos esta tendencia.

Um processo martingal e sempre definido com relacao a um conjunto de informacoes(σ-algebra) e com relacao a uma distribuicao de probabilidade (ou medida de probabili-dade). Se alterarmos o conjunto de informacoes e/ou a distribuicao de probabilidade, oprocesso que e martingal sob a condicao anterior pode deixar de se-lo sob a(s) nova(s)condicao(oes). Da mesma forma, se um processo nao e martingal, pode-se mudar adistribuicao de probabilidade para que o seja. Voltaremos a este assunto com maioresdetalhes e veremos que no aprecamento de derivativos e sempre conveniente obtermosprocessos que sejam martingais. Isto porque calcular o valor esperado condicional de umprocesso martingal e imediato e consequentemente o aprecamento torna-se uma tarefamais facil.

Exercıcio 3.4. Seja o processo aritmetico Browniano St = µt + σBt onde µ ∈ R eσ > 0. Verifique que St nao e martingal em relacao a filtracao Fs = σ (Bx, x ≤ s) paras < t. Obtenha um processo martingal a partir de St.

Exercıcio 3.5. Verifique se sao martingais os seguintes processos para t e s ∈ [0, T ] e s <t, em relacao a filtracao Ft = σ (Bs, s ≤ t):

(i) Zt = 2Bt + t

(ii) Zt = B3t − 3tBt

(iii) Zt = B4t

(iv) Zt = exp(−αBt − 1

2α2t), α 6= 0

3.4 Integracao estocastica

No inıcio deste capıtulo vimos na secao 3.1.1 que o processo Browniano nao e difer-enciavel em nenhum ponto de sua trajetoria. Isto porque as trajetorias nao sao suficien-temente suaves para que as derivadas a esquerda e a direita em determinado ponto sejamiguais. Tambem vimos que o processo Browniano e de variacao nao limitada. Estas duasrazoes fazem com os metodos classicos de integracao nao sejam aplicaveis as trajetoriasdo processo Browniano. Mais especificamente, estamos interessados em avaliar integraisda forma

∫ t0f (u) dBu (ω), onde (Bt (ω) , t ≥ 0) e uma trajetoria do movimento Browni-

ano e f uma funcao determinıstica ou uma trajetoria de um processo estocastico. Para

92

Page 103: Processos Estocásticos em Finanças

lidar com tais questoes teremos que desenvolver o conceito da integral estocastica deIto. Sob a otica da existencia desta integral, faz sentido o conceito de diferenciacao.Mencionamos anteriormente alguns processos estocasticos escritos sob a forma diferen-cial. Naquela oportunidade evitamos entrar nos detalhes do sentido da diferenciacao queusamos. Ao final desta e da proxima secao os conceitos de diferenciacao e integracaoem ambiente estocastico estarao compreendidos pelo leitor. Tambem devera estar bemclara a regra de diferenciacao, em ambiente estocastico, que e conhecida como formula(lema) de Ito. Antes de chegar neste ponto vamos rever rapidamente os conceitos daintegracao classica nas primeiras subsecoes.

A maior parte dos conceitos aqui apresentados deve-se a Kyosi Ito (1915-2008). Elefoi um dos pioneiros no campo da teoria da probabilidade e devido as suas contribuicoesoriginou-se um ramo da matematica denominado de calculo estocastico ou calculo deIto. As aplicacoes do calculo de Ito abrangem varios campos como fısica, engenharia(controle estocastico), biologia (genetica populacional) e economia (financas). De acordocom a citacao da National Academy of Sciences a famosa formula (lema) de Ito estapara a analise estocastica assim como os teoremas fundamentais de Newton estao paraa analise classica. Veja maiores detalhes sobre o trabalho de Ito em uma nota da Amer-ican Mathematical Society no site

http://www.ams.org/notices/200706/tx070600744p.pdf

Recomendamos tambem aos leitores interessados o artigo de Jarrow e Protter (2004)[58] que apresenta uma breve historia da integracao estocastica e sua aplicacao em fi-nancas.

3.4.1 Integral de Reimann

Considere f uma funcao real definida em um intervalo [a, b]. Considere uma particaodeste intervalo

τn : a = t0 < t1 < . . . tn−1 < tn = b

Vamos definir ∆ti = ti − ti−1, i = 1, . . . , n. Uma sub-particao δn e definida por valoresde yi tais que ti−1 ≤ yi ≤ ti para i = 1, . . . , n. Para as particoes δn e τn definimos asoma de Riemann como

Sn = Sn (τn, δn) =n∑i=1

f (yi) (ti − ti−1) =n∑i=1

f (yi) ∆ti (3.26)

Definicao 3.13. (Integral de Reimann) Se o limite S = limn→∞

Sn = limn→∞

n∑i=1

f (yi) ∆ti

existe e S e independente das particoes utilizadas, entao S e definida como a integral deRiemann de f no intervalo [a, b]. Escrevemos S =

∫ baf(t)dt.

93

Page 104: Processos Estocásticos em Finanças

3.4.2 Integral de Reimann-Stieltjes

Agora estamos interessados em integrar uma funcao em relacao a outra. Ou seja, bus-camos a interpretacao para a integral

∫ T0f (t) dg (t). Considere uma particao tal que

τn : 0 = t0 < t1 < . . . tn−1 < tn = T

Considere tambem uma sub-particao δn tal que

δn : ti−1 ≤ yi ≤ ti i = 1, . . . , n

Sejam f e g duas funcoes reais definidas em [0, T ] e considere

∆g (ti) = g (ti)− g (ti−1) i = 1, . . . n

A soma de Riemann-Stieltjes e dada por

Sn = Sn (τn, δn) =n∑i=1

f (yi) ∆g (ti) =n∑i=1

f (yi) [g (ti)− g (ti−1)] (3.27)

Definicao 3.14. (Integral de Reimann-Stieltjes) Se o limite

S = limn→∞

Sn = limn→∞

n∑i=1

f (yi) ∆g (ti)

existe e S e independente das particoes utilizadas, entao S e definida como integral deRiemann-Stieltjes em [0, T ]. Escrevemos S =

∫ T0f (t) dg (t).

Podemos considerar tambem o caso da integral∫ T

0g (xt) dFX (xt). Se X e uma

variavel aleatoria e FX (xt) a sua funcao distribuicao, entao uma integral deste tipo e ovalor esperado de g (x) para um t fixo:

E [g (xt)] =

∫ ∞−∞

g (xt) dFX (xt)

A questao que surge e saber quando e que existe a integral de Riemann-Stieltjes. Alemdisso, a funcao g pode ser substituıda pelo movimento Browniano? Na secao 3.1.1 con-sideramos o conceito de funcao com variacao limitada. Porem nos restringimos ao casodo Browniano examinando a situacao em que a ordem era p = 1. Agora ampliaremoseste conceito.

Definicao 3.15. (Variacao limitada de ordem p) Uma funcao h definida em [0, 1]tem variacao limitada de ordem p > 0, se

supτ

n∑i=1

|h (ti)− h (ti−1) |p <∞

onde o supremo e avaliado sobre todas as particoes τ em [0, 1].

94

Page 105: Processos Estocásticos em Finanças

As condicoes para a existencia da integral de Riemann-Stieltjes sao: (i) as funcoes fe g nao devem ter descontinuidades no mesmo ponto t ∈ [0, T ], (ii) a funcao f deve tervariacao limitada de ordem p > 0 e a funcao g de ordem q > 0, tal que p−1 + q−1 > 1.Com estas consideracaoes podemos dizer que a integral I =

∫ T0Bt (ω) dBt (ω) existe

sob o conceito de Riemann-Stieltjes? O movimento Browniano somente tem variacaolimitada para p > 2, entao 2

pnao sera maior que 1. Logo, sob o conceito de Riemann-

Stieltjes a integral acima nao existe.

3.4.3 Integral de Ito

A questao de avaliar a integral I, definida acima, ainda nao esta definitivamente clara.Em outras palavras, sob que condicoes podemos definir uma integral de tal natureza?Vamos voltar um pouco e retomar o movimento Browniano com drift. Considere oprocesso estocastico aritmetico Browniano Xt = µt + σBt, para t ≥ 0, σ > 0 e µ ∈ R.Vamos considerar o processo escrito sob a forma diferencial. Alem disto, se tomarmosuma particao τn

τn : 0 = t0 < t1 < . . . < tn−1 < tn = T

e avaliarmos St para cada ti e em seguida tomarmos a diferenca, teremos

Xti −Xti−1= µ∆ti + σ∆Bti

onde ∆ti = ti− ti−1 e ∆Bti = Bti−Bti−1para i = 1, . . . , n. Esta equacao para intervalos

infinitesimais de tempo torna-se

dXt = µdt+ σdBt (3.28)

que e a equacao diferencial estocastica (EDE) vista anteriormente.

Agora vamos considerar a equacao (3.28) de forma mais geral. Vamos admitir que osparametros µ e σ sejam funcoes do tempo e da variavel aleatoria Xt. Assim escrevemos

dXt = µ (St, t) dt+ σ (St, t) dBt (3.29)

A equacao (3.29) escrita sob a forma discreta e

Xti −Xti−1= µ

(Xti−1

, ti)

∆ti + σ(Xti−1

, ti)

∆Bti i = 1, . . . n

Se somarmos os incrementos ∆Sti , teremos

n∑i=1

Xti −Xti−1=

n∑i=1

µ(Xti−1

, ti)

∆ti +n∑i=1

σ(Xti−1

, ti)

∆Bti

Vamos definir a integral de Xt ao longo de toda a trajetoria como sendo o limite quandon→∞. Assim temos∫ T

0

dXu = limn→∞

n∑i=1

µ(Xti−1

, ti)

∆ti +n∑i=1

σ(Xti−1

, ti)

∆Bti

(3.30)

95

Page 106: Processos Estocásticos em Finanças

Cada somatorio do lado direito de (3.30) e uma integral. Observe que a primeira integralnao envolve nenhum termo estocastico quando temos uma informacao em ti. Alem disso,a integral (ou somatorio) e tomado em relacao as variacoes ∆ti, que e determinıstico. Istosignifica que a primeira integral e definida no sentido de Riemann-Stieltjes. A segundaintegral envolve termos que sao estocasticos em ti−1. Ou seja, dada as informacoes emti−1, o termo ∆Bti = Bti − Bti−1

nao e conhecido, e e uma variavel aleatoria. Comoa segunda soma envolve uma variavel aleatoria, o resultado dever ser uma variavelaleatoria e o conceito da soma de Riemann-Stieltjes nao se aplica. Deparamo-nos coma questao de definir qual o significado da soma

n∑i=1

σ(Xti−1

, ti)

∆Bti (3.31)

Na secao 1.6 vimos a definicao de convergencia de ordem p. Agora vamos reapresenta-lapara o caso em que p = 2. Ja definimos tambem a variacao quadratica (veja secao 3.1.2)e a variacao quadratica do Browniano (veja o teorema 3.1).

Definicao 3.16. (Convergencia media quadratica) Seja X = (Xt, t ≥ 0) umavariavel aleatoria. Entao Xt converge para X no sentido medio quadratico se

limt→∞

E[(Xt −X)2] = 0

Isto significa que quando t→∞ a variancia do erro εt (εt = Xt −X) tende a zero.

A soma em (3.31) e uma variavel aleatoria que possui convergencia media quadratica.O valor para o qual esta soma converge e definida como a integral de Ito. Em termosda definicao acima podemos escrever:

limn→∞

E[

n∑i=1

σ(Xti−1

, ti)

∆Bti −∫ t

0

σ (Xu, u) dBu

]2 = 0

Definicao 3.17. (Integral de Ito) Considere o processo Browniano B = (Bt, t ≥ 0)e a correspondente filtracao natural Ft = σ (Bt, t ≥ 0). Considere σ = (σt, t ∈ [0, T ])um processo estocastico atendendo as seguintes condicoes:

(i) σt e uma funcao de Bs, s ≤ t;

(ii) O processo σt nao e explosivo, ou seja E(∫ T

0[σ (Bu)]

2 du)<∞.

Todos os processos considerados estao definidos no mesmo espaco de probabilidade (Ω,F , P ),onde P e a medida de probabilidade em relacao a σ-algebra F .

A integral de Ito∫ T

0σ (Bu, u) dBu e o limite medio quadratico quando n→∞

limn→∞

E[

n∑i=1

σ(Bti−1

, ti)

∆Bti −∫ T

0

σ (Bu, u) dBu

]2 = 0

96

Page 107: Processos Estocásticos em Finanças

A condicao (i) e fundamental para a integral de Ito. Ela significa que a funcaoque esta sendo integrada deve ser nao antecipativa. Se estamos considerando a integral∫ T

0σu (Bu, u) dBu, entao podemos escolher a particao

τn : 0 = t0 < t1 . . . < tn−1 < tn = T

A funcao σ (·), no integrando, e adaptada a(Fti−1

), ou seja σ e funcao do movimento

Browniano ate o tempo ti−1. Caso contrario, os termos σti e ∆Bti

(= Bti −Bti−1

)pode-

riam ser correlacionados inviabilizando a existencia da convergencia media quadratica.

Pode-se demonstrar a existencia da integral de Ito sob estas condicoes. Em geral, naoe possıvel calcular o valor limite da soma media quadratica. Um caso simples, que noentanto e algebricamente oneroso, e a integral∫ T

0

Bu (ω) dBu (ω)

cujo resultado e ∫ T

0

Bs (ω) dBs (ω) =1

2

[B2T (ω)− T

](3.32)

Se tivessemos usado o calculo classico usando o limite da soma de Riemann encon-trarıamos 1

2B2t (ω). Este exemplo mostra o quanto diferem os resultados de uma inte-

gracao em ambiente estocastico e convencional. Nao se preocupe se ainda nao esta clarocomo resolver a integral acima. Aprenderemos um pouco mais adiante como chegar aoresultado da equacao (3.32).

Pode-se tambem demonstrar que o termo (∆Bti)2 =

(Bti −Bti−1

)2converge no sen-

tido medio quadratico para T . Formalmente escrevemos

limn→∞

E[n−1∑i=0

(∆Bti)2 −

∫ T

0

(dBu)2

]2 = 0

e o valor da integral estocastica de Ito e∫ T

0

(dBu)2 = T (3.33)

Este resultado e coerente com o conceito visto anteriormente de que (dBt)2 = dt, ou

seja ∫ T

0

(dBu)2 =

∫ T

0

du = T (3.34)

Definicao 3.18. (Processo de Ito univariado) Considere Bt um processo Brownianoe Ft = σ (Bx, x ≤ t), para t ≥ 0. O processo de Ito e definido por

Xt = x+

∫ t

0

µ (Xu, u) du+

∫ t

0

σ (Xu, u) dBu (3.35)

97

Page 108: Processos Estocásticos em Finanças

onde X0 = x representa o valor inicial do processo e os processos µ (Xt, t) e σ (Xt, t)sao adaptados a filtracao natural de Bt, ou seja, a Ft. Ainda mais as funcoes µ (·) eσ (·) devem atender as condicoes∫ t

0

µ (Xu, u) ds <∞ q.c. e

∫ t

0

|σ (Xu, u) |du <∞ q.c.

onde as iniciais q.c. referem-se ao termo quase certamente.

A primeira integral do segundo membro e uma integral de Reimann-Stiltjes e asegunda e uma integral estocastica de Ito. Na forma diferencial o processo de Ito eassim escrito

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt (3.36)

para o caso especial em que µ (Xt, t) = µXt e σ (Xt, t) = σXt temos o processogeometrico Browniano definido anteriormente na equacao (3.17). O termo σ (·) e de-nominado difusao do processo.

Considere f e g duas funcoes que atendam as condicoes estabelecidas na definicao daintegral de Ito. Admita que 0 ≤ s < t < T . Entao sao validas as seguintes propriedadespara a integral de Ito:

(i)∫ TsfdBu =

∫ tsfdBu +

∫ TtfdBu

(ii)∫ Ts

(cf + g) dBu = c∫ TsfdBu +

∫ TsgdBu

(iii) E[∫ T

sfdBu

]= 0

(iv) Isometria de Ito: E

[(∫ TsfdBu

)2]

= E[∫ T

sf 2du

]Ainda mais relevante e o fato de que a integral de Ito e martingal em relacao a filtracaonatural do movimento Browniano Ft, t ∈ [0, T ], ou seja,

E

[∫ t

0

σ (Su, u) dBu|Fs]

=

∫ s

0

σ (Su, u) dBu

Em geral a avaliacao de integrais estocasticas usando o conceito de convergencia mediaquadratica e muito onerosa em termos dos calculos algebricos envolvidos. Geralmenteavaliamos as integrais estocasticas a partir do uso da formula (lema) de Ito. Por estarazao deixaremos os exercıcios e exemplos para a proxima secao.

Agora entendemos o sentido da integral estocastica. Com isto aprenderemos, naproxima secao, o conceito de diferenciacao de um processo estocastico. Apos, estare-mos aptos a resolver as principais equacoes diferenciais estocasticas que rotineiramentemodelam os processos em financas.

98

Page 109: Processos Estocásticos em Finanças

3.5 Formula de Ito

A secao anterior apresentou em que sentido e valido o conceito de integracao quandolidamos com variaveis estocasticas. Nesta secao apresentaremos o conceito da formula(lema) de Ito que por sua vez esta relacionado ao conceito de convergencia mediaquadratica. Da mesma forma que no caso de integracao, o conceito de convergenciamedia quadratica provocara uma modificacao da regra de diferenciacao que conhecemosdo calculo classico. A formula (lema) de Ito permite que possamos trabalhar difer-enciando variaveis em um ambiente estocastico. Se sabemos que St e um processoestocastico pode-se escrever uma funcao F (St). A formula (lema) de Ito permitiraque calculemos o diferencial dF (St), medindo o que acontece com F quando ocorrempequenas variacoes na variavel St.

Exercıcio 3.6. Considere um tıtulo que pague $1 em sua maturacao T . O valor destetıtulo em t ∈ [0, T ] e f (Rt, t) = e−Rt(T−t). Calcule o diferencial total d [f (Rt, t)], con-siderando as variaveis determinısticas.

Antes da definicao da formula (lema) de Ito vamos rever o desenvolvimento de umafuncao f (x) em serie de Taylor em torno de x0. Considere que f seja uma funcao comderivadas ate ordem n+ 1 tal que:

f (x) = f (x0) + f ′ (x0) (x− x0) +1

2f ′′ (x0) (x− x0)2 +R (∆x)

onde R (∆x) refere-se aos termos subsequentes e ∆x = x − x0. Ou ainda podemosescrever

f (x)− f (x0) = ∆f = f ′ (x0) ∆x+1

2f ′′ (x0) (∆x)2 +R (∆x)

Tomando ∆x como pequenos incrementos de x, temos

df = f ′ (x) dx

onde todos o termos de ordem igual ou superior a dois sao muito pequenos e desprezıveis.Este e o conceito de diferencial de f no calculo classico para a funcao de uma variavel.Para duas variaveis terıamos a expansao em serie de Taylor em torno do ponto (x0, y0):

f (x, y) = f (x0, y0) +∂f

∂x(∆x) +

∂f

∂y(∆y) +

1

2

∂2f

∂x2(∆x)2 +

1

2

∂2f

∂y2(∆y)2 +

∂2f

∂x∂y(∆x) (∆y) +R (∆x,∆y)

onde as derivadas parciais sao calculadas no ponto (x0, y0). Podemos ainda escrever

f (x, y)− f (x0, y0) = ∆f = fx∆x+ fy∆y +1

2fxx (∆x)2 +

1

2fyy (∆y)2 + fxy (∆x) (∆y) +R (∆x,∆y)

Tomando pequenos incrementos de ∆x e ∆y e desprezando o termos de ordem superiora dois, temos

df =∂f

∂xdx+

∂f

∂ydy = fxdx+ fydy

99

Page 110: Processos Estocásticos em Finanças

Este e o conceito de diferencial total para uma funcao de duas variaveis no calculoclassico.

Vamos verificar o que acontece quando lidamos com variaveis estocasticas. Seja aequacao diferencial estocastica (3.29) aqui reescrita

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt (3.37)

Na forma discreta temos

∆Xti = Xti −Xti−1= µ

(Xti−1

, ti)

∆ti + σ(Xti−1

, ti)

∆Bti (3.38)

onde os termos do lado direito ja foram definidos. Isto significa que em ti−1 a variavelXti−1

e conhecida.

Agora considere a funcao f (Xt, t) e admita que f (·) seja uma funcao contınua e difer-enciavel duas vezes em relacao a x e uma vez em relacao a t. Desejamos calculard (f (Xti , ti)) em torno do ponto

(Xti−1

, ti−1

)usando a expansao de Taylor:

∆fti = f (Xti , ti)− f(Xti−1

, ti−1

)=∂f

∂x∆Xti +

∂f

∂t∆ti+

1

2

∂2f

∂x2(∆Xti)

2 +1

2

∂2f

∂t2(∆ti)

2 +∂2f

∂x∂t(∆Xti) (∆ti) +R (∆Xti ,∆ti) (3.39)

Os termos de segunda ordem que nao envolvem variaveis estocasticas sao desprezadosconforme a mesma consideracao do calculo classico. Assim (∆ti)

2 → 0. Vamos examinaro termo de segunda ordem (∆Xti)

2. A partir da equacao (3.38) e simplificando a notacao,temos:

(∆Xti)2 = (µti∆ti + σti∆Bti)

2 =

(µti)2 (∆ti)

2 + (σti)2 (∆Bti)

2 + 2µtiσti∆ti∆Bti

O primeiro termo do lado direito e desprezıvel. O segundo termo (∆Bti)2 tende a ∆ti no

sentido da convergencia media quadratica, conforme os argumentos desenvolvidos entreas equacoes (3.32) e (3.34). O ultimo termo e da ordem (∆ti)

3/2 e tambem tende a zero.

O termo cruzado de segunda ordem em (3.39) (∆Xti) (∆ti), e dado por

(∆Xti) (∆ti) = (∆ti) [µti∆ti + σti∆Bti ]

sob os mesmos argumentos anteriores, temos que (∆Xti) (∆ti)→ 0. Os termos do restoR (∆Xti ,∆ti) envolvem ordem igual o superior a tres e sao desprezıveis. Entao restade (3.39) que

∆fti =∂f

∂x∆Xti +

∂f

∂t∆ti +

1

2

∂2f

∂x2(σti)

2 ∆ti

∆fti =

(∂f

∂t+

1

2σ2ti

∂2f

∂x2

)∆ti +

∂f

∂x∆Xti

Tomando incrementos infinitesimais, temos

df =

(∂f

∂t+

1

2σ2t

∂2f

∂x2

)dt+

∂f

∂xdX

100

Page 111: Processos Estocásticos em Finanças

Usando dXt de (3.37)

df =

(∂f

∂t+ µt

∂f

∂x+

1

2σ2t

∂2f

∂x2

)dt+ σt

∂f

∂xdBt (3.40)

onde µt = µ (Xt, t) e σt = σ (Xt, t). A equacao (3.40) e a formula (lema) de Ito quefornece o diferencial total de uma funcao que tem como argumentos Xt e t. O processoXt cujo processo esta descrito na equacao (3.37).

Teorema 3.2. (Formula de Ito) Considere Xt um processo estocastico em 0 ≤ t ≤ T

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt (3.41)

Seja f (x) uma funcao contınua e duas vezes diferenciavel, entao o diferencial de f edado por

d [f (Xt)] = f ′ (Xt) dXt +1

2f ′′ (Xt) d [X,X] (t) (3.42)

ou ainda, introduzindo dXt e calculando a variacao quadratica de X, temos

d [f (Xt)] =

[f ′ (Xt)µ (Xt, t) +

1

2f ′′ (Xt)σ

2 (Xt, t)

]dt+ f ′ (Xt)σ (Xt, t) dBt (3.43)

Exemplo 3.10. Considere f (Bt) = B2t . Calcule o diferencial d(f).

Solucao: Vamos inicialmente designar x = Bt. Temos entao que f (x) = x2. Assim

as derivadas parciais de f sao ∂f∂x

= 2x e ∂2f∂x2 = 2, logo temos:

df =∂f

∂xdx+

1

2

∂2f

∂x2(dx)2

ou ainda

df = 2BtdBt +1

22 (dBt)

2

= 2BtdBt + dt

d(B2t

)= 2BtdBt + dt

Teorema 3.3. (Formula de Ito para duas variaveis) Seja f (x, y, t) uma funcaocontınua e derivavel duas vezes com relacao a x e y (com a primeira e segunda derivadascontınuas) e uma vez em relacao a t (com derivada contınua). Sejam X e Y processosde Ito conforme (3.36) com difusoes σX e σY , entao

d [f (X, Y, t)] =∂f

∂tdt+

∂f

∂xdXt +

∂f

∂ydYt +

1

2

∂2f

∂x2σ2X (Xt, t) dt+

1

2

∂2f

∂y2σ2Y (Yt, t) dt

+∂2f

∂x∂yσX (Xt, t)σY (Yt, t) dt

(3.44)

onde dBXtdBYt = ρXY dt.

Comentamos anteriormente que usarıamos a formula (lema) de Ito para calcularintegrais estocasticas. Agora vamos faze-lo.

Exemplo 3.11. Calcule a integral∫ T

0BudBu.

101

Page 112: Processos Estocásticos em Finanças

Solucao: Sabemos do exemplo 3.10 que

d(B2t

)= 2BtdBt + dt

integrando de 0 a T ambos os membros da equacao temos∫ T

0

dB2u = 2

∫ T

0

BudBu +

∫ T

0

du

O segundo membro contem a integral desejada. Resolvendo a equacao para esta integralficamos com ∫ T

0

BudBu =1

2

∫ T

0

dB2u −

T

2

=1

2

(B2T −B2

0

)− T

2

=B2T − T

2

Este resultado ja havia sido mostrado na equacao (3.32). Naquela oportunidade aindanao sabıamos com encontra-lo. Agora mostramos os detalhes com o auxılio da formula(lema) de Ito.

Exercıcio 3.7. Calcule as seguintes integrais:

(i)∫ T

0B2udBu

(ii)∫ T

0udBu

Exercıcio 3.8. Calcule o diferencial das seguintes funcoes:

(i) f (Bt) = exp (B2t )

(ii) f (Bt, t) = exp(σBt − 1

2σ2t)

Exercıcio 3.9. Considere o movimento geometrico Browniano

St = s exp

[(µ− 1

2σ2

)t+ σBt

]onde, S0 = s. Calcule dSt.

Exercıcio 3.10. Retome o enunciado do exercıcio 3.6. Considere f (Rt, t) = e−Rt(T−t)

e que a taxa de juros segue o processo de Vasicek (veja em Vasicek (1977) [100])

dRt = (α− βRt) dt+ σdBt

onde α, β e σ sao constantes positivas, encontre d [f (Rt, t)].

O exercıcio que se segue tem o mesmo enunciado do exemplo 3.3.

102

Page 113: Processos Estocásticos em Finanças

Exercıcio 3.11. Considere que X segue um processo geometrico Browniano com driftα ∈ R, X0 = x = 1 e volaltilidade σ > 0. Da mesma forma Y segue um processogeometrico Browniano com drift β ∈ R, Y0 = y = 1 e volatilidade ν > 0. A correlacaoentre os Brownianos dos dois processos e ρ, ou melhor, dBXdBY = ρdt. Resolva ositens abaixo:

(i) Faca V = XY . Que processo V segue?

(ii) Quais as correlacoes de dV com dX e dY ?

(iii) Faca W = X/Y . Que processo W segue?

(iv) Quais as correlacoes de dW com dX e dY ?

(v) Qual a correlacao de dV com dW?

Exercıcio 3.12. Retome o enunciado do exercıcio 3.11. Mostre que dBX pode serexpresso como uma funcao de sua projecao em dBY mais um resıduo ε independente,tal que dBX = ρdBY +

√1− ρ2dε.

Teorema 3.4. (Formula de Ito multivariada) Considere X1, . . . , Xn processos Ito2 tais que

dXi = µi (X1, . . . , Xn) dt+ σi (X1, . . . , Xn) dBXi (3.45)

Seja f (X1, . . . , Xn, t), onde f e contınua e duas vezes diferenciavel em relacao a xi(com derivadas contınuas) e uma vez em ralacao a t (com derivada contınua), entao odiferencial de f sera

df (X1, . . . , Xn, t) =∂f

∂tdt+

∑i

∂f

∂xidXi +

1

2

∑i,j

∂2f

∂xi∂xjdXidXj (3.46)

onde dBXidBXj = ρijdt, i 6= j.

Exemplo 3.12. Sejam Xt e Yt dois processos estocasticos definidos por dXt = αdt +σdBXt e dYt = βdt + νdBYt com X0 = Y0 = 0. Seja g (X, Y, t) = etX + etY . Calculedg (·).

Solucao: Sabemos que Xt = αt+ σBXt e Yt = βt+ νBYt. Entao a funcao g (·) e dadapor

g (X, Y, t) = eαt2+σtBXt︸ ︷︷ ︸gX(x,t)

+ eβt2+νtBYt︸ ︷︷ ︸gY (y,t)

onde x ≡ BXt e y ≡ BYt. Temos entao que

dg (·) = d (gX (x, t)) + d (gY (y, t))

dg (·) =∂gX∂t

dt+∂gX∂x

dBXt +1

2

∂2gX∂x2

(dBXt)2

+∂gY∂t

dt+∂gY∂y

dBYt +1

2

∂2gY∂y2

(dBYt)2

2Para simplificar a notacao eliminamos o subscrito t das variaveis estocasticas.

103

Page 114: Processos Estocásticos em Finanças

dg (·) = eαt2+σtBXt (2αt+ σBXt) dt+ eαt

2+σtBXtσtdBXt +1

2eαt

2+σtBXtσ2t2dt

+ eβt2+νtBYt (2βt+ νBYt) dt+ eβt

2+νtBYtνtdBYt +1

2eβt

2+νtBYtν2t2dt

dg (·) =

[eαt

2+σtBXt

(2αt+ σBXt +

1

2σ2t2

)+ eβt

2+νtBYt

(2βt+ νBYt +

1

2ν2t2

)]dt

+ eαt2+σtBXtσtdBXt + eβt

2+νtBYtνtdBYt

Exemplo 3.13. Retome o enunciando do exercıcio 3.11. Seja f (X, Y ) = XY . Calculeo diferencial df (·).

Solucao: Agora temos que fx = Y , fy = X, fxx = fyy = 0 e fxy = 1. Logo odiferencial df (·), usando a equacao (3.44), sera

df (·) = Y (Xαdt+XσdBX) +X (Y βdt+ Y νdBY ) + dXdY

df (·) = XY αdt+XY βdt+ σνXY dBXdBY +XY σdBX +XY νdBY

Lembrando que f (X, Y ) = XY e que dBXdBY = ρdt, obtemos:

df

f= (α + β + σνρ) dt+ σdBX + νdBY

Exercıcio 3.13. Considere o mesmo enunciado do exercıcio 3.11. Seja f (X, Y ) = 1XY

.Calcule df (·).

Exercıcio 3.14. Considere os seguintes processos estocasticos dXt = µXdt + σXdBXt

e dYt = µY dt + σY dBYt com X0 = Y0 = 0 e dBXtdBYt = ρdt. Seja f (X, Y, t) = eX+Y ,calcule df (·).

3.6 Exemplos de EDE´s

Embora este texto dedique o capıtulo 6 as EDE´s, achamos oportuno apresentar algunsexemplos e suas solucoes neste capıtulo. Faremos isto nesta secao. No capıtulo 6 tere-mos a oportunidade de formalizarmos estes conceitos.

Aprendemos ao longo deste capıtulo que a forma diferencial do processo estocasticodefinido como processo geometrico Browniano tem uma solucao fechada. Entretantonao apresentamos a sua solucao. Outro processo estocastico muito comum em financase o processo de reversao a media, tambem conhecido como Ornstein-Uhlenbeck. Veremosa sua solucao. Esta secao contem a formalizacao da solucao de algumas EDE’s.

104

Page 115: Processos Estocásticos em Finanças

3.6.1 Processo geometrico Browniano

A equacao (3.17) e utilizada em financas para descrever os precos de acoes. Vimos queS representa o preco da acao e que a sua distribuicao e lognormal, adequada pois arepresentar variaveis que assumem valores positivos. Reescrevemos a equacao a seguir

dXt

Xt

= µdt+ σdBt para t ≥ 0, X0 = x

onde µ ∈ R e σ > 0. Desejamos encontrar uma solucao para esta equacao3, i.e.,Xt = f (Bt, t).

Na forma integral esta equacao e escrita como

Xt = x+

∫ t

0

µf (Bu, u) du+

∫ t

0

σf (Bu, u) dBu (3.47)

onde a primeira integral e de Riemann-Stieltjes, a segunda e de Ito e X0 e o preco doativo em t = 0. Considerando Xt = f (Bt, t) = f (x, t), podemos usar a formula (lema)de Ito

df [(x, t)] =∂f

∂tdt+

∂f

∂xdBt +

1

2

∂2f

∂x2(dBt)

2

d [f (x, t)] =∂f

∂tdt+

∂f

∂xdBt +

1

2

∂2f

∂x2dt =

(∂f

∂t+

1

2

∂2f

∂x2

)dt+

∂f

∂xdBt

integrando ambos os lados desta equacao, temos

f (Bt, t)− f (B0, 0) =

∫ t

0

(∂f

∂u+

1

2

∂2f

∂x2

)du+

∫ t

0

∂f

∂xdBu (3.48)

Comparando as equacoes (3.48) e (3.47), podemos dizer para a segunda integral que

∂f

∂x= σf ⇒ df

f= σdx⇒ ln f − ln g (t) = σx

e entaof = g (t) eσx (3.49)

Para a primeira integral podemos escrever

∂f

∂u+

1

2

∂2f

∂x2= µf (3.50)

Mas a equacao (3.49) significa que

∂f

∂t= g′ (t) eσx

3A solucao para a equacao dXt = µ (X, t) dt + σ (X, t) dBt existe e e unica desde que as funcoesµ (Xt, t) e σ (Xt, t) sejam contınuas e a condicao de Lipshitz para Xt seja valida. Veja a demonstracaodesta propriedade em Kloeden and Platen (1992) [63]. Veja tambem a definicao da condicao de Lipshitzpara uma funcao f (x) x ∈ R, no Apendice deste capıtulo. Formalizaremos estes conceitos no capıtulo6.

105

Page 116: Processos Estocásticos em Finanças

∂2f

∂x2= g (t)σ2eσx

Introduzindo ambos os resultados na equacao (3.49), temos

g′ (t) eσx +1

2g (t)σ2eσx = µf = µg (t) eσx

Simplificando esta equacao resulta

g′ (t) =

(µ− 1

2σ2

)g (t)⇒ g′ (t)

g (t)=

(µ− 1

2σ2

)⇒ g (t) = Ce(µ−

12σ2)t

onde C e uma constante relacionada as condicoes iniciais. Levando este resultado naequacao (3.49), temos finalmente

f (Bt, t) = Ce(µ−12σ2)t+σBt

E em t = 0 o preco do ativo e X0 = x, resultando em

Xt = xe(µ−12σ2)t+σBt

3.6.2 Equacao de Langevin

A equacao de Langevin e dada por

dXt = µXtdt+ σdBt para t ≥ 0, X0 = x (3.51)

onde µ e σ > 0 sao parametros. Desejamos encontrar a solucao Xt.

Considere o fator de integracao e−µt e multiplique ambos os membros da equacao acima

e−µtdXt = µe−µtXtdt+ σe−µtdBt (3.52)

Agora considere a funao g (t,Xt) = e−µtXt e calcule o seu diferencial d [g (t,Xt)] usandoa formula (lema) de Ito

d [g (t,Xt)] = d(e−µtXt

)= −µe−µtXtdt+ e−µtdXt (3.53)

Somando membro a membro as equacoes (3.52) e (3.53)

d(e−µtXt

)+ e−µtdXt = σe−µtdBt + e−µtdXt

Simplificandod(e−µtXt

)= σe−µtdBt

E agora integrando de t = 0 a t

e−µtXt − x = σ

∫ t

0

e−µudBu

Finalmente chegamos ao resultado

Xt = xeµt + σ

∫ t

0

eµ(t−u)dBu

Exercıcio 3.15. Calcule a media e a variancia de Xt = X0eµt+σ

∫ t0eµ(t−u)dBu. Calcule

a covariancia Cov (Xt, Xu) para s < t.

106

Page 117: Processos Estocásticos em Finanças

3.6.3 Processo de Ornstein-Uhlenbeck

Tambem conhecido como processo de reversao a media, o processo de Ornstein-Uhlenbeck(OU) e um processo que reverte a media de longo prazo e e dado por

dXt =(X −Xt

)dt+ σdBt para t ≥ 0, X0 = x (3.54)

onde X e a media de longo prazo do preco do ativo e σ > 0 a volatilidade. Buscamos asolucao Xt.

Esta dinamica significa que o preco flutua mas e atraıdo para a media de longo prazo.Considere o fator de integracao et e multiplique ambos membros da equacao (3.54)

etdXt =(X −Xt

)etdt+ σetdBt (3.55)

Considere a funcao g (t,Xt) = etXt e use a formula (lema) de Ito para calcular d [g (t,Xt)]

d [g (t,Xt)] = d(etXt

)= etXtdt+ etdXt (3.56)

Somando membro a membro as equacoes (3.55) e (3.56)

d(etXt

)= Xetdt+ σetdBt

Integrando de t = 0 a t

etXt − x = Xet − X + σ

∫ t

0

eudBu

etXt = x− X + Xet + σ

∫ t

0

eudBu

e finalmente

Xt = X +(x− X

)e−t + σ

∫ t

0

eu−tdBu

Exercıcio 3.16. A equacao (3.54) pode ser alterada para

dXt = k(X −Xt

)dt+ σdBt para t ≥ 0, X0 = x (3.57)

neste caso k > 0 representa a velocidade de reversao e σ > 0 a volatilidade. Agora opreco do ativo flutua mas retorna a media de longo prazo com velocidade k:

(i) resolva esta equacao usando o fator de integracao ekt,

(ii) calcule a media e a variancia de Xt.

O processo de reversao e utilizado para modelar muitas variaveis economicas que ten-dem a retornar a valores medios de longo prazo. Uma das aplicacoes e o uso do processode reversao, analogo ao da equacao (3.57), para modelar a taxa de juros. Antecipamosisto no exercıcio 3.10. De fato, a taxa de juros acompanha os ciclos economicos que nolongo prazo alternam perıodos de expansao e de recessao.

107

Page 118: Processos Estocásticos em Finanças

Outra aplicacao dos processos de reversao ocorre na modelagem dos precos das commodi-ties. Em geral os produtores ofertam seus produtos de acordo com os precos. Assim se osprecos estao elevados os produtores irao ofertar em abundancia ocasionando uma quedanos precos. Por outro lado, se os precos estao baixos eles se sentem pouco atraıdos aofertar e entao o produto torna-se escasso no mercado. Isto provoca uma alta nos precos.Portanto, existe uma tendencia dos precos acompanharem a media de longo prazo.

Existem variantes do processo de reversao. Uma delas muito comum e usada paramodelar precos de commodities e o processo geometrico de reversao. Estaremos nestetexto dedicando especial atencao, em um capıtulo inteiro, aos processos estocasticosutilizados na modelagem de commodities. Nao obstante, e oportuno neste momentoapresentarmos um pouco mais sobre estes modelos.

Schwartz (1997) [88] modelou os precos das commodities pelo processo geometrico dereversao

dXt = k (µ− lnXt)Xtdt+ σXtdBt (3.58)

onde St representa o preco a vista da commodity e σ > 0 a volatilidade. Este precoreverte para a media de longo prazo X = eµ a uma velocidade de reversao igual a k > 0.

Observe a primeira parcela do segundo membro das equacoes (3.57) e (3.58). Se Xesta acima de X, entao esta parcela e negativa e o preco tende a reduzir, no sentido deX. Da mesma forma, se X esta abaixo de X, esta parcela e positiva e tende a aumentaro preco, no sentido de X.

Exercıcio 3.17. Considere na equacao (3.58) que Yt = lnXt. Derive o processo es-tocastico de Yt atraves da formula (lema) de Ito.

Como resposta do exercıcio 3.17 encontramos que

dYt = k (θ − Yt) dt+ σdBt (3.59)

onde θ = µ− σ2

2k, Yt segue o processo de Ornstein-Uhlenbeck definido na equacao (3.57).

A figura 3.4 mostra quatro trajetorias do processo geometrico de reversao definido pelaequacao (3.58). Nesta simulacao o preco inicial e X0 = $50, a volatilidade e σ = 20%ao ano e a media de longo prazo e X = $54. Observe que a medida que as velocidadesde reversao aumentam, os precos sao atraıdos para a media X mais fortemente. Foramusados os mesmos choques nas simulacoes das quatro trajetorias.

Retome a definicao do processo de reversao na equacao (3.57). A primeira parcela dosegundo membro desta equacao e dXt = k

(X −Xt

)dt. Integrando de t = 0 a t, obtemos

Xt − X =(x− X

)e−kt

Se definirmos tH como o tempo para X cair para a metade de seu nıvel inicial temos

1

2

(x− X

)=(x− X

)e−ktH

108

Page 119: Processos Estocásticos em Finanças

Figura 3.4: Simulacoes do processo geometrico de reversao

O tempo tH e definido como a meia-vida do processo de reversao. E uma forma distintade nos referirmos a velocidade de reversao. Resolvendo a ultima equacao temos a meia-vida

tH =ln 2

k(3.60)

Como dissemos anteriormente voltaremos a estes conceitos nos capıtulos seguintes quandotrataremos da simulacao de processos estocasticos e da modelagem de commodities, res-pectivamente.

3.7 Resumo e consideracoes finais

Este capıtulo constitui a base necessaria para o desenvolvimento das metodologias deaprecamento de derivativos. Primeiramente destacamos o conceito de processo Browni-ano, Bt ∼ N (0, t), que tem valor inicial zero, tem incrementos estacionarios e indepen-dentes e possui realizacoes contınuas (sem saltos). Estas propriedades lhe conferem acondicao de nao diferenciabilidade no sentido classico.

Seguimos com o conceito de valor esperado condicional e com a nocao de σ-algebra.A relevancia destes dois conceitos esta no fato de que em financas e importante quesaibamos calcular o valor esperado de uma variavel aletoria no futuro dado um conjuntode informacoes disponıveis atualmente. A σ-algebra e o conceito matematico que re-trata este conjunto de informacoes diponıveis. O valor esperado condicional e semprecalculado em relacao a uma funcao de probabilidade (ou medida de probabilidade) e a

109

Page 120: Processos Estocásticos em Finanças

uma σ-algebra, de tal forma que escrevemos EP (Xt|Fs) para expressar o valor esper-ado, segundo a funcao probabilidade P , da variavel aleatoria X no instante t dada asinformcaoes do instante s, sendo s < t. Alterando-se a medida de probabilidade e/ou aσ-algebra o valor esperado em geral modifica-se.

Em seguida definimos o processo martingal como aquele em que o valor esperado condi-cional para o processo em t e o seu valor em s, ou seja, EP (Xt|Fs) = Xs. Aqui valedestacar que esta propriedade permitira o aprecamento de derivativos de uma formamuito simples. Isto porque se encontrarmos uma medida de probabilidade Q em relacaoa qual o processo e martingal, entao o valor esperado da variavel em uma data futurae o seu valor hoje. Isto reduz bastante os calculos comparativamente a metodologiaclassica de aprecamento. No capıtluo 4 trataremos da metodologia classica e faremoso aprecamento de opcoes como no modelo de Black, Merton e Scholes. No capıtuloposterior usaremos o conceito da propriedade martingal, aqui apresentado.

Os dois topicos seguintes estao intimamente relacionados. Desenvolvemos o conceitode integracao em ambiente estocastico. Uma vez definido o conceito de integracao, aoperacao de diferenciacao passa a fazer sentido neste ambiente. Definimos a integral deIto como sendo o resultado da convergencia media quadratica na definicao 3.17 e aquienfatizado

limn→∞

E[

n∑i=1

σ(Bti−1

, ti)

∆Bti −∫ T

0

σ (Bu, u) dBu

]2 = 0

Com o conceito da integral de Ito pudemos definir o processo de Ito na definicao 3.18

Xt = x+

∫ t

0

µ (Xu, u) du+

∫ t

0

σ (Xu, u) dBu

onde a primeira integral e de Reimann e a segunda e uma integral de Ito. Vimos tambemque a integral de Ito goza da propriedade martingal. Estando definido o sentido deintegracao, pode-se escrever o processo na forma diferencial como

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt

Para o caso especial em que µ (Xt, t) = µXt e σ (Xt, t) = σXt temos o processogeometrico Browniano definido por

dXt = µXtdt+ σXtdBt para t ≥ 0, X0 = x

A seguir definimos a formula de Ito que nada mais e do que a operacionalizacao da difer-enciacao total de variaveis estocasticas, equivalentemente a regra da cadeia no calculoclassico. Vimos como calcular d [f (Xt, t)] onde Xt segue e um processo de Ito acima. Aregra de diferenciacao e

df (Xt, t) =

(∂f

∂t+ µt

∂f

∂x+

1

2σ2t

∂2f

∂x2

)dt+ σ

∂f

∂xdBt

110

Page 121: Processos Estocásticos em Finanças

onde µt = µ (Xt, t) e σt = σ (Xt, t). A formula de Ito juntamente com a propriedademartingal sao as ferramentas basicas para o desenvolvimento de aprecamento de deriva-tivos em financas. Ja no capıtulo 4 faremos uso da formula de Ito na derivacao domodelo de Black, Merton e Scholes. Finalizamos o capıtulo 3 com a aplicacao de todosos conceitos acima. Para tal resolvemos algumas equacoes diferenciais estocasticas quesao usuais em financas com destaque para o processo geometrico Browniano e a equacaode Ornstein-Uhlenbeck.

3.8 Apendice - Variacao quadratica, condicoes de

Lipshitz e Holder

3.8.1 Variacao quadratica

Repetimos abaixo o enunciado do teorema 3.1 e apresentamos a sua demonstracao.

Seja Bt, 0 ≤ t ≤ T , uma processo Browninao padrao e seja τ uma particao assimdefinida

τ : 0 = t0 < t1 < . . . tn = T

entao a variacao quadratica [B,B] (T ) = T e

[B,B] (T ) = limδ→0

n−1∑i=0

(Bti+1

−Bti

)2= T

Prova. Seja S =∑n−1

i=0

(Bti+ −Bti

)2. Temos que provar que limδ→0 S = T . A soma S

e uma variavel aleatoria. Se tomarmos diferentes particoes teremos diferentes caminhos,que calculados com base na definicao de S e tomado o limite, fornecerao sempre comoresultado o valor T . Vamos calcular o valor esperado e a variancia de S.

E (S) = E

(n−1∑i=0

(Bti+1

−Bti

)2

)=

n−1∑i=0

E[(Bti=1

−Bti)2] =

n−1∑i=0

(ti+1 − ti) = T

V ar (S) = V ar

[n−1∑i=0

(Bti+1

−Bti

)2

]=

n−1∑i=0

V ar[(Bti+1

−Bti

)2]

Vamos calucular a variancia V ar[(Bti+1

−Bti

)2]

e posteriormente substituir na equacao

acima.

V ar[(Bti+1

−Bti

)2]

= E

[(Bti+1

−Bti

)2 − E[(Bti+1

−Bti

)2]]2

= E

[(Bti+1

−Bti

)2 − (ti+1 − ti)]2

= E[(Bti+1

−Bti

)4+ (ti+1 − ti)2 − 2 (ti+1 − ti)

(Bti+1

−Bti

)2]

= E[(Bti+1

−Bti

)4]

+ (ti+1 − ti)2 − 2 (ti+1 − ti)E[(Bti+1

−Bti

)2]

= 3 (ti+1 − ti)2 + (ti+1 − ti)2 − 2 (ti+1 − ti)2 = 2 (ti+1 − ti)2

111

Page 122: Processos Estocásticos em Finanças

a primeira parcela da penultima linha e a curtose de uma normal com media zero evariancia ti+1−ti que e igual a tres vezes a variancia ao quadrado, veja a equacao (1.13).Logo a variancia de S sera

V ar (S) =n−1∑i=0

2 (ti+1 − ti)2 =n−1∑i=0

2 (ti+1 − ti) (ti+1 − ti)

Se substituirmos (ti+1 − ti) por δ que e o maximo valor dentre todos, temos um limitesuperior para a variancia, ou seja

V ar (S) ≤n−1∑i=0

2δ (ti+1 − ti) = 2δT

E agora tomando o limite quando δ tende a zero, temos

limδ→0

= 0

Em outras palavras, mostramos que o valor esperado de S e T e que sua variancia tendea zero. O que foi demonstrado fornece o suporte para o entendimento das equacoes (3.3),(3.8) e (3.11), culminando com a regra basica 2 na equacao (3.13).

3.8.2 Condicoes de Lipshitz e Holder

Definicao 3.19. (Condicao de Lipshitz) Uma funcao f satizfaz a condicao deLipshitz sem [a, b] se existe uma constante K ≥ 0 tal que para todo x, y ∈ [a, b]

|f (x)− f (y) | ≤ K|x− y| (3.61)

Se f e continuamente diferenciavel em [a, b] entao ela atende as condicoes de Lipshitzou simplesmente e Lipshitz. Uma funcao Lipshitz em [a, b] possui variacao finita em[a, b]. O produto de duas funcoes Lipshitz e limitadas e tambem Lipshitz.

Definicao 3.20. (Condicao de Holder) Uma funcao f satisfaz a condicao de Holderde ordem p, 0 < p ≤ 1 em [a, b] se existe uma constante K > 0 positiva tal que paratodo x, y ∈ [a, b]

|f (x)− f (y) | ≤ K|x− y|p (3.62)

A condicao de Lipshitz e um caso particular de Holder quando p = 1.

112

Page 123: Processos Estocásticos em Finanças

Capıtulo 4

Modelo de Black, Merton e Scholes

A utilizacao de processos estocasticos em financas tornou-se bem sucedida a partir dosmodelos de aprecamento de Black e Scholes (1973) [9] e Merton (1973) [73]. Estes tra-balhos seminais mudaram o rumo da teoria em financas e propiciaram o surgimentode varios instrumentos financeiros que puderam ser aprecados por estes conceitos. Poroutro lado, o desenvolvimento dos mercados e instrumentos financeiros impulsionaramo desenvolvimento dos estudos em financas. No inıcio do seculo passado, Bachelier comsua tese de doutorado entitulada Theorie de la Speculation proveu as bases dos processosde difusao Markovianos introduzindo o processo Browniano na teoria de financas. Muitodepois, Samuelson (1965) [86] utilizou o processo geometrico Browniano na modelagemdos precos de acoes (Veja em Jarrow e Protter (2004) [58] um relato da aplicacao dosconceitos de calculo estocastico em financas).

Neste texto denominaremos de modelo de BMS os modelos de aprecamentos de con-tratos de opcoes Europeias desenvolvidos por Black e Scholes (1973) [9] e Merton (1973)[73]. Este capıtulo apresentara a derivacao destes modelos usando a metodologia classicade aprecamento, ou seja tal como desenvolvido por estes autores. Estes modelos definemo preco de contratos de opcoes a partir da solucao de uma equacao diferencial parcialde segunda ordem. Posteriormente, em 1979 a metodologia de aprecamento sofreu novoimpulso e o aprecamento de tais contratos passaram a utilizar o conceito da propriedademartingal. Os resultados dos aprecamentos por uma metodologia ou outra sao identicos,porem a propriedade martingal facilita os calculos. O aprecamento pela medida mar-tingal sera desenvolvido nos capıtulos seguintes.

Existem varios textos classicos que cobrem os topicos desta capıtulo. Wilmott, Howisone Dewynne (1995) [101] trata o aprecamento utilizando a abordagem classica, ou seja,atraves da solucao de equacoes diferenciais. Hull (2000) [53] e o livro texto mais usualpara o tratamento de conceitos introdutorios de derivativos em geral. McDonald (2003)[70] trata os conceitos de derivativos com este mesmo enfoque e com identico nıvel deabordagem. Shimko (1992) [93] apresenta conceitos basicos do calculo estocastico eo aprecamento atraves de EDP´s. Alem dos textos acima, acrescentamos o artigo deSmith (1976) [96] que apresenta um sumario do desenvolvimento do aprecamento deopcoes ate aquela data.

113

Page 124: Processos Estocásticos em Finanças

4.1 Conceitos basicos

Considere que o preco a vista de uma acao no instante t seja Xt. Considere tambem quea evolucao de Xt siga um processo geometrico Browniano tal qual definido no capıtulo3 ou mais apropriadamente definido pela equacao (3.17).

Definicao 4.1. (Opcao Europeia) Um contrato de uma opcao financeira do tipo Eu-ropeia fornece ao seu proprietario o direito, mas nao a obrigacao, de comprar/venderum ativo (ativo objeto ou subjacente) por um preco K (preco de exercıcio) em uma dataespecificada, T (data do vencimento).

O proprietario do contrato de opcao adquire este direito em um instante t pagandoum premio que e preco da opcao de compra ct ou da opcao de venda vt. Em t = T(data de exercıcio ou vencimento do contrato) ele ira decidir se adquire ou vende a acaopelo preco definido no contrato K (preco de exercıcio). Denominaremos o valor destecontrato no vencimento pela funcao ΛT . A opcao de compra sera vantajosa para o seuproprietario se no vencimento XT > K. A opcao de venda sera vantajosa se ocorrero inverso, K > XT . Isto significa que no vencimento (t = T ) as opcoes de comprae venda valem ΛT = (XT −K)+ e ΛT = (K −XT )+, respectivamente. A figura 4.1mostra os valores da opcao de compra para diversos valores do preco do ativo objeto nadata do vencimento. Um grafico desta natureza e denominado de diagrama de posicao.

A figura 4.2 mostra o diagrama de posicao para uma opcao de venda na data do venci-mento. Para XT > K a opcao de venda nao tem valor no vencimento. E intuitivo que

Figura 4.1: Diagrama de posicao de uma opcao de compra

em uma data anterior ao vencimento (t < T ) o valor da opcao deve ser funcao do precoda acao Xt, ou seja, pode-se escrever c (Xt, t) para a opcao de compra ou v (Xt, t) para aopcao de venda. Uma forma mais completa de retratar estas variaveis seria escreve-lasna forma c (Xt, t;K,T, σ, r) e v (Xt, t;K,T, σ, r). Por simplicidade de notacao vamos

114

Page 125: Processos Estocásticos em Finanças

Figura 4.2: Diagrama de posicao de uma opcao de venda

escreve-las de forma abreviada como c (Xt, t) e v (Xt, t), ou simplismente por ct e vt, ouainda como notacoes reduzidas da forma completa acima. Pelo fato do valor da opcao seruma funcao do preco da acao, dizemos que o contrato de opcao e um derivativo, ou seja oseu preco deriva do preco do ativo objeto ou subjacente (acao). Existem inumeros outroscontratos de derivativos como, por exemplo, os contratos futuros, forward, swaps, opcoesexoticas, etc. Oportunamente definiremos cada um destes derivativos. As metodologiasdeste e do proximo capıtulo permitirao o aprecamento de derivativos de uma formageral, entretanto neste capıtulo ficaremos restritos aos derivativos denominados opcoes.A definicao acima apresentou o conceito de opcao do tipo Europeia (c (Xt, t)). Nestetipo de opcao o seu detentor pode exercer o seu direito somente na data do vencimento.Ha tambem a opcao do tipo Americana (C (Xt, t)) em que o proprietario pode exercer oseu direito em qualquer data ate o vencimento em t = T . Diferentemente dos dois tiposanteriores, ha a opcao do tipo Bermuda em que o direito pode ser exercido em algumasdatas pre-definidas (mas nao em qualquer data) ate o vencimento. Devido ao fato deque o ganho de uma opcao e definido pelo melhor interesse de seu possuidor o seu valorsera sempre maior ou igual a zero. Assim podemos escrever

c (Xt, t) ≥ 0 C (Xt, t) ≥ 0 opcao de compra

(4.1)

v (Xt, t) ≥ 0 V (Xt, t) ≥ 0 opcao de venda

As opcoes podem ser negociadas por interesse especulativo ou por necessidade de protecaodo ativo objeto. Por exemplo se um investidor acredita que o preco de determinada acaoira aumentar nos proximos meses, pode adquirir uma opcao de compra. No vencimentose sua expectativa se confirmar estara tendo lucro. Este lucro sera tanto maior quantomaior for o preco do ativo objeto no vencimento. Se a sua expectcativa nao se confir-mar, a sua opcao nada valera no vencimento e sua perda estara limitada ao valor pagopara adquirir a opcao (premio). A contra-parte do investidor que adquire uma opcaode compra e outro investidor que lanca esta mesma opcao. A sua posicao e contraria a

115

Page 126: Processos Estocásticos em Finanças

do comprador, isto e, se a acao valorizar-se muito sua perda e ilimitada pois tera quevender a acao por um preco (preco de exercıcio) muito inferior ao preco a vista. Se opreco da acao cair, o seu lucro estara limitado o premio que recebeu quando vendeu aopcao. Inversamente, se o investidor anteve momentos de desvalorizacao da acao, podeadquirir uma opcao de venda. E novamente, em se realizando sua previsao tera lucroe este lucro sera tanto maior quanto maior for a queda do preco. Se a sua previsaoestiver errada perdera o premio que pagou pela opcao. A sua contra-parte esta em umaposicao contraria. Se o preco da acao cair, o lancador da opcao de venda tera perdassignificativas, entretanto se nao se configurar tal cenario, seu ganho estara limitado aopremio que recebeu pela venda. Neste caso os investidores estarao atuando meramentecom fins especulativos, buscando tirar proveito de uma situacao que pode acontecerou nao. Quando um investidor possui uma acao e teme perdas devido ao movimentofuturo de queda dos precos, pode proteger-se de tal situacao adquirindo uma opcao devenda. Assim a desvalorizacao de sua acao sera compensada pelo ganho que tera coma opcao. Alternativamente o investidor pode lancar uma opcao de compra e se o precoda acao cair abaixo do preco de exercıcio nao havera o exercıcio, ele ganhara o premiopela venda da opcao. Nestes casos o investidor buscou estrategias que protegessem o seuativo contra um cenario desfavoravel. E natural que a existencia do mercado de opcoescom finalidade de protecao sera tanto mais util para os investidores quanto maior for aincerteza dos precos no futuro. Em outras palavras, se o cenario de incerteza dos precosfor grande (alta volatilidade) as opcoes terao mais valor para os agentes que negociam.

Um conceito fundamental na teoria de aprecamento de contratos e o de arbitragem.Evoluiremos com este conceito no capıtulo seguinte apresentando a sua formalizacao.Por enquanto definiremos arbitragem como a operacao no mercado financeiro que per-mite ganhos sem envolver riscos de perdas. A nao possibilidade de arbitragem (ou deganhos sem riscos) nos permitira realizar o aprecamento de contratos. Usaremos semprea condicao de nao arbitragem, ou seja, nao ha lucro livre de risco a partir de estrategiastomadas no mercado. Para exemplificar, suponha que o custo de uma estrategia A deinvestimento seja IA e que o de outra estrategia B seja IB. Estas estrategias podemser tomadas no instante t. Considere que na data T as duas estrategias tem o mesmovalor. Portanto, o custo destas duas estrategias em t deve ser o mesmo, ou seja, IA = IB.

Outro conceito relevante em financas e o da taxa livre de risco. A taxa livre de risco e oretorno de um investimento em que nao ha possibilidade de perda. Uma aproximacao detal situacao sao os tıtulos emitidos por paıses desenvolvidos. O mercado considera quetais paıses honrarao suas emissoes pagando a remuneracao contratualmente acordadacom os investidores. Consideraremos que sempre exista a taxa livre de risco denominadapor r. Se uma estrategia de investimento nao oferece risco algum a sua remuneracaodeve ser a taxa livre de risco, caso contrario haveria a possibilidade de arbitragem.

Os conceitos apresentados acima permitem que encontremos uma relacao de equivalenciaentre a opcao de compra e a opcao de venda sobre o mesmo ativo com o mesmo precode exercıcio e maturidade. Esta relacao e denominada de paridade entre a opcao decompra ct e a opcao de venda vt.

Proposicao 4.1 (Paridade entre opcoes de compra e venda). Considere que (i)

116

Page 127: Processos Estocásticos em Finanças

uma acao (ativo subjacente) nao pague dividendos no perıodo [0, T ]; (ii) a taxa livrede risco seja constante neste perıodo e igual a r; (iii) que nao haja possibilidade dearbitragem. Considere tambem que em t (0 ≤ t ≤ T ) o preco a vista do ativo subjacenteseja Xt e as opcoes Europeias de compra e venda, com preco de exercıcio K e vencimentoem T , valham ct e vt, respectivamente. Entao e valida a relacao

Xt + vt = ct +Ke−r(T−t) (4.2)

Prova. Considere uma carteira (ou portfolio) em que se compre uma acao a vista, umaopcao de venda e que se venda uma opcao de compra. No tempo t esta carteira valeraXt + vt− ct. No vencimento, em t = T duas situacoes podem ocorrer: (i) XT > K e (ii)XT ≤ K. No primeiro caso a carteira valera XT + 0− (XT −K) = K. No segundo casoa carteira valera XT + (K −XT ) + 0 = K. Ou seja, no vencimento o valor da carteirasera sempre K qualquer que seja o estado da natureza. Entao na data t o valor dacarteira sera o valor na data T , que e igual a K, descontado pela taxa livre de risco noperıodo T − t, isto e, Ke−r(T−t). Caso contrario haveria a possibilidade de arbitragem.Consequentemetne podemos escrever Xt + vt − ct = Ke−r(T−t). Desta forma obtemos aequacao (4.2).

A equacao (4.2) estabelece que o valor de uma acao mais uma opcao de vendaequivale uma opcao de compra mais o valor presente do preco de exercıcio. Isto significatambem que, caso em um mercado, haja somente negociacao de opcoes de compra,pode-se construir sinteticamente uma opcao de venda de mesmo preco de exercıcio ematuridade. O inverso tambem e verdadeiro para opcoes de venda, podendo-se obtersinteticamente opcoes de compra. Observe tambem que, na demonstracao acima, naofoi feita nenhuma consideracao sobre a dinamica de Xt.

Exercıcio 4.1. Qual o valor de um portfolio, na data T , formado por uma acao (depreco Xt) e uma opcao de venda sobre esta acao com preco de exercıcio K?

4.2 Modelo de Black e Scholes

A questao natural que surge e saber qual o valor de uma opcao (compra ou venda) emum instante t < T , ou seja, precisamos aprecar o contrato de uma opcao definindo o seupreco c = f (Xt, t). Em outras palavras, qual o preco justo de um contrato deste tipo?Existe alguma modelo que permita definir este preco justo? Estas questoes estavam namente dos pesquisadores que se dedicavam muito a encontrar a resposta para o prob-lema. Por outro lado, os mercados de opcoes estavam sendo organizados e apesar dasnegociacoes destes contratos serem incipientes havia um grande interesse em modelosque pudessem expressar o preco justo. Black e Scholes (1973) [9] e Merton (1973) [73]foram os responsaveis diretos pelas formulas de aprecamento que se tornaram famosasa partir da publicacao destes artigos. Esta secao apresentara a derivacao do modelo deBlack e Scholes (1973). O modelo de Merton (1973) e uma generalizacao do modelo deBlack e Scholes (1973) e sera apresentado na secao seguinte.

Considere que o preco a vista de uma acao seja Xt. O preco de uma opcao de comprasobre esta acao e c = f (X, t), o contrato tem maturidade T e o preco de exercıcio e K.Considere tambem que as seguintes hipoteses sejam verificadas:

117

Page 128: Processos Estocásticos em Finanças

(i) a taxa livre de risco r e constante durante todo perıodo de maturacao;

(ii) a opcao de compra e do tipo Europeia;

(iii) o ativo subjacente nao paga dividendos durante a maturidade da opcao;

(iv) o ativo subjacente segue um processo geometrico Browniano, isto e, a distribuicaodos precos e lognormal;

(v) nao ha custos de transacao e impostos, os ativos sao infinitamente divisıveis e astransacoes ocorrem continuamente ao longo da vida da opcao;

(vi) a volatilidade e constante durante todo o perıodo de maturacao;

(vii) o mercado nao admite a possibilidade de arbitragem.

Muitas destas consideracoes podem ser relaxadas e ainda pode-se obter uma solucaoanalıtica para o modelo. Outras, tais como o tipo do processo estocastico seguido peloativo subjacente quando alterado, podem ter um custo adicional implicando, em geral,em solucoes numericas para o modelo.

Considere portanto o processo estocastico geometrico Browniano para o preco do ativosubjacente Xt, ou seja,

Xt = Xue(µ− 1

2σ2)(t−u)+σBt−u (4.3)

onde µ ∈ R, σ > 0 e B = (Bt, t ≥ 0) e o Browniano com a filtracao associda Ft.Vimos no capıtulo 3 que a equacao (4.3) equivale a seguinte forma diferencial, ou maisapropriadamente e a solucao da seguinte EDE (equacao diferencial estocastica)

dXt

Xt

= µdt+ σdBt (4.4)

para 0 ≤ u ≤ t < T .

O valor da opcao de compra Europeia e funcao do preco do ativo Xt = x e dotempo: c = f (x, t). No vencimento, quando t = T , o valor da opcao e o maximo entreo valor da acao e o preco de exercıcio K: c (XT , T ) = (XT −K)+ ou equivalentementec (XT , T ) = max (XT −K, 0). Na derivacao que se segue iremos omitir os subscrito“tempo” das variaveis.

Portanto, temos c = f (x, t), e usando a formula de Ito para calcular dc, temos

dc =∂c

∂xdX +

∂c

∂tdt+

1

2

∂2c

∂x2(dX)2

A equacao acima significa que a variacao do preco da opcao de compra dc em um pequenointervalo de tempo dt e dada pelo segundo membro. Substituindo dX da equacao (4.4),nesta ultima equacao, obtemos

dc =∂c

∂x(µXdt+ σXdB) +

∂c

∂tdt+

1

2σ2X2 ∂

2c

∂x2dt

dc =

(µX

∂c

∂x+∂c

∂t+

1

2σ2X2 ∂

2c

∂x2

)dt+ σX

∂c

∂xdB (4.5)

118

Page 129: Processos Estocásticos em Finanças

Esta equacao representa a dinamica de evolucao do valor da opcao de compra.

Considere a formacao de um portfolio com a compra de ∆ acoes ao preco X e avenda de uma opcao ao preco c. O valor Π deste portfolio sera

Π = ∆X − c (4.6)

O diferencial do valor do portfolio dΠ e dado por

dΠ = ∆dX − dc (4.7)

Substituindo na equacao (4.7) os valores de dX e dc das equacoes (4.4) e (4.5), respec-tivamente, obteremos

dΠ = ∆µXdt+ ∆XσdB −(µX

∂c

∂x+∂c

∂t+

1

2σ2X2 ∂

2c

∂x2

)dt− σX ∂c

∂xdB

Agrupando os termos, temos

dΠ =

(∆µS − µS ∂c

∂s− ∂c

∂t− 1

2σ2S2 ∂

2c

∂s2

)dt+

(∆σS − σS ∂c

∂s

)dB (4.8)

A equacao acima representa a dinamica de evolucao do valor do portfolio. Observe nosegundo membro a presenca da tendencia (coeficiente de dt) e a presenca do termo es-tocastico (coeficiente de dB) que confere a aleatoriedade a dΠ.

Para eliminar esta aleatoriedade do valor do portfolio deve-se fazer o coeficiente dedB nulo na equacao (4.8), isto e

∆Xσ − σX ∂c

∂x= 0

∆ =∂c

∂x(4.9)

Levando o resultado de ∆, encontrado acima, na equacao (4.8), temos

dΠ =

(µX

∂c

∂x− µX ∂c

∂x− ∂c

∂t− 1

2σ2X2 ∂

2c

∂x2

)dt

dΠ =

(−∂c∂t− 1

2σ2X2 ∂

2c

∂x2

)dt (4.10)

Ajustando a quantidade de acoes ∆ do portfolio neste valor (∆ = ∂c∂x

), vimos acimaque o portfolio torna-se sem risco. Por outro lado um ativo livre de risco deve retornara taxa livre de risco para que nao haja possibilidade de arbitragem, como foi supostoacima. Entao o retorno deste portfolio dΠ

Πdeve ser rdt, ou seja

Π= rdt⇒ dΠ = rΠdt (4.11)

Substituindo as equacoes (4.10) e (4.6) na equacao (4.11), obteremos(−∂c∂t− 1

2σ2X2 ∂

2c

∂x2

)dt = r (∆X − c) dt

119

Page 130: Processos Estocásticos em Finanças

Resultando na seguinte equacao diferencial parcial (EDP)

∂c

∂t+ rX

∂c

∂x+

1

2σ2X2 ∂

2c

∂x2= rc (4.12)

Esta e a equacao diferencial parcial do modelo de Black e Scholes (1973). Podemosainda escreve-la na forma abreviada onde os subscritos indicam as derivadas parciais

ct (x, t) + rScx (x, t) +1

2σ2X2cxx (x, t) = rc (x, t) (4.13)

As condicoes de contorno necessitam ser estabelecidas para que se proceda a sua solucao.Note que se o preco da acao Xt atinge zero a equacao (4.3) mostra que o valor per-manecera em zero e consequentemente a opcao nada valera. Para sermos consistentecom a transformacao logarıtimica que sera utilizada na solucao, usaremos apenas o fatode que Xt → 0. Temos entao que

limx→0

c (x, t) = 0 (4.14)

Se o preco da acao Xt atingir um valor muito elevado o preco da opcao sera poucoafetado pelo preco de exercıcio (que se tornara pequeno em relacao ao preco do ativo) enaturalmente o valor da opcao tendera ao preco da acao, ou seja

limx→∞

c (x, t) = x (4.15)

No vencimento quando t = T , tem-se a condicao terminal, c (XT , T ) = (XT −K)+.Entretanto vemos que em t = T o termo d1 abaixo nao esta definindo. Escreve-se entaoque

limt→T

c (x, t) = (XT −K)+ (4.16)

A EDP (4.12) e do tipo parabolica e e redutıvel a forma classica da equacao de difusaodo calor. A sua solucao fornece o preco da opcao de compra

c (Xt, t) = XtN (d1)−Ke−r(T−t)N (d2) 0 ≤ t < T x > 0 (4.17)

onde

d1 =ln(XtK

)+(r + 1

2σ2)

(T − t)σ√T − t

d2 = d1 − σ√T − t

e N (.) representa a distribuicao normal padrao acumulada, isto e

N (Z) =1√2π

∫ Z

−∞e−

12y2

dy

O Apendice deste capıtulo e dedicado a resolucao da EDP (4.12) juntamente com ascondicoes em (4.14) - (4.16).

Ressaltamos que a estrategia de manter o portfolio continuamente ajustado com ∆(∆ = ∂c

∂X) acoes para cada opcao, levara o portfolio a ter igual valor que preco da opcao

no vencimento (Λ (T )).

Exemplo 4.1. Vimos na demonstracao que a condicao para que o portfolio seja semrisco e que ∆ = ∂c

∂X. Diferencie a equacao (4.17) em relacao a X para demonstrar que

∆ = N (d1).

120

Page 131: Processos Estocásticos em Finanças

Solucao: Para simplificar a notacao vamos considerar τ = T − t (τ significa o temporemanescente para o vencimento) e abolir o subındice do tempo, entao as equacoes acimatornam-se

c = XN (d1)−Ke−rτN (d2) (4.18)

onde

d1 =ln(XK

)+ (r + 0.5σ2) τ

σ√τ

d2 = d1 − σ√τ

Diferenciando a equacao (4.18), temos:

∆ =∂c

∂x= N (d1) +XN ′ (d1)

∂d1

∂X−Ke−rτN ′ (d2)

∂d2

∂X(4.19)

Por outro lado podemos escrever que

lnX − d21

2= lnX − 1

2

[ln(XK

)+(r + 1

2σ2)τ

σ√τ

]2

= lnX − 1

2σ2τ

[ln

(X

K

)+

(r +

1

2σ2

]2

Trabalhando o segundo membro da equacao acima temos

1

2σ2τ

2σ2τ lnX −

[(ln

(X

K

)+ rτ

)2

+ σ2τ

(ln

(X

K

)+ rτ

)+

1

4σ4τ 2

]

Agrupando os termos similares, o segundo membro fica igual a

− 1

2σ2τ

[ln

(X

K

)+ rτ

]2

+1

2σ4τ 2 + σ2τ (− lnX − lnK + rτ)

Logo temos que

lnX − d21

2= − 1

2σ2τ

[ln

(X

K

)+ rτ

]2

+1

2σ4τ 2 + σ2τ (− lnX − lnK + rτ)

(4.20)

Tambem pode-se escrever que

lnK − rτ − d22

2= lnK − rτ − 1

2

[ln(XK

)+(r − 1

2σ2)τ

σ√τ

]2

Trabalhando como previamente o segundo membro da equacao anterior chega-se ao re-sultado abaixo

lnK − rτ − d22

2

= − 1

2σ2τ

[ln

(X

K

)+ rτ

]2

+1

4σ4τ 2 + σ2τ (− lnX − lnK + rτ)

(4.21)

121

Page 132: Processos Estocásticos em Finanças

As equacoes (4.20) e (4.21) sao iguais, isto permite que se escreva

lnX − d21

2= lnK − rτ − d2

2

2

Exponenciando ambos os lados da equacao anterior, escreve-se

X exp

(−d

21

2

)= Ke−rτe−

d222

Temos ainda que N ′ (z) = 12√πe−

z2

2 e a equacao anterior fica

XN ′ (d1) = Ke−rτN ′ (d2) (4.22)

Ainda pode-se escrever que ∂d1

∂X= 1

Xσ√τ

e ∂d2

∂X= 1

Xσ√τ, consequentemente ∂d1

∂X= ∂d2

∂X.

Este ultimo resultado levado na equacao (4.22) fornece

XN ′ (d1)∂d1

∂X= Ke−rτN ′ (d2)

∂d2

∂X(4.23)

A equacao (4.23) levada na equacao (4.19), resulta finalmente, no resultado ∆ = N (d1).

Adotando as mesmas etapas anteriores pode-se deduzir a EDP para uma opcao devenda (veja exercıcio 4.4) obtendo-se

∂v

∂t+ rX

∂v

∂x+

1

2σ2X2 ∂

2v

∂x2= rv (4.24)

A equacao que fornece o aprecamento de uma opcao de venda pode ser obtida pelasubstituicao da equacao (4.17) na equacao (4.2), que estabelece a paridade entre opcoesde compra e venda. Resolvida esta equacao obtem-se

v (Xt, t) = Ke−r(T−t)N (−d2)−XtN (−d1) (4.25)

As condicoes de contorno tambem podem ser obtidas a partir da relacao de paridade.Assim, se Xt tende para zero a opcao de compra tambem tende para zero e consequente-mente tem-se

limx→0

(x, t) = Ke−r(T−t) (4.26)

Se Xt atinge valores muito elevados a opcao de venda nada vale e tem-se

limx→∞

v (x, t) = 0 (4.27)

A condicao terminal, ja vista, fornece v (xT , T ) = (K −X)+. Pela mesma restricao emrelacao a definicao de d1, escrevemos

limt→T

v (x, t) = (K −X)+ (4.28)

122

Page 133: Processos Estocásticos em Finanças

Exercıcio 4.2. Faca X → 0+ na equacao (4.17) e verifique a condicao de contornoc (0, t) = 0 para t ∈ [0, T ].

Exercıcio 4.3. Faca X → ∞ na equacao (4.17) e verifique a condicao de contornoem (4.15) atraves do limx→∞ c (x, t)−X +Ke−r(T−t) = 0 para t ∈ [0, T ].

Exercıcio 4.4. Siga os mesmos passos utilizados na deducao da EDP (4.12) referente aopcao de compra, para obter a EDP referente a opcao de venda dada pela equacao (4.24).

Exercıcio 4.5. Mostre que o ∆ oriundo da deducao feita no exercıcio 4.4 e igual aN (d1)− 1.

Figura 4.3: Opcao de compra para K = 7, r = 5% e σ = 25%

Figura 4.4: Opcao de venda para K = 7, r = 5% e σ = 25%

123

Page 134: Processos Estocásticos em Finanças

As equacoes (4.17) e (4.25) fornecem os precos das opcoes Europeias de compra evenda, respectivamente para diferentes instantes de tempo antes do vencimento, emfuncao do preco do ativo subjacente dados os parametros da taxa livre de risco, volatil-idade, e preco de exercıcio.

Black e Scholes (1973) ressaltam que o modelo de equilıbrio pode ser usado para valorarmuitos problemas de aprecamento de ativos contingentes. Por exemplo, na valoracaodo capital proprio de uma firma alavancada a posicao dos acionistas equivale ao docomprador de uma opcao de compra e a dos credores equivale ao do vendedor destaopcao. Isto e, os acionistas tem o direito de comprar a firma novamente dos credorespagando-lhes o valor de face da dıvida.

A figura 4.3 mostra o grafico de uma opcao de compra para diferentes instantes antes dovencimento e para a data do vencimento. Em outras palavras, apresentamos os graficosdos precos para τ = 0, τ = 1, τ = 1.5 e τ = 2. Observe que as condicoes de contornosao atendidas para os precos tendendo a zero e ao infinito. A figura 4.4 mostra o casosimilar para o opcao de venda considerando os mesmos valores de τ .

4.3 Modelo de Merton

A secao anterior apresentou os detalhes da derivacao do modelo de Black e Scholes(1973). Logo apos a sua publicacao, Robert C. Merton publicou seu artigo que, damesma forma, aborda o aprecamento de uma opcao Europeia, porem com um trata-mento estocatisco para o comportamento da taxa de juros. Esta secao apresenta osdetalhes da derivacao do modelo de Merton (1973) [73]. Alem de relaxar a hipostese docomportamento da taxa de juros, Merton (1973) considera que o ativo subjacente pagadividendos. Esta consideracao sera feita no proximo capıtulo. Essencialmente trata-sedo mesmo problema e ao longo deste texto nos referiremos ao modelo de Black, Mertone Scholes - BMS (em ordem alfabetica) expressando indistintamente os resultados dasecao 4.2 e 4.3.

Seja c (St, Xt, t) o preco de uma opcao de compra Europeia, com preco de exercıcioK, no instante t. Considere que 0 ≤ t ≤ T e que, como anteriormente, τ = T − t e otempo remanescente para o vencimento. St representa o preco da acao no instante t eXt representa o preco de um tıtulo da letra do tesouro. Novamente a dinamica do precoda acao St (que nao paga dividendos) e dada pelo processo geometrico Browniano.

dStSt

= µSdt+ σSdBSt , t ≥ 0 (4.29)

onde as consideracoes sobre os parametros sao as mesmas ja apresentadas na secao an-terior.

Considere que as letras do tesouro Xt possuem a dinamica definida pelo mesmo processoe dado por

dXt

Xt

= µXtdt+ σXtdBXt , t ≥ 0 (4.30)

124

Page 135: Processos Estocásticos em Finanças

onde os parametros de tendencia (drift) e volatilidade sao dependentes do tempo. Xt

representa o preco de um tıtulo sem risco de credito que no vencimento T = t, para$1, ou seja, XT = 1 e nesta condicao σXT = 0. O caso especial em que a taxa de jurosnao e estocastica e constante ao longo do vencimento resulta em σXt = 0 e µXt = r,consequentemente Pt = e−r(T−t). O problema, neste caso, resume-se aquele estudadopor Black e Scholes (1973). As incertezas dos dois processos estao correlacionadas talque dBStdBXt = ρdt.

Para tornar a notacao menos onerosa abandonaremos o subscrito do tempo, entao es-crevemos c (S,X, t). Usando a formula de Ito podemos escrever

dc =∂c

∂sdS +

∂c

∂xdX +

∂c

∂tdt+

1

2

∂2c

∂s2(dS)2 +

∂2

∂s∂xdSdX +

1

2

∂2c

∂x2(dX)2

Inserindo na equacao acima as definicoes de dS e dX das equacoes (4.29) e (4.30), temos

dc = (µSSdt+ σSSdBS)∂c

∂s+ (µXXdt+ σXXdBX)

∂c

∂x+∂c

∂tdt

+1

2σ2SS

2 ∂2c

∂s2dt+ ρσSσXSX

∂2c

∂s∂xdt+

1

2σ2XX

2 ∂2c

∂x2dt

Reagrupando os termos da equacao acima, resulta em

dc =

(µSS

∂c

∂s+ µXX

∂c

∂x+∂c

∂t+

1

2σ2SS

2 ∂2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2

)dt

+ σSS∂c

∂sdBS + σXX

∂c

∂xdBX

Podemos simplificadamente escrever que

dc

c= βdt+ γdBS + ηdBX (4.31)

onde:

β =1

c

(µSS

∂c

∂s+ µXX

∂c

∂x+∂c

∂t+

1

2σ2SS

2 ∂2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2

)

γ =1

c

(σSS

∂c

∂s

)e η =

1

c

(σXX

∂c

∂x

)Considere agora um portfolio de valor Y com a seguinte composicao: WS e o montanteinvestido na acao, WX e o montante investido na letra do tesouro e Wc o montanteinvestido na opcao de compra. O total do investimento agregado e nulo e escrevemos

Y = WS +Wc +WX = 0 (4.32)

Considere que dY e o retorno do portfolio em moeda, entao temos que

dY = WSdS

S+Wc

dc

c+WX

dX

X

125

Page 136: Processos Estocásticos em Finanças

Fazendo uso da equacao (4.32), escrevemos

dY = WSdS

S+Wc

dc

c− (WS +Wc)

dX

X

Usando as equacoes (4.29), (4.30) e (4.31), temos

dY = WS (µSdt+ σSdBS) +Wc (βdt+ γdBS + ηdBX)− (WS +Wc) (µXdt+ σXdBX)

= [WS (µS − µX) +Wc (β − µX)] dt+ (σSWS + γWc) dBS

+ [ηWc − σX (WS +Wc)] dBX

A condicao de que o portfolio formado nao seja estocastico requer que os coeficientes dedBS e dBX sejam nulos. Por outro lado, o investimento inicial no portfolio e zero (con-forme a equacao (4.32)) e portanto para que seja atendida a condicao de nao arbitragemo retorno em moeda do portfolio deve ser nulo (dY = 0). Estas condicoes permitemescrever que

σSWS + γWc = 0

−σXWS + (η − σX)Wc = 0 (4.33)

(µS − µX)WS + (β − µX)Wc = 0

As equacoes acima resolvidas para WS e Wc requerem para a solucao nao trivial que

−WS

Wc

σS=σX − ησX

=β − µXµS − µX

(4.34)

A igualdade γσS

= 1− ησX

resulta que

1

c

(S∂c

∂s

)= 1− 1

c

(X∂c

∂x

)ou ainda

c = S∂c

∂s+X

∂c

∂x(4.35)

A outra igualdade de (4.34) e β − µX = γσS

(µS − µX) e resulta, usando as respectivasdefinicoes, em

1

c

(µSS

∂c

∂s+ µXX

∂c

∂x+∂c

∂t+

1

2σ2S2 ∂

2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2

)− µX

=1

cS∂c

∂s(µS − µX)

Trabalhando algebricamente a equacao acima, resulta em

1

2σ2SS

2 ∂2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2+ µXS

∂c

∂s+ µXX

∂c

∂x+∂c

∂t= µXc (4.36)

ou ainda usando o resultado em (4.35) no segundo membro da equacao anterior

1

2σ2SS

2 ∂2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2+ µXS

∂c

∂s+ µXX

∂c

∂x+∂c

∂t

= µX

(S∂c

∂s+X

∂c

∂x

)

126

Page 137: Processos Estocásticos em Finanças

Finalmente simplificando os termos de primeira ordem comuns do primeiro e segundomembro, ficamos com

1

2σ2SS

2 ∂2c

∂s2+ ρσSσXSX

∂2c

∂s∂x+

1

2σ2XX

2 ∂2c

∂x2+∂c

∂t= 0 (4.37)

Note que a equacao (4.36) e a mesma equacao de Black e Scholes (1973). Para verificar-mos este fato basta considerarmos a taxa de juros determinıstica e constante no tempo,isto e, µX = r e σX = 0 com dX

X= rdt ou X = e−r(T−t). Introduzindo estas alteracoes

em (4.36) obtemos a equacao (4.12).

O modelo de Merton (1973) e uma generalizacao do modelo de Black e Scholes (1973),que ao contrario deste ultimo, considera a taxa de juros estocastica. A EDP (4.36)juntamente com a condicao terminal c (ST , 1, T ) = (ST −K)+ e a condicao de contornoc (0, Xt, t) = 0 definem o preco de uma opcao de compra Europeia.

4.4 Modelo de Margrabe

Margrabe (1978) analisou a opcao de troca de uma acao por outra dentro das condicoesestabelecidas para os modelos anteriores. Seja entao X1t e X2t o preco de duas acoes,que nao pagam dividendos, com as mesmas dinamicas anteriores, entao escrevemos

dXit

Xit

= µidt+ σidBit t ≥ 0 i = (1, 2) (4.38)

onde µi ∈ R, σi ∈ R+, ρdt = dB1tdB2t e 0 ≤ t ≤ T .

Seja h (X1t , X2t , t) a opcao Europeia de troca de um ativo por outro com vencimentoem t = T . O valor da opcao nesta data sera h (X1T , X2T , T ) = X1T − X2T . Como an-teriormente, para tornar a notacao mais simples, abandonaremos o subscrito do tempo.Esta opcao e simultaneamente uma opcao de compra do ativo 1 (ativo subjacente) compreco de exercıcio X2T e uma opcao de venda do ativo 2 (ativo subjacente) com precode exercıcio X1T . Nesta situacao, o dono desta opcao somente exercera o seu direito emt = T quando for conveniente, ou seja

h (X1, X2, T ) = (X1 −X2)+ (4.39)

Sendo h (X1, X2, t) podemos usar a formula de Ito e definir o valor de pequenas variacoesdo preco da opcao dh

dh =∂h

∂x1

dX1 +∂h

∂x2

dX2 +∂h

∂tdt+

∂2h

∂x21

(dX1)2 +∂2h

∂x22

(dX2)2 +∂2h

∂x1∂x2

(dX1) (dX2)

Substituindo as dinamicas dos dois ativos, temos

dh =∂h

∂x1

(µ1X1dt+ σ1X1dB1) +∂h

∂x2

(µ2X2dt+ σ2X2dB2) +∂h

∂tdt

+1

2σ2

1X21

∂2h

∂x21

dt+1

2σ2

2X22

∂2h

∂x22

dt+ ρσ1σ2X1X2∂2h

∂x1∂x2

dt

127

Page 138: Processos Estocásticos em Finanças

Coletando os termos em dt, ficamos com

dh =

[µ1X1

∂h

∂x1

+ µ2X2∂h

∂x2

+∂h

∂t+

1

2σ2

1X21

∂2h

∂x21

+1

2σ2

2X22

∂2h

∂x22

+ ρσ1σ2X1X2∂2h

∂x1∂x2

]dt

+∂h

∂x1

σ1X1dB1 +∂h

∂x2

σ2X2dB2 (4.40)

Vamos considerar um portfolio em que compramos uma opcao h, vendemos δ1 acoes aopreco X1 e δ2 acoes ao preco X2. As quantidades δ1 e δ2 sao escolhidas tal que o valordo portfolio e zero

Π = h− δ1X1 − δ2X2

A variacao do valor do porftolio dΠ em um pequeno intervalo de tempo dt e dada por

dΠ = dh− δ1dX1 − δ2dX2 (4.41)

Levando a equacao (4.40) e (4.38) em (4.41) e trabalhando algebricamente, temos

dΠ = Λdt+

(∂h

∂x1

σ1X1 − δ1σ1X1

)dB1 +

(∂h

∂x2

σ2X2 − δ2σ2X2

)dB2

onde

Λ = µ1X1∂h

∂x1

+ µ2X2∂h

∂x2

+∂h

∂t+

1

2σ2

1X21

∂2h

∂x21

+1

2σ2

2X22

∂2h

∂x22

+ ρσ1σ2X1X2∂2h

∂x1∂x2

− δ1µ1X1 − δ2µ2X2

Para que o portfolio seja sem risco devemos ter simultaneamente δ1 = ∂h∂x1

e δ2 = ∂h∂x2

.Levando estes valores na equacao anterior, temos

dΠ =∂h

∂t+

1

2σ2

1X21

∂2h

∂x21

+1

2σ2

2X22

∂2h

∂x22

+ ρσ1σ2X1X2∂2h

∂x1∂x2

Como o valor do portfolio e nulo, o diferencial dΠ tambem sera, caso contrario haveriapossibilidade de arbitragem. Entao temos como resultado

∂h

∂t+

1

2σ2

1X21

∂2h

∂x21

+1

2σ2

2X22

∂2h

∂x22

+ ρσ1σ2X1X2∂2h

∂x1∂x2

= 0 (4.42)

A solucao da equacao desta EDP e dada por

h (X1t , X2t , t) = X1tN (d1)−X2tN (d2) (4.43)

onde:

d1 =ln(X1t

X2t

)+ 1

2σ2 (T − t)

σ√T − t

d2 = d1 − σ√T − t

σ2 = σ21 + σ2

2 − 2ρσ1σ2

A solucao da EDP (4.42), apresentada em (4.43), sera formalizada ao longo do textoquando tratarmos da mudanca de numerario.

128

Page 139: Processos Estocásticos em Finanças

4.5 Gregas

A deducao da EDP de aprecamento de uma opcao de compra faz uso da condicao deque o risco do portfolio, formado pela compra de ∆ acoes e venda de uma opcao, eeliminado. Para tal, o valor que ∆ assume deve ser igual a ∂c

∂X. Neste caso, em que o

portfolio nao envolve risco, dizemos que se trata de uma posicao delta-neutra. Entao,por inexistencia de arbitragem, tal portfolio deve ser remunerado pela taxa livre derisco. Como o preco do ativo subjacente altera a todo instante, o valor de ∆ deve ser,da mesma forma, ajustado para que o portfolio mantenha a situacao de neutralidade.Este tipo de posicionamento, em que periodicamente deve-se ajustar (ou rebalancear) asquantidades dos ativos na carteira, e chamado de protecao dinamica (hedge dinamico).

Convencionou-se denominar de gregras as sensiblidades de ct em relacao as variaveisdo modelo. A sensibilidade mais relevante e exatamente em relacao ao preco do ativosubjacente: ∆ = ∂c

∂X= N (d1). Ela mede o quanto varia o preco da opcao para $1 de

variacao no ativo subjacente. O comportamento do preco de uma opcao nao e linear como preco do ativo subjacente. Isto significa que o ∆ varia com o preco S. A sensibilidadeda variacao de ∆ como o preco do ativo e denominado de gama: Γ = ∂∆

∂X= ∂2c

∂X2 . O gamarepresenta a variacao do delta para alteracoes de $1 no preco do ativo. A sensibilidadedo preco da opcao em relacao a volatilidade e denominada vega: V ega = ∂c

∂σ. Representa

a variacao do preco da opcao para alteracao de 0.01 (1%) na volatildade. Em geral opreco da opcao decresce a medida que se aproxima o vencimento. A sensibilidade dopreco da opcao em relacao ao tempo e denominado de teta: Θ = ∂c

∂t. A sensibilidade em

relacao a taxa livre de risco r e denominada de ro: ρ = ∂c∂r

. Pode-se derivar analitica-mente as expressoes para cada uma das gregas a exemplo do que foi feito para o delta∆ da opcao de compra. O exercıcio seguinte solicita estas derivacoes.

Exercıcio 4.6. Demonstre as expressoes analıticas para as gregas de uma opcao decompra de acordo com as definicoes desta secao:

(i) Γ =∂∆

∂X=N ′ (d1)

Xσ√τ

(4.44)

(ii) V ega =∂c

∂σ= XN ′ (d1)

√τ (4.45)

(iii) Θ =∂c

∂t= −1

2

σXN ′ (d1)√τ

− rKe−rτN (d2) (4.46)

(iv) ρ =∂c

∂r= τKe−rτN (d2) (4.47)

Exercıcio 4.7. Repita o exercıcio anterior para uma opcao de venda Europeia.

Exercıcio 4.8. Considere um portfolio Π formado pela compra de ∆ acoes e a venda deuma opcao. Faca este portfolio delta-neutro, em particular considere que ∆ = 0. Mostreque 1

2σ2X2Γ = rc−Θ.

Exercıcio 4.9. Na situacao do exercıcio 4.8 mostre que Π = Ke−r(T−t)N (d2).

Exercıcio 4.10. Mostre que a variacao percentual do preco de uma opcao de compra emaior que a variacao percentual do preco da acao, dc

c> dX

X.

129

Page 140: Processos Estocásticos em Finanças

4.6 Volatilidade implıcita

Anteriormente foi visto que o calculo do preco de uma opcao Europeia em um instante te funcao do valor da acao em t, do preco de exercıcio K, do tempo remanescente para ovencimento τ = T − t, da taxa livre de risco r e da volatilidade σ. Todas estas variaveissao facilmente observaveis, exceto a volatilidade que nao e observada diretamente. Por-tanto a volatilidade deve ser estimada. A figura 4.5 mostra o comportamento do Vegada opcao para diferentes instantes antes do vencimento. Devido a relacao de paridadee facil concluir que os Vegas de uma opcao de compra e venda sao os mesmos (vejaequacao (4.2) e exercıcios 4.6 e 4.7). Pode-se notar que o preco de uma opcao e bastantesensıvel a volatilidade, principalmente quando o preco esta proximo de K (a opcao estano dinheiro). Desta forma, justifica-se a importancia de uma estimacao acurada paravolatilidade no aprecamento de opcoes.

Uma maneira simples e estimar a volatilidade historica a partir da serie de log-retornos.

Figura 4.5: Comportamento do Vega com o preco do ativo (K = 7, r = 5% e σ = 25%)

Por outro lado, vemos que o Vega e estritamente positivo. Sempre que uma funcao eestritamente monotona em relacao a uma variavel podemos inverte-la nesta variavel.Assim, com base no modelo de BMS e usando as cotacoes das opcoes fornecidas pelomercado, podemos obter a volatilidade. Neste caso a volatilidade e denominada volatil-idade implıcita. Em suma, a patir do modelo de BMS pode-se extrair a volatilidade apartir dos precos das opcoes, pois ha uma relacao biunıvoca entre o preco da opcao e avolatilidade. A relacao biunıvoca entre o preco da opcao e a volatilidade implıcita temimportantes implicacoes praticas. O mercado e indiferente entre negociar opcoes combase nas suas cotacoes de precos ou com base nas volatilidades implıcitas calculadas pelomodelo de BMS e visualizada pelos agentes negociadores simultaneamente aos precos.

Se calcularmos volatilidade implıcita para diferentes precos de exercıcios com mesmamaturidade (e as demais variaveis constantes), observaremos que o valor da volatilidadenao e o mesmo. Ou seja, σ (K1, Xt, r, τ, c1) 6= σ (K2, Xt, r, τ, c2) onde c1 e c2 sao as

130

Page 141: Processos Estocásticos em Finanças

cotacoes das opcoes para os precos de exercıcios K1 e K2, respectivamente. Isto sig-nifica que empiricamente nao se observa aquilo que o modelo de BMS preve. Uma dasrazoes para este comportamento e a hipotese do modelo que assume que volatilidadee constante durante todo o perıodo ate o vencimento. De fato, o comportamento davolatilidade esta muito distante desta consideracao. No capıtulo 2 foi visto que um fatoestilizado das series financeiras e a presenca de aglomerados de volatilidade. Isto sig-nifica que ha momentos em que a volatilidade permanece mais elevada e ha outros emque e mais baixa. Ha diversos modelos econometricos que buscam modelar a volatilidadecapturando este e outros fatos estilizados. Os mais conhecidos e muito usuais na liter-atura econometrica sao os modelos da famılia GARCH. Veja a secao 2.6 onde tratamosos modelos GARCH lineares e nao lineares. Por exemplo, a consideracao da volatilidadevariando no tempo acarreta um comportamento da distribuicao de retornos distintodaquele do modelo de BMS. Por este ultimo, a distribuicao dos retornos e normal (ob-serve o lado direito da equacao (4.4)). Entretanto a distribuicao empırica dos retornospossui caudas mais pesadas que a normal. Os modelos que consideram a volatilidadevariando no tempo buscam capturar o efeito destas caudas pesadas. Os modelos queincluem a componente de salto na dinamica do preco do ativo tambem reproduzem bemeste efeito. Em particular o modelo de Heston (1993) [51] busca retratar o comporta-mento incerto da volatilidade modeladando-a como estocastica. Isto e, a volatilidade etratada por um processo estocastico, constituindo o que se denomina na literatura definancas de modelo de dois fatores (ou dois fatores estocasticos: um para os precos eoutro para a volatilidade). Este modelo tem uma solucao semi-analıtica baseada emintegrais que podem ser resolvidas numericamente. A maior dificuldade de lidar comeste modelo e a sua calibracao (ou estimacao dos parametros do modelo). Todas estasconsideracoes de volatilidade variando no tempo buscam explicar este interessante com-portamento da volatilidade implıcita extraıda do modelo de BMS, que e denominadovolatilidade smiles.

O modelo de BMS considera que a distribuicao dos retornos e normal. Entretantoos dados empıricos mostram que esta distribuicao tem excesso de curtose. Quando, porexemplo, o preco de exercıcio e muito alto e a opcao de compra esta fora do dinheiro, aprobabilidade de seu exercıcio e pequena. Mas a distribuicao empırica (com caudas pe-sadas) fornecera uma probabilidade de exercıcio mais elevada que aquela da distribuicaonormal. Esta maior probabilidade implicara em um maior preco para a opcao e conse-quentemente uma volatilidade implıcita (calculada por BMS) maior que a real. Vejamosagora o que ocorre para uma opcao de venda fora do dinheiro (preco de exercıcio e muitobaixo). Novamente devido ao excesso de curtose a probabilidade de exercıcio oriundada distribuicao empırica sera maior que a da distribuicao normal. Decorre que o precocalculado para a opcao deve ser maior que aquele previsto pelo modelo de BMS. Se us-armos este modelo para o calculo da volatilidade implıcita, obteremos uma volatilidademais elevada que a volatilidade real.

Portanto, calculando a volatilidade implıcita atraves do modelo de BMS o seu com-portamento sera tipicamente aquele retratado na figura 4.6. Neste grafico vemos quea volatilidade e maior nas regioes onde o preco de exercıcio e mais elevado e tambemmais baixo. Este grafico e conhecido como volatilidade smile ou smirk dependendo do

131

Page 142: Processos Estocásticos em Finanças

formato da curva. Ha evidencias que este comportamento antes do crash de 1987 erasimetrico, daı o nome smile. Apos o crash o comportamento da volatilidade implıcita emais adequadamente representado pelo grafico da figura 4.6. Justifica-se tal mudancadevido ao aumento da aversao ao risco dos investidores que passaram a demandar maiorretorno face a queda dos precos. Se tal comportamento ira modificar-se (ou mostrar-semais pronunciado) devido a crise de 2008 ainda e um fato nao identificado empirica-mente, porem qualquer alteracao certamente sera motivo de publicacoes academicas.

O comportamento assimetrico (skew) da volatilidade reflete um fato estilizado que omodelo de BMS nao captura adequadamente. Este efeito assimetrico tambem e con-hecido como efeito alavanca e e devido a Black (1976) [8]. Veja na secao 2.6.2 a suaexplicacao. Em suma, o efeito alavanca retrata o fenomeno de que a volatilidade e maiorpara choques negativos nos precos. Isto significa que para dois choques (de mesma mag-nitude) um positivo e outro negativo (queda nos precos), a volatilidade subsequentesera maior no segundo caso. Em outras palavras, para situacoes de queda de precosa percepcao de risco dos agentes torna-se mais aguda e consequentemente os mesmosdemandarao maiores retornos, justificando assim a assimetria mostrada na figura 4.6.

Dentro deste mesmo enfoque podemos estimar a densidade implıcita, ou neutra ao risco,a partir dos precos das opcoes para diferentes precos de exercıcio. Este resultado e devidoa Breeden e Litzenberger (1978) [14], voltaremos e este topico o capıtulo 6.

Figura 4.6: Volatilidade implıcita - grafico smirk

4.7 Resumo e consideracoes adicionais

Este capıtulo foi dedicado ao desenvolvimento do modelo de Black, Merton e Scholestal qual foi originalmente apresentado em 1973, que convencionamos denominar demetodologia de aprecamento pela abordagem classica. Primeiramente apresentamoso conceito basico de nao arbitragem. Esta consideracao e fundamental no aprecamento

132

Page 143: Processos Estocásticos em Finanças

de derivativos financeiros seja pela metodologia classica seja pela consideracao da pro-priedade martingal. Voltaremos a este ponto no capıtulo seguinte. Em seguida fizemosa primeira aplicacao deste conceito mostrando a paridade entre as opcoes de compra evenda do tipo Europeia. A paridade de opcoes e um exemplo classico de uma protecaoestatica (hedge estatico). Isto significa que toma-se a posicao de compra de uma acaoe de uma opcao de venda e a posicao de venda de uma opcao de compra; o portfolioassim permance sem risco, o seu valor e Ke−r(T−t) e altera-se tao somente pelo decorrerdo tempo.

Fizemos entao a derivacao do modelo de Black e Scholes (1973). A metodologia classicaconsidera a derivacao deste modelo a partir da formacao de um portfolio com posicaocomprada em ∆ acoes e posicao lancadora em uma opcao de compra. O risco desteportfolio e eliminado fazendo ∆ = ∂c

∂X. Esta e uma protecao dinamica (hedge dinamico).

Isto significa que o portfolio deve ser rebalanceado sempre que houver alguma alteracaoem X (consequentemente tambem c alterara). Se nao ha risco no portfolio ele deve serremunerado pela taxa livre de risco para satisfazer a condicao de nao arbitragem nomercado. Obtem-se desta forma a EDP

∂c

∂t+ rX

∂c

∂x+

1

2σ2X2 ∂

2c

∂x2= rc

Esta EDP e do tipo parabolico e pode ser reduzida, por transformacao de variaveis, naclassica EDP da difusao do calor, cuja solucao e bem conhecida, dadas as condicoes decontorno.

Fizemos em seguida a derivacao do modelo de Merton (1973) que considera a esto-casticidade da taxa de juros. Derivamos tambem o modelo de Margrabe (1978) quetrata da opcao de troca entre dois ativos com risco, dentro da mesma abordagem dosmodelos anteriores.

Mostramos as analises de sensiblidades do valor da opcao em relacao as variaveis en-volvidas, o que na literatura e conhecido por Gregas. Posteriormente apresentamos oconceito de volatilidade implıcita e algumas limitacoes do modelo de BMS. A dinamicado ativo subjacente no modelo de BMS considera que a volatilidade e constante durantetodo o perıodo do vencimento (veja a equacao (4.4)) sendo a distribuicao dos precos log-normal e a de retornos normal. Empiricamente este fato nao e observado e a distribuicaodos retornos possue excesso de curtose. Modelos alternativos para a evolucao dos precospodem ser usados para modelar as caudas pesadas. Por exemplo, considera-se comoprocesso de precos aqueles com volatilidade variando no tempo (volatilidade GARCHou volatilidade estocastica) ou ainda processos que contem uma componente adicionalrepresentando a presenca de saltos. Trataremos dos processos com saltos em capıtulosposteriores.

Finalmente apresentamos, no Apendice abaixo, todos os detalhes da solucao da EDP domodelo de BMS usando a solucao da equacao do calor. Da mesma forma, a equacao docalor foi resolvida usando a transformada de Fourier. Procuramos evidenciar todas asetapas envolvidas na solucao do problema e separamos o desenvolvimento das mesmasem subsecoes por razoes didaticas. Reconhecemos que para enfrentar esta parte do texto

133

Page 144: Processos Estocásticos em Finanças

e necessario coragem, nao obstante entendemos que e um esforco valido.

O leitor deve ter observado a enfase deste texto nos fundamentos das metodologias deaprecamento. Reservamos para tal este e os dois proximos capıtulos. Estas metodolo-gias constituem a essencia da moderna teoria de financas e sao fundamentais parao aprecamento de derivativos, de forma geral. Como ressalta Duffie (2001) [28], oaprecamento de derivativos tem seu nucleo fundamental desenvovido na chamada “decadadourada dos derivativos” cobrindo o perıodo de 1969 a 1979. Portanto, entendemos quee justificavel todo o esforco despendido neste sentido e encorajamos o leitor a seguir naleitura do Apendice e dos capıtulos seguintes.

4.8 Apendice - Solucao da EDP de BMS

O objetivo deste Apendice e mostrar todos os detalhes da resolucao da EDP (4.12)(ou (4.13)) juntamente com as condicoes iniciais e de contorno. Este detalhamento epouco usual em livros textos nao somente pela aridez algebrica envolvida como peloespaco que demanda. Vamos tentar ser breves mantendo a riqueza de detalhes parao completo entendimento da solucao. O Apendice esta dividido em quatro secoes. Aprimeira apresenta os detalhes da transformacao da EDP de BMS para a forma basicada equacao do calor. A seguir usamos a solucao da equacao do calor para mostramosa solucao da EDP de BMS (equacao (4.18)). Entretanto a solucao da equacao do calornao e usual para a maiorida dos leitores, portanto decidimos apresenta-la. Porem,primeiramente precisamos de um outro conceito que e a transformada de Fourier. Asegunda secao apresenta os conceitos basicos da transformada de Fourier e a terceirasecao faz uso destes conceitos na solucao da equacao do calor. A quarta secao demonstraalguns resultados que se fazem necessarios para a penultima secao.

4.8.1 Solucao da EDP de BMS

A EDP de BMS e uma equacao diferencial parcial do tipo parabolica. O preco daopcao e funcao do preco do ativo subjacente e do tempo dados os demais parametros,escrevemos entao c (St, t;σ,K, r). Para tornar clara a notacao iremos usar que St = sdestacando a diferenca entre a variavel aleatoria St e o valor que esta variavel assumes. Entao escreveremos c (s, t). Esta funcao c (s, t) e a solucao da seguinte EDP comcondicao final e de contorno dadas por

∂c

∂t+ rS

∂c

∂s+

1

2σ2S2 ∂

2c

∂s2= rc (4.48)

ou em forma mais abreviada

ct (s, t) + rScs (s, t) +1

2σ2S2css (s, t) = rc (s, t) (4.49)

onde S ≥ 0 e 0 ≤ t < T . As condicoes de contorno sao definidas abaixo.

Quando o preco atinge St = 0, os precos subsequentes do ativo serao zero pois trata-se

134

Page 145: Processos Estocásticos em Finanças

de uma barreira de absorcao do processo geometrico Browniano. Entretanto para sermosconsistente com a transformacao utilizada abaixo, usaremos a condicao St → 0

lims→0

c (s, t) = 0 t ∈ [0, T ) (4.50)

Quando o preco da acao cresce indefinidamente, o mesmo ocorre com o preco da opcao

lims→∞

c (s, t) = s t ∈ [0, T ) (4.51)

A condicao terminal, quando t→ T , e dada por

limt→T

c (s, t) = (ST −K)+ (4.52)

Vamos fazer a primeira mudanca de variaveis e transformar o problema escrito em termosde c (s, t) para f (x, τ). A primeira variavel preco sera assim transformada

s = Kex (4.53)

onde −∞ < x < ∞. A razao para tal transformacao e simples. Na equacao (4.48) apotencia da variavel S e a mesma da ordem e a mesma da ordem do respectivo diferencial.O fator de escala K considerado sera eliminado em breve. E tomando a derivada temos

ds

dx= Kex ⇒ dx

ds=

1

Ke−x (4.54)

Adotamos neste texto a definicao de que a variavel τ representa o tempo remanescentepara o vencimento. Exclusivamente neste Apendice vamos fazer uma ligeira mudancanesta definicao. Assim definiremos τ

τ =1

2σ2 (T − t) (4.55)

onde 0 ≤ t < T e consequentemente 0 < τ ≤ 12σ2T . A razao para esta transformacao

e simples. Em primeiro desejamos transformar a condicao terminal em condicao ini-cial. Em segundo lugar, usando o fator de escala 1

2σ2 ele podera ser eliminado da

equacao (4.48). Tomando a derivada temos

dt= −1

2σ2 (4.56)

A funcao f (x, τ) mapeara a funcao c (s, t) da seguinte forma

c (s, t) = Kf (x, τ) (4.57)

Usando o fator de escala K poderemos elimina-lo do problema pois ele foi igualmenteincluıdo na equacao (4.53).

Agora necessitamos das derivadas ∂c∂t

, ∂c∂s

e ∂2c∂s2

para introduzı-las na EDP (4.48)

∂c

∂t= K

∂f

∂τ

∂τ

∂t= K

∂f

∂τ

(−1

2σ2

)= −1

2σ2K

∂f

∂τ(4.58)

135

Page 146: Processos Estocásticos em Finanças

∂c

∂s= K

∂f

∂x

∂x

∂s= K

∂f

∂x

(1

Ke−x)

= e−x∂f

∂x(4.59)

Iremos usar o resultado da equacao acima para o calculo da segunda derivada

∂2c

∂s2=

∂s

(e−x

∂f

∂x

)= −e−xdx

ds

∂f

∂x+ e−x

∂s

(∂f

∂x

)= −e−x e

−x

K

∂f

∂x+ e−x

∂2f

∂x2

∂x

∂s

= −e−2x

K

∂f

∂x+e−2x

K

∂2f

∂x2(4.60)

Levando os resultados das equacoes (4.58), (4.59) e (4.60) na equacao (4.48) e fazendoas simplificacoes, teremos

1

2σ2∂

2f

∂x2+

(r − 1

2σ2

)∂f

∂x− 1

2σ2∂f

∂τ− rf = 0

Se fizermos r = k σ2

2, entao a equacao acima pode ser escrita como

∂2f

∂x2+ (k − 1)

∂f

∂x− ∂f

∂τ− kf = 0

Ou ainda podemos escrever

∂f

∂τ=∂2f

∂x2+ (k − 1)

∂f

∂x− kf (4.61)

Agora que transformamos a EDP original em outra EDP em termos de x e τ , precisamostambem modificar as condicoes de contorno originais de acordo com a transformacaoacima. Assim escrevemos que em t = T ⇒ τ = 0 e entao a definicao (4.57) c (s, t) =Kf (x, τ) tornar-se-a c (s, T ) = Kf (x, 0). Um pouco mais alem, temos que

c (s, T ) = Kf (x, 0) = max (S −K, 0)

= Kf (x, 0) = max (Kex −K, 0) = K max (ex − 1, 0)

f (x, 0) = (ex − 1)+ (4.62)

Esta ultima equacao e a condicao inicial do problema em termos de f (·). O que fizemosfoi transformar uma equacao diferencial do tipo backward em outra do tipo forward.Neste caso estabelecemos a condicao inicial em τ = 0 e procedemos a solucao para val-ores maiores que zero.

Vamos fazer uma nova transformacao na EDP (4.61). Escreveremos a EDP, que estaescrita em termos de f (x, τ), em termos de u (x, τ), obedecendo o seguinte mapeamentode uma funcao em outra

f (x, τ) = eαx+βτu (x, τ)

136

Page 147: Processos Estocásticos em Finanças

onde α e β serao definidos posteriormente. Vejamos primeiramente a condicao inicialem termos de u (·),

f (x, 0) = eαxu (x, 0)⇒ u (x, 0) = e−αxf (x, 0) (4.63)

Novamente necessitamos das derivadas ∂f∂τ

, ∂f∂x

e ∂2f∂x2 para obtermos a EDP em termos

de u (·). Trabalhano algebricamente, temos que

∂f

∂τ= βeαx+βτu (x, τ) +

∂u

∂τeαx+βτ = eαx+βτ

(βu+

∂u

∂τ

)(4.64)

∂f

∂x= αeαx+βτu (x, τ) +

∂u

∂xeαx+βτ = eαx+βτ

(αu+

∂u

∂x

)(4.65)

∂2f

∂x2= α2eαx+βτu (x, τ) + αeαx+βτ ∂u

∂x+ αeαx+βτ ∂u

∂x+ eαx+βτ ∂

2u

∂x2

= eαx+βτ

(α2u+ 2α

∂u

∂x+∂2u

∂x2

)(4.66)

Inserindo estas derivadas na equacao (4.61), cancelando os termos exponenciais e agru-pando os termos similares, obtemos a seguinte EDP

∂u

∂τ=∂2u

∂x2+ (2α + k − 1)

∂u

∂x+ [(α + k) (α− 1)− β]u

Impondo a condicao de que os coeficientes dos dois ultimos termos do segundo membrosao nulos, obtemos

(α + k) (α− 1)− β = 0⇒ β = α2 + α (k − 1)− k (4.67)

2α + k − 1 = 0⇒ α = −1

2(k − 1) (4.68)

ou ainda

1− α = 1 +1

2(k − 1) =

1

2(k + 1) (4.69)

Inserindo (4.68) em (4.67) teremos β

β =1

4(k − 1)2 − 1

2(k − 1)2 − k ⇒ β = −1

4(k + 1)2 (4.70)

Agora temos as definicoes de α e β em termos de k nas equacoes (4.68) e (4.70). Incluindoestes resultados na relacao entre as funcoes f (·) e u (·), obtemos

f (x, τ) = e−12

(k−1)x− 14

(k+1)2τu (x, τ)

A EDP final sera∂u

∂τ=∂2u

∂x2−∞ < x <∞ e τ > 0 (4.71)

De volta a condicao inicial na equacao (4.63), temos que

u (x, 0) = e−αxf (x, 0)

137

Page 148: Processos Estocásticos em Finanças

Usando a equacao (4.62) nesta ultima, temos que

u (x, 0) = e−αx max (ex − 1, 0)

= max(e(1−α)x − e−αx, 0

)Usando as equacoes (4.69) e (4.68) nesta ultima equacao, ficamos com

u (x, 0) = max(e

12

(k+1)x − e12

(k−1)x, 0)

(4.72)

Podemos entao reescrever o problema da seguinte forma

∂u

∂τ=∂2u

∂x2−∞ < x <∞ τ > 0

(4.73)

u (x, 0) = φ (x) = max(e

12

(k+1)x − e12

(k−1)x, 0)

O problema descrito em (4.73) e a classica equacao de difusao do calor. Desta formaconcluımos a primeira parte de nosso problema, qual seja, reduzir a EDP de BMS naforma da equacao do calor. Agora iremos aplicar a solucao desta ultima ao nosso prob-lema de financas.

A solucao da equacao (4.73) e dada por

u (x, τ) =1√4πτ

∫ ∞−∞

φ (y) e−(x−y)2

4τ dy

A solucao da equacao do calor pode ser vista com detalhes em Brown e Churchill (1978)[18], dentre outros. Na secao 4.8.3 deste Apendice apresentamos a solucao da equacao docalor usando a transformada de Fourier. Considerando que a solucao da equacao (4.73)seja conhecida, o restante do trabalho e o calculo da integral acima, o qual depende so-mente de esforco algebrico. Depois de resolvida a integral e encontrarmos u (·), voltare-mos a funcao f (·) e em seguida a c (s, t), completando assim o trabalho.

Vamos observar a funcao φ (y) acima:

φ (y) = max(e

12

(k+1)y − e12

(k−1)y, 0)

(4.74)

Note que φ (y) = e12

(k+1)y − e 12

(k−1)y se e12

(k+1)y − e 12

(k−1)y ≥ 0. Assim podemos escrever

e12

(k+1)y − e12

(k−1)y ≥ 0⇔ 1

2(k + 1) y ≥ 1

2(k − 1) y

Em consequencia k + 1 ≥ k − 1 desde que tenhamos y > 0. Assim, tomando a integralacima para valores positivos de y, escrevemos

u (x, τ) =1√4πτ

∫ ∞0

φ (y) e−(x−y)2

4τ dy

138

Page 149: Processos Estocásticos em Finanças

Para resolver esta integral vamos fazer a seguinte mudanca de variavel

w =y − x√

2τ⇒ y =

√2τw + x⇒ dy =

√2τdw

Introduzindo estas definicoes na integral acima obtemos sucessivamente

u (x, τ) =1√4πτ

∫ ∞− x√

φ(√

2τw + x)e−

w2

2

√2τdw

=1√2π

∫ ∞− x√

φ(√

2τw + x)e−

w2

2 dw

=1√2π

∫ ∞− x√

(e

12

(k+1)(√

2τw+x) − e12

(k−1)(√

2τw+x))e−

w2

2 dw

Vamos separar esta ultima integral em duas, denominadas de I1 e I2, ou seja

u (x, τ) =1√2π

∫ ∞− x√

e12

(k+1)(√

2τw+x)e−w2

2 dw − 1√2π

∫ ∞− x√

e12

(k−1)(√

2τw+x)e−w2

2 dw

= I1 − I2

onde:

I1 =1√2π

∫ ∞− x√

e12

(k+1)x+ 12

(k+1)√

2τw−w2

2 dw

I2 =1√2π

∫ ∞− x√

e12

(k−1)x+ 12

(k−1)√

2τw−w2

2 dw

Vamos resolver a integral I1. Somando e subtraindo o termo 14

(k + 1)2 2τ ao expontedo integrando, temos

I1 =1√2πe

12

(k+1)x

∫ ∞− x√

e−12(−(k+1)

√2τw+w2+ 1

4(k+1)22τ− 1

4(k+1)22τ)dw

=1√2πe

12

(k+1)x

∫ ∞− x√

e− 1

2

(w− (k+1)

√2τ

2

)2

e14

(k+1)2τdw

=1√2πe

12

(k+1)xe14

(k+1)2τ

∫ ∞− x√

e− 1

2

(w− (k+1)

√2τ

2

)2

dw

Vamos fazer mais uma mudanca de variavel na qual

z = w − (k + 1)√

2⇒ dz = dw

Denominando o limite inferior de integracao w = − x√2τ

por −d1, teremos

−d1 = − x√2τ− (k + 1)

√2τ

2

139

Page 150: Processos Estocásticos em Finanças

Podemos escrever

I1 = e12

(k+1)xe14

(k+1)2τ

(1√2π

∫ ∞−d1

e−z2

2 dz

)O termo entre parenteses representa a area sob a distribuicao normal padrao entre −d1

e ∞. E pela simetria da distribuicao normal, esta area e a mesma que aquela entre−∞ e d1, que chamaremos de N (d1), onde N (·) e a funcao distribuicao cumulativa danormal padronizada. Em resumo temos que

I1 = e12

(k+1)xe14

(k+1)2τN (d1) (4.75)

onde

d1 =x√2τ

+(k + 1)

√2τ

2(4.76)

O calulo de I2 e feito de maneira similar

I2 =1√2π

∫ ∞− x√

e12

(k−1)x+ 12

(k−1)√

2τw−w2

2 dw

=1√2πe

12

(k−1)x

∫ ∞− x√

e−12(w2−(k−1)

√2τw)dw

Completando o quadrado perfeito no exponencial do integrando, temos

I2 =1√2πe

12

(k−1)x

∫ ∞− x√

e−12(w2−(k−1)

√2τw+ 1

4(k−1)22τ− 1

4(k−1)22τ)dw

=1√2πe

12

(k−1)x+ 14

(k−1)2τ

∫ ∞− x√

e− 1

2

(w− (k−1)

√2τ

2

)2

dw

Como anteriormente faremos a seguinte mudanca de variavel z = w− (k−1)√

2τ2

. O limite

inferior de integracao sera −d2 = − x√2τ− (k−1)

√2τ

2. Entao podemos escrever

I2 =1√2πe

12

(k−1)x+ 14

(k−1)2τ

∫ ∞−d2

e−z2

2 dz

= e12

(k−1)x+ 14

(k−1)2τ

(1√2π

∫ ∞−d2

e−z2

2 dz

)O termo entre parenteses e a area sob a distribuicao normal padronizada entre −d2 e∞. Pela simetria da distribuicao normal esta area e mesma que aquela entre −∞ e d2.Entao temos

I2 = e12

(k−1)x+ 14

(k−1)2τN (d2) (4.77)

onde

d2 =x√2τ

+(k − 1)

√2τ

2(4.78)

Havıamos estabelecido anteriormente que u (x, τ) = I1 − I2. Usando os resultados obti-dos, chegamos a

u (x, τ) = e12

(k+1)xe14

(k+1)2τN (d1)− e12

(k−1)x+ 14

(k−1)2τN (d2)

140

Page 151: Processos Estocásticos em Finanças

Agora devemos proceder o caminho de volta encontrando as funcoes f (·) e c (·). Havıamosdefinido a relacao entre f (·) e u (·). Usando o resultado acima de u (·) obtemos suces-sivamente para os seguintes resultados para f (·):

f (x, τ) = e−12

(k−1)x− 14

(k+1)2τu (x, τ)

= e−12

(k−1)x− 14

(k+1)2τ(e

12

(k+1)xe14

(k+1)2τN (d1)− e12

(k−1)x+ 14

(k−1)2τN (d2))

= exN (d1)− e−τkN (d2) (4.79)

De acordo com a nossa definicao previa em (4.53) s = Kex, entao x = ln(sK

). Da mesma

forma, de (4.55) podemos escrever que −τk = − (T − t) 12σ2k = −r (T − t). Usando a

definicao em (4.57) em que c (s, t) = Kf (x, t), a equacao (4.79) pode ser escrita por

c (s, t) = K(eln( s

K )N (d1)− e−r(T−t)N (d2))

= sN (d1)−Ke−r(T−t)N (d2)

Para d1 temos sucessivamente que

d1 =x√2τ

+(k + 1)

√2τ

2

=ln(sK

)+(r + σ2

2

)(T − t)

σ√T − t

Para d2 temos sucessivamente que

d2 =x√2τ

+(k − 1)

√2τ

2

=x+ (k − 1) τ√

=ln(sK

)+(r − σ2

2

)(T − t)

σ√T − t

= d1 − σ√T − t

Lembrando que a variavel s representa o preco da acao St, temos finalmente que

c (St, t) = StN (d1)−Ke−r(T−t)N (d2) St > 0 0 ≤ t < T (4.80)

onde

d1 =ln(StK

)+(r + σ2

2

)(T − t)

σ√T − t

d2 = d1 − σ√T − t

Note que a equacao (4.80) nao e definida em t = T (ou τ = 0), pois este termo apareceno denominador de d1. Podemos dizer o mesmo com relacao a validade de (4.80) emSt = 0, que e um argumento da funcao log. Entretanto c (St, t) esta definida tal quelimt→T c (St, t) = (St −K)+ e limSt→0 c (St, t) = 0.

141

Page 152: Processos Estocásticos em Finanças

4.8.2 Transformada de Fourier

Na secao anterior resolvemos a equacao do modelo de BMS reduzindo-a a forma daequacao do calor e usando a solucao desta ultima. Agora o objetivo e mostrar a validadedo que fizemos resolvendo a equacao do calor. Usaremos a transformada de Fourier pararesolver a equacao do calor. Esta secao mostra alguns conceitos basicos da transformadade Fourier. Exitem varios textos dedicados ao assunto, dentre os quais Iorio e Iorio(2001) [56], Oliveira e Tygel (2005) [81] e Kreyszig (2007) [66].

Definicao 4.2. (Transformada de Fourier) Seja f (x) uma funcao real definida em−∞ < x <∞, definimos a transformada de Fourier F [f (x)] pela integral

F [f (x)] = f (ξ) =1√2π

∫ ∞−∞

f (x) e−iξxdx (4.81)

desde que tal integral exista.

Definicao 4.3. (Transformada de Fourier inversa) Definimos a transformada in-

versa F−1[f (ξ)

]pela integral

F−1[f (ξ)

]= f (x) =

1√2π

∫ ∞−∞

f (ξ) eiξxdξ (4.82)

Para detalhes sobre as classes de funcoes para as quais existem a transformada e suainversa, sugerimos os textos apontados acima.

Definicao 4.4. (Derivadas da transformada) Pode-se facilmente mostrar que asderivadas das transformadas de Fourier sao dadas por

f ′ (x) = −iξf (x) f ′′ (x) = −ξ2f (x) e f (n) (x) = (−iξ)n f (x) n = 1, 2, . . . (4.83)

Teorema 4.1. (Teorema da integral de Fourier) Seja f (x) uma funcao contınuadefinida em um intervalo finito. Considere que em cada ponto f (x) tem derivadas aesquerda e direita. Suponha que a integral

∫∞−∞ |f (x) |dx exista. Entao f (x) pode ser

escrita usando a integral de Fourier

f (x) =

∫ ∞0

[A (λ) cos (λx) +B (λ) sen (λx)] dλ −∞ < x <∞ (4.84)

onde:

A (λ) =1

π

∫ ∞−∞

f (y) cos (λy) dy

B (λ) =1

π

∫ ∞−∞

f (y) sen (λy) dy

e se f (x) nao e contınua em x0 o valor da integral de Fourier e a media dos limites deambos os lados 1

2

[f(x+

0

)+ f

(x−0)]

.

O uso do teorema 4.1 na solucao desta EDP pode ser visto em Baidya e Castro(1992) [3].

142

Page 153: Processos Estocásticos em Finanças

4.8.3 Solucao da equacao do calor

Nesta secao iremos resolver a equacao do calor com o uso da transformada de Fourierusando algumas definicoes da secao anterior. Ao longo da resolucao iremos nos depararcom alguns resultados que necessitam demonstracao. Por isto preferimos deixa-los paraa proxima secao.

Definicao 4.5. (Equacao do calor em uma barra finita) Seja u (x, τ) a temperaturano ponto x em uma barra de secao reta constante e material homogeneo de tamanho l noinstante τ . A equacao de difusao do calor, que flui unicamente na direcao x, e definidapor

∂u (x, τ)

∂τ= K2

c

∂2u (x, τ)

∂x2τ > 0 0 < x < l (4.85)

a temperatura inicial (ou condicao inicial) e definida pela funcao φ (x) tal que

u (x, 0) = φ (x) 0 < x < l (4.86)

e as condicoes de contorno sao u (0, τ) = u (l, τ) = 0, onde K2c = L

δκsendo L a condu-

tividade termica, δ o calor especıfico e κ a massa especıfica do material.

Definicao 4.6. (Equacao do calor em uma barra infinita) Seja u (x, τ) a temper-atura no ponto x em uma barra infinita de secao reta constante e material homogeneo,no instante τ . A equacao de difusao do calor, que flui unicamente na direcao x, edefinida por

∂u (x, τ)

∂τ= K2

c

∂2u (x, τ)

∂x2τ > 0 −∞ < x <∞ (4.87)

a temperatura inicial (ou condicao inicial) e definida pela funcao φ (x) tal que

u (x, 0) = φ (x) −∞ < x <∞ (4.88)

onde K2c foi definido acima.

A solucao da equacao do calor pode ser feita de diferentes formas. Em geral estetipo de equacao e resolvida com o uso de transformadas integrais. A transformada deLaplace e um tipo de transformada integral que pode ser usada na solucao do problema.Aqui optamos por usar a transformada de Fourier. Trataremos especificamente do prob-lema descrito na definicao 4.6. Sem perda de generalidade consideraremos o caso emque K2

c = 1.

Aplicando a definicao F [f (x)] ao problema descrito pelas equacoes (4.87) e (4.88), temos

∂u (ξ, τ)

∂τ= −ξ2u (ξ, τ)

(4.89)

u (ξ, 0) = φ (ξ)

O problema em (4.89) e o de uma equacao diferencial ordinaria, cuja solucao e dada por

u (ξ, τ) = φ (ξ) e−ξ2τ (4.90)

143

Page 154: Processos Estocásticos em Finanças

A transformada inversa de u (·)

F−1 [u (ξ, τ)] = u (ξ, τ) =1√2π

∫ ∞−∞

u (ξ, τ) eiξxdξ

Usando a equacao (4.90) na equacao anterior, temos

u (ξ, τ) =1√2π

∫ ∞−∞

φ (ξ) e−ξ2τeiξxdξ (4.91)

Por outro lado, da definicao da transformada de Fourier, sabemos que

φ (ξ) =1√2π

∫ ∞−∞

φ (y) e−iξydy (4.92)

Levando a equacao (4.92) na equacao (4.91), obtemos o seguinte resultado

u (x, τ) =1√2π

∫ ∞−∞

1√2π

∫ ∞−∞

φ (y) e−iξydye−ξ2τeiξxdξ

Reagrupando os termos similares, resulta em

u (x, τ) =1

∫ ∞−∞

eiξ(x−y)e−ξ2τdξ

∫ ∞−∞

φ (y) dy (4.93)

Definindo

Θ (x, τ) =

∫ ∞−∞

e−ξ2τeiξxdξ

Entao podemos escrever

Θ (x− y, τ) =

∫ ∞−∞

e−ξ2τeiξ(x−y)dξ (4.94)

Usando a equacao (4.94) em (4.93), resulta em

u (x, τ) =1

∫ ∞−∞

Θ (x− y, τ)φ (y) dy (4.95)

Note que a ultima integral e a convolucao (Θ ∗ φ) (x). Vamos usar o seguinte resultadopara Θ (·) que demonstraremos na secao seguinte

Θ (x, τ) =

√π

τe−

x2

Levando este resultado na equacao (4.95), temos a solucao u (·)

u (x, τ) =1

∫ ∞−∞

√π

τe−

(x−y)2

4τ φ (y) dy

=1√4πτ

∫ ∞−∞

φ (y) e−(x−y)2

4τ dy (4.96)

A equacao (4.96) e a solucao da equacao do calor que usamos na secao anterior.

144

Page 155: Processos Estocásticos em Finanças

4.8.4 Resultados basicos

Esta secao mostra resultados fundamentais que previamente foram utilizados na solucaoda equacao do calor (secao 4.8.3).

Proposicao 4.2. E valido o seguinte resultado∫ ∞−∞

e−ξ2τdξ =

√π

τ

Prova. Considere I (τ) =∫∞−∞ e

−ξ2τdξ. Entao podemos escrever

I2 (τ) =

∫ ∞−∞

e−ξ2τdξ

∫ ∞−∞

e−η2τdη =

∫ ∞−∞

∫ ∞−∞

e−(ξ2+η2)τdξdη

Usando coordenadas polares para resolver esta ultima integral, temos que

ξ = r cos θ η = rsenθ onde: r ∈ [0,∞) θ ∈ [0, 2π]

A area de um pequeno setor circular em coordenadas polares e dado por dξdη = rdrdθ.Entao temos

I2 (τ) =

∫ ∞−∞

∫ ∞−∞

e−(ξ2+η2)τdξdη =

∫ ∞0

rdre−r2τ

∫ 2π

0

dθ = 2π

∫ ∞0

re−r2τdr

= −πτ

∫ ∞0

(−2rτ) e−r2τdr =

π

τ

Entao temos o resultado

I (τ) =

√π

τ

Proposicao 4.3. E valido o seguinte resutado∫ ∞−∞

e−ξ2τeiξxdξ =

√π

τe−

x2

Prova. Seja h (x) =∫∞−∞ e

−ξ2τeiξxdξ, a derivada h′ (x) e

h′ (x) =

∫ ∞−∞

e−ξ2τ (iξ) eiξxdξ = − i

∫ ∞−∞−2ξτe−ξ

2τeiξxdξ

= − i

∫ ∞−∞

d

(e−ξ

2τ)eiξxdξ

Usando integracao por partes na ultima integral acima, resulta

h′ (x) = − i

[e−ξ

2τeiξx∣∣∣∞−∞−∫ ∞−∞

e−ξ2τ (ix) eiξxdξ

]= − i

2τ(−ix)

∫ ∞−∞

e−ξ2τeiξxdξ = − x

2τh (x)

145

Page 156: Processos Estocásticos em Finanças

Usando o resultado da proposicao 4.2, temos

h′ (x) = − x

2τh (x) e h (0) =

∫ ∞−∞

e−ξ2τdξ =

√π

τ

Ainda podemos escrever

h′ (x)

h (x)= − x

2τ⇒ d [ln (h (x))] = − x

Integrando

ln (h (x))− ln (h (0)) = −∫ x

0

y

2τdy =

y2

∣∣∣x0

= −x2

ln

(h (x)

h (0)

)= −x

2

O resultado final sera

h (x)

h (0)= e−

x2

4τ ⇒ h (x) = h (0) e−x2

4τ e usando o ultimo resultado para h (0)

h (x) =

∫ ∞−∞

e−ξ2τeiξxdξ =

√π

τe−

x2

Note que eiξx = cos (ξx) + isen (ξx), entao o nosso problema pode ser escrito por∫ ∞−∞

e−ξ2τ [cos (ξx) + isen (ξx)] dξ =

∫ ∞−∞

e−ξ2τ cos (ξx) dξ + i

∫ ∞−∞

e−ξ2τsen (ξx) dξ

A segunda integral do segundo membro tem como integrando o produto de uma funcaopar por uma uma funcao ımpar. O resultado e uma funcao ımpar, logo a integral destafuncao de −∞ a ∞ e zero. Portanto, temos∫ ∞

−∞e−ξ

2τeiξxdξ =

∫ ∞−∞

e−ξ2τcos (ξx) dξ =

√π

τe−

x2

ou ainda ∫ ∞−∞

e−ξ2τeiξ(x−y)dξ =

∫ ∞−∞

e−ξ2τcos (ξ (x− y)) dξ =

√π

τe−

(x−y)2

Este ultimo resultado foi utilizado para encontrar a solucao da equacao do calor (vejaequacao (4.94)).

146

Page 157: Processos Estocásticos em Finanças

Capıtulo 5

Mudanca de Medida

No capıtulo anterior fizemos o aprecamento com a suposicao da inexistencia da possi-bilidade de arbitragem. Este e um ponto central neste texto. Sempre consideraremos oaprecamento nesta condicao. Dado que nao ha arbitragem existem fundamentalmenteduas metodologias bem definidas para o aprecamento. A primeira e a metodologiaclassica apresentada no capıtulo 4. A segunda metodologia sera abordada neste capıtulo.

E muito usual o aprecamento de derivativos atraves da medida martingal. Historica-mente esta metodologia iniciou-se em 1979 com o artigo de Harrison e Kreps (1979) [48]e posteriormente Harrison e Pliska (1981) [47]. Neste capıtulo iremos detalhar os con-ceitos matematicos envolvidos nesta metodologia e faremos novamente o aprecamentodo modelo de BMS. Obviamente o resultado e o mesmo que o obtido no capıtulo ante-rior. Uma pergunta natural seria qual o apelo que se tem pelo aprecamento pela medidamartingal? A metodologia originalmente desenvolvida por BMS, quando aplicada aoaprecamento de derivativos de modo geral, requer a montagem de um portfolio (tomadade posicao no ativo subjacente e no derivativo) e em seguida a eliminacao do risco desteportfolio (estrategia esta mantida ao longo do perıodo de maturacao do derivativo).Matematicamente este procedimento resulta em uma EDP que em muitos casos naotem solucao analıtica. Por vezes a solucao numerica nao e trivial e demanda tecnicasmais avancadas para a sua resolucao.

O aprecamento pela medida martingal envolve a mudanca de medida de probabilidade(que significa escrever o processo estocastico do ativo subjacente em uma medida equiv-alente) e em seguida o calculo do valor esperado nesta medida. O aprecamento podeser feito por uma metodologia ou outra, dependendo de cada caso. Ha situacoes em queo uso da medida martingal mostra-se mais vantajoso. Em outros casos ocorre o inverso.

Matematicamente o que se esta fazendo ao resolver uma equacao diferencial ou cal-cular o valor esperado, e uma operacao de integracao. A solucao de EDP´s por metodosnumericos e um topico ao qual sao dedicados textos especıficos e metodologia diversas.Para o calculo do valor esperado, quando necessario, pode-se recorrer a procedimentosnumericos. Um deles bastante usual em financas e a tecnica de Monte-Carlo, que e rel-ativamente facil de ser implementada, porem demanda procedimentos especıficos paratornar-se mais eficiente computacionalmente.

147

Page 158: Processos Estocásticos em Finanças

Este capıtulo inicia-se com os conceitos de mudanca de medida, segue-se a mudanca demedida para o processo geometrico Browniano e o teorema de Girsanov. A seguir e feitoo aprecamento de opcoes Europeias (modelo de BMS). Posteriormente sao mostradasalgumas extensoes do modelo de BMS e a conceituacao de opcoes exoticas. Ao final docapıtulo, o leitor devera ter o domınio de todo o procedimento envolvido no aprecamentopela medida martingal. A referencias bibliograficas, tal qual no capıtulo 3, diferem muitoem termos do nıvel matematico da abordagem. Ha textos de menor complexidade comoMikosh (1999) [75], ultimo capıtulo; Neftci (2000) [77], capıtulos 14 e 15; Baxter e Ren-nie (1996) [5] e Joshi, (2003) [59] capıtulo 6. Outros textos, tambem acessıveis mascom complexidade matematica mais elevada, sao Shreve (2004) [94], Steele (2000) [97],Øksendal (2003) [80], Elliot e Kopp (2005) [34] e Klebaner (2005) [62], dentre outros.

5.1 Conceitos basicos

Inicialmente consideraremos um exemplo numerico. Sejam duas distrbuicoes normaisN1 (2, 4) e N2 (3, 4). Sabemos que as funcoes densidades (veja a equacao (1.27)) destasdistribuicoes sao

f1 (x) =1√2π2

e−(x−2)2

8 x ∈ R (5.1)

f2 (x) =1√2π2

e−(x−3)2

8 x ∈ R (5.2)

onde x sao os valores de Xi (ω) , i = 1, 2 e ω ∈ Ω. Consideremos agora Z1,2 (x) a razaoentre as duas funcoes densidades. Isto e

Z1,2 (x) =f1 (x)

f2 (x)(5.3)

Usando as expressoes das equacoes (5.1) e (5.2) na equacao (5.3), temos:

Z1,2 (x) = e−2x+5

8 x ∈ R (5.4)

Dizemos que Z1,2 (x) e a densidade de f1 (x) em relacao a f2 (x). Note que Z1,2 (x) naoe uma funcao densidade de probabilidade pois

∫∞−∞ Z1,2 (x) dx 6= 1.

Podemos similarmente definir a densidade de f2 (x) em relacao a f1 (x) por Z2,1 (x) =f2(x)f1(x)

para x ∈ R. Para as densidades em (5.1) e (5.2), teremos

Z2,1 (x) = e2x−5

8 (5.5)

Note tambem que tanto Z1,2 (x) como Z2,1 (x) representam o quociente entre duasfuncoes densidades que envolvem exponenciais e portanto sao nao negativas.

Sabemos tambem que dP1 (x) = f1 (x) dx e que dP2 (x) = f2 (x) dx, onde P1 (x) e P2 (x)sao as funcoes distribuicoes respectivas, ou em outras palavras, sao duas medidas deprobabilidades. E imediato que

Z1,2 (x) =dP1 (x)

dP2 (x)e Z2,1 (x) =

dP2 (x)

dP1 (x)

148

Page 159: Processos Estocásticos em Finanças

Entao pode-se tambem escrever que

dP1 (x) = Z1,2 (x) dP2 (x)

ou aindadP1 (x) = Z1,2 (x) f2 (x) dx (5.6)

e da mesma maneiradP2 (x) = Z2,1 (x) f1 (x) dx (5.7)

A equacao (5.7) significa que conhecendo-se Z2,1 (x) e a funcao densidade f1 (x) pode-se obter a distribuicao de probabilidade P2 (x). Da mesma forma, pode-se dizer omesmo com relcao a distribuicao P1 (x). Note que obtivemos uma nova distribuicaoPi (x) (ou medida de probabilidade) a partir do conhecimento de Zi,j (x) e da densidadefj (x) , i = 1, 2 e j = 2, 1, respectivamente. Esta mudanca de medida foi feita de talforma que se definiu novas probabildades aos eventos ω ∈ Ω. Poder-se-ia tambem chegarao mesmo resultado sem a alteracao das probabilidades. Poderıamos ter atuado sobreos valores X (ω). No nosso exemplo a segunda distribuicao tem a mesma variancia quea primeira porem a media e superior em uma unidade. Se tivessemos somado 1 a cadaelemento da primeira distribuicao obterıamos a segunda.

De fato, o que fizemos alterando a medida (ou probabilidades) e mais util em financasdo que simplesmente deslocar a media. Por exemplo, para obter a medida dP2 (x), amudanca feita pela equacao (5.7) devera reduzir as probabilidades associadas aos even-tos ω, para os quais X (ω) sao positivos e aumentar as probabilidades para os quais taisvalores sao negativos.

Em resumo, podemos dizer que a mudanca de medida, de P1 (x) para P2 (x) e feitapor Z2,1 (x). A mudanca de P2 (x) para P1 (x) e feita por Z1,2 (x). Em ambos os casosnao alteramos o valor da variavel X (ω). Mudamos o valor das probabilidades associadasaos eventos ω ∈ Ω.

5.2 Mudanca de medida

A secao anterior mostrou o mecanismo com o qual iremos mudar a medida de proba-bilidade. Nesta secao formalizaremos este conceito. Usaremos o conceito de espacode probabilidade (Ω,F , P ) onde Ω representa o espaco de eventos ω que podem ocor-rer, F representa a σ-algebra dos subconjuntos de Ω e P e a medida (distribuicao) deprobabilidade dos eventos ω ∈ Ω.

Definicao 5.1. (Medidas equivalentes) Duas medidas de probabilidades P e Q em(Ω,F) sao equivalentes se elas estao em concordancia com relacao a quais conjuntos deF tem probabilidade zero.

Seja A ∈ F tal que P (A) = 0. Entao se P e Q sao equivalentes, Q (A) = 0. Como Ae o complemento do conjunto que tem probabilidade de ocorrencia 1, entao P e Q estaoem concordancia com relacao a quais conjuntos de F tem probabilidade 1, ou seja, aoseventos q.c. (quase certamente). Entao se um evento ocorre quase certamente e se P eQ sao equivalentes, tanto faz se a ele nos referimos pela medida P ou Q.

149

Page 160: Processos Estocásticos em Finanças

Definicao 5.2. (Derivada de Radon-Nikodym) Considere o espaco de probabilidade(Ω,F , P ). Seja Q em (Ω,F) uma medida equivalente a P . Seja Z uma funcao naonegativa, de tal modo que seja a densidade de Q em relacao a P . Entao Z e denominadade derivada de Radon-Nikodym de Q em relacao a P , ou seja

Z (ω) =dQ (ω)

dP (ω)(5.8)

Seja entao A ∈ F entao pode-se escrever que a probabilidade de ocorrer o evento,avaliado pela medida Q, e

Q (A) =

∫A

Z (ω) dP (ω) (5.9)

onde ω ∈ Ω. Alem disso pode-se mostrar que EP (Z) = 1. A notacao do valor esperadodevera, de agora em diante, designar a medida em relacao a qual o valor esperado estasendo calculado.

Pode-se demonstrar que sendo P e Q medidas equivalentes em (Ω,F) existe quasecertamente Z nas condicoes acima.

Seja (Ω,F , P ) um espaco de probabilidade. Sob estas condicoes seja X uma distribuicaonormal com media µ e variancia 1, ou seja, X ∼ N (µ, 1). Isto significa que o espacoΩ representa os numeros reais R, ou seja, x = X (ω) ∈ R e a funcao densidade de X edada por

fX (x) =1√2πe−

12

(x−µ)2

x ∈ R (5.10)

A probabilidade do evento A ∈ F e dada por

P (A) =1√2π

∫A

e−12

(x−µ)2

dx x ∈ R (5.11)

Ainda temos que EP (X) = µ e V arP (X) = 1 e escrevemos X ∼ P : N (µ, 1).

Agora encontraremos Z (x) tal que possamos definir uma medida equivalente Q emrelacao a qual tenhamos a media de X igual a zero e a variancia identica a anterior, ouseja, EQ (X) = 0 e V arQ (X) = 1.

Tomemos Z (x) = e−xµ+µ2

2 . Da definicao 5.2, equacao (5.8), temos dQ (x) = Z (x) dP (x),ou seja

dQ (x) = e−xµ+µ2

21√2πe−

12

(x−µ)2

dx

E facil ver que Z (x) e nao negativa pois e uma funcao exponencial. Avaliando Q (A),onde A ∈ F , temos:

Q (A) =1√2π

∫A

e−12

(x−µ)2

e−xµ+µ2

2 dx

Q (A) =1√2π

∫A

e−12x2+xµ−µ

2

2 e−xµ+µ2

2 dx

Q (A) =1√2π

∫A

e−12x2

dx (5.12)

150

Page 161: Processos Estocásticos em Finanças

Isto mostra que a funcao distribuicao de X na medida Q e uma normal com media zeroe variancia 1. Ou melhor, para avaliar a probabilidade de A sob a medida Q, devemos

usar a densidade 1√2πe−

x2

2 . Escrevemos entao: EQ (X) = 0 e V arQ (X) = 1, ou ainda

X ∼ Q : N (0, 1). E facil ver que EP (Z) = 1 pois trata-se da area abaixo da densidadeda distribuicao normal padronizada.

Em resumo, o que foi feito acima foi retirar a media da distribuicao mudando as prob-abilidades (ou medida) em relacao a qual a variavel aleatoria X esta sendo avaliada.

A pergunta que vem a seguir e: qual o uso e importancia da mudanca de medidano contexto de financas? Esta questao sera naturalmente elucidada com a evolucao dosconceitos neste capıtulo. Mas por enquanto devemos ressaltar que a mudanca de medidasera usada para o aprecamento de derivativos de forma geral. Faremos isto com detalhespara o caso de uma opcao Europeia e chegaremos ao mesmo resultado que aquele domodelo de BMS, que usaram a metodologia vista no capıtulo anterior. A medida realde probabilidade (tambem conhecida como medida frequentista) e a medida em relacaoa qual os fatos sao observados no mundo cotidiano. Em geral, os processos estocasticosdos precos, sob esta medida, nao possuem a propriedade martingal. E interessante quefacamos a mudanca de medida para que tais processos tenham esta propriedade. A van-tagem de se trabalhar com a propriedade martingal e que o valor esperado do derivativoem uma data futura pode ser facilmente avaliado e atualizado para a data atual. Istoevita o aprecamento atraves da solucao de uma EDP. Esta nova medida de probabilidadee denominada de medida martingal ou medida neutra de probabilidade. As questoesrelativas a existencia de tal medida serao tratadas adiante.

Exercıcio 5.1. Seja (Ω,F , P ) um espaco de probabilidade. Considere Y ∼ P : N (0, 1).Encontre Z tal que sob a medida equivalente Q tenhamos Y ∼ Q : N (µ, 1).

5.3 Mudando a medida do Browniano

Nesta secao aplicaremos os conceitos anteriores ao caso do processo Browniano padrao.Seja um espaco de probabilidade (Ω,F , P ). Considere Bt, t ≥ 0, um processo Brow-niano padrao. As propriedades do Browniano dependem da medida P e da σ-algebra.Neste contexto a distribuicao de Bt e tal que Bt ∼ N (0, t) e Ft = σ (Bs, s ≤ t). Istosignfica que sob a medida P , Bt tem distribuicao normal com media zero e variancia t.Escrevemos mais apropriadamente Bt ∼ P : N (0, t). Se alterarmos a medida de pro-babilidade podemos alterar signficativamente a distribuicao de probabilidade de Bt. Amedida de probabilidade que descreve o Browniano padrao com as propriedades acimae

dP (Bt) =1√2πt

e−B2t

2t dBt (5.13)

Escreve-se tambem EP (Bt) = 0 e V arP (Bt) = t. Para tornar a notacao mais simples,denominaremos por x os valores assumidos por Bt, isto e x = Xt (ω) = Bt (ω) de talmodo que a equacao anterior fica

dP (X) =1√2πt

e−x2

2t dx x ∈ R (5.14)

151

Page 162: Processos Estocásticos em Finanças

Seja agora θ uma constante nao nula. Seja o processo abaixo

Bt (ω) = Bt (ω) + θt t ≥ 0 (5.15)

Para tornar a notacao mais simples denominaremos por y os valores assumidos porBt, isto e, y = Yt (ω) = Bt (ω). Isto significa que (5.15) poderia ser escrita porYt (ω) = Xt (ω) + θt.

E claro que o Bt nao e um Browniano padrao na medida P . Queremos mudar a medidade probabilidade de P para Q de tal maneira que sob esta medida Bt seja um Brownianopadrao.

Sabemos que a derivada de Radon-Nikodym e dada por (5.8) onde apresentamos esteconceito sob o enfoque de mudanca da medida para a distribuicao de probabilidades.Agora vamos buscar este conceito para um processo estocastico. Definimos a derivadade Radon-Nikodym para a mudanca de medida de um processo estocastico por

Zt (ω) = EP [Z (ω) |Ft] t ≥ 0 (5.16)

onde Z (ω) esta definido na equacao (5.8).

Exercıcio 5.2. Mostre que o processo estocastico que define a derivada de Radon-Nikodym em (5.16) e martingal em relacao a Ft, ou seja, EP [Zt (ω) |Fs] = Zs (ω).Sugerimos que o item (iv) do exercıcio 3.5 seja refeito.

Vamos considerar o seguinte processo estocastico

Zt (ω) = exp

(−θBt (ω)− 1

2θ2t

)ω ∈ Ω (5.17)

Inicialmente vamos considerar que este processo representa a derivada de Radon-Nikodym.Entao a medida de probabilidade equivalente Q e escrita por

dQ (ω) = Zt (ω) dP (ω) ω ∈ Ω (5.18)

Podemos alternativamente escrever

Q (A) =

∫A

Zt (ω) dP (ω) A ∈ Ft (5.19)

Vamos calcular o valor esperado do processo Bt na medida Q, EQ(Bt

)(ou ainda

EQ (Y )). Para tal vamos investigar qual a funcao distribuicao de Y na medida Q. Istoe faremos o calculo de Q (Y < β) usando (5.19) e considerando A = ω : Y (ω) ≤ β.Temos que Yt (ω) = Xt (ω) + θt, ou ainda y = x + θt, para y = β temos x = β − θt, eentao

Q (Y ≤ β) =

∫ β−θt

−∞e−θx−

12θ2t 1√

2πte−

x2

2t dx

Q (Y ≤ β) =1√2πt

∫ β−θt

−∞e−

(x+θt)2

2t dx

152

Page 163: Processos Estocásticos em Finanças

Agora transformando y = x+ θt, temos

Q (Y ≤ β) =1√2πt

∫ β

−∞e−

y2

2t dy (5.20)

Lembrando que Yt (ω) = Bt (ω) = y, vemos que sob a medida Q, Bt distribui-se comouma normal com media zero e variancia t. A equacao (5.20) tambem pode ser assimescrita

Q(Bt ≤ β

)=

1√2πt

∫ β

−∞e−

12tB2t dBt (5.21)

Esta equacao comparada com (5.13) mostra claramente que EQ(Bt

)= 0 e V arQ

(Bt

)=

1. A derivada de Radon-Nikodym em (5.17) permitiu que fizessemos a mudanca de Ppara Q de tal modo que Bt na equacao (5.15) se tornasse um Browniano padrao sob Q.

5.4 Teorema de Girsanov

Esta secao formaliza o que fizemos na secao 5.3 atraves do Teorema de Girsanov. A seguiriremos analisar a mudanca de medida do processo geometrico Browniano considerando-o como a dinamica de evolucao dos precos das acoes. Tal mudanca busca encontrar amedida que leve o processo a propriedade martingal.

Teorema 5.1. (Teorema de Girsanov) Seja (Ω,F , P ) um espaco de probabilidade.Seja Bt (ω) , 0 ≤ t ≤ T um processo Browniano padrao neste espaco e Ft = σ (Bu, u ≤ t)a filtracao natural gerada por este Browniano. Seja θt um processo adaptado. Definimosainda

Bt (ω) = Bt +

∫ t

0

θudu (5.22)

Zt (ω) = exp

[−∫ t

0

θudBu −1

2

∫ t

0

θ2udu

](5.23)

Considere a medida de probabilidade Q equivalente a P tal que

Q (A) =

∫A

Zt (ω) dP (ω) A ∈ Ft (5.24)

Considere tambem a condicao de Novikov

E

[∫ T

0

θ2uZu (ω) du

]<∞

Entao sob a medida de probabilidade Q, Bt (ω) e um processo Browniano padrao. Amedida Q e denominada de medida martingal equivalente.

Para os leitores interessados, a demonstracao do Teorema de Girsanov pode ser vista,dentre os textos mencionados no inıcio do capıtulo, em Øksendal (2003), Klebaner (2005)e Shreve (2004).

Na secao 5.3 usamos a equacao (5.22) fazendo θu = θ, um valor constante, para definir

153

Page 164: Processos Estocásticos em Finanças

o processo Bt. A equacao (5.17) decorreu deste fato e equivale a equacao (5.23) e final-mente a equacao (5.21) mostrou que Bt e um Browniano padrao sob a medida Q.

A seguir apresentaremos a mudanca de medida para o processo geometrico Browni-ano que e o processo representativo da dinamica de uma acao no modelo de BMS.

Seja (Ω,F , P ) um espaco de probabilidade. Considere Bt (ω) , 0 ≤ t ≤ T um pro-cesso Browniano padrao neste espaco e Ft = σ (Bu, u ≤ t) a filtracao natural geradapor este Browniano. Considere o processo geometrico Browniano como sendo a dinamicade uma acao de preco St, tal que

dXt = µXtdt+ σXtdBt 0 ≤ t ≤ T (5.25)

Vimos que a solucao desta EDE e dada por

Xt = SX0e(µ− 1

2σ2)t+σBt

Xt = X0eδt+σBt 0 ≤ t ≤ T (5.26)

onde δ = µ− 12σ2.

Seja 0 ≤ u < t ≤ T , podemos escrever a equacao (5.26) entre os instantes u e tpor

Xt = Xueδ(t−u)+σ(Bt−Bu)

Vamos calcular o valor esperado de St na medida P , condicional a Fu

EP (Xt|Fu) = XuE[eδ(t−u)+σ(Bt−Bu)|Fu

]= Xue

δ(t−u)E(eσ(Bt−Bu)|Fu

)Como Bt −Bu e independente de Fu, temos

EP (Xt|Fu) = Xueδ(t−u)E

(eσ(Bt−Bu)

)= Xue

δ(t−u)e12σ2(t−u)

= Xueδ(t−u)+ 1

2σ2(t−u)

= Xue(δ+ 1

2σ2)(t−u)

= Xueµ(t−u)

Em geral o proprietario de um ativo com risco requer um “ganho extra” (premio derisco) para mante-lo em seu portfolio. Isto significa que espera obter um retorno alemda taxa livre de risco, r. Em outras palavras, e natural que µ seja positivo e superior ar, de tal forma que tenhamos da ultima equacao

EP (Xt|Fu) > Xu (5.27)

Isto significa que o processo de precos sob a medida P e submartingal. Devemos buscaruma medida que torne o processo de preco (ou um processo a ele relacionado) martingal.

154

Page 165: Processos Estocásticos em Finanças

Vamos considerar o processo de evolucao da taxa de juros Rt. Seja Dt o fator dedesconto no tempo t, tal que

Dt = e−∫ t0 Rsds (5.28)

Para o caso em que a taxa de juros e constante e igual a r (taxa livre de risco), o fatorde desconto sera

Dt = e−rt (5.29)

Verifiquemos agora o comportamento dos precos descontados Xt relativamente a pro-priedade martingal. Considerando Rt = r para 0 ≤ t ≤ T , temos

Xt = XtDt = Xte−rt = X0e

(µ−r− 12σ2)t+σBt 0 ≤ t ≤ T

Pelas mesmas razoes anteriores (µ > r), encontramos

EP(Xt|Fu

)> Xu u < t (5.30)

E o processo de precos descontados sob a mediada P e submartingal.

Vamos definir o processo estocastico dos precos descontados na forma diferencial. Sabe-mos que Xt = e−rtXt. Fazendo Xt = e−rtXt = f (x, t) e usando a formula de Ito,temos

d(Xt

)= d (f (x, t)) =

∂f

∂tdt+

∂f

∂xdXt +

1

2

∂2f

∂x2(dXt)

2

onde ∂f∂t

= −re−rtXt,∂f∂x

= e−rt, ∂2f∂x2 = 0.

Entao o processo estocastico procurado e dado por

dXt = −re−rtXtdt+ e−rt (µXtdt+ σXtdBt)

dXt = (µ− r) Xtdt+ σXtdBt (5.31)

A equacao (5.31) mostra que o processo de Xt e geometrico Browniano e que sob acondicao de que µ > r, o processo tem tendencia (drift) nao nulo e portanto nao emartingal sob a medida P .

Definicao 5.3. (Preco do risco de mercado) O preco do risco de mercado em uminstante t e definido como e excesso de ganho em relacao a taxa livre de risco por unidadede volatildade. Isto significa que

θt =µt − rtσt

(5.32)

onde θ e o preco do risco de mercado.

Para o caso que estamos examinando em que: (i) a acao possui dinamica definida naequacao (5.25) onde a tendencia (drift) e a volatilidade sao constantes e respectivamentedadas por µ e σ, (ii) a taxa livre de risco e considerada como constante e igual a r; opreco do risco de mercado e dado por

θ =µ− rσ

(5.33)

155

Page 166: Processos Estocásticos em Finanças

Agora a equacao (5.31) por ser escrita por

dXt = σXt (θdt+ dBt) (5.34)

Agora vamos aplicar o teorema de Girsanov considerando θ constante na equacao (5.22),ou seja

Bt = Bt + θt

Ainda podemos considerardBt = dBt + θdt (5.35)

Substituindo a equacao (5.35) na equacao (5.34), temos

dXt = σXtdBt (5.36)

O teorema de Girsanov garante que Bt e um processo Browniano padrao sob a medidaQ equivalente a P . O processo Xt nao possui tendencia e e martingal sob a medida Q.Outra forma de verificar que o processo e martingal e escrevendo-o sob a forma integral

Xt = X0 + σ

∫ t

0

XudBu (5.37)

Sob a medida Q a integral acima e uma integral de Ito e portanto e martingal. Por estarazao a medida Q e denominada medida martingal equivalente (MME). A solucao daEDE (5.36) e

Xt = X0e− 1

2σ2t+σBt 0 ≤ t ≤ T (5.38)

Embora tenhamos demonstrado que o processo de precos descontados e martingal parauma acao que segue um processo geometrico Browniano, pode-se mostrar mais generi-camente que esta condicao e valida para qualquer ativo, ou seja EQ

(YT |Ft

)= Yt, onde

Yt e o processo de precos descontados para o ativo que segue uma dinamica descrita porYt.

Se quisermos escrever o processo de precos Xt sob a medida Q basta substituirmosdBt = dBt − θdt em (5.25) para obtermos

dXt = µXtdt+ σXt

(dBt − θdt

)dXt = σXt

[(µσ− θ)dt+ dBt

]dXt = rXtdt+ σXtdBt

dXt

Xt

= rdt+ σdBt (5.39)

A solucao da EDE (5.39) e dada por

Xt = X0e(r− 1

2σ2)t+σBt (5.40)

Na medida real de probabilidade o processo geometrico Browniano para o preco do ativoXt e dado por dXt

Xt= µdt+σdBt. Ao mudarmos a medida de probabilidade tal processo

torna-se dXtXt

= rdt + σdBt. Pode-se dizer que a tendencia µ original foi separada em

156

Page 167: Processos Estocásticos em Finanças

duas partes, uma e a taxa livre de risco que continua na formula e a outra parte e opremio de risco que esta inserido na nova medida Q em relacao a qual escrevemos o novoprocesso.

Tanto no processo dos precos Xt (equacao (5.39)) como no processo dos precosdescontados Xt (equacao (5.36)), a mudanca de medida de P para Q nao alterou avolatilidade. Em ambos os casos (sob a medida Q) houve uma mudanca na tendencia,sendo que no processo de precos descontados a tendencia foi eliminada. Ja no processodescrito em (5.39) a tendencia tornou-se a propria taxa livre de risco. Nesta medida Qo ativo (acao) e remunerado pela taxa livre de risco e os estados da natureza refletem aneutralidade ao risco.

5.5 Aprecamento pela medida martingal

O capıtulo 4 dedicou-se a metodologia de aprecamento de opcoes de compra/venda dotipo europeu. A metodologia ali empregada definiu uma estrategia de posicionamentono ativo objeto e no derivativo (montagem de um portfolio). Foi imposta a condicao deinexistencia de risco neste portfolio. E sob tal situacao, para que nao haja arbitragem,o portfolio deve ser remunerado pela taxa livre de risco. Em consequencia chega-se aopreco do derivativo (opcao de compra/venda). Esta estrategia de manter o portfoliosem risco e obtida pela revisao contınua das quantidades de cada ativo na composicaodo portfolio. Ao final, no vencimento, o valor do derivativo (ΛT ) e igual ao valor doportfolio (ou igual ao valor final da estrategia). Voltaremos a este caso mais a frente.

Neste capıtulo enfatizamos que o aprecamento de um derivativo pode ser feito pelamedida martingal equivalente (trata-se de uma metodologia alternativa). Nesta secaousaremos os conceitos construıdos ate o momento e realizaremos o aprecamento de umaopcao de compra Europeia pela MME. Na secao seguinte ficara claro sob que condicoespodemos usar a MME para fins de aprecamento. Da mesma forma, veremos a conexaoque existe entre a metodologia classica de aprecamento e a metodologia que agora ap-resentamos.

Consideremos novamente 0 ≤ t ≤ T onde T e a data do vencimento do contrato deopcao (compra/venda). Vimos que o processo de precos descontados e martingal soba medida Q (ou medida martingal equivalente MME). Vamos nos concentrar no casode uma opcao de compra Europeia. Tambem sabemos que uma opcao de compra valeno vencimento a diferenca entre o preco do ativo objeto neste momento e o preco deexercıcio, isto e

ΛT = cT = (XT −K)+ (5.41)

Desejamos definir o preco da opcao em t, ou seja, queremos encontrar ct a partir doconhecimento do seu valor em T , isto e cT . Do que vimos anteriormente podemosescrever que o preco descontado e martingal, isto e pode ser escrito por

EQ(e−rT cT |Ft

)= e−rtct (5.42)

157

Page 168: Processos Estocásticos em Finanças

Substituindo a equacao (5.41) na equacao (5.42) e incluindo o termo e−rt dentro do valoresperado condicional1, temos

ct = EQ[e−r(T−t) (XT −K)+ |Ft

](5.43)

Como a equacao anterior trata do valor esperado sob a medida martingal, tomemos opreco escrito sob esta mesma medida a partir da equacao (5.40) e reescrita abaixo

Xt = x = X0e(r− 1

2σ2)t+σBt (5.44)

A equacao acima relaciona o preco em um instante qualquer Xt com o preco no instantet = 0, ou seja, X0. O mesmo podemos fazer entre os instantes T e t = 0 e assimescreve-se

XT = X0e(r− 1

2σ2)T+σBT (5.45)

Entao para obtermos uma relacao entre os precos nos instantes t e T , divide-se aequacao (5.45) pela equacao (5.44), obtendo-se

XT = xe(r−12σ2)(T−t)+σ(BT−Bt) (5.46)

Da mesma forma que no capıtulo 4, vamos definir τ = T −t como o tempo remanescentepara o vencimento do contrato de opcao. Entao temos

XT = xe(r−12σ2)τ+σBτ (5.47)

Note que XT e o produto de Xt = x (que e um processo adaptado a Ft) pela funcao

e(r−12σ2)τ+σBτ ou e(r−

12σ2)τ+σ(BT−Bt)

que e independente de Ft. Logo temos que o valor esperado condicional em (5.43) eigual a

ct = EQ[e−rτ (XT −K)+] (5.48)

Por outro lado sabemos que BT − Bt = Bτ ∼ N (0, τ). Logo temos que

w =BT − Bt√

τ=Bτ√τ

e uma distribuicao normal padrao, w ∼ N (0, 1). Levando este resultado em (5.47)temos

XT = xe(r−12σ2)τ+σ

√τw (5.49)

Substituindo a equacao (5.49) na equacao (5.48), temos

ct = EQ

[e−rτ

(xe(r−

12σ2)τ+σ

√τw −K

)+]

1Quando o processo Dt nao considera a taxa livre de risco constante, devemos usar a equacao (5.28).Ainda assim trata-se de um processo adaptado a F e portanto pode ser incluıdo dentro do valor esperado.

158

Page 169: Processos Estocásticos em Finanças

Mais uma vez enfatizamos que o valor esperado acima e calculado sob a medida martingalequivalente. Para tal, tomamos o integrando sob esta medida. Assim o valor de STem (5.49) ja contem as transformacoes necessarias para te-lo sob a MME. Assim temos

ct =1√2π

∫ ∞−∞

e−rτ(xe(r−

12σ2)τ+σ

√τw −K

)+

e−12w2

dw (5.50)

O integrando sera positivo se

w >1

σ√τ

[ln

(K

x

)−(r − 1

2σ2

]isto equivale a

w > −ln(xK

)+(r − 1

2σ2)τ

σ√τ

= −d2

Logo, a integral da equacao (5.50) sera do limite inferior −d2 ao limite superior ∞

ct =1√2π

∫ ∞−d2

e−rτ(xe(r−

12σ2)τ+σ

√τw −K

)e−

12w2

dw

A equacao acima sera separada em duas integrais I1 e I2, tal que

ct = I1 − I2 (5.51)

onde tais integrais estao escritas abaixo

I1 =1√2π

∫ ∞−d2

e−rτ(xe(r−

12σ2)τ+σ

√τw)e−

12u2

dw e I2 =1√2π

∫ ∞−d2

e−rτKe−12w2

dw

Para a primeira integral temos

I1 = x1√2π

∫ ∞−d2

e−12σ2τ+σ

√τw− 1

2w2

dw

I1 = x1√2π

∫ ∞−d2

e−12(u−σ

√τ)

2

dw

Fazendo z = w − σ√τ , teremos dz = dw. E o limite inferior de integracao sera z =

−d2 − σ√τ = −d1, logo

I1 =x√2π

∫ ∞−d1

e−12z2

dz

A integral da densidade normal de −d1 a +∞ e igual a integral de −∞ a d1 por suapropriedade de simetria. Logo

I1 = xN (d1) (5.52)

onde N (z) = 1√2π

∫ z−∞ e

− 12y2dy.

Para a segunda integral temos

I2 =Ke−rτ√

∫ ∞−d2

e−12w2

dw

159

Page 170: Processos Estocásticos em Finanças

Pelas mesmas razoes acima podemos escrever que

I2 = e−rτKN (d2) (5.53)

Finalmente, substituindo os resultados das equacoes (5.53) e (5.52) na equacao (5.51),temos que

ct = XtN (d1)−Ke−rτN (d2) (5.54)

onde

d1 =ln(XtK

)+(r + 1

2σ2)τ

σ√τ

e d2 = d1 − σ√τ

A equacao (5.54) define a formula para o aprecamento de uma opcao de compra Europeiaconforme o modelo de BMS. Este e o mesmo resultado da equacao (4.17) para uma opcaode compra Europeia.

Exercıcio 5.3. Apresente todos os detalhes do aprecamento de uma opcao de vendaEuropeia vt que no vencimento vale vT = (K −XT )+. Verifique se o seu resultadoatende a paridade entre as opcoes de compra e venda definidas na equacao (4.2).

Exercıcio 5.4. Definindo o processo de precos descontados de uma opcao de compraEuropeia por ct = e−rtct, resolva os itens:

(i) defina o processo estocastico dct na medida de probabilidade P (lembre-se quect = f (x, t) e que Xt segue um processo geometrico Browniano,

(ii) aplique o Teorema de Girsanov e troque a medida para Q definindo agora o processoct na MME,

(iii) obtenha a EDP de BMS a partir do item (ii) considerando que na medida Q oprocesso de ct e martingal, isto e nao possui tendencia (drift).

A medida martingal equivalente e uma medida de probabilidade conveniente para oaprecamento de derivativos. Uma vez que o processo estocastico do ativo subjacente estaescrito sob esta medida, o calculo do valor esperado nos fornece o valor do derivativo.De forma geral se o derivativo no vencimento vale ΛT , entao o valor Λt, sera dado por

Λt = EQ[e−r(T−t)ΛT |Ft

]0 ≤ t ≤ T (5.55)

Esta equacao e equivalente a equacao (5.42).

Se a taxa livre de risco nao e constante entre 0 ≤ t ≤ T , podemos usar a definicaoem (5.28), tal que

Λt = EQ[e−

∫ Tt RuduΛT |Ft

]0 ≤ t ≤ T (5.56)

As equacoes (5.55) e (5.56) sao denominadas equacoes fundamentais de aprecamento.

E interessante observar que a MME (medida Q) nao esta relacionada aos estadosda natureza diretamente. Isto significa dizer que as probabilidades de ocorrencia doseventos no mundo real nao sao dadas por esta medida. Se estamos interessados emfazer simulacoes (cenarios de precos) ou previsoes de eventos futuros, devemos usar amedida real de probabilidade P (ou tambem conhecida como medida frequentista), quee a medida sob a qual os fatos reais da natureza ocorrem.

160

Page 171: Processos Estocásticos em Finanças

Exercıcio 5.5. Considere uma opcao de compra Europeia sobre um ativo subjacentede preco St cuja dinamica e dada pela equacao (5.25), com preco de exercıcio K evencimento em t = T . A taxa livre de risco e r. Calcule a probabilidade na medida realdo preco Xt ser inferior a K, ou seja P (Xt < K) no tempo t. Calcule tambem nestemomento a mesma probabilidade na medida neutra, ou seja, Q (Xt < K).

Exercıcio 5.6. Seja Xt o preco negociado em mercado da margem de producao daindustrializacao de certo produto. A dinamica de Xt e dada por

Xt = µdt+ σdBt, t ≥ 0

onde µ ∈ R e σ ∈ R+. Seja ct o preco da opcao de compra Europeia cujo valor novencimento e dado por

Λ = cT = (XT −K)+

onde K e o preco de exercıcio e T a data de vencimento. Calcule o preco ct, 0 ≤ t ≤ T .

5.6 Teoremas fundamentais de financas

Esta secao apresenta os teoremas fundamentais de financas que constituem os alicercesda teoria de aprecamento. Veremos como as duas metodologias abordadas nos capıtulos4 e neste estao conectadas. Nao apresentaremos as demonstracoes de tais teoremas esugerimos que os leitores interessados busquem-as nas referencias mencionadas ao longodeste capıtulo. Iniciaremos com algumas definicoes basicas para o entendimento do con-texto destes teoremas.

Considere um mercado com n ativos (acoes) e que o preco do i-esimo ativo no instantet seja dado por X i

t . A dinamica dos precos segue a equacao (5.25) em um espaco deprobabilidade (Ω,F , P ).

Definicao 5.4. Uma estrategia qt define a quantidade de cada ativo (acao), no instantet, de um portfolio, tal que

qt (ω) =(q1t (ω) , q2

t (ω) , . . . , qnt (ω))

(5.57)

onde qit (ω) e um processo adaptado ao Browniano Bit (ω).

O valor do portfolio em t definido por uma estrategia qt (ω) e dado por

Wt (ω) =n∑i=1

qit (ω)X it ω ∈ Ω (5.58)

Definicao 5.5. (Estrategia auto-financiavel) Uma estrategia qt (ω) e auto-financiavelquando as alteracoes no seu valor Wt (ω), se devem tao somente as variacoes dos precos,ou seja,

dWt (ω) =n∑i=1

qit (ω) dX it (5.59)

Isto significa que nenhum recurso monetario e adicionado ou retirado do portfolio.

161

Page 172: Processos Estocásticos em Finanças

Definicao 5.6. Define-se uma estrategia de protecao (hedging) como aquela para a qualexiste uma estrategia auto-financiavel qt (ω) que faz com que o valor do derivativo novencimento ΛT seja igual ao valor do portfolio (quase certamente), isto e

WT (ω) =n∑i=1

qiT (ω)X iT = ΛT (ω) q.c. (5.60)

Exemplo 5.1. Exemplifique a estrategia de protecao para uma situacao de venda deuma opcao de compra Europeia.

Solucao: No capıtulo 4, para o aprecamento de uma opcao de compra pela metodologiaclassica, foi montado um porfolio que era formado pela compra de ∆ acoes e vendade uma opcao. Foi imposta a condicao de que o portfolio fosse livre de risco. Paratal, dever-se-ia manter no portfolio uma quantidade ∆t de acoes tal ∆t = ∂ct

∂St. Esta

quantidade deve ser ajustada continuamente em funcao das alteracoes dos precos daacao e da opcao. Esta estrategia dinamica leva entao o valor do portfolio a tornar-seigual ao de uma opcao de compra na data do vencimento. Lembre-se que ∂cT

∂ST= 1.

Definicao 5.7. Se para todos os derivativos do mercado existe uma estrategia de protecao(hedging) de tal modo que (5.60) e atendida, entao o mercado e dito completo.

Entao nos referimos a um mercado completo como sendo aquele em que usando osativos deste mercado somos capazes de gerar estrategias de hedging para os derivativosexistentes. Em outras palavras, somos capazes de replicar os precos dos derivatiovs.

No capıtulo 4 apresentamos o conceito de arbitragem enfatizando que se trata de umaforma de realizar ganhos sem tomar riscos. Formalizaremos este conceito com a defincaoa seguir.

Definicao 5.8. (Arbitragem) Uma oportunidade de arbitragem e uma estrategia auto-financiavel qt (ω) tal que: (i) W0 = 0, (ii) P (WT ≥ 0) = 1 e P (WT > 0) > 0.

Isto significa que em t = 0 o valor do portfolio e zero, W0 = 0. Entao adotando aestrategia qt (ω) chegamos ao instante T com o valor do portfolio WT sem possibilidadede perda (WT ≥ 0 com probabilidade 1). E ainda mais, o valor do portfolio sera positivo(WT > 0 com probabilidade positiva).

Agora que temos a formalizacao de varios conceitos fundamentais, retomamos oconceito de equivalencia entre as medidas de probabilidades P e Q, conforme o Teo-rema de Girsanov. Naquela oportunidade, secao 5.4, fizemos a mudanca de medidapara os precos descontados das acoes e constatamos que sob Q tal processo era mar-tingal (equacoes (5.36) e (5.37)). Na secao 5.5 usamos a equacao de aprecamento(equacao (5.42)) e chegamos a solucao analıtica do modelo de BMS. Entretanto emnenhum momento ficou claro sob que condicoes pode-se garantir a existencia da medidamartingal equivalente. Agora faremos isto.

162

Page 173: Processos Estocásticos em Finanças

Definicao 5.9. (Medida neutra) A medida de probabilidade Q e neutra ao risco seP e Q sao equivalentes e se sob Q o processo de precos descontados de cada ativo domercado e martingal.

Admita que cada acao do mercado tenha a dinamica dada pela equacao (5.25). Isto ecada acao esta sujeita somente a uma fonte de incerteza (um unico Browniano caracterizao processo de St). Assim podemos escrever que

dX it = µiX i

tdt+ σitXitdB

it i = 1, . . . , n (5.61)

Seguindo as etapas apresentadas na secao anterior, teremos o preco do risco de mercadodado por

θ =µi − rσi

i = 1, . . . , n

Como toda a incerteza provem de um unico Browniano (expresso na dinamica de cadaacao), o preco do risco de mercado e unico, de tal sorte que

µi − rσi

=µj − rσj

i, j = 1, . . . , n e i 6= j (5.62)

Caso a condicao anterior nao se verifique estamos diante de uma situacao em que nestemercado pode haver arbitragem. A mesma consideracao pode tambem ser feita parao caso de varias fontes de incerteza na dinamica do processo de precos (mais de umBrowniano na dinamica de Xt). Estes fatos podem ser demonstrados embora nao osapresentemos neste texto.

O primeiro teorema fundamental de financas define sob que condicoes existe a medidaneutra ao risco. A importancia deste teorema esta no fato de que, em grande parte, oaprecamento de derivativos e feito sob a condicao da existencia da medida neutra.

Teorema 5.2. (Primeiro Teorema Fundamental de Financas) Um mercado naoadmite arbitragem se e somente se existe uma medida neutra ao risco.

Apresentamos a seguir a demonstracao do primeiro teorema fundamental de financas.Inicialmente suporemos que exista a medida neutra e provaremos que a existencia dapossiblidade de arbitragem nesta situacao, e contraditoria.

Prova. Considere que existe a medida neutra ao risco Q. Isto significa que o processode preco descontado de cada ativo e martingal. Seja Xt o preco de ativo, tal que Xt ≥ 0.O processo de preco descontado e DtXt. Este processo e martingal sob Q, entao escreve-se EQ (DTXT ) = DtXt = X0, t ∈ [0, T ]. Vamos supor que em t = 0 temos X0 = 0.Logo escrevemos que

EQ (DTXT ) = 0 (5.63)

Vamos supor que haja possibilidade de arbitragem. Pela definicao 5.8 significa dizer quese X0 = 0, entao

P (XT ≥ 0) = 1 e P (XT > 0) > 0 (5.64)

ou seja, nao ha perda em T e certamente havera ganho. Portanto sob estas condicoespode-se escrever que

P (XT ≥ 0) = 1⇒ P (XT < 0) = 0 (5.65)

163

Page 174: Processos Estocásticos em Finanças

Como Q e P sao equivalentes, estas probabilidades coincidem em relacao aos conjuntosde medida nula, ou seja Q (XT < 0) = 0. Se nao ha probabilidade de perda sob Q e seo valor esperado sob Q e nulo (equacao (5.63)), entao

Q (XT > 0) = 0 (5.66)

Se assim nao fosse Q (DTXT > 0) > 0 o que implicaria EQ (DTXT ) > 0 que con-tradiz a equacao (5.63). Em consequencia, da equacao (5.66) podemos escrever queP (XT > 0) = 0, que por sua vez contradiz a suposicao de possibilidade de arbitragemque fizemos inicialmente e que foi descrita na equacao (5.64).

Teorema 5.3. (Segundo Teorema Fundamental de Financas) Um mercado ecompleto se e somente se possui uma unica medida neutra ao risco.

A demonstracao pode ser encontrada nas referencias mencionadas.

O primeiro teorema coloca as condicoes necessarias e suficientes para se proceder oaprecamento. Note que ha uma conexao nıtida entre a metodologia classica e a que es-tudamos neste capıtulo. Na metodologia classica usamos a condicao de nao arbitragemno mercado. E portanto esta condicao garante a existencia da medida neutra que por suavez pode tambem ser o instrumento para o aprecamento, como foi feito na secao anterior.

O segundo teorema assegura a unicidade da medida neutra mediante a existencia deum mercado completo, e vice-versa. Trata-se de uma situacao mais restritiva que aquelado primeiro teorema.

Os teoremas 5.2 e 5.3 constituem as ferramentas naturais de aprecamento de deriva-tivos em financas. Alem disto, a condicao de nao arbitragem e util de forma geral paradefinir relacoes entre precos no mercado, como por exemplo a paridade entre opcoesde compra e venda. Uma pergunta natural que surge e como usar os teoremas acima.Em geral, supoe-se que o mercado e livre de arbitragem e completo e entao faz-se ouso da medida neutra ao risco atraves do teorema de Girsanov. Em muitos casos haa necessidade de estimar o parametro θ (preco do risco de mercado). Nestas situacoesdeve-se proceder a calibracao do modelo teorico ajustando-o aos precos praticados (dadosempıricos). Desta maneira, pode-se obter tambem outros parametros do modelo, comoa volatilidade, velocidade de reversao, etc. Em geral a calibracao e feita maximizando-sea funcao de verossimilhanca do modelo, o mesmo procedimento que foi visto no capıtulo2. Voltaremos a este topico quando tratarmos de mercados futuros. Outra perguntaque surge e como obter a funcao de densidade neutra ao risco. Para a finalidade deaprecamento nao ha necessidade de obtermos a funcao densidade. No entanto, caso sejautil para alguma outra finalidade, a medida neutra (densidade neutra implıcita) estaimplıcita nos precos dos derivativos (o mercado contem esta informacao). Ela pode serlevantada empiricamente e o procedimento e devido a Breeden e Litzenberger (1978)[14] e sera apresentado no proximo capıtulo.

5.7 Replicando para o aprecamento

Esta secao usa os conceitos das secoes anteriores e apresenta uma forma ligeiramentediferente de realizar o aprecamento. Nao se trata de uma metodologia adicional. De fato

164

Page 175: Processos Estocásticos em Finanças

o aprecamento continua sendo aquele feito pela medida martingal. Entretanto achamosinteressante explorar alguns dos conceitos apresentados ate o momento, e eles estao aquireunidos.

Vamos considerar que podemos replicar o valor de uma opcao de compra a partir deuma estrategia em que tomamos posicao no ativo com risco (acao) e no ativo sem risco(letras do tesouro). Seja a estrategia definida por q1

t e q2t , respectivamente. O valor do

portfolio em t (0 ≤ 0 ≤ T ) sera

Wt = q1tXt + q2

t βt (5.67)

onde Xt e βt sao os valores da acao e do tıtulo governamental livre de risco, respectiva-mente. Note que βt e o inverso do fator de desconto expresso na equacao (5.29), ou seja,βt = ert e dβt = rβtdt. Consideremos que o portfolio assim formado e auto-financiavel,ou seja

dWt = q1t dXt + q2

t dβt (5.68)

Vamos considerar o processo de precos descontados deste portfolio, Wt = e−rtWt, talque

Wt = e−rt(q1tXt + q2

t βt)

(5.69)

Usando a formula de Ito para calcular as variacoes do valor do portfolio descontado,temos

dWt = d(e−rtWt

)= −re−rtWtdt+ e−rtdWt (5.70)

Usando as equacoes (5.67) e (5.68) na equacao (5.70), obtem-se

dWt = −re−rt(q1tXt + q2

t βt)dt+ e−rt

(q1t dXt + q2

t dβt)

= −re−rt(q1tXt + q2

t βt)dt+ e−rt

(q1t dXt + q2

t rβtdt)

= q1t

(−re−rtXtdt+ e−rtdXt

)= q1

t dXt (5.71)

Da equacao (5.36) temos que dXt = σXtdBt que levado na equacao (5.71) fornece

dWt = q1t σXtdBt

ou ainda

Wt = W0 + σ

∫ t

0

q1uXudBu (5.72)

Portanto, sob a medida Q, o processo do portfolio descontado Wt e martingal pois aequacao (5.72) e uma integral de Ito e o processo q1

uXu e adaptado a Ft. Logo, Wt emartingal e podemos usar a equacao geral de aprecamento (5.56) e escrever

Wt = EQ(e−rτWT |Ft

)0 ≤ t ≤ T

Se WT replica o preco de uma opcao entao WT = (XT −K)+ e ct = Wt. Consequente-mente

ct = EQ[e−rτ (XT −K)+ |Ft

]165

Page 176: Processos Estocásticos em Finanças

e chegamos novamente a equacao (5.43). O restante do desenvolvimento ja foi realizadoabrangendo as equacoes (5.44) ate (5.54).

A estrategia de replicar o preco de uma opcao por ativos existentes no mercado eexatamente o que vimos anteriormente e denominamos de hedge dinamico. Em cadainstante de tempo de tempo as posicoes do portfolio sao ajustadas atraves de quantidadesq1t da acao e q2

t das letras do tesouro (ativo sem risco). Situacao identica foi a abordagemda secao 4.2 quando fizemos a derivacao do modelo de BMS. Naquele caso o portfolioΠt era mantido neutro (sem risco) em cada instante de tempo atraves do ajuste δ-hedge.Isto e, em cada instante de tempo o numero de acoes e ajustado de tal forma que∆t = ∂ct

∂Xt≈ ∆ct

∆Xtrefletindo a razao entre a variacao do preco da opcao e a variacao do

preco da acao. Lembre-se que a posicao do portfolio e comprado em ∆t acoes e vendidoem uma opcao de compra. O comprador da opcao de compra mantem um posicaoestatica ate o vencimento. O agente proprietario do portfolio Π (Πt = ∆tXt − ct) temque manter-se balanceado desde que toma a posicao de comprado em ∆ acoes (ativosubjacente) no instante t = 0. Desta forma, no instante t (0 < t < T ) se Xt subir oucair a quantidade de acoes deve ser ajustada. Na pratica a posicao de ajustes contınuosna posicao do portfolio (∆t) implica em custos de corretagem que podem ser elevadosse a frequencia de ajustes for grande.

5.8 Extensoes do modelo de BMS

Esta secao apresenta algumas extensoes do modelo de BMS. Os modelos que serao ap-resentados a seguir, em muitos casos, sao extensoes imediatas e a sua derivacao podeser obtida tal qual fizemos nas secoes anteriores. Portanto, nao nos deteremos no seudetalhamento, ficando para o leitor esta tarefa. Em outros caso deixaremos os modelospara serem desenvolvidos na forma de exercıcios. A primeira extensao considera o casodo aprecamento de uma opcao de compra para uma acao que paga dividendos.

Seja (Ω,F , P ) um espaco de probabilidade. Considere Bt (ω) 0 ≤ t ≤ T , um processoBrowniano padrao e Ft = σ (Bs, s ≤ t) a filtracao natural gerada por este Browniano.Tal qual fizemos nas secoes anteriores, considere Xt o preco de uma acao cuja dinamicae dada por

dXt = µXtdt+ σXtdBt (5.73)

Na secao 4.2 onde apresentamos as hipoteses do modelo de BMS a condicao (iii) re-stringia o modelo aos casos em que a acao nao pagava dividendos. Uma hipotese usual eque o pagamento de dividenos seja considerado de forma contınua. Vamos considerar ocaso de dividendos pagos a uma taxa constante α. Por exemplo se α = 2%, significa quea variacao do preco implicado pelo dividendo pago continuamente e 0, 02×Xt, ou aindaque o retorno implicado pelo pagamento acarreta uma variacao percentual do preco de2%. O pagamento de dividendos reduz o valor de uma acao porporcionalmente. Logo adinamica da acao sob esta consideracao sera

dXt = µXtdt+ σXtdBt − αXtdt (5.74)

Vale observar que se entre t = 0 e t = T a acao que paga dividendos varia de X0 a XT ,entao caso nao pagasse nenhum dividendo variaria de X0 a XT e

αT , ou entao de X0e−αT

166

Page 177: Processos Estocásticos em Finanças

a XT .

A equacao (5.74) se reduz a

dXt = (µ− α)Xtdt+ σXtdBt (5.75)

Desejamos saber o preco de uma opcao sob a dinamica de (5.74) ou equivalentementesob a dinamica de (5.75). Note que a diferenca de (5.75) e (5.73) esta somente no termorelativo a tendencia (drift) do processo. Sob a medida Q ele sera escrito por

dXt = (r − α)Xtdt+ σXtdBt (5.76)

A solucao de (5.76) e dada por

Xt = xe(r−α−12σ2)t+σBt (5.77)

Entre os instantes t e T podemos escrever

XT = Xe(r−α−12σ2)(T−t)+σ(BT−Bt) (5.78)

Esta ultima equacao equivale a equacao (5.47) do procedimento desenvolvido na secao5.5. De agora em diante o procedimento e identico ao daquela secao e fica como exercıciopara o leitor finalizar o desenvolvimento. O resultado final para o preco da opcao decompra sera

ct = Xte−ατN (d1)−Ke−rτN (d2) (5.79)

onde:

d1 =ln(XtK

)+(r − α + 1

2σ2)τ

σ√τ

e d2 = d1 − σ√τ

Note que a diferenca entre a equacao (5.79) e (5.54) esta no preco da acao Xt, que soba condicao de pagamento de dividendo, se transforma em Xte

−αt.

A seguir seguem outras extensoes do modelo de BMS colocadas sob a forma de ex-ercıcios.

Exercıcio 5.7. Retome o enunciado do exercıcio 5.3 e apresente todos os detalhes doaprecamento de uma opcao de venda Europeia vt sobre uma acao que paga dividendosa uma taxa contınua e constante igual a α. Verifique a condicao de paridade entre asopcoes de compra (equacao (5.79)) e venda.

Exercıcio 5.8. Considere a dinamica de Xt tal qual nos capıtulos 4 e 5. Considere umaopcao de compra cujo valor no vencimento sera

ΛT =

H se XT > K

0 se XT < K

Observe que XT = K e um evento que ocorre com probabilidade nula. Esta equacao econhecida como opcao binaria ou digital (ou usando o termo original cash or nothing

167

Page 178: Processos Estocásticos em Finanças

option). Para tornar a modelagem mais facil, considere que o seu valor no vencimentoseja,

ΛT =

H se XT > KH2

se XT = K

0 se XT < 0

(5.80)

(i) Mostre que o valor da opcao de compra e ct = He−rτN (d2) (Sugestao: use aequacao geral de aprecamento (5.55) ou (5.42)).

(ii) Mostre que o valor da opcao de venda vt = He−rτ (1−N (d2)). O valor da opcaode venda no vencimento e exatamente o oposto de (5.80).

(iii) Encontre a relacao de paridade entre ct e vt: (a) usando os resultados obtidos em(i) e (ii); (b) usando o argumento de nao arbitragem tal qual aquele apresentadona secao 4.1 para chegarmos a equacao (4.2).

(iv) Derive as formulas para as gregas delta, gama e teta.

Exercıcio 5.9. Retome o enunciado do exercıcio anterior e considere que o valor daopcao de compra no vencimento seja

ΛT =

ST se XT > KST2

se XT = K

0 se XT < K

(5.81)

(i) Calcule o valor da opcao de compra ct (esta opcao e denominada asset or nothingoption).

(ii) Considere que o valor da opcao de venda no exercıcio seja o oposto do que estaem (5.81). Calclule o valor de vt.

(iii) Obtenha a relacao de paridade entre ct e vt.

5.9 Derivativos exoticos

Ate o presente momento vimos os derivativos do tipo Europeu em que o proprietariosomente pode exercer o seu direito na data do vencimento, T . Outra propriedade dosderivativos que estudamos e que o valor do mesmo no vencimento e funcao do preco doativo subjacente naquela data, ou seja ΛT = f (XT , T ). Usando a equacao fundamentalde aprecamento Λt = EQ

[e−r(T−t)ΛT

]temos o valor do derivativo na data t, 0 ≤ t ≤ T .

Existem outros tipos de derivativos em que o exercıcio pode acontecer em uma dataanterior ao vencimento. Os derivativos Americanos sao aqueles em que o exercıcio podeocorre em qualquer data anterior ao vencimento. Dentro desta classe ha tambem osderivativos do tipo Bermuda em que o exercıcio pocode ocorrer em datas especıficasanteriores ao vencimento.

Existem os derivativos cujo valor na data do vencimento e funcao da trajetoria seguida

168

Page 179: Processos Estocásticos em Finanças

pelos precos ate esta data, isto e ΛT = f (Xt1 , Xt2 , . . . , Xtn , T ), onde tk ∈ [0, T ].

Esta secao reune alguns destes derivativos denominados de exoticos. Muitos deles naopossuem solucao analıtica fechada. O recurso, nesta situacao, e recorrer a solucoesaproximadas, a maioria delas obtidas numericamente. O apendice deste capıtulo apres-nta os conceitos envolvendo o metodo de Monte-Carlo muito usual em financas. Naopretendemos nos deter na derivacao dos modelos. O leitor interessado encontrara textosdedicados somente aos derivativos exoticos, ou ainda pode usar as referencias men-cionadas no inıcio do capıtulo. Alem dessas, o texto de Wilmott, Howison, Dewynne(1995) [101] apresenta varios capıtulos dedicados aos derivativos exoticos bem como es-pecial atencao as solucoes numericas. Veja tambem no apendice deste capıtulo variasreferencias sobre metodos numericos em financas. Dentre varios derivativos exoticos nosdedicaremos as opcoes.

5.9.1 Opcoes com barreiras

As opcoes com barreiras sao opcoes em que o seu valor no vencimento e funcao dofato do preco do ativo subjacente ter atingido um nıvel previamente definido (barreira).Primeiramente vejamos as opcoes de compra.

(i) Opcao de compra down e out : esta opcao tem valor zero no vencimento se opreco do ativo atingir a barreira (B < X0) em algum instante t ∈ [0, T ], caso abarreira na seja atingida o valor da opcao no vencimento e identico ao de umaopcao Americana,

(ii) Opcao de compra down e in: esta opcao tem valor zero no vencimento, a menosque atinja a barreira (B < X0) em algum instante t ∈ [0, T ], se a barreira e cruzadao seu valor no vencimento e o de uma opcao Americana.

As formulas para o aprecamento destas opcoes podem ser vistas nas referencias. Observeque o valor das opcoes de compra do tipo down sao inferiores aqueles de uma opcaoEuropeia. A soma da duas opcoes in e out resulta no valor de uma Europeia.

(i) Opcao de compra down e out : esta opcao tem valor zero no vencimento se opreco do ativo atingir a barreira (B > X0) em algum instante t ∈ [0, T ], caso abarreira na seja atingida o valor da opcao no vencimento e identico ao de umaopcao Americana,

(ii) Opcao de compra down e in: esta opcao tem valor zero no vencimento, a menosque atinja a barreira (B > X0) em algum instante t ∈ [0, T ], se a barreira e cruzadao seu valor no vencimento e o de uma opcao Americana.

As definicoes para as opcoes de venda seguem-se analogamente as apresentadas acimaapenas substituindo-se a palavra compra por venda. Todas elas possuem solucoesanalıticas que atendem as novas condicoes de contorno definidas pelas barreiras (vejanas referencias).

169

Page 180: Processos Estocásticos em Finanças

5.9.2 Opcoes Lookback

As opcoes do tipo Lookback sao aquelas em que o seu valor no vencimento depende dosvalores mınimos ou maximos que ocorreram na trajetoria de precos do ativo subjacente.

(i) Opcao de compra com preco de exercıcio fixo: seu valor no vencimento e dado por(Xmax −K)+ onde Xmax = max (Xt) para t ∈ [0, T ],

(ii) Opcao de venda com preco de exercıcio fixo: seu valor no vencimento e dado por(K −Xmin)+, onde Xmin = min (Xt), para t ∈ [0, T ],

(iii) Opcao de compra com preco de exercıcio flutuante: seu preco de exercıcio novencimento e dado por XT −Xmin,

(iv) Opcao de venda com preco de exercıcio flutuante: seu preco de exercıcio no venci-mento e dado por Xmax −XT .

Note que as opcoes Lookback valem mais que as respectivas Europeias. Para as opcoescom preco de exercıcio fixo o valor no vencimento considera Xmax ≥ XT e Xmin ≤ XT

que resultam em valores superiores aso da Europeia. As opcoes com preco de exercıcioflutuante sao inapropriadamente denominadas de opcoes pois sempre sera vantajoso oexercıcio. Veja nas referencias as formulas para o aprecamento destas opcoes.

5.9.3 Opcoes Asiaticas

As opcoes Asiaticas sao aquelas em que o valor da opcao no vencimento depende damedia dos precos do ativo subjacente em [0, T ].

(i) Opcao de compra Asiatica com a media no preco: o seu valor no vencimento e por(1T

∫ T0Xudu−K

)+

,

(ii) Opcao de venda Asiatica com a media no preco: o seu valor no vencimento e dado

por(K − 1

T

∫ T0Xudu

)+

,

(iii) Opcao de compra Asiatica com a media no preco de exercıcio:: o seu valor no

vencimento e dado por(XT − 1

T

∫ T0Xudu

)+

,

(iv) Opcao de venda Asiatica com a media no preco de exercıcio: o seu valor no

vencimento e dado por(

1T

∫ T0Xudu−XT

)+

.

Em geral as opcoes Asiaticas nao apresentam solucao analıtica. Os casos em que istoocorre sao excessoes. As referencias mencionadas definem estes casos.

5.10 Resumo e consideracoes finais

Neste capıtulo apresentamos o conceito de aprecamento de derivativos atraves da me-dida martingal equivalente (MME). A MME e uma medida de probabilidade util para o

170

Page 181: Processos Estocásticos em Finanças

aprecamento pois define um procedimento alternativo ao da metodologia classica. A me-dida real de probabilidade P e a medida em que os fenomenos ou os estados da naturezaacontecem. Para procedermos o aprecamento devemos fazer a mudanca de medida semfazer nenhuma alteracao nos elementos da distribuicao de probabilidade original. Paratal foi introduzido o conceito da derivada de Radon-Nikodym (para duas distribuicoes

de probabilidades) que e a densidade de Q em relacao a P , ou seja Z (ω) = dQ(ω)dP (ω)

.

A seguir fizemos a mudanca de medida de probabilidade para o Browniano padrao,Bt (ω). O processo Browniano padrao na medida de probabilidade Q e Bt (ω), tal queBt (ω) = Bt (ω)+θt, θ 6= 0. Alem disso, a derivada de Radon-Nikodym para a mudancade medida envolvendo processos estocasticos, e o valor esperado condicional na medidaP , ou seja, Zt (ω) = EP (Z (ω) |Ft). A etapa seguinte foi o enunciado do teorema de Gir-sanov, onde foram definidos Bt, Zt (ω) e a medida equivalente Q. O teorema garante quesob Q o processo Bt (ω) e um processo Browniano padrao. Realizamos entao a mudancade medida para o processo geometrico Browniano (considerando como esta a dinamciados precos das acoes). Mostramos que sob P o processo de precos e submartingal. Omesmo ocorre para o processo de precos descontados.

Fizemos entao a mudanca de medida para o processo de precos descontados. Entao sobQ mostramos que o processo e martingal. A seguir procedemos o aprecamento de opcaode compra Europeia usando a MME conforme a equacao fundamental de aprecamento

Λt = EQ[e−r(T−t)ΛT |Ft

]0 ≤ t ≤ T

Os teoremas fundamentais de financas garantem as condicoes sob as quais pode-se fazero uso da MME. A inexistencia da possibilidade de arbitragem garante a existencia daMME. Ainda mais, se o mercado e completo esta medida e unica. Posteriormente apre-sentamos o conceito de replicar a opcao por uma estrategia de posicionamento no ativosubjacente e no tıtulo sem risco. Mostramos que o valor descontado deste portfolio emartingal e consequentemetne a equacao geral de aprecamento pode ser usada para ocalculo de ct. Como extensoes do modelo de BMS fizemos o aprecamento de uma opcaode compra de uma acao que paga dividendos e conceituamos algumas opcoes exoticas.No apendice apresentaremos a simulacao de Monte-Carlo. Ela requer que sejam re-alizadas simulacoes de trajetorias do ativo subjacente sob a MME. Posteriormente ecalculado a media do valor do derivativo no vencimento (ΛT ) usando o valor do ativosubjacente neste instante (XT ). Desconta-se esta media ao tempo t pela taxa livre derisco obtendo-se o valor do derivativo nesta data.

5.11 Apendice - Metodo de Monte-Carlo

O objetivo deste apendice e apresentar os conceitos basicos da simulcao de Monte-Carloe a sua aplicacao para o aprecamento de derivativos em financas.

Uma das virtudes do modelo de BMS e que o mesmo possui solucao analıtica. Poremnem sempre este e caso para outros derivativos. Frequentemente temos que buscar al-guma solucao numerica para a questao do aprecamento. Como foi dito anteriormente,se derivarmos o modelo para o preco de um derivativo e chegarmos a uma EDP que nao

171

Page 182: Processos Estocásticos em Finanças

tenha solucao analıtica, teremos que proceder a sua solucao numerica. Uma metodolo-gia usual e o metodo das diferencas finitas, veja por exemplo Duffy (2006) [29] que eum texto dedicado a solucao de problemas em financas usando diferencas finitas. Vejatambem Wilmott, Howison e Dewynne (1995) [101] e Hull (2000) [53].

Porem se aprecamos um derivativo a partir do calculo do valor esperado sob a MME(equacao fundamental de aprecamento), podemos chegar a uma integral que nao tenhasolucao analıtica. Uma forma de resolver o problema e atraves de metodos numericosde integracao.

Uma metodologia de integracao, muito usual em financas, e a simulacao de Monte-Carlo (MC). A simulacao de MC nao se restringe a problemas de financas e e usadaem problemas de engenharia em geral que lidam com variaveis estocasticas. Por estarazao a bibliografia sobre o metodo de MC e vasta. Em financas nao poderia ser difer-ente e destacamos Brandimarte (2003) [13], Glasserman (2003) [41], Jackel (2002) [57]e McLeish (2005) [71], dentre outros. Para uma breve introducao a metodologia vamosaplica-la ao caso do aprecamento de uma opcao de compra Europeia tal qual no modelode BMS.

Considere incialmente que X seja uma variavel aleatoria com E (X) = µX e V ar (X) =σ2X . Sabemos que se produzirmos uma amostra de tamanho N da variavel aleatoriaX teremos os valores X1, X2 . . . , XN . Uma boa aproximacao para a media de X (esti-mador) e a estatıstica X, dada por

X =1

N

N∑i=1

Xi (5.82)

onde Xi sao variaveis aleatorias independentes. O valor esperado de X e

E(X)

=1

N

N∑i=1

E (Xi) =1

N(E (X1) + . . . E (XN)) =

1

NNµX = µX (5.83)

Isto mostra que X e um estimador nao tendencioso para a media (E(X)

= µX).

Um estimador natural para a variancia de X e a estatıstica σ2X dada por

σ2 =1

N

N∑i=1

(Xi − X

)2

O exemplo 1.14 mostra que este estimador e tendencioso. O estimador nao tendenciosoda variancia e obtido facilmente definindo

σ2X =

1

N − 1

N∑i=1

(Xi − X

)2

O Teorema Central do Limite (veja o teorema 1.4) afirma que a distribuicao de X − µe normal com media zero e variancia σ2

N; isto e X − µ ∼ N

(0, σ

2

N

). Isto significa que o

172

Page 183: Processos Estocásticos em Finanças

intervalo de confianca de 95% e dado por

P

(−1, 96 ≤ X − µ

σ√N

≤ 1, 96

)= 0, 95

ou ainda

P

(X − 1, 96σ√

N≤ µ ≤ X +

1, 96σ√N

)= 0, 95

Usando o estimador σX para o desvio-padrao σ, o intevalo de 95% para a media µ e[X − 1, 96σX√

N, X +

1, 96σX√N

](5.84)

Desta forma podemos obter a analise de MC. Tomamos uma amostra de tamanho N ecomputamos X e σX e assim somos capazes de estimar um intervalo de confianca paraa media.

Para o aprecamento de uma opcao devemos calcular o valor da opcao usando a equacao (5.43)aqui reescrita

ct = EQ[e−rτ (XT −K)+ |Ft

](5.85)

Devemos portanto obter uma amostra de tamanho N da variavel XT . Para tal devemosgerar N trajetorias de precos de Xt = x ate XT . Estas trajetorias devem ser calculadasna medida neutra usando a equacao (5.49) aqui reescrita

XT = xe(r−12σ2)τ+σ

√τw (5.86)

onde w ∼ N (0, 1). Gerando N numeros aleatorios de uma normal padrao, obte-mos os valores de XT usando a equacao acima. Calcula-se entao o valor (XT −K)+,atualizando-os pela taxa livre de risco e a seguir tomamos a media dos N valores obti-dos. Temos assim ct e computamos o intervalo de confianca desejado para este valor.

Observando o intervalo de confianca em (5.84), nota-se que a reducao do erro e pro-porcional ao inverso da raız quadrada do tamanho da amostra. Uma reducao de 10% noerro implica em um aumento de 100 vezes no tamanho da amostra. Isto explica porqueo metodo de MC e computacionalmente intensivo ou demandante. Portanto, a precisaodo resultado esbarra nas limitacoes computacionais.

A outra questao relacionada a precisao do metodo esta no fato de que o intervalo deconfianca e proporcional ao desvio-padrao conforme (5.84). Uma maneira de contornaro problema e buscar estimar o intervalo de outra variavel aleatoria que tenha a mesmamedia porem com menor variancia. Esta tecnica e denominada reducao de variancia.Para o seu melhor entendimento sugerimos que o leitor consulte as referencias men-cionadas acima.

173

Page 184: Processos Estocásticos em Finanças

174

Page 185: Processos Estocásticos em Finanças

Capıtulo 6

Equacoes Diferenciais Estocasticas

O capıtulo 3 deste texto concentrou os conceitos fundamentais do calculo estocasticode tal modo que pudessemos, nos dois capıtulos subsequentes, desenvolver e aplicar asmetodologias de aprecamento.

Deixamos alguns outros conceitos relacionados ao calculo estocastico para o presentecapıtulo. Tudo o que sera agora apresentado e uma continuacao do capıtulo 3. Poderıamoster unido os dois capıtulos, 3 e 6, entretanto por questoes didaticas e por organizacaodo texto, preferimos intermedia-los com as aplicacoes para aprecamento, tomando comobase o modelo de BMS.

Da mesma forma como fizemos no capıtulo 3, este tambem e um capıtulo relevantepara o desenvolvimento das habilidades do leitor e para a compreensao mais ampla dateoria de financas. Iniciamos o capıtulo pela propriedade de Markov. Posteriormenteestenderemos a dinamica dos processos estocasticos ao caso multivariado, neste contextoapresentamos o processo de Ito multivariado. Conceituaremos o gerador de difusao deIto para fazermos a conexao entre a solucao de uma EDP e o calculo da esperancacondicional. Definiremos as equacoes de Kolmogorov e Feynman-Kac que permitemrelacionar estes dois topicos. A relacao entre a metodologia classica (aprecamento porEDP) e o aprecamento pela MME foi ressaltada no inıcio do capıtulo 5. Aqui veremoso ponto em comum de ambas metodologias e saberemos como transformar um prob-lema em outro. O ponto central desta abordagem baseia-se no fato de que a solucao deuma equacao diferencial estocastica e um processo Markoviano. Sob esta condicao pode-se deduzir as equacoes de Kolmogorov e Feynman-Kac que farao a conexao mencionada.

Ainda com relacao ao que apresentamos no capıtulo 3, temos a acrescentar alguns topicosem relacao as EDE´s. Naquela oportunidade vimos algumas solucoes para EDE´s sem,no entanto, formalizar os conceitos. Agora vamos apresenta-los neste capıtulo e aindaresolveremos outras equacoes que sao importantes em financas.

As referencias para os assuntos contidos neste capıtulo sao Neftci (2000) [77], Øksendal(2003) [80], Shreve (2004) [94], Klebaner (2001) [62], Elliot e Kopp (2005) [34], Kloedene Platen (1992) [63] e Kloeden, Platen e Schurz (2003) [64].

175

Page 186: Processos Estocásticos em Finanças

6.1 Conceitos basicos

Esta secao apresenta os conceitos da propriedade de Markov. A propriedade Markovpara um processo estocastico estabelece que os futuros valores deste processo nao de-pendem dos valores passados mas somente dos valor(es) atual(is). Se um processo Xt

possui a propriedade de Markov, entao a distribuicao condicional de Xt+s dado Xt = x,nao depende dos valores passados de Xt, mas depende do valor atual Xt = x.

Definicao 6.1. (Propriedade de Markov) Seja Ft a σ-algebra gerada pelo processoXt. Este processo tem a propriedade de Markov se a distribuicao condicional de Xt+s

dado Ft e a mesma distribuicao condicional de Xt+s dado Xt = x, ou seja

P (Xt+s ≤ z|Ft) = P (Xt+s ≤ z|Xt = x) q.c. (6.1)

Vamos estabelecer a seguinte notacao Xxs (t) que representa o valor da variavel X

no instante t que se iniciou no instante s quando seu valor era x. Os processos que saoMarkovianos sao caracterizados por uma funcao densidade de probabilidade p (s, t, x, y)e pela respectiva funcao distribuicao P (s, t, x, y). Seja Xt um processo de Markov, entaoescreve-se

P (x, t, x, y) = P [Xxs (t) < y] q.c. (6.2)

A propriedade de Markov descrita em (6.1) pode ser assim escrita considerando agora0 ≤ s < t e que x0 = x.

P [Xx0 (t) ≤ y|Fs] = P [Xx

0 (t) < y|Xx0 (s)] (6.3)

Ainda podemos escrever que para funcoes de densidade contınuas

P (x, t, x, y) =

∫ y

−∞p (x, t, s, u) du (6.4)

Exemplo 6.1. Verifique a propriedade de Markov para o processo Browniano padrao.

Solucao: Vamos verificar a propriedade de Markov usando o conceito da funcao ger-adora de momentos visto no capıtulo 1. Naquela oportunidade a equacao (1.18) definiua funcao geradora da distribuicao X por

MX (u) = E(euX)

Se a funcao geradora de Bt+s condicional a Ft e a mesma que a funcao geradora condi-cionada a Bt = x, entao as funcoes distribuicoes sao as mesmas e a equacao (6.1) ficaverificada. Entao temos,

E(euBt+s|Ft

)= E

(eu(Bt+s+Bt−Bt)|Ft

)= E

(euBteu(Bt+s−Bt)|Ft

)= euBtE

(eu(Bt+s−Bt)|Ft

)= euBtE

(eu(Bt+s−Bt)

)= euBteu

2 12s

= euBtE(eu(Bt+s−Bt)|Bt = x

)= E

(euBt+s|Bt = x

)176

Page 187: Processos Estocásticos em Finanças

Exemplo 6.2. Considere 0 ≤ s < t, escreva a funcao distribuicao P (s, t, x, y) doprocesso B (t) dado B (s).

Solucao: Do exemplo 6.1 vimos que

P (Bt ≤ y|Fs) = P (Bt ≤ y|Bs)

O processo Browniano neste caso esta condicionado a Bs = x. Sabemos tambem queE (Bt|Bs) = Bs = x para t > s. Logo a distribuicao condicionada de Bt dado Bs e

Bt|Bs ∼ N (x, t− s)

Entao a funcao distribuicao condicional sera

P (s, t, x, y) =

∫ y

−∞

1√2π (t− s)

e−(u−s)22(t−s) du

e a densidade de transicao e

p (s, t, x, y) =1√

2π (t− s)e−

(y−x)2

2(t−s)

A seguir apresentamos o Teorema da Representacao Martingal. Vimos na secao 5.7que podemos montar uma estrategia que replica o preco de uma opcao no vencimentot = T . Sendo o valor do portfolio um processo martingal (sob Q), o valor da opcao emqualquer instante (0 ≤ t ≤ T ) pode ser obtido pela equacao geral de aprecamento. OTeorema da Representacao Martingal (TMR) garante a existencia desta estrategia e porconseguinte da protecao (ou hedging).

Teorema 6.1. (TRM) Seja (Ω,Ft, P ) um espaco de probabilidade, seja Bt um processoBrowniano padrao neste espaco e Ft a filtracao natural gerada por este processo. SejaMt um processo martingal em relacao a Ft, ou seja E (Mt|Fu = Mu) para u < t. Existe

um processo adaptado Ht, com E[∫ T

0H2udu <∞

], tal que

Mt = M0 +

∫ t

0

HudBu (6.5)

O TRM afirma que se Mt e martingal em relacao a filtracao do Browniano, entaoMt e dado pela condicao inicial M0 mais uma integral de Ito. Observe a identidadeda equacao (6.5) com a equacao (5.72). Esta ultima foi consequencia da estrutura dereplicacao (ou protecao adotada). Agora estamos formalizando este resultado. O TRMgarante a existencia do processo Hs (equivalente a q1

uSu na equacao (5.72)) e desta forma,da estrategia que permite o aprecamento.

177

Page 188: Processos Estocásticos em Finanças

6.2 Calculo estocastico multivariado

E frequente em financas tratarmos variaveis que envolvem mais de uma fonte de in-certeza. Por exemplo, o preco a vista de uma commodity pode conter incertezas refer-entes ao curto e ao longo prazos. Os modelos desta natureza serao tratados nos proximoscapıtulos. Tambem e comum tratarmos o preco de um tıtulo com duas fontes de in-certezas. Por exemplo, uma acao de uma empresa em um paıs emergente pode sermodelada com o risco associado ao proprio negocio somado ao risco do paıs onde atua.Assim, e natural que tenhamos interesse em trabalhar com processos estocasticos quereunam multiplas fontes de incertezas. Apresentaremos os detalhes para este tipo demodelgagem ao longo desta secao.

Definicao 6.2. (Browniano multivariado) Define-se um processo Browniano comdimensao m por Bt (ω) = (B1

t (ω) , . . . , Bmt (ω)) para t ≥ 0 onde cada Bi

t (ω) e umBrowniano padrao univariado. Ainda, ao processo Bt (ω) esta associada a filtracaoFt tal que Bt (ω) e adaptado a esta filtracao e os incrementos Bu (ω) − Bt (ω) saoindependentes de Ft para 0 ≤ t < u.

Definicao 6.3. (Processo de Ito multivariado) Considere Bt (ω) t ≥ 0, um Brow-niano de dimensao m. Entao o processo de Ito de dimensao n e dado por

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt (6.6)

O processo estocastico descrito na equacao (6.6) por ser escrito por

dXit = µi (Xt, t) dt+m∑j=1

σij (Xt, t) dBjt i = 1, . . . n

ou ainda na forma integral

Xit = xi0 +

∫ t

0

µi (Xu, u) du+m∑j=1

∫ t

0

σij (Xu, u) dBju i = 1, . . . n (6.7)

onde Xi0 = xi0 e cada µi e σij atendem as condicoes da definicao 3.18.

Considere que os vetores e matrizes acima sejam

Xt =

X1t

. . .Xnt

µ =

µ1

. . .µn

σ =

σ11 . . . σ1m

. . . . . . . . .σn1 . . . σnm

entao o processso descrito na equacao (6.6) pode ser escrito por

dX1t = µ1dt+ σ11dB1t + . . .+ σ1mdBmt

. . . = . . .

dXnt = µndt+ σn1dB1t + . . .+ σnmdBmt

As equacoes acima podem descrever uma economia com n ativos e cada um destes ativoscontem m fatores de risco.

178

Page 189: Processos Estocásticos em Finanças

A formula de Ito para o processo multivariado foi antecipado no capıtulo 3 como umamera extensao do caso univariado. Aqui repetimos a formula de Ito multivariado queseria aplicado ao caso descrito acima. Para tornar a notacao mais simples, em algunscasos, omitiremos o subscrito indicador do “tempo”.

Teorema 6.2. (Formula de Ito multivariado) Sejam X1, X2, . . . , Xn processos deIto univariados dados por

dXi = µi (Xt, t) dt+ σi (Xt, t) dBit i = 1, . . . , n (6.8)

Seja f (X1, . . . , Xn, t), onde f (·) e contınua e diferenciavel duas vezes em relacao ax1, . . . , xn e uma vez em relacao a t (com derivadas contınuas), entao o diferencialdf (·) e dado por

df (X1, . . . , Xn, t) =∂f

∂tdt+

∑i

∂f

∂xidXi +

1

2

∑i,j

∂2f

∂xi∂xjdXidXj (6.9)

onde dBXidBXj = ρijdt, i 6= j, e ρij e a correlacao entre os Brownianos i e j.

Exemplo 6.3. Considere o processo Xt = eµt+σ1B1t+σ2B2t em que t ≥ 0, µ, σ1, σ2 saopositivos e ρ12dt = dB1tdB2t. Calcule dXt.

Solucao: Considere f (x1, x2, t) = eµt+σ1B1t+σ2B2t . Entao temos

∂f

∂x1

= eµt+σ1x1+σ2x2σ1 = f (x1, x2, t)σ1∂2f

∂x21

= σ21f (·)

∂f

∂x2

= eµt+σ1x1+σ2x2σ2 = f (x1, x2, t)σ2∂2f

∂x22

= σ22f (·)

∂f

∂x1∂x2

= eµt+σ1x1+σ2x2σ1σ2 = f (x1, x2, t)σ1σ2∂f

∂t= µf (·)

Usando a equacao (6.9), temos

dXt = µfdt+ fσ1dB1t + fσ2dB2t +1

2

[σ2

1f (dB1t)2 + σ2

2f (dB2t)2 + 2σ1σ2fdB1tdB2t

]dXt = µXtdt+ σ1XtdB1t + σ2XtdB2t +

1

2σ2

1Xtdt+1

2σ2

2Xtdt+ σ1σ2Xtρ12dt

dXt

Xt

=

(µ+

1

2σ2

1 +1

2σ2

2 + σ1σ2ρ12

)dt+ σ1dB1t + σ2dB2t

O teorema 6.1 (TRM) pode ser estendido para o caso multivariado e entao o teoremagarante a existencia de um processo adaptado Hs multivariado, em que poderıamosimaginar a sua aplicacao ao caso de uma economia com n ativos. A existencia doprocesso adaptado assegura a possibilidade de protecao (hedge) em tal economia.

179

Page 190: Processos Estocásticos em Finanças

Exercıcio 6.1. Seja (Ω,F , P ) um espaco de probabilidade. Considere os seguintes pro-cessos definidos neste espaco: (i) dχt = −kχtdt + σχdBχt (ii) dξt = µξdt + σξdBξt

com ρdt = dBχtdBξt, onde k, σχ e σξ sao positivos. Ainda, Ft e a σ-algebra tal queBt (ω) = (Bχt , Bξt) e adaptado a Ft. Seja lnSt = χt+ξt, onde St e o preco a vista. Estee o modelo de dois fatores de Schwartz e Smith (2000) [89] na modelagem dos precos decommodities. Os dois fatores que descrevem o preco a vista sao as variacoes de curtoprazo χt e o preco de equilıbrio de longo prazo ξt. Voltaremos a este modelo quandotratarmos da modelagem de commodities.

(i) Encontre as solucoes para χt e ξt,

(ii) Calcule EP (χt) e V arP (χt),

(iii) Calcule EP (ξt) e V arP (ξt),

(iv) Calcule a CovP (χt, ξt),

(v) Calcule EP (St),

(vi) Calcule dSt.

Exemplo 6.4. Retome o enunciado do exercıcio 6.1. Suponha que ambos os processossejam referentes a um contexto de um mercado onde nao ha arbitragem. Escreva ambosos processos na MME.

Solucao: Para dχt = −kχtdt + σχdBχt vamos considerar o teorema de Girsanov emque Bχt = Bχt + θχt onde θχ e o preco do risco de mercado de χt e Bχt e o processoBrowniano padrao sob Q. Levando na equacao anterior, temos

dχt = −kχtdt+ σχ

(dBχt − θχdt

)dχt = − (kχt + θχ) dt+ σχdBχt

Para dξt = µξdt + σξdBξt definimos θξ como o preco do risco de mercado para ξt e deforma similar teremos

dξt = (µξ − θξ) dt+ σξdBξt

Exercıcio 6.2. Considere o enunciado do exercıcio 6.1 e os resultados do exemploanterior.

(i) Encontre as solucoes para χt e ξt sob a medida Q,

(ii) Calcule EQ (χt) e V arQ (χt),

(iii) Calcule EQ (ξt) e V arQ (ξt),

(iv) Calcule a CovQ (χt, ξt),

(v) Calcule EQ (St).

180

Page 191: Processos Estocásticos em Finanças

6.3 Gerador de difusao de Ito

Estamos caminhando no sentido de estabelecermos uma conexao entre os conceitos devalor esperado condicional e de EDP´s. Nesta secao iremos definir o gerador de difusaode Ito, um importante conceito neste topico.

O processo de Ito univariado foi definido pela equacao (3.35) (ou equivalentementepela equacao (3.36)). O processo de Ito multivariado foi definido pela equacao (6.6) (ouequivalentemente pela equacao (6.7)).

Quando os coeficientes destas equacoes sao independentes do tempo, temos o que sedenomina por difusao homogenea de Ito (ou simplesmente difusao de Ito). Assim, paraos casos univariado e multivariado, temos as respectivas difusoes

dXt = µ (Xt) dt+ σ (Xt) dBt t ≥ 0 (6.10)

dXt = µ (Xt) dt+ σ (Xt) dBt t ≥ 0 (6.11)

E imediato, neste estagio do texto, observar que o processo geometrico Browniano podeser definido a partir da EDE (6.10) considerando µ (Xt) = µXt e σ (Xt) = σXt.

Definicao 6.4. (Propriedade de Markov para difusao) Seja Xt uma difusao deIto conforme a EDE (6.10). Seja f uma funcao limitada e Ft a σ-algebra natural geradapelo processo Browniano padrao. Dizemos que Xt satisfaz a propriedade de Markov parah > 0 se

E [f (Xt+h) |Ft] = E [f (Xt+h) |Xt = x] (6.12)

Esta definicao da propriedade de Markov e identica a aquela da secao 6.1, poremagora colocada em termos do valor esperado condicional. A equacao (6.12) significaque a previsao do valor de X dadas as informacoes ate o instante t e identica aquela seconsiderarmos que o processo incia-se em t. Isto e o mesmo que dizer que as informacoespassadas do processo nao ajudam na sua previsao futura.

Exercıcio 6.3. Mostre que sao Markovianos os processos estocasticos abaixo definidosno espaco (Ω,F , P ).

(i) dXt = µdt+ σdBt X0 = 0

(ii) dXt = µXtdt+ σXtdBt X0 = x

Definicao 6.5. (Gerador de difusao de Ito univariado) Seja Xt uma difusao deIto conforme a EDE (6.10) com X0 = x. Seja f uma funcao contınua e duas vezesdiferenciavel (com derivadas contınuas). O gerador de difusao de Ito e definido por

Lf (x) = limt→0

E (f (Xt) |x)− f (x)

t(6.13)

O gerador de difusao de Ito define a taxa de variacao do valor esperado de f (Xt).

181

Page 192: Processos Estocásticos em Finanças

Vamos aplicar a formula de Ito para calcular d (f (Xt)). Temos que

d [f (Xt)] =∂f

∂xdXt +

1

2

∂2f

∂x2(dXt)

2

=∂f

∂x[µ (x) dt+ σ (x) dBt] +

1

2σ2 (x)

∂2f

∂x2dt

=

[µ (x)

∂f

∂x+

1

2σ2 (x)

∂2f

∂x2

]dt+ σ (x)

∂f

∂xdBt

ou equivalentemente

f (Xt)− f (X0) =

∫ t

0

(µ (x)

∂f

∂x+

1

2σ2 (x)

∂2f

∂x2

)du+

∫ t

0

σ (x)∂f

∂xdBu

Se tomarmos o valor esperado da equacao acima temos o numerador da equacao (6.13)que dividido por t e levado ao limite quando t tende a zero, resulta em

Lf (x) = µ (x)∂f

∂x+

1

2σ2 (x)

∂2f

∂x2(6.14)

Note que o operador Lf (x) e um operador que contem a tendencia (drift) do processode d [f (Xt)].

Exemplo 6.5. Encontre o gerador da difusao de Ito para os seguintes processos es-tocasticos, t ≥ 0:

(i) dXt = µXtdt+ σXtdBt

(ii) dYt = k (θ − Yt) dt+ σYtdBt, k > 0, θ > 0

(iii) dZt = (r − α)Ztdt+ σ√ZtdBt, r > 0, α > 0

Solucao:

(i) Usando a equacao (6.14) onde µ (x) = µx e σ (x) = σx, temos

Lf (x) = µx∂f

∂x+

1

2σ2x2∂

2f

∂x2

(ii) Neste caso temos µ (y) = k (θ − y) e σ (y) = σy, portanto

Lf (y) = k (θ − y)∂f

∂y+

1

2σ2y2∂

2f

∂y2

iii) Temos que µ (z) = (r − α) z e σ (z) = σ√z, logo

Lf (z) = (r − α) z∂f

∂z+ σ2z

∂2f

∂z2

182

Page 193: Processos Estocásticos em Finanças

Definicao 6.6. (Gerador de difusao de Ito multivariado) Considere uma difusaode Ito multivariada em que a EDE e dada por

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt t ≥ 0 (6.15)

onde µ (Xt) e um vetor n × 1, os termos µi sao todos funcao de Xt, σ (Xt) e umamatriz n×m, os termos σij sao todos funcao de Xt e dBt e o Browniano multivariadode ordem m. Seja f uma funcao limitada de duas vezes diferenciavel (com derivadascontınuas), o gerador de difusao e dado por

Lf (x) =∑i

µi (x, t)∂f

∂xi+

1

2

∑i,j

(σσ>

)i,j

(x, t)∂2f

∂xixj(6.16)

Definimos acima o gerador de difusao de Ito para uma difusao em que temos n EDE´se cada uma possui m Brownianos padroes. No caso de termos um processo de difusaode ordem n significa que estamos nos referindo a n EDE´s com n Browninanos padroes.

Exemplo 6.6. Encontre o gerador de difusao de Ito para os seguintes casos

(i) dXt = µXtdt+Xt (σ1dB1t + σ2dB2t) , σ1 > 0, σ2 > 0, µ ∈ R

(ii)

[dχtdξt

]=

[−kχtµ

]dt+

[σχ 00 σξ

] [dBχt

dBξt

], k > 0, σχ > 0, σξ > 0, µ ∈ R

Solucao:

(i) Temos que o vetor de tendencia e simplesmente µ (x) = µx. A matriz de varianciae σ (x) =

[σ1x σ2x

]. Portanto temos:

σσ> (x) =[σ1x σ2x

] [ σ1xσ2x

]σσ> = σ2

1x2 + σ2

2x2

O gerador de difusao de Ito sera

Lf (x) = µx∂f

∂x+

1

2

(σ2

1 + σ22

)x2∂

2f

∂x2

(ii) Para simplificar a notacao vamos considerar x1 = χ e x2 = ξ. Note que o primeirotermo do segundo membro da equacao (6.16) e um produto escalar, ou mais apropriada-mente, o gradiente de f multiplicado pelo vetor de tendencia do processo. O primeirotermo do gerador sera[

∂f∂x1

∂f∂x2

]·[−kx1

µ

]= −kx1

∂f

∂x1

+ µ∂f

∂x2

A matriz σσ> e dada por

σσ> =

[σx1 00 σx2

] [σx1 00 σx2

]=

[σ2x1

00 σ2

x2

]183

Page 194: Processos Estocásticos em Finanças

Portanto o gerador de difusao sera

Lf (x) = −kx1∂f

∂x1

+ µ∂f

∂x2

+1

2

(σ2x1

∂2f

∂x21

+ σ2x2

∂2f

∂x22

)

Exercıcio 6.4. Encontre os geradores de difusao de Ito dos seguintes processos:

(i)

[dX1t

dX2t

]=

[µ1

µ2X2t

]dt+

[σ1 00 σ2X2t

] [dB1t

dB2t

]

(ii)

[dXt

dYt

]=

[rXt

µYt

]dt+

[eXt

0

]dBt onde Bt e univariado

(iii)

[dXt

dYt

]=

[1µ

]dt+

[0σ

]dBt onde Bt e univariado

Exercıcio 6.5. Encontre os processos estocasticos para os quais os geradores de difusaode Ito estao dados abaixo:

(i) Lf (x) = 2x∂2f∂x2 + ∂f

∂x

(ii) Lf (x) = 12

(∂2f∂x2

1

)+ r ∂f

∂x1+ µ ∂f

∂x2

(iii) Lf (x) = ∂f∂t

+ µ∂f∂x

+ ∂2f∂x2

Exercıcio 6.6. (Processo de Bessel) Seja Bt um Browniano multivariado de di-mensao m. Considere Rt =

∑mi=1B

2it.

(i) Mostre que dRt = mdt+ 2∑m

i=1BitdBit

(ii) Considere Zt = R12t . Mostre dZt = m−1

2Zt+ dBt. Zt e o processo de Bessel.

(iii) Mostre que o gerador de difusao de Ito e dado por Lf (z) = 12f ′′ (z) + m−1

2zf ′ (z).

Este e o operador diferencial de Bessel (por esta razao a denominacao de processode Bessel para Zt).

6.4 Equacao de Kolmogorov

A equacao backward de Kolmogorov fornece a relacao que ha entre o valor esperadocondicional e a correspondente EDP. Desta maneira ficara clara a relacao entre asmetodologias de aprecamento vistas nos capıtulos 4 e 5.

Seja Xt uma difusao de Ito multivariada de ordem n. Seja f uma funcao limitadae duas vezes diferenciavel e com derivadas contınuas. Vamos definir o seguinte valoresperado

h (x, t) = E [f (Xt) |x] (6.17)

184

Page 195: Processos Estocásticos em Finanças

onde x significa o ultimo valor de X que precede Xt. Se diferenciarmos em relacao a t,teremos

∂h

∂t= E [Lf (Xt)] (6.18)

A equacao (6.18) mostra como o valor de esperado de f (Xt) evolui no tempo.

Teorema 6.3. (Equacao backward de Kolmogorov) Seja Xt uma difusao mul-tivarida sendo x ∈ Rn e 0 ≤ s < t. Considere f uma funcao limitada duas vezesdiferenciavel com derivadas contınuas. Seja Xs = x e p (s, t, x, y) a funcao densidadede transicao em y. Dado que

h (x, s) = E [f (Xt) |x] =

∫Rnf (y) p (s, t,x,y) dy (6.19)

entao∂h (x, s)

∂s+ Lh (x, s) = 0 (6.20)

h (x, s) = f (x) (6.21)

O teorema acima afirma que a solucao do problema dado pela EDP (6.20) com acondicao inicial (6.21) e a equacao (6.19) onde a solucao h (x, s) e o valor esperadocondicional de f (Xt). A equacao (6.20) escrita em termos das variaveis x e s e denomi-nada equacao backward de Kolmogorov. A demonstracao pode ser vista nas referenciasmencionadas.

Exemplo 6.7. Considere x ∈ R, s > 0 e f limitada e duas vezes diferenciavel comderivadas contınuas. Seja o seguinte problema de valor inicial(

∂s+ µx

∂x+

1

2σ2x2 ∂

2

∂x2

)h (x, s) = 0 (6.22)

h (x, 0) = f (x) (6.23)

Encontre a funcao v (x, s).

Solucao: Vamos usar a equacao backward de Kolmogorov. Pelo teorema 6.3 vemosque a equacao (6.20) se refere a EDP dada. Entao temos que encontrar a difusao deIto (EDE) que tem como gerador a EDP acima sem o termo que envolve a derivada emrelacao ao tempo. Em outras palavras

∂h

∂s+ Lh =

∂h

∂s+ µx

∂h

∂x+

1

2σ2x2∂

2h

∂x2= 0 (6.24)

Sabemos que o gerador de difusao de Ito univariado e dado por

Lg (x) = µ (x)∂g

∂x+

1

2σ2 (x)

∂2g

∂x2

Logo temos µ (x) = µx e σ (x) = σx, portanto a difusao (EDE) e

dXt = µXtdt+ σXtdBt (6.25)

185

Page 196: Processos Estocásticos em Finanças

Temos em (6.24) o problema identico a (6.20) onde Xt e dado por (6.25). A EDE (6.25)refere-se ao processo geometrico Browniano cuja solucao e dada por

Xt = Xse(µ− 1

2σ2)(t−s)+σBt−s

Denominando δ = µ− 12σ2, temos Xt = Xse

δ(t−s)+σBt−s.

Agora que conhecemos Xt vamos usar a equacao (6.19) com Xs = x e considerary = Bt|Bs ∼ N (x, t− s). Sabemos entao que y ∈ R. Logo temos

h (x, s) = E[f(Xse

δ(t−s)+σy|Xs = x)]

h (x, s) =

∫ ∞−∞

f(xeδ(t−s)+σy

) 1√2π (t− s)

e−(y−x)2

2(t−s) dy, t > 0

h (x, s) =1√

2π (t− s)

∫ ∞−∞

f(xeδ(t−s)+σy

)e−

(y−x)2

2(t−s) dy, t > 0

Na equacao backward de Kolmogorov expressamos o resultado em termos das variaveisx e s, daı a denominacao de backward. As variaveis t e y sao fixas.

Exercıcio 6.7. Considere o mesmo enunciado do exemplo 6.7. Encontre a solucao parao seguinte problema de valor inicial

∂h

∂s+ µ

∂h

∂x+

1

2σ2∂

2h

∂x2= 0 s > 0, x ∈ R

h (x, 0) = f (x)

Exercıcio 6.8. Seja a difusao de Ito dada por

dXt = µ (Xt, t) dt+ σ (Xt, t) t > s

Seja s o instante inicial tal que Xs = x e 0 ≤ s < t. A funcao densidade de transicaonao negativa e p (s, t, x, y). Mostre que esta funcao satisfaz a equacao backward deKolmogorov

∂h (x, s)

∂s+ Lh (x, s) = 0

isto e∂p (s, t, x, y)

∂s+ µ (x, s)

∂p (s, t, x, y)

∂x+

1

2σ2 (x, s)

∂2p (s, t, x, y)

∂x2= 0

Exercıcio 6.9. Seja o Browniano padrao Bt, t ≥ 0.

(i) Escreva a funcao densidade de transicao p (t, x, y) para t > 0;

(ii) Verifique que a densidade de transicao satisfaz a equacao de difusao

∂p

∂t=

1

2

∂2p

∂y2

186

Page 197: Processos Estocásticos em Finanças

Considere agora f (Xt, t) eXt uma difusao de Ito univariada tal que dXt = µ (Xt) dt+σ (Xt) dBt. Admita tambem todas as consideracoes feitas ao longo desta secao. Temosda formula de Ito que

d [f (Xt, t)] =∂f

∂tdt+

∂f

∂xdXt +

1

2

∂2f

∂x2(dXt)

2

d [f (Xt, t)] =∂f

∂tdt+

∂f

∂xµ (x) dt+

∂f

∂xσ (x) dBt +

1

2

∂2f

∂x2σ2 (x) dt

d [f (Xt, t)] =

(∂f

∂t+ µ (x)

∂f

∂x+

1

2σ2 (x)

∂2f

∂x2

)dt+ σ (x)

∂f

∂xdBt

Usando o fato de que

Lf (x) = µ (x)∂f

∂x+

1

2σ2 (x)

∂2f

∂x2

podemos escrever

d [f (Xt, t)] =

(∂f

∂t+ Lf (x)

)dt+ σ (x)

∂f

∂xdBt

integrando temos

f (Xt, t)− f (X0, 0) =

∫ t

0

(∂f

∂u+ Lf (x)

)du+

∫ t

0

σ (x)∂f

∂xdBu

A ultima integral do lado direito e uma integral de Ito e portanto e martingal. Denotandoesta integral por Mt, temos

f (Xt, t)− f (X0, 0) =

∫ t

0

(∂f

∂u+ Lf (x)

)du+Mt

ou ainda

Mt = f (Xt, t)− f (X0, 0)−∫ t

0

(∂f

∂u+ Lf (x)

)du (6.26)

Isto mostra que o lado direito da equacao (6.26) e um processo martingal. Uma con-sequencia imediata do resultado em (6.26) e que se f (x, t) satisfaz a equacao

∂f

∂t+ Lf (x) = 0

entao f (Xt, t)− f (X0, 0) e um processo martingal.

Exemplo 6.8. Seja a difusao de Ito dXt = dt + dBt, cuja solucao para X0 = 0 eXt = t+Bt. Seja a EDP

1

2

∂2f

∂x2+∂f

∂x= 0 (6.27)

Mostre que se f (x, t) satisfaz a equacao (6.27), entao f (Xt, t) e um processo martingal.

187

Page 198: Processos Estocásticos em Finanças

Solucao: Primeiramente note que o gerador Lf (x) da difusao de Ito e a equacao (6.27),ou seja

Lf (x) =∂f

∂x+

1

2

∂2f

∂x2

A solucao de Lf (x) = 0 e f (x) = 1 + e−2x. Portanto, f (Xt, t) = 1 + e−2Bt−2t. Paramostrar que f (Xt, t) e martingal basta observar que e−2Bt−2t e martingal, ou seja

E(e−2Bt−2t|Fs

)= e−2Bs−2s

Exercıcio 6.10. Admita as mesmas consideracoes para a funcao f que foram enunci-adas ao longo desta secao. Seja f (Bt, t) = t2B5

t , t ≥ 0.

(i) Encontre o gerador de difusao de Ito,

(ii) Escreva a equacao (6.26) para o processo em questao. Calcule entao o E (f (Xt, t) |Fs),onde Fs e a filtracao natural do Browniano padrao.

Exercıcio 6.11. Seja o processo de Ornstein-Uhlenbeck descrito na equacao (3.54) ereescrito como dXt = (θ −Xt) dt+ σdBt, onde θ > 0, σ > 0 e X0 = x.

(i) Encontre o gerador da difusao de Ito,

(ii) Escreva a equacao backward de Kolmogorov,

(iii) Encontre a solucao geral.

Esta secao mostrou como resolver um problema de valor inicial atraves do calculo dovalor esperado condicional. Sendo o problema de valor inicial essencialmente a resolucaode uma EDP, entao podemos obte-la por meio do calculo do valor esperado condicional.Este e o ponto por onde das duas metodologias estao conectadas. O aprecamento deuma opcao pode ser feito pelo calculo do valor esperado condicional (capıtulo 5) ou pelasolucao de uma EDP (capıtulo 4). Neste capıtulo mostramos que a equacao backwardde Kolmogorov estabelece o elo entre a solucao da EDP e o caculo do valor esperadocondicional.

6.5 Equacao de Fokker-Planck

A secao anterior mostrou a relacao entre o calculo da esperanca condicional e a solucaode uma EDP (equacao backward de Kolmogorov). Esta equacao e escrita em termos dasvariaveis x e s da funcao densidade de transicao. Agora veremos que tambem podemosescrever uma equacao diferencial parcial em termos das variaveis forward y e t. Trata-seda equacao de Fokker-Planck ou da equacao forward de Kolmogorov.

Teorema 6.4. (Equacao de Fokker-Planck) Seja a difusao multivariada de Ito dadapor

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt

188

Page 199: Processos Estocásticos em Finanças

sendo x ∈ Rn, 0 ≤ s < t e µ (x, t) e σ (x, t) sao funcoes que atendem as condicoesde Holder em relacao a x e t. Seja p (s, t,x,y) a funcao densidade de transicao em y,entao ela satisfaz a equacao de Fokker-Planck ( equacao forward de Kolmogorov)

−∂p (s, t,x,y)

∂t+

1

2

∂2

∂y2

[σ2 (y, t) p (s, t,x,y)

]− ∂

∂y[µ (y, t) p (s, t,x,y)] = 0 (6.28)

Na equacao (6.28) s e x sao fixas e as variaveis sao y e t, daı a denominacao forward.O Apendice deste capıtulo apresenta o conceito de volatilidade local que faz uso daequacao de Fokker-Planck. Porem antes vejamos a equacao de Feynman-Kac e a suaaplicacao ao aprecamento de uma opcao de compra Europeia.

6.6 Equacao de Feynman-Kac

Esta secao apresenta dos detalhes da equacao de Feynman-Kac que se constitui numaextensao da equacao de Kolmogorov vista na secao anterior.

Teorema 6.5. (Equacao de Feyman-Kac) Seja f uma funcao limitada, duas vezesdiferenciavel e com derivadas contınuas. Seja q uma funcao tambem limitada. Considere0 ≤ s < t e x ∈ Rn. Seja Xt uma difusao multivariada de Ito com Xs = x e L o geradorde difusao multivariado de Ito. Define-se v (x, s) por

h (x, s) = E[e−

∫ ts q(Xu)duf (Xt) |x

](6.29)

Entao∂h (x, s)

∂s+ Lh (x, s) = qh (x, s) (6.30)

h (x, t) = f (x) (6.31)

O teorema 6.5 estabelece que a solucao para o problema de valor final dado pelasequacoes (6.30) e (6.31) e a equacao (6.29), e esta solucao e unica. Veja a demonstracaodo teorema 6.5 nas referencias mencionadas no inıcio do capıtulo.

No que se segue vamos utilizar a equacao de Feynman-Kac para encontrar a solucaodo modelo de BMS. Vimos no capıtulo 4 que a EDP do modelo de BMS e dada pelaequacao (4.12) e abaixo reescrita.

∂c

∂t+ rX

∂c

∂x+

1

2σ2X2 ∂

2c

∂x2= rc (6.32)

com a consideracao de que c e a opcao de compra Europeia e e funcao de Xt e t, eescrevemos ct = f (x, t). Tambem ha que se observar que t e o tempo corrente tal que0 ≤ t ≤ T e T e a data do vencimento. A taxa livre de risco e constante ao longo dovencimento e o mesmo ocorre com a volatilidade σ do ativo subjacente. A condicaoterminal e dada por

c (XT , T ) = (XT −K)+ (6.33)

onde XT e o preco do ativo no vencimento e K > 0 e o preco de exercıcio.

189

Page 200: Processos Estocásticos em Finanças

Das secoes anteriores sabemos que o gerador de difusao de Ito do processo geometricoBrowniano, escrito sob a MME, e

Lg (x) = rx∂g

∂x+

1

2σ2x2 ∂

2g

∂x2

Em outras palavras, a equacao (6.32) pode ser escrita por

∂c

∂t+ Lc = rc (6.34)

Observe a correspondencia entre as equacoes (6.34) e (6.30). Da mesma forma entre asequacoes (6.33) e (6.31). Considerando h (x, t) ≡ ct = f (x, t) onde x ∈ R+ e Xt = x,podemos escrever

∂h

∂t+ rX

∂h

∂x+

1

2σ2X2∂

2h

∂x2= rh 0 ≤ t ≤ T (6.35)

e a condicao terminal serah (xT , T ) = (xT −K)+ (6.36)

Temos portanto um problema de valor final e vamos usar a equacao de Feynman-Kac (6.29) para resolve-lo. O valor da opcao e ct = h (x, t) que calculado pelo valoresperado condicional e

h (x, t) = E[e−

∫ Tt q(Xu)duf (XT ) |XT |x

](6.37)

Comparando a equacao (6.34) com a equacao (6.30) vemos que q = r, que e constante,conforme a hipotese do modelo. O processo estocastico geometrico Browniano escritosob a MME e

dXt = rXtdt+ σXtdBt 0 ≤ t ≤ T (6.38)

A solucao desta EDE e

xT = xe(r−12σ2)τ+σBτ (6.39)

onde τ = T − t. A solucao para o valor da opcao h (x, t) sera obtido a partir daequacao (6.37). Como o processo esta escrito sob a MME usaremos a indicacao do valoresperado sob esta medida, teremos

h (x, t) = EQ[e−

∫ Tt rduf (XT ) |x

]Ja sabemos que o valor esperado condicional acima e identico ao valor esperado incondi-cional, isto e

h (x, t) = EQ[e−r(T−t)f

(xe(r−

12σ2)τ+σBτ

)](6.40)

Sabemos que Bτ ∼ N (0, τ). Entao podemos escrever w = Bτ√τ∼ N (0, 1). Alem disso

temos que h (xT , T ) = (xT −K)+. Levando estas consideracoes em (6.40) temos

h (x, t) =e−r(T−t)√

∫ ∞−∞

(xe(r−

12σ2)τ+σ

√τw −K

)+

e−w2

2 dw (6.41)

190

Page 201: Processos Estocásticos em Finanças

Observe que a equacao (6.41) e similar a equacao (5.50) guardando obviamente as al-teracoes na notacao (h (x, t) em (6.41) e o preco da opcao cujo ativo subjacente tempreco inicial x equivalendo a ct em (5.50) cujo ativo subjacente tem preco inicial s).Note que o valor esperado foi calculado em relacao a medida neutra pois a difusao es-tava sob esta medida. O desenvolvimento subsequente a (6.41), ate a equacao final domodelo de BMS, demanda somente algebrismo e deixamos esta tarefa para o leitor.

6.7 Equacoes diferenciais estocasticas

6.7.1 Definicoes basicas

Definicao 6.7. Seja Xt, t ≥ 0 um processo estocastico em (Ω,F , P ). Seja Bt umBrowniano padrao neste espaco. Uma equacao da forma

dXt = µ (Xt, t) dt+ σ (Xt, t) dBt (6.42)

onde µ (x, t) e σ (x, t) sao processos adaptados, e denominada de EDE. Xt e a solucaode (6.42). Definiremos as condicoes sob as quais a EDE (6.42) admite solucao.

Vimos alguns exemplos de EDE´s no capıtulo 3 tais como (i) EDE do processogeometrico Browniano, (ii) equacao de Langevin e (iii) equacao de Ornstein-Uhlenbeck.

Definicao 6.8. (Exponencial estocastico) Seja Xt um processo estocastico de variacaofinita e seja Yt dado por

dYt = YtdXt (6.43)

com Y0 = 1, entao Yt e definido como exponencial estocastico de Xt.

A solucao de (6.43) e dada por

Yt = eXt−X0− 12

[X,X](t) (6.44)

onde [X,X] (t) e a variacao quadratica de X conforme a definicao 3.4 e Xt segue adinamica em (6.42).

Para mostrar que (6.44) e a solucao de (6.43) vamos considerar que

Zt = Xt −X0 −1

2[X,X] (t) (6.45)

Portanto temosYt = eZt (6.46)

e usando a formula de Ito para calcular dYt podemos verificar se obtemos (6.43). Temosque

dYt = d(eZt)

= eZtdZt +1

2eZtd [Z,Z] (t)

A variacao quadratica de Z e finita e e a mesma de X, entao temos

dYt = eZt(dXt −

1

2d [X,X] (t)

)+

1

2eZtd [X,X] (t)

= eZtdXt

= YtdXt

como prentendıamos verificar.

191

Page 202: Processos Estocásticos em Finanças

Exemplo 6.9. Calcule o exponencial estocastico Yt de Xt onde dXt = rdt + σBt, r >0, σ > 0, sendo que dYt = YtdXt.

Solucao: Da equacao (6.44) podemos escrever

Yt = eXt−X0− 12

[X,X](t)

Mas X0 = 0 e [X,X] (t) = σ2t. Logo ficamos com

Yt = ert+σBt−12σ2t = e(r−

12σ2)t+σBt

A solucao Xt da EDE (6.42) pode ser tomada sob duas perspectivas: (i) solucaoforte e (ii) solucao fraca. A solucao forte e a representacao de Xt por um processoestocastico que e funcao de Bt atendendo a equacao (6.42). Quando a solucao forte naoexiste a EDE pode ter sua solucao na forma de distribuicao, que por sua vez pode serdefinida em outro espaco de probabilidade. Esta e denominada solucao fraca da EDE.Neste texto trataremos apenas da solucao forte. Para maiores detalhes da solucao fracarecomendamos as referencias mencionadas no inıcio do capıtulo.

6.7.2 Solucao forte da EDE

Seja a EDE (6.42) com as respectivas consideracoes da definicao 6.7. A seguir definimosa solucao forte.

Definicao 6.9. (Solucao forte) A solucao da EDE (6.42) Xt, e dita forte se Xt euma funcao f (Bu, t) u ≤ t; se as integrais atendem as condicoes∫ t

0

µ (Xu, u) du <∞ q.c.

∫ y

0

|σ (Xu, u) |dBu <∞ q.c.

e se a equacao de Xt na forma integral

Xt = X0 +

∫ t

0

µ (Xu, u) du+

∫ t

0

σ (Xu, u) dBu (6.47)

e atendida.

Exemplo 6.10. Retome o exemplo anterior, encontre a solucao forte da EDE

dYt = rYtdt+ σYtdBt

Solucao: A EDE acima pode ser escrita por dYt = (rdt+ σdBt)Yt. Tambem sabemosque Xt = rt + σBt. Logo a equacao acima e dYt = YtdXt. Vimos que a solucao doexponencial estocastico de Xt e

Yt = e(r−12σ2)t+σBt

Ou ainda a solucao da EDE pode ser escrita por

f (xt, t) = e(r−12σ2)t+σxt

192

Page 203: Processos Estocásticos em Finanças

O exercıcio que se segue e identico ao exercıcio 3.16. Se o leitor je resolveu-o escrevaa solucao na forma f (xt, t). Se ha alguma dificuldade em resolve-lo, a proxima secao oajudara a encontrar a solucao.

Exercıcio 6.12. Considere a EDE

dXt = k (θ −Xt) dt+ σdBt X0 = 1 t ≥ 0

onde k > 0, σ > 0 e θ representa a media de longo prazo de Xt. Encontre a solucaoforte de Xt.

6.7.3 Solucao geral da EDE

Nesta secao apresentamos a EDE na sua forma mais completa e formalizamos a suasolucao.

Seja Xt, t ≥ 0 um processo estocastico em (Ω,F , P ). Seja Bt um Browniano padraoneste espaco com a filtracao natural Ft. Considere a EDE definida por

dXt = (mt + ntXt) dt+ (pt + qtXt) dBt (6.48)

onde mt, nt, pt e qt sao processos adaptados e aqui serao tratados como funcoes deter-minısticas do tempo.

Desejamos encontrar a solucao de Xt para estas condicoes. Vamos proceder em duas eta-pas, primeiramente vamos buscar a solucao particular para o caso em que mt = pt = 0.Posteriormente apresentaremos a solucao geral.

Solucao particular (mt = pt = 0)

Sob esta condicao temos que a equacao (6.48) e escrita como

dSt = ntStdt+ qtStdBt (6.49)

Esta equacao tambem pode ser escrita por

dSt = (ntdt+ qtdBt)St

Fazendo dYt = ntdt+ qtdBt temos que (6.49) toma a forma do exponencial estocastico

dSt = StdYt (6.50)

St e o exponencial estocastico de Yt e a sua solucao e dada por

St = S0eYt−Y0− 1

2[Y,Y ](t) (6.51)

Por outro lado, sabemos que Yt na forma integral e dado por

Yt = Y0 +

∫ t

0

nudu+

∫ t

0

qudBu (6.52)

193

Page 204: Processos Estocásticos em Finanças

A variacao quadratica de Y e data por d [Y, Y ] (t) = q2t dt, consequentemente temos

[Y, Y ] (t) =

∫ t

0

q2udu (6.53)

Levando os resultados de (6.52) e (6.53) em (6.51), temos:

St = S0e∫ t0 nudu+

∫ t0 qudBu−

12

∫ t0 q

2udu

St = S0e∫ t0 (nu− 1

2q2u)du+

∫ t0 qudBu (6.54)

Solucao geral

A solucao geral com mt 6= 0 e pt 6= 0 faz uso da solucao particular vista anteriormente.Vamos buscar a solucao geral da forma

Xt = StYt (6.55)

Neste caso consideramos St como

dSt = ntStdt+ qtStdBt (6.56)

que e a equacao (6.49) com solucao ja conhecida. Seja Yt dado por

dYt = gtdt+ htdBt (6.57)

onde gt e ht sao processos adaptados considerados como funcoes determinısticas dotempo e serao avaliados abaixo.

Vamos considerar que S0 = 1 de tal modo que X0 = Y0. Diferenciando Xt e usando aformula de Ito, obtemos

dXt = StdYt + YtdSt + dStdYt

dXt = St (gtdt+ htdBt) + Yt (ntStdt+ qtStdBt) + qthtStdt

dXt = (gtSt + qthtSt + ntXt) dt+ (htSt + qtXt) dBt (6.58)

Comparando (6.48) com (6.58), temos que

htSt = pt ⇒ ht =ptSt

(6.59)

gtSt + qthtSt = mt (6.60)

Usando (6.59) em (6.60), temos

gtSt + qtct = mt

gt =mt − qtpt

St(6.61)

Portanto a solucao geral sera

Xt = St

(Y0 +

∫ t

0

mu − qupuSu

du+

∫ t

0

puSudBu

)194

Page 205: Processos Estocásticos em Finanças

Como Y0 = X0, temos

Xt = St

(X0 +

∫ t

0

mu − qupuSu

du+

∫ t

0

puSudBu

)(6.62)

onde St e dado por (6.54) com S0 = 1.

Exemplo 6.11. Considere o enunciado do exercıcio 6.12. Encontre a solucao forte deXt usando (6.62).

Solucao: Comparando a EDE do exercıcio 6.12 com a equacao (6.48), podemos escr-ever

mt = kθ nt = −k pt = σ e qt = 0

logo usando (6.62), temos

Xt = St

(1 +

∫ t

0

Sudu+

∫ t

0

σ

SudBu

)com St sendo dado por (6.54), ou seja

St = e∫ t0 −kdu = e−kt

Portanto

Xt = e−kt(

1 +

∫ t

0

kθekudu+

∫ t

0

σekudBu

)Xt = e−kt +

∫ t

0

kθe−k(t−u)du+

∫ t

0

σe−k(t−u)dBu (6.63)

ou ainda

f (xt, t) = e−kt +

∫ t

0

kθe−k(t−u)du+

∫ t

0

σe−k(t−u)dxt

Exercıcio 6.13. Considere o modelo de reversao geometrico dado por

dXt = k (µ− lnXt)Xtdt+ σXtdBt

Encontre a solucao forte de Xt sob a MME (Sugestao: reveja o exercıcio 3.17).

Uma questao natural que surge e sob que condicoes a equacao (6.42) tem solucao?Que propriedade importante tem a sua solucao? Alem disso, a solucao e unica? Oteorema seguinte garante a existencia e unicidade.

Teorema 6.6. (Existencia e unicidade da solucao) Considere as mesmas condicoesexpressas na definicao 6.7. Seja t ∈ [0, T ], T > 0 e k uma constante positiva. Admitaas seguintes condicoes:

(i) |µ (x, t) |+ |σ (x, t) | ≤ k (1 + |x|) (6.64a)

(ii) |µ (x, t)− µ (y, t) |+ |σ (x, t)− σ (y, t) | < k|x− y| (6.64b)

(iii) X0 e independente de Ft e E[X2

0

]<∞ (6.64c)

entao a EDE (6.42) tem solucao unica tal que

E

[∫ t

0

|Xu|2du]<∞ (6.65)

195

Page 206: Processos Estocásticos em Finanças

A demonstracao do teorema 6.6 pode ser vista em Øksendal (2003) [80], dentre out-ros mencionados no inıcio do capıtulo.

Seja Xt a solucao da EDE (6.42) conforme as condicoes do teorema 6.6. Pode-se demon-strar que Xt e um processo Markoviano, ou seja, para 0 ≤ s < t e Xs = x

P (Xt ≤ z|Fs) = P (Xt ≤ z|Xs = x) q.c. (6.66)

E intuitivo que Xt seja Markoviano pois de forma simplificada Xt+∆ = Xt +µ∆t+σB∆

e B∆ e Markoviano como ja demonstrado.

Exercıcio 6.14. Considere o modelo de Vasicek (1977) [100] para a dinamica da taxade juros

dRt = (α− βRt) dt+ σdBt t ≥ 0 (6.67)

onde α, β e σ sao constantes positivas, encontre a solucao forte f (rt, t). Calcule E (Rt)e V ar (Rt).

Exemplo 6.12. Considere o modelo de Hull e White (1990) [54] para a dinamica dataxa de juros

dRt = (αt − βtRt) dt+ σtdBt t ≥ 0 (6.68)

onde αt, βt e σt sao funcoes determinısticas de t. Considere que o processo inicia-se emR0. Encontre a solucao forte f (rt, t).

Solucao: Comparando a equacao (6.68) com a equacao (6.48) temos que mt = αt,nt = −βt, pt = σt e qt = 0.

Primeiramente temos a solucao para St obtida a partir da equacao (6.54)

St = e−∫ t0 βudu (6.69)

A solucao para Rt sera

Rt = St

(R0 +

∫ t

0

αuSudu+

∫ t

0

σuSudBu

)(6.70)

Levando a equacao (6.69) em (6.70), temos

Rt = e−∫ t0 βudu

(R0 +

∫ t

0

αue∫ u0 βudu+

∫ t

0

σue∫ u0 βududBu

)Rt = R0e

−∫ t0 βudu +

∫ t

0

αue−∫ tu βududu+

∫ t

0

σue−∫ tu βududBu (6.71)

ou ainda

f (rt, t) = R0e−∫ t0 βudu +

∫ t

0

αue−∫ tu βududu+

∫ t

0

σue−∫ tu βududrt (6.72)

Podemos tambem resolver a EDE (6.68) usando o fator de integracao e∫ t0 βudu. Multipli-

cando (6.68) por este fator, teremos

e∫ t0 βududRt = αte

∫ t0 βududt− βte

∫ t0 βuduRtdt+ σte

∫ t0 βududBt (6.73)

196

Page 207: Processos Estocásticos em Finanças

Calculando o diferencial de e∫ t0 βuduRt, temos

d(e∫ t0 βuduRt

)= βte

∫ t0 βuduRtdt+ e

∫ t0 βududRt (6.74)

Somando as equacoes (6.73) e (6.74) e simplficando, teremos

d(e∫ t0 βuduRt

)= αte

∫ t0 βududt+ σte

∫ t0 βududBt

Integrando de 0 a t, temos

e∫ t0 βuduRt −R0 =

∫ t

0

αue∫ u0 βududu+

∫ t

0

σue∫ u0 βududBu

e∫ t0 βuduRt = R0 +

∫ t

0

αue∫ u0 βududu+

∫ t

0

σue∫ u0 βududBu

Rt = R0e−∫ t0 βudu +

∫ t

0

αue−∫ tu βududu+

∫ t

0

σue−∫ tu βududBu (6.75)

que e a mesma equacao em (6.71).

Tanto o modelo de Vasicek (1977) como o de Hull e White (1990) para taxas de juros,admitem valores negativo de Rt. Este e um ponto fraco de tais modelos. O modelo deCox, Ingersoll e Ross (1985) [23] (ou modelo CIR) dado pela seguinte EDE

dRt = (α− βRt) dt+ σ√RtdBt (6.76)

onde α, β e σ sao positivos, nao admite solucoes negativas para a taxa de juros.Esta EDE nao e da forma daquela apresentada na equacao (6.48). Nao ha nenhumasolucao fechada para (6.76). Muitas outras EDE’s nao possuem solucao analıtica e asolucao numerica constitui uma alternativa para a obtencao de aproximacoes. SugerimosKloeden e Platen (1992) [63] e Kloeden, Platen e Schurz (2003) [64] para as solucoesnumericas de EDE´s.

6.8 Resumo e consideracoes finais

Este capıtulo apresentou conceitos relevantes para o aprecamento de derivativos eviden-ciando o elo entre as metodologias de aprecamento vistas nos capıtulos 4 e 5. Iniciamosapresentando a propriedade de Markov que tambem sera util no capıtulo seguinte. Aseguir a apresentamos o Teorema da Representacao Martingal (TRM) que garante sobalgumas condicoes especıficas a existencia de um integrando que e um processo adaptado.Desta forma o processo de evolucao do preco do ativo (ou do valor de um portfolio) e umprocesso martingal. Em consequencia podemos usar a equacao geral de aprecamento. Agarantia da existencia deste processo significa que podemos ter uma carteira replicantepara o aprecamento e a existencia de hedge fica estabelecida. Na secao 5.7 fizemos istoe neste capıtulo formalizamos o conceito de replicacao e hedging no aprecamento.

197

Page 208: Processos Estocásticos em Finanças

Em seguida tratamos dos aspectos relacionados ao calculo estocastico multivariado.Vimos as definicoes do processo de Ito multivariado e da formula de Ito multivariado.Tais consideracoes sao necessarias quando pretendemos estudar modelos que possuemmais de uma fonte de incerteza. Tais modelos sao frequentes em financas e buscamosilustra-los com exercıcios e exemplos.

O gerador de difusao de Ito foi definido como a taxa de variacao do valor esperadode f (Xt), onde Xt e uma difusao. Estes conceitos foram apresentados nas formas uni-variadas e multivariadas. Finalizamos o capıtulo definindo as equacoes de Kolmogorov ede Feynman-Kac. Estas equacoes permitem resolver um problema de valor inicial (EDP)atraves do calculo de um valor esperado condicional. Desta forma buscamos tornar nıtidoque as duas abordagens de aprecamento, vistas nos capıtulos 4 e 5, estao relacionadas;ficando evidente que o uso de uma ou outra e uma mera questao de conveniencia. Con-cluımos com o modelo de BMS derivado a partir da equacao de Feynman-Kac.

Ampliamos a abordagem sobre EDE´s anteriormente apresentadas neste texto. A formageral da EDE que consideramos e

dXt = (mt + ntXt) dt+ (pt + qtXt) dBt (6.77)

A sua solucao geral e dada por

Xt = St

(X0 +

∫ t

0

mu − nupuSu

du+

∫ t

0

puSudBu

)(6.78)

onde St e a solucao particular (ou exponencial estocastico) dada por

St = S0e∫ t0 (nu− 1

2q2u)du+

∫ t0 qudBu (6.79)

Exploramos algumas EDE´s de financas que possuem a forma (6.77) e portanto temsolucao fechada como o processo geometrico Browniano, a equacao de Langevin e Ornstei-Uhlenbeck e as equacoes para os modelos de taxas de juros de Vasicek e Hull e White. AsEDE´s que nao possuem solucao analıtica sao tratadas numericamente e aproximacoessao obtidas. Estas questoes numericas nao sao abordadas neste texto e requerem bibli-ografia especialiazada.

6.9 Apendice - Densidade implıcita e volatilidade

local

Este Apendice apresenta os conceitos de densidade implıcita e volatilidade local, esteultimo sendo uma aplicacao da equacao de Fokker-Planck.

6.9.1 Densidade implıcita

No capıtulo 4 definimos o conceito de volatilidade implıcita como sendo a volatilidadeoriunda do modelo de BMS usando os dados de precos das opcoes existentes no mercado.E natural imaginar que, da mesma forma, ha uma funcao densidade implıcita neutra

198

Page 209: Processos Estocásticos em Finanças

ao risco que permita o aprecamento das opcoes. Sabemos que o preco ct de uma opcaode compra Europeia, com preco de exercıcio K, vencimento em T e taxa livre de riscoconstante r no perıodo 0 ≤ t ≤ T , e dado pela equacao fundamental de aprecamento

ct = EQ[e−r(T−t) (XT −K)+ |Ft

](6.80)

onde Xt e o preco a vista. Conforme ja explicado nas equacoes (5.43) a (5.48) podemosescrever, considerando o tempo remanescente para o vencimento τ = T − t, que

ct = EQ[e−rτ (XT −K)+] 0 ≤ t ≤ T (6.81)

Consideremos agora o calculo da opcao com a funcao densidade neutra ao risco φ (XT ).Entao podemos escrever com base na equacao (6.81) que

c (K,T ;X0) = e−rτ∫ ∞K

(XT −K)φ (XT , T ;x) dXT (6.82)

Note que o preco da opcao e funcao do preco de exercıcio K, dado o preco inicial doativo subjacente X0 = x. Isto porque cada trajetoria de preco entre 0 ≤ t ≤ T e funcao

do preco inicial x atraves de XT = xe(r−12σ2)τ+σBτ .

A partir das informacoes da curva smile, onde temos os precos da opcao em funcaodos precos de exercıcio, desejamos obter estimativas para a densidade neutra ao risco.O resultado a seguir e devido a Breeden e Litzenberger (1978) [14].

Diferenciando a equacao (6.82) em relacao a K, obtemos

∂ct (K,T ;x)

∂K= −e−rτ

∫ ∞K

φ (XT , T ;x) dXT

Novamente diferenciando em relacao a K, temos

∂2ct (K,T ;x)

∂K2= e−rτφ (K,T ;x)

ou ainda

φ (K,T ;x) = erτ∂2ct (K,T ;x)

∂K2(6.83)

A equacao (6.83) significa que com as informacoes advindas da funcao ct (K;x) pode-seobter a funcao densidade neutra ao risco. Esta funcao e extraıda dos precos do mercadoe por isto e denominada densidade implıcita neutra ao risco.

6.9.2 Volatilidade local

Sabemos que a volatilidade e um parametro nao observavel. No capıtulo 2 lidamos commodelos parametricos que estimam a volatilidade capturando alguns fatos estilizados dasseries de retorno das acoes. Tais modelos consideram a caracterıstica de comportamentoem que ha dependenica entre a volatilidade entre os instantes t e t−1. O comportamentodescrito nestes modelos e auto-regressivo e a volatilidade varia no tempo. Tambem vi-mos modelos de volatilidade estocastica onde a aleatoriedade e representada por termo

199

Page 210: Processos Estocásticos em Finanças

de ruıdo. No capıtulo 3 ressaltamos que o modelo de BMS com volatilidade constantenao era capaz de capturar o comportamento erratico da volatilidade. Isto gerava o com-portamento smile (smirk) da volatilidade em um grafico σ versus K. Em consequencia,modelos de volatilidade estocastica como do de Heston (1993) buscavam descrever maisadequadamente a volatilidade implıcita advinda dos precos de mercado. Neste contextosurge o conceito de volatilidade local.

A volatilidade local σL denota um conjunto de volatilidades σ (Xt, t) que seja consistentecom os precos das opcoes e diferentes precos de exercıcio de um dado ativo subjacente. Avolatilidade local modela a volatilidade instantanea que em cada momento ira produzirum aprecamento coerente com os precos das opcoes observados no mercado para todos osprecos de exercıcio e maturidades. Quando usamos o “termo consistente com os precosdas opcoes” estamos nos referindo tambem a consitencia com a densidade implıcita (ouimplicada pelos precos das opcoes). Em outras palavras, a volatilidade local envolve ocomportamento da densidade implıcita com o tempo, isto e ∂p

∂t. Portanto, e natural que

facamos uso da equacao de Fokker-Planck (equacao forward de Kolmogorov). A de-terminacao de volatilidade local e um problema de natureza inversa: dada a densidadeimplıcita φ = p (t, T, xt, xT ), extraıda de observacoes de mercado, deseja-se encontrar avolatilidade local σL (xt, t). Os primeiros trabalhos em tempo discreto e contınuo foramapresentados por Derman e Kani (1994) [25] e Dupire (1994) [30], respectivamente. Aquitrataremos deste conceito em tempo contınuo.

Dupire (1994, 1997) [30] [32] mostrou que sob a condicao de neutralidade ao risco existeum unico processo de difusao consistente com esta funcao densidade. A funcao σL (Xt, t)que e o coeficiente do termo de difusao (e tambem e unica) e denominada volatilidadelocal. Sob esta definicao escrevemos que o processo de difusao dos precos sob a medidamartingal e dado por

dXt

Xt

= µ (Xt, t) dt+ σL (Xt, t) dBt 0 ≤ t ≤ T (6.84)

onde µ (Xt, t) = µtXt = (r − αt)Xt e αt e a taxa instantanea de dividendos. Trabal-haremos como preco da opcao sem o fator de desconto e−r(T−t) e sera designado por ct.Assim podemos escrever a equacao (6.82) como

ct (K,T ;x) =

∫ ∞K

(XT −K)φ (XT , T ;x) dXT 0 ≤ t ≤ T (6.85)

Usando a equacao de Fokker-Planck (veja secao 6.5) e observando que as variaveis for-ward sao XT e T , temos

− ∂φ∂T

+1

2

∂2

∂X2T

[σ2 (XT , T )φ

]− ∂

∂XT

[µ (XT , T )φ] = 0 (6.86)

Tambem sabemos que o termo de difusao na equacao (6.84) e dado por σ2 (XT , T ) =σ2LX

2T . O drift e dado pore µ (XT , T ) = (r − αT )XT = µTXT onde µT e o drift do

processo na MME. A equacao acima sera

∂φ

∂T=

1

2

∂2

∂X2T

[σ2LX

2Tφ]− ∂

∂XT

[µTXTφ] (6.87)

200

Page 211: Processos Estocásticos em Finanças

O resultado em (6.83) permite escrever

φ (K,T ;x) =∂2ct (K,T ;x)

∂K2(6.88)

Diferenciando a equacao (6.85) em relacao a K, temos

∂ct (K,T ;x)

∂T=

∫ ∞K

[∂

∂Tφ (XT , T ;x)

](XT −K) dXT (6.89)

A equacao (6.87) fornece ∂φ∂T

e usando este resultado em (6.89), temos

∂c (K,T ;x)

∂T=

∫ ∞K

[1

2

∂2

∂X2T

(σ2LX

2Tφ)− ∂

∂XT

(µTXTφ)

](XT −K) dXT

= (6.90)

A solucao da integral acima leva ao resultado

∂c (K,T ;x)

∂T=

1

2σ2LK

2 ∂2c

∂K2+ µT

(c−K ∂c

∂K

)(6.91)

que e denominada de equacao de Dupire. Isto implica que dadas as informacoes dosprecos das opcoes para todos os precos de exercıcio e maturidades, existira somente umvalor de σL (K,T ;x) que atendera a equacao (6.91). Observe tambem que a derivacaoda equacao acima independe da natureza da dinamica dos precos.

Pode-se tambem demonstrar a relacao entre a volatilidada local e a volatilidade implıcita.Da mesma forma, demonstra-se que a variancia local e o valor esperado, sob a medidaneutra, da variancia instantanea, condicional a que o preco do ativo subjacente no venci-mento seja o preco de exercıcio. Este ultimo resultado pode ser visto em Derman e Kani(1998) [26] e em Dupire (1996) [31]. Ainda dentro deste contexto temos o conceito desuperfıcie de volatilidade implıcita em que a volatilidade implıcita e definida em cadamaturidade para diferentes precos de exercıcio. Todos estes topicos sao perfeitamentepassıveis de desenvolvimento com os instrumentos ja apresentados neste texto. No en-tanto nao o faremos e deixamos que o leitor interessado busque-os nas referencias citadas.Caso contrario, sairıamos do objetivo principal a que nos propusemos.

A literatura conta com varias pesquisas empıricas para o levantamento da curva smile,da superfıcie de volatilidade implıcita e da funcao densidade neutra ao risco. No mercadobrasileiro referimo-nos ao trabalho de Yoshino (2001) [102].

201

Page 212: Processos Estocásticos em Finanças

202

Page 213: Processos Estocásticos em Finanças

Capıtulo 7

Derivativos Americanos

No capıtulo 5 apresentamos alguns derivativos exoticos. Esses derivativos diferem dotradicional derivativo do tipo Europeu por dois aspectos distintos: (i) pela forma comoe definido o valor do derivativo no vencimento (pode ser definido com base na trajetoriado preco do ativo subjacente), (ii) pela possibilidade de exercıcio antecipado. Dentro daclasse dos derivativos com possibilidade de exercıcio antecipado destacam-se os do tipoAmericano e Bermudiano. Os derivativos do tipo Americano sao os mais negociadosnas bolsas em todo o mundo. Neste capıtulo estudaremos as importantes questoesrelacionadas ao seu aprecamento. Da mesma forma como fizemos no capıtulos anterioreso nosso enfoque sera em opcoes de compra e venda.

As referencias basicas sobre derivativos Americanos sao Hull (2000) [53], McDonald(2003) [70], Neftci (2000) [77], Joshi (2003) [59] e Wilmott, Howison e Dewynne (1995)[101]. Com um nıvel de rigor mais elevado citamos Musiela e Rutkowski (2004), Shreve(2004) [94], Øksendal (2003) [80], Elliot e Kopp (2005) [34]. Muito dos conceitos doscapıtulos 4 e 7 podem ser encontrados no classico artigo de Smith (1976) [96].

7.1 Conceitos basicos

Definicao 7.1. (Opcao Americana) O contrato de uma opcao financeira do tipoAmericano fornece ao seu proprietario o direito, mas nao a obrigacao, de comprar/venderum ativo (ativo objeto ou subjacente) por um preco K (preco de exercıcio) em qualquerdata t (t ∈ [0, T ]) ate a data T de vencimento.

Definicao 7.2. (Opcao Bermudiana) O contrato de uma opcao financeira do tipoBermudiano fornece ao seu proprietario o direito, mas nao a obrigacao, de comprar/venderum ativo (ativo objeto ou subjacente) por um preco K (preco de exercıcio) em algumasdatas especıficas tk, onde tk ∈ [0, T ].

A definicao 7.1 estabelece que o detentor do contrato pode exercer o seu direito emqualquer data antes do vencimento T . Isto faz com que o proprietario de uma opcaoAmericana tenha um comportamento mais ativo que aquele de uma opcao Europeia.Este ultimo somente tera a decisao de exercıcio em T . No caso da opcao Americanaele deve estar constantemente perguntando se e melhor exercer agora ou esperar o diaseguinte. O mesmo raciocınio aplica-se ao caso da opcao Bermudiana para as datas deexercıcio.

203

Page 214: Processos Estocásticos em Finanças

A opcao do tipo Bermuda e um caso intermediario entre a opcao Europeia e Amer-icana. Nao existem formulas fechadas para o aprecamento das opcoes Americanas eBermudianas. Em geral recorre-se a aproximacoes e/ou solucoes numericas. O fato denao haver uma formula definida, implica que as aproximacoes devem cuidadosamenteatender as restricoes que surgem da formulacao analıtica que sera apresentada nestecapıtulo.

Definicao 7.3. (Valor intrınseco) O valor intrınseco de uma opcao em uma data te o valor resultante do seu exercıcio neste instante, assim escrevemos

(Xt −K)+ opcao de compra

(7.1)

(K −Xt)+ opcao de venda

Considere o caso de um investidor proprietario de uma opcao de compra Americana.A cada instante de tempo ele deve preocupar-se acerca do momento otimo de exercıcio.Em outras palavras, o investidor pergunta-se: o valor intrınseco e maior que o valor es-perado da situacao de nao exerce-la (manter viva a opcao) ate o vencimento? Podemosformalizar esta questao como se segue.

Seja entao t ∈ [0, T ]. Sera mais vantajoso o exercıcio em t do que esperar pelo ex-ercıcio no vencimento se

Xt −K > EQ[e−r(T−t) (XT −K)+ |Ft

](7.2)

onde r e a taxa livre de risco admitida como constante no perıodo de maturacao docontrato. A questao que se segue e saber qual o instante t leva o investidor ao exercıciootimo. No vencimento T o fluxo de caixa recebido pelo investidor, dado que nao houveexercıcio previo, sera XT −K. Seja t1 ∈ [0, T ] a primeira data imediatamente anteriora T em que a opcao pode ser exercida. Entao sera vantajoso o exercıcio em t1 se

Xt1 −K > EQ[e−r(T−t1) (XT −K)+ |Ft1

](7.3)

ou ainda podemos escrever

Xt1 −K > EQ[e−rτFCT |Ft1

]onde FCT representa o fluxo de caixa em T e τ o tempo remanescente para o vencimento.

Seja agora t2 < t1 a primeira data anterior a t1 em que a opcao pode ser exercida.Sera vantajoso exercer em t2 se

Xt2 −K > EQ[e−r(t1−t2) (Xt1 −K)+ |Ft2

](7.4)

ou aindaXt2 −K > EQ

[e−rτiFC|Ft2

]onde τi pode ser tanto t1 − t2 como T − t2 (caso nao tenha havido exercıcio em t1) eFC o respectivo fluxo de caixa em t1 ou T . Assim, trabalhando recursivamente pode-se

204

Page 215: Processos Estocásticos em Finanças

obter as possıveis datas de exercıcio antecipado.

Denomina-se por t? o instante otimo de exercıcio, onde o termo otimo esta associ-ado ao maior valor dentre todas as possıveis datas de exercıcio antecipado. Definido oinstante otimo t?, resta calcular o valor do derivativo Americano em uma data qualquert, 0 ≤ t < t? ≤ T . A data de exercıcio otimo t? e chamado de tempo de parada.Se soubermos definir o tempo de parada sabemos que devemos exercer a opcao nesteinstante. Portanto, o tempo de parada e um importante conceito para o aprecamentode derivativos Americanos. A inexistencia de formulas fechadas para o aprecamento deopcoes Americanas e Bermudianas esta associada a caracterıstica estocastica do tempode parada.

O tempo de parada e uma variavel aleatoria assumindo valores no intervalo [0,∞].No instante t quando observa-se uma realizacao para o tempo de parada escrevemosque t? = t. Isto significa que a variavel aleatoria t? assume o valor t de um instante detempo do intervalo [0,∞].

Considere um derivativo do tipo Americano cujo ativo subjacente e um processo es-tocastico governado pelo processo Browniano Bt tal que t ∈ [0, T ] e T e data do venci-mento. Seja Ft a σ-algebra natural gerada por Bt. Nesta situacao em que conhecemosFt sabemos dizer se t? ≤ t (houve exercıcio do derivativo).

Definicao 7.4. (Tempo de parada) O tempo de parada e uma variavel Ft-mensuravelassumindo valores em [0,∞] tal que

t? ≤ t para todo t ≥ 0 (7.5)

7.2 Aprecamento do derivativo

Com as definicoes da secao anterior podemos tratar do aprecamento de derivativosAmericanos. Nesta secao definiremos o derivativo Americano de forma generica e nasecao seguinte o foco e aprecamento de uma opcao de venda.

Definicao 7.5. (Preco do derivativo Americano) Seja Xt um processo estocasticogovernado por Bt com σ-algebra natural Ft. Seja Θ o conjunto de todos os tempos deparada entre t e T e seja θ ∈ Θ. Seja Λ (Xt, t) o preco de um derivativo Americano emt sobre o ativo subjacente Xt tal que t ∈ [0, T ], entao

Λ (Xt, t) = maxθ∈Θ

EQ[e−r(θ−t)Λ (Xθ, t, θ) |Ft

](7.6)

onde r e a taxa livre de risco admitida como constante em [0, T ].

A definicao acima estabelece que para todos os possıveis tempos de parada, onde oinvestidor pode exercer o seu direito, devemos calcular o valor esperado sob Q, do valordescontatado do derivativo e escolher o maior resultado. Assim, um dos valores de θsera o tempo de parada t?. Veremos adiante como faze-lo.

Exercıcio 7.1. Escreva a equacao em (7.6) para uma opcao de venda cujo preco em t edado por V (Xt, t) e Xt e o processo do ativo subjacente conforme definido nesta secao.

205

Page 216: Processos Estocásticos em Finanças

Do que vimos ate o momento esta claro que o aprecamento de uma opcao Americanae mais oneroso que o caso de uma Europeia.

Tomemos o caso de uma opcao de venda do tipo Europeia cujo preco e v (Xt, t) ondeXt e o ativo subjacente descrito por um processo geometrico Browniano. Do capıtulo 4sabemos que v ( ·) deve satisfazer a EDP (4.24) aqui reescrita

∂v

∂t+ rX

∂v

∂x+

1

2σ2X2 ∂

2v

∂x2= rv (7.7)

juntamente com as condicoes de contorno em (4.26) a (4.28).

Na equacao (7.7) o exercıcio antecipado nao e permitido pois trata-se de um opcaoEuropeia. Seja V (Xt, t) o preco de uma opcao de venda Americana sobre o mesmoativo subjacente. E intuitivo que o investidor que possui o direito de exercıcio da opcaoantes do vencimento atribuira a este direito mais valor que no caso de uma opcao Eu-ropeia, mantidas as mesmas caracterısticas de prazo e preco entre os dois casos. Commais direitos envolvidos o seu preco devera ser maior (V (Xt, t) ≥ v (Xt, t)) e portantoV (·) nao satisfara a EDP (7.7).

Agora vejamos o comportamento de uma opcao de venda Europeia em um grafico simi-lar ao da figura 7.1 e aqui reproduzido. Vemos que ha regioes onde v e inferior ao valor

Figura 7.1: Opcao de venda para τ = 2, K = 7, r = 5% e σ = 25%

intrınseco K −Xt. Considere o caso em que v (Xt, t) < K −Xt e considere tambem apossibilidade de exercıcio antecipado. Logo podemos comprar o ativo subjacente por Xt

e a opcao por v (Xt, t) e exercer imediatamente o direito vendendo o ativo subjacentepor K. Entao recebemos K e desembolsamos Xt + v resultando em um lucro sem riscode K −Xt − v (pois por hipotese v e inferior a K −Xt). Portanto, se ha possibilidadede exercıcio antecipado V (Xt, t) ≥ K −Xt (usando a notacao de maısculo para o caso

206

Page 217: Processos Estocásticos em Finanças

do exercıcio antecipado ou opcao Americana). Ou mais apropriadamente

V (Xt, t) ≥ (K −Xt)+ t ∈ [0, T ] (7.8)

Argumento identico pode ser construıdo para o caso de uma opcao de compra em que oativo subjacente paga dividendos e temos entao que

C (Xt, t) ≥ (Xt −K)+ t ∈ [0, T ] (7.9)

Exercıcio 7.2. Considere que duas opcoes de compra Americanas diferem somente peladata de exercıcio. Apresente argumentos que levem a conclusao de que

C (Xt, t;K,T1, σ, r) ≥ C (Xt, t;K,T2, σ, r) (7.10)

onde T1 > T2.

Exercıcio 7.3. Considere duas opcoes de compra Americanas que diferem somente pelopreco de exercıcio, mostre que

C (Xt, t;K1, T, σ, r) ≥ C (Xt, t;K2, T, σ, r) (7.11)

onde K1 > K2.

Exercıcio 7.4. Com base nos exercıcios 7.2 e 7.3 apresente os argumentos que levema conclusao de que o preco de uma acao ordinaria e superior ou igual ao de uma opcaode compra Americana perpetua sobre esta acao com preco de exercıcio zero, isto e

Xt ≥ C (Xt, t; 0,∞, σ, r) ≥ C (Xt, t;K,T, σ, r) (7.12)

7.3 Aprecamento da opcao de venda

Conforme vimos na secao anterior o aprecamento do derivativo Americano mostra-semais complexo que o de um Europeu, senao vejamos.

Considere o caso de uma opcao de venda Americana V (Xt, t) onde Xt, (t ≥ 0) e oativo subjacente, com expiracao em T , preco de exercıcio K e taxa livre de risco cons-tante r em [0, T ]. Para resolvermos o problema em (7.6) temos primeiramente que tomaro maximo do valor esperado entre todos os tempos de parada, ou seja

maxθ

[EQ(e−r(θ−t)V (Xθ) |Ft

)](7.13)

Feito isto, precisamos definir se o θ selecionado e realmente o tempo de parada. O valorescolhido de θ sera um tempo de parada t? = θ se for atendida a regra

V (Xt? , t?) ≥ EQ

[e−r(t−t

?)V (Xt, t)Ft?]

para t > t? (7.14)

A equacao (7.14) estabelece que havera o exercıcio antecipado (θ sera um tempo deparada: θ = t?) quando o valor intrınseco do exercıcio for superior ou igual ao valoresperado de continuacao (ou seja, o de manter viva a opcao).

207

Page 218: Processos Estocásticos em Finanças

Ao aplicarmos os procedimentos especıficos descritos em (7.13) e (7.14) definiremosem um plano Xt versus t duas regioes distintas: (i) em uma delas havera o exercıcio e(ii) na outra nao havera o exercıcio. Assim a estrategia otima sera da forma

t? = minu

[u : Xu < LV (Xu, u)] (7.15)

onde LV (Xt, t) define a equacao da fronteira otima de exercıcio para a opcao de vendaque separa as duas regioes acima.

Uma vez que conhecemos (ou sabemos determinar) LV (Xt, t) a decisao de exercıciodo derivativo Americano fica definida. Exploraremos os conceitos da fronteira otima naproxima secao.

Alem da fronteira otima, precisamos saber qual o preco da opcao de venda em t = 0,por exemplo. Imagine que tenhamos um plano Xt versus t e que apliquemos os proced-imentos acima, resultando na definicao do tempo de parada t?. Entao o preco da opcaode venda Americana sera o valor esperado do valor intrınseco em t?, descontado a datainicial, em outras palavras se t = 0 e a data inicial, temos

V0 = EQ[e−rt

?

(K −Xt?)]

(7.16)

7.4 Fronteira otima de exercıcio

Vimos na secao anterior o procedimento para o aprecamento de uma opcao de vendado tipo Americana. Entretanto o procedimento e geral e pode ser aplicado ao caso deuma opcao de compra, fazendo-se as modificacoes necessarias. Todo o procedimento daestrategia otima definida pelas equacoes (7.13) a (7.15) e denominado de problema decontorno livre. Esta denominacao resulta do fato de nao conhecermos a priori a fronteiraotima de exercıcio LV (Xt, t). A aplicacao destas equacoes ira definir a fronteira otima epossibilitara a definicao do preco do derivatio como em (7.16). Esta secao define algumaspropriedades da fronteira otima de exercıcio que surgem no problema de contorno livre.

A primeira propriedade foi definida pelas equacoes (7.8) e (7.9), onde o valor do deriva-tivo Americano e maior ou igual ao seu valor intrınseco. Esta condicao foi obtida apartir da nao possibilidade de arbitragem quando existe o exercıcio antecipado. Quandoprevalece a condicao de igualdade significa que o derivativo Americano deve ser exercido.Quando prevalece a desigualdade, nao ha o exercıcio e a EDP de BMS e satisfeita.

Entao outra forma de expressar este fato e considerar uma desigualdade na equacaode BMS, isto e

∂V

∂t+ rx

∂V

∂x+

1

2σ2x2∂

2V

∂x2− rV ≤ 0 (7.17)

Para o caso de uma opcao de venda na situacao (ou regiao) de nao exercıcio vale aigualdade em (7.17) e escrevemos

∂V

∂t+ rx

∂V

∂x+

1

2σ2x2∂

2V

∂x2− rV = 0 (7.18)

208

Page 219: Processos Estocásticos em Finanças

V (Xt, t) > (K −Xt)+ (7.19)

Na situacao em que ha exercıcio

V (Xt, t) = K −Xt (7.20)

E alem disto vale a desigualdade estrita na equacao (7.17), ou seja

∂V

∂t+ rx

∂V

∂x+

1

2σ2x2∂

2V

∂x2− rV < 0 (7.21)

Usando a condicao de (7.20) na equacao (7.21) (e considerando que Xt < K) observamosque o primeiro membro desta ultima sera igual a −rK, consequentemente escrevemos

∂V

∂t+ rx

∂V

∂x+

1

2σ2x2∂

2V

∂x2− rV = −rK < 0 (7.22)

Em um plano Xt versus t (veja a figura 7.3) observamos as duas regioes distintas ondee vantajoso o exercıcio da opcao de venda (equacoes (7.22) e (7.20)) e a outra regiaoonde e vantajoso manter viva a opcao (nao exerce-la) (equacoes (7.18) e (7.19)).

Agora vamos investigar o comportamento de V (·) com relacao ao preco do ativo sub-jacente Xt. Portanto considere um plano de V (·) versus Xt. Neste plano temos umareta com inclinacao de 45

orepresentando o valor intrınseco. Uma questao a observar e

a inclinacao da solucao otima em relacao a funcao valor intrınseco V (Xt, t) = K −Xt.Nos pontos da fronteira otima de exercıcio ∂V

∂x= −1. Veja na figura 7.2 a funcao valor

intrınseco. Observe agora a curva (a) onde notamos que ocorrem situacoes em que∂V∂x

< −1. Note que estes casos sao incompatıveis com a ausencia de arbitragem, senao

Figura 7.2: Transicao suave na curva (b) compatıvel com a aus encia de arbitragem

vejamos. Quando Xt aumenta a partir da instersecao com a reta do valor intrınseco,o valor da opcao e inferior a este ultimo (veja na curva (a)). E isto esta em desacordocom a condicao em (7.8) em que V (·) ≥ (K −Xt)

+. Um argumento similar e obtido

209

Page 220: Processos Estocásticos em Finanças

se imaginarmos o caso sem que ∂V∂x

> −1. Resta portanto a condicao em que ∂V∂x

= −1como mostrado na curva (b). Esta condicao, que expressa a derivada da solucao otimaV (·) no ponto de contato com a funcao valor intrınseco, e denominada de transicaosuave. Temos portanto que

∂V (Xt, t)

∂x

∣∣∣x = fronteira

= −1 (7.23)

onde x = fronteira significa todos os pontos pertencentes a fronteira LV (Xt, t). Assim

V (Xt, t) e ∂V (Xt,t)∂x

sao ambas contınuas ao longo da fronteira.

Podemos sintetizar o que foi visto nesta secao com o grafico onde esquematizamos noplano Xt versus t o esboco da fronteira otima de exercıcio. Enfatizamos que nao hasolucao analıtica para determinarmos LV (Xt, t). A figura 7.3 mostra a fronteira otimade exercıcio. Para Xt ≥ LV (Xt, t) temos a regiao onde nao ha exercıcio e onde a

Figura 7.3: Fronteira otima de exercıcio para uma opcao de venda Americana

manutencao da opcao viva e melhor que exerce-la. Nela sao validas as equacoes (7.18)e (7.19). Para Xt ≤ LV (Xt, t), temos o caso em que e vantajoso o exercıcio antecipado.Nesta regiao sao validas as equacoes (7.20) e (7.22). Alem disso, a condicao de transicaosuave e valida ao longo da fronteira otima de exercıcio. Podemos expressa-la para pontosacima e abaixo de LV (Xt, t) escrevendo

∂V (Xt, t)

∂x

∣∣∣x+

=∂V (Xt, t)

∂x

∣∣∣x−

= −1 (7.24)

A transicao suave nao e valida em t = T . Neste instante na regiao superior (onde naoha exercıcio) temos V (XT , T ) = 0. Na regiao inferior onde ha o exercıcio V (XT , T ) =K −XT , que e o mesmo valor da opcao Europeia no vencimento. Isto implica que emt = T , temos

∂V (XT , T )

∂x

∣∣∣x+

= 0 e∂V (XT , T )

∂x

∣∣∣x−

= −1 (7.25)

210

Page 221: Processos Estocásticos em Finanças

Ainda temos que quando o preco do ativo subjacente tende a zero, o valor da opcao devenda tende a K, isto e

limXt→0

V (Xt, t) = K 0 ≤ t ≤ T (7.26)

Da mesma forma, se o preco do ativo subjacente cresce indefinidamente, a opcao devenda nao tem nenhum valor

limXt→∞

V (Xt, t) = 0 0 ≤ t ≤ T (7.27)

O preco da opcao de venda V (Xt, t) pode ser obtido numericamente com o uso

(i) da equacao (7.18) para Xt ≥ L (Xt, t),

(ii) da equacao (7.20) para Xt ≤ L (Xt, t),

(iii) das equacoes de transicao suave (7.24), e

(iv) da condicao terminal definida pela equacao V (XT , T ) = (K −XT )+

Ao se definir os valores de V (Xt, t) simultaneamente obtem-se a fronteira otima de ex-ercıcio LV (Xt, t).

Se o domınio da EDP (7.18) fosse conhecido, apenas a condicao de contorno (7.20)seria necessaria. No entanto o domınio nao e conhecido e faz-se necessaria mais umacondicao de contorno (equacao (7.24)) para que o problema seja resolvido. Implıcitanesta argumentacao esta o uso da condicao terminal.

7.5 Solucoes Numericas

Vimos, nas secoes anteriores, que o preco de um derivativo, que tenha possibilidadede exercıcio antecipado, nao possui solucao analıtica. A sua determincao devera serestabelecida por procedimentos numericos, conforme mencionado nas secoes anteriores.Existem varios metodos para tal, como por exemplo arvores binomiais, Monte-Carlo,diferencas finitas, aproximacoes numericas, dentre outros. Este texto nao tem comoobjetivo discorrer sobre metodos numericos em financas. Existem varias obras dedicadasexclusivamente a este topico. Nao obstante, reservamos uma secao para introduzir osconceitos do metodo binomial dada a sua importancia e popularidade em financas. Jamencionamos varias referencias que tratam de procedimentos numericos relacionados aeconomia e financas. Aqui enfatizamos novamente tais textos: Hull (2000) [53], Wilmott,Howison e Dewynne (1995) [101], Brandimarte (2003) [13], Glasserman (2003) [41],Jackel (2002) [57], McLeish (2005) [71], Judd (1998) [60], Duffy (2006) [29], e Huynh,Lai e Soumare (2008) [55].

7.5.1 Metodo binomial

O metodo binomial, ou simplesmente arvore binomial, consiste na consideracao de queo movimento do preco de um tıtulo entre os instantes t e t + ∆t sera representado por

211

Page 222: Processos Estocásticos em Finanças

dois estados da natureza. Em geral considera-se que o primeiro estado representa umavalorizacao do tıtulo e o segundo uma desvalorizacao, ou seja, movimentos ascendentee descendente do preco, respectivamente. Trata-se de um importante e popular metodoem financas onde a modelagem e simples e os resultados satisfatorios. Tem largo usodidatico e pratico e ha varios textos e capıtulos de livros dedicados ao metodo binomial.Alem dos classicos textos de financas ja referenciados, vale ressaltar o livro Shreve(2004)[95] dedicado aos modelos de financas, integralmente com o uso do metodo binomial.

Vamos considerar que em t o preco do tıtulo seja Xt. Neste mesmo instante um deriva-tivo Europeu sobre este tıtulo tem preco Λt. Admitamos que o movimento de alta dotıtulo leve-o, em t + ∆t, ao preco Xu

t+∆t = uXt, onde u > 1. Da mesma forma para omovimento de baixa temos Xd

t+∆t = dXt, onde d < 1. Consideremos tambem que p e1− p sao as probabilidades de alta e baixa de Xt, respectivamente. Nos movimentos dealta e de baixa os precos do derivativo serao Λu

t+∆t e Λdt+∆t, respectivamente.

Vamos montar um portfolio formado pela compra de ∆ tıtulos e a venda de um unidadedo derivativo Europeu. Trata-se do mesmo portfolio usado na secao 4.2 para derivacaoda EDP do modelo de Black e Scholes (1973). Entao temos que o valor do portfolio emt e Πt = ∆Xt − Λt.

Quando o tıtulo subir teremos Πut+∆t = ∆Xu

t+∆t − Λut+∆t e da mesma forma quando

cair Πdt+∆t = ∆Xd

t+∆t − Λdt+∆t. O portfolio sera livre de risco se para os movimentos de

alta e baixa o seu valor for o mesmo, isto e, Πut+∆t = Πd

t+∆t. Nesta situacao podemosescrever

∆Xut+∆t − Λu

t+∆ = ∆Xdt+∆t − Λd

t+∆t

∆uXt − Λut+∆t = ∆dXt − Λd

t+∆t

∆ =Λut+∆t − Λd

t+∆t

uXt − dXt

(7.28)

O valor de ∆ na equacao (7.28) tem o mesmo significado que aquele da equacao (4.9).Ou seja, significa a variacao do preco do derivativo pela variacao do preco do ativosubjacente no instante t+ ∆t.

O valor em t deste portfolio sera

Πt =(∆uXt − Λu

t+∆t

)e−r∆t (7.29)

onde r e a taxa livre de risco entre os instantes de tempo. Note que estamos supondo aausencia de arbitragem e neste caso a taxa de desconto devera ser a taxa livre de risco.Entao podemos escrever que

Πt = ∆Xt − Λt =(∆uXt − Λu

t+∆t

)e−r∆t (7.30)

Enfatizamos que ao igualar o portfolio formado em t com o valor do portfolio em t+ ∆tdescontado, estamos considerando a ausencia da possibilidade de arbitragem. O precodo derivativo sera

Λt = ∆Xt −(∆uXt − Λu

t+∆t

)e−r∆t (7.31)

212

Page 223: Processos Estocásticos em Finanças

Inserindo o valor de ∆ obtido na equacao (7.28) na equacao (7.31), resulta que

Λt =[qΛu

t+∆t + (1− q) Λdt+∆t

]e−r∆t (7.32)

onde

q =er∆t − du− d

(7.33)

A equacao (7.32) estabelece o preco do derivativo em t. Note que e uma ponderacaodos valores Λu

t+∆t e Λdt+∆t pelas quantidades q e 1 − q. De fato, q e 1 − q represntam

as probabilidades na medida neutra ao risco. A equacao (7.32) e o valor esperado nestemedida dos provaveis precos do derivativo nos dois estados da natureza.

Portanto temos que p e 1 − p sao as probabilidades de alta e baixa entre t e t + ∆t,respectivamente. Estas sao as medidas historicas, fısicas ou reais de evolucao dos precosentre os dois instantes. Os valores de q e 1 − q representam as probabilidades entreestes mesmos instantes em uma situacao de neutralidade ao risco. Podemos escrever aequacao (7.32) conforme fizemos anteriormente quando usamos os conceitos de financasem tempo contınuo

Λt = EQ(e−r∆tΛt+∆t|Ft

)(7.34)

onde Q representa o valor esperado sob a MME.

Podemos tambem escrever que

EP (Xt+∆t|Ft) = pXut+∆t + (1− p)Xd

t+∆t (7.35)

onde P representa a medida real de probabilidade.

Exercıcio 7.5. Considere as definicoes apresentadas nesta secao. Seja p e 1 − p asprobabildades de aumento e queda do preco do tıtulo Xt, respectivamente, entre os in-stantes t e t + ∆t. O que ocorre com o preco do derivativo Λt quando aumentamos oudiminuimos o valor de p?

Exercıcio 7.6. Calcule o valor esperado de Xt+∆t na MME, isto e EQ (Xt+∆t|Ft).

Vamos considerar a situacao com um perıodo de tempo adicional. Agora o tıtulo Xt

pode evoluir no primeiro intervalo de tempo para Xut+∆t ou Xd

t+∆t. Evoluindo mais umintervalo de tempo o preco pode, em cada estado, subir ou cair resultando na arvorebinomial mostrada na figura 7.4. A evolucao do preco do derivativo esta representadona figura 7.5. Se um derivativo Europeu tem o seu vencimento em T = t + 2∆t entaosabemos o seu valor no vencimento. Usando a equacao (7.34) podemos calcular o seupreco no momento que antecede o vencimento, isto e

Λut+∆t =

[qΛuu

t+2∆t + (1− q) Λudt+2∆t

]e−r∆t (7.36)

Λdt+2∆t =

[qΛud

t+2∆t + (1− q) Λddt+2∆t

]e−r∆t (7.37)

onde q e dado pela equacao (7.33). Procedendo de modo similar chegamos ao valor deΛt

Λt =[qΛu

t+∆t + (1− q) Λdt+∆t

]e−r∆t (7.38)

213

Page 224: Processos Estocásticos em Finanças

Figura 7.4: Arvore binomial com 2 perıodos e 3 estados terminais

onde Λut+∆t e Λd

t+∆t foram calculados em (7.36) e (7.37), respectivamente. Inserindoestas equacoes em (7.38), temos

Λt =[q2Λuu

t+2∆t + 2q (1− q) Λudt+2∆t + (1− q)2 Λdd

t+2∆

]e−2r∆t (7.39)

O caso anterior era de uma arvore binomial com dois instantes de tempo t+∆t e t+2∆t.Nesta situacao o numero de estados da natureza no vencimento (T = t+2∆t) e tres (vejafigura 7.4). Para o caso em que temos M perıodos, o vencimento sera em T = t+M∆te teremos M + 1 estados da natureza nesta data. Em um instante ti = t + i∆t temossimultaneamente i + 1 nos (ou estados) representativos do preco do ativo subjacente.Assim podemos escrever que os precos neste instante sao

Xt+i∆t = di−jujXt 0 ≤ j ≤ i (7.40)

onde j representa os estados da natureza. Assim para i = 2, os valores de Xt+2∆t serao

(i) j = 0⇒ d2−0u0Xt = d2Xt

(ii) j = 1⇒ d2−1u1Xt = duXt

(iii) j = 2⇒ d2−2u2Xt = u2Xt

Esta arvore esta representada na figura 7.4. Em uma arvore com M perıodos o valordo derivativo Europeu no vencimento e uma funcao do preco do ativo subjacente novencimento

Λt+M∆t = h (Xt+M∆t) (7.41)

onde h (·) representa a funcao que fornece o valor no vencimento. No caso de umaopcao de compra temos h (Xt+M∆t) = Xt+M∆t − K onde K e o preco de exercıcio.

214

Page 225: Processos Estocásticos em Finanças

Figura 7.5: Arvore binomial com os precos do derivativo em cada no

De forma similar para a opcao de venda o valor sera h (Xt+M∆t) = K − Xt+M∆t. Afigura 7.6 apresenta simplificadamente uma arvore binomial com M perıodos. O valordo derivativo Europeu em um instante ti desta arvore e dado pelo valor esperados dosnos subsequentes sob a medida Q. Entao escrevemos

Λjt+i∆t =

[qΛj+1

t+(i+1)∆t + (1− q) Λjt+(i+1)∆t

]e−r∆t 0 ≤ j ≤ i e 0 ≤ i ≤M−1 (7.42)

onde j representa os estados de alta e baixa subsequentes ao tempo ti = t+i∆t. Variandoj (0 ≤ j ≤ i) e i (0 ≤ i ≤ M − 1) chega-se ao valor do derivativo Europeu em t. Porexemplo o valor de Λ1

t+∆t, na arvore da figura 7.6 e dado por

Λ1t+∆t =

[qΛ2

t+∆t + (1− q) Λ1t+∆t

]e−r∆t

Para que o processo descrito pelos precos do ativo subjacente, no modelo binomial, sejaaderente ao processo geometrico Browniano, devemos ajustar adequadamente os valoresde u e d. No restante desta subsecao nos dedicaremos a esta tarefa. Assim temos que oprocesso geometrico Browninao escrito na medida real e dado por

Xt+∆t = Xte(µ− 1

2σ2)∆t+σBt+∆t (7.43)

O valor esperado eEP (Xt+∆t|Ft) = Xte

µ∆t (7.44)

Este resultado deve ser identico ao da equacao (7.35), ou seja

Xteµ∆t = pXu

t+∆t + (1− p)Xdt+∆t

= puXt + (1− p) dXt

que resulta em

p =eµ∆t − du− d

(7.45)

215

Page 226: Processos Estocásticos em Finanças

Figura 7.6: Arvore binomial com M perıodos e M + 1 nos no vencimento

onde p representa a probabilidade real para um movimento de alta.

No processo geometrico Browniano

dXt

Xt

= µdt+ σdBt (7.46)

onde o primeiro membro representa o retorno dos precos do ativo subjacente entre t et+ ∆t. Calculando as variancias dos retornos temos

V arP(Xt+∆t −Xt

Xt

|Ft)

= σ2∆t (7.47)

A variancia dos retornos no modelo binomial entre t e t+ ∆t e

V arP(Xt+∆t −Xt

Xt

|Ft)

= pu2 + (1− p) d2 − [pu+ (1− p) d]2 (7.48)

Igualando as equacoes (7.47) e (7.48) para adequar a volatilidade do modelo binomial avolatilidade do processo geometrico Browniano, temos

pu2 + (1− p) d2 − [pu+ (1− p) d]2 = σ2∆t (7.49)

Usando a equacao (7.45) na equacao (7.49) resulta em

eµ∆t + (1− p) d2 − ud− e2µ∆t − σ2∆t = 0 (7.50)

O primeiro estudo da adequacao do modelo binomial ao processo geometrico Brownianofoi realizado por Cox, Ross e Rubinstein (1979) [24]. Devido a sua popularidade estemodelo ficou conhecido como modelo binomial de CRR, referente as iniciais dos autores.

216

Page 227: Processos Estocásticos em Finanças

Neste estudo CRR desprezaram os termos de ordem superior a dois para o tempo, isto e(∆t)2 ≈ 0. Tambem consideraram que u = 1

d. Assim a equacao (7.50) tem como solucao

u = eσ√

∆t (7.51)

d = e−σ√

∆t (7.52)

Subsequentemente a este pioneiro trabalho outros autores apresentaram propostas paraa calibragem de u e d. O Apendice deste capıtulo contem os detalhes da calibragem domodelo binomial de CRR.

Exercıcio 7.7. Escreva a variancia dos retornos de Xt entre t e t + ∆t na medida

MME, isto e V arQ(Xt+∆t−Xt

Xt|Ft)

.

Exercıcio 7.8. Considere o modelo binomial de CRR com dois perıodos: t e t + ∆t.Seja Xt o preco do ativo subjacente e ct o preco da opcao de compra Europeia compreco de exercıcio K. Os movimentos de alta e baixa do ativo subjacente sao obtidoscom os fatores u e d. Considere que a taxa livre de risco seja zero. Calcule o preco daopcao de venda para o mesmo preco de exercıcio. Verifique se o resultado encontradoesta de acordo com a paridade entre opcoes de compra e venda Europeia definida pelaequacao (4.2).

Exercıcio 7.9. Seja o modelo binomial de CRR com n perıodos e vencimento em T =t+n∆t. A probabilidade de alta do ativo subjacente Xt e p. Calcule: (i) a probabilidadede exercıcio de uma opcao de compra Europeia com preco de exercıcio K sobre tal ativo,(ii) a probabilidade de exercıcio da opcao de venda Europeia nas mesmas condicoes.

7.5.2 Derivativos Americanos e Bermudianos

Considere a arvore apresentada na figura 7.6. Para avaliacao do derivativo Ameri-cano/Bermudiano o procedimento segue a mesma ordem dos eventos que no caso doderivativo Europeu. Isto e, iniciamos do final da arvore (data do vencimento) para oinıcio. No vencimento o valor do derivativo Americano e identico ao do Europeu. Emqualquer instante ti anterior ao vencimento temos ti = t+ i∆t onde i ≤M − 1. Nestescasos devemos computar a equacao (7.42) e comparar com o valor intrınseco dado pelafuncao h (·). Em cada instante ti a opcao Americana vale o maior entre os dois valores.Assim temos

Λjt+i∆t = max

[h (Xt+i∆t) ,

(qΛj+1

t+(i+1)∆t + (1− q) Λjt+(i+1)∆t

)e−r∆t

]0 ≤ j ≤ i 0 ≤ i ≤M − 1 (7.53)

O primeiro argumento entre colchetes e o valor intrınseco de exercıcio. O segundo ar-gumento e o valor esperado de continuacao atualizado para a data ti. Fazendo variarj e i nas equacoes (7.40) e (7.41) e simultaneamente aplicando a condicao de maximodefinida na equacao (7.53) chegaremos ao preco do derivativo Americano Λt.

Agora vejamos como definir a fronteira otima de exercıcio LV (Xt, t). Abaixo seguem asetapas:

217

Page 228: Processos Estocásticos em Finanças

(i) definimos a partir de t a arvore de precos usando a equacao (7.40) e um valorinicial Xt,

(ii) usamos a equacao (7.41) para definir o valor do derivativo no vencimento,

(iii) procedemos o calculo da opcao Americana usando a equacao (7.53),

(iv) repetimos todo o procedimento anterior para outro valor inicial Xt.

Se estivermos determinando a fronteira otima para uma opcao de venda Americana(LV (·)) como na figura 7.3, devemos, em cada instante ti = t + i∆t, 0 ≤ i ≤ M − 1,tomar o menor valor de Xti para o qual o valor esperado de continuacao supera o valorintrınseco. Procedendo desta forma para todos os ti, definimos a fronteira LV (Xti , ti).

No caso de uma opcao de compra Americana a fronteira LC (Xt, t) sera obtida a partirde cada ti, tomando o maior valor de Xti para o qual o valor esperado de continuacaosupera o valor intrınseco.

O aprecamento de um derivativo Americano sobre um ativo subjacente que paga divi-dendos deve ser procedido da mesma forma apresentada acima, apenas levando-se emconsideracao que a arvore binomial dos precos de Xt+i∆t tera a influencia de um redutor(1− α) referente a taxa de dividendos α a partir da data de pagamento dos mesmos.

Os derivativos com possibilidade de exercıcio antecipado podem ser aprecados numeri-camente atraves do metodo de simulacao de Monte-Carlo. O leitor encontrara em Car-riere (1996) [21], Tsitsiklis e Van Roy (2001) [99] e Longstaff e Schwartz (2001) [67]detalhes sobre tais procedimentos. Esta ultima referencia, que tornou-se popular, re-cebeu a denominacao de Mınimos Quadrados Monte-Carlo, ou LSM. Os autores usamas informacoes dos precos simulados para o calculo do valor esperado de continuacao.Este e obtido por uma regressao (MQO) dos fluxos de caixa subsequentes, no casode nao exercıcio da opcao, versus o preco do ativo subjacente, avaliado por diferentesfuncoes (polinomios classicos, de Legendre, de Hermite, de Laguerre, etc). Os metodosde aprecamento por simulacao de Monte-Carlo, em geral, demandam um grande tempocomputacional. Entretanto, sao particularmente interessantes para o aprecamento dederivativos Americanos/Bermudianos onde estejam presentes mais de uma fonte de in-certeza (como por exemplo modelos de mais de um fator).

As aproximacoes numericas sao uteis para o aprecamento como uma alternativa aosprocedimentos numericos. Referenciamos as aproximacoes quadraticas abordadas emMaCMillan (1986) [69] e Barone-Adesi e Whaley (1987) [4]. Maiores detalhes podemser encontrado nas referencias mencionadas no inıcio da secao.

7.6 Propriedades das opcoes

Nesta secao iremos apresentar algumas propriedades das opcoes Americanas. O conteudodesta secao e util para estabelecer limites para o preco da opcao Americana compar-ativamente ao preco da opcao Europeia e ao preco do ativo subjacente. Desta forma,

218

Page 229: Processos Estocásticos em Finanças

as metodologias numericas, quando corretamente formuladas, devem fornecer resulta-dos coerentes com os resultados ate entao definidos neste capıtulo incluindo os que seseguem.

Proposicao 7.1. Uma opcao de compra Americana sobre uma acao que nao paga div-idendos nunca sera exercida antes do vencimento.

Prova. Considere a formacao de dois portfolios A e B. O portfolio A e composto deuma opcao de compra Europeia que na data t tem preco c (Xt, t;K,T, σ, r), (que porsimplicidade de notacao sera escrita como c (Xt, t;K,T )) e por K tıtulos de renda fixaque valem Ke−r(T−t) ou Ke−rτ , onde T e o vencimento e τ = T − t. O portfolio Be composto de uma acao Xt. A tabela 7.1 abaixo mostra os valores dos porftolios nadata atual t e no vencimento T . Observe que nao ha fluxos de dividendos no portfolio

Tabela 7.1: Valores dos portfolios A e B na data atual e no vencimento

Portfolio Valor atual Valor no vencimentoXT < K XT > K

A c (Xt, t;K,T ) +Ke−rτ 0 +K (XT −K) +K

B Xt XT XT

B. No vencimento, quando XT < K, o portfolio A vale a mais que B. Similarmente,quando XT > K os dois portfolios tem o mesmo valor. Se o valor do portfolio A e maiorou igual ao de B em qualquer estado da natureza na data do vencimento, entao paraevitar a possibilidade de arbitragem, devera apresentar a mesma forma de dominanciaem qualquer anterior a T . Desta forma escreve-se

c (Xt, t;K,T ) +Ke−rT ≥ Xt (7.54)

A equacao (7.54) pode ser escrita por

c (Xt, t;K,T ) ≥(Xt −Ke−rτ

)+(7.55)

Podemos ainda escrever que

C (Xt, t;K,T ) ≥ c (Xt, t;K,T ) ≥(Xt −Ke−rτ

)+(7.56)

Note que se exercida em t, uma opcao de compra Americana vale (Xt −K)+ que e menorque (Xt −Ke−rτ )+

. Desta forma, o proprietario da opcao Americana prefere vende-laa exerce-la. Isto permite concluir que na ausencia de dividendos uma opcao de compraAmericana nunca sera exercida antes do vencimento e portanto seu preco sera igual aode uma Europeia.

Esta propriedade tem aplicacao imediata pois sabemos que o aprecamento da opcaode compra Europeia e feito com o uso de uma formula fechada de BMS.

Proposicao 7.2. Uma opcao Americana perpetua sobre uma acao ordinaria que naopaga dividendos deve valer tanto quanto esta acao.

219

Page 230: Processos Estocásticos em Finanças

Prova. Da equacao (7.56) temos que

C (Xt, t;K,T ) ≥(Xt −Ke−rτ

)+(7.57)

Para uma opcao perpetua T =∞, ou seja, τ =∞ (τ = T − t). Logo, Ke−rτ = 0 e entao

C (Xt, t;K,T ) ≥ Xt (7.58)

Por outro lado da equacao (7.12) temos que

Xt ≥ C (Xt, t;K,∞) (7.59)

Das equacoes (7.58) e (7.59) concluımos

Xt = C (Xt, t;K,∞) (7.60)

Proposicao 7.3. O preco de uma opcao de compra Americana e uma funcao convexado preco de exercıcio. Se K2 = λK1 + (1− λ)K3, onde K1 ≥ K2 ≥ K3 e 0 ≤ λ ≤ 1,entao

C (Xt, t;K2) ≤ λC (Xt, t;K1) + (1− λ)C (Xt, t;K3) (7.61)

Tabela 7.2: Valores dos portfolios A e B na data atual e no vencimento

Portfolio Valor atual Valor no vencimentoXT ≤ K3 K3 < XT < K2 K2 < XT < K1 XT ≥ K1

A λC (·;K1) + 0+ 0+ 0+ λ (XT −K1) +κC (·;K3) 0 κ (XT −K3) κ (XT −K3) κ (XT −K3)

B C (·;K2) 0 0 XT −K2 XT −K2

Prova. Considere dois portfolios A e B. O portfolio A contem λ opcoes de compra compreco de exercıcio K1 e (1− λ) opcoes de compra com preco de exercıcio K3. O portfolioB contem uma opcao de compra com preco de exercıcio K2. A tabela 7.2 mostra osvalores atual e no vencimento de cada portfolio (usamos a denominacao κ = 1− λ). Novencimento, em todos os estados da natureza dos precos XT , relativamente aos precos deexercıcios K1, K2 e K3, o valor do portfolio A e maior ou igual ao de B. Portanto, paraque nao haja arbitragem, na data t deve prevalecer a mesma dominancia do vencimentoe portanto vale a relacao em (7.61).

Exercıcio 7.10. Considere uma opcao de compra Americana sobre uma acao que pagadividendos. Mostre que e possıvel que haja exercıcio da opcao antes do vencimento.

220

Page 231: Processos Estocásticos em Finanças

7.7 Resumo e consideracoes finais

Este capıtulo analisou os conceitos relevantes para o aprecamento de derivativos compossibilidade de exercıcio antecipado. A maior parte dos conceitos foram desenvolvidosusando o caso de uma opcao de venda Americana. Neste contexto foi apresentado oconceito de tempo de parada e a sua importancia para definir o preco do derivativoAmericano. Sabemos que a ausencia de uma solucao fechada para o preco do derivativoAmericano e um obstaculo para o seu aprecamento imediato. Por esta razao os conceitosdeste capıtulo sao necessarios para o desenvolvimento de algorıtmos que tenham porfinalidade tal aprecamento. O proprietario de uma opcao Americana deve ser ativodurante todo o tempo de maturacao do derivativo. Ser ativo, neste caso, significaque deve estar continuamente avaliando o ganho do exercıcio imediato contra o valoresperado de continuacao (ou de manter viva a opcao). Ao aplicarmos continuamenteeste conceito desenvolvemos uma estrategia otima de tal forma que definimos o tempode parada por

t? = minu

[u : Xu < L (Xu, u)] (7.62)

A fronteira otima LV (Xt, t) e definida, neste caso, pelo menor preco que torna o valorde continuacao superior ao valor da opcao quando exercida (opcao de venda). Na regiaode continuacao vale a equacao de BMS e o valor da opcao e superior ao valor intrınseco.Na regiao em que e favoravel o exercıcio o preco da opcao e dado pelo valor intrınseco eprevalece uma desigualdade estrita na equacao de BMS. Foi mostrado que sob o argu-mento de nao arbitragem a derivada ∂V

∂xao longo da fronteira otima de exercıcio e tal

que ∂V∂x+ = ∂V

∂x−= −1. Esta condicao e denominada transicao sauve. Isto significa que,

no ponto otimo de exercıcio, a taxa de variacao do preco da opcao em relacao ao precodo ativo e identico para pontos imediatamente acima e abaixo da fronteira.

A definicao das fronteira LV (·) e LC (·) e feita numericamente e simultaneamente aoaprecamento da opcao Americana. Por esta razao o problema de aprecamento de umaopcao Americana e um problema de fronteira livre.

Em geral, no aprecamento, sao utilizadas metodologias como metodo de Monte-Carlo,diferencas finitas, metodo binomial, etc. Neste texto dedicamos atencao ao metodobinomial dada a sua importancia em financas. A calibragem do metodo binomial aoambiente do modelo de BMS (processo geometrico Browniano) foi explorada sob a oticado modelo de Cox, Ross e Rubinstein (1979) [24]. Sugerimos aos leitores interessdosna metodologia de aprecamento por Monte-Carlo que consultem a referencia relativaao metodo LSM em Longstaff e Schwartz (2001) [67]. Finalizamos o capıtulo apresen-tando algumas propriedades uteis para o aprecamento que foram demonstradas sob oargumento de nao arbitragem entre um instante t (antes do vencimento) e a data dematuracao T .

7.8 Apendice - Metodo binomial de CRR

Este Apendice apresenta os detalhes da calibracao dos parametros com o processo log-normal dos precos do ativo subjacente, conforme Cox, Ross e Rubinstein (1979) [24].

221

Page 232: Processos Estocásticos em Finanças

Para simplificar a notacao vamos considerar a data de vencimento t = T e a data inicialsera t = 0. Cada incremento de tempo ∆t do processo binomial sera ∆t = T

M.

Em primeiro lugar e processo geometrico Browniano em tempo contınuo e a respec-tiva solucao da EDP sao

dXt

Xt

= µdt+ σdBt (7.63)

Xt = xe(µ−12σ2)t+σBt x = X0 (7.64)

Sabemos que estas mesmas equacoes escritas na MME sao dadas por

dXt

Xt

= rdt+ σdBt (7.65)

Xt = xe(r−12σ2)t+σBt x = X0 (7.66)

Escrevendo as equacoes (7.64) e (7.66) em termos do logaritmo neperiano, temos

ln

(Xt

x

)=

(µ− 1

2σ2

)t+ σBt (7.67)

ln

(Xt

x

)=

(r − 1

2σ2

)t+ σBt (7.68)

Os valores esperados incondicionais de (7.67) e (7.68) sao

EP =

[ln

(Xt

x

)]=

(µ− 1

2σ2

)t (7.69)

EQ =

[ln

(Xt

x

)]=

(r − 1

2σ2

)t (7.70)

As variancias incondicionais sao identicas e dadas por

V arP[ln

(Xt

x

)]= V arQ

[ln

(Xt

x

)]= σ2t (7.71)

Agora discretizando o processo em intervalos de tempo iguais a ∆t, observamos queapos n intervalos, temos t = n∆t. As equacoes (7.69), (7.70) e (7.71) tornam-se

EP =

[ln

(Xt

x

)]=

(µ− 1

2σ2

)n∆t (7.72)

EQ =

[ln

(Xt

x

)]=

(r − 1

2σ2

)n∆t (7.73)

V arP[ln

(Xt

x

)]= V arQ

[ln

(Xt

x

)]= σ2n∆t (7.74)

Estas equacoes acima definem o processo estocastico e os seus dois primeiros momentosda variavel Xt que representa o preco do ativo subjacente no ambiente Gaussiano domodelo de BMS.

222

Page 233: Processos Estocásticos em Finanças

Para manter a coerencia da resposta do modelo binomial com a modelagem de BMS,necessitamos calibrar os parametros u e d para que os dois primeiros momentos sejamos mesmos nos dois casos. Vamos agora nos reportar ao modelo binomial.

Seja Z a variavel aleatoria associada aos movimentos de alta e baixa dos precos nomodelo binomial. Se o preco sobe entre (i− 1) ∆t e i∆t temos que Zi = 1. Se o precocai neste mesmo intervalo Zi = 0. Isto significa Zi = 1 com probabilidade p e Zi = 0com probabilidade 1 − p. Entre os instantes i∆t e (i+ 1) ∆t a situacao repete-se e osmovimentos sao independentes daqueles do intervalo anterior. Em outras palavras, Z euma variavel aleatoria que tem distribuicao de Bernoulli com parametro p (veja secao1.3). Apos n intervalos de tempo temos t = n∆t e o preco teve

∑ni=1 Zi movimentos de

alta e n−∑n

i=1 movimentos de baixa. Entao o preco Xt sera

Xt = xu∑ni=1 Zidn−

∑ni=1 Zi

Trabalhando a expressao acima, temos

ln

(Xt

x

)= n ln d+ ln

(ud

) n∑i=1

Zi (7.75)

Calculando o valor incondicional de (7.75), temos

EP

[ln

(Xt

x

)]= E

[n ln d+ ln

(ud

) n∑i=1

Zi

]

= n ln d+ (lnu− ln d)E

(n∑i=1

Zi

)= n ln d+ (lnu− ln d)np

= np lnu+ n (1− p) ln d (7.76)

A distribuicao de ln(Xtx

)para grandes valores de n sera proxima de uma distribuicao

normal. Isto porque limn→∞∑n

i=1 Zid= N (·). Este resultado e devido ao Teorema Cen-

tral do Limite (veja o teorema 1.4). Ou seja, o mundo em que o ativo tem movimentosde alta e/ou baixa (distribuicao binomial) tendera a uma distribuicao normal para oslog-retornos quando n e grande. Por esta razao impomos a condicao dos dois primeirosmomentos serem os mesmos daqueles do modelo de BMS.

Assim igualamos as equacoes (7.76) e (7.72)

np lnu+ n (1− p) ln d =

(µ− 1

2σ2

)n∆t

p lnu+ (1− p) ln d =

(µ− 1

2σ2

)∆t

p lnu+ (1− p) ln d = µ?∆t (7.77)

onde µ? = µ− 12σ2.

223

Page 234: Processos Estocásticos em Finanças

Sob a condicao de neutralidade ao risco a equacao (7.77) sera

q lnu+ (1− q) ln d = µ?N∆t (7.78)

onde µ? = r − 12σ2.

Calculando a variancia incondicional de ln(Xtx

)na equacao (7.75), temos

V arP[ln

(Xt

x

)]= V arP

[n ln d+ ln

(ud

) n∑i=1

Zi

]

=[ln(ud

)]2

V arP

(n∑i=1

Zi

)=[ln(ud

)]2

np (1− p) (7.79)

Igualando as equacoes (7.79) e (7.74), temos[ln(ud

)]2

np (1− p) = σ2n∆t

p (1− p)[ln(ud

)]2

= σ2∆t (7.80)

Na condicao de neutralidade ao risco a variancia nao e afetada.

Mencionamos anteriormente que no modelo de CRR havia a consideracao de que u = 1d,

entao lnu = − ln d. Este resultado levado na equacao (7.77) resulta em

p lnu+ (1− p) (− lnu) = µ?∆t

2p lnu = µ?∆t+ lnu

p =1

2+

µ?

2 lnu(7.81)

Observando a equacao (7.80) vemos que para calcular a variancia devemos computarp (1− p). Faremos isto com o resultado da equacao (7.81), entao

p (1− p) =

(1

2+µ?∆t

2 lnu

)(1

2− µ?∆t

2 lnu

)=

1

4− 1

4

(µ?∆t

lnu

)2

(7.82)

Tambem devemos computar ln(ud

). Assim temos

ln(ud

)= 2 lnu (7.83)

Usando os resultados de (7.82) e (7.83) na equacao (7.80), temos[1

4− 1

4

(µ∗∆t

lnu

)2]

(2 lnu)2 = σ2∆t (7.84)

224

Page 235: Processos Estocásticos em Finanças

Os autores consideraram que as potencias de ∆t maiores ou iguais da dois sao aproxi-mandamente zero (desprezıveis), logo resulta em

(lnu)2 = σ2∆t

lnu = σ√

∆t

u = eσ√

∆t (7.85)

Consequentemente

d = e−σ√

∆t (7.86)

Usando o resultado de (7.85) na equacao (7.81)

p =1

2+

µ?∆t

2σ√

∆t=

1

2+

1

2

µ?

σ

√∆t (7.87)

Note que para valores infinitesimais de ∆t (∆t → ∞), p tende a 12. Por outro lado,

vimos na equacao (7.33) que sob a MME a probabilidade (de alta) e

q =er∆t − du− d

A partir desta definicao pode-se demonstrar que para valores infinitesimais de ∆t (∆t→∞) q tende a 1

2.

Exercıcio 7.11. Sabendo que como consequencia de nao arbitragem o valor de q e

q =er∆t − du− d

entao mostre que

lim∆t→0

q =1

2

Exercıcio 7.12. Defina quais condicoes que u e d devem atender para que tenhamos0 ≤ q ≤ 1.

225

Page 236: Processos Estocásticos em Finanças

226

Page 237: Processos Estocásticos em Finanças

Referencias Bibliograficas

[1] Akaike, H. A new look at the statistical model identification. IEEE Transactionson Automatic Control 19, 6 (1974), 716–723.

[2] Anderson, H., Nam, K., and Vahid, F. Asymmetric nonlinear smooth transi-tion GARCH models. Nonlinear Time Series Analysis of Economic and FinancialData, Boston: Kluwer (1999), 191–207.

[3] Baidya, T., and Castro, P. Uma aplicacao do teorema da integral de Fourierna solucao da equacao diferencial de Black e Scholes para precificacao de opcoesde compra. Revista Brasileira de Mercado de Capitais 17, 45 (1992).

[4] Barone-Adesi, G., and Whaley, R. Efficient analytic approximation ofAmerican option values. Journal of Finance (1987), 301–320.

[5] Baxter, M., and Rennie, A. Financial Calculus: an introduction to derivativepricing. Cambridge University Press, 1996.

[6] Baz, J., and Chacko, G. Financial derivatives: pricing, applications, andmathematics. Cambridge University Press, 2004.

[7] Bjork, T. Arbitrage theory in continuous time. Oxford University Press, USA,2004.

[8] Black, F. The price of commodity contracts. Journal of Financial Economics 3(1976), 167–79.

[9] Black, F., and Scholes, M. The pricing of options and corporate liabilities.Journal of Political Economy 81, 3 (1973), 637–654.

[10] Bollerslev, T. Generalized autoregressive conditional heteroskedasticity. Jour-nal of Econometrics 31 (1986), 307–327.

[11] Bollerslev, T. A conditionally heteroskedastic time series model for speculativeprices and rates of return. The review of economics and statistics (1987), 542–547.

[12] Bollerslev, T., and Wright, J. High-frequency data, frequency domaininference, and volatility forecasting. Review of Economics and Statistics 83, 4(2001), 596–602.

[13] Brandimarte, P. Numerical methods in finance: a MATLAB-based introduc-tion. Wiley-Interscience, 2003.

227

Page 238: Processos Estocásticos em Finanças

[14] Breeden, D., and Litzenberger, R. Prices of contingent claims implied inoption prices. Journal of Business 51 (1978), 621–651.

[15] Breidt, F., and Carriquiry, A. Improved quasi-maximum likelihood estima-tion for stochastic volatility models. Modelling and prediction: honoring SeymourGeisser (1996), 228–247.

[16] Brock, W., D., D., Sheinkman, J., and LeBaron, B. A test for inde-pendence based on the correlation dimension. Econometrics Review 15, 3 (1996),197–235.

[17] Broto, C., and Ruiz, E. Estimation methods for stochastic volatility models:a survey. Journal of Economic Surveys 18, 5 (2004), 613–649.

[18] Brown, J., and Churchill, R. Fourier series and boundary value problems.McGraw-Hill Singapore, 1978.

[19] Campbell, J., Lo, A., and McKinlay, C. The Econometrics of FinancialMarkets. Princeton, New Jersey: Princeton University Press, 1997.

[20] Carnero, M., Pena, D., and Ruiz, E. Persistence and kurtosis in GARCHand stochastic volatility models. Journal of Financial Econometrics 2, 2 (2004),319–342.

[21] Carriere, J. Valuation of the early-exercise price for options using simula-tions and nonparametric regression. Insurance Mathematics and Economics 19, 1(1996), 19–30.

[22] Casella, G., and Berger, E. L., 1990: Statistical Inference. Duxbury Press,Belmont, California, 2001.

[23] Cox, J., Ingersoll Jr, J., and Ross, S. A theory of the term structure ofinterest rates. Econometrica: Journal of the Econometric Society (1985), 385–407.

[24] Cox, J., Ross, S., and Rubinstein, M. Option pricing: A simplified approach.Journal of Financial Economics 7 (1979), 229–263.

[25] Derman, E., and Kani, I. Riding on a smile. Risk 7, 2 (1994), 32–39.

[26] Derman, E., and Kani, I. Stochastic implied trees: Arbitrage pricing withstochastic term and strike structure of volatility. International Journal of Theo-retical and Applied Finance 1, 1 (1998), 61–110.

[27] Dickey, D., and Fuller, W. Distribution of the estimators for autoregressivetime series with a unit root. Journal of the American Statistical Association(1979), 427–431.

[28] Duffie, D. Dynamic asset pricing theory. Princeton University Press Princeton,NJ, 2001.

[29] Duffy, D. Finite Difference Methods in Financial Engineering: A Partial Dif-ferential Equation Approach. John Wiley& Sons Ltd, 2006.

228

Page 239: Processos Estocásticos em Finanças

[30] Dupire, B. Pricing with a smile. Risk 7 (1994), 18–20.

[31] Dupire, B. A unified theory of volatility. Tech. rep., Banque Paribas workingpaper, reprinted in Derivatives Pricing: The Classic Collection, edited by PeterCarr, 2004 (Risk Books, London), 1997.

[32] Dupire, B. Pricing and hedging with smiles. Mathematics of derivative securities1, 1 (1997), 103–111.

[33] Durbin, J., and Koopman, S. Time series analysis by state space methods.Oxford University Press, 2001.

[34] Elliot, R., and Kopp, P. Mathematics of Financial Markets. New-York,Springer, 2nd, 2005.

[35] Embrechts, P. Copulas: A personal view. Journal of Risk and Insurance (2008).

[36] Engle, R. Autoregressive conditional heteroscedasticity with estimates of thevariance of United Kingdom inflation. Econometrica: Journal of the EconometricSociety (1982), 987–1007.

[37] Engle, R., and Ng, V. Measuring and testing the impact of news on volatility.Journal of Finance (1993), 1749–1778.

[38] Fornari, F., and Mele, A. Sign-and volatility-switching ARCH models: the-ory and applications to international stock markets. Journal of Applied Econo-metrics (1997), 49–65.

[39] Franses, P., and Van Dijk, D. Nonlinear time series models in empiricalfinance. Cambridge University Press, 2000.

[40] Fuller, W. Introduction to statistical time series. Wiley-Interscience, 1996.

[41] Glasserman, P. Monte Carlo methods in financial engineering. Springer Verlag,2003.

[42] Glosten, L., Jagannathan, R., and Runkle, D. On the relation betweenthe expected value and the volatility of the nominal excess return on stocks. Jour-nal of Finance (1993), 1779–1801.

[43] Gonzalez-Rivera, G. Smooth-transition GARCH models. Studies in NonlinearDynamics and Econometrics 3, 2 (1998), 61–78.

[44] Gourieroux, C., and Jasiak, J. Financial econometrics: problems, models,and methods. Princeton University Press, 2001.

[45] Hagerud, G. Anew non-linear GARCH model. PhD thesis, PhD Dissertation,Stockholm School of Economics, 1997.

[46] Hamilton, J. Time series analysis. Princeton Univ Pr, 1994.

229

Page 240: Processos Estocásticos em Finanças

[47] Harrison, J., and Kreps, D. Martingales and arbitrage in multiperiod secu-rities markets. Journal of Economic theory 20, 3 (1979), 381–408.

[48] Harrison, J., and Pliska, S. Martingales and stochastic integrals in thetheory of continous trading. Stochastic processes and their applications 11 (1981),215–260.

[49] Harvey, A. Forecasting, structural time series models and the Kalman filter.Cambridge University Press, 1991.

[50] Harvey, A., Ruiz, E., and Shephard, N. Multivariate stochastic variancemodels. The Review of Economic Studies (1994), 247–264.

[51] Heston, S. A closed-form solution for options with stochastic volatility withapplications to bond and currency options. Review of Financial Studies (1993),327–343.

[52] Hogg, R., Craig, A., and McKean, J. Introduction to mathematical statis-tics. Prentice Hall, New Jersey, 2004.

[53] Hull, J. Options, futures, and other derivatives. Pearson Prentice Hall, 2008.

[54] Hull, J., and White, A. Pricing interest-rate-derivative securities. Review offinancial studies (1990), 573–592.

[55] Huynh, H., Lai, V., and Soumare, I. Stochastic Simulation and Applicationsin Finance with MATLAB Programs. John Wiley & Sons, 2009.

[56] Iorio Jr, R., and Iorio, V. Fourier analysis and partial differential equations.Cambridge University Press, 2001.

[57] Jackel, P. Monte Carlo methods in finance. Wiley, 2002.

[58] Jarrow, R., and Protter, P. A short history of stochastic integration andmathematical finance: the early years, 1880-1970. Lecture Notes-Monograph Series45 (2004), 75–91.

[59] Joshi, M. The concepts and practice of mathematical finance. Cambridge Uni-versity Press, 2003.

[60] Judd, K. Numerical methods in economics. The MIT Press, 1998.

[61] Kim, S., Shephard, N., and Chib, S. Stochastic volatility: likelihood inferenceand comparison with ARCH models. Review of Economic studies (1998), 361–393.

[62] Klebaner, F. Introduction to stochastic calculus with applications. ImperialCollege Pr, 2005.

[63] Kloeden, P., and Platen, E. Numerical solution of stochastic differentialequations. Springer, 1992.

230

Page 241: Processos Estocásticos em Finanças

[64] Kloeden, P., Platen, E., and Schurz, H. Numerical solution of SDE throughcomputer experiments. Springer Verlag, 1994.

[65] Koopman, S., Harvey, A., Doornik, J., and Shephard, N. STAMP:Structural time series analyser, modeller and predictor. Timberlake ConsultantsLondon, 2000.

[66] Kreyszig, E. Advanced engineering mathematics. John Wiley & Sons, Inc.,2007.

[67] Longstaff, F., and Schwartz, E. Valuing American options by simulation: Asimple least-squares approach. Review of Financial Studies 14, 1 (2001), 113–147.

[68] MacKinnon, J., Engle, R., and Granger, C. Long-run economic relation-ships: readings in cointegration. Oxford University Press (1991).

[69] MacMillan, L. Analytic approximation for the American put option. Advancesin futures and options research 1, 119-139 (1986), 4.

[70] McDonald, R. Derivatives markets. Addison-Wesley Reading, MA, 2003.

[71] McLeish, D. Monte Carlo simulation and finance. Wiley, 2005.

[72] McLeod, A., and Li, W. Diagnostic checking ARMA time series models usingsquared-residual autocorrelations. Journal of Time Series Analysis 4, 4 (1983),269–273.

[73] Merton, R. Theory of rational option pricing. The Bell Journal of Economicsand Management Science (1973), 141–183.

[74] Meucci, A. Risk and asset allocation. Springer, 2007.

[75] Mikosh, T. Elementary stochastic calculus with finance in view, vol. 6. WorldScientific Publishing Co. Pte. Ltd., 1999.

[76] Moretin, P., and Toloi, C. Analise de series temporais. Sao Paulo: EdgargBlucher, 2004.

[77] Neftci, S. An introduction to the mathematics of financial derivatives. AcademicPress, 2000.

[78] Nelson, D. The time series behavior of stock market volatility and returns.PhD thesis, PhD Dissertation, Massachusetts Institute of Technology, Dept. ofEconomics, 1988.

[79] Nelson, D. Conditional heteroskedasticity in asset returns: A new approach.Econometrica: Journal of the Econometric Society (1991), 347–370.

[80] Øksendal, B. Stochastic differential equations: an introduction with applica-tions. Springer, 2003.

231

Page 242: Processos Estocásticos em Finanças

[81] Oliveira, E.C. e Tygel, M. Metodos Matematicos para Engenharia. SocidadeBrasileira de Matematica, Rio de Janeiro, 2005.

[82] Pestman, W. Mathematical statistics: an introduction. Walter De Gruyter Inc,1998.

[83] Polson, N., Jacquier, E., and Rossi, P. Bayesian analysis of stochasticvolatility models. Journal of Business and Economic Statistics 20 (2002), 69–87.

[84] Rabemananjara, R., and Zakoian, J. Threshold ARCH models and asym-metries in volatility. Journal of Applied Econometrics (1993), 31–49.

[85] Ruiz, E. Quasi-maximum likelihood estimation of stochastic volatility models.Journal of Econometrics 63, 1 (1994), 289–306.

[86] Samuelson, P. Rational Theory of Warrant Pricing, in P. Cootner (ed.), TheRandom Character of Stock Market Prices, 1965.

[87] Sandmann, G., and Koopman, S. Estimation of stochastic volatility modelsvia Monte Carlo maximum likelihood. Journal of Econometrics 87, 2 (1998),271–301.

[88] Schwartz, E. The stochastic behavior of commodity prices: Implications forvaluation and hedging. Journal of Finance (1997), 923–973.

[89] Schwartz, E., and Smith, J. Short-term variations and long-term dynamicsin commodity prices. Management Science (2000), 893–911.

[90] Schwarz, G. Estimating the dimension of a model. The annals of statistics(1978), 461–464.

[91] Sentana, E. Quadratic ARCH models. The Review of Economic Studies (1995),639–661.

[92] Shephard, N., and Pitt, M. Likelihood analysis of non-Gaussian parameter-driven models. Economics Discussion Paper-Nuffield College Oxford (1995).

[93] Shimko, D. Finance in continuous time: a primer. Kolb, 1992.

[94] Shreve, S. Stochastic Calculus for Finance: Continuous-Time Models. Springer,2004.

[95] Shreve, S. Stochastic calculus for finance: The binomial asset pricing model.Springer Verlag, 2004.

[96] Smith Jr, C. Option pricing: a review. Journal of Financial Economics 3, 1-2(1976), 3–51.

[97] Steele, J. Stochastic calculus and financial applications. Springer Verlag, 2001.

[98] Tsay, R. Analysis of financial time series. Wiley-Interscience, 2005.

232

Page 243: Processos Estocásticos em Finanças

[99] Tsitsiklis, J., and Van Roy, B. Regression methods for pricing complexAmerican-style options. IEEE Transactions on Neural Networks 12, 4 (2001),694–703.

[100] Vasicek, O. An equilibrium characterization of the term structure. Journal offinancial economics 5, 2 (1977), 177–188.

[101] Wilmott, P., Howison, S., and Dewynne, J. The mathematics of financialderivatives: a student introduction. Cambridge University Press, 1995.

[102] Yoshino, J. Uma metodologia para a estimacao do risco no mercado acionariobrasileiro: preco Arrow-Debreu. Pesquisa e planejamento economico, IPEA 31, 1(2001), 125–152.

[103] Zakoian, J. Threshold heteroskedastic models. Journal of Economic Dynamicsand Control 18, 5 (1994), 931–955.

233

Page 244: Processos Estocásticos em Finanças

Indice Remissivo

arvore binomial, 213

aglomerados de volatilidade, 53AIC, 51AR, 46arbitragem, 116, 162ARCH, 58, 59ARIMA, 50ARMA, 46assimetria, 4ativo, 9

financeiro, 9objeto, 115subjacente, 115

autocorrelacao, 61autocovariancia, 39

BIC, 51Box e Jenkins, 45Box-Jenkins, 37Browniano, 73

multivariado, 178

calculo estocastico, 73multivariado, 178

cırculo unitario, 47cauda, 5

pesada, 5coeficiente, 4

de assimetria, 4de correlacao, 19

complementar, 2condicao

de Holder, 112de Lipshitz, 105, 112de Novikov, 153

condicao de primeira ordem, 33contrato

forward, 115futuro, 115

convergencia, 28de ordem p, 96em distribuicao, 28em probabilidade, 28media quadratica, 96quase certa, 28, 29

covariancia, 19curtose, 4

delta ∆, 120densidade, 3

de probabilidade, 24condicional, 18conjunta, 17, 18, 20, 30implıcita, 198

neutra ao risco, 199marginal, 17, 18neutra

implıcita, 164normal

bivariada, 21, 22multivariada, 21

densidade de transicao, 176dependencia linear, 53derivada de Radon-Nikodym, 150derivativo, 114

Americano, 168, 203, 217Bermudiano, 168, 203, 217exotico, 168

desigualdade, 27Chebyshev, 35, 36de Chebyshev, 27de Markov, 28dos momentos, 28em probabilidade, 27Jensen, 28Markov, 36Schwarz, 28

desvio padrao, 4

234

Page 245: Processos Estocásticos em Finanças

diferenciavel, 75distribuicao, 1

de Bernoulli, 6de Poisson, 3de probabilidade, 3binomial, 3, 7condicional, 13, 15, 16, 21, 22de Cauchy, 12de Poisson, 7de probabilidade

conjunta, 13exponencial, 3gama, 3, 10lognormal, 9marginal, 13, 15, 21normal, 3, 8simetrica, 5t de Student, 11uniforme, 3, 9

econometria, 37EDE, 81, 82, 95, 104EDP, 120

de Black e Scholes, 120efeito alavanca, 53, 64equacao

do calor, 120, 133, 134de Dupire, 201de Feynman-Kac, 189de Kolmogorov, 184de Langevin, 106diferencial

estocastica, 81, 82, 95, 100, 104, 175ordinaria, 143parabolica, 134parcial, 113, 120

fundamental de aprecamento, 160, 168,171

espaco, 1dos resultados, 1amostral, 1de probabilidade, 86parametrico, 31

estacionariedade, 42de segunda ordem, 42fraca, 42testes, 56

estimador, 31de maxima verossimilhanca, 33, 34nao tendencioso, 31

estrategia, 161auto-financiavel, 161de protecao, 162

evento, 1aleatorio, 1

exponencial estocastico, 191

formulade Ito, 99, 101de Ito, 73

multivariada, 103FAC, 40FACP, 41fator

de integracao, 106, 107fatos estilizados, 37, 53Feynman-Kac, 189filtracao, 89

natural, 89filtro, 69

de Kalman, 69financas, 9fronteira otima, 208, 217funcao, 3

geradora de momentos, 5caracterıstica, 5, 6de autocorrelacao, 40de autocorrelacao parcial, 41de verossimilhanca, 31, 33densidade, 3, 4, 6, 8–12

conjunta, 14, 16marginal, 14

distribuicao, 3funcao distribuicao de transicao, 176

GARCH, 37, 58AR, 37

gerador da difusao de Ito, 181multivariado, 183univariado, 181

grau de liberdade, 11gregas, 129

hedge, 129dinamico, 129

235

Page 246: Processos Estocásticos em Finanças

heterocedastico, 53Hull e White, 196

inferencia, 30estatıstica, 30

integravel, 76integracao, 92

estocastica, 92integral, 76

de Ito, 95, 96, 98de Reimann, 93de Reimann-Stieltjes, 94estocastica, 76

inversibilidade, 47isometria de Ito, 98

Kolmogorov, 184

lei fraca dos grandes numeros, 28lema de Ito, 73, 99, 101

multivariado, 103duas variaveis, 101multivariado, 179

log-retorno, 53LSTGARCH, 65

media, 4condicional, 14, 16, 19, 60, 61incondicional, 16, 20, 60, 61

metodobinomial, 211

CRR, 217de monte-carlo, 171LSM, 218

MA, 46Markov, 28

propriedade, 176, 181mediana, 5medida, 86

de probabilidade, 86, 147martingal, 157martingal equivalente, 153, 156neutra ao risco, 163

medidas equivalentes, 149meia-vida, 109mensuravel

funcao, 89mercado, 9

completo, 162de opcoes, 116

MME, 156, 157moda, 5modelo, 45

de Cox, Ingersoll e Ross, 197de Hull e White, 196de Vasicek, 196Box e Jenkins, 45de Black e Sholes, 117de BMS, 113, 117de Vasicek, 102EGARCH, 64martingal, 55RW1, 54RW2, 55RW3, 55

modelo CIR, 197modelo QGARCH, 65modelo TARCH, 64momento, 4

de ordem m, 5primeiro, 4segundo, 4terceiro, 4

Monte-Carlo, 57, 69, 147mudanca de medida, 147

NYMEX, 43

opcao, 114lookback, 170Americana, 115, 203Asiatica, 170Bermudiana, 168, 203com barreira, 169de venda, 122Europeia, 114exotica, 115, 168

operador, 41lag, 41

passeio aleatorio, 38ponte Browniano, 79portfolio, 24premio, 154

de risco, 154preco, 114

236

Page 247: Processos Estocásticos em Finanças

de risco de mercado, 155de exercıcio, 114

precos, 43de commodities, 108do petroleo, 43

probabilidade, 1condicional, 2incondicional, 19

problemade contorno livre, 208

processo, 73adaptado, 89aritmetico

Browniano, 80auto-similar, 75Browniano, 73

padrao, 74com incrementos estacionarios, 74de Ornstein-Uhlenbeck, 107de Vasicek, 102de Wiener, 74estocastico

adaptado, 89geometrico

Browniano, 80, 105martingal, 91submartingal, 91supermartingal, 91

processo de Itomultivariado, 178univariado, 97

processo estocastico, 37, 38

quantil, 5quase certamente, 28, 29, 86, 98

RB, 38ruıdo branco, 38

serie, 39de retorno, 52financeira, 52temporal, 37, 39

sigma σ-algebra, 85smile, 131smirk, 131solucao forte, 192solucao fraca, 192

solucao numerica, 211superfıcie de volatilidade implıcita, 201swap, 115

taxa, 102de juros, 102, 107, 155livre de risco, 116, 117

tempo de parada, 205teorema, 1, 29

central do limite, 29da representacao martingal, 177de Bayes, 2de Girsanov, 153fundamental de financas, 163limite, 27

teste, 56ADF, 56ARCH-LM, 66Box-Pierce, 57de adequacao do modelo, 67DF, 56do sinal do choque, 66do tamanho do choque, 67Ljung-Box, 57para autocorrelacao, 57Phillips-Perron, 57

transformada de Fourier, 6transicao suave, 210

unimodal, 5

valor esperado, 4condicional, 14, 84

valor intrınseco, 204variaveis aleatorias, 2

iid, 2independentes, 2

variavel, 1aleatoria, 1

contınua, 3discreta, 3momento, 4multidimensional, 13

variancia, 4condicional, 17, 19, 60incondicional, 60, 61

variacao, 76limitada, 76

237

Page 248: Processos Estocásticos em Finanças

nao limitada, 76quadratica, 77

do Browniano, 78Vasicek, 102, 196velocidade de reversao, 107, 108verossimilhanca, 31vetor, 13

aleatorio, 13volatilidade, 37

condicional, 58linear, 59nao linear, 64

estocastica, 68implıcita, 130local, 199

238