UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou...

188
UMA INTRODUC ¸ ˜ AO ` A TEORIA ECON ˆ OMICA DOS JOGOS Humberto Jos´ e Bortolossi Universidade Federal Fluminense Gilmar Garbugio Universidade Federal Fluminense Br´ ıgida Sartini Universidade Federal Rural do Rio de Janeiro VERS ˜ AO 1.1.2 2 de fevereiro de 2017 Por favor, envie suas sugest˜oes, corre¸c˜ oes e cr´ ıticas para [email protected]ff.br, [email protected]ff.br e [email protected].

Transcript of UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou...

Page 1: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 1

UMA INTRODUCAO A TEORIA

ECONOMICA DOS JOGOS

Humberto Jose BortolossiUniversidade Federal Fluminense

Gilmar GarbugioUniversidade Federal Fluminense

Brıgida SartiniUniversidade Federal Rural do Rio de Janeiro

VERSAO 1.1.2

2 de fevereiro de 2017

Por favor, envie suas sugestoes, correcoes e crıticas [email protected], [email protected] e [email protected].

Page 2: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 2

A minha esposa Joselı e a minha filha Hillary Winry.H. J. B.

A minha mae Rita e aos meus irmaos Humberto e Reginaldo.B. A. S.

Aos meus pais Orlando e Iraci e aos meus irmaos Roseli, Rosinei,Rosana, Carla, Andreia e Reginaldo.

G. G.

Page 3: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 3

Page 4: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 1

Sumario

Prefacio 3

1 Alguns marcos historicos 5

2 Jogos na forma estrategica 10

2.1 O que e um jogo? . . . . . . . . . . . . . . . . . . . . . 10

2.2 Solucoes de um jogo em estrategias puras . . . . . . . 13

2.2.1 Dominancia em estrategias puras . . . . . . . . 14

2.2.2 Equilıbrio de Nash em estrategias puras . . . . 20

2.2.3 Relacoes entre dominancia e equilıbrio de Nash 24

2.3 Estrategias mistas . . . . . . . . . . . . . . . . . . . . 27

2.4 Solucoes de um jogo em estrategias mistas . . . . . . . 31

2.4.1 Dominancia em estrategias mistas . . . . . . . 32

2.4.2 Equilıbrio de Nash em estrategias mistas . . . . 35

2.4.3 Relacoes entre dominancia e equilıbrio de Nash 45

2.4.4 Como interpretar estrategias mistas? . . . . . . 45

2.5 Jogos infinitos . . . . . . . . . . . . . . . . . . . . . . . 48

2.6 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 O teorema de equilıbrio de Nash 60

3.1 Usando o teorema de Brouwer . . . . . . . . . . . . . . 60

3.2 Usando o teorema de Kakutani . . . . . . . . . . . . . 65

3.3 Algumas propriedades dos equilıbrios de Nash . . . . . 69

3.4 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . 70

1

Page 5: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 2

2 Sumario

4 Calculando equilıbrios de Nash 714.1 Equilıbrio de Nash via um problema de otimizacao . . 714.2 Equilıbrio de Nash via equacoes polinomiais . . . . . . 744.3 Jogos de soma zero . . . . . . . . . . . . . . . . . . . . 82

4.3.1 Jogos de soma constante com dois jogadores . . 824.3.2 Equilıbrio de Nash em estrategias puras . . . . 864.3.3 Equilıbrio de Nash em estrategias mistas . . . . 914.3.4 O teorema minimax de von Neumann . . . . . 93

4.4 Equilıbrio de Nash via um problema de complementa-ridade . . . . . . . . . . . . . . . . . . . . . . . . . . . 1014.4.1 Jogos bimatriciais . . . . . . . . . . . . . . . . 1014.4.2 O algoritmo de Lemke-Howson . . . . . . . . . 104

4.5 Gambit . . . . . . . . . . . . . . . . . . . . . . . . . . 1044.6 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . 106

5 Jogos na forma extensa 1085.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . 1085.2 Equilıbrio de Nash . . . . . . . . . . . . . . . . . . . . 1105.3 Inducao retroativa e equilıbrio perfeito em subjogos . . 1145.4 O teorema de Kuhn-Zermelo . . . . . . . . . . . . . . 1185.5 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . 119

6 Exemplos 1206.1 O jogo Le Her simplificado . . . . . . . . . . . . . . . . 1206.2 O modelo de duopolio de Cournot . . . . . . . . . . . 1266.3 O modelo de duopolio de Bertrand . . . . . . . . . . . 1296.4 O modelo de duopolio de Stackelberg . . . . . . . . . . 1316.5 A tragedia dos comuns . . . . . . . . . . . . . . . . . . 133

A Convexidade 137

B Programacao Linear 145

C Respostas dos exercıcios 155

Bibliografia 173

Indice 183

Page 6: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 3

Prefacio

A teoria dos jogos e uma teoria matematica criada para se modelarfenomenos que podem ser observados quando dois ou mais “agentes dedecisao” interagem entre si. Ela fornece a linguagem para a descricaode processos de decisao conscientes e objetivos envolvendo mais deum indivıduo.

Suas aplicacoes incluem eleicoes, leiloes, balanco de poder, evolu-cao genetica, etc. Ela tambem e uma teoria matematica pura, quepode e tem sido estudada como tal, sem a necessidade de relaciona-lacom problemas comportamentais ou jogos per se.

Algumas pessoas acreditam que a teoria dos jogos formara, algumdia, o alicerce de um conhecimento tecnico estrito de como decisoessao feitas e de como a economia funciona. A teoria ainda nao atingiueste patamar e, hoje, e mais estudada em seus aspectos matematicospuros e, em aplicacoes, ela e usada como uma ferramenta ou alegoriaque auxiliam no entendimento de sistemas mais complicados.

Neste texto trataremos da teoria matematica dos jogos nao-coope-rativos estaticos de informacao completa e dos jogos dinamicos deinformacao perfeita.

A Teoria Economica dos Jogos nao deve ser confundida com aTeoria Combinatoria dos Jogos, iniciada por Sprague e Grundy nadecada de 30. Enquanto que a primeira tem motivacoes predomi-nante economicas e procura estabelecer metodos para se maximizaro ganho (payoff ), a segunda se concentra nos aspectos combinatoriosde jogos de mesa (por exemplo, a estrategia do jogo de nim) e naopermite “elementos imprevisıveis” como o lancamento de um dadoou o embaralhamento de cartas.

Acreditamos que o assunto seja estimulante para o estudante dematematica: ele tera a oportunidade de ver como conceitos de analise,

3

Page 7: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 4

4 Prefacio

topologia, otimizacao e probabilidade se integram em uma teoria apli-cada.

Agradecimentos 1Gostarıamos de agradecer a Hilmar Ilton Santana Ferreira, Polya-

ne Alves Santos e Larissa Santana Barreto, que participaram ativa-mente dos seminarios sobre teoria dos jogos realizados no perıodo2003-2004, momento no qual uma versao preliminar deste texto foiescrita. Tambem gostarıamos de agradecer a Rita de Cassia SilvaCosta, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, queleram o texto e fizeram varias sugestoes. Finalmente, gostarıamos deagradecer a Secao de Referencia (SRE) da Divisao de Bibliotecas eDocumentacao da PUC-Rio pela agilidade e eficiencia na aquisicaode alguns artigos difıceis de se encontrar.

Agradecimentos 2Gostarıamos de agradecer as varias pessoas que, apos a divulgacao

da versao Creative Commons deste livro, colaboraram com sugestoes:Doherty Andrade, Carlos Frederico Palmeira.

Humberto Jose BortolossiBrıgida Alexandre Sartini

Gilmar Garbugio

1 de fevereiro de 2017

Page 8: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 5

Capıtulo 1

Alguns marcoshistoricos

Neste capıtulo apresentaremos alguns marcos historicos da teoriados jogos relacionados principalmente com os topicos que iremos ex-plorar no texto. Para uma cronologia mais completa, recomendamosas referencias [46, 50, 65, 86, 95, 96].

O conceito de solucao de um jogo por estrategia mista1 surgiu pelaprimeira vez no estudo do jogo Le Her, realizado por James Walde-grave e descrito por ele em uma carta a Pierre Remond de Montmort,em 13 de novembro de 1713. Em seu estudo, ele procurou encontraruma estrategia que maximizasse a probabilidade de vitoria do joga-dor, independentemente da escolha de estrategia de seu oponente.Este jogo foi discutido por Montmort e por Nicholas Bernoulli em1713 e os resultados foram publicados nesse ano por Montmort, queincluiu a solucao de Waldegrave em um apendice.

Em 1838, Augustin Cournot publicou sua obra Recherches surles Principes Mathematiques de la Theorie des Richesses , na qualanalisou um caso especial de duopolio. As empresas decidiam asquantidades a produzir e Cournot definiu o conceito de equilıbrio de

1Uma estrategia pura e uma das escolhas que o jogador pode fazer. Umaestrategia mista e uma distribuicao de probabilidades sobre o conjunto de es-trategias puras. Definicoes formais serao apresentadas no proximo capıtulo.

5

Page 9: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 6

6 [CAP. 1: ALGUNS MARCOS HISTORICOS

Figura 1.1: Antoine Augustin Cournot (1801–1877).

mercado como sendo a situacao em que ambas as empresas reagemde forma otima a decisao da empresa concorrente. Este conceitode solucao e uma versao do equilıbrio de Nash aplicado ao caso doduopolio.

No inıcio do seculo XX, apareceram varios artigos sobre teoria dosjogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogode xadrez no artigo Uber eine Anwendung der Mengenlehre auf dieTheorie des Schachspiels , afirmando que, em cada etapa do jogo, pelomenos um dos jogadores possui uma estrategia que o levara a vitoriaou ao empate. Contudo, Zermelo nao demonstrou o teorema em seuartigo. A primeira demonstracao foi dada por Laszlo Kalmar. Apa-rentemente, foi Zermelo quem primeiro destacou o uso da semanticade otimalidade em teoria dos jogos: “Whether one could calculatewith mathematical objectivity, or even give a participant some ideaof, the value of a possible position in the game, as well as of the bestmove in this position: information without which the player wouldhave to eliminate both subjective and psychological guesses and theopinions of ‘the perfect player’, etc.?” ([95]).

No perıodo de 1921 a 1927, Emile Borel publicou uma serie denotas sobre jogos simetricos de soma zero com dois jogadores comum numero finito n de estrategias puras para cada jogador. Borelfoi o primeiro a tentar formular matematicamente este jogo. Ele in-troduziu o conceito de “metodo de jogada” (o que hoje correspondea estrategia pura) e procurou por uma solucao em estrategias mis-tas (o que hoje e conhecido como solucao minimax). Em 1921, eleprovou a existencia de tal solucao para n = 3 ([07]) e, em 1924,

Page 10: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 7

7

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).

para n = 5 ([08]). Borel acreditava que o resultado de existencianao seria valido para um n qualquer, mas como nao encontrou umcontra-exemplo, deixou o problema em aberto.

Figura 1.3: Felix Edouard Justin Emile Borel (1871-1956).

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usandotopologia e calculo funcional ([50]), John von Neumann demonstroua existencia de solucao em estrategias mistas de um jogo finito desoma zero com dois jogadores e um numero arbitrario de estrategiaspuras. Este artigo tambem introduziu a forma extensa de um jogo.

Ate a decada de 40, os artigos publicados sobre teoria dos jogosnao tinham despertado muito o interesse dos cientistas sociais e deoutras areas que pesquisavam sobre conflitos de interesses. Talvezisto se deva ao fato de que os artigos eram escritos por matematicose publicados em revistas matematicas. Este panorama foi alteradocom a publicacao em 1944 do livro Theory of Games and Economic

Page 11: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 8

8 [CAP. 1: ALGUNS MARCOS HISTORICOS

Behavior, escrito por John von Neumann e pelo economista OskarMorgenstern, um marco na teoria dos jogos.

Oskar Morgenstern John von Neumann(1902-1977) (1903-1957)

Figura 1.4: Oskar Morgenstern e John von Neumann.

Eles detalharam a formulacao de problemas economicos e mostraramvarias possibilidades de aplicacao da teoria dos jogos em economia,procurando apresentar as motivacoes, os raciocınios e as conclusoesda teoria de forma acessıvel, atraindo assim a atencao de pesquisa-

Page 12: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 9

9

dores de diversas areas. Na reedicao de 1947, tomada como padrao,os autores estabeleceram os axiomas da teoria da utilidade. O livrofoi republicado em 1953 e sua mais recente edicao e de 1980.

Na Universidade de Princeton, John Forbes Nash Jr. escreveu suatese de doutorado em 1949, sob o tıtulo Non-Cooperative Games . Eledefiniu o conceito de ponto de equilıbrio, atualmente conhecido comoequilıbrio de Nash de um jogo e provou sua existencia para jogos nao-cooperativos. Os resultados mais importantes de sua tese estao noartigo Equilibrium Points in N-Person Games de 1950 ([66]) e, maisdetalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).Ainda em 1950, Nash escreveu sobre o problema da barganha emThe Bargaining Problem ([68]) e, no ano de 1953, sobre jogos coo-perativos em Two Person Cooperative Games ([70]). Nestes, Nashdefiniu o conceito de solucao da barganha de Nash em um jogo coo-perativo com dois jogadores, estabeleceu um sistema de axiomas queesta solucao deveria satisfazer e provou a existencia e unicidade destasolucao.

Em 1994, John Harsanyi, John Nash e Reinhard Selten receberamo Premio Nobel de Economia em reconhecimento ao trabalho pioneirosobre analise de equilıbrio na teoria de jogos nao-cooperativos.

(a) (b) (c)

Figura 1.5: Ganhadores do premio Nobel de Economia em 1994:(a) John Harsanyi (1920-2000), (b) John Forbes Nash Jr.(1928-2015) e (c) Reinhard Selten (1930-2016).

Page 13: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 10

Capıtulo 2

Jogos na formaestrategica

2.1 O que e um jogo?

A teoria dos jogos pode ser definida como a teoria dos modelosmatematicos que estuda a escolha de decisoes otimas sob condicoesde conflito. O elemento basico em um jogo e o conjunto de jogadoresque dele participam. Cada jogador tem um conjunto de estrategias.Quando cada jogador escolhe sua estrategia, temos entao uma si-tuacao ou perfil no espaco de todas as situacoes (perfis) possıveis.Cada jogador tem interesse ou preferencias para cada situacao nojogo. Em termos matematicos, cada jogador tem uma funcao uti-lidade que atribui um numero real (o ganho ou payoff do jogador)a cada situacao do jogo. Mais especificamente, um jogo tem os se-guintes elementos basicos: existe um conjunto finito de jogadores,representado por

G = {g1, g2, . . . , gn},

e cada jogador gi ∈ G possui um conjunto finito

Si = {si1, si2, . . . , simi}

10

Page 14: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 11

[SEC. 2.1: O QUE E UM JOGO? 11

de opcoes, denominadas estrategias puras do jogador gi (mi ≥ 2).Um vetor

s = (s1j1 , s2j2 , . . . , snjn),

onde siji e uma estrategia pura para o jogador gi ∈ G, e denomi-nado um perfil de estrategias puras. O conjunto de todos os perfis deestrategias puras formam, portanto, o produto cartesiano

S =

n∏i=1

Si = S1 × S2 × · · · × Sn,

denominado espaco de estrategias puras do jogo. Para cada joga-dor gi ∈ G, existe uma funcao utilidade

ui : S → Rs �→ ui(s)

que associa o ganho (payoff) ui(s) do jogador gi a cada perfil deestrategias puras s ∈ S. Esta funcao utilidade e uma forma de re-presentar a preferencia do jogador gi com relacao aos varios perfis deestrategias do jogo ([13]).

Jogos descritos nesta forma sao denominados jogos estrategicos oujogos na forma normal . Neles, cada jogador deve fazer a sua escolhade estrategia sem o conhecimento das escolhas dos demais jogadores.Admite-se, contudo, que cada jogador conhece toda a estrutura dojogo. Por este motivo, jogos deste tipo tambem sao denominadosjogos nao-cooperativos de informacao completa.

Assume-se tambem que os jogadores sejam racionais, isto e, elessempre escolherao acoes que maximizem a sua funcao utilidade. Alemde ser racional, cada jogador (1) sabe que seus adversarios tambemsao racionais, (2) sabe que eles sabem que o jogador sabe que eles saoracionais, ad infinitum.

Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exem-plo mais conhecido na teoria dos jogos e o dilema do prisioneiro. Elefoi formulado por Albert W. Tucker em 1950, em um seminario parapsicologos na Universidade de Stanford, para ilustrar a dificuldade dese analisar certos tipos de jogos.

A situacao e a seguinte: dois ladroes, Al e Bob, sao capturadose acusados de um mesmo crime. Presos em selas separadas e sem

Page 15: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 12

12 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

poderem se comunicar entre si, o delegado de plantao faz a seguinteproposta: cada um pode escolher entre confessar ou negar o crime.Se nenhum deles confessar, ambos serao submetidos a uma pena de1 ano. Se os dois confessarem, entao ambos terao pena de 5 anos. Masse um confessar e o outro negar, entao o que confessou sera libertadoe o outro sera condenado a 10 anos de prisao. Neste contexto, temos

G = {Al,Bob},SAl = {confessar, negar}, SBob = {confessar, negar},

S = SAl × SBob =

{(confessar, confessar), (confessar, negar),(negar, confessar), (negar, negar)}.

As duas funcoes utilidade

uAl : S → R e uBob : S → Rsao dadas por

uAl(confessar, confessar) = −5, uAl(confessar, negar) = 0,

uAl(negar, confessar) = −10, uAl(negar, negar) = −1,

(que representam os ganhos de Al) e

uBob(confessar, confessar) = −5, uBob(confessar, negar) = −10,

uBob(negar, confessar) = 0, uBob(negar, negar) = −1

(que representam os ganhos de Bob). E uma pratica representar ospayoffs dos jogadores atraves de uma matriz, denominada matriz depayoffs.

Bobconfessar negar

Al

confessar (−5,−5) (0,−10)

negar (−10, 0) (−1,−1)

Nesta matriz, os numeros de cada celula representam, respectiva-mente, os payoffs de Al e Bob para as escolhas de Al e Bob corres-pondentes a celula.

Page 16: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 13

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 13

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulherdesejam sair para passear. O homem prefere assistir a um jogo defutebol enquanto que sua mulher prefere ir ao cinema. Se eles foremjuntos para o futebol, entao o homem tem satisfacao maior do que amulher. Por outro lado, se eles forem juntos ao cinema, entao a mu-lher tem satisfacao maior do que o homem. Finalmente, se eles saıremsozinhos, entao ambos ficam igualmente insatisfeitos. Esta situacaotambem pode ser modelada como um jogo estrategico. Temos:

G = {homem,mulher},Shomem = {futebol, cinema}, Smulher = {futebol, cinema},

S = Shomem × Smulher =

{(futebol, futebol), (futebol, cinema),

(cinema, futebol), (cinema, cinema)}.As duas funcoes utilidade uhomem : S → R e umulher : S → R saodescritas pela seguinte matriz de payoffs:

Mulherfutebol cinema

Homem

futebol (10, 5) (0, 0)

cinema (0, 0) (5, 10)

.

2.2 Solucoes de um jogo em estrategias

puras

Uma solucao de um jogo e uma prescricao ou previsao sobre o re-sultado do jogo. Existem varios conceitos diferentes de solucao. Nestasecao, investigaremos os dois conceitos mais comuns: dominancia eequilıbrio de Nash.

Considere o dilema do prisioneiro. Como encontrar uma solucaopara o dilema de Al e Bob, isto e, que estrategias sao plausıveis

Page 17: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 14

14 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

se os dois prisioneiros querem minimizar1 o tempo de cadeia? Seanalisarmos o jogo do ponto de vista de Al, ele pode raciocinar daseguinte maneira:

“Duas coisas podem acontecer: Bob pode confessar ouBob pode negar. Se Bob confessar, entao e melhor paramim confessar tambem. Se Bob nao confessar, entao eufico livre se eu confessar. Em qualquer um dos casos, emelhor para mim confessar. Entao, eu confessarei.”

Se analisarmos agora o jogo do ponto de vista de Bob, podemosaplicar a mesma linha de raciocınio e concluir que Bob tambem iraconfessar. Assim, ambos confessarao e ficarao presos por 5 anos.

Em termos da teoria dos jogos, dizemos que (1) os dois joga-dores possuem uma estrategia dominante, isto e, todas menos umaestrategia e estritamente dominada, (2) que o jogo e resoluvel por do-minancia estrita iterada e (3) que o jogo termina em uma solucao quee um equilıbrio de estrategia dominante, conceitos que definiremos aseguir.

2.2.1 Dominancia em estrategias puras

Frequentemente, iremos discutir perfis de estrategia na qual ape-nas a estrategia de um unico jogador gi ∈ G ira variar, enquanto queas estrategias de seus oponentes permanecerao fixas. Denote por

s−i = (s1j1 , . . . , s(i−1)ji−1, s(i+1)ji+1

, . . . , snjn) ∈S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn

uma escolha de estrategia para todos os jogadores, menos o jogador gi.Desta maneira, um perfil de estrategias pode ser convenientementedenotado por

s = (siji , s−i) = (s1j1 , . . . , s(i−1)ji−1, siji , s(i+1)ji+1

, . . . , snjn).

1No Exemplo 2.1, os payoffs foram definidos como numeros ≤ 0. Desta ma-neira, minimizar o tempo de cadeia e equivalente a maximizar o payoff.

Page 18: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 15

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 15

Definicao 2.1 (Estrategia Pura Estritamente Domi-nada) Dizemos que uma estrategia pura sik ∈ Si do joga-dor gi ∈ G e estritamente dominada pela estrategia sik′ ∈ Si se,independentemente das escolhas dos demais jogadores, o joga-dor gi ganhar mais escolhendo sik′ do que sik, isto e, se

ui(sik′ , s−i) > ui(sik, s−i),

para todo s−i ∈ S−i.

Definicao 2.2 (em estrategias puras)

(a) (Dominancia Estrita Iterada) Dominancia estrita ite-rada e o processo no qual, sequencialmente, se eliminam asestrategias que sao estritamente dominadas.

(b) (Equilıbrio de Estrategia Estritamente Dominan-te) Quando o processo de dominancia estrita iterada reduzo jogo para um unico perfil de estrategias puras s∗, dizemosque s∗ e um equilıbrio de estrategia estritamente dominante.

Exemplo 2.3 Considere o jogo determinado pela matriz de payoffsabaixo.

g2s21 s22 s23 s24

g1

s11 (5, 2) (2, 6) (1, 4) (0, 4)

s12 (0, 0) (3, 2) (2, 1) (1, 1)

s13 (7, 0) (2, 2) (1, 1) (5, 1)

s14 (9, 5) (1, 3) (0, 2) (4, 8)

Page 19: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 16

16 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Neste jogo, para o jogador g2, a estrategia s21 e estritamente domi-nada pela estrategia s24 e, assim, a primeira coluna da matriz podeser eliminada.

g2s22 s23 s24

g1

s11 (2, 6) (1, 4) (0, 4)

s12 (3, 2) (2, 1) (1, 1)

s13 (2, 2) (1, 1) (5, 1)

s14 (1, 3) (0, 2) (4, 8)

Agora, nesta matriz reduzida, para o jogador g1, as estrategias s11e s14 sao estritamente dominadas pelas estrategias s12 e s13, respec-tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Alemdisso, a estrategia s23 do jogador g2 e estritamente dominada pela es-trategia s22. Assim, a coluna 2 tambem pode ser eliminada. Obtemosentao uma matriz reduzida 2× 2.

g2s22 s24

g1s12 (3, 2) (1, 1)

s13 (2, 2) (5, 1)

Finalmente, a estrategia s24 do jogador g2 e estritamente dominadapela estrategia s22 e, na matriz 2 × 1 resultante, a estrategia s13 dojogador g1 e estritamente dominada pela estrategia s12. Vemos entaoque (s12, s22) e o equilıbrio de estrategias estritamente dominantes dojogo: o jogador g1 escolhe a estrategia s12 (ganhando 3) e o jogador g2escolhe a estrategia s22 (ganhando 2).

Note que, em cada passo do processo de eliminacao das estrategiasestritamente dominadas, o jogo e substituıdo por um outro jogo

Page 20: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 17

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 17

mais simples, no sentido de que o conjunto de estrategias purasde um jogador (aquele que tem uma estrategia estritamente domi-nada) e substituıdo por um subconjunto com menos elementos (ob-tido removendo-se justamente as estrategias que sao estritamente do-minadas). No exemplo acima, os conjuntos de estrategias puras ini-ciais dos dois jogadores sao dados, respectivamente, por

S1 = {s11, s12, s13, s14} e S2 = {s21, s22, s23, s24}.Como a estrategia pura s21 e estritamente dominada por s24, o con-junto S2 e substituıdo por {s22, s23, s24} = S2−{s21}. O conjunto S1

permanece o mesmo. Sendo assim, podemos substituir o jogo originalpor um mais simples, onde os conjuntos de estrategias puras dos doisjogadores sao dados por

S(1)1 = {s11, s12, s13, s14} e S

(1)2 = {s22, s23, s24}.

As funcoes utilidade do novo jogo sao as restricoes das funcoes utili-dade do jogo original aos novos conjuntos de estrategias puras:

u1|S(1)1

e u2|S(1)2

.

Para o novo jogo, vemos que as estrategias s11 e s14 sao estritamentedominadas pelas estrategias s12 e s13, respectivamente. Logo, pode-mos simplificar o jogo mais uma vez, considerando os conjuntos deestrategias puras

S(2)1 = {s12, s13} e S

(2)2 = {s22, s23, s24}.

Seguindo com as outras eliminacoes, terminamos com um jogo muitosimples, onde cada conjunto de estrategias puras e unitario:

S(5)1 = {s12} e S

(5)2 = {s22}.

Este processo de eliminacao gerou, portanto, uma cadeia de espacosde estrategias puras:

S = S1 × S2 � S(1) = S(1)1 × S

(1)2 � S(2) = S

(2)1 × S

(2)2 � · · ·

� S(5) = S(5)1 × S

(5)2 = {(s12, s22)}.

Page 21: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 18

18 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Neste exemplo, a tecnica de dominancia estrita iterada forneceu umunico perfil de estrategias como solucao do jogo, no caso, o perfil

(s12, s22) ∈ S(5)1 × S

(5)2 .

Contudo, pode acontecer da tecnica fornecer varios perfis ou, atemesmo, fornecer todo o espaco de estrategias, como e o caso da bata-lha dos sexos, onde nao existem estrategias estritamente dominadas.

Um outro conceito importante e o de estrategia pura fracamentedominada.

Definicao 2.3 (Estrategia Pura Fracamente Domi-nada) Dizemos que uma estrategia pura sik ∈ Si do joga-dor gi ∈ G e fracamente dominada pela estrategia sik′ ∈ Si

seui(sik′ , s−i) ≥ ui(sik, s−i),

para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i,

ui(sik′ , s•−i) > ui(sik, s•−i).

Em outras palavras, sik ∈ Si e fracamente dominada porsik′ ∈ Si se, independentemente das escolhas dos demais joga-dores, o jogador gi nada perde se trocar a estrategia sik ∈ Si

pela estrategia sik′ ∈ Si e, pelo menos para uma escolha dosdemais jogadores, esta troca da ao jogador gi um ganho maior.

Definicao 2.4

(a) (Dominancia Fraca Iterada) Dominancia fraca iteradae o processo no qual, sequencialmente, se eliminam as es-trategias que sao fracamente dominadas.

(b) (Equilıbrio de Estrategia Fracamente Dominante)Quando o processo de dominancia fraca iterada reduz o jogopara um unico perfil de estrategias puras s∗, dizemos ques∗ e um equilıbrio de estrategia fracamente dominante.

Page 22: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 19

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 19

Exemplo 2.4 Considere o jogo cuja matriz de payoffs e dada por:

g2s21 s22

g1s11 (1, 1) (1, 0)

s12 (1, 0) (0, 1)

.

A estrategia s12 do jogador g1 e fracamente dominada pela estra-tegia s11. Eliminando-a, obtemos a matriz reduzida:

g2s21 s22

g1 s11 (1, 1) (1, 0)

.

Vemos agora que a estrategia s22 do jogador 2 e estritamente do-minada pela estrategia s21. Sendo assim, (s11, s21) e o equilıbrio deestrategias fracamente dominadas do jogo.

Uma pergunta natural e se o processo de eliminacao das estrategiasdominadas depende ou nao da ordem em que sao realizadas. Parao caso de estrategias estritamente dominadas, pode-se mostrar queesta ordem e irrelevante, isto e, independentemente da ordem emque as estrategias (estritamente dominadas) sao eliminadas, obtem-sesempre a mesma matriz reduzida no final do processo. Por outro lado,o processo de eliminacao das estrategias fracamente dominadas podeconduzir a resultados diferentes, dependendo da ordem de eliminacao.Considere, por exemplo, o jogo (conforme [32]):

g2

s21 s22 s23

g1s11 (0, 2) (0, 0) (1, 0)

s12 (0, 3) (1, 0) (0, 0)

.

Page 23: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 20

20 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Eliminando-se, em sequencia, as estrategias s23 (que e estritamentedominada por s21), s11 (que e fracamente dominada por s12) e s22(que e estritamente dominada por s21), obtemos (s12, s21) como res-posta. Agora, eliminando-se, em sequencia, as estrategias s22 (quee estritamente dominada por s21), s12 (que e fracamente dominadapor s11) e s23 (que e estritamente dominada por s21), obtemos outraresposta: (s11, s21). Para detalhes sobre este assunto, recomendamosas referencias [01, 15, 26, 32, 47, 55].

Com relacao a complexidade computacional, os resultados mos-tram que os problemas relacionados com estrategias estritamente do-minadas tendem a ser mais faceis (no sentido que eles podem serresolvidos em tempo polinomial), enquanto que questoes envolvendoestrategias fracamente dominadas sao mais difıceis (no sentido queeles sao NP-completos). Por exemplo, saber se uma dada submatrizde uma matriz de payoffs pode ser obtida atraves do processo deeliminacao de estrategias dominadas e um problema polinomial parao caso de estrategias estritamente dominadas e e um problema NP-Completo para o caso de estrategias fracamente dominadas. Detalhessobre o assunto podem ser encontrados nas referencias [18, 33].

2.2.2 Equilıbrio de Nash em estrategias puras

Uma solucao estrategica ou equilıbrio de Nash de um jogo e umperfil de estrategias onde cada jogador nao tem incentivo de mudarsua estrategia se os demais jogadores nao o fizerem.

Definicao 2.5 (Equilıbrio de Nash) Dizemos que um perfilde estrategias

s∗ = (s∗1, . . . , s∗(i−1), s

∗i , s

∗(i+1), . . . , s

∗n) ∈ S

e um equilıbrio de Nash se

ui(s∗i , s

∗−i) ≥ ui(siji , s

∗−i)

para todo i = 1, . . . , n e para todo ji = 1, . . . ,mi, com mi ≥ 2.

Page 24: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 21

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 21

Exemplo 2.5

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrategias(confessar, confessar) e um equilıbrio de Nash. De fato:

uAl(confessar, confessar) = −5 > −10 = uAl(negar, confessar)

e

uBob(confessar, confessar) = −5 > −10 = uBob(confessar, negar).

Estas desigualdades mostram que, para o perfil de estrategias(confessar, confessar), um prisioneiro nao se sente motivado amudar a sua estrategia se o outro nao o fizer (ele nao vai ficarmenos tempo na cadeia fazendo isto).

Ja o perfil (negar, confessar) nao e um equilıbrio de Nash dojogo pois, neste caso, dado que Bob decide confessar, Al ficamenos tempo na cadeia se mudar a sua estrategia de negar paraconfessar. Em outras palavras, para o perfil (negar, confessar),Al se sente motivado a mudar a sua estrategia se Bob nao o fizer.

Os perfis (confessar, negar) e (negar, negar) tambem nao saoequilıbrios de Nash. Em (confessar, negar), Bob se sente moti-vado a mudar a sua estrategia se Al nao o fizer e, em (negar,negar), cada um dos prisioneiros se sente motivado a mudar asua estrategia se o outro nao o fizer. Desta maneira, vemos queo unico equilıbrio de Nash do jogo e (confessar, confessar).

(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estrategia (fu-tebol, futebol) e (cinema, cinema) sao os unicos equilıbrios deNash do jogo.

(c) No Exemplo 2.3, o unico equilıbrio de Nash do jogo e o perfil deestrategias (s12, s22).

Existem, contudo, jogos que nao possuem equilıbrios de Nash emestrategias puras. Este e o caso, por exemplo, do jogo de compararmoedas (matching pennies).

Page 25: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 22

22 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Exemplo 2.6 (Comparar moedas) Nesse jogo, dois jogadores exi-bem, ao mesmo tempo, a moeda que cada um esconde em sua mao.Se ambas as moedas apresentam cara ou coroa, o segundo jogadorda sua moeda para o primeiro. Se uma das moedas apresenta cara,enquanto a outra apresenta coroa, e a vez do primeiro jogador darsua moeda para o segundo. Esse jogo se encontra representado porsua matriz de payoffs dada abaixo.

g2s21 s22

g1s11 (+1,−1) (−1,+1)

s12 (−1,+1) (+1,−1)

Observe que o perfil de estrategias (s11, s21) nao e um equilıbrio deNash em estrategias puras, pois se o jogador g1 mantiver a sua es-trategia s11, o jogador g2 tera um ganho maior se mudar sua es-trategia de s21 para s22, isto e, ele se sente motivado a mudar a suaestrategia se o jogador g1 nao mudar a sua escolha. O mesmo com-portamento ocorre para o perfil de estrategias (s12, s22). Ja, para osperfis (s11, s22) e (s12, s21), e o jogador g1 que se sente motivado amudar de estrategia para ganhar mais, se o jogador g2 mantiver a suaestrategia. Isto mostra que o jogo de comparar moedas nao possuiequilıbrios de Nash em estrategias puras.

Existe uma maneira conveniente de se caracterizar equilıbrios deNash atraves das funcoes de melhor resposta. De maneira informal,a melhor resposta de um jogador para uma determinada escolha deestrategias dos demais jogadores e o conjunto de estrategias do jo-gador que maximizam o seu ganho quando os demais jogadores naomudam as suas escolhas. Mais precisamente, temos a seguinte

Definicao 2.6 (Funcoes de melhor resposta) A funcao demelhor resposta do jogador gi e a aplicacao

MRi : S−i → 2Si

Page 26: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 23

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 23

definida por

MRi(s−i) = argmaxsi∈Siui(si, s−i)

= {s∗i ∈ Si | ∀si ∈ Si, ui(s∗i , s−i) ≥ ui(si, s−i)},

com s−i ∈ S−i (aqui 2Si representa o conjunto das partes de Si).

A funcao de melhor resposta do jogo e a aplicacao

MR: S → 2S

definida por

MR(s) = (MR1(s−1),MR2(s−2), . . . ,MRn(s−n)),

com s ∈ S. Observacao: alguns autores usam as notacoesMRi : S−i ⇒ Si e MRi : S−i →→ Si para representar a funcaode melhor resposta MRi : S−i → 2Si .

Exemplo 2.7

(a) No dilema do prisioneiro (Exemplo 2.1), temos

MRAl : SBob →→ SAl

confessar �→ {confessar}negar �→ {confessar}

MRBob : SAl →→ SBob

confessar �→ {confessar}negar �→ {confessar}.

(b) Na batalha dos sexos (Exemplo 2.2), temos

MRHomem : SMulher →→ SHomem

futebol �→ {futebol}cinema �→ {cinema}

MRMulher : SHomem →→ SMulher

futebol �→ {futebol}cinema �→ {cinema}.

Page 27: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 24

24 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

(c) No Exemplo 2.3, temos

MR1(s21) = {s14}, MR1(s22) = {s12},MR1(s23) = {s12}, MR1(s24) = {s13},MR2(s11) = {s22}, MR2(s12) = {s22},MR2(s13) = {s22}, MR2(s14) = {s24}.

(d) No jogo de comparar moedas (Exemplo 2.6), temos

MR1(s21) = {s11}, MR1(s22) = {s12},MR2(s11) = {s22}, MR2(s12) = {s21}.

A proxima proposicao e uma consequencia direta das definicoesde equilıbrio de Nash e funcoes de melhor resposta.

Proposicao 2.1 s∗ = (s∗1, . . . , s∗i , . . . , s

∗n) ∈ S e um equilıbrio

de Nash em estrategias puras se, e somente se, s∗i ∈ MRi(s∗−i)

para todo i = 1, . . . , n.

Observacao. Como vimos, nem sempre um jogo possui um equi-lıbrio de Nash em estrategias puras. Contudo, e possıvel garantiresta existencia para certos tipos de jogos com estruturas especiais.O leitor interessado pode consultar os jogos descritos nos artigos [28,61, 80, 94]. Para resultados quantitativos, veja [60].

2.2.3 Relacoes entre dominancia e equilıbrio deNash

Proposicao 2.2 O processo de dominancia estrita iterada naopode eliminar um equilıbrio de Nash ao simplificar um jogo.

Demonstracao: Lembramos que, em cada etapa do processo de eli-minacao de estrategias estritamente dominadas, o conjunto de es-trategias puras de algum jogador e substituıdo por um subconjunto

Page 28: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 25

[SEC. 2.2: SOLUCOES DE UM JOGO EM ESTRATEGIAS PURAS 25

com menos elementos, obtido removendo-se as estrategias do jogadorque sao estritamente dominadas. Cada eliminacao gera um espaco deestrategias puras com menos elementos o que, sucessivamente, sim-plifica o jogo original:

S = S1 × · · · × Sn � S(1) = S(1)1 × · · · × S(1)

n �

· · · � S(k) = S(k)1 × · · · × S(k)

n .

Com esta notacao, o enunciado da proposicao pode ser colocado as-sim: se s∗ ∈ S e um equilıbrio de Nash, entao s∗ ∈ S(k).

A demonstracao sera feita por contradicao: suponha, por absurdo,que exista s∗ = (s∗1, . . . , s

∗n) ∈ S tal que s∗ e um equilıbrio de Nash,

mas s∗ �∈ S(k). Isto significa que existe i tal que s∗i ∈ S(l)i mas

s∗i �∈ S(l+1)i para algum l = 0, . . . , k − 1 (se l = 0, defina S

(0)i = Si).

Sem perda de generalidade, vamos supor que esta propriedade ocorrepela primeira vez para o ındice i, isto e, s∗i e a primeira estrategia doperfil de estrategias

s∗ = (s∗1, . . . , s∗(i−1), s

∗i , s

∗(i+1), . . . , s

∗n)

que e eliminada por uma estrategia estritamente dominante. Sendo

assim, existe s•i ∈ S(l)i tal que

ui(s∗i , s−i) < ui(s

•i , s−i)

para todo s−i ∈ S(l)−i. Como s∗i e a primeira estrategia a ser eliminada,

isto significa que s∗−i ∈ S(l)−i e, portanto,

ui(s∗i , s

∗−i) < ui(s

•i , s

∗−i).

Mas isto e um absurdo pois, por hipotese, s∗ = (s∗i , s∗−i) e um

equilıbrio de Nash.

Proposicao 2.3 Se o processo de dominancia estrita iteradadeixa apenas um unico perfil de estrategias puras s∗, entao s∗

e o unico equilıbrio de Nash do jogo.

Page 29: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 26

26 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Demonstracao: Suponha que o processo de dominancia estrita iteradagere uma cadeia de espacos de estrategias puras

S = S1 × · · · × Sn � S(1) = S(1)1 × · · · × S(1)

n �

· · · � S(k) = S(k)1 × · · · × S(k)

n ,

onde o ultimo conjunto da cadeia e unitario:

S(k) = S(k)1 × · · · × S(k)

n = {s∗} = {(s∗1, . . . , s∗i , . . . , s∗n)}.

Note que, em particular, s∗1 ∈ S(l)1 , s∗2 ∈ S

(l)2 , . . . , s∗n ∈ S

(l)n , para

todo l = 0, . . . , k. Vamos mostrar que, nesta situacao, s∗ e o unicoequilıbrio de Nash do jogo. De fato, basta mostrar que s∗ e umequilıbrio de Nash, pois a unicidade e uma consequencia direta daProposicao 2.2. Suponha entao, por absurdo, que s∗ nao seja umequilıbrio de Nash. Neste caso, devem existir ındice i e estrategiapura s[1]

i ∈ Si, com s[1]

i �= s∗i , tais que

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i).

Dado que (s[1]

i , s∗−i) �∈ S(k) e dado que s∗ι ∈ S(l)ι para todo ι = 1, . . . n

e para todo l = 0, . . . , k, segue-se que a estrategia s[1]

i e estritamentedominada por alguma outra estrategia s[2]

i ∈ Si. Segue-se entao que,em particular, ui(s

[1]

i , s∗−i) < ui(s[2]

i , s∗−i) e, portanto,

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i) < ui(s[2]

i , s∗−i).

Note que, por causa destas desigualdades, segue-se que s[2]

i �= s[1]

i es[2]

i �= s∗i . Como (s[2]

i , s∗−i) tambem nao pertence a S(k), segue-se que aestrategia s[2]

i e estritamente dominada por uma outra estrategia s[3]

i ∈Si. Sendo assim, ui(s

[2]

i , s∗−i) < ui(s[3]

i , s∗−i) e, portanto,

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i) < ui(s[2]

i , s∗−i) < ui(s[3]

i , s∗−i).

Como antes, destas desigualdades, segue-se que s[3]

i �= s[2]

i , s[3]

i �= s[1]

i es[3]

i �= s∗i . Prosseguindo desta maneira, construirıamos uma sequenciainfinita (s[1]

i , s[2]

i , s[3]

i , . . . , s[r]

i , . . .) de estrategias puras distintas do jo-gador gi satisfazendo as desigualdades

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i) < · · · < ui(s[r]

i , s∗−i) < · · · .

Page 30: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 27

[SEC. 2.3: ESTRATEGIAS MISTAS 27

Mas isto e um absurdo, pois Si e um conjunto finito.

A recıproca da Proposicao 2.3 e falsa, isto e, mesmo que o jogotenha um unico equilıbrio de Nash, ele nao e necessariamente obtido apartir do processo de dominancia estrita iterada. O jogo cuja matrizde payoffs e

g2s21 s22 s23

g1

s11 (−1,+1) (+1,−1) (−1,+1)

s12 (+1,−1) (−1,+1) (+1,−1)

s13 (−1,+1) (+1,−1) (+5,+5)

fornece um contra-exemplo: s∗ = (s13, s23) e o unico equilıbrio deNash do jogo, mas nao existem estrategias estritamente dominadas.

A Proposicao 2.2 e falsa se trocarmos dominancia estrita por do-minancia fraca, isto e, o processo de dominancia fraca iterada podeeliminar um equilıbrio de Nash (veja o exercıcio [10] na pagina 58para um contra-exemplo). Se o processo de dominancia fraca iteradareduz o jogo para apenas um unico perfil de estrategias (como naProposicao 2.3), entao este perfil e obrigatoriamente um equilıbrio deNash, contudo, ele nao e necessariamente o unico equilıbrio de Nashdo jogo.

2.3 Estrategias mistas

Como vimos no jogo de comparar moedas do Exemplo 2.6, existemjogos que nao possuem equilıbrios de Nash em estrategias puras. Umaalternativa para estes casos e a de considerar o jogo do ponto de vistaprobabilıstico, isto e, ao inves de escolher um perfil de estrategiaspuras, o jogador deve escolher uma distribuicao de probabilidade sobresuas estrategias puras.

Uma estrategia mista pi para o jogador gi ∈ G e uma distribuicaode probabilidades sobre o conjunto Si de estrategias puras do jogador,

Page 31: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 28

28 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

isto e, pi e um elemento do conjunto

Δmi =

{(x1, . . . , xmi) ∈ Rmi | x1 ≥ 0, . . . , xmi ≥ 0 e

mi∑k=1

xk = 1

}.

Assim, se pi = (pi1, pi2, . . . , pimi), entao

pi1 ≥ 0, pi2 ≥ 0, . . . , pimi≥ 0 e

mi∑k=1

pik = 1.

Note que cada Δmi e um conjunto compacto e convexo. NasFiguras 2.1 e 2.2 temos os desenhos de Δ2 e Δ3, respectivamente. Ospontos extremos (vertices) de Δmi , isto e, os pontos da forma

e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), . . . , emi = (0, 0, . . . , 0, 1)

dao, respectivamente, probabilidade 1 as estrategias puras si1, si2,. . . , simi . Desta maneira, podemos considerar a distribuicao de pro-babilidade ek como a estrategia mista que representa a estrategiapura sik do jogador gi.

10

1

x1

x2

Figura 2.1: Δ2 ={(x1, x2) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1

}.

Page 32: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 29

[SEC. 2.3: ESTRATEGIAS MISTAS 29

0

1

1

1

x1

x2

x3

Figura 2.2: Δ3 ={(x1, x2, x3) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 +

x2 + x3 = 1}.

O espaco de todos os perfis de estrategia mista e o produto car-tesiano

Δ = Δm1 ×Δm2 × · · · ×Δmn ,

denominado espaco de estrategias mistas. Como o produto cartesianode conjuntos compactos e convexos e compacto e convexo, vemos queΔ e compacto e convexo.

Um vetor p ∈ Δ e denominado um perfil de estrategias mistas.Como no caso de estrategias puras, usaremos a notacao p−i pararepresentar as estrategias mistas de todos os jogadores, excluindo-sea do jogador gi. Desta maneira, escreveremos

(pi,p−i)

para representar p = (p1, . . . ,pi, . . . ,pn). Como a estrategia pura sikpode ser identificada com a distribuicao de probabilidades que dapeso 1 a sik e peso 0 as demais estrategias do jogador gi, usaremos

(sik,p−i)

Page 33: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 30

30 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

como uma notacao alternativa para o perfil de estrategias mistas(ek,p−i). Do mesmo modo, usaremos

(pi, s−i)

para indicar o perfil de estrategias mistas onde o jogador gi escolhea distribuicao de probabilidades pi e os demais jogadores escolhemdistribuicoes que dao peso 1 as estrategias puras em s−i.

Cada perfil de estrategias mistas p = (p1, . . . ,pn) ∈ Δ determinaum payoff esperado (utilidade esperada), uma media dos payoffs pon-derada pelas distribuicoes de probabilidades p1, . . . , pn. Mais preci-samente, se

p = (p1,p2, . . . ,pn)

= (p11, p12, . . . , p1m1︸ ︷︷ ︸p1

; p21, p22, . . . , p2m2︸ ︷︷ ︸p2

; . . . ; pn1, pn2, . . . , pnmn︸ ︷︷ ︸pn

),

entao

ui(p) =

m1∑j1=1

m2∑j2=1

· · ·mn∑jn=1

p1j1 · p2j2 · · · pnjn · ui(s1j1 , s2j2 , . . . , snjn).

(2.1)Cuidado com o abuso de notacao: estamos usando ui para representara funcao utilidade tanto em estrategias puras quanto em estrategiasmistas.

Como exemplo, considere o jogo de comparar moedas na pagi-na 22. Se g1 escolhe a distribuicao de probabilidade p1 = (1/4, 3/4)e g2 escolhe a distribuicao de probabilidade p2 = (1/3, 2/3), entaoos payoffs esperados associados ao perfil de estrategias mistas p =(p1,p2) = (1/4, 3/4; 1/3, 2/3) sao dados por

u1(p) =2∑

j1=1

2∑j2=1

p1j1 · p2j2 · u1(s1j1 , s2j2)

= p11 · p21 · u1(s11, s21) + p11 · p22 · u1(s11, s22) +

p12 · p21 · u1(s12, s21) + p12 · p22 · u1(s12, s22)

=1

4· 13· (+1) +

1

4· 23· (−1) +

3

4· 13· (−1) +

3

4· 23· (+1)

= +1

6

Page 34: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 31

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 31

e, analogamente,

u2(p) =

2∑j1=1

2∑j2=1

p1j1 · p2j2 · u2(s1j1 , s2j2)

= p11 · p21 · u2(s11, s21) + p11 · p22 · u2(s11, s22) +

p12 · p21 · u2(s12, s21) + p12 · p22 · u2(s12, s22)

=1

4· 13· (−1) +

1

4· 23· (+1) +

3

4· 13· (+1) +

3

4· 23· (−1)

= −1

6.

Observacao. Se p∗ = (p∗i ,p

∗−i) ∈ Δ, entao a funcao x �→ ui(x,p

∗−i)

preserva combinacoes convexas . Mais precisamente, se x1, . . . , xr ∈Δmi e λ1, . . . , λr sao escalares nao-negativos com

∑rk=1 λk = 1, entao

ui

(r∑

k=1

λk · xk,p∗−i

)=

r∑k=1

λk · ui(xk,p∗−i). (2.2)

Em particular, se

p∗i = (p∗i1, . . . , p

∗imi

) =

mi∑k=1

p∗ik · ek, (2.3)

com ek o k-esimo vetor da base canonica de Rmi , entao

ui(p∗) = ui(p

∗i ,p

∗−i) = ui

(mi∑k=1

p∗ik · ek,p∗−i

)=

mi∑k=1

p∗ik · ui(ek,p∗−i).

(2.4)

2.4 Solucoes de um jogo em estrategiasmistas

Todos os criterios basicos para solucoes de jogos em estrategiaspuras podem ser estendidos para estrategias mistas.

Page 35: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 32

32 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

2.4.1 Dominancia em estrategias mistas

Definicao 2.7 (Estrategia Mista Estritamente Domi-nada) Dizemos que uma estrategia mista pi ∈ Δmi do joga-dor gi ∈ G e estritamente dominada pela estrategia p′

i ∈ Δmi

se, independentemente das escolhas de distribuicoes de proba-bilidade dos demais jogadores, o jogador gi ganha mais esco-lhendo p′

i do que pi, isto e, se

ui(p′i,p−i) > ui(pi,p−i),

para todo p−i ∈ Δ−i = Δm1×· · ·×Δmi−1×Δmi+1×· · ·×Δmn .

Como os payoffs ui(p′i,p−i) e ui(pi,p−i) sao, respectivamente,

combinacoes convexas dos payoffs ui(p′i, s−i) e ui(pi, s−i),

segue-se que a condicao acima e equivalente a

ui(p′i, s−i) > ui(pi, s−i),

para todos perfis de estrategias puras s−i ∈ S−i.

Exemplo 2.8 ([30], pagina 21) Considere o jogo com a seguintematriz de payoffs :

g2s21 s22

g1

s11 (5, 3) (0, 0)

s12 (0, 0) (5, 3)

s13 (2, 1) (2, 1)

.

A estrategia mista p1 = (0, 0, 1) ∈ Δ3 do jogador g1 e estritamente

Page 36: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 33

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 33

dominada pela estrategia mista p′1 = (1/2, 1/2, 0) ∈ Δ3, pois

u1(p′1,p2) = u1

(1

2,1

2, 0; p21, p22

)=

5

2· p21 + 5

2· p22 =

5

2

>

u1(p1,p2) = u1

(0 , 0 , 1; p21, p22

)= 2 · p21 + 2 · p22 = 2

para todo p2 = (p21, p22) ∈ Δ2. Como p1 = (0, 0, 1) representaa estrategia pura s13 do jogador g1, este exemplo tambem mostraque uma estrategia pura pode nao ser dominada por nenhuma outraestrategia puras mas, ainda sim, ser dominada por uma estrategiamista.

Exemplo 2.9 ([31], pagina 7) Uma estrategia mista que atribuiprobabilidade positiva para uma estrategia pura estritamente domi-nada tambem e estritamente dominada (Exercıcio [13]). Contudo,uma estrategia mista pode ser estritamente dominada mesmo que elaatribua probabilidades positivas apenas para as estrategias puras quenao sao nem mesmo fracamente dominadas. Considere, por exemplo,o jogo com a seguinte matriz de payoffs :

g2s21 s22

g1

s11 (5, 3) (2, 0)

s12 (2, 0) (5, 3)

s13 (4, 1) (4, 1)

.

As estrategias puras s11 e s12 nao sao fracamente dominadas, masa estrategia mista p1 = (1/2, 1/2, 0) e estritamente dominada pelaestrategia mista p′

1 = (0, 0, 1) (que corresponde a estrategia pura s13),

Page 37: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 34

34 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

pois

u1(p′1,p2) = u1

(0 , 0 , 1; p21, p22

)= 4 · p21 + 4 · p22 = 4

>

u1(p1,p2) = u1

(1

2,1

2, 0; p21, p22

)=

7

2· p21 + 7

2· p22 =

7

2

para todo p2 = (p21, p22) ∈ Δ2.

A definicao de dominancia estrita iterada para estrategias mistas quedaremos aqui segue a linha proposta pelas referencias [26, 31, 74].Abordagens alternativas podem ser encontradas em [01, 15].

Definicao 2.8 (Dominancia Estrita Iterada em Estra-

tegias Mistas) Sejam S(0)i = Si e Δ

(0)mi = Δmi . Defina, recur-

sivamente,

S(n)i = {s ∈ S

(n−1)i | �pi ∈ Δ(n−1)

mital que

∀s−i ∈ S(n−1)−i , ui(pi, s−i) > ui(s, s−i)}

e

Δ(n)mi

= {pi = (pi1, . . . , pimi) ∈ Δmi |∀k = 1, . . . ,mi, pik > 0 somente se sik ∈ S

(n)i }.

A intersecao

S∞i =

∞⋂n=0

S(n)i

e o conjunto de estrategias puras que sobrevivem a remocaoiterada de estrategias estritamente dominadas e

Page 38: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 35

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 35

Δ∞mi

= {pi ∈ Δmi | �p′i ∈ Δmi

tal que ∀s−i ∈ S(∞)−i , ui(p

′i, s−i) > ui(pi, si)}

e o conjunto de todas as estrategias mistas do jogador gi quesobreviveram a tecnica de dominancia estrita iterada.

Note que S(n)

i e o conjunto de estrategias puras em S(n−1)

i que nao saoestritamente dominadas pelas estrategias mistas em Δ(n−1)

mie que Δ(n)

mi

e o conjunto de estrategias mistas que da probabilidades positivasapenas para as estrategias puras em S(n)

i .

Definicao 2.9 (Equilıbrio de Estrategia EstritamenteDominante) Se, no processo de dominancia estrita iterada, oconjunto S∞ = S∞

1 × · · · × S∞n e unitario, isto e, se

S∞ = {s∗},

entao dizemos que s∗ e um equilıbrio de estrategia estritamentedominante.

Como no caso de estrategias puras, e possıvel mostrar que os con-juntos S∞ = S∞

1 × · · · × S∞n e Δ∞ = Δ∞

m1× · · · ×Δ∞

mnnao depen-

dem da ordem em que as estrategias estritamente dominadas saoremovidas. Nao apresentaremos a demonstracao deste fato aqui.O leitor interessado podera encontra-la (bem como as definicoes eresultados sobre estrategias mistas fracamente dominadas) nas re-ferencias [01, 15, 26, 55].

2.4.2 Equilıbrio de Nash em estrategias mistas

Definicao 2.10 (Equilıbrio de Nash) Dizemos que um per-fil de estrategias mistas

Page 39: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 36

36 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

p∗ = (p∗1,p

∗2, . . . ,p

∗n) ∈ Δ = Δm1 ×Δm2 × · · · ×Δmn

e um equilıbrio de Nash se

ui(p∗i ,p

∗−i) ≥ ui(p,p

∗−i)

para todo p ∈ Δmi , isto e, nenhum jogador sente motivacaode trocar a sua estrategia mista se os demais jogadores nao ofizerem.

Exemplo 2.10

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrategiasmistas

p∗ = (p∗1,p

∗2) = (1, 0; 1, 0)

e um equilıbrio de Nash, pois

u1(p1,p∗2) = u1(p11, p12; 1, 0) = 5 · p11 − 10 ≤

− 5 = u1(1, 0; 1, 0) = u1(p∗1,p

∗2)

para todo p1 = (p11, p12) ∈ Δ2 e

u2(p∗1,p2) = u2(1, 0; p21, p22) = 5 · p21 − 10 ≤

− 5 = u2(1, 0; 1, 0) = u2(p∗1,p

∗2)

para todo p2 = (p21, p22) ∈ Δ2. Observe que este equilıbriocorresponde ao equilıbrio em estrategias puras

s∗ = (confessar, confessar).

Mostraremos mais adiante que este e o unico equilıbrio de Nashem estrategias mistas do jogo.

(b) Na batalha dos sexos (Exemplo 2.2), os equilıbrios de Nash emestrategias mistas sao

(1, 0; 1, 0), (0, 1; 0, 1) e (2/3, 1/3; 1/3, 2/3).

Page 40: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 37

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 37

Os dois primeiros perfis de estrategias mistas correspondem asestrategias puras (futebol, futebol) e (cinema, cinema), respec-tivamente. Mostraremos mais adiante que estes sao os unicosequilıbrios de Nash em estrategias mistas do jogo.

(c) No Exemplo 2.3, o unico equilıbrio de Nash em estrategia mistae o ponto

(0, 1, 0, 0; 0, 1, 0, 0)

que corresponde ao equilıbrio de Nash (s12, s22) em estrategiaspuras.

(d) No jogo de comparar moedas do Exemplo 2.6, o unico equilıbriode Nash em estrategias mistas e o ponto

(1/2, 1/2; 1/2, 1/2).

Como no caso de estrategias puras, podemos caracterizar equilı-brios de Nash em estrategias mistas atraves das funcoes de melhorresposta. Considere um jogo com espaco de estrategias mistas Δ =Δm1 ×· · ·×Δmi ×· · ·×Δmn . No que se segue, usaremos as seguintesnotacoes:

Δ(Si) = Δmi e Δ(S−i) = Δm1 × · · · ×Δmi−1 ×Δmi+1 × · · ·Δmn .

Definicao 2.11 (Funcoes de melhor resposta em estra-tegias mistas) A funcao de melhor resposta do jogador gi e aaplicacao

MRi : Δ(S−i) → 2Δ(Si)

definida por MRi(p−i) = argmaxpi∈Δ(Si) ui(pi,p−i), isto e,

MRi(p−i)

=

{p∗i ∈ Δ(Si) | ∀pi ∈ Δ(Si), ui(p

∗i ,p−i) ≥ ui(pi,p−i)},

com p−i ∈ Δ(S−i). A funcao de melhor resposta do jogo e aaplicacao

MR: Δ → 2Δ

Page 41: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 38

38 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

definida por

MR(p) = (MR1(p−1),MR2(p−2), . . . ,MRn(p−n)),

com p ∈ Δ.

Note que, como Δ(Si) e um conjunto compacto nao-vazio e afuncao pi �→ ui(pi,p−i) e contınua, podemos usar o teorema de Wei-erstrass para garantir que MRi(p−i) = argmaxpi∈Δ(Si) ui(pi,p−i) eum conjunto nao-vazio para todo p−i ∈ Δ(S−i).

A proxima proposicao e uma consequencia direta das definicoesde equilıbrio de Nash e funcoes de melhor resposta em estrategiasmistas.

Proposicao 2.4 p∗ = (p∗1, . . . ,p

∗i , . . . ,p

∗n) ∈ Δ e um equilıbrio

de Nash em estrategias mistas se, e somente se, p∗i ∈ MRi(p

∗−i)

para todo i = 1, . . . , n, isto e, p∗ ∈ MR(p∗).

Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2),a mulher escolha a estrategia mista p2 = (1/2, 1/2). Qual e a melhorresposta do homem a esta estrategia da mulher? Para responder aesta pergunta, observe inicialmente que

uHomem(p1,p2) = uHomem(p11, p12; p21, p22)

= p11 · p21 · uHomem(futebol, futebol) +

p11 · p22 · uHomem(futebol, cinema) +

p12 · p21 · uHomem(cinema, futebol) +

p12 · p22 · uHomem(cinema, cinema)

= 10 · p11 · p21 + 5 · p12 · p22e, portanto, uHomem(p11, p12; 1/2, 1/2) = 5 · p11 + (5/2) · p12. Destamaneira,

MRHomem(1/2, 1/2) = argmax(p11,p12)∈Δ2(5 · p11 + (5/2) · p12).

Page 42: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 39

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 39

Segue-se que a melhor resposta do homem a estrategia mista p2 =(1/2, 1/2) da mulher e obtida resolvendo-se o seguinte problema deotimizacao:

maximizar 5 · p11 + (5/2) · p12sujeito a p11 + p12 = 1,

p11 ≥ 0,p12 ≥ 0,

cuja solucao e (p∗11, p∗12) = (1, 0). Sendo assim, MRHomem(1/2, 1/2) =

{(1, 0)}.No caso de jogos com apenas dois jogadores, cada um com apenasduas estrategias puras, e possıvel escrever as estrategias mistas deuma maneira mais simplificada:

Δ2 = {(p, 1− p) ∈ R2 | 0 ≤ p ≤ 1},isto e, cada elemento de Δ2 pode ser identificado com um numero realno intervalo [0, 1]. Com isto, as funcoes de melhor resposta podemser reescritas de forma a depender de apenas de um numero real. Porexemplo, se o homem escolhe uma estrategia mista (p, 1 − p) ∈ Δ2,qual e a melhor resposta da mulher a esta estrategia do homem?Escrevendo as estrategias mistas da mulher na forma (q, 1− q) ∈ Δ2,vemos que

uMulher(p, 1− p; q, 1− q) = 15 pq + 10− 10 q − 10 p

= 5 (3 p− 2) q + 10 (1− p).

Sendo assim,

MRMulher(p) = argmax(q,1−q)∈Δ2(5 (3 p− 2) q + 10 (1− p))

= argmaxq∈[0,1](5 (3 p− 2) q + 10 (1− p)),

onde, por simplicidade, estamos escrevendo MRMulher(p) no lugarde MRMulher(p, 1−p). Assim, dada a escolha de p ∈ [0, 1] do homem,a mulher quer encontrar os valores de q ∈ [0, 1] que maximizam o valorde sua utilidade uMulher = 5 (3 p− 2) q + 10 (1− p). Se p ∈ [0, 2/3),entao 3 p− 2 < 0 e, para maximizar a sua utilidade, a mulher devera

Page 43: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 40

40 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

escolher q = 0. Se p = 2/3, entao 3 p− 2 = 0 e, portanto, a utilidadeuMulher = 10 (1 − p) da mulher nao dependera de q. Neste caso, amulher podera escolher qualquer valor de q em [0, 1]. Se p ∈ (2/3, 1],entao 3 p− 2 > 0 e, para maximizar a sua utilidade, a mulher deveraescolher q = 1. Mostramos entao que

MRMulher(p) =

⎧⎨⎩{0}, se p ∈ [0, 2/3),[0, 1], se p = 2/3,{1}, se p ∈ (2/3, 1].

Esta funcao de melhor resposta pode ser representada graficamente,como mostra a Figura 2.3.

1 p (Homem)0

1

q

2/3

(Cinema)

(Cinema)

(Futebol)

(Mulher)

(Futebol)

Figura 2.3: Representacao grafica da funcao de melhor resposta damulher no jogo da batalha dos sexos.

Do mesmo modo, se a mulher escolhe uma estrategia mista (q, 1−q) ∈Δ2, entao

uHomem(p, 1− p; q, 1− q) = 15 pq + 5− 5 q − 5 p

= 5 (3 q − 1) p+ 5 (1− q),

de modo que

MRHomem(q) = argmax(p,1−p)∈Δ2(5 (3 q − 1) p+ 5 (1− q))

= argmaxp∈[0,1](5 (3 q − 1) p+ 5 (1− q)).

Page 44: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 41

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 41

Assim, dada a escolha de q ∈ [0, 1] da mulher, o homem quer en-contrar os valores de p ∈ [0, 1] que maximizam o valor de sua utili-dade uHomem = 5 (3 q − 1) p + 5 (1 − q). Se q ∈ [0, 1/3), entao 3 q −1 < 0 e, para maximizar a sua utilidade, o homem devera esco-lher p = 0. Se q = 1/3, entao 3 q − 1 = 0 e, portanto, a utilidadeuHomem = 5 (1 − q) do homem nao dependera de p. Neste caso, ohomem podera escolher qualquer valor de p em [0, 1]. Se q ∈ (1/3, 1],entao 3 q− 1 > 0 e, para maximizar a sua utilidade, o homem deveraescolher p = 1. Mostramos entao que

MRHomem(q) =

⎧⎨⎩{0}, se q ∈ [0, 1/3),[0, 1], se q = 1/3,{1}, se q ∈ (1/3, 1].

Esta funcao de melhor resposta pode ser representada graficamente,como mostra a Figura 2.4.

1 q (Mulher)0

1

p

1/3

(Cinema)

(Cinema)

(Futebol)

(Homem)

(Futebol)

Figura 2.4: Representacao grafica da funcao de melhor resposta dohomem no jogo da batalha dos sexos.

Agora, pela Proposicao 2.4, segue-se que um perfil de estrategiasmistas (p∗, 1− p∗; q∗, 1− q∗) e um equilıbrio de Nash se, e somente se,q∗ ∈ MRMulher(p

∗) e p∗ ∈ MRHomem(q∗). Desta maneira, os valores

de p∗ e q∗ que geram equilıbrios de Nash correspondem aos pontosde intersecao entre as representacoes graficas das funcoes de melhor

Page 45: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 42

42 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

resposta da mulher e do homem, quando representadas em um mesmosistema de eixos, como ilustra a Figura 2.5.

1 p (Homem)0

1

q

2/3

1/3

(Cinema)

(Cinema)

(Futebol)

(Mulher)

(Futebol)

Figura 2.5: Calculando os equilıbrios de Nash usando as representa-coes graficas das duas funcoes de melhor resposta.

Vemos, portanto, que a batalha dos sexos possui apenas 3 equilıbriosde Nash em estrategias mistas:

(0, 1; 0, 1), (2/3, 1/3; 1/3, 2/3) e (1, 0; 1, 0),

que correspondem, respectivamente, aos tres unicos pontos de inter-secao (p∗, q∗) = (0, 0), (p∗, q∗) = (2/3, 1/3) e (p∗, q∗) = (1, 1) dasduas representacoes graficas.

Exemplo 2.12 ([31], pagina 17) (O jogo da inspecao) O che-fe de uma empresa de computacao desconfia que seu operador decomputadores esta usando o tempo de servico para “bater papo”na internet. Se o operador trabalha corretamente, ele gasta g emesforco e produz um lucro bruto de v unidades para a empresa. Ochefe, por sua vez, pode fiscalizar ou nao o trabalho do operador.Fiscalizar custa h unidades para a empresa. Se o operador for pego“batendo papo” na internet, ele perde o seu salario de w unidades(o chefe nao pode condicionar o valor do salario w ao valor do lucrobruto v). Para limitar o numero de casos a considerar, vamos assumir

Page 46: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 43

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 43

que g > h > 0 e que w > g. Os dois jogadores escolhem suasestrategias simultaneamente (em particular, ao decidir se vai fiscalizarou nao, o chefe nao sabe se o empregado decidiu trabalhar ou decidiu“bater papo” na internet). Neste contexto, o jogo da inspecao tem amatriz de payoffs indicada abaixo.

empregadonao trabalhar trabalhar

chefe fiscalizar (−h, 0) (v − w − h,w − g)

nao fiscalizar (−w,w) (v − w,w − g)

Observe que este jogo nao possui equilıbrio de Nash em estrategiaspuras e, como ele deve se repetir em cada dia util de trabalho, nao esensato escolher sempre a mesma estrategia pura para todos os dias.A solucao, neste caso, e escolher entre as estrategias puras a cada diaseguindo uma distribuicao de probabilidades, isto e, atraves de es-trategias mistas. Como as funcoes de melhor resposta do empregadoe do chefe sao dadas, respectivamente, por

MREmpregado(p) = argmaxq∈[0,1]((−wp+ g) q + w − g)

=

⎧⎨⎩{1}, se p ∈ [0, g/w),[0, 1], se p = g/w,{0}, se p ∈ (g/w, 1],

MRChefe (q) = argmaxp∈[0,1]((+wq − h) p+ v (1− q)− w)

=

⎧⎨⎩{0}, se q ∈ [0, h/w),[0, 1], se q = h/w,{1}, se q ∈ (h/w, 1],

segue-se que o (unico) equilıbrio de Nash em estrategias mistas eobtido tomando-se p∗ = g/w e q∗ = h/w. Se, por exemplo, v = 5,w = 4, g = 3 e h = 2, entao

(p∗, 1− p∗; q∗, 1− q∗) = (3/4, 1/4; 1/2, 1/2).

Isto significa que o chefe deve escolher sua estrategia de acordo comum gerador de numeros aleatorios com distribuicao de probabili-dade (3/4, 1/4) e o operador deve escolher sua estrategia de acordo

Page 47: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 44

44 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

com um gerador de numeros aleatorios com distribuicao de probabili-dade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodasda fortuna” da Figura 2.6.

Fiscalizar

Não fiscalizar

Trabalhar

Não trabalhar

chefe empregado

Figura 2.6: Distribuicoes de probabilidade que constituem um equilı-brio de Nash para o jogo do Exemplo 2.12.

A partir deste resultado, podemos calcular o valor otimo de contratodo empregado, isto e, o valor de w que maximiza o payoff esperadodo chefe:

uChefe(w) = (+wq∗ − h) p∗ + v (1 − q∗)− w) = v

(1− h

w

)− w.

Se, por exemplo,√vh > g, entao este valor otimo e dado por w∗ =√

vh (note que u′Chefe(w

∗) = 0 e u′′Chefe(w) ≤ 0 para w > 0).

Jogos deste tipo tem sido usados para se estudar temas como controlede armas ([03, 10, 83]), prevencao de crimes ([04]) e incentivos notrabalho ([53]).

Como vimos no jogo de comparar moedas no Exemplo 2.6, existemjogos que nao possuem equilıbrios de Nash em estrategias puras e, ateagora, todos os jogos apresentados em nossos exemplos possuem pelomenos um equilıbrio de Nash em estrategias mistas. Uma perguntanatural e se a existencia de equilıbrios de Nash em estrategias mistase um resultado geral ou nao. A resposta e sim! No proximo capıtuloapresentaremos e demonstraremos o teorema de equilıbrio de Nash,

Page 48: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 45

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 45

que garante a existencia de equilıbrios em estrategias mistas parajogos finitos.

2.4.3 Relacoes entre dominancia e equilıbrio deNash

As Proposicoes 2.2 e 2.3 para estrategias puras continuam validaspara estrategias mistas: (1) o processo de dominancia estrita ite-rada em estrategias mistas nao pode eliminar um equilıbrio de Nashe (2) se o processo de dominancia estrita iterada em estrategias mistasdeixa apenas um unico perfil de estrategias, entao este perfil e umequilıbrio de Nash do jogo. Nao apresentaremos as demonstracoesdestes resultados aqui. O leitor interessado podera encontra-las nasreferencias [15, 26].

2.4.4 Como interpretar estrategias mistas?

Existe muita controversia sobre as interpretacoes e usos de es-trategias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann,por exemplo, em [02], afirma que

“Mixed strategy equilibria have always been intuitivelyproblematic because they are not ‘strict’: a player will notlose if he abandons the randomization and uses insteadany arbitrary one of the pure strategy components of therandomization.”

(veja as Equacoes 4.1 na pagina 81) e, segundo Rardner e Roshen-tal ([76]),

“One of the reasons why game-theoretic ideas have notfound more widespread application is that randomization,which plays a major role in game theory, seems to havelimited appeal in many practical situations.”

Ainda, segundo Rubinstein ([81]),

“The reason for the criticism is that the naive interpreta-tion of a mixed strategy as an action which is conditionalon the outcome of a lottery executed by the player before

Page 49: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 46

46 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

the game, goes against our intuition. We are reluctant tobelieve that our decisions are made at random. We preferto be able to point to a reason for each action we take.Outside of Las Vegas we do not spin roulettes.”

De fato, testes experimentais recentes mostraram que jogadores naoseguem a estrategia mista prevista pela teoria, mesmo quando o jogopossui um unico equilıbrio de Nash em estrategias mistas ([57]).

Existem tambem certas analises feitas com estrategias mistas queproduzem resultados nao-intuitivos. Considere, por exemplo, a se-guinte situacao. Um contribuinte C deve decidir se vai ou nao sonegarimposto, sabendo que existe um fiscal F que pode ou nao fiscaliza-lo.Na matriz de payoffs abaixo, vamos assumir que valem as seguintesdesigualdades

(1) c21 > c11: o contribuinte C prefere nao sonegar se souber queo fiscal F ira fiscalizar,

(2) c12 > c22: o contribuinte C prefere sonegar se souber que o fis-cal F nao ira fiscalizar,

(3) f11 > f12: o fiscal F prefere fiscalizar se souber que o contribuin-te C ira sonegar e

(4) f22 > f21: o fiscal F prefere nao fiscalizar se souber que o contri-buinte C nao ira sonegar.

Voce pode pensar que os cij sao numeros negativos que representamo quanto sera debitado de C pelo pagamento de imposto e que os fijsao numeros positivos que representam bonus salariais de F .

Ffiscalizar nao fiscalizar

Csonegar (c11, f11) (c12, f12)

nao sonegar (c21, f21) (c22, f22)

.

Usando a tecnica descrita no Exemplo 2.11, vemos que o unico equi-lıbrio de Nash do jogo e dado por (p∗C , 1− p∗C ; p

∗F , 1− p∗F ), onde

(p∗C , p∗F ) =

(f22 − f21

f22 − f21 − f12 + f11,

c22 − c12c22 − c12 − c21 + c11

).

Page 50: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 47

[SEC. 2.4: SOLUCOES DE UM JOGO EM ESTRATEGIAS MISTAS 47

Aqui, p∗C representa a probabilidade com que C decide sonegar e p∗Frepresenta a probabilidade com que F decide fiscalizar. Dois resulta-dos nao-intuitivos advem destas expressoes para p∗C e p∗F :

(a) Se a receita federal decide aumentar a multa de sonegacao, istoe, se ela resolve diminuir o valor de c11, entao a frequencia p∗C desonegacoes nao muda e a frequencia de fiscalizacoes p∗F diminui.

(b) Se a receita federal decide aumentar o bonus salarial para os fis-cais que identificam contribuintes sonegadores, isto e, se ela resol-ver aumentar o valor de f11, entao a frequencia de fiscalizacoes p

∗F

nao muda e a frequencia de sonegacoes p∗C diminui.

Isto acontece porque alteracoes introduzidas nos payoffs de um jo-gador afeta apenas a expressao para o perfil de estrategias mistasdo equilıbrio de Nash do outro jogador (Proposicao da Irrelevanciado Payoff [43]).

Existem, contudo, interpretacoes que sao mais robustas. Uma de-las e imaginar o jogo como uma interacao entre n populacoes nume-rosas: cada partida ocorre depois que n jogadores sao selecionadosde maneira aleatoria nestas populacoes. As probabilidades piji noperfil de estrategias mistas pi do jogador gi sao interpretadas comoas frequencias dos jogadores que escolheram a estrategia pura siji nai-esima populacao. Outra interpretacao e devida a Harsanyi. Apre-sentamos aqui o abstract de seu artigo [39]:

“Equilibrium points in mixed strategies seem to be unsta-ble, because any player can deviate without penalty fromhis equilibrium strategy even if he expects all other playersto stick to theirs. This paper proposes a model underwhich most mixed-strategy equilibrium points have fullstability. It is argued that for any game Γ the players’uncertainty about the other players’ exact payoffs can bemodeled as a disturbed game Γ∗, i.e., as a game with smallrandom fluctuations in the payoffs. Any equilibrium pointin Γ, whether it is in pure or in mixed strategies, can ‘al-most always’ be obtained as a limit of a pure-strategyequilibrium point in the corresponding disturbed gameΓ∗ when all disturbances go to zero. Accordingly, mixed-strategy equilibrium points are stable – even though the

Page 51: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 48

48 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

players may make no deliberate effort to use their purestrategies with the probability weights prescribed by theirmixed equilibrium strategies – because the random fluc-tuations in their payoffs will make them use their purestrategies approximately with the prescribed probabili-ties.”

Nao nos aprofundaremos neste tema polemico. O leitor interessadopode consultar as referencias citadas no inıcio desta subsecao e, emespecial, [81] e a Secao 3.2 de [74].

2.5 Jogos infinitos

Os jogos que estudamos ate agora sao finitos, isto e, eles possuemum numero finito de jogadores, cada um com um numero finito de es-trategias puras. Contudo, existem situacoes que, para serem modela-das, necessitam de um numero infinito de jogadores ou de um numeroinfinito de estrategias ([06, 44, 62]). Jogos em estrategias mistas, porexemplo, podem ser pensados como jogos com um numero finito dejogadores e com um numero infinito de estrategias (as infinitas dis-tribuicoes de probabilidade que cada jogador pode escolher). Vamosnos concentrar no caso de jogos com um numero finito de jogadores eum numero infinito de estrategias puras (o caso de estrategias mistasrequer como pre-requisito teoria da medida e nao sera tratado aqui).As definicoes de estrategias estritamente dominadas, estrategias fra-camente dominadas e equilıbrios de Nash sao analogas ao caso finito,com a diferenca de que, agora, os conjuntos Si podem ser infinitos.

Definicao 2.12 (Estrategia Pura Estritamente Domi-nada) Dizemos que uma estrategia pura si ∈ Si do jogador gi ∈G e estritamente dominada pela estrategia s′i ∈ Si se

ui(s′i, s−i) > ui(si, s−i),

para todo s−i ∈ S−i.

Page 52: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 49

[SEC. 2.5: JOGOS INFINITOS 49

Definicao 2.13 (Estrategia Pura Fracamente Domi-nada) Dizemos que uma estrategia pura si ∈ Si do joga-dor gi ∈ G e fracamente dominada pela estrategia s′i ∈ Si se

ui(s′i, s−i) ≥ ui(si, s−i),

para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i,

ui(siκ′ , s•−i) > ui(siκ, s•−i).

Definicao 2.14 (Equilıbrio de Nash)Dizemos que um perfilde estrategias

s∗ = (s∗1, . . . , s∗(i−1), s

∗i , s

∗(i+1), . . . , s

∗n) ∈ S

e um equilıbrio de Nash se

ui(s∗i , s

∗−i) ≥ ui(si, s

∗−i)

para todo i = 1, . . . , n e para todo si ∈ Si.

Exemplo 2.13 ([26], pagina 2009) Considere o seguinte jogo in-finito: G = {g1, g2}, S1 = S2 = [0, 1] e u1, u2 : S = S1 × S2 → Rdefinidas por

u1(x, y) =

⎧⎨⎩x, se x < 1,0, se x = 1 e y < 1,1, se x = 1 e y = 1,

e

u2(x, y) =

⎧⎨⎩y, se y < 1,0, se y = 1 e x < 1,1, se y = 1 e x = 1,

Observe que toda estrategia pura x ∈ [0, 1) do jogador g1 e estrita-mente dominada. De fato, (1 + x)/2 ∈ (x, 1) e

u1(x, y) = x < (1 + x)/2 = u1((1 + x)/2, y), ∀y ∈ [0, 1].

Page 53: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 50

50 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Do mesmo modo, toda estrategia pura y ∈ [0, 1) do jogador g2 eestritamente dominada por (1 + y)/2 ∈ (y, 1). Como

u1(1, 1) = 1 ≥ u1(x, 1) e u2(1, 1) = 1 ≥ u2(1, y), ∀x, y,∈ [0, 1],

segue-se que (x∗, y∗) = (1, 1) e o unico equilıbrio de Nash em es-trategias puras do jogo. Eliminando-se todas as estrategias em S1 −{1, t} e S2 − {1, t}, para algum t < 1, obtemos um jogo 2 × 2, quenao pode ser mais reduzido:

g21 t

g11 (1, 1) (0, t)

t (t, 0) (t, t)

Como t e arbitrario, este exemplo mostra que, em jogos infinitos,o processo de eliminacao de estrategias puras estritamente domina-das pode produzir reducoes que dependem da ordem em que as eli-minacoes sao realizadas. O exemplo tambem mostra que, em jogosinfinitos, a melhor resposta de um jogador pode nao existir. Porexemplo, nao existe uma melhor resposta (em estrategias puras) dojogador g1 a uma escolha y ∈ (0, 1) do jogador g2.

Como no caso de jogos finitos, um jogo infinito nem sempre pos-sui equilıbrios de Nash em estrategias puras. Contudo, e possıvelmostrar que se os espacos de estrategias Si sao subconjuntos com-pactos, convexos e nao-vazios de um espaco euclidiano e as funcoesutilidade s = (si, s−i) �→ ui(s) sao contınuas em s e quase-concavasem si, entao o jogo possui pelo menos um equilıbrio de Nash em es-trategias puras ([23, 31, 34]). Note que este resultado inclui, comocaso particular, os jogos finitos em estrategias mistas.

2.6 Exercıcios

[01] Use o processo de dominancia estrita iterada para reduzir o jogocuja matriz de payoffs e dada abaixo.

Page 54: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 51

[SEC. 2.6: EXERCICIOS 51

g2s21 s22 s23 s24

g1

s11 (3, 0) (1, 1) (5, 4) (0, 2)

s12 (1, 1) (3, 2) (6, 0) (2,−1)

s13 (0, 2) (4, 4) (7, 2) (3, 0)

[02] Considere a matriz de payoffs para os jogadores L (linhas) e C(colunas), a seguir:

Cc1 c2

L

l1 (3, 3) (0, 1)

l2 (1, 1) (2, 3)

Pede-se:

(a) Determinar se existe alguma estrategia estritamente domi-nante para algum jogador.

(b) Determinar se existe algum equilıbrio de Nash (em estrate-gias puras). Caso exista mais do que um equilıbrio, quantose quais sao.

[03] A partir da matriz de payoffs a seguir para os jogadores L (li-nhas) e C colunas,

Cc1 c2

L

l1 (3, 2) (4, 4)

l2 (1, 1) (9, 2)

determine:

Page 55: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 52

52 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

(a) Se algum jogador possui alguma estrategia dominante.

(b) Quantos equilıbrios de Nash em estrategias puras existem.

[04] (Jogo do covarde) Neste jogo, dois adolescentes pilotamcarros roubados em direcao a um abismo em um teste de co-ragem: aquele que desviar o carro primeiro sera chamado decovarde (chicken).

Este tipo de jogo ficou popular depois do filme Juventude Trans-viada (Rebel Without a Cause) de 1955, estrelado por JamesDean, que morreu em decorrencia de um acidente de automovel.

Bertrand Russell, em [82], compara uma variacao deste jogocom a tatica de brinkmanship2 na corrida nuclear:

“Since the nuclear stalemate became apparent, theGovernments of East and West have adopted thepolicy which Mr. Dulles calls ‘brinkmanship’. Thisis a policy adapted from a sport which, I am told, ispractised by some youthful degenerates. This sportis called ‘Chicken!’. It is played by choosing a longstraight road with a white line down the middle andstarting two very fast cars towards each other fromopposite ends. Each car is expected to keep the wheelsof one side on the white line. As they approach eachother, mutual destruction becomes more and moreimminent. If one of them swerves from the white

2Arte ou pratica de se levar uma situacao perigosa ou confrontacao alem dolimite do que pode ser considerado seguro, para conseguir determinado desfecho.

Page 56: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 53

[SEC. 2.6: EXERCICIOS 53

line before the other, the other, as he passes, shouts‘Chicken!’, and the one who has swerved becomesan object of contempt. As played by irresponsibleboys, this game is considered decadent and immoral,though only the lives of the players are risked. Butwhen the game is played by eminent statesmen, whorisk not only their own lives but those of many hun-dreds of millions of human beings, it is thought onboth sides that the statesmen on one side are dis-playing a high degree of wisdom and courage, andonly the statesmen on the other side are reprehensi-ble. This, of course, is absurd. Both are to blamefor playing such an incredibly dangerous game. Thegame may be played without misfortune a few times,but sooner or later it will come to be felt that lossof face is more dreadful than nuclear annihilation.The moment will come when neither side can facethe derisive cry of ‘Chicken!’ from the other side.When that moment is come, the statesmen of bothsides will plunge the world into destruction.”

O jogo do covarde pode ser modelado com a seguinte matrizde payoffs:

g2desviar nao desviar

g1desviar (2, 2) (1, 3)

nao desviar (3, 1) (0, 0)

.

Pede-se:

(a) Determinar se existe alguma estrategia estritamente domi-nante para algum jogador.

(b) Determinar se existe algum equilıbrio de Nash (em estrate-gias puras). Caso exista mais do que um equilıbrio, quantose quais sao.

Page 57: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 54

54 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

[05] (Jogo Hawk-Dove) Dois animais disputam um recurso (umapresa, por exemplo). Cada animal tem duas opcoes: (1) brigarpelo recurso (estrategia hawk) ou (2) ameacar o seu oponente(estrategia dove). Se os dois animais resolverem brigar pelorecurso, o conflito continuara ate que um deles fique ferido eo vencedor sera o outro. Se somente um animal decide ata-car, entao ele vencera o animal que decidiu apenas ameacar.Se os dois escolherem fazer ameacas, entao existe um empatee cada animal recebe um ganho menor do que ganharia na si-tuacao onde um escolhe brigar e o outro ameacar. Este jogofoi apresentado pela primeira vez por John Maynard Smith eGeorge Price no artigo The Logic of Animal Conflict na re-vista Nature [56]. A forma tradicional da matriz de payoffs e aseguinte:

g2brigar ameacar

g1brigar

(V − C

2,V − C

2

)(V, 0)

ameacar (0, V )

(V

2,V

2

) .

Aqui, V e o valor do recurso sendo disputado e C e o custo dabriga. Em geral, assume-se que o valor do recurso e menor doque o custo da briga, isto e, C > V > 0. Pede-se:

(a) Determinar se existe alguma estrategia estritamente domi-nante para algum jogador.

(b) Determinar se existe algum equilıbrio de Nash (em estrate-gias puras). Caso exista mais do que um equilıbrio, quantose quais sao.

[06] No artigo “Nornmandy: Game and Reality”, de W. Draker narevista “Moves”, no. 6 (1972), e feita uma analise da invasao daEuropa na Normandia na Segunda Guerra Mundial. Seis confi-guracoes possıveis de ataque (1 a 6) pelos Aliados e seis possıveis

Page 58: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 55

[SEC. 2.6: EXERCICIOS 55

estrategias defensivas (A a F ) pelo Eixo foram simuladas e cal-culadas, num total de 36 simulacoes. A matriz da Tabela 2.1foi estimada pelos Aliados para cada batalha hipotetica. Use oprocesso de dominancia fraca iterada para reduzir ao maximopossıvel o tamanho da matriz.

[07] Considere um jogo com tres jogadores: A, B e C. As estrategiasdo jogador A sao {x1, x2, x3}, as estrategias do jogador B sao{y1, y2} e as estrategias do jogador C sao {z1, z2, z3, z4}. Seo jogador B escolhe a estrategia y1, os payoffs sao dados pelamatriz

Cz1 z2 z3 z4

A

x1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1)

x2 (3, 2, 2) (9, 1, 8) (2, 0, 5) (2, 0, 2)

x3 (1, 0, 0) (1, 0, 9) (4, 0, 8) (3, 0, 3)

Por outro lado, se o jogador B escolhe a estrategia y2, entao ospayoffs sao dados por

Cz1 z2 z3 z4

A

x1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9)

x2 (0, 3, 2) (1, 2, 3) (2, 1, 8) (2, 1, 0)

x3 (1, 1, 0) (2, 1, 1) (3, 2, 2) (3, 1, 3)

Use a tecnica de dominancia estrita iterada para reduzir a ma-triz deste jogo.

Page 59: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 56

56 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Eixo

AB

CD

EF

Aliados

1(+

13,−

13)

(+29,−

29)

(+8,−

8)

(+12,−

12)

(+16,−

16)

(+23,−

23)

2(+

18,−

18)

(+22,−

22)

(+21,−

21)

(+22,−

22)

(+29,−

29)

(+31,−

31)

3(+

18,−

18)

(+22,−

22)

(+31,−

31)

(+31,−

31)

(+27,−

27)

(+37,−

37)

4(+

11,−

11)

(+22,−

22)

(+12,−

12)

(+21,−

21)

(+21,−

21)

(+26,−

26)

5(+

18,−

18)

(+16,−

16)

(+19,−

19)

(+14,−

14)

(+19,−

19)

(+28,−

28)

6(+

23,−

23)

(+22,−

22)

(+19,−

19)

(+23,−

23)

(+30,−

30)

(+34,−

34)

Tabela

2.1:Analise

dainvasaodaEuropanaNorm

andia

naSegundaGuerra

Mundial.

Page 60: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 57

[SEC. 2.6: EXERCICIOS 57

[08] Repita o exercıcio anterior com a matriz de payoffs

Cz1 z2 z3 z4

A

x1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9)

x2 (3, 8, 3) (4, 5, 4) (4, 1, 3) (3, 9, 3)

x3 (2, 9, 9) (3, 9, 9) (3, 9, 9) (2, 9, 9)

caso o jogador B escolha a estrategia y1 e a matriz de payoffs

Cz1 z2 z3 z4

A

x1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9)

x2 (4, 9, 1) (4, 2, 2) (3, 2, 1) (2, 2, 1)

x3 (1, 9, 9) (2, 9, 9) (2, 9, 9) (1, 9, 9)

caso ele escolha a estrategia y2.

[09] Considere um jogo com tres jogadores: A, B e C. As estrategiasdo jogador A sao {x1, x2, x3}, as estrategias do jogador B sao{y1, y2} e as estrategias do jogador C sao {z1, z2, z3, z4}. Seo jogador B escolhe a estrategia y1, os payoffs sao dados pelamatriz

Cz1 z2 z3 z4

A

x1 (1, 2, 1) (2, 3, 1) (1, 0, 2) (1, 4, 1)

x2 (2, 0, 1) (1, 2, 1) (3, 1, 3) (3, 2, 1)

x3 (1, 0, 1) (1, 1, 1) (2, 5, 1) (1, 3, 1)

Page 61: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 58

58 [CAP. 2: JOGOS NA FORMA ESTRATEGICA

Por outro lado, se o jogador B escolhe a estrategia y2, entao ospayoffs sao dados por

Cz1 z2 z3 z4

A

x1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1)

x2 (2, 1, 0) (1, 5, 1) (2, 2, 3) (1, 5, 2)

x3 (2, 1, 1) (1, 0, 1) (1, 0, 4) (1, 5, 3)

Calcule os equilıbrios de Nash em estrategias puras deste jogo.

[10] Considere o jogo cuja matriz de payoffs e dada por:

Jogador 2

L C R

Jogador1 T (1, 0) (3, 1) (1, 1)

M (1, 1) (3, 0) (0, 1)

B (2, 2) (3, 3) (0, 2)

.

(a) Identifique, para cada jogador, todos os pares de estrategiasonde uma estrategia e fracamente dominada pela outra.

(b) Usando o processo de eliminacao das estrategias fracamentedominadas, encontre todas as possıveis de maneiras de re-duzir o jogo para uma matriz 1× 1.

(c) Quais sao os equilıbrios de Nash em estrategias puras dojogo?

[11] Suponha que o processo de dominancia fraca iterada em es-trategias puras reduza um jogo finito para apenas um unicoperfil de estrategias s∗. Mostre que s∗ e um equilıbrio de Nashem estrategias puras do jogo.

Page 62: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 59

[SEC. 2.6: EXERCICIOS 59

[12] Demonstre a propriedade 2.2 da pagina 31 da funcao utilidadeesperada definida em 2.1.

[13] Mostre que uma estrategia mista que atribui probabilidade po-sitiva para uma estrategia pura estritamente dominada tambeme estritamente dominada.

[14] Use a tecnica descrita no Exemplo 2.11 para calcular as funcoesde melhor resposta dos jogadores dos Exemplos 2.1 (o dilemados prisioneiros) e 2.6 (comparar moedas). Em seguida, use asrepresentacoes graficas destas funcoes para calcular os equilı-brios de Nash em estrategias mistas de cada jogo.

[15] Um equilıbrio de Nash em estrategias mista pode dar probabi-lidade positiva a uma estrategia pura que e estritamente domi-nada? E em uma estrategia pura que e fracamente dominada?

[16] (Eficiencia de Pareto) Um perfil de estrategias puras e Pa-reto eficiente (tambem denominado ponto otimo de Pareto) senenhum outro perfil de estrategias puras oferece a todos os joga-dores um ganho maior, isto e, nenhum jogador pode aumentar oseu ganho sem que algum outro jogador tenha uma perda. Maisprecisamente, s∗ ∈ S e Pareto eficiente se, nao existe s• ∈ Stal que

ui(s•) > ui(s

∗), para todo i = 1, . . . , n.

O equilıbrio de Nash s∗ = (confessar, confessar) do jogo dodilema dos prisioneiros e Pareto eficiente?

Page 63: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 60

Capıtulo 3

O teorema de equilıbriode Nash

O teorema de equilıbrio de Nash estabelece que todo jogo finitopossui pelo menos um equilıbrio de Nash em estrategias mistas. Esteresultado foi provado por John Forbes Nash Jr. em sua tese de dou-torado em 1949 na Universidade de Princeton. Neste capıtulo apre-sentaremos duas demonstracoes do teorema, obtidas atraves de doisteoremas de ponto fixo: o de Brouwer e o de Kakutani.

3.1 Usando o teorema de Brouwer

Teorema 3.1 (do ponto fixo de Brouwer) Se Δ e umsubconjunto compacto, convexo e nao-vazio de um espaco eucli-diano de dimensao finita e se F : Δ → Δ e uma funcao contınua,entao F possui um ponto fixo em Δ, isto e, existe p∗ ∈ Δ talque

F(p∗) = p∗.

A demonstracao deste teorema pode ser encontrada, por exemplo,em [63, 79]. A dissertacao de mestrado [89] oferece um excelente

60

Page 64: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 61

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 61

survey sobre o assunto: ela inclui dados historicos, generalizacoes eaplicacoes do teorema do ponto fixo de Brouwer.

Com as notacoes dadas na Secao 2.3, estabeleceremos uma se-quencia de teoremas que fornecem caracterizacoes alternativas paraum equilıbrio de Nash.

Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . ,mi, defina asfuncoes

zij : Δ → Rp �→ zij(p) = ui(sij ,p−i)− ui(pi,p−i)

(isto e, zij mede o ganho ou perda do jogador gi quando ele trocaa distribuicao de probabilidade pi pela estrategia pura sij). Te-mos que p∗ e um equilıbrio de Nash se, e somente se,

zij(p∗) ≤ 0

para cada i = 1, . . . , n e j = 1, . . . ,mi.

Demonstracao:(⇒) Se p∗ = (p∗

i ,p∗−i) e um equilıbrio de Nash, entao ui(p

∗i ,p

∗−i)

≥ ui(sij ,p∗−i) para cada i = 1, . . . , n e j = 1, . . . ,mi. Consequente-

mente,zij(p

∗) = ui(sij ,p∗−i)− ui(p

∗i ,p

∗−i) ≤ 0

para cada i = 1, . . . , n e j = 1, . . . ,mi.(⇐) Se

zij(p∗) = ui(sij ,p

∗−i)− ui(p

∗i ,p

∗−i) ≤ 0

para cada i = 1, . . . , n e j = 1, . . . ,mi, entao

ui(sij ,p∗−i) = ui(ej ,p

∗−i) ≤ ui(p

∗i ,p

∗−i)

para cada i = 1, . . . , n e j = 1, . . . ,mi, onde ej e o vetor em Rmi quetem 1 na j-esima coordenada e zero nas demais. Devemos mostrarque para todo pi = (pi1, . . . , pimi) ∈ Δmi

ui(pi,p∗−i) ≤ ui(p

∗i ,p

∗−i).

Page 65: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 62

62 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

Mas, como x �→ ui(x,p∗i ) preserva combinacoes convexas, temos que

ui(pi,p∗−i) = ui

(mi∑k=1

pik · ek,p∗−i

)=

mi∑k=1

pik · ui

(ek,p

∗−i

)≤

mi∑k=1

pik · ui

(p∗i ,p

∗−i

)= ui

(p∗i ,p

∗−i

) · mi∑k=1

pik = ui

(p∗i ,p

∗−i

),

onde, na ultima igualdade, usamos o fato de que∑mi

k=1 pik = 1, dadoque pi ∈ Δmi .

Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . ,mi, defina asfuncoes

gij : Δ → Rp �→ gij(p) = max{0, zij(p)} .

Temos que p e um equilıbrio de Nash se, e somente se,

gij(p) = 0

para cada i = 1, . . . , n e j = 1, . . . ,mi.

Demonstracao: A prova segue imediatamente do teorema anterior.

Teorema 3.4 Defina a aplicacao

F : Δ = Δm1 × · · · ×Δmn → Δ = Δm1 × · · · ×Δmn

p = (p1, . . . ,pn) �→ F(p) = (y1(p), . . . , yn(p)),

onde

yi(p) = (yi1(p), . . . , yimi(p)), pi = (pi1, . . . , pimi)

e

Page 66: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 63

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 63

yij(p) =pij + gij(p)

1 +

mi∑k=1

gik(p)

.

Temos que p∗ e um equilıbrio de Nash se, e somente se,

F(p∗) = p∗,

isto e, se, e somente se, p∗ e um ponto fixo da aplicacao F.

Demonstracao: Observe que, de fato, F(Δ) ⊆ Δ, pois claramenteyij ≥ 0 e

mi∑k=1

yik(p) =

mi∑k=1

⎛⎜⎜⎜⎜⎝ pik + gik(p)

1 +

mi∑k=1

gik(p)

⎞⎟⎟⎟⎟⎠ =

mi∑k=1

pik +

mi∑k=1

gik(p)

1 +

mi∑k=1

gik(p)

=

1 +

mi∑k=1

gik(p)

1 +

mi∑k=1

gik(p)

= 1,

isto e, cada yi(p) ∈ Δmi .

(⇒) Se p∗ e um equilıbrio de Nash, entao gij(p∗) = 0 para cada

i = 1, . . . , n e j = 1, . . . ,mi. Desta maneira, yij(p∗) = p∗ij para cada

i = 1, . . . , n e j = 1, . . . ,mi, isto e, yi(p∗) = p∗

i para cada i = 1, . . . , nou, ainda, F(p∗) = p∗.

(⇐) Suponha que p∗ = (p∗1,p

∗2, . . . ,p

∗n) ∈ Δ = Δm1 × · · · ×Δmn

seja um ponto fixo da aplicacao F : Δ → Δ, isto e, suponha que

p∗ij =p∗ij + gij(p

∗)

1 +

mi∑k=1

gik(p∗)

Page 67: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 64

64 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

para todo j = 1, . . . ,mi e i = 1, . . . , n. Segue-se entao que

p∗ij ·mi∑k=1

gik(p∗) = gij(p

∗),

para todo j = 1, . . . ,mi e i = 1, . . . , n. Afirmamos agora que α =∑mi

k=1 gik(p∗) = 0, de modo que gik(p

∗) = 0 para todo k = 1, . . . ,mi

e i = 1, . . . , n. De fato: se, por absurdo, α > 0, vemos a partir darelacao acima que

gij(p∗) > 0 se, e somente se, p∗ij > 0.

Sem perda de generalidade, suponha que p∗i1 > 0, p∗i2 > 0, . . . , p∗il > 0e p∗i(l+1) = p∗i(l+2) = · · · = p∗imi

= 0. Observe que

p∗i =

mi∑k=1

p∗ikek,

onde ei e o i-esimo vetor da base canonica de Rmi . Dado quegik(p

∗) > 0 para todo k = 1, . . . , l, temos que

ui(ek,p∗−i) > ui(p

∗i ,p

∗−i),

para todo k = 1, . . . , l. Desta maneira,

ui(p∗i ,p

∗−i) = ui

(mi∑k=1

p∗ikek,p∗−i

)=

mi∑k=1

p∗ik · ui

(ek,p

∗−i

)

=

l∑k=1

p∗ik · ui

(ek,p

∗−i

)>

l∑k=1

p∗ik · ui

(p∗i ,p

∗−i

)= ui

(p∗i ,p

∗−i

) · l∑k=1

p∗ik = ui

(p∗i ,p

∗−i

),

um absurdo. Isto demonstra que gij(p∗) = 0 para todo j = 1, . . . ,mi

e j = 1, . . . ,m e, assim, p∗ e um equilıbrio de Nash em estrategiasmistas.

Page 68: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 65

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 65

Teorema 3.5 (do equilıbrio de Nash) Todo jogo definidopor matrizes de payoffs possui um equilıbrio de Nash.

Demonstracao: A aplicacao F : Δ → Δ definida no teorema anteriore contınua e Δ e um conjunto compacto e convexo. Pelo teoremado ponto fixo de Brouwer, F possui um ponto fixo p∗. Pelo teoremaanterior, p∗ e um equilıbrio de Nash.

3.2 Usando o teorema de Kakutani

Seja X um subconjunto de Rn. Dizemos que p∗ ∈ X e um pontofixo de uma funcao φ : X → 2X se p∗ ∈ φ(p∗). O teorema do pontofixo de Kakutani estabelece condicoes suficientes para que φ possuapelo menos um ponto fixo.

Teorema 3.6 (do ponto fixo de Kakutani) Seja X umsubconjunto compacto, convexo e nao-vazio de Rn. Se

φ : X → 2X

e semicontınua superiormente e φ(x) e nao-vazio e convexo paratodo x ∈ X, entao φ possui pelo menos um ponto fixo, isto e,existe p∗ ∈ X tal que

p∗ ∈ φ(p∗).

Suponha que exista um subconjunto compacto K de Rn tal queφ(x) ⊆ K para todo x ∈ X e suponha que φ(x) e um subconjuntofechado de Rn para todo x ∈ X. Dizemos que φ : X → 2X e contınuasuperiormente se, e somente se, y0 ∈ φ(x0) sempre que (a) x0 ∈ X,(b) xk ∈ X para k = 1, 2, . . ., (c) limk→+∞ xk = x0, (d) yk ∈ φ(xk)e (e) limk→+∞ yk = y0. Neste contexto, φ e contınua superiormentese, e somente se, o grafico de φ,

Gr(φ) = {(x,y) ∈ X×X | y ∈ φ(x)},

Page 69: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 66

66 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

e um subconjunto fechado de X × X. Por exemplo, se X = [0, 1],entao

φ(x) =

{{1/2}, se 0 ≤ x < 1/2,[1/4, 3/4], se 1/2 ≤ x ≤ 1,

e semicontınua superiormente (Figura 3.1), enquanto que

ϕ(x) =

{{1/2}, se 0 ≤ x ≤ 1/2,[1/4, 3/4], se 1/2 < x ≤ 1,

nao o e (Figura 3.2).

0 1/2

1/2

1/4

3/4

1

1

x

y

Figura 3.1: Grafico de uma funcao que e semicontınua superiormente.

Usaremos o teorema do ponto fixo de Kakutani para mostrar quea funcao de melhor resposta MR: Δ → 2Δ definida por

MR(p) = (MR1(p−1),MR2(p−2), . . . ,MRn(p−n)),

com p ∈ Δ e MRi(p−i) = argmaxpi∈Δ(Si) ui(pi,p−i), possui umponto fixo p∗ que, em virtude da Proposicao 2.4, sera um equilıbriode Nash.

Page 70: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 67

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 67

0 1/2

1/2

1/4

3/4

1

1

x

y

Figura 3.2: Grafico de uma funcao que nao e semicontınua superior-mente.

Teorema 3.7 (do equilıbrio de Nash) Todo jogo definidopor matrizes de payoffs possui um equilıbrio de Nash.

Demonstracao: Basta verificarmos que a funcao de melhor respostasatisfaz as hipoteses do teorema do ponto fixo de Kakutani.

(1) O conjunto X = Δ = Δ(S1) × · · · × Δ(Sn) e nao-vazio, com-pacto (como produto cartesiano de conjuntos compactos) e con-vexo (como produto cartesiano de conjuntos convexos).

(2) Para todo p ∈ Δ, o conjunto MR(p) esta contido no compactoK = Δ.

(3) Para todo p ∈ Δ, o conjunto MR(p) e convexo. De fato: supo-nha, por absurdo, MR(p) nao seja um conjunto convexo. Entaoexistem q(•),q(◦) ∈ MR(p) e λ ∈ (0, 1) tais que

(1− λ) · q(•) + λ · q(◦) �∈ MR(p).

Page 71: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 68

68 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

Mas, para todo ındice i, vale que

ui((1− λ) · q(•)i + λ · q(◦)

i ,p−i) =

(1− λ) · ui(q(•)i ,p−i) + λ · ui(q

(◦)i ,p−i).

Agora,

ui(q(•)i ,p−i) = ui(q

(◦)i ,p−i) = constante = max

pi∈Δ(Si)ui(pi,p−i).

Consequentemente, ui((1 − λ) · q(•)i + λ · q(◦)

i ,p−i) = constante,isto e, (1− λ) · q(•)

i + λ · q(◦)i ∈ MRi(p−i), para todo i = 1, . . . , n,

o que e uma contradicao.

(4) Para todo p ∈ Δ, o conjunto MR(p) e fechado. Para ver isto,basta mostrar que MRi(p−i) = argmaxpi∈Δ(Si) ui(pi,p−i) e fe-

chado. Seja entao p(k)

i uma sequencia de pontos emMRi(p−i) queconverge para p(0)

i . Desta maneira, ui(p(k)

i ,p−i) = constante =maxpi∈Δ(Si) ui(pi,p−i) e, como x �→ ui(x,p−i) e uma funcaocontınua, concluımos que

ui(p(0)

i ,p−i) = constante = maxpi∈Δ(Si)

ui(pi,p−i).

Sendo assim, p(0)

i ∈ MRi(p−i).

(5) MR: Δ → 2Δ e semicontınua superiormente. Com efeito, mos-traremos que se (a) p(0) ∈ Δ, (b) p(k) e uma sequencia de pontosem Δ, (c) limk→+∞ p(k) = p(0), (d) q(k) ∈ MR(p(k)) e (e) q(k)

converge para q(0), entao q(0) ∈ MR(p(0)). Se, por absurdo,q(0) �∈ MR(p(0)), entao existe ındice i tal que q(0)

i �∈ MR(p(0)

−i).

Portanto, existem ε > 0 e q(•)i ∈ Δ(Si) tais que

ui(q(•)i ,p(0)

−i) > ui(q(0)

i ,p(0)

−i) + 3 · ε.

Mas, desde que ui e uma funcao contınua e (q(k)

i ,p(k)

−i) converge

para (q(0)

i ,p(0)

−i), entao para todo k suficientemente grande,

ui(q(•)i ,p(k)

−i) > ui(q(•)i ,p(0)

−i)− ε >

ui(q(0)

i ,p(0)

−i) + 2 · ε > ui(q(k)

i ,p(k)

−i) + ε.

Page 72: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 69

[SEC. 3.3: ALGUMAS PROPRIEDADES DOS EQUILIBRIOS DE NASH 69

Sendo assim, q(k)

i �∈ MRi(p(k)

−i), pois ui(q(•)i ,p(k)

−i) > ui(q(k)

i ,p(k)

−i),o que contradiz (d).

Shizuo Kakutani demonstrou o seu teorema no artigo [45]. Debreulista mais de 300 aplicacoes do teorema do ponto fixo de Kakutaniao provar a existencia de um equilıbrio economico em [24].

3.3 Algumas propriedades dos equilıbriosde Nash

Wilson ([97]) mostrou que, a menos de um conjunto fechado ede medida zero, todo jogo finito possui um numero finito e ımparde equilıbrios de Nash em estrategias mistas. Pelo menos para jogoscom dois jogadores, cada um com duas estrategias, este resultadopode ser antecipado atraves da analise das funcoes de melhor respostaque fizemos na Subsecao 2.4.2 (veja, por exemplo, a Figura 2.5 napagina 42). Harsanyi, em [40], apresentou uma prova alternativa paraeste resultado. Tambem tratam do assunto as referencias [35, 36, 59].

Por outro lado, os casos degenerados podem ter topologias diver-sificadas. De fato, Datta provou que toda variedade algebrica real(solucoes reais de um sistema de equacoes polinomiais) e isomorfaao conjunto de equilıbrios de Nash em estrategias totalmente mistasde algum jogo com 3 jogadores e, tambem, de algum jogo com njogadores, cada um com apenas 2 estrategias puras ([20]). Um per-fil de estrategias totalmente mistas e um perfil que da probabilidadepositiva a cada estrategia pura.

Existem jogos cujos payoffs sao todos numeros racionais, mas to-dos os equilıbrios de Nash em estrategias mistas possuem coordenadasirracionais ([69]). Contudo, Markakis mostrou que, neste contexto,existe sempre pelo menos um equilıbrio de Nash em estrategias mistascom coordenadas algebricas ([51, 54]).

Torres-Martınez ([91]) e Zhao ([99]) demonstram que e possıveldeduzir os teoremas de ponto fixo de Brouwer e Kakutani a partir deum teorema de existencia de equilıbrios de Nash.

Page 73: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 70

70 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

3.4 Exercıcios

[01] O objetivo deste exercıcio e mostrar que as hipoteses do teoremado ponto fixo de Brouwer nao podem ser removidas.

(a) Exiba uma funcao F : Δ → Δ descontınua, definida em umsubconjunto Δ compacto, convexo e nao-vazio de Rn, quenao possui ponto fixo.

(b) Exiba uma funcao F : Δ → Δ contınua, definida em umsubconjunto Δ nao-compacto, convexo e nao-vazio de Rn,que nao possui ponto fixo.

(c) Exiba uma funcao F : Δ → Δ contınua, definida em umsubconjunto Δ compacto, nao-convexo e nao-vazio de Rn,que nao possui ponto fixo.

[02] Exiba um exemplo de funcao φ : X → 2X definida em umsubconjunto X compacto, convexo e nao-vazio de Rn, que esemicontınua superiormente, mas nao possui ponto fixo. Istomostra que a hipotese de φ(x) ser um conjunto convexo paratodo x ∈ X nao pode ser removida do enunciado do teoremado ponto fixo de Kakutani.

[03] De um exemplo de jogo com um numero par de equilıbrios deNash em estrategias mistas.

Page 74: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 71

Capıtulo 4

Calculando equilıbriosde Nash

4.1 Equilıbrio de Nash via um problema

de otimizacao

O Teorema 3.3 sugere uma maneira de se calcular os equilıbriosde Nash de um jogo. Eles sao solucoes do seguinte problema deotimizacao nao-linear:

minimizar

n∑i=1

mi∑j=1

(gij(p))2

sujeito a p ∈ Δ.

Com efeito: a soma de quadrados e zero se, e somente se, cada parcelae igual a zero. McKelvey demonstrou em [58] que a funcao objetivo

p �→n∑

i=1

mi∑j=1

(gij(p))2

e uma funcao de classe C1. Assim, algoritmos numericos de oti-mizacao que usam derivadas (Newton, Davidon-Fletcher-Powell) po-dem ser usados.

71

Page 75: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 72

72 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Exemplo 4.1 Para o dilema do prisioneiro (Exemplo 2.1, pagina 11),

(p, q) = (p, 1− p; q, 1− q) ∈ Δ2 ×Δ2

e um equilıbrio de Nash se, e somente se, (p, q) e solucao do seguinteproblema de otimizacao

minimizar G(p, q) = (max {0,− (−1 + p) (4 q + 1)})2 +(max {0,−p (4 q + 1)})2 +(max {0,− (4 p+ 1) (−1 + q)})2 +(max {0,−q (4 p+ 1)})2

sujeito a 0 ≤ p ≤ 1,0 ≤ q ≤ 1.

Como vemos pela Figura 4.1, que mostra o grafico e o mapa de con-torno de G, o ponto

(p∗, q∗) = (1, 0; 1, 0)

e o unico equilıbrio de Nash do jogo.

Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, pagina 13),

(p, q) = (p, 1− p; q, 1− q) ∈ Δ2 ×Δ2

e um equilıbrio de Nash se, e somente se, (p, q) e solucao do seguinteproblema de otimizacao

minimizar G(p, q) = (max {0,−5 (−1 + p) (3 q − 1)})2 +(max {0,−5 p (3 q − 1)})2 +(max {0,−5 (3 p− 2) (−1 + q)))

2+

(max {0,−5 q (3 p− 2)})2sujeito a 0 ≤ p ≤ 1,

0 ≤ q ≤ 1.

Como vemos pela Figura 4.2, que mostra o grafico e o mapa de con-torno de G, os pontos

(p∗, q∗) = (1, 0; 1, 0), (p∗, q∗) = (0, 1; 0, 1) e

(p∗, q∗) = (2/3, 1/3; 1/3, 2/3)

Page 76: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 73

[SEC. 4.1: EQUILIBRIO DE NASH VIA UM PROBLEMA DE OTIMIZACAO 73

sao os unicos equilıbrios de Nash do jogo.

Exemplo 4.3 Para o jogo do Exemplo 2.6 da pagina 22,

(p, q) = (p, 1− p; q, 1− q) ∈ Δ2 ×Δ2

e um equilıbrio de Nash se, e somente se, (p, q) e solucao do seguinteproblema de otimizacao

minimizar G(p, q) = (max {0,−2 (−1 + p) (2 q − 1)})2 +(max {0,−2 p (2 q − 1)})2 +(max {0, 2 (2 p− 1) (−1 + q)})2 +(max {0, 2 (2 p− 1) q})2

sujeito a 0 ≤ p ≤ 1,0 ≤ q ≤ 1.

Como vemos pela Figura 4.3, que mostra o grafico e o mapa de con-torno de G, o ponto

(p∗, q∗) = (1/2, 1/2; 1/2, 1/2)

e o unico equilıbrio de Nash do jogo.

Exemplo 4.4 Para o jogo do exemplo 2.12 da pagina 42,

(p, q) = (p, 1− p; q, 1− q) ∈ Δ2 ×Δ2

e um equilıbrio de Nash se, e somente se, (p, q) e solucao do seguinteproblema de otimizacao

minimizar G(p, q) = (max {0,−2 (−1 + p) (2 q − 1)})2 +(max {0,−2 p (2 q − 1)})2 +(max {0, (−3 + 4 p) (−1 + q)})2 +(max {0, q (−3 + 4 p)})2

sujeito a 0 ≤ p ≤ 1,0 ≤ q ≤ 1.

Page 77: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 74

74 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Como vemos pela Figura 4.4, que mostra o grafico e o mapa de con-torno de G, o ponto

(p∗, q∗) = (3/4, 1/4; 1/2, 1/2)

e o unico equilıbrio de Nash do jogo.

4.2 Equilıbrio de Nash via equacoes poli-

nomiais

A proxima proposicao estabelece que a maior utilidade esperadaque o jogador gi pode obter contra qualquer escolha de estrategiasmistas dos demais jogadores nao depende se o jogador gi esta usandoestrategias mistas ou somente estrategias puras. Mais ainda, as es-trategias mistas otimas para o jogador gi sao justamente aquelas queatribuem probabilidade positiva somente para as estrategias purasotimas.

Proposicao 4.1 Para todo i = 1, . . . , n e para todo p =(p1, . . . ,pi, . . . ,pn) ∈ Δ = Δ(S1)× · · · ×Δ(Si)× · · ·Δ(Sn),

maxsiji∈Si

ui(siji ,p−i) = maxpi∈Δ(Si)

ui(pi,p−i).

Mais ainda,

p∗i = (p∗i1, . . . , p

∗ik, . . . , p

∗imi

) ∈ argmaxpi∈Δ(Si) ui(pi,p−i)

p∗ik = 0 para todo k tal que sik �∈ argmaxsiji∈Si

ui(siji ,p−i).

Demonstracao: Pela Propriedade 2.4, sabemos que

ui(pi,p−i) =

mi∑ji=1

piji · ui(siji ,p−i).

Page 78: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 75

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUACOES POLINOMIAIS 75

0 0.2 0.4 0.6 0.8 1p0

0.5

1

q0

5

10

15

20

25

0 0.2 0.4 0.6 0.8 1p

0

0.2

0.4

0.6

0.8

1

q

Figura 4.1: Encontrando os equilıbrios de Nash para o dilema do pri-sioneiro via um problema de otimizacao.

Page 79: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 76

76 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

0 0.2 0.4 0.6 0.8 1p0

0.20.4

0.60.8

1

q0

0.5

1

1.5

2

2.5

3

0 0.2 0.4 0.6 0.8 1p

0

0.2

0.4

0.6

0.8

1

q

Figura 4.2: Encontrando os equilıbrios de Nash para a batalha dossexos via um problema de otimizacao.

Page 80: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 77

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUACOES POLINOMIAIS 77

0 0.2 0.4 0.6 0.8 1

p0

0.2

0.4

0.6

0.8

1

q

1

2

3

4

0 0.2 0.4 0.6 0.8 1p

0

0.2

0.4

0.6

0.8

1

q

Figura 4.3: Encontrando os equilıbrios de Nash do jogo de compararmoedas via um problema de otimizacao.

Page 81: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 78

78 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

0 0.2 0.4 0.6 0.8 1

p0

0.2

0.4

0.6

0.8

1

q

2

4

6

8

0 0.2 0.4 0.6 0.8 1p

0

0.2

0.4

0.6

0.8

1

q

Figura 4.4: Encontrando os equilıbrios de Nash do jogo do Exem-plo 2.12 via um problema de otimizacao.

Page 82: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 79

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUACOES POLINOMIAIS 79

Assim, ui(pi,p−i) e a media ponderada dos valores ui(siji ,p−i), ondeos pesos piji sao nao-negativos e somam 1. Esta media ponderadanao pode ser maior do que o maior dos valores que participam nocalculo da media. Assim,

ui(pi,p−i) ≤ maxsiji∈Si

ui(siji ,p−i)

para todo pi ∈ Δ(Si) e, portanto,

maxpi∈Δ(Si)

ui(pi,p−i) ≤ maxsiji∈Si

ui(siji ,p−i).

Por outro lado, ui(siji ,p−i) = ui(eji ,p−i), onde eji e a distribuicaode probabilidades em Δ(Si) que da peso 1 a estrategia pura siji .Assim,

ui(siji ,p−i) = ui(eji ,p−i) ≤ maxpi∈Δ(Si)

ui(pi,p−i)

para todo siji ∈ Si e, portanto,

maxsiji∈Si

ui(siji ,p−i) ≤ maxpi∈Δ(Si)

ui(pi,p−i).

Para a segunda parte da proposicao, suponha por absurdo que exista

p∗i = (p∗i1, . . . , p

∗ik, . . . , p

∗imi

) ∈ argmaxpi∈Δ(Si) ui(pi,p−i)

onde, para algum ındice k, ocorre que

p∗ik > 0 e sik �∈ argmaxsiji∈Siui(siji ,p−i).

Isto implica que ui(sik,p−i) < maxsiji∈Si ui(siji ,p−i). Uma vez queui(siji ,p−i) ≤ maxsiji∈Si ui(siji ,p−i) para todo ji �= k, segue-se que

ui(p∗i ,p−i) =

mi∑ji=1

p∗iji · ui(siji ,p−i)

<

mi∑ji=1

p∗iji · maxsiji∈Si

ui(siji ,p−i) = maxsiji∈Si

ui(siji ,p−i)

= maxpi∈Δ(Si)

ui(pi,p−i).

Page 83: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 80

80 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Masisto contradiz o fato de p∗i pertencer a argmaxpi∈Δ(Si) ui(pi,p−i).

Reciprocamente, se p∗i satisfaz a condicao p∗ik = 0 para todo k tal que

sik �∈ argmaxsiji∈Siui(siji ,p−i), entao

ui(sik,p−i) = maxsiji∈Si

ui(siji ,p−i)

sempre que p∗ik > 0. Assim

ui(p∗i ,p−i) =

mi∑k=1

p∗ik · ui(sik,p−i) =∑p∗ik>0

p∗ik · ui(sik,p−i)

=∑p∗ik>0

p∗ik · maxsiji∈Si

ui(siji ,p−i) = maxsiji∈Si

ui(siji ,p−i)

= maxpi∈Δ(Si)

ui(pi,p−i).

Isto mostra que p∗i pertence a a argmaxpi∈Δ(Si) ui(pi,p−i).

Corolario 4.1 p∗ = (p∗1, . . . ,p

∗i , . . . ,p

∗n) ∈ Δ e um equilıbrio

de Nash em estrategias mistas se, e somente se, para todo i =1, . . . , n,

p∗ik > 0 ⇒ sik ∈ argmaxsiji∈Siui(siji ,p

∗−i),

onde p∗i = (p∗i1, . . . , p

∗ik, . . . , p

∗imi

).

O suporte de um perfil p∗i = (p∗i1, . . . , p

∗ik, . . . , p

∗imi

) de estrategiasmistas e o conjunto de estrategias puras do jogador gi que recebeprobabilidade positiva por p∗

i . Mais precisamente,

supp(p∗i ) = {sik ∈ Si | p∗ik > 0}.

Assim, o Corolario 4.1 diz que p∗ = (p∗1, . . . ,p

∗i , . . . ,p

∗n) e um equilı-

brio de Nash se, e somente se, para todo i = 1, . . . , n,

supp(p∗i ) ⊆ argmaxsiji∈Si

ui(siji ,p∗−i).

Page 84: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 81

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUACOES POLINOMIAIS 81

A Proposicao 4.1 pode ser usada para calcular equilıbrios de Nashem estrategias mistas. O ponto chave e observar que, pela Pro-posicao 4.1, se p∗ ∈ Δ e um equilıbrio de Nash em estrategias mistas,entao, para todo i = 1, . . . , n,

ui(sik,p∗−i) = constante = max

siji∈Si

ui(siji ,p∗−i) (4.1)

sempre que p∗ik > 0, isto e, em um equilıbrio de Nash, o jogador gitem o mesmo ganho se trocar sua estrategia p∗

i por qualquer outraestrategia pura que recebeu probabilidade positiva de p∗

i .

Exemplo 4.5 No Exemplo 2.11, vimos que as funcoes utilidade doisjogadores da batalha dos sexos sao dadas por

uHomem(p11, p12; p21, p22) = 10 · p11 · p21 + 5 · p12 · p22,uMulher(p11, p12; p21, p22) = 5 · p11 · p21 + 10 · p12 · p22.

Vamos usar as relacoes 4.1 para calcular o equilıbrio de Nash emestrategias mistas que nao e um equilıbrio em estrategias puras,isto e, o equilıbrio de Nash cujas estrategias mistas tem suportenas duas estrategias puras de cada jogador. Para isto, considerep∗ = (p∗11, p∗12; p∗21, p∗22) ∈ Δ2 × Δ2, com 0 < p∗11, p∗12, p∗21, p∗22 < 1.Pelas relacoes 4.1, se p∗ e um equilıbrio de Nash, entao

uHomem( 1 , 0 ; p∗21, p∗22) = uHomem( 0 , 1 ; p∗21, p

∗22),

uMulher(p∗11, p

∗12; 1 , 0 ) = uMulher(p

∗11, p

∗12; 0 , 1 ),

isto e,10 · p∗21 = 5 · p∗22 e 5p∗11 = 10 · p∗12.

Como p∗21+p∗22 = 1 e p∗11+p∗12 = 1, obtemos entao um sistema linearcom 4 equacoes e 4 incognitas. A solucao deste sistema da o equilıbriode Nash

(p∗11, p∗12; p

∗21, p

∗22) = (2/3, 1/3; 1/3, 2/3).

A tecnica descrita no exemplo acima pode ser usada para o calculodos equilıbrios de Nash que nao sao estrategias puras para jogos com

Page 85: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 82

82 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

mais do que dois jogadores e com mais do que duas estrategias puraspor jogador. Neste caso, e preciso (1) considerar os varios casos queresultam das diferentes escolhas das estrategias puras que farao partedo suporte de cada perfil em estrategias mistas e (2) resolver o sistemanao-linear resultante. Mais precisamente, para cada jogador gi e paracada subconjunto nao-vazio Ti = {sik1 , . . . , sikti

} de Si (que especificaquais estrategias puras farao parte do suporte), devemos resolver osistema descrito na Figura 4.5 (neste sistema, wi representa o ganhoconstante que o jogador gi obtem escolhendo qualquer uma de suasestrategias puras que recebeu probabilidade positiva de p∗

i ).Para jogos com muitos jogadores e muitas estrategias, o sistema

da Figura 4.5 nao e pratico para o calculo a mao dos equilıbrios deNash. Contudo, metodos numericos para a solucao de um sistemade equacoes polinomiais podem ser aplicados: o metodo de Newtoncom uma estrategia de subdivisao espacial, bases de Grobner e conti-nuacao homotopica poliedral. O leitor interessado pode consultar asreferencias [21, 22, 51]

4.3 Jogos de soma zero

Nesta secao estudaremos os jogos de soma zero com dois jogado-res, uma classe especial de jogos onde a soma dos payoffs dos doisjogadores e sempre zero: o que um jogador ganha, o outro perde1.Veremos que, para este tipo de jogo, os equilıbrios de Nash em es-trategias mistas podem ser facilmente calculados resolvendo-se umproblema de otimizacao linear.

4.3.1 Jogos de soma constante com dois jogadores

Definicao 4.1 (Jogos de soma constante com dois jo-gadores) Um jogo de soma constante com dois jogadores e umjogo com dois jogadores, comumente denominados jogador linhae jogador coluna, com estrategias

1Por este motivo, jogos de soma zero tambem sao denominados jogos estrita-mente competitivos.

Page 86: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 83

[SEC. 4.3: JOGOS DE SOMA ZERO 83

m1 ∑ j 1=1

···m

i−

1 ∑j i

−1=1

mi+

1 ∑j i

+1=1

···m

n ∑ j n=1

p∗ 1j 1···p

∗ (i−1)j

i−

1·p

∗ (i+1)j

i+

1···p

∗ nj n

·ui(s 1

j 1,...,s

ij−

i,s

ikτ,s

iji+

1,s

nj n)=

wi,

∀i=

1,...,n

,∀s i

kτ∈Ti,

p∗ ik

τ=

0,

∀i=

1,...,n

,∀τ=

1,...,t

i,

t i ∑ τ=1

p∗ ik

τ=

1,

∀i=

1,...,n

.

Figura

4.5:CalculandoequilıbriosdeNash

atrav

esdeum

sistem

anao-linear.

Page 87: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 84

84 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Sjogador linha = {1, 2, . . . ,m}e

Sjogador coluna = {1, 2, . . . , n}e matriz de payoffs

jogador coluna1 2 · · · n

jogadorlinha

1 (a11, b11) (a12, b12) · · · (a1n, b1n)

2 (a21, b21) (a22, b22) · · · (a2n, b2n)

......

.... . .

...

m (am1, bm1) (am2, bm2) · · · (amn, bmn)

satisfazendo aij + bij = c = constante, para todo i = 1, . . . ,me j = 1, . . . , n. No caso particular em que a constante c e zero,dizemos que o jogo tem soma zero.

Em termos de estrategias mistas, se p = (p1, . . . , pm) ∈ Δm e umadistribuicao de probabilidades para as estrategias puras do jogadorlinha e q = (q1, . . . , qn) ∈ Δn e uma distribuicao de probabilidadespara as estrategias puras do jogador coluna, entao o payoff esperadopara o jogador linha e

ul(p, q) =m∑i=1

n∑j=1

piqjaij

=[p1 p2 · · · pm

]⎡⎢⎢⎢⎣

a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

⎤⎥⎥⎥⎦⎡⎢⎢⎢⎣

q1q2...qn

⎤⎥⎥⎥⎦ ,

Page 88: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 85

[SEC. 4.3: JOGOS DE SOMA ZERO 85

isto e,

ul(p, q) = pTAq, com A =

⎡⎢⎢⎢⎣a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

⎤⎥⎥⎥⎦ .

Analogamente, o payoff esperado para o jogador coluna e dado por

uc(p, q) = pTBq, com B =

⎡⎢⎢⎢⎣b11 b12 · · · b1nb21 b22 · · · b2n...

.... . .

...bm1 bm2 · · · bmn

⎤⎥⎥⎥⎦ .

Uma vez que o jogo tem soma constante, vemos que

A+B =

⎡⎢⎢⎢⎣a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

⎤⎥⎥⎥⎦+

⎡⎢⎢⎢⎣b11 b12 · · · b1nb21 b22 · · · b2n...

.... . .

...bm1 bm2 · · · bmn

⎤⎥⎥⎥⎦

=

⎡⎢⎢⎢⎣c c · · · cc c · · · c...

.... . .

...c c · · · c

⎤⎥⎥⎥⎦ ,

isto e,

A+B = C =

⎡⎢⎢⎢⎣c c · · · cc c · · · c...

.... . .

...c c · · · c

⎤⎥⎥⎥⎦ = c

⎡⎢⎢⎢⎣1 1 · · · 11 1 · · · 1...

.... . .

...1 1 · · · 1

⎤⎥⎥⎥⎦ = c 1 ,

onde 1 denota a matriz m × n formada com 1 em todas as suasentradas. Sendo assim, e facil de ver que

uc(p, q) = pTBq = pT (c 1 − A)q = cpT 1 q− pTAq = c− ul(p, q)

Page 89: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 86

86 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

onde, na ultima igualdade, usamos que pT 1 q = 1, pois p e q saodistribuicoes de probabilidades e, por isto,

m∑i=1

pi = 1 e

n∑j=1

qj = 1.

Em particular, vale a seguinte propriedade importante:

ul(p∗, q∗) ≥ ul(p, q

∗) ⇔ uc(p∗, q∗) ≤ uc(p, q

∗). (4.2)

4.3.2 Equilıbrio de Nash em estrategias puras

Definicao 4.2 (Ponto de sela) Dizemos que um elementoaij de uma matriz A e um ponto de sela da matriz A se ele forsimultaneamente um mınimo em sua linha e um maximo em suacoluna, isto e, se

aij ≤ ail para todo l = 1, . . . , n e

aij ≥ akj para todo k = 1, . . . ,m.

O termo ponto de sela vem do fato que se desenharmos o graficodos payoffs do jogador linha, a vizinhanca do ponto de sela lembra oformato de uma sela de cavalo (Figura 4.6).

Teorema 4.1 O elemento aij e um ponto de sela da matriz Ase, e somente se, o par (i, j) e um equilıbrio de Nash em es-trategias puras para o jogo.

Demonstracao:(⇒) Seja aij um ponto de sela da matriz A. Como aij e maximo

em sua coluna, vale que

ul(i, j) = aij ≥ akj = ul(k, j)

Page 90: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 87

[SEC. 4.3: JOGOS DE SOMA ZERO 87

ColunasLinhas

payoff

Figura 4.6: Ponto de sela.

para todo k = 1, . . . ,m, isto e, o jogador linha nao pode aumentar oseu payoff se o jogador coluna mantiver a escolha da coluna j. Poroutro lado, como aij e mınimo em sua linha, vale que

uc(i, j) = bij = c− aij ≥ c− ail = bil = uc(i, l)

para todo l = 1, . . . , n, isto e, o jogador coluna nao pode aumentaro seu payoff se o jogador linha mantiver a escolha da linha i. Istomostra que o perfil de estrategias puras (i, j) e um equilıbrio de Nashdo jogo.

(⇐) Seja (i, j) e um equilıbrio de Nash do jogo. A partir dasconsideracoes acima, e facil de ver que aij e maximo em sua colunae mınimo em sua linha e que, portanto, aij e um ponto de sela damatriz A.

Page 91: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 88

88 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Teorema 4.2 Se aij e ars sao dois pontos de sela da matriz A,entao ais e arj tambem sao pontos de sela da matriz A e

aij = ars = ais = arj.

Demonstracao: Considere a matriz

A =

⎡⎢⎢⎢⎢⎢⎢⎢⎣

......

· · · aij · · · ais · · ·...

. . ....

· · · arj · · · ars · · ·...

...

⎤⎥⎥⎥⎥⎥⎥⎥⎦.

Como aij e ars sao pontos de sela, sabemos que eles sao mınimosem suas respectivas linhas e maximos em suas respectivas colunas.Assim,

aij ≤ ais ≤ ars e aij ≥ arj ≥ ars,

e, portanto,

aij = ais = arj = ars.

Observe que ais e mınimo em sua linha, pois aij = ais e mınimoda mesma linha e que ais e maximo em sua coluna, pois ars = aise maximo da mesma coluna. Analogamente, arj e mınimo em sualinha, pois ars = arj e mınimo da mesma linha e arj e maximo emsua coluna, pois arj = aij e maximo da mesma coluna. Concluımosentao que ais e arj tambem sao pontos de sela da matriz A.

O payoff mınimo do jogador linha, se ele escolher a linha k, e dadopor

ak = min1≤l≤n

akl.

Analogamente, o payoff mınimo do jogador coluna, se ele escolher acoluna l, e dado por c− al, onde

al = max1≤k≤m

akl.

Page 92: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 89

[SEC. 4.3: JOGOS DE SOMA ZERO 89

Definavl(A) = max

1≤k≤mak = max

1≤k≤mmin

1≤l≤nakl

evc(A) = min

1≤l≤nal = min

1≤l≤nmax

1≤k≤makl.

Teorema 4.3 Para toda matriz A, tem-se vc(A) ≥ vl(A).

Demonstracao: Temos que para todo k = 1, . . . ,m e j = 1, . . . , n,akj ≥ min

1≤l≤nakl.

Assim,max

1≤k≤makj ≥ max

1≤k≤mmin

1≤l≤nakl = vl(A),

para todo j = 1, . . . , n. Consequentemente,

vc(A) = min1≤j≤n

max1≤k≤m

akj ≥ max1≤k≤m

min1≤l≤n

akl = vl(A).

O proximo teorema caracteriza a existencia de pontos de sela e,portanto, a existencia de equilıbrios de Nash em estrategias puras,em termos das funcoes vl e vc.

Teorema 4.4 Uma matriz A tem um ponto de sela se, e so-mente se, vl(A) = vc(A).

Demonstracao:(⇒) Se aij e um ponto de sela da matriz A, entao vale que

aij = min1≤l≤n ail = ai. Como vl(A) = max1≤k≤m ak, e claro quevl(A) ≥ ai = aij . Por outro lado, aij = max1≤k≤m akj = aj. Comovc(A) = min1≤l≤n al, segue-se que vc(A) ≤ aj = aij . Combinandoestas duas desigualdades, concluımos que vc(A) ≤ aij ≤ vl(A). Mas,pelo teorema anterior, vc(A) ≥ vl(A) e, sendo assim, vc(A) = vl(A).

(⇐) Como vl(A) = max1≤r≤m ar, existe uma linha i tal quevl(A) = ai. Como, por sua vez, ai = min1≤s≤n ais, existe uma co-luna l tal que ai = ail. Assim, vl(A) = ai = ail. Analogamente, como

Page 93: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 90

90 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

vc(A) = min1≤s≤n as, existe uma coluna j tal que vc(A) = aj . Como,por sua vez, aj = max1≤r≤m arj , existe uma linha k tal que aj = akj .Assim, vc(A) = aj = akj . Uma vez que, por hipotese, vl(A) = vc(A),temos que

ail = ai = vl(A) = vc(A) = aj = akj .

Afirmamos que aij e um ponto de sela da matriz A. Com efeito, aij ≤aj = ai ≤ ais, para todo s = 1, . . . , n, isto e, aij e o mınimo de sualinha. Por outro lado, aij ≥ ai = aj ≥ arj, para todo r = 1, . . . ,m,isto e, aij e o maximo de sua coluna. Portanto, aij e um ponto desela da matriz A.

Corolario 4.2 Um jogo de dois jogadores com soma constantedefinido pela matriz de payoffs A do jogador linha tem umequilıbrio de Nash em estrategias puras se, e somente se,

vl(A) = vc(A).

Exemplo 4.6 Considere o jogo de soma zero cujos payoffs do jogadorlinha sao dados pela matriz A abaixo.

A =

mınimo das linhas⎡⎢⎢⎢⎣⎤⎥⎥⎥⎦

3 1 1 0 0

0 1 2 0 0

1 0 2 1 0

3 1 2 2 1

maximo das colunas 3 1 2 2

Como vl(A) = maximo dos mınimos das linhas = 1 = vc(A) = mınimodos maximos das colunas, segue-se que o jogo possui um equilıbriode Nash em estrategias puras. De fato, a42 e um ponto de sela damatriz A.

Page 94: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 91

[SEC. 4.3: JOGOS DE SOMA ZERO 91

Exemplo 4.7 Considere o jogo de soma zero cujos payoffs do jogadorlinha sao dados pela matriz A abaixo.

A =

mınimo das linhas⎡⎢⎢⎢⎣⎤⎥⎥⎥⎦

3 2 1 0 0

0 1 2 0 0

1 0 2 1 0

3 1 2 2 1

maximo das colunas 3 2 2 2

Como vl(A) = maximo dos mınimos das linhas = 1 < 2 = vc(A) =mınimo dos maximos das colunas, segue-se que o jogo nao possui umequilıbrio de Nash em estrategias puras.

4.3.3 Equilıbrio de Nash em estrategias mistas

Defina

vl(A) = maxp∈Δm

minq∈Δn

pTAq e vc(A) = minq∈Δn

maxp∈Δm

pTAq.

Teorema 4.5 Para toda matriz A, tem-se vc(A) ≥ vl(A).

Demonstracao: Temos que para todo p ∈ Δm,

pTAq ≥ miny∈Δn

pTAy.

Assim,maxp∈Δm

pTAq ≥ maxp∈Δm

miny∈Δn

pTAy = vl(A).

Consequentemente,

vc(A) = minq∈Δn

maxp∈Δm

pTAq ≥ maxp∈Δm

miny∈Δn

pTAy = vl(A).

O proximo teorema caracteriza a existencia de equilıbrios de Nashem estrategias mistas em termos das funcoes vl e vc.

Page 95: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 92

92 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Teorema 4.6 Um perfil de estrategias mistas (p∗, q∗) e umequilıbrio de Nash de um jogo de dois jogadores com soma cons-tante definido pela matriz de payoffs A do jogador linha se, esomente se,

vl(A) = vc(A) = p∗TAq∗.

Demonstracao:(⇒) Se (p∗, q∗) e um equilıbrio de Nash, entao

p∗TAq∗ = ul(p∗, q∗) ≥ ul(p, q

∗) = pTAq∗,

para todo p ∈ Δm. Em particular,

p∗TAq∗ = maxp∈Δm

pTAq∗ ≥ miny∈Δn

maxp∈Δm

pTAy = vc(A).

Vale tambem que

p∗TAq∗ = c− uc(p∗, q∗) ≤ c− uc(p

∗, q) = p∗TAq,

para todo q ∈ Δn. Em particular,

p∗TAq∗ = minq∈Δn

p∗TAq ≤ maxx∈Δm

minq∈Δn

xTAq = vl(A).

Desta maneira, vl(A) ≥ vc(A). Como, pelo teorema anterior, vl(A) ≤vc(A), concluımos que vl(A) = vc(A).

(⇐) Como vl(A) = maxp∈Δm minq∈Δn pTAq, existe p∗ ∈ Δm talque

vl(A) = minq∈Δn

p∗TAq.

Analogamente, como vc(A) = minq∈Δn maxp∈Δm pTAq, existe q∗ ∈Δm tal

vc(A) = maxp∈Δm

pTAq∗.

Uma vez que, por hipotese, vl(A) = vc(A), temos que

minq∈Δn

p∗TAq = vl(A) = vc(A) = maxp∈Δm

pTAq∗.

Page 96: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 93

[SEC. 4.3: JOGOS DE SOMA ZERO 93

Afirmamos que (p∗, q∗) e um equilıbrio de Nash do jogo. Com efeito,

ul(p∗, q∗) = p∗TAq∗ ≥ min

q∈Δn

p∗TAq =

maxp∈Δm

pTAq∗ ≥ xTAq∗ = ul(x, q∗),

para todo x ∈ Δm. Por outro lado,

uc(p∗, q∗) = c− p∗TAq∗ ≥ c− max

p∈Δm

pTAq∗ =

c− minq∈Δn

p∗TAq ≥ c− p∗TAy = uc(p∗, y),

para todo y ∈ Δn. Desta maneira, (p∗, q∗) e um equilıbrio de Nashdo jogo.

4.3.4 O teorema minimax de von Neumann

O proximo teorema estabelece que, para jogos de dois jogadorescom soma zero, vl(A) = vc(A) sempre. Sendo assim, pelo teorema 4.6,segue-se que, para esta classe de jogos, sempre existe pelo menos umequilıbrio de Nash em estrategias mistas.

Teorema 4.7 (minimax de von Neumann) Para todo jogode soma zero com dois jogadores, representado pela matrizde payoffs A do jogador linha, sempre existe um perfil de es-trategias mistas (p∗, q∗) ∈ Δm ×Δn satisfazendo

vl(A) = maxp∈Δm

minq∈Δn

pTAq

=

p∗TAq∗

=

minq∈Δn

maxp∈Δm

pTAq = vc(A).

Em particular, (p∗, q∗) e um equilıbrio de Nash do jogo.

Page 97: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 94

94 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Daremos uma demonstracao deste teorema minimax de von Neu-mann usando o teorema de dualidade da teoria de programacao linear.Lembramos que um problema de programacao linear e um problemade otimizacao com funcao objetivo e restricoes lineares:

(problema primal)

maximizar bTysujeito a Ay ≤ c,

y ≥ 0,

onde as desigualdades devem ser interpretadas componente a com-ponente. A cada problema de programacao linear (problema primal)podemos associar um outro problema de otimizacao (problema dual):

(problema dual)

minimizar cTx

sujeito a xTA ≥ bT ,x ≥ 0.

Teorema 4.8 (da dualidade em programacao linear)

(a) O problema primal possui uma solucao se, e somente se, oproblema dual possui uma solucao.

(b) Se y∗ e solucao do problema primal e x∗ e solucao do pro-blema dual, entao cTx∗ = bTy∗.

Uma demonstracao do teorema de dualidade pode ser encontradaem [14, 52].

Demonstracao do teorema minimax: sem perda de generalidade,podemos assumir que todas as entradas da matriz de payoffs A do jo-gador linha sao positivas. Caso contrario, basta substituir A por A =A + D e B = −A por B = −D + B, onde D = d 1 , com d >max1≤i≤m,1≤j≤n |aij |. Observe que A+ B = 0 (isto e, o jogo definido

pelas matrizes A e B tem soma zero) e que (p∗, q∗) e um equilıbrio

Page 98: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 95

[SEC. 4.3: JOGOS DE SOMA ZERO 95

de Nash para o jogo definido pela matriz A se, e somente se, (p∗, q∗)e um equilıbrio de Nash para o jogo definido pela matriz A.

Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os proble-mas de programacao linear:

(problema primal)

maximizar bTysujeito a Ay ≤ c,

y ≥ 0,

(problema dual)

minimizar cTx

sujeito a xTA ≥ bT ,x ≥ 0.

Passo 1: o problema dual possui uma solucao.Como A > 0, o conjunto admissıvel

X = {x ∈ Rm | xTA ≥ bT e x ≥ 0}

e nao vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a funcao ob-jetivo do problema e escrita como x = (x1, x2, . . . , xm) �→ cTx =x1 + x2 + · · ·+ xm. Assim, o problema dual consiste em encontrar oponto do conjunto X mais proximo da origem segundo a norma dasoma || · ||1, um problema que certamente possui uma solucao pois,se p ∈ X , entao podemos “compactificar” o conjunto admissıvel in-cluindo a restricao ||x||1 ≤ ||p||1 e, com isso, podemos usar o teoremade Weierstrass para garantir a existencia de um mınimo.

Passo 2: construcao do equilıbrio de Nash.Dado que o problema dual possui uma solucao, pelo teorema de

dualidade, o problema primal tambem possui. Mais ainda: se x∗ esolucao do problema dual e y∗ e solucao do problema primal, entao

cTx∗ = (x∗)TAy∗ = bTy∗.

Seja θ = cTx∗ = bTy∗ (que e > 0 pois (0, 0, . . . , 0) nao e admissıvel)e defina

p∗ =x∗

θe q∗ =

y∗

θ.

Page 99: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 96

96 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Afirmamos que (p∗, q∗) e um equilıbrio de Nash do jogo. Com efeito:claramente p∗ ∈ Δm e q∗ ∈ Δn, pois p

∗ ≥ 0 (ja que x∗ ≥ 0 e θ > 0),q∗ ≥ 0 (ja que y∗ ≥ 0 e θ > 0),

m∑i=1

pi =

m∑i=1

x∗i

θ=

cTx∗

θ=

θ

θ= 1

em∑j=1

qj =

n∑j=1

y∗jθ

=bTy∗

θ=

θ

θ= 1.

Agora, como x∗TA ≥ bT , temos que para todo q ∈ Δn, x∗TAq ≥

bTq =∑n

j=1 qj = 1. Mas p∗ = x∗/θ. Desta maneira, p∗TAq ≥ θ =

p∗TAq∗, para todo q ∈ Δn. Consequentemente,

uc(p∗, q∗) = −p∗TAq∗ ≥ −p∗TAq = uc(p

∗, q)

para todo q ∈ Δn. Mostramos entao que o jogador coluna nao podeaumentar o seu payoff esperado trocando q∗ por q, se o jogador linhamantiver a escolha p∗. Analogamente, como Ay ≤ c, temos quepara todo p ∈ Δm, pTAy∗ ≤ pT c =

∑mi=1 pi = 1. Mas y∗ =

q∗/θ. Desta maneira, p∗Aq∗ ≤ θ = p∗TAq∗, para todo p ∈ Δm.Consequentemente,

ul(p∗, q∗) = p∗TAq∗ ≥ pTAq∗ = ul(p, q

∗),

para todo p ∈ Δm. Mostramos entao que o jogador linha nao podeaumentar o seu payoff esperado trocando p∗ por p, se o jogador co-luna mantiver a escolha q∗. Concluımos, portanto, que (p∗, q∗) e umequilıbrio de Nash do jogo.

Alem de estabelecer a existencia de equilıbrios de Nash, a demons-tracao que demos sugere uma maneira de calcula-los: resolvendo-sedois problemas de programacao linear.

Exemplo 4.8 O governo deseja vacinar seus cidadaos contra umcerto vırus da gripe. Este vırus possui dois sorotipos, sendo que edesconhecida a proporcao na qual os dois sorotipos ocorrem na po-pulacao do vırus. Foram desenvolvidas duas vacinas onde a eficacia

Page 100: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 97

[SEC. 4.3: JOGOS DE SOMA ZERO 97

da vacina 1 e de 85% contra o sorotipo 1 e de 70% contra o soro-tipo 2. A eficacia da vacina 2 e de 60% contra o sorotipo 1 e de 90%contra o sorotipo 2. Qual polıtica de vacinacao deveria ser tomadapelo governo?

Esta situacao pode ser modelada como um jogo de soma zerocom dois jogadores, onde o jogador linha L (o governo) deseja obtera maior compensacao (a fracao dos cidadaos resistentes ao vırus) omaior possıvel e o jogador coluna C (o vırus) deseja obter a maiorcompensacao a menor possıvel. A matriz de payoffs e a seguinte:

vırussorotipo 1 sorotipo 2

governo vacina 1 (85/100,−85/100) (70/100,−70/100)

vacina 2 (60/100,−60/100) (90/100,−90/100)

Para encontrar um equilıbrio de Nash, devemos resolver os seguintesproblemas de programacao linear

(problema primal)

maximizar y1 + y2

sujeito a

[85/100 70/10060/100 90/100

] [y1y2

]≤

[11

],[

y1y2

]≥

[00

],

(problema dual)

minimizar x1 + x2

sujeito a[x1 x2

] [ 85/100 70/10060/100 90/100

]≥ [

1 1],[

x1

x2

]≥

[00

],

isto e,

Page 101: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 98

98 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

(problema primal)

maximizar y1 + y2sujeito a 17y1 + 14y2 ≤ 20,

6y1 + 9y2 ≤ 10,y1 ≥ 0,y2 ≥ 0,

(problema dual)

minimizar x1 + x2

sujeito a 7x1 + 12x2 ≥ 20,7x1 + 9x2 ≥ 10,

x1 ≥ 0,x2 ≥ 0.

A solucao do problema dual e x∗ = (20/23, 10/23) (Figura 4.7) e asolucao do problema primal e y∗ = (40/69, 50/69), com

θ = x∗1 + x∗

2 = y∗1 + y∗2 =30

23.

Desta maneira, o unico equilıbrio de Nash para o problema e dadopelo ponto (p∗, q∗), onde

p∗ =x∗

θ=

(2

3,1

3

)e q∗ =

y∗

θ=

(4

9,5

9

).

O teorema minimax de von Neumann garante que, para jogos desoma zero, existem estrategias mistas p∗ e q∗ tais que:

(a) Se o jogador linha jogar com p∗, entao o seu ganho esperadonunca e menor do que v∗ = p∗TAq∗, independentemente da es-colha do jogador coluna.

(b) Se o jogador coluna jogar com q∗, entao a sua perda esperadanunca e maior do que v∗ = p∗TAq∗, independentemente da esco-lha do jogador linha.

Como efeito: como (p∗, q∗) e um equilıbrio de Nash em estrategiasmistas, segue-se que v∗ = uc(p

∗, q∗) ≥ uc(p∗, q), ∀q ∈ Δn, e v∗ =

Page 102: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 99

[SEC. 4.3: JOGOS DE SOMA ZERO 99

x2

0 20/23 30/23

10/23

30/23

x1

Figura 4.7: Solucao do problema dual.

0 40/69 30/23

30/23

50/69

y1

y1

Figura 4.8: Solucao do problema primal.

Page 103: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 100

100 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

ul(p∗, q∗) ≥ uc(p, q), ∀p ∈ Δm. Mas uc(p, q) = −pTAq e ul(p, q) =

+pTAq. Assim,

∀q ∈ Δn, v∗ = uc(p

∗, q∗) ≥ uc(p∗, q)

⇓∀q ∈ Δn,p

∗TAq ≥ p∗TAq∗ = v∗ (4.3)

⇓O ganho esperado do jogador linha nunca e menordo que v∗ se ele jogar com p∗, independentementeda escolha q do jogador coluna.

e, analogamente,

∀p ∈ Δm, v∗ = ul(p∗, q∗) ≥ ul(p, q

∗)⇓

∀p ∈ Δm,pAq∗ ≤ p∗TAq∗ = v∗ (4.4)

⇓A perda esperada do jogador coluna nunca e maiordo que v∗ se ele jogar com q∗, independentementeda escolha p do jogador linha.

Mais ainda: se (p∗, q∗) e um equilıbrio de Nash do jogo, entao

n∑j=1

aij · q∗j = v∗, para todo i tal que p∗i > 0 e (4.5)

m∑i=1

p∗i · aij = v∗, para todo j tal que q∗j > 0. (4.6)

De fato: suponha, por absurdo, que exista algum ındice k tal quep∗k > 0 e

∑nj=1 akj · q∗j �= v∗. Usando as desigualdades 4.4 com

p = ei, sabemos que∑n

j=1 aij ·q∗j ≤ v∗ para todo i = 1, . . . ,m. Logo,

se∑n

j=1 akj · q∗j �= v∗, entao∑n

j=1 akj · q∗j < v∗. Mas, entao,

v∗ =

m∑i=1

p∗i

⎛⎝ n∑j=1

aij · q∗j

⎞⎠ <

(m∑i=1

p∗i

)v∗ = v∗,

Page 104: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 101

[SEC. 4.4: EQUILIBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE101

o que e uma contradicao. Um argumento analogo pode ser usadopara provar 4.6. Note que 4.5 e 4.6 nada mais sao do que as condicoesestabelecidas no Corolario 4.1 na pagina 80 para o caso particular dejogos de soma zero.

4.4 Equilıbrio de Nash via um problemade complementaridade

4.4.1 Jogos bimatriciais

Sejam u1(p, q) = pTAq e u2(p, q) = pTBq sao, respectivamente,as funcoes utilidade dos jogadores 1 e 2. Sem perda de generalidade,podemos assumir que A > 0 e B > 0 pois, caso contrario, bastasubstituir A por A + c 1 e B por B + c 1 para alguma constantec > 0 suficientemente grande. Observe agora que (p∗, q∗) ∈ Δ =Δm ×Δn e um equilıbrio de Nash em estrategias mistas do jogo se,e somente se, p∗ e q∗ satisfazem os seguintes programas lineares, umdependendo do outro:

maximizar (Aq∗)Tpsujeito a �

Tmp = 1,p ≥ 0,

maximizar (BTp∗)Tqsujeito a �

Tnq = 1,q ≥ 0,

onde �m e �n sao, respectivamente, matrizes de tamanhom×1 e n×1com todas as entradas iguais a 1. Os problemas duais destes dois PLssao dados por:

minimizar λsujeito a �mλ ≥ Aq∗,

minimizar μsujeito a �nμ ≥ BTp∗.

Se λ∗ e a solucao otima do primeiro problema dual, entao pelo teo-rema forte da dualidade, vale que (Aq∗)Tp∗ = λ∗. Mas (Aq∗)Tp∗ =q∗TATp∗ = p∗TAq∗ e λ∗ = (p∗

�m)λ∗. Assim, p∗TAq∗ = (p∗�m)λ∗

ou, equivalentemente,

p∗T (�mλ∗ −Aq∗) = 0. (4.7)

Page 105: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 102

102 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Esta condicao diz que p∗ e �mλ∗−Aq∗ sao ortogonais. Dado que estesvetores sao nao-negativos, eles tem que ser complementares, no sen-tido que eles nao podem ter componentes positivas na mesma posicao.Esta caracterizacao de um par primal-dual otimo e conhecida comofolgas complementares em programacao linear. Dado que p∗ e umadistribuicao de probabilidades, pelo menos uma de suas componen-tes e positiva, de modo que a respectiva componente de �mλ∗ −Aq∗

e zero e λ∗ e a maior das entradas de Aq∗. Qualquer estrategiapura i do jogador 1 e uma melhor resposta a q∗ se, e somente se,a i-esima componente de �mλ∗ − Aq∗ e igual a zero. Desta forma,a Equacao 4.7 obtem o Corolario 4.1 na pagina 80: uma estrategiamista p∗ e uma melhor resposta para q∗ se, e somente se, ela da pro-babilidade positiva apenas para as estrategias puras que sao melhoresrespostas para q∗. Analogamente, se μ∗ e a solucao otima do segundoproblema dual, entao

q∗T (�nμ∗ −BTp∗) = 0. (4.8)

Teorema 4.9 O perfil de estrategias mistas (p∗, q∗) e umequilıbrio de Nash se, e somente se, existem numeros reais λ∗

e μ∗ tais que

�Tmp∗ = 1,

�Tnq

∗ = 1,�mλ∗ − Aq∗ ≥ 0,

�nμ∗ − BTp∗ ≥ 0,

p∗, q∗ ≥ 0,

(4.9)

e as Equacoes 4.7 e 4.7 sejam satisfeitas.

Dado um vetor t ∈ Rn e uma matriz M de tamanho n × n, oproblema de complementaridade linear (PCL) associado ao par (t,M)consiste em encontrar z,w ∈ Rn tais que

w+Mz = t, w ≥ 0, z ≥ 0 e zTw = 0.

Veremos agora como caracterizar os equilıbrios de Nash em estra-tegias mistas de jogos bimatriciais (jogos finitos com apenas dois

Page 106: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 103

[SEC. 4.4: EQUILIBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE103

jogadores) atraves de um problema de complementaridade linear.Se (p∗, q∗) e um equilıbrio de Nash do jogo, entao

u1(p∗, q∗) = p∗TAq∗ ≥ pTAq∗ = u1(p, q

∗), ∀p ∈ Δm.

Mas, por linearidade, p∗TAq∗ ≥ pTAq∗ para todo p ∈ Δm se, esomente se, p∗TAq∗ ≥ eTi Aq

∗, ∀i = 1, . . . ,m, onde ei representao i-esimo vetor da base canonica. Mas, entao,

(p∗TAq∗)�m ≥ (eTi Aq∗)�m = �m(eTi Aq

∗) = (�meTi )(Aq∗) = Aq∗.

Analogamente, como

u2(p∗, q∗) = p∗TBq∗ ≥ p∗TBq = u2(p

∗, q), ∀q ∈ Δn,

segue-se que p∗TBq∗ ≥ p∗TBej = eTj BTp∗, ∀j = 1, . . . , n e, por-

tanto,

(p∗TBq∗)�n ≥ (eTj BTp∗)�m =

�m(eTj BTp∗) = (�meTj )(B

Tp∗) = BTp∗.

Desta maneira, (p∗, q∗) e um equilıbrio de Nash se, e somente se,

(p∗TAq∗)�m ≥ Aq∗ e (p∗TBq∗)�n ≥ BTp∗. (4.10)

Como A e B possuem todas as entradas positivas, segue-se que osnumeros p∗TAq∗ e p∗TBq∗ sao positivos. Sejam entao

x∗ =p∗

p∗TBq∗e y∗ =

q∗

p∗TAq∗.

Introduzindoas variaveis de folgaw∗ = (u∗, v∗), vemos que se (p∗, q∗)e um equilıbrio de Nash, entao z∗ = (x∗, y∗) e w∗ constituem umasolucao do problema de complementaridade linear

w+Mz = t, w ≥ 0, z ≥ 0 e zTw = 0,

onde

t =

[�m

�n

]e M =

[0 ABT 0

].

Page 107: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 104

104 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Reciprocamente, se z∗ = (x∗, y∗) e w∗ = (u∗, v∗) constituem umasolucao do problema de complementaridade linear acima, entao

p∗ =x∗

�Tmx∗

e q∗ =y∗

�Tny

constituem um equilıbrio de Nash do jogo bimatricial.

Alem de programacao linear, programacao quadratica e teoria dosjogos, aplicacoes do problema de complementaridade linear incluemo estudo de modelos financeiros, a analise nao-linear de certas estru-turas elasto-plasticas e muitas outras areas ([64]).

4.4.2 O algoritmo de Lemke-Howson

Um dos metodos mais importantes para se encontrar uma solucaode um PCL e o algoritmo de Lemke-Howson. Ele foi apresentado noartigo [49] em 1964. Muito mais do que um metodo de calculo deequilıbrios de jogos bimatriciais, o algoritmo de Lemke-Howson dauma prova algebrica construtiva para a existencia de equilıbrios, alemde estabelecer que, genericamente, o numero de equilıbrios de Nash efinito e ımpar. Sendo similar ao algoritmo Simplex para programacaolinear, sua complexidade e exponencial ([84]). Alem do artigo origi-nal, o leitor interessado em mais detalhes do algoritmo pode consultara referencia [87].

4.5 Gambit

Desenvolvido por Richard D. McKelvey (California Institute ofTechnology), Andrew M. McLennan (University of Minnesota) e The-odore L. Turocy (Texas A&M University), Gambit e um programa decomputador, gratuito e multiplataforma, orientado para a construcaoe analise de jogos finitos. Ele oferece uma interface grafica intuitivapara o calculo de equilıbrios de Nash e a analise das estruturas dedominancia das estrategias do jogo. Para baixa-lo, acesse o endereco:

http://econweb.tamu.edu/gambit.

Page 108: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 105

[SEC. 4.5: GAMBIT 105

Figura 4.9: Gambit eliminando as estrategias fracamente domina-das do Jogo da Segunda Gerra Mundial descrito noExercıcio 6 na pagina 54.

Page 109: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 106

106 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Observacao. A equipe do Gambit recentemente desenvolveu umaversao on-line do software que esta disponıvel no endereco: http:

//gte.csc.liv.ac.uk/gte/builder/ (e preciso habilitar o uso dejanelas pop-up).

4.6 Exercıcios

[01] Calcule os pontos de sela da matriz

A =

⎡⎢⎢⎣24 23 22 2510 22 20 1927 25 22 2320 28 16 15

⎤⎥⎥⎦ .

[02] Como no Exemplo 4.8, escreva os problemas primal e dual dojogo de comparar moedas (Exemplo 2.6, pagina 22). Resolvaestes problemas de otimizacao para encontrar o equilıbrio deNash em estrategias mistas do jogo.

[03] Mostre como encontrar pelo menos um equilıbrio de Nash deum jogo de soma zero 2× 2 geral.

[04] Encontre pelo menos um equilıbrio de Nash em estrategias mis-tas do jogo de soma zero definido pela matriz

A =

[ −1 +5 +1 −2+1 −3 −2 +5

].

[05] Sejam p∗ ∈ Δm e q∗ ∈ Δn duas estrategias mistas de um jogode soma zero com dois jogadores. Mostre que se o mınimo dosganhos medios do jogador linha usando p∗ e igual ao maximodas perdas medias do jogador coluna usando q∗, isto e, se

min1≤l≤n

ul(p∗, el) = max

1≤k≤m(−uc(ek, q

∗)),

entao (p∗, q∗) e um equilıbrio de Nash do jogo. Aqui ek re-presenta o k-esimo vetor da base canonica de Rm e el o l-esimo vetor da base canonica de Rn. Use este resultado para

Page 110: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 107

[SEC. 4.6: EXERCICIOS 107

mostrar que as estrategias mistas p∗ = (6/37, 20/37, 0, 11/37)e q∗ = (14/37, 4/37, 0, 19/37, 0) constituem um equilıbrio deNash do jogo de soma zero definido pela matriz

A =

⎡⎢⎢⎣5 8 3 1 64 2 6 3 52 4 6 4 11 3 2 5 3

⎤⎥⎥⎦ .

[06] (Jogos de quadrados magicos) Um quadrado magico e umamatriz quadrada n × n cujas entradas sao constituıdas pelosnumeros 1, 2, . . . , n2, arranjados de tal forma que a soma dasn entradas em qualquer linha, coluna ou diagonal principal esempre o mesmo numero. Mostre como encontrar pelo menosum equilıbrio de Nash em estrategias mistas de um jogo de somazero cuja matriz e um quadrado magico. Aplique a tecnica paraa matriz

A =

⎡⎢⎢⎣16 3 2 135 10 11 89 6 7 124 15 14 1

⎤⎥⎥⎦ .

Este quadrado magico aparece na gravura Melencolia I de Al-brecht Durer:

http://en.wikipedia.org/wiki/Melancholia_I.

[07] Considere um jogo de soma zero definido por uma matriz Ainversıvel que possui um equilıbrio de Nash (p∗, q∗) totalmentemisto (isto e, 0 < p∗i , q

∗j < 1 para todo i, j ∈ {1, . . . , n}). Mostre

que

p∗ =�TA−1

�TA−1�e q∗ =

A−1�

�TA−1�,

onde � =[1 · · · 1

]T.

Page 111: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 108

Capıtulo 5

Jogos na forma extensa

A forma normal de um jogo e usada em situacoes onde os jogado-res escolhem sua estrategia simultaneamente ou o fazem sem conhecera estrategia dos outros jogadores. Contudo, existem situacoes em queos jogadores tomam suas decisoes de forma sequencial, depois de ob-servar a acao que um outro jogador realizou. A forma extensa temuma estrutura mais adequada para analisar jogos desta natureza, es-pecificando assim quem se move, quando, com qual informacao e oganho de cada jogador. Ela contem toda informacao sobre um jogo.Existem varias formas de se representar um jogo da forma extensa, to-das elas tentando formalizar a ideia de arvore. Entre elas: (1) relacoesde ordem, (2) teoria de grafos ([41]) e (3) alfabetos ([27]). Nossa abor-dagem aqui sera mais informal. Trataremos dos jogos sequencias deinformacao perfeita: os ganhos sao de conhecimento comum de todosos jogadores, um unico jogador faz um movimento por vez e cadajogador conhece as escolhas dos jogadores que o antecederam todavez que for jogar.

5.1 Definicao

Um jogo na forma extensa (tambem denominado jogo sequencial)e aquele em que os jogadores realizam seus movimentos em uma or-dem predeterminada. Por este motivo, uma maneira muito adequada

108

Page 112: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 109

[SEC. 5.1: DEFINICAO 109

de se representar um jogo na forma extensa e atraves de uma arvore.Por exemplo, na Figura 5.1, o jogador 1 joga primeiro: ele pode es-colher entre as acoes a e b. Depois, e a vez do jogador 2 jogar. Se 1jogou a, entao 2 pode escolher entre c ou d e, se 1 jogou b, entao 2 podeescolher entre e e f . Depois que todos jogadores realizaram (sequen-cialmente) suas acoes, cada jogador recebe o seu ganho. A convencaoe que a primeira coordenada do vetor de payoffs represente o ganhode quem jogou em primeiro lugar, a segunda coordenada representeo ganho de quem jogou em segundo lugar, e assim por diante.

1

a

2c

d

b

2e

f

2, 4

1, 0

6,12

9,

(

(

(

(

)

)

)

){1

Figura 5.1: Um jogo na forma extensa.

Uma arvore e composta por nos e ramos. Os ramos representamas acoes dos jogadores. No jogo da Figura 5.1 existem 6 ramos: a, b,c, d, e e f . Alguns sao do jogador 1 (a e b), enquanto que outros saodo jogador 2 (c, d, e e f). Os nos sao de dois tipos: existem aquelesque emanam ramos e existem aqueles que nao. Estes ultimos sao asfolhas da arvore e neles estao os valores dos payoffs dos jogadores.Um no que nao e uma folha identifica o jogador que deve escolheruma das acoes representadas pelos ramos que saem do no. Nos quenao sao folhas sao denominados nos de decisao. Por exemplo, noprimeiro no (tambem denominado raiz da arvore) o jogador 1 quedeve fazer a sua escolha entre os ramos (acoes) a e b.

Uma estrategia de um jogador e um plano de acao completo queespecifica uma acao factıvel deste jogador em cada no de decisaoem que o jogador pode atuar. No jogo da Figura 5.1, o jogador 1tem apenas um no de decisao. Por este motivo, suas estrategias se

Page 113: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 110

110 [CAP. 5: JOGOS NA FORMA EXTENSA

confundem com suas acoes:

S1 = {a, b}.Por outro lado, o jogador 2 tem dois nos de decisao: um que se seguedepois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b.Por este motivo, cada estrategia do jogador 2 deve conter duas acoes:uma para o primeiro no e a outra para o outro no. Assim, umaestrategia possıvel para o jogador 2 e “jogar c se o jogador 1 jogar ae jogar f se o jogador 1 jogar b”. Outra e “jogar c se o jogador 1jogar a e jogar e se o jogador 1 jogar b”. Escrevendo apenas as acoesque o jogador 2 pode tomar em cada no de decisao, o conjunto desuas estrategias pode ser entao representado da seguinte maneira:

S2 = {(c, e), (c, f), (d, e), (d, f)}.E muito importante notar a diferenca entre acoes e estrategias. Nestecontexto, (c, e) e uma estrategia do jogador 2, enquanto que c e e saoacoes (uma para cada no de decisao do jogador). Uma acao e umconceito local: ela representa o comportamento do jogador em ummomento particular do jogo, isto e, em um no de decisao. Umaestrategia e um conceito global: ela especifica o comportamento dojogador no jogo inteiro, isto e, em todos os nos de decisao do jogador.Mais exemplos: no jogo da Figura 5.2,

S1 = {a, b}, S2 = {(c, e), (c, f), (c, g), (d, e), (d, f), (d, g)}e, no jogo da Figura 5.3,

S1 = {(a, l, p), (a, l, q), (a,m, p), (a,m, q),

(b, l, p), (b, l, q), (b,m, p), (b,m, q)}e

S2 = {(c, e), (c, f), (d, e), (d, f)}.

5.2 Equilıbrio de Nash

A definicao de equilıbrio de Nash para jogos sequenciais e a mesmadada para jogos na forma normal: se Si e o conjunto de estrategias

Page 114: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 111

[SEC. 5.2: EQUILIBRIO DE NASH 111

1

a

2 c

d

b

2

e

f

g

2, 4

1, 0

6,12

9,

(

(

(

(

)

)

8, 9( )

)

){1

Figura 5.2: Um jogo na forma extensa.

1

2 c

a

b

d

2e

1 l

m

f1 p

q

2, 4

1,10

(

(

)

)

5, 4( )

2, 3( )

1, 4( )

5, 0( )

®

¯

°

±

²

Figura 5.3: Um jogo na forma extensa.

Page 115: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 112

112 [CAP. 5: JOGOS NA FORMA EXTENSA

do jogador i, 1 ≤ i ≤ n, entao um perfil de estrategias

s∗ = (s∗1, . . . , s∗i , . . . , s

∗n) ∈ S1 × · · · × Si × · · · × Sn

e um equilıbrio de Nash (em estrategias puras) se

ui(s∗i , s

∗−i) ≥ ui(siji , s

∗−i)

para todo i = 1, . . . , n e para todo ji = 1, . . . ,mi, com mi o numerode estrategias do jogador i. A caracterizacao via funcoes de melhorresposta tambem pode ser usada: s∗ = (s∗1, . . . , s

∗i , . . . , s

∗n) ∈ S e um

equilıbrio de Nash em estrategias se, e somente se, s∗i ∈ MRi(s∗−i)

para todo i = 1, . . . , n, onde MRi(s−i) = argmaxsi∈Siui(si, s−i).

No jogo da Figura 5.4, temos que

S1 = {a, b}, S2 = {(c, e), (c, f), (d, e), (d, f)}

Assim, existem 8 perfis de estrategias:

S = S1 × S2 = {(a, (c, e)), (a, (c, f)), (a, (d, e)), (a, (d, f)),(b, (c, e)), (b, (c, f)), (b, (d, e)), (b, (d, f))}.

1

a

2c

d

b

2e

f

2, 4

1, 9

5, 0

5,

(

(

(

(

)

)

)

)4

Figura 5.4: Calculando equilıbrios de Nash em um jogo sequencial.

Vamos mostrar que o perfil (a, (c, f)) nao e um equilıbrio de Nashdo jogo. Inicialmente, observe que, para calcular o ganho dos joga-dores associado a um determinado perfil de estrategias, basta seguir

Page 116: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 113

[SEC. 5.2: EQUILIBRIO DE NASH 113

o caminho de execucao do jogo. Por exemplo, para o perfil de es-trategia (a, (c, f)), a execucao do jogo se da da seguinte maneira:o jogador 1 escolhe a acao a e, em seguida, o jogador 2 escolhe aacao c, o que resulta no ganho 2 para o jogador 1 (Figura 5.5). Ja,para o perfil de estrategia (b, (c, f)), o jogador 1 escolhe a acao ae o jogador 2 escolhe a acao f , dando o ganho 5 para o jogador 1(Figura 5.6).

1

a

2c

d

b

2e

f

2, 4

1, 9

5, 0

5,

(

(

(

(

)

)

)

)4

Figura 5.5: Caminho de execucao associado ao perfil de estrate-gias (a, (c, f)).

1

a

2c

d

b

2e

f

2, 4

1, 9

5, 0

5,

(

(

(

(

)

)

)

)4

Figura 5.6: Caminho de execucao associado ao perfil de estrate-gias (b, (c, f)).

Desta maneira, se o jogador 2 mantiver a sua estrategia (c, f), ojogador 1 ganhara mais trocando sua estrategia a pela estrategia b:

u1(a, (c, f)) = 2 < 5 = u1(b, (c, f)).

Page 117: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 114

114 [CAP. 5: JOGOS NA FORMA EXTENSA

Isto mostra que (a, (c, f)) nao e um equilıbrio de Nash. O per-fil (b, (c, f)), por sua vez, e um equilıbrio de Nash, pois

u1(b, (c, f)) = 5 > 2 = u1(a, (c, f))

eu2(b, (c, f)) = 4 > 0 = u2(b, (c, e)),u2(b, (c, f)) = 4 > 0 = u2(b, (d, e)),u2(b, (c, f)) = 4 ≥ 4 = u2(b, (d, f)).

O jogo possui mais um equilıbrio de Nash: o perfil (b, (c, f)).

5.3 Inducao retroativa e equilıbrio per-feito em subjogos

A inducao retroativa e um processo que produz um perfil de es-trategias com a propriedade de que se cada jogador seguir as reco-mendacoes de acoes estabelecidas pelo perfil, entao suas estrategiasserao otimas em cada no de decisao onde o jogador pode atuar.

O algoritmo e simples. Comecando pelos nos de decisao finais,determinamos as melhores acoes disponıveis para os jogadores quevao atuar nestes nos. Isto e facil de se fazer, ja que nao existemoutros nos de decisao que sucedem os nos em questao: basta, emcada no de decisao final, escolher a acao que de ao jogador do noo maior payoff possıvel. Se existe um empate entre duas acoes quelevam ao maior payoff, escolhemos uma delas arbitrariamente. Feitoisto, as acoes escolhidas sao marcadas e, as demais, ignoradas. Esteprocesso agora e repetido para os penultimos nos de decisao, para osantepenultimos, etc., ate que a raiz da arvore seja alcancada.

Por exemplo, no jogo sequencial da Figura 5.3, os ultimos nos dedecisao sao β, δ e ε. Assim, no passo 1 da inducao retroativa, o joga-dor 2 marca a acao d no no β e o jogador 1 marca as acoes l e p nosnos δ e ε, respectivamente (Figura 5.7). No passo 2, o jogador 2 marcaa acao e no no γ (Figura 5.8). Finalmente, no passo 3, o jogador 1marca a acao b (Figura 5.9). O perfil de estrategias obtido e

((b, l, p), (d, e)).

Page 118: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 115

[SEC. 5.3: INDUCAO RETROATIVA E EQUILIBRIO PERFEITO EM SUBJOGOS 115

1

2 c

a

b

d

2e

1 l

m

f1 p

q

2, 4

1,10

(

(

)

)

5, 4( )

2, 3( )

1, 4( )

5, 0( )

®

¯

°

±

²

Figura 5.7: Inducao retroativa: passo 1.

1

2 c

a

b

d

2e

1 l

m

f1 p

q

2, 4

1,10

(

(

)

)

5, 4( )

2, 3( )

1, 4( )

5, 0( )

®

¯

°

±

²

Figura 5.8: Inducao retroativa: passo 2.

Page 119: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 116

116 [CAP. 5: JOGOS NA FORMA EXTENSA

1

®

2

¯

c

a

b

d

2

°

e

1

±

l

m

f1

²

p

q

2, 4

1,10

(

(

)

)

5, 4( )

2, 3( )

1, 4( )

5, 0( )

Figura 5.9: Inducao retroativa: passo 3.

O processo de inducao retroativa da, portanto, um algoritmo paraencontrar um equilıbrio de Nash em estrategias puras de um jogosequencial com informacao perfeita. Note, contudo, que nem todoequilıbrio de Nash pode ser obtido por inducao retroativa. O perfilde estrategias (b, d) do jogo da Figura 5.10 e um equilıbrio de Nashque nao e obtido por inducao retroativa.

1

a

2c

d

b

2, 1

0, 0

(

(

)

)

1, 2( )

Figura 5.10: (b, d) e um equilıbrio de Nash que nao e obtido porinducao retroativa.

Seja α um dos nos de decisao de um jogo G. O subjogo quecomeca em α e o jogo obtido copiando-se todos os nos de decisao,ramos e payoffs do jogo original que sucedem α. Por exemplo, nojogo da Figura 5.3, o subjogo que comeca no de decisao γ, e o jogo

Page 120: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 117

[SEC. 5.3: INDUCAO RETROATIVA E EQUILIBRIO PERFEITO EM SUBJOGOS 117

da Figura 5.11.

2e

1 l

m

f1 p

q

5, 4( )

2, 3( )

1, 4( )

5, 0( )°

±

²

Figura 5.11: Subjogo que comeca no no γ do jogo da Figura 5.3.

Dizemos que um perfil de estrategias (puras) s∗ e um equilıbrioperfeito em subjogos de um jogo sequencial G se os respectivos sub-perfis de s∗ sao equilıbrios de Nash de cada subjogo de G. Comoveremos, este equilıbrio idealizado por Reinhard Selten, tem forte co-nexao com o processo de inducao retroativa. De fato: considere, porexemplo, o jogo da Figura 5.3. Se

s∗ = ((aα, aδ, aε), (aβ , aγ))

e um equilıbrio perfeito em subjogos deste jogo, entao (aδ) e (aε)devem ser equilıbrios de Nash dos subjogos que comecam nos nos δe ε, respectivamente. Mas, neste caso, aδ e aε devem ser acoes quemaximizem o ganho do jogador 1 nestes nos. Sendo assim, concluımosque aδ = l e aε = p ou aε = q. Tomemos aε = p. Do mesmo modo,como (aβ) deve ser um equilıbrio de Nash do subjogo que comeca nono β, vemos que o jogador 2 escolhera aβ = d. Entao, nesta primeiraiteracao, ja podemos afirmar que

s∗ = ((aα, l, p), (d, aγ)).

Agora, se aγ = e, o jogador 2 ganhara 3 (ja que o jogador 1 escolhe lneste caso) e, se aγ = f , o jogador 2 ganhara 0 (ja que o jogador 1escolhe p neste caso). Como (aγ , (l, p)) deve ser um equilıbrio deNash do subjogo que comeca no no γ, segue-se que, obrigatoriamente,aγ = e. Assim, apos a segunda iteracao, vale que

s∗ = ((aα, l, p), (d, e)).

Page 121: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 118

118 [CAP. 5: JOGOS NA FORMA EXTENSA

Como as acoes nos nos β, γ, δ e ε ja estao agora todas determinadas,e facil de ver que se s∗ = ((aα, l, p), (d, e)) e um equilıbrio de Nash dojogo original, entao aα = b. Assim, o equilıbrio perfeito em subjogos e

s∗ = ((b, l, p), (d, e)).

Note que a imposicao de que os respectivos subperfis de s∗ sejamequilıbrios de Nash de cada subjogo de G induz a mesma selecao deacoes que seria feita no processo de inducao retroativa. E por estemotivo que os equilıbrios perfeitos em subjogos coincidem com osequilıbrios obtidos por inducao retroativa.

5.4 O teorema de Kuhn-Zermelo

Teorema 5.1 (Kuhn-Zermelo) Todo jogo sequencial de in-formacao perfeita possui pelo menos um equilıbrio de Nash emestrategias puras.

Ideia da prova. A demonstracao e feita por inducao. Se o jogo possuiapenas um unico no de decisao, entao o teorema e verdadeiro: o jo-gador que age neste no escolhe uma acao que maximiza o seu payoff.Os outros jogadores, se existirem, tem espacos de estrategias vazios.Suponha entao que todo jogo com menos do que m > 1 nos de de-cisao possua pelo menos um equilıbrio de Nash. Escolhendo um no dedecisao β que sucede imediatamente a raiz α da arvore do jogo, cria-remos dois jogos. O primeiro e o subjogo Gβ que comeca em β. Pelahipotese de inducao, Gβ possui pelo menos um equilıbrio de Nash s∗β .O segundo jogo, G−β , e construıdo da seguinte maneira: removemosde G o subjogo Gβ e no β, que antes era de decisao, criamos umafolha cujos payoffs sao dados pelos payoffs associados ao equilıbrio s∗βde Gβ . Novamente, pela hipotese de inducao, G−β possui pelo me-nos um equilıbrio de Nash s∗−β . Se a acao em s∗−β nao usa o ramo aque liga α a β em G−β , entao s∗−β e um equilıbrio de Nash do jogooriginal G. Por outro lado, se s∗−β usa o ramo a, entao (a, s∗β) e umequilıbrio de Nash do jogo original G.

Page 122: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 119

[SEC. 5.5: EXERCICIOS 119

5.5 Exercıcios

[01] (Jogo da centopeia) Use inducao retroativa para obter umequilıbrio de Nash do jogo sequencial da figura abaixo. Oequilıbrio e Pareto eficiente?

1 2 21

(4, 1) (2, 8) (16, 4) (8, 32)

(64, 16)Continuar Continuar Continuar Continuar

Parar

Parar

Parar

Parar

.

Este jogo foi desenvolvido pelo economista RobertW. Rosenthal,mas o seu nome e devido a Kenneth Binmore.

[02] (Jogo da confianca) Use inducao retroativa para obter umequilıbrio de Nash do jogo sequencial da figura abaixo. O equi-lıbrio e Pareto eficiente?

1

2

(0, 0)

( 1, 1)

({1, 2)

confiar

não confiar

trair

honrar

.

Page 123: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 120

Capıtulo 6

Exemplos

6.1 O jogo Le Her simplificado

Nesta secao estudaremos a versao simplificada do jogo Le Her,como apresentada por Benjamim e Goldman em [05]. Dois jogadoresempregam um pacote de 13 cartas do mesmo naipe (A, 2, . . . , 10,Q, J e K). Apos um sistema de distribuicao e troca de cartas quedescreveremos a seguir, o vencedor e aquele com a maior carta (A <2 < · · · < 10 < Q < J < K).

Inicialmente, o jogador 1 embaralha as 13 cartas e distribui umacarta X para si, uma carta Y para o jogador 2 e deixa o restantedas cartas em um monte Z, sem que nenhum dos dois jogadoresveja as cartas. Feito isto, cada jogador ve sua carta, mas nao asoutras. O jogador 1 deve entao decidir se mantem a sua carta oua troca com o jogador 2 (que nao pode se negar a fazer a troca).No primeiro caso, e a vez do jogador 2 decidir se ele mantem a suacarta (a unica que ele conhece ate o momento) ou se ele faz a trocacom a primeira carta do monte Z. Depois que o jogador 2 faz a suaescolha, os jogadores mostram as suas cartas e vence aquele com amaior carta. No segundo caso, os dois jogadores conhecem os valoresdas duas cartas X e Y e o jogador 2 nao tem escolha alguma: se,depois da troca, a sua carta for menor do que a carta do jogador 1,entao ele deve obrigatoriamente troca-la com a carta do monte Zna esperanca de obter uma carta maior para vencer o jogo, caso

120

Page 124: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 121

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 121

contrario, ele mantem a sua carta e vence o jogo. O leitor interessadopode se familiarizar com as regras do jogo atuando como o jogador 2no applet Java disponıvel no endereco:

http://www.professores.uff.br/hjbortol/arquivo/2007.1/

applets/leher1_br.html.

Quais sao as estrategias puras do jogador 1? Cada estrategia puracorresponde a uma escolha de um subconjunto formado pelas cartasque ele ira manter na primeira etapa do jogo. Por exemplo, a escolhado subconjunto {5, 7, 9} corresponde a estrategia pura do jogador 1em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Destamaneira, existem tantas estrategias puras quantos subconjuntos doconjunto

D = {A, 2, 3, 4, 5, 6, 7, 8, 9, 10,Q, J,K},isto e, existem um total de 213 = 8192 estrategias puras para o joga-dor 1. O mesmo vale para o jogador 2: ele tem 213 estrategias purasque estao em correspondencia biunıvoca com os 213 subconjuntos

Page 125: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 122

122 [CAP. 6: EXEMPLOS

distintos de D, cada um especificando quais cartas o jogador 2 iramanter. E importante observar mais uma vez que o jogador 2 so fazuma escolha (a de manter a sua carta Y ou troca-la com uma cartado monte Z) quando o jogador 1 decide por manter a sua carta X .Se o jogador 1 resolve trocar de cartas, a acao do jogador 2 esta com-pletamente determinada pelos valores das cartas X e Y (supondo,naturalmente, que o jogador 2 seja racional).

A matriz de payoffs do jogo tem, portanto, dimensao 213 × 213.Este tamanho pode ser reduzido consideravelmente observando queestrategias puras “com saltos” sao dominadas por aquelas “sem sal-tos”. Por exemplo, a estrategia pura

{5, 7, 9}(manter apenas as cartas 5, 7 e 9) e dominada pela estrategia pura

{5, 6, 7, 8, 9, 10,Q, J,K}(manter apenas as cartas maiores do que ou iguais a 5). Assim, aoinves de considerar todos os 213 subconjuntos de D, podemos nosrestringir aos 13 subconjuntos da forma {C ∈ D | C ≥ C}, onde

C ∈ D. No que se segue, usaremos o seguinte abuso de notacao

A = {A, 2, 3, 4, 5, 6, 7, 9, 9, 10,Q, J,K},2 = {2, 3, 4, 5, 6, 7, 9, 9, 10,Q, J,K},

3 = {3, 4, 5, 6, 7, 9, 9, 10,Q, J,K}, . . .para representar estas estrategias puras dominantes de cada jogador.

O ganho do jogador 1 e sua probabilidade de vitoria que, eviden-temente, depende das estrategias puras (dominantes) escolhidas pelosdois jogadores. Atraves de calculos com probabilidades condicionais(como em [05]) ou atraves de uma enumeracao direta (veja o ap-plet Java disponıvel no endereco http://www.professores.uff.br/hjbortol/arquivo/2007.1/applets/leher2_br.html), obtemos amatriz de payoffs apresentada na tabela 6.1, onde as probabilidadesforam calculadas com 3 casas decimais corretas. Como o jogo e desoma zero (isto e, um jogador vence se, e somente se, o outro perde),a matriz de payoffs do jogador 2 e a matriz de payofffs do jogador 1multiplicada por −1.

Page 126: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 123

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 123

jogador2

A2

34

56

78

910

QJ

K

jogador1

A0.500

0.462

0.429

0.404

0.385

0.372

0.365

0.365

0.372

0.385

0.404

0.429

0.462

20.538

0.500

0.468

0.442

0.423

0.410

0.404

0.404

0.410

0.423

0.442

0.468

0.500

30.571

0.538

0.506

0.480

0.460

0.447

0.440

0.439

0.445

0.457

0.476

0.501

0.533

40.596

0.569

0.543

0.517

0.496

0.481

0.473

0.471

0.476

0.487

0.505

0.529

0.559

50.613

0.592

0.571

0.550

0.529

0.513

0.503

0.499

0.502

0.512

0.527

0.550

0.578

60.622

0.606

0.590

0.573

0.557

0.541

0.529

0.523

0.523

0.530

0.544

0.564

0.590

70.623

0.611

0.598

0.586

0.574

0.562

0.550

0.541

0.538

0.543

0.553

0.570

0.593

80.614

0.605

0.597

0.588

0.579

0.571

0.562

0.553

0.547

0.548

0.555

0.568

0.588

90.596

0.590

0.584

0.578

0.572

0.566

0.561

0.555

0.549

0.545

0.548

0.558

0.573

10

0.566

0.563

0.559

0.556

0.552

0.549

0.545

0.542

0.538

0.535

0.533

0.538

0.549

Q0.526

0.524

0.523

0.521

0.519

0.517

0.516

0.514

0.512

0.510

0.509

0.508

0.514

J0.474

0.474

0.473

0.473

0.472

0.471

0.471

0.470

0.470

0.469

0.469

0.468

0.468

K0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

0.410

Tabela6.1:Matriz

depayoffsdojogador1para

ojogoLeHer.

Page 127: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 124

124 [CAP. 6: EXEMPLOS

jogador2

A2

34

56

78

910

QJ

K

jogador 1

70.623

0.611

0.598

0.586

0.574

0.562

0.550

0.541

0.538

0.543

0.553

0.570

0.593

80.614

0.605

0.597

0.588

0.579

0.571

0.562

0.553

0.547

0.548

0.555

0.568

0.588

90.596

0.590

0.584

0.578

0.572

0.566

0.561

0.555

0.549

0.545

0.548

0.558

0.573

Tabela

6.2:Matriz

depayoffsdojogador1para

ojogoLeHer

aposmaisumaelim

inacaodeestra

tegias

estritamente

dominadas.

Page 128: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 125

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 125

Vamos usar dominancia para simplificar ainda mais a matriz dojogo. Observe que as estrategias 7 e 9 do jogador 1 dominam, respec-tivamente, as estrategias de A a 6 e de 10 a K (isto e, o jogador 1deve sempre trocar cartas ≤ 6 e deve sempre manter cartas ≥ 10).Eliminando-se entao as linhas estritamente dominadas, obtemos amatriz da tabela 6.2. Para esta matriz reduzida, as estrategias 9e 10 do jogador 2 dominam, respectivamente, as estrategias de A a 8e de Q a K (isto e, o jogador 2 deve sempre trocar cartas ≤ 8 e devesempre manter as cartas Q, J e K. Eliminando-se entao as colunasestritamente dominadas, obtemos a matriz da tabela 6.3.

jogador 29 10

jogador1 7 0.538 0.543

8 0.547 0.548

9 0.549 0.545

Tabela 6.3: Matriz de payoffs do jogador 1 para o jogo Le Her aposmais uma eliminacao de estrategias estritamente domi-nadas.

Finalmente, vemos que para esta matriz reduzida, a estrategia 8 dojogador 1 domina estritamente a estrategia 7. Eliminando-a, obtemosa matriz 2× 2 da tabela 6.4.

jogador 29 10

jogador1

8 0.547 0.548

9 0.549 0.545

Tabela 6.4: Matriz de payoffs do jogador 1 para o jogo Le Her aposmais uma eliminacao de estrategias estritamente domi-nadas.

Usando-se programacao linear ou funcoes de melhor resposta, po-demos calcular facilmente o equilıbrio de Nash em estrategias mistas

Page 129: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 126

126 [CAP. 6: EXEMPLOS

deste jogo 2× 2:

(p1, p2) = (4/5, 1/5) para o jogador 1

e(q1, q2) = (3/5, 2/5) para o jogador 2.

Os payoffs medios sao, respectivamente, 0.5474 e 0.4526. Vemos,portanto, que o jogador 1 leva vantagem nesta versao simplificadado Le Her supondo, e claro, que ele aja racionalmente seguindo oequilıbrio de Nash.

Observacoes.

1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocarde cartas com o jogador 1 se sua carta forK (a de maior valor). Nocaso de cartas de mesmo valor (mas naipes diferentes), o jogador 2vence. Mesmo na versao original, a probabilidade media de ganhodo jogador 1 e maior do que a do jogador 2 no equilıbrio de Nash.Os detalhes podem ser encontrados nas referencias [25] e [37].

2. O jogo Le Her foi investigado por Pierre Remond de Montmort(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Wal-degrave (1684–1741) que forneceu uma solucao para o jogo usandoo conceito de equilıbrio em estrategias mistas. As referencias [90]e [37] apresentam em detalhes a historia deste jogo, incluindo atroca de correspondencia entre Montmort, Bernoulli e Waldegravee os erros cometidos na solucao apresentada por Bernoulli.

3. Benjamim e Goldman mostram em [05] que, para a versao sim-plificada do Le Her, a reducao da matriz de payoffs para umamatriz 2× 2 ocorre para qualquer baralho com um numero N ≥ 3de cartas de um mesmo naipe.

6.2 O modelo de duopolio de Cournot

Sejam q1 e q2 as quantidades de um produto homogeneo fabricadopor duas empresas 1 e 2, respectivamente. Diz-se que dois produtosfabricados por empresas diferentes sao homogeneos quando os con-sumidores nao percebem diferencas na qualidade dos dois produtos

Page 130: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 127

[SEC. 6.2: O MODELO DE DUOPOLIO DE COURNOT 127

e, assim, eles tomam suas decisoes sobre qual produto comprar con-siderando apenas o preco, independentemente do fabricante. Vamosassumir a situacao de market-clearing, isto e, nao existe excesso dedemanda ou excesso de oferta no mercado. Assim, a quantidade de-mandada do produto e igual a quantidade ofertada do mesmo. Parasimplificar, vamos supor que o preco de mercado e uma funcao linearda quantidade agregada Q = q1 + q2 do produto no mercado. Maisprecisamente,

P (Q) =

{A−Q, se Q < A,0, se Q ≥ A,

=

{A− (q1 + q2), se q1 + q2 < A,0, se q1 + q2 ≥ A.

Aqui, A e o preco maximo aceitavel pelo mercado. Os custos to-tais de producao das empresas 1 e 2 sao dados, respectivamente,por C1(q1) = c · q1 e C2(q2) = c · q2, com c > 0. Vamos supor quec < A. As duas empresas devem escolher simultaneamente as quan-tidades que irao produzir. O ganho de cada empresa e o lucro queela obtem.

Temos entao um jogo infinito com dois jogadores, g1 = Empresa 1,g2 = Empresa 2, S1 = [0,+∞), S2 = [0,+∞) e S = S1 ×S2. As fun-coes de utilidade u1, u2 : S → R sao dadas por

u1(q1, q2) = q1 · P (q1 + q2)− c · q1=

{q1 · [A− (q1 + q2)− c], se q1 + q2 ≤ A,q1 · [−c], se q1 + q2 > A,

=

{q1 · (−q1 + (A− q2 − c)), se q1 + q2 ≤ A,q1 · [−c], se q1 + q2 > A,

u2(q1, q2) = q2 · P (q1 + q2)− c · q2=

{q2 · [A− (q1 + q2)− c], se q1 + q2 ≤ A,q2 · [−c], se q1 + q2 > A,

=

{q2 · (−q2 + (A− q1 − c)), se q1 + q2 ≤ A,q2 · [−c], se q1 + q2 > A.

Desta maneira, as funcoes de melhor resposta das duas empresas saodadas por

MR1(q2) =

{{(A− c− q2)/2}, se q2 ≤ A− c,{0}, se q2 > A− c,

Page 131: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 128

128 [CAP. 6: EXEMPLOS

MR2(q1) =

{{(A− c− q1)/2}, se q1 ≤ A− c,{0}, se q1 > A− c.

Lembrando que (q∗1 , q∗2) e um equilıbrio de Nash em estrategias puras

se, e somente se, q∗2 ∈ MR2(q∗1) e q∗1 ∈ MR1(q

∗2), vemos que (q∗1 , q

∗2)

deve ser solucao do sistema

q∗2 = (A− c− q∗1)/2 e q∗1 = (A− c− q∗2)/2.

Sendo assim, vemos que o unico equilıbrio de Nash em estrategiaspuras do jogo e

(q∗1 , q∗2) =

(A− c

3,A− c

3

). (6.1)

Estes valores tambem podem ser encontrados geometricamente, a-traves dos pontos de intersecao das representacoes graficas das duasfuncoes de melhor resposta (Figura 6.1).

0 (A { c)/2 A { c

(A { c)/2

A { c

q1

(q , q )1* *

2

q2

Figura 6.1: Calculando o equilıbrio de Nash do modelo de duopoliode Cournot.

Page 132: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 129

[SEC. 6.3: O MODELO DE DUOPOLIO DE BERTRAND 129

6.3 O modelo de duopolio de Bertrand

Neste modelo, ao inves de decidir o quanto produzir, as empresasdevem escolher o quanto cobrar pelo produto, isto e, elas entram emuma competicao de precos. Como no modelo de Cournot, estamosassumindo que tudo o que e produzido e consumido. Lembrandoque A e o preco maximo aceitavel pelo mercado, vemos que S1 =S2 = [0, A] e S = S1 × S2 = [0, A]× [0, A]. As funcoes utilidade saodadas por

ui(p1, p2) = pi ·Qi(p1, p2)− c ·Qi(p1, p2) = (pi − c) ·Qi(p1, p2),

onde Qi(p1, p2) representa a producao vendida da empresa i com operfil de precos (p1, p2). Como o produto e homogeneo, podemosassumir que os consumidores comprarao o produto mais barato. Seas duas empresas cobrarem o mesmo preco, vamos assumir que elasdividem igualmente o mercado. Desta maneira,

Qi(p1, p2) =

⎧⎨⎩A− pi, se pi < pj ,(A− pi)/2, se pi = pj ,0, se pi > pj ,

e, portanto,

ui(p1, p2) =

⎧⎨⎩(pi − c) · (A− pi), se pi < pj,(pi − c) · (A− pi)/2, se pi = pj,0, se pi > pj,

onde j �= i = 1, 2.Quais sao os equilıbrios de Nash em estrategias puras deste mo-

delo? Certamente (p∗1, p∗2) = (c, c) e um equilıbrio de Nash pois, neste

caso,

u1(p∗1, p

∗2) = 0 ≥ u1(p1, p

∗2) e u2(p

∗1, p

∗2) = 0 ≥ u2(p

∗1, p2),

para todo p1 ∈ S1 e para todo p2 ∈ S2. Existem outros equilıbrios deNash? A resposta e nao, como podemos concluir a partir dos casosdescritos a seguir.

(a) Se p∗2 < c e p∗1 ≥ p∗2, entao u2(p∗1, p

∗2) < 0 = u2(p

∗1, c). Logo, neste

caso, (p∗1, p∗2) nao e um equilıbrio de Nash do jogo.

Page 133: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 130

130 [CAP. 6: EXEMPLOS

0 c A

c

A

p1

p2

Caso (a)

Caso (e)

Caso (g)

Caso (h)

Caso (c)Cas

o (b

)

Cas

o (f)

Cas

o (

d)

Figura 6.2: Calculando o equilıbrio de Nash do modelo de duopoliode Bertrand analisando os varios casos.

(b) Se p∗1 = p∗2 < c, entao u1(p∗1, p

∗2) < 0 = u1(c, p

∗2). Logo, neste

caso, (p∗1, p∗2) nao e um equilıbrio de Nash do jogo.

(c) Se p∗1 < c e p∗2 ≥ p∗1, entao u1(p∗1, p

∗2) < 0 = u1(c, p

∗2). Logo, neste

caso, (p∗1, p∗2) nao e um equilıbrio de Nash do jogo.

(d) Suponha que p∗1 = c e p∗2 > c. Se p∗2 < A, entao u1(p∗1, p

∗2) = 0 <

u1(p∗2, p

∗2). Se p∗2 = A, entao

u2(p∗1, p

∗2) = 0 < u2(p

∗1, (A+ c)/2).

Note que (A + c)/2 e ponto de maximo da funcao quadraticapi �→ (pi−c) · (A−pi) no intervalo [c, A]. Vemos entao que, nestecaso, (p∗1, p

∗2) tambem nao e um equilıbrio de Nash do jogo.

(e) Suponha que p∗2 > p∗1 > c. Como u2(p∗1, p

∗2) = 0 < u2(p

∗1, p

∗1).

segue-se que (p∗1, p∗2) tambem nao e um equilıbrio de Nash do

jogo.

Page 134: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 131

[SEC. 6.4: O MODELO DE DUOPOLIO DE STACKELBERG 131

( f ) Suponha que p∗2 = p∗1 > c. Se p∗1 = p∗2 ∈ ((A + c)/2, A], entaou1(p

∗1, p

∗2) < u1((A + c)/2, p∗2). Se p∗1 = p∗2 ∈ (c, (A + c)/2], seja

p•1 a solucao da equacao (c−x) · (A−x) = u∗ no intervalo (c, p∗1),onde u∗ = (c− p∗1) · (A− p∗1)/2, isto e, seja

p•1 =A+ c

2−

√c2 +A2 − 2 · p∗1 · A+ 2 · p∗12 − 2 · c · p∗1

2.

Entao u1(p∗1, p

∗2) < u1((p

•1 + p∗1)/2, p

∗2). Vemos entao que, neste

caso, (p∗1, p∗2) tambem nao e um equilıbrio de Nash do jogo.

(g) Suponha que p∗1 > p∗2 > c. Como u1(p∗1, p

∗2) = 0 < u1(p

∗2, p

∗2).

segue-se que (p∗1, p∗2) tambem nao e um equilıbrio de Nash dojogo.

(h) Suponha que p∗2 = c e p∗1 > c. Se p∗1 < A, entao u2(p∗1, p

∗2) = 0 <

u2(p∗1, p

∗1). Se p∗1 = A, entao

u1(p∗1, p

∗2) = 0 < u1((A+ c)/2, p∗2).

Vemos entao que, neste caso, (p∗1, p∗2) tambem nao e um equilıbrio

de Nash do jogo.

Ao contrario do modelo de duopolio de Cournot, as funcoes demelhor resposta nao estao definidas. Por exemplo, se p∗1 = (A+ c)/2,entao nao existe um ponto de maximo da funcao p2 �→ u2(p

∗1, p2),

como mostra a Figura 6.3. Isto acontece por que esta funcao e des-contınua.

6.4 O modelo de duopolio de Stackelberg

O modelo de duopolio de Cournot e um jogo simultaneo, no sen-tido que cada empresa, ao escolher o seu nıvel de producao, nao sabeo nıvel de producao da empresa concorrente. Heinrich von Stackel-berg, em [88], propos um modelo de duopolio onde uma das empresas(a empresa lıder) escolhe sua producao primeiro e a outra empresa(a empresa seguidora) faz a sua escolha de producao depois.

A ordem do jogo e a seguinte: (1) a empresa 1 escolhe uma quan-tidade de producao q1 ≥ 0 e (2) a empresa 2 observa o valor de q1

Page 135: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 132

132 [CAP. 6: EXEMPLOS

0 c A p2

u2

(A+c)/2

Figura 6.3: Grafico da funcao p2 �→ u2((A + c)/2, p2).

e, entao, escolhe a sua quantidade de producao q2 ≥ 0. O ganho decada empresa e o lucro que ela obtem:

u1(q1, q2) = q1 · P (q1 + q2)− c · q1,u2(q1, q2) = q2 · P (q1 + q2)− c · q2,

onde P (Q) = A−Q e o preco de mercado em funcao da quantidadeagregada Q = q1 + q2 e c > 0 e o custo unitario de producao.

Vamos usar inducao retroativa para encontrar um equilıbrio deNash deste jogo sequencial. Primeiro, vamos calcular a acao otimaA2(q1) da empresa 2 em funcao da quantidade de producao q1:

A2(q1) = argmaxq2≥0 u2(q1, q2) = argmaxq2≥0 q2 · [A− q1 − q2 − c] .

Pela regra de Fermat, obtemos que

q2 = A2(q1) =A− q1 − c

2,

Page 136: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 133

[SEC. 6.5: A TRAGEDIA DOS COMUNS 133

desde que q1 < A − c. Prosseguindo retroativamente, vemos que aacao otima A1 da Empresa 1 e dada por

A1 = argmaxq1≥0 u1(q1, A2(q1))

= argmaxq1≥0 q1 · [A− q1 −A2(q1)− c]

= argmaxq1≥0 q1 · [A− q1 − c]/2

e, desta maneira,

q∗1 = A1 =A− c

2e q∗2 = A2(q

∗1) =

A− c

4.

Se a empresa 1 tivesse escolhido a acao sugerida pelo equilıbrio deCournot, q(C)

1 = (A− c)/3, entao a acao otima da empresa 2 tambemseria aquela sugerida pelo equilıbrio de Cournot, q(C)

2 = (A − c)/3.Portanto, usando-se as acoes sugeridas pelo equilıbrio de Cournot nomodelo Stackelberg, temos que Q(C) = q(C)

1 + q(C)

2 = 2 · (A − c)/3,P (Q(C)) = (A+ 2 · c)/3 e

u1(q(C)

1 , q(C)

2 ) = u2(q(C)

1 , q(C)

2 ) =(A− c)2

9.

Por outro lado, usando-se as acoes obtidas por inducao retroativa,vemos que Q∗ = q∗1 + q∗2 = 3 · (A− c)/4, P (Q∗) = (A+ 3 · c)/4 e

u1(q∗1 , q

∗2) =

(A− c)2

8, u2(q

∗1 , q

∗2) =

(A− c)2

16.

Estas expressoes mostram que a producao agregada (a soma dasproducoes) e maior no modelo de Stackelberg do que no modelo deCournot. Elas tambem explicam porque, no modelo de Stackelberg,a empresa 1 nao escolhe a acao sugerida pelo modelo de Cournot: seela o fizer, vai ganhar menos. Vemos tambem que o preco de mercadono modelo de Cournot e maior do que no modelo de Cournot. Assim,no modelo de Stackelberg, a empresa 1 esta ganhando mais porque aempresa 2 esta ganhando bem menos.

6.5 A tragedia dos comuns

O termo “A Tragedia dos Comuns” vem de uma parabola pu-blicada pelo economista polıtico William Forster Lloyd em seu livro

Page 137: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 134

134 [CAP. 6: EXEMPLOS

Two Lectures on the Checks to Population de 1833, que depois foi po-pularizada e estendida por Garret Hardin no seu artigo The Tragedyof the Commons publicado na revista Science em 1968 ([38]).

A palavra “tragedia” tem o significado dado por Alfred NorthWhitehead em seu livro Science and The Modern World : “The es-sence of dramatic tragedy is not unhappiness. It resides in the solem-nity of the remorseless working of things.”. Ja a palavra “comuns”designa uma area de pastagem coletiva, sem dono e sem qualquerregulamentacao, usada por pastores na Idade Media, que cuidavamdo rebanho de ovelhas para obter a la que vendiam para a confeccaode roupas.

Com o crescimento do numero de famılias de camponeses ao longodo tempo, ocorreu um aumento do numero de ovelhas necessariaspara o sustento de cada famılia. Como a area de pastagem era de usocomum, nenhuma famılia tinha incentivo para controlar o numero deovelhas de seu rebanho pois, se o fizesse, outras famılias usariam aspastagens de qualquer forma. Com uma superpopulacao de ovelhas, aterra que antes era fertil, comecou a se exaurir. A reducao da area depastagem afetou tanto o rebanho quanto a industria local de roupas.A parabola mostra, entao, que a imprudencia em administrar umrecurso finito do qual todos se beneficiam pode levar a ruına.

Vamos usar teoria dos jogos para modelar uma versao ingenua datragedia dos comuns. Considere uma aldeia com n pastores e seja oio numero de ovelhas do i-esimo pastor, de modo que o numero totalde ovelhas da aldeia e o = o1 + · · ·+ on. O custo de compra de umaovelha e c, independentemente do numero de ovelhas que o pastorja possui. O benefıcio de um pastor em deixar uma ovelha pastandoe v(o) por ovelha. Como o campo de pastagem e um recurso finito,existe um numero maximo o de ovelhas que ele pode suportar. As-sim, v(o) > 0 se o < o e v(o) = 0 se o ≥ o. Naturalmente, v e umafuncao decrescente, pois quanto mais ovelhas no pasto, menor sera aarea util de pastagem para a proxima ovelha. Mais ainda: se existempoucas ovelhas pastando, colocar uma a mais para pastar nao vaiafetar muito as ovelhas que ja estao pastando mas, por outro lado, seexistem muitas ovelhas no pasto, digamos, quase que completando acota maxima o, o acrescimo de uma ovelha prejudica mais acentua-damente a pastagem das demais ovelhas. Admitindo que as ovelhassejam infinitamente divisıveis, estas condicoes podem ser modeladas

Page 138: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 135

[SEC. 6.5: A TRAGEDIA DOS COMUNS 135

exigindo-se que v′ ≤ 0 e v′′ < 0. Desta maneira, v tem um grafico talcomo o apresentado na Figura 6.4.

0 oo

v

v

Figura 6.4: Grafico da funcao v.

Neste jogo, a estrategia do pastor i e a escolha da quantidade deovelhas que ele deixara no pasto. Podemos entao considerar que oconjunto de estrategias puras do pastor i e Si = [0, o). Sua funcaoutilidade e dada por

ui(o1, . . . , oi, . . . , on) = oi · v(o1 + · · ·+ oi + · · ·+ on)− c · oi.

Suponha que c < v = v(0). Vamos caracterizar os equilıbrios deNash o∗ = (o∗1, . . . , o

∗n) tais que

∑nj=1 o

∗j < o. Para isto, usaremos

as seguintes notacoes: σ∗ =∑n

j=1 o∗j e σ∗

−i = σ∗ − o∗i . Note que afuncao

oiμi�−→ ui(oi,o

∗−i) = oi · v

(oi − σ∗

−i

)− c · oitem as seguintes propriedades:

(1) μi e contınua,

(2) μi tem a mesma classe de diferenciabilidade de v em [0, o− σ∗−i),

(3) μi(0) = 0, μi(o− σ∗−i) < 0, μi(oi) ≤ 0 para oi ≥ o− σ∗

−i,

(4) μ′i(0) = v(0)− c > 0, logo μi e crescente e, portanto, positiva, em

um intervalo (0, ε) para algum ε > 0 e

Page 139: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 136

136 [CAP. 6: EXEMPLOS

(5) μi e concava em[0, o− σ∗

−i

].

Logo, a funcao de melhor resposta do pastor i esta bem definida:

MRi(o∗) = argmaxoi∈(0,o−σ∗

−i)

(oi · v

(oi − σ∗

−i

)− c · oi).

Se o∗i ∈ MRi(o∗), entao, pela regra de Fermat, μ′

i(o∗i ) = 0, isto e,

v(o∗i + σ∗−i) + o∗i · v′(o∗i + σ∗

−i)− c = 0.

Somando-se estas equacoes para i = 1, . . . , n e, entao, dividindo-sepor n, obtemos que σ∗ deve satisfazer a seguinte equacao:

v(σ∗) +1

n· σ∗ · v′(σ∗) = 0. (6.2)

Por outro lado, se o objetivo e maximizar a utilidade coletiva, istoe, a soma das funcoes utilidades individuais, entao devemos resolvero seguinte problema de otimizacao:

maxo∈(0,o)

(o · v(o) − c · o) .

Usando novamente a regra de Fermat, concluımos que uma solucao σ•

deste problema de otimizacao deve resolver a seguinte equacao:

v(σ•) + σ• · v′(σ•) = 0. (6.3)

Observe que σ∗ > σ•. Com efeito: se, por absurdo, σ∗ ≤ σ•, entaov(σ∗) ≥ v(σ•), ja que v e decrescente. Mas v′ tambem e decrescente,ja que v′′ < 0. Desta maneira, 0 > v′(σ∗) ≥ v′(σ•). Como 0 <σ∗/n < σ∗ ≤ σ•, segue-se que

σ∗

n· v′(σ∗) ≥ σ∗

n· v′(σ•) > σ• · v′(σ•)

e, portanto,

0 = v(σ∗) +σ∗

n· v′(σ∗) > v(σ•) + σ• · v′(σ•) = 0,

uma contradicao. Vemos entao que o equilıbrio de Nash o∗ colocamais ovelhas no pasto do que o numero de ovelhas sugerido peloequilıbrio coletivo o•. Isto acontece porque cada pastor consideraapenas o seu proprio benefıcio e nao o efeito de suas acoes sobre osoutros pastores.

Page 140: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 137

Apendice A

Convexidade

Neste apendice apresentaremos as definicoes e propriedades ba-sicas de funcoes convexas necessarias no texto. As demonstracoesomitidas podem ser encontradas em [42].

Definicao A.1 (Conjuntos convexos) Dizemos que U ⊂Rn e um conjunto convexo se, e somente se, para todo p,q ∈ Utem-se

(1− t) · p+ t · q ∈ U,

para todo t ∈ [0, 1], isto e, se o segmento de reta que une doispontos quaisquer de U esta sempre contido em U .

Teorema A.1 Seja {Uξ}ξ∈Ξ uma famılia de conjuntos conve-xos em Rn Entao ⋂

ξ∈Ξ

tambem e um conjunto convexo em Rn.

137

Page 141: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 138

138 [CAP. A: CONVEXIDADE

(a) (b)

Figura A.1: O conjunto da esquerda e convexo enquanto que o dadireita nao o e.

Definicao A.2 (Semiplanos e Semiespacos) Seja a um ve-tor nao-nulo em Rn e seja c um numero real. Os conjuntos

H+ = {x ∈ Rn | ax ≥ c} e H− = {x ∈ Rn | ax ≤ c}

sao denominados, respectivamente, semiespacos fechados cor-respondentes ao semiplano H = {x ∈ Rn | ax = c}.

Por linearidade, segue-se que semiplanos e semiespacos sao con-juntos convexos.

Definicao A.3 (Politopos e Poliedros) Um politopo e umconjunto que pode ser expresso como a intersecao de um numerofinito de semiespacos fechados. Um poliedro e um politopo limi-tado.

Note que politopos e poliedros sao conjuntos convexos, como in-tersecao de conjuntos convexos.

Definicao A.4 (Combinacao convexa) Sejam x1, . . . ,xk ∈Rn e λ1, . . . , λk numeros reais ≥ 0 tais que

∑ni=1 λi = 1. A com-

binacao convexa de x1, . . . ,xk com pesos λ1, . . . , λk e o ponto

λ1 · x1 + · · ·+ λi · xk.

Page 142: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 139

139

(a) (b)

Figura A.2: O conjunto de todas as combinacoes convexas de (a) doispontos distintos e um segmento de reta que liga os doispontos e de (b) tres pontos nao-colineares e um triangulo(lados e interior) com vertices nos tres pontos.

Teorema A.2 Um subconjunto U de Rn e convexo se, e so-mente se, toda combinacao convexa de pontos de U pertencea U .

Definicao A.5 (Funcoes convexas e concavas)

(a) Dizemos que uma funcao f : U ⊂ Rn → R definida em umsubconjunto convexo U de Rn e convexa se, e somente se,

f((1− t) · p+ t · q) ≤ (1− t) · f(p) + t · f(q), (A.1)

para todo p,q ∈ U e todo t ∈ [0, 1].

(b) Dizemos que uma funcao f : U ⊂ Rn → R definida em umsubconjunto convexo U de Rn e concava se, e somente se,

f((1− t) · p+ t · q) ≥ (1− t) · f(p) + t · f(q), (A.2)

para todo p,q ∈ U e todo t ∈ [0, 1].

A interpretacao geometrica e a seguinte: para uma funcao convexa, osegmento de reta secante que passa pelos pontos (p, f(p)) e (q, f(q))sempre esta acima ou coincide com o grafico de f para qualquer

Page 143: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 140

140 [CAP. A: CONVEXIDADE

segmento de reta secante

p0

y

f(p)

f(q)

q x

gráfico de f

(1{ t) p+t q. .

(1{ t) f(p)+t f(q). .

f((1{ t) p +t q). .

Figura A.3: Para uma funcao convexa, o segmento de reta secantefica sempre acima ou coincide com o grafico da funcao,para quaisquer escolhas de p e q.

escolha de pontos p e q em U (veja a Figura A.3). Ja para umafuncao concava, o segmento de reta secante que passa pelos pontos(p, f(p)) e (q, f(q)) sempre esta abaixo ou coincide com o graficode f para qualquer escolha de pontos p e q em U . Note que f econcava se, e somente se, −f e convexa.

O proximo teorema estabelece o motivo de convexidade ser uma pro-priedade tao desejavel em otimizacao.

Teorema A.3

(a) Se f : U ⊂ Rn → R e convexa, entao todo ponto de mınimolocal de f em U tambem e ponto de mınimo global de fem U .

(b) Se f : U ⊂ Rn → R e concava, entao todo ponto de maximolocal de f em U tambem e ponto de maximo global de fem U .

Page 144: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 141

141

Teorema A.4 Seja f : U ⊂ Rn → R uma funcao de classe C1

definida em um subconjunto convexo U de Rn.

(a) f e uma funcao convexa em U se, e somente se,

f(q) ≥ f(p) +∇f(p) · (q− p), (A.3)

para todo p,q ∈ U , isto e, se, e somente se, cada hiperplanotangente ao grafico de f esta sempre abaixo ou coincide como grafico de f .

(b) f e uma funcao concava em U se, e somente se,

f(q) ≤ f(p) +∇f(p) · (q− p), (A.4)

para todo p,q ∈ U , isto e, se, e somente se, cada hiperplanotangente ao grafico de f esta sempre acima ou coincide como grafico de f .

Aqui ∇f(p) denota o vetor gradiente de f em p.

0

y

x

gráfico de f

Figura A.4: Para uma funcao convexa, cada hiperplano tangente aografico de f esta sempre abaixo do grafico de f .

Page 145: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 142

142 [CAP. A: CONVEXIDADE

Definicao A.6 (Funcoes quase-convexas e quase-con-cavas)

(a) Dizemos que uma funcao f : U ⊂ Rn → R definida em umsubconjunto convexo U de Rn e quase-convexa se, e somentese,

{x ∈ U | f(x) ≤ c}e um conjunto convexo para todo c ∈ R.

(b) Dizemos que uma funcao f : U ⊂ Rn → R definida em umsubconjunto convexo U de Rn e quase-concavo se, e somentese,

{x ∈ U | f(x) ≥ c}e um conjunto convexo para todo c ∈ R.

Note que f e quase-concava se, e somente se, −f e quase-convexa.Toda funcao convexa e quase-convexa e toda funcao concava e quase-concava. Existem funcoes quase-convexas que nao sao convexas. Porexemplo, a funcao f : R → R definida por y = f(x) =

3√x2 e quase-

convexa, mas nao e convexa.

0 x

y

Figura A.5: y = f(x) =3√x2 e quase-convexa, mas nao e convexa

em R.

Page 146: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 143

143

Toda funcao f : R → R monotona e quase-convexa e quase-concava.A funcao y = f(x) = �x� que leva x ∈ R no maior inteiro menor doque ou igual a x e funcao quase-convexa que nao e contınua. A funcaoda Figura A.6 e um exemplo de funcao que nao e quase-convexa.

Teorema A.5 Seja f : U ⊂ Rn → R uma funcao definida emum subconjunto convexo U de Rn.

(a) As seguintes condicoes sao equivalentes:

(1) f e uma funcao quase-convexa em U .

(2) ∀x1,x2 ∈ U, ∀t ∈ [0, 1], se f(x1) ≤ f(x2), entao

f(t · x1 + (1− t) · x2) ≤ f(x2).

(3) ∀x1,x2 ∈ U, ∀t ∈ [0, 1],

f(t · x1 + (1− t) · x2) ≤ max{f(x1), f(x2)}.

(b) As seguintes condicoes sao equivalentes:

(1) f e uma funcao quase-concava em U .

(2) ∀x1,x2 ∈ U, ∀t ∈ [0, 1], se f(x1) ≥ f(x2), entao

f(t · x1 + (1− t) · x2) ≥ f(x2).

(3) ∀x1,x2 ∈ U, ∀t ∈ [0, 1],

f(t · x1 + (1− t) · x2) ≥ min{f(x1), f(x2)}.

Teorema A.6 Seja f : U ⊂ Rn → R uma funcao de classe C1

definida em um subconjunto convexo U de Rn.

(a) f e quase-convexa em U se, e somente se,

∀x1,x2 ∈ U, f(x2) ≤ f(x1) ⇒ ∇f(x1) · (x2 − x1) ≤ 0.

Page 147: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 144

144 [CAP. A: CONVEXIDADE

0 x

y

c

Figura A.6: Um exemplo de funcao que nao e quase-convexa.

(b) f e quase-concava em U se, e somente se,

∀x1,x2 ∈ U, f(x2) ≥ f(x1) ⇒ ∇f(x1) · (x2 − x1) ≥ 0.

Page 148: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 145

Apendice B

Programacao Linear

Neste apendice apresentaremos as definicoes e propriedades ba-sicas da teoria de programacao linear necessarias no texto. Paradetalhes, demonstracoes e extensoes, recomendamos os excelentes li-vros [14, 52].

Um programa linear e um problema de otimizacao onde a funcaoque queremos otimizar e as restricoes sao todas lineares. Por exemplo,

minimizarx1,x2∈R

x1 + x2

sujeito a 3 x1 + 2 x2 ≥ 8,x1 + 5 x2 ≥ 7,

x1 ≥ 0,x2 ≥ 0,

(B.1)

e um programa linear. Para resolve-lo, precisamos encontrar umponto (x1, x2) do conjunto admissıvel

K = {(x1, x2) ∈ R2 | 3 x1 + 2 x2 ≥ 8, x1 + 5 x2 ≥ 7, x1 ≥ 0, x2 ≥ 0}

que torna o valor da funcao objetivo o(x1, x2) = x1 + x2 o menorpossıvel. O conjunto K esta desenhado na Figura B.1. Por inspecao,vemos que a solucao otima e dada por (x∗

1, x∗2) = (2, 1). Este ponto e

a intersecao da curva de nıvel f(x1, x2) = x1 + x2 = c “mais baixa”que intercepta o conjunto admissıvel.

145

Page 149: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 146

146 [CAP. B: PROGRAMACAO LINEAR

x 1

x 2

4

3

1

720 3

Figura B.1: O conjunto admissıvel do programa linear B.1.

Dizemos que um programa linear esta na forma padrao se todasas variaveis de decisao sao nao-negativas e se todas as restricoes saoem igualdade:

minimizarx1,...,xn

∈ R c1x1 + · · ·+ cnxn

sujeito a a11x1 + · · · + a1nxn = b1,...

......

......

am1x1 + · · · + amnxn = bm,

e x1 ≥ 0, . . . , xn ≥ 0.

Todo programa linear pode ser reescrito na forma padrao com o usode variaveis de folga. Por exemplo, uma restricao da forma

ai1x1 + · · ·+ ainxn ≥ bi

pode ser substituıda, de maneira equivalente, pelas restricoes

ai1x1 + · · ·+ ainxn − yi = bi e yi ≥ 0.

Se uma variavel de decisao xi pode assumir qualquer valor real, isto e,se nao existe restricao de nao-negatividade em xi, entao podemos

Page 150: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 147

147

substituir xi por ui − vi, a diferenca de dois numeros positivos. Secolocarmos o programa linear B.1 na forma padrao, obtemos o se-guinte PL:

minimizarx1,x2,y1,y2∈R

x1 + x2

sujeito a 3 x1 + 2 x2 − y1 = 8,x1 + 5 x2 − y2 = 7,

x1 ≥ 0,x2 ≥ 0,y1 ≥ 0,y2 ≥ 0.

(B.2)

Um programa linear pode ser escrito de forma mais compactausando-se matrizes e vetores:

minimizarx∈Rn

cTx

sujeito a Ax = b e x ≥ 0,(B.3)

onde x ∈ Rn, c ∈ Rn, b ∈ Rm e A e uma matriz m × n. Noteque o conjunto admissıvel K = {x ∈ Rn | Ax = b e x ≥ 0} de umprograma linear, quando nao-vazio, e um politopo convexo, e que ashipersuperfıcies de nıvel da funcao objetivo sao hiperplanos.

Problemas de maximizacao podem ser transformados em proble-mas de minimizacao substituindo-se a funcao objetivo o por −o. Maisprecisamente, x∗ e uma solucao otima de

maximizarx∈Rn

cTx

sujeito a Ax = b e x ≥ 0,

se, e somente se, x∗ tambem e solucao de

minimizarx∈Rn

−cTx

sujeito a Ax = b e x ≥ 0.

Na teoria de programacao linear, assume-se que m < n (existemmais incognitas do que restricoes em igualdade) e que o posto damatrizA em, isto e, asm linhas deA sao linearmente independentes.

Page 151: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 148

148 [CAP. B: PROGRAMACAO LINEAR

Da teoria de Algebra Linear sabemos, entao, que existem m colunasde A que sao linearmente independentes. Renomeando-se ındices senecessario, podemos assumir que estas colunas sejam as m primeiras.Isto induz uma decomposicao de A e de x:

A =[B C

], x =

[xB

xC

],

ondeB e uma matrizm×m inversıvel. Como o sistema linearAx = be equivalente a BxB + CxC = b, segue-se entao que existe umasolucao x de Ax = b na forma[

xB

0

].

Esta solucao e denominada solucao basica do sistema linear Ax =b associada a base B. As componentes de xB sao denominadasvariaveis basicas.

Teorema B.1 (Teorema Fundamental da ProgramacaoLinear) Considere um programa linear na forma padrao B.3,com A matriz m× n de posto m.

(a) Se o programa linear possui um ponto admissıvel, entao elepossui um ponto admissıvel que e uma solucao basica dosistema linear Ax = b.

(b) Se o programa linear possui um ponto otimo, entao ele pos-sui um ponto otimo que e uma solucao basica do sistemalinear Ax = b.

O proximo teorema da uma interpretacao geometrica para pontosadmissıveis que sao solucoes basicas: eles correspondem aos pontosextremos (vertices) do politopo K = {x ∈ Rn | Ax = b e x ≥ 0}.

Definicao B.1 (Ponto Extremo) Dizemos que um ponto xem um conjunto convexo U e ponto extremo de U se nao existemdois outros pontos distintos x1 e x2 em U tais que x = αx1 +(1− α)x2 para algum α no intervalo (0, 1).

Page 152: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 149

149

Na Figura B.2, x1, x2 e x3 sao os unicos pontos extremos doconjunto admissıvel K do PL B.1. O ponto x4 nao e um pontoextremo de K, pois ele pode ser escrito como uma combinacao con-vexa de x2 ∈ K e x3 ∈ K. Como x6 = αx5 + (1 − α)x7 paraalgum α ∈ (0, 1), vemos que o ponto x6 (no interior do conjuntoadmissıvel) tambem nao e um ponto extremo de K.

0 x 1

x 2

4

3

1

72 3

x2

x3

x1

x4

x5

x7x6

Figura B.2: x1, x2 e x3 sao os unicos pontos extremos do conjuntoadmissıvel do PL B.1.

Teorema B.2 (Equivalencia entre Pontos Extremos eSolucoes Basicas) Seja A uma matriz m × n de posto m,b um vetor em Rm e K = {x ∈ Rn | Ax = b e x ≥ 0} o con-junto admissıvel de B.3. Entao x e um ponto extremo de Kse, e somente se, x e um ponto admissıvel que e solucao basicade Ax = b.

Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, naoe preciso considerar todos os pontos do conjunto admissıvel K: bastaprocurar pelo ponto otimo entre os pontos extremos (vertices) de K!O metodo simplex explora esta estrutura para construir um algoritmomuito popular para se resolver B.3. Outra categoria de metodos que

Page 153: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 150

150 [CAP. B: PROGRAMACAO LINEAR

recentemente ganhou bastante popularidade e a classe dos metodosde ponto interior. Nao e nosso proposito estudar estes algoritmosaqui. O leitor interessado podera consultar os livros [14, 52]. O que epreciso se ter em mente e que programas lineares podem ser resolvidosnumericamente de maneira muito eficiente nos dias de hoje. A seguirestabeleceremos resultados sobre dualidade, um conceito fundamentale muito util em programacao linear.

Definicao B.2 (O problema dual) O problema dual de

minimizarx∈Rn

cTx

sujeito a Ax ≥ b e x ≥ 0,(B.4)

e o programa linear

maximizarλ∈Rm

λTb

sujeito a ATλ ≤ c e λ ≥ 0,(B.5)

onde λTb =∑m

i=1 λibi. B.5 e denominado o problema dualde B.4. Neste contexto, B.4 e denominado problema primal.

Por exemplo, o problema dual do programa linear B.1 e

minimizarλ1,λ2∈R

8λ1 + 7λ2

sujeito a 3λ1 + λ2 ≤ 1,2λ1 + 5λ2 ≤ 1,

λ1 ≥ 0,λ2 ≥ 0.

(B.6)

O problema dual de qualquer programa linear pode ser encontradoconvertendo-o para o formato B.4. Por exemplo, como Ax = b se,e somente se, Ax ≥ b e −Ax ≥ −b, o programa linear na formapadrao B.3 pode ser escrito na forma do problema primal B.4 da

Page 154: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 151

151

seguinte maneira equivalente

minimizarx∈Rn

cTx

sujeito a

[A

−A

]x ≥

[b

−b

]e x ≥ 0.

Particionando-se agora as variaveis duais na forma (u,v), o problemadual deste ultimo PL e

minimizarx∈Rn

uTb− vTb

sujeito a ATu−ATv ≤ c,u ≥ 0 e v ≥ 0.

Fazendo-se λ = u−v, o problema acima pode ser simplificado, o quenos leva ao seguinte par de problemas duais:

Par Dual B.1

(problema primal)

minimizarx∈Rn

cTx

sujeito a Ax = b,x ≥ 0,

(problema dual)

maximizarλ∈Rm

λTb

sujeito a ATλ ≤ c.

Outros pares de problemas duais de interesse sao dados a seguir.

Par Dual B.2

(problema primal)

maximizarx∈Rn

cTx

sujeito a Ax = b,x ≥ 0,

(problema dual)

minimizarλ∈Rm

λTb

sujeito a ATλ ≥ c.

Page 155: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 152

152 [CAP. B: PROGRAMACAO LINEAR

Par Dual B.3 (O da Definicao B.2)

(problema primal)

minimizarx∈Rn

cTx

sujeito a Ax ≥ b,x ≥ 0,

(problema dual)

maximizarλ∈Rm

λTb

sujeito a ATλ ≤ c,λ ≥ 0.

Par Dual B.4

(problema primal)

maximizary∈Rm

bTy

sujeito a Ay ≤ c,y ≥ 0,

(problema dual)

minimizarx∈Rn

cTx

sujeito a xTA ≥ bT,x ≥ 0.

Teorema B.3 (Teorema fraco de dualidade) Se x e λ saoadmissıveis para os problemas B.3 e B.5, respectivamente, entaocTx ≥ λTb.

Este teorema mostra que um ponto admissıvel para um dos pro-blemas fornece uma cota para o valor da funcao objetivo do outroproblema. Os valores associados com o problema primal sao sempremaiores ou iguais aos valores associados com o problema dual. Comocorolario, vemos que se um par de pontos admissıveis pode ser encon-trado para os problemas primal e dual com valores iguais da funcaoobjetivo, entao estes pontos sao otimos.

Teorema B.4 (Teorema forte de dualidade) Se um dosproblemas B.3 ou B.5 tem uma solucao otima finita, entao ooutro tambem tera uma solucao otima finita e, neste caso, osvalores das respectivas funcoes objetivo sao iguais. Se a funcao

Page 156: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 153

153

objetivo do problema primal nao e limitada inferiormente, entaoo conjunto admissıvel do problema dual e vazio e, se a funcaoobjetivo do problema dual nao e limitada superiormente, entaoo conjunto admissıvel do problema primal e vazio.

O conjunto admissıvel do problema dual B.6 do programa linear B.1esta desenhado na Figura B.3. Por inspecao, vemos que a solucaootima e dada por (λ∗

1, λ∗2) = (4/13, 1/13). Este ponto e a intersecao da

curva de nıvel g(λ1, λ2) = 8λ1 + 7λ2 = c “mais alta” que interceptao conjunto admissıvel. Lembrando que (x∗

1, x∗2) = (2, 1) e a solucao

do problema primal B.1, vemos que

f(x∗1, x

∗2) = x∗

1 + x∗2 = 3 = 8λ∗

1 + 7λ∗2 = g(λ∗

1, λ∗2),

como afirma o teorema forte da dualidade.

¸1

¸2

0

3/8

3/7

1/3

1/5

(4/13, 1/13)

Figura B.3: O conjunto admissıvel do problema dual B.6 do pro-grama linear B.1.

Por fim, gostarıamos de observar que se a funcao objetivo do pro-grama linear B.3 nao e limitada inferiormente no conjunto admissıvel

Page 157: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 154

154 [CAP. B: PROGRAMACAO LINEAR

K = {x ∈ Rn | Ax = b e x ≥ 0} ,entao existem ponto extremo x e raio extremo r de K tal que o valorda funcao objetivo de B.3 em x = x+ t r tende a −∞ quando t tendea +∞. Em particular,

cT r < 0.

Dizemos que r e um raio de K se, e somente se, r �= 0 e o conjunto{p ∈ Rn | p = x+ t r e t ≥ 0} esta contido em K para todo x ∈ K.Um raio r de K e extremo, se nao existem outros dois raios r1 e r2de K (com r1 �= t r2 para todo t > 0) e um escalar s no intervalo (0, 1)tal que r = s r1 + (1− s) r2.

0 x 1

x 2

r2

r1

r3K

Figura B.4: Os vetores r1 e r2 nao sao raios extremos de K. O ve-tor r3 e um raio extremo de K.

Page 158: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 155

Apendice C

Respostas dos exercıcios

Capıtulo 2

[01] O processo de dominancia estrita iterada reduz o jogo para umamatriz 1×1 com um unico perfil de estrategias puras: (s13, s22).

[02] (a) Nao existem estrategias dominantes neste jogo.

(b) (l1, c1) e (l2, c2) sao os unicos equilıbrios de Nash em es-trategias puras do jogo.

[03] (a) c2 domina estritamente c1.

(b) (l2, c2) e o unico equilıbrio de Nash em estrategias puras dojogo.

[04] (a) Nao existem estrategias dominantes neste jogo.

(b) (desviar, nao desviar) e (nao desviar, desviar) sao os unicosequilıbrios de Nash em estrategias puras do jogo.

[05] (a) Nao existem estrategias dominantes neste jogo.

(b) (brigar, ameacar) e (ameacar, brigar) sao os unicos equilıbriosde Nash em estrategias puras do jogo.

[06] Usando o processo de dominancia fraca iterada, o jogo se reduzpara uma matriz 3× 3:

155

Page 159: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 156

156 [CAP. C: RESPOSTAS DOS EXERCICIOS

EixoA B C

Aliados

1 (+13,−13) (+29,−29) (+ 8,− 8)

3 (+18,−18) (+22,−22) (+31,−31)

6 (+23,−23) (+22,−22) (+19,−19)

.

[07] O processo de dominancia estrita iterada reduz o jogo parauma matriz 1× 1× 1 com um unico perfil de estrategias puras:(x3, y2, z4).

[08] O processo de dominancia estrita iterada reduz o jogo parauma matriz 1× 1× 1 com um unico perfil de estrategias puras:(x2, y1, z2).

[09] O perfil de estrategias (x2, y2, z3) e o unico equilıbrio de Nashem estrategias puras do jogo.

[10] (a) Para o jogador 1, a estrategia M e fracamente dominadapela estrategia T e tambem fracamente dominada pela es-trategia B. Para o jogador 2, a estrategia L e fracamentedominada pela estrategia R.

(b) O processo de eliminacao das estrategias fracamente domi-nadas conduz a duas reducoes 1× 1: {(B,C)} e {(T,R)}.

(c) Os equilıbrios de Nash em estrategias puras sao (T,C),(T,R) e (B,C). Note que (T,C) nao esta entre os per-fis de estrategias encontrados no item anterior.

[11] Suponha, por absurdo, que s∗ = (s∗1, . . . , s∗n) nao seja um e-quilıbrio de Nash. Entao devem existir ındice i e estrategiapura s[1]

i ∈ Si, com s[1]

i �= s∗i , tais que ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i).

Como, por hipotese, o processo de eliminacao reduz o jogo ape-nas para o perfil s∗, segue-se que o perfil (s[1]

i , s∗−i) foi eliminadoem alguma etapa do processo. Dados que as estrategias purasem s∗−i nao foram eliminadas (se o fossem, o perfil (s∗i , s

∗−i)

tambem seria eliminado), segue-se que a eliminacao ocorreu

Page 160: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 157

157

porque a estrategia s[1]

i foi fracamente dominada por outra es-trategia s[2]

i . Logo, ui(s[1]

i , s−i) ≤ ui(s[2]

i , s−i) para todo s−i

que pode ser construıdo com as estrategias que restaram nosespacos de estrategias puras dos outros jogadores neste estagiodo processo (que inclui s∗−i) e, mais ainda, pelo menos paraum s[2]

−i, vale a desigualdade estrita: ui(s[1]

i , s[2]

−i) < ui(s[2]

i , s[2]

−i).Das desigualdades

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i) ≤ ui(s[2]

i , s∗−i)

e

ui(s[1]

i , s[2]

−i) < ui(s[2]

i , s[2]

−i)

segue-se que s[2]

i �= s∗i e s[2]

i �= s[1]

i .

Agora, por sua vez, o perfil (s[2]

i , s[2]

−i) tambem foi eliminado du-

rante o processo. Dados que as estrategias puras em s[2]

−i nao

foram eliminadas nesta etapa (se o fossem, o perfil (s[1]

i , s[2]

−i)tambem seria eliminado e, portanto, ele nao existiria nas eta-pas seguintes), segue-se que a eliminacao correu porque a es-trategia s[2]

i foi fracamente dominada por outra estrategia s[3]

i .Logo, ui(s

[2]

i , s−i) ≤ ui(s[3]

i , s−i) para todo s−i que pode serconstruıdo com as estrategias que restaram nos espacos de es-trategias puras dos outros jogadores neste estagio do processo(que inclui s∗−i e s[2]

−i) e, mais ainda, pelo menos para um s[3]

−i,

vale a desigualdade estrita: ui(s[2]

i , s[3]

−i) < ui(s[3]

i , s[3]

−i). Dasdesigualdades

ui(s∗i , s

∗−i) < ui(s

[1]

i , s∗−i) ≤ ui(s[2]

i , s∗−i) ≤ ui(s[3]

i , s∗−i),

ui(s[1]

i , s[2]

−i) < ui(s[2]

i , s[2]

−i) ≤ ui(s[3]

i , s[2]

−i)

e

ui(s[2]

i , s[3]

−i) < ui(s[3]

i , s[3]

−i)

segue-se que s[3]

i �= s∗i , s[3]

i �= s[1]

i e s[3]

i �= s[2]

i .

Prosseguindo desta maneira, construirıamos uma sequencia in-finita (s[1]

i , s[2]

i , s[3]

i , . . . , s[r]

i , . . .) de estrategias puras distintas dojogador gi, o que e impossıvel, dado que Si e, por hipotese,finito.

Page 161: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 158

158 [CAP. C: RESPOSTAS DOS EXERCICIOS

[12] Note que

ui(p∗) = ui(p

∗i ,p

∗−i)

=

m1∑j1=1

· · ·mn∑jn=1

p∗1j1 · · · · p∗njn · ui(s1j1 , . . . , snjn).

Reordenando os somatorios, obtemos que

ui(p∗i ,p

∗−i) =

mi∑ji=1

p∗iji · vji = 〈p∗i , v〉

onde

vji =

m1∑j1=1

· · ·mi−1∑ji−1=1

mi+1∑ji+1=1

· · ·mn∑jn=1

cj1,...,jn · ui(s1j1 , . . . , snjn),

com cj1,...,jn = p∗1j1 · · · p∗(i−1)ji−1· p∗(i+1)ji+1

· · · p∗njn . Desta ma-neira, se x1, . . . , xr ∈ Δi e λ1, . . . , λr sao escalares nao-negativoscom

∑rk=1 λk = 1, entao

ui

(r∑

k=1

λk · xk,p∗−i

)=

⟨r∑

k=1

λk · xk, v⟩

=

r∑k=1

λk · 〈xk, v〉

=

r∑k=1

λk · ui(xk,p∗−i).

Nas igualdades acima nao usamos que λ1, . . . , λr sao escalaresnao-negativos com

∑rk=1 λk = 1. De fato, esta exigencia e

necessaria apenas para garantir que se x1, . . . , xr ∈ Δi, entao∑rk=1 λk · xk ∈ Δi.

[13] Suponha que a estrategia pura sik do jogador gi seja estrita-mente dominada por uma estrategia mista

p′i = (p′i1, . . . , p

′ik, . . . , p

′imi

) ∈ Δmi .

Page 162: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 159

159

Vamos mostrar que se pi = (pi1, . . . , pik, . . . , pimi) e uma outraestrategia mista do jogador gi com pik > 0, entao pi tambeme estritamente dominada. Como sik e estritamente dominadapor p′

i, segue-se que

ui(p′i, s−i) > ui(sik, s−i), ∀s−i ∈ S−i.

Assim,

ui(pi, s−i)(∗)=

mi∑r=1

pir · ui(sir , s−i)

=

mi∑r=1r =k

pir · ui(sir, s−i) + pik · ui(sik, s−i)

<

mi∑r=1r =k

pir · ui(sir, s−i) + pik · ui(p′i, s−i),

onde, em (∗), usamos a propriedade 2.4 da pagina 31. Mas, poresta mesma propriedade,

ui(p′i, s−i) =

mi∑r′=1

p′ir′ · ui(sir′ , s−i).

Consequentemente,

ui(pi, s−i)

<mi∑r=1r =k

pir · ui(sir , s−i) + pik ·mi∑r′=1

p′ir′ · ui(sir′ , s−i)

=mi∑r=1r =k

(pir + pik · p′ir) · ui(sir , s−i) + pik · p′ik · ui(sik, s−i)

=mi∑r=1

p′′ir · ui(sir , s−i),

Page 163: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 160

160 [CAP. C: RESPOSTAS DOS EXERCICIOS

onde os coeficientes p′′ir sao definidos por

p′′ir =

{pir + pik · p′ir, se r �= k,pik · p′ik, se r = k.

Como p′′ir ≥ 0 para todo r = 1, . . . ,mi e∑mi

r=1 p′′ir = 1, segue-se

que p′′i = (p′′i1, . . . , p

′′ir, . . . , p

′′imi

) e uma distribuicao de proba-bilidades e, sendo assim,

ui(pi, s−i) <

mi∑r=1

p′′ir · ui(sir, s−i) = ui(p′′i , s−i), ∀s−i ∈ S−i.

Isto mostra que a estrategia mista pi e estritamente dominadapela estrategia mista p′′

i .

[14] Para o dilema dos prisioneiros, as funcoes de melhor respostasao dadas por:

MRBob(p) = argmaxq∈[0,1]((4 p+ 1) q − (9 p+ 1)) = {1},MRAl (q) = argmaxp∈[0,1]((4 q + 1) p− (9 q + 1)) = {1}.

A partir das representacoes graficas destas funcoes (Figura C.1),vemos que o unico equilıbrio de Nash em estrategias mistas dojogo e o perfil (1, 0; 1, 0), que corresponde ao unico ponto deintersecao (p∗, q∗) = (1, 1) das duas representacoes graficas.

Para o jogo de comparar moedas, as funcoes de melhor respostasao dadas por:

MR2(p) = argmaxq∈[0,1](2 (+1− 2 p) q − 1 + 2 p)

=

⎧⎨⎩{1}, se p ∈ [0, 1/2),[0, 1], se p = 1/2,{0}, se p ∈ (1/2, 1],

MR1(q) = argmaxp∈[0,1](2 (−1 + 2 q) p+ 1− 2 q)

=

⎧⎨⎩{0}, se q ∈ [0, 1/2),[0, 1], se q = 1/2,{1}, se q ∈ (1/2, 1].

A partir das representacoes graficas destas funcoes (Figura C.2),vemos que o unico equilıbrio de Nash em estrategias mistas do

Page 164: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 161

161

1 p

(Bob)

0

1

q

(Negar)

(Negar)(Al)

(Confessar)

(Confessar)

Figura C.1: Calculando os equilıbrios de Nash usando as representa-coes graficas das duas funcoes de melhor resposta.

jogo e o perfil (1/2, 1/2; 1/2, 1/2), que corresponde ao unicoponto de intersecao (p∗, q∗) = (1/2, 1/2) das duas representa-coes graficas.

[15] Um equilıbrio de Nash nao pode por probabilidade positiva emuma estrategia pura que e estritamente dominada. De fato:suponha, por absurdo, que p∗ = (p∗

i ,p∗−i) seja um equilıbrio

de Nash com p∗i = (p∗i1, . . . , p

∗ik1

, . . . , p∗ik2, . . . , p∗imi

) e p∗ik1> 0,

onde sik1 e uma estrategia pura estritamente dominada por sik2 .Defina agora p•

i = (p∗i1, . . . , 0, . . . , p∗ik1

+ p∗ik2, . . . , p∗imi

). Noteque p•

i ∈ Δ(Si) e ui(p•i ,p

∗i ) > ui(p

∗i ,p

∗i ), contradizendo o fato

de p∗ = (p∗i ,p

∗−i) ser um equilıbrio de Nash. Um equilıbrio de

Nash pode por probabilidade positiva em uma estrategia purafracamente dominada. No jogo abaixo,

g2s21 s22

g1s11 (12, 10) (28, 26)

s12 (20, 46) (20, 46)

,

Page 165: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 162

162 [CAP. C: RESPOSTAS DOS EXERCICIOS

11/2 p0

1/2

1

q

(s )12

(s )22

(s )21

(s )11

(g )1

(g )2

Figura C.2: Calculando os equilıbrios de Nash usando as representa-coes graficas das duas funcoes de melhor resposta.

o perfil de estrategias mistas (0, 1; 1/2, 1/2) e um equilıbrio deNash que poe probabilidade p21 = 1/2 > 0 na estrategia s21e s21 e fracamente dominada pela estrategia s22.

[16] O perfil de estrategias puras s∗ = (confessar, confessar) nao ePareto eficiente pois, se s• = (negar, negar) e tal que uAl(s

•) =−1 > −5 = uAl(s

•) e uBob(s•) = −1 > −5 = uBob(s

•).

Capıtulo 3

[01] (a) Considere Δ = [0, 1] e F : Δ → Δ cujo grafico e dado naFigura C.3.

(b) Considere Δ = (0, 1) e F : Δ → Δ cujo grafico e dado naFigura C.4.

(c) Considere Δ = [0, 1/3]∪ [2/3, 1] e F : Δ → Δ cujo grafico edado na Figura C.5.

Page 166: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 163

163

0 1/2

1/2

1

1

x

y

Figura C.3: Grafico do item (a).

0 1/3

2/3

1

1

x

y

Figura C.4: Grafico do item (b).

Page 167: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 164

164 [CAP. C: RESPOSTAS DOS EXERCICIOS

0 1/3 2/3

2/3

1/3

1

1

x

y

Figura C.5: Grafico do item (c).

0 1/2

1/4

3/4

1

1

x

y

Figura C.6: φ nao possui ponto fixo.

Page 168: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 165

165

[02] Conforme a Figura C.6 na pagina 164, um exemplo e obtidotomando-se X = [0, 1] e

φ(x) =

⎧⎨⎩[3/4, 1], se 0 ≤ x < 1/2,[0, 1/4] ∪ [3/4, 1], se x = 1/2,[0, 1/4], se 1/2 < x ≤ 1.

[03] O jogo abaixo possui apenas dois equilıbrios de Nash em es-trategias mistas.

g2s21 s22

g1s11 (1, 1) (0, 0)

s12 (0, 0) (0, 0)

,

Capıtulo 4

[01] A matriz A tem dois pontos de sela: a13 e a33.

[02] No jogo de comparar moedas,

A =

[+1 −1−1 +1

]Como A tem entradas negativas, vamos substituı-la por

A =

[+1 −1−1 +1

]+ 2 1 =

[+3 +1+1 +3

].

Assim:

(problema primal)

maximizar y1 + y2sujeito a 3 y1 + y2 ≤ 1,

y1 + 3 y2 ≤ 1,y1 ≥ 0,y2 ≥ 0,

Page 169: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 166

166 [CAP. C: RESPOSTAS DOS EXERCICIOS

(problema dual)

minimizar x1 + x2

sujeito a 3 x1 + x2 ≥ 1,x1 + 3 x2 ≥ 1,

x1 ≥ 0,x2 ≥ 0.

A solucao do problema dual e (x∗1, x

∗2) = (1/4, 1/4) e a solucao

do problema primal e (y∗1 , y∗2) = (1/4, 1/4). Se

θ = x∗1 + x∗

2 = y∗1 + y∗2 =1

2,

segue-se que o unico equilıbrio de Nash do jogo de compararmoedas e dado por (p∗, q∗), onde

p∗ =(x∗

1, x∗2)

θ=

(1

2,1

2

)e q∗ =

(y∗1 , y∗2)θ

=

(1

2,1

2

).

[03] Considere o seguinte jogo matricial geral de ordem 2× 2:

A =

[a bd c

].

Se existe um ponto de sela, basta usarmos os resultados da Sub-secao 4.3.2 para encontrar um equilıbrio de Nash do jogo. Su-ponha entao que a matriz A nao possua pontos de sela. Destamaneira, o jogo possui apenas equilıbrios de Nash

(p∗, 1− p∗; q∗, 1− q∗)

totalmente mistos, isto e, com 0 < p∗, q∗ < 1. Se a ≥ b, entaob < c, caso contrario b seria um ponto de sela. Desde que b < c,devemos ter c > d pois, caso contrario, c seria um ponto desela. Prosseguindo desta maneira, vemos que d < a e a > b.Em outras palavras, se a ≥ b, entao a > b, b < c, c > d e d < a.Por simetria, se a ≤ b, entao a < b, b > c, c < d e d > a.Com isto mostramos que se nao existem pontos de sela, entao

Page 170: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 167

167

ou a > b, b < c, c > d e d < a, ou a < b, b < c, c < d e d > a.Usando as Equacoes 4.6, obtemos que

a p∗ + d (1− p∗) = b p∗ + c (1− p∗)

Resolvendo para p∗, encontraremos que

p∗ =c− d

(a− b) + (c− d)

Como nao existem pontos de sela, (a − b) e (c − d) sao ambospositivos ou ambos negativos, e consequentemente, 0 < p∗ < 1.O ganho medio do jogador linha usando esta estrategia e

v∗ = a p∗ + d (1− p∗) =a c− b d

(a− b) + (c− d).

Analogamente, usando as Equacoes 4.5, obtemos a seguinte ex-pressao:

q∗ =c− b

(a− b) + (c− d)

com 0 < q∗ < 1. A perda media do jogador coluna usando estaestrategia e

v∗ = a q∗ + d(1 − q∗) =ac− bd

(a− b) + (c− d).

[04] ComoA nao possui pontos de sela, o jogo possui apenas equilıbriosde Nash

(p∗, 1− p∗; q∗, 1− q∗)

totalmente mistos, isto e, com 0 < p∗, q∗ < 1. Se v∗ e o valordo jogo, entao usando as desigualdades 4.3 com q = ek ∈ R4

para k = 1, 2, 3, 4, vemos que

[p∗ 1− p∗

] [ −1 +5 +1 −2+1 −3 −2 +5

]≥

⎡⎢⎢⎣v∗

v∗

v∗

v∗

⎤⎥⎥⎦ ,

Page 171: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 168

168 [CAP. C: RESPOSTAS DOS EXERCICIOS

{ 3

{ 2

{ 1

1

0 1 p

v

5

v* = { 2 p* + 1

v*={7p*+5

Coluna 1

Coluna 3

Coluna 4

Coluna 2

*

*

v*= 3

p*{ 2

v*=8p*{3

Figura C.7: Envelope inferior.

isto e, ⎧⎪⎪⎨⎪⎪⎩v∗ ≤ −2 p∗ + 1,v∗ ≤ 8 p∗ − 3,v∗ ≤ 3 p∗ − 2,v∗ ≤ −7 p∗ + 5.

(C.1)

As funcoes afins v∗ = −2 p∗ + 1, v∗ = 8 p∗ − 3, v∗ = 3 p∗ − 2e v∗ = 3 p∗ − 2 representam os ganhos medios do jogador linhaquando ele escolhe a distribuicao de probabilidades (p∗, 1−p∗) eo jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente.Os graficos destas funcoes para 0 ≤ p∗ ≤ 1 estao desenhados naFigura C.7.

Para um valor fixo de p∗, o jogador linha esta seguro de que seuganho medio e pelo menos o mınimo destas quatro funcoes cal-culadas em p∗, o envelope inferior destas quatro funcoes. Comoo jogador linha pretende maximizar os seus ganhos medios,

Page 172: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 169

169

entao ele precisa encontrar p∗ que atinge o maximo deste en-velope inferior. De acordo com a Figura C.7, o maximo ocorrejustamente na intersecao das retas v∗ = −2 p∗+1 e v∗ = 3 p∗−2,as quais representam, respectivamente, as colunas 1 e 3 do jo-gador coluna. Deste modo, uma solucao do jogo 2 × 4 originalpode ser obtida estudando-se o jogo 2× 2 definido pela matriz

R =

[ −1 +1+1 −2

].

O valor deste jogo e v∗ = −1/5 para p∗ = 3/5 e q∗ = 3/5.Assim, um equilıbrio de Nash do jogo original e dado por

(p∗, 1− p∗; q∗, 0, 1− q∗, 0) =(3

5,2

5;3

5, 0,

2

5, 0

).

Naturalmente, a tecnica aqui descrita pode ser aplicada paraqualquer jogo de soma zero com matriz A de tamanho 2× n.

[05] Lembre-se que ul(p, q) = pTAq e ul(p, q) = −pTAq. Sejamek∗ e el∗ tais que

min1≤l≤n

ul(p∗, el) = ul(p

∗, el∗)

emax

1≤k≤m(−uc(ek, q

∗)) = −uc(ek∗ , q∗),

isto e, p∗TAel ≥ p∗TAel∗ para todo l e eTk Aq∗ ≤ eTk∗Aq∗ para

todo k. Desta maneira,

eTkAq∗ ≤ eTk∗Aq∗ = −(−p∗TAel∗) = p∗TAel∗ ≤ p∗TAel,

para todo k = 1, . . . ,m e l = 1, . . . , n. Por linearidade, segue-seque

pTAq∗ ≤ p∗TAq,

para todo p ∈ Δm e q ∈ Δn. Em particular, pTAq∗ ≤ p∗TAq∗

e p∗TAq∗ ≤ p∗TAq, isto e, ul(p, q∗) ≤ ul(p

∗, q∗) e uc(p∗, q) ≤

uc(p∗, q∗) para todo p ∈ Δm e q ∈ Δn. Isto mostra que (p∗, q∗)

e um equilıbrio de Nash do jogo.

Page 173: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 170

170 [CAP. C: RESPOSTAS DOS EXERCICIOS

Para a matriz A de tamanho 4× 5 do enunciado, temos que

ul(p∗, e1) =

121

37, ul(p

∗, e2) =121

37, ul(p

∗, e3) =160

37,

ul(p∗, e4) =

121

37e ul(p

∗, e5) =169

37,

e

uc(e1, q∗) =

121

37, uc(e2, q

∗) =121

37, uc(e3, q

∗) =120

37e

uc(e4, q∗) =

121

37,

de modo que

min1≤l≤n

ul(p∗, el) = 121/37 = max

1≤k≤m(−uc(ek, q

∗)) = 121/37.

Pelo resultado acima, isto mostra que (p∗, q∗) e um equilıbriode Nash do jogo.

[06] Seja M =∑n

l=1 ail =∑n

k=1 akj a constante obtida pela somade qualquer linha ou coluna. Defina

p∗ = q∗ =

(1

n, . . . ,

1

n

)∈ Δn.

Observe que, para todo k, l ∈ {1, . . . , n}, ul(p∗, el) = p∗Ael =∑n

i=1 p∗i ail = p∗i

∑ni=1 ail = M/n e uc(ek, q

∗) = −ekAq∗ =

−∑nj=1 akjq

∗j = −q∗j

∑nj=1 akj = −M/n. Portanto,

min1≤l≤n

ul(p∗, el) =

M

n= max

1≤k≤m(−uc(ek, q

∗)).

Pelo resultado do exercıcio anterior, concluımos que (p∗, q∗) eum equilıbrio de Nash do jogo. Para o caso do quadrado magicoda gravura Melancolia I de Albrecht Durer,

p∗ = q∗ =

(1

4,1

4,1

4,1

4

)e o valor do jogo e v∗ = 34/4 = 17/2.

Page 174: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 171

171

[07] Se (p∗, q∗) e um equilıbrio de Nash totalmente misto, entao,pelas relacoes 4.5,

n∑j=1

aijq∗j = v∗, ∀i ∈ {1, . . . , n}.

Estas equacoes podem ser escritas usando-se matrizes da se-guinte maneira: Aq∗ = v∗�. Como, por hipotese, A e umamatriz inversıvel, segue-se que q∗ = v∗A−1

�. Agora,

n∑j=1

q∗j = 1 ⇒ 1 = �Tq∗ = v∗�TA� ⇒ v∗ =

1

�TA−1�.

Sendo assim,

q∗ =A−1

�TA−1�.

Do mesmo modo, pelas relacoes 4.6,

n∑i=1

p∗i aij = v∗, ∀j ∈ {1, . . . , n}.

Estas equacoes podem ser escritas usando-se matrizes da se-guinte maneira: p∗TAq∗ = v∗�. Como, por hipotese, A e umamatriz inversıvel, segue-se que p∗ = v∗�A−1 e, assim,

p∗ =�A−1

�TA−1�.

Capıtulo 5

[01] O equilıbrio de Nash em estrategias puras obtido por inducaoretroativa e

((Parar,Parar), (Parar,Parar)).

Este equilıbrio nao e Pareto eficiente pois, em comparacao como perfil acima,

((Continuar,Continuar), (Continuar,Continuar))

da um ganho maior para os dois jogadores.

Page 175: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 172

172 [CAP. C: RESPOSTAS DOS EXERCICIOS

[02] O equilıbrio de Nash em estrategias puras obtido por inducaoretroativa e

(Nao confiar,Trair).

Este equilıbrio nao e Pareto eficiente pois, em comparacao como perfil acima,

(Confiar,Honrar)

da um ganho maior para os dois jogadores.

Page 176: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 173

ReferenciasBibliograficas

[01] K. R. Apt, Uniform Proofs of Order Independence for VariousStrategy Elimination Procedures. Contributions to TheoreticalEconomics, vol. 4, no. 1, article 5, 48 paginas, 2004.

[02] R. Aumann, What Is Game Theory Trying to Accomplish?.Em Frontiers of Economics, K. Arrow, S. Honkapohja eB. Blackwell (editores), pp. 28-76, 1985.

[03] R. Avenhaus, M. Canty, D. M. Kilgour, B. von Stengel, S. Za-mir, Inspection Games in Arms Control. European Journal ofOperational Research, vol. 90, no. 3, pp. 383-394, 1996.

[04] G. S. Becker, Crime and Punishment: An Economic Approach.Journal of Politial Economy, vol 79, pp. 169-217, 1968.

[05] A. T. Benjamin e A. J. Goldman, Analysis of the N-CardGame Le Her. Journal of Optimization Theory and Applica-tions, vol. 114, no. 3, pp. 695–704, 2002.

[06] J. Bertrand. Theorie Mathematique de la Richesse Sociale.Journal des Savants, pp. 499-508, 1883.

[07] E. Borel, The Theory of Play and Integral Equations with SkewSymmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100,1953. Originalmente publicado em: Comptes Rendus Hebdo-madaires des Seances de l’Academie des Sciences, 1921.

173

Page 177: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 174

174 REFERENCIAS BIBLIOGRAFICAS

[08] E. Borel, On Games that Involve Chance and the Skill of thePlayers. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Origi-nalmente publicado em: Elements de la Theorie des Probabi-lites, 1924.

[09] T. Borgers, Pure Strategy Dominance. Econometrica, vol. 61,no. 1, pp. 423-430, 1993.

[10] S. J. Brams e D. M. Kilgour, Game Theory and National Se-curity. Basil Blackwell, 1988.

[11] F. Brandt, F. Fischer e Y. Shoham, On Strictly CompetitiveMulti-Player Games. Proceedings of the 21st National Confe-rence on Artificial Intelligence (AAAI), AAAI Press, pp. 605-612, 2006.

[12] J. N. Brown e R. W. Rosenthal, Testing The Minimax Hy-pothesis: A Re-Examination of O’Neill’s Game Experiment.Econometrica, vol 58, no. 5, pp. 1065-1081, 1990.

[13] L. I. de Castro e J. H. Faro, Introducao a Teoria da Escolha.25o Coloquio Brasileiro de Matematica, IMPA, 2005.

[14] V. Chvatal, Linear Programming. W. H. Freeman and Com-pany, 1983.

[15] Y. C. Chen, N. Y. Long e X. Luo, Iterated Strict Dominancein General Games. CIRANO Working Papers, 2007s-03, 2007.

[16] S.-F. Cheng e M. P. Wellman, Iterated Weaker-Than-WeakDominance Twentieth International Joint Conference on Ar-tificial Intelligence, Hyderabad, India, pp. 1233-1238, 2007.

[17] P. A. Chiappori, S. Levitt e T. Groseclose, Testing Mixed-Strategy Equilibria When Players Are Heterogeneous: The Caseof Penalty Kicks in Soccer. The American Economic Review,vol. 92, no. 4, pp. 1138-1151, 2002.

[18] V. Conitzer e T. Sandholm, Complexity of (Iterated) Domi-nance. Proceedings of the 6th ACM Conference on ElectronicCommerce, pp. 88–97, 2005.

Page 178: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 175

REFERENCIAS BIBLIOGRAFICAS 175

[19] A. A. Cournot, Recherches sur les Principes Mathematiques dela Theorie des Richesses, 1838. Traduzido por N. T. Bacon emResearches into the Mathematical Principles of the Theory ofWealth, McMillan, New York, 1927.

[20] R. S. Datta, Algebraic Methods in Game Theory. Tese de dou-torado, Departamento de Matematica, University of Californiaat Berkeley, 2003.

[21] R. S. Datta, Using Computer Algebra To Find Nash Equilibria.International Conference on Symbolic and Algebraic Compu-tation, Proceedings of the 2003 International Symposium onSymbolic and Algebraic Computation, pp. 74-79, 2003.

[22] R. S. Datta, Finding All Nash Equilibria of a Finite GameUsing Polynomial Algebra. Artigo aceito para publicacao, TheJournal of Economic Theory, 2007. Disponıvel eletronicamenteem: http://arxiv.org/abs/math.AC/0612462.

[23] G. Debreu, A Social Equilibrum Existence Theorem. Proceed-ings of the National Academy of Sciences of the United Statesof America (PNAS), vol. 38, no. 10, pp. 886-893, 1952.

[24] G. Debreu, Existence of Competitive Equilibrium. Em Hand-book of Mathematical Economics, vol. II, K. J. Arrow e M. D.Intriligator (editores), North-Holland, pp. 697-743, 1982.

[25] M. Dresher, Games of Strategy: Theory and Applications.Prentice-Hall, Englewood Cliffs, 1961.

[26] M. Dufwenberg e M. Stegeman, Existence and Uniqueness ofMaximal Reductions Under Iterated Strict Dominance. Econo-metrica, vol. 70, n. 5, pp. 2007–2023, 2002.

[27] K. Etessami, Algorithmic Game Theory and Aplications. Lec-ture Notes, School of Informatics, The University of Edinburgh,Scotland, UK, 2004.

[28] A. Fabrikant, A. Luthra, E. Maneva, C. H. Papadimitriou eS. Shenker, On a Network Creation Game. Annual ACM Sym-posium on Principles of Distributed Computing, Proceedings

Page 179: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 176

176 REFERENCIAS BIBLIOGRAFICAS

of the Twenty-Second Annual Symposium on Principles of Dis-tributed Computing, pp. 347–351, 2003.

[29] J. W. Friedman, Game Theory with Aplications to Economics,Second Edition. Oxford University Press, 1990.

[30] D. Fudenberg e D. K. Levine, The Theory of Learning inGames. The MIT Press, 1996.

[31] D. Fudenberg e J. Tirole, Game Theory. The MIT Press, 1995.

[32] I. Gilboa, E. Kalai e E. Zemel, On the Order of Elimina-ting Dominated Strategies. Operations Research Letters, vol. 9,pp. 85–89, 1990.

[33] I. Gilboa, E. Kalai e E. Zemel, The Complexity of EliminatingDominated Strategies, Mathematics of Operations Research,vol. 18, no. 3, pp. 553–565, 1993.

[34] I. L. Glicksberg, A Further Generalization of the KakutaniFixed Point Theorem, with Application to Nash EquilibriumPoints, Proceedings of the American Mathematical Society,vol. 3, no. 1, pp. 170-174, 1952.

[35] S. Govindan e R. Wilson, Direct Proofs of Generic Finitenessof Nash Equilibrium Outcomes. Econometrica, vol. 69, no. 3,pp. 765-769, 2001.

[36] F. Gul, D. Pearce, E. Stacchetti, A Bound on The Proportionof Pure Strategy Equilibria in Generic Games. Mathematics ofOperations Research, vol. 18, no. 3, pp. 548-552, 1993.

[37] A. Hald, A History of Probability and Statistics and Their Ap-plications before 1750. John Willey & Sons, New York, 1990.

[38] G. Hardin, The Tragedy of the Commons. Science, vol 162,pp. 1243-1248, 1968.

[39] J. C. Harsanyi, Games with Randomly Disturbed Payoffs: ANew Rationale for Mixed Strategy. International Journal ofGame Theory, vol. 2, no. 1, pp. 1-23, 1973.

Page 180: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 177

REFERENCIAS BIBLIOGRAFICAS 177

[40] J. C. Harsanyi, Oddness of The Number of Equilibrium Points:A New Proof. International Journal of Game Theory, vol. 2,no. 1, pp. 235-250, 1973.

[41] S. Hart, Games in Extensive and Strategic Forms. Capıtulo 2em Handbook of Game Theory, vol. 1, R. J. Aumann e S. Hart(editores), Elsevier Science Publishers, 1992.

[42] J. B. Hiriart-Urruty e C. Lemarechal, Convex Analysis and Mi-nimization Algorithms I: Fundamentals. Springer-Verlag, 1993.

[43] J. Hirshleifer e E. Rasmusen, Are Equilibrium Strategies Unaf-fected by Incentives?. Journal of Theoretical Politics, vol. 4,no. 3, pp. 353-367, 1992.

[44] H. Hotelling, The Stability of Competition. The Economic Jour-nal, vol 39, no. 153, pp. 41-57, 1929.

[45] S. Kakutani, A Generalization of Brouwer’s Fixed Point The-orem. Duke Mathematical Journal, vol 8, pp. 457-459, 1941.

[46] T. H. Kjeldsen, John von Neumann’s Conception of the Mini-max Theorem: A Journey Through Different MathematicalContexts. Archive for History of Exact Sciences, vol. 56, no. 1,pp. 39-68, 2001.

[47] D. Knuth, C. Papadimitriou e J. Tsitsiklis, A Note on StrategyElimination in Bimatrix Games. Operations Research Letters,vol. 7, pp. 103–107, 1988.

[48] D. M. Kreps, Game Theory and Economic Modelling. Claren-don Lectures in Economics, Oxford University Press, 1990.

[49] C. E. Lemke e J. T. Howson Jr., Equilibrium Points of Bima-trix Games. Journal of the Society for Industrial and AppliedMathematics, vol. 12, no. 2, pp. 413-423, 1964.

[50] R. J. Leonard, From Parlor Games to Social Science: Von Neu-mann, Morgenstern, and the Creation of Game Theory 1928-1944. Journal of Economic Literature, vol. 33, no. 2, pp. 730-761, 1995.

Page 181: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 178

178 REFERENCIAS BIBLIOGRAFICAS

[51] R. J. Lipton e E. Markakis, Nash Equilibria via PolynomialEquations. Em LATIN 2004: Theoretical Informatics, LecturesNotes in Computer Science, Springer-Verlag, pp. 413-422, 2004.

[52] D. G. Luenberger, Linear and Nonlinear Programming, SecondEdition. Addision-Wesley Publishing Company, 1989.

[53] W. B. MacLeod, Incentives in Organizations: An Overview ofSome of the Evidence and Theory. Em Trends in Business Or-ganization, Horst Siebert (editor), The Kiel Institute of WorldEconomics, 1995.

[54] E. Markakis, Computational Aspects of Game Theory and Mi-croeconomics. Tese de doutorado, Faculdade de Computacao,Georgia Institute of Technology, 2005.

[55] L. M. Marx e J. M. Swinkels, Order Independence for Iterat-ed Weak Dominance. Games and Economic Behavior, vol 18,pp. 219–245, 1997.

[56] J. Maynard Smith e G. R. Price, The Logic of Animal Conflict.Nature, vol. 246, no. 5427, pp. 15-18, 1973.

[57] K. A. McCabe, A. Mukherji e D. E. Runkle, An ExperimentalStudy of Information and Mixed-Strategy Play in Three-PersonMatching-Pennies Game. Economic Theory, vol. 15, pp. 421-462, 2000.

[58] R. D. McKelvey, A Liapunov Function for Nash Equilibria. So-cial Science Working Paper 953, California Institute of Tech-nology, 1998.

[59] R. D. McKelvey e A. McLennan, The Maximal Number of Regu-lar Totally Mixed Nash Equilibria. Journal of Economic Theory,vol. 72, pp. 411-425, 1997.

[60] A. McLennan, The Maximal Generic Number of Pure NashEquilibria. Journal of Economic Theory, vol. 72, no. 2, pp. 408-410, 1997.

Page 182: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 179

REFERENCIAS BIBLIOGRAFICAS 179

[61] I. Milchtaich, Congestion Games with Player-Specific PayoffFunctions. Games and Economic Behavior, vol 13, n. 1,pp. 111–124, 1996.

[62] P. R. Milgrom e R. J. Weber, A Theory of Auctions and Com-petitive Bidding. Econometrica, vol. 50, no. 5, pp. 1089-1122,1982.

[63] J. Milnor, Analytic Proofs of the “Hairy Ball Theorem” and theBrouwer Fixed Point Theorem. The American MathematicalMonthly, vol. 85, no. 7, pp. 521-524, 1978.

[64] K. G. Murty, Linear Complementarity, Linear and NonlinearProgramming. Heldermann-Verlag, 1988.

[65] R. G. Myerson, Nash Equilibrium and the History of Econo-mic Theory. Journal of Economic Literature, vol. 37, no. 3,pp. 1067-1082, 1999.

[66] J. F. Nash Jr., Equilibrium Points in n-person Games. Procee-dings of the National Academy of Sciences of the United Statesof America, pp. 48–49, 1950.

[67] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Prince-ton University Press, 1950.

[68] J. F. Nash Jr., The Bargaining Problem. Econometrica, vol. 18,no. 2, pp. 155–162, 1950.

[69] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathemat-ics, vol. 54, pp. 286–295, 1951.

[70] J. F. Nash Jr., Two-person Cooperative Games. Econometrica,pp. 128–140, 1953.

[71] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathe-matische Annalen, vol. 100, pp. 295-320. Traduzido por S.Bargmann: On the Theory of Games of Stategy em Contribu-tions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tuckere R. D. Luce (editores), Princeton University Press, 1959.

Page 183: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 180

180 REFERENCIAS BIBLIOGRAFICAS

[72] J. von Neumann e O. Morgenstern, Theory of Games and Eco-nomic Behavior. Princeton University Press, 1944.

[73] B. O’Neill, Nonmetric Test of the Minimax Theory of Two-person Zerosum Games. Proceedings of the National Academyof Sciences of the United States of America (PNAS), vol. 84,pp. 2106-2109, 1987.

[74] M. J. Osborne e A. Rubinstein, A Course in Game Theory.The MIT Press, 1994.

[75] R. Otter e J. Dunne, Games with Equilibrium Points. Proceed-ings of the National Academy of Sciences of the United Statesof America (PNAS), vol. 39, pp. 310-314, 1953.

[76] R. Radner e R. Roshental, Private Information and Pure Strat-egy Equilibrium. Mathematics of Operations Research, vol. 7,pp. 401-409, 1982.

[77] A. Rapoport e R. B. Boebel, Mixed Strategies in Strictly Com-petitive Games: A Further Test of The Minimax Hypothesis.Games and Economic Behaviour, vol. 4, no. 2, pp. 261-283,1992.

[78] P. J. Reny, On The Existence of Pure and Mixed Strategy NashEquilibria in Discontinuous Games. Econometrica, vol. 67,no. 5, pp. 1029-1056, 1999.

[79] C. A. Rogers, A Less Strange Version of Milnor’s Proof ofBrouwer’s Fixed-Point Theorem. The American MathematicalMonthly, vol. 87, no. 7, pp. 525-527, 1980.

[80] R. W. Rosenthal, A Class of Games Possessing Pure-StrategyNash Equilibria. International Journal of Game Theory, vol. 2,n. 1, pp. 65–67, 1973.

[81] A. Rubinstein, Comments On The Interpretation of Game The-ory. Econometrica, vol. 59, no. 4, pp. 909-924, 1991.

[82] B. W. Russell, Common Sense and Nuclear Warfare. GeorgeAllen & Unwin, 1959.

Page 184: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 181

REFERENCIAS BIBLIOGRAFICAS 181

[83] T. L. Saaty, Mathematical Models of Arms Control and Disar-mament: Application of Mathematical Structures in Politics.John Wiley & Sons, 1968.

[84] R. Savani e B. von Stengel, Exponentially Many Steps for Find-ing a Nash Equilibrium in a Bimatrix Game. CDAM ResearchReport LSE-CDAM-2004-03, 2004.

[85] T. C. Schelling, The Strategy of Conflict. Oxford UniversityPress, 1968.

[86] U. Schwalbe e P. Walker, Zermelo and the Early History ofGame Theory. Games and Economic Behavior, vol. 34, no. 1,pp. 123-137, 2001.

[87] L. S. Shapley, A Note on the Lemke-Howson Algorithm.Mathematical Programming Study I: Pivoting and Extensions,pp. 175-189, 1974.

[88] H. von Stackelberg, Marktform und Gleichgewicht. JuliusSpringer, 1934.

[89] T. Stuckless, Brouwer’s Fixed Point Theorem: Methods ofProof and Generalizations. Dissertacao de mestrado, Departa-mento de Matematica, Simon Fraser University, 2003.

[90] I. Todhunter, A History of the Mathematical Theory of Proba-bility. Chelsea, New York, 1949.

[91] J. P. Torres-Martınez, Fixed Points as Nash equilibria. FixedPoint Theory and Applications, vol. 2006, 4 paginas, 2006.

[92] G. Tsebelis, The Abuse of Probability In Political Analysis: TheRobison Crusoe Fallacy. The American Political Science Re-view, vol. 83, no. 1, pp. 77-91, 1989.

[93] G. Tsebelis, Are Sanctions Effective? A Game-TheoreticAnalysis. The Journal of Conflict Resolution, vol. 34, no. 1,pp. 3-28, 1990.

Page 185: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 182

182 REFERENCIAS BIBLIOGRAFICAS

[94] A. Vetta, Nash Equilibria in Competitive Societies, with Ap-plications to Facility Location, Traffic Routing and Auctions.Proceedings of the 43rd Annual IEEE Symposium on Founda-tions of Computer Science (FOCS’02), IEEE Computer Society,pp. 416–425, 2002.

[95] N. N. Vorob’ev, Foundations of Game Theory: NoncooperativeGames. Birkhauser Verlag, 1994.

[96] P. Walker, A Chronology of Game Theory. http://www.econ.canterbury.ac.nz/personal pages/paul walker/gt/hist

.htm, 2005.

[97] R. Wilson, Computing Equilibria of N-Person Games. SIAMJournal on Applied Mathematics, vol. 21, no 1, 1971.

[98] E. Zermelo, Uber eine Anwendung der Mengdenlehre auf dietheories des Schachspiels. Atas do Decimo Quinto CongressoInternacional de Matematicos, vol. 2, pp. 501–504, 1913.

[99] J. Zhao, The Equivalente Between Four Economic Theoremsand Brouwer’s Fixed Point Theorem. Working paper, Depart-ment of Economics, Iowa State University, 2002.

Page 186: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 183

Indice

Arvore, 109

Bernoulli, Nicholas, 5, 126Bertrand

Modelo de duopolio, 129Binmore, Kenneth, 119Borel, Emile, 6

Combinacao convexa, 31, 138Complementaridade Linear, 102Conjunto

admissıvel de um PL, 145convexo, 137

CournotAugustin, 5Modelo de duopolio, 126

de Montmort, Pierre Remond,126

Dominanciaem estrategias mistas, 32em estrategias puras, 14estrita iterada, 15, 34fraca iterada, 18

Durer, Albrecht, 107

Eficiencia de Pareto, 59Equilıbrio

de estrategia estritamentedominante, 15, 35

de estrategia fracamente do-minante, 18

de Nash, 20, 110em estrategiasmistas, 35

perfeito em subjogos, 117Espaco de estrategias

mistas, 29puras, 11

Estrategiade um jogo sequencial, 109mista, 27suporte, 80

pura, 11totalmente mista, 69

Folgas complementares, 102Folha de uma arvore, 109Forma

normal, 11padrao de um PL, 146

Funcaoconcava, 139convexa, 139de melhor reposta, 22objetivo de um PL, 145quase-concava, 142quase-convexa, 142

183

Page 187: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 184

184 INDICE

utilidade, 11esperada, 30

Gambit, 104Ganho, 10

Hardin, Garret, 134Harsanyi, John, 9

Inducao retroativa, 114Informacao perfeita, 108

Jogoa batalha dos sexos, 13bimatricial, 101Chicken, 52comparar moedas, 21da centopeia, 119da confianca, 119da inspecao, 42de informacao perfeita, 108de soma zero, 822× 2, 1062× n, 169matriz inversıvel, 107quadrado magico, 107

do covarde, 52estrategico, 11estritamente competitivo,

82hawk-dove, 54Le Her, 120na forma extensa, 108na forma normal, 11nao-cooperativo, 11o dilema do prisioneiro, 11quadrado magico, 107sequencial, 108

Kalmar, Laszlo, 6

Le Her, 120Lloyd, William Forster, 133

Market-clearing, 127Matriz de payoffs , 12Melhor resposta, 22Metodo simplex, 149Modelo de Duopolio

de Bertrand, 129de Cournot, 126de Stackelberg, 131

Montmort, Pierre Remond, 5Morgenstern, Oskar, 8

NashEquilıbrio deem estrategiasmistas, 35em estrategias puras, 20

Nash Jr., John Forbes, 9, 60No de uma arvore, 109

Otimo de Pareto, 59

Pareto, eficiencia de, 59Payoff , 10Perfil de estrategias

mistas, 29puras, 11

Politopo, 138Ponto

extremo, 148fixo, 60, 65

Problemade complementaridade li-

near, 102dual, 150dual de um LP, 150

Page 188: UMA INTRODUC¸AO˜ ATEORIA` ECONOMICA DOS JOGOSˆ · 2017. 2. 2. · Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no jogo. Em termos matem´aticos, cada jogador

“tdj”2017/2/2page 185

INDICE 185

primal de um LP, 150Produto homogeneo, 126Proposicao da Irrelevancia do Payoff,

47

Quadrado magico, 107

Raiz de uma arvore, 109Ramo de uma arvore, 109Rosenthal, Robert W., 119Russell, Bertrand, 52

Selten, Reinhard, 9, 117Semiespaco, 138Semiplano, 138Simplex, 149Solucao

basica de um PL, 148Solucao estrategica, 20Stackelberg

Modelo de duopolio, 131Subjogo, 116Suporte, 80

Teoremado ponto fixo de Brouwer,

60do ponto fixo de Kakutani,

65forte de dualidade, 152fraco de dualidade, 152fundamental da programacao

linear, 148Tucker, Albert W., 11

Utilidade, 11esperada, 30

Variavel

basica de um PL, 148de folga de um PL, 146

von Neumann, John, 7von Stackelberg, Heinrich, 131

Waldegrave, James, 5, 126Whitehead, Alfred North, 134

Zermelo, Ernst, 6