John Nash -(Theory of the Games) Teoria Dos Jogos

57
Teoria dos Jogos Prof. Roberto Ellery Jr Departamento de Economia Universidade de Brasília

Transcript of John Nash -(Theory of the Games) Teoria Dos Jogos

Teoria dos Jogos

Prof. Roberto Ellery JrDepartamento de EconomiaUniversidade de Brasília

Conteúdo

Conceitos fundamentais

Resolução de um jogo

Jogos simultâneos de informação completa

Jogos seqüenciais repetidos

BibliografiaFIANI, Ronaldo; Teoria dos Jogos, Ed. Campus : Rio de Janeiro, 2004.

RUBINFELD, Daniel e Robert PINDYCK; Microeconomia, Prentice Hall Brasil : São Paulo, 2002.

GIBBONS, Robert; Game Theory for Applied Economists, Princeton UniversityPress : Princeton, 1992

O Que é um Jogo?

Situação onde ocorre iterações entre agentes racionais que se comportam de forma estratégica visando atingir um objetivo que depende do comportamento de todos os agentes envolvidos.

O Que é um Jogo?Agente: Participante de um jogo. Pode ser um indivíduo, um grupo de indivíduos, uma firma ou mesmo o governo. Em teoria dos jogos são chamados de jogadores.Racionalidade: Os indivíduos procuram usar os meios mais adequados para atingir seus objetivos.Comportamento Estratégico: Cada jogador toma decisões considerando que suas decisões terão efeitos sobre os outros jogadores, bem como as decisões dos outros jogadores terão efeitos sobre suas decisões.

Exemplos de Jogos

Duas pessoas decidem quem paga a conta no “par-ou-impar”.Um casal decide onde ir a noite.Empresas decidem se formam ou não um cartel.Negociações internacionais para controle da emissão de gases poluentes.

Jogos na Forma EstratégicaConjunto de Jogadores.

Conjunto de Estratégias para cada Jogador.

Conjunto de resultados (payoffs) do jogo. Descreve o ganho ou perda de cada jogador quando um conjunto de estratégias é escolhido.

Exemplo: Par ou Impar

Existem dois jogadores, A e B.Cada jogador pode escolher um número par ou um número impar.Se a soma dos números for par, A ganha 1 e B perde 1; se a soma dos números for impar, B ganha 1 e A perde 1.

Exemplo: Dilema dos Prisioneiros

Existem dois jogadores, A e B.Cada jogador pode escolher entre confessar e não confessar.Se apenas um confessar ele é solto e o outro é condenado a seis meses de prisão. Se ambos negarem cada um pega um mês de prisão. Se ambos confessarem a pena é de três meses para cada um.

Exemplo: Guerra dos Sexos

Existem dois jogadores, H e M.Cada jogador pode escolher entre ir ao teatro ou ao futebol.Se ambos forem ao teatro o homem ganha 1 e a mulher 2. Se ambos forem ao futebol o homem ganha 2 e a mulher 1. Caso escolham ir a lugares diferentes ninguém ganha nada.

Jogo do Covarde (Chicken)

Dois jogadores, A e B.Cada jogador escolhe desviar ou não-desviar.Se ambos escolherem não-desviar ambos perdem 2. Se um escolher desviar e outro não-desviar o que não desviou ganha 2 e o que desviou perde 1. Se ambos desviarem ambos ficam com zero.

Matriz de Resultados

Matriz que representa as estratégias de cada jogadores bem como o resultado de cada jogador associado a cada conjunto de estratégias.

Exemplo: Par ou Impar

BPar Impar

1;-1-1;1

-1;11;-1Par

AImpar

Exemplo: Dilema dos Prisioneiros

B

-1;-1-6;0

0;-6-3;-3

Não ConfessaConfessa

Confessa

ANãoConfessa

Exemplo: Guerra dos Sexos

MFutebol Teatro

1;20;0

0;02;1Futebol

HTeatro

Exercício

Construa a matriz de resultados para o Jogo do Covarde.

Jogos na Forma Estendida

A representação é feita por meio de árvores dos jogos. Esta forma é usada para representar jogos onde as ações obedecem um padrão temporal.

Características de uma Árvore

Todo nó deve ser precedido por, no máximo, um outro nó.Nenhuma trajetória pode ligar um nó a ele mesmo.Todo nó na árvore de um jogo deve ser sucessor de um único e mesmo nó inicial.

Exemplo: Par ou Impar

A•

••Bpar

par

parimparimpar

impar

-1

1

-1

1

1

-1

1

-1

Exemplo: Dilema dos Prisioneiros

A•

••Bc

c

c ncnc

nc

-6

0

0

-6

-1

-1

-3

-3

Exemplo: Guerra dos Sexos

H•

••Mf

f

f tt

t

1

2

0

0

2

1

0

0

Exercício

Represente o Jogo do Covarde na forma estendida.

Jogo Seqüencial

Um jogo é dito seqüencial quando os jogadores executam suas ações de acordo com uma ordem pré-determinada.

Exemplo de Jogos Seqüenciais

Mercado com firma líder.Um país decidir se deve aderir a um tratado de não proliferação de armas.Guerra dos sexos para cavalheiros.

Exemplo: Entrada no Mercado

Existem dois jogadores, Firma Nova e Monopolista.A firma nova decide se entra ou não entra no mercado. O monopolista decide se luta ou acomoda a firma nova.A firma monopolista ganha 9 se manter o monopólio. A nova firma ganha 1 se ficar fora do mercado. Se ocorrer competição ambas as firmas ganham zero. No caso de acomodar a firma nova ganha 2 e a monopolista 1.

Exemplo: Entrada no Mercado

FN•

••M

entra

acomoda luta

não entra

acomodaluta

1

9

1

9

2

1

0

0

Conceitos Importantes

Estratégia: É um plano de ações que específica, para um determinado jogador, qual ação tomar, em todos os momentos que terá de decidir o que fazer.Conjunto de Informações: É formado pelos nós que o jogador acredita pode ter alcançado em uma determinada etapa do jogo quando é sua vez de jogar.

Conjunto de Estratégias

Chamamos conjunto de estratégias ou espaço de estratégias o conjunto de estratégias a disposição do jogador.

Estratégia Dominante

Uma estratégia é dita dominante se os resultados proporcionados por ela são melhores para o jogador independente das ações tomadas pelos outros jogadores.

Exemplos de Estratégias Dominantes

No dilema dos prisioneiros “confessar” é uma estratégia dominante para cada jogador.No jogo de par ou impar não existe estratégia dominante.No jogo da entrada no mercado “acomodar” é uma estratégia fracamente dominante.

Solução por Eliminação de Estratégias Dominadas

O método mais simples de resolver um jogo é eliminando sucessivamente as estratégias dominadas para cada jogador.

Exemplo: Dilema do Prisioneiro

-1;-1-6;0

0;-6-3;-3

Não Confessa

B

Confessa

Confessa

ANãoConfessa

Eliminação de Estratégias Dominadas

BB1 B2 B3 B4

A

3,07,24,40,2

2,-16,05,21,1

0,25,41,13,0A1

A2

A3

Exemplo: Par ou Impar

BPar Impar

1;-1-1;1

-1;11;-1Par

AImpar

Equilíbrio de Nash

Um conjunto de estratégias constitui um Equilíbrio de Nash se a escolha de cada jogador for ótima dada a escolha de todos os outros jogadores. O Equilíbrio de Nashimplica em não arrependimento.

Exemplo: Guerra dos Sexos

A estratégia (F,F) é um Equilíbrio de Nash (E.N.) pois dado que o homem escolheu ir ao futebol o melhor que a mulher faz é ir ao futebol e dado que a mulher escolheu ir ao futebol o melhor que o homem faz é ir ao futebol.Existe outro Equilíbrio de Nash?

Encontrando Equilíbrio de Nash

MFutebol Teatro

1;20;0

0;02;1Futebol

HTeatro

Exercícios

Por que o homem ir ao futebol e a mulher ir ao teatro não é um Equilíbrio de Nash?

Encontre o E.N. no Dilema dos Prisioneiros.

Equilíbrio de Nash e Bem-Estar

Nem sempre um Equilíbrio de Nashgarante o máximo de bem-estar. O Dilema do Prisioneiro fornece um exemplo onde ambos escolherem não confessar traria o máximo de bem-estar, porém ambos escolhem confessar.

Problema do Recurso Comum

Dois jogadores, A e B.Cada jogador escolhe se pesca ou não pesca.Se ambos pescarem ambos ficam com 3. Se um pescar e outro não o que pescou fica com 5 e o que não pescou fica com 0. Se nenhum pescar ambos ficam com 5.

Matriz do Jogo

BPescar Não-Pescar

5;50;6

6;03;3Pescar

ANão Pescar

Explorando um Garimpo

Suponha que foi encontrada uma mina de ouro com livre acesso para qualquer garimpeiro.Um grama de ouro custa R$ 1,00.O material de garimpagem pode ser adquirido por R$ 4,00.A produção de ouro é dada por f(n) = 20n – 2n2, onde n é o número de garimpeiros.

Explorando um Garimpo

O lucro de todos os garimpeiros será dado por:

Lucro = f(n) – 4n = 20n – 2n2 – 4nO valor de n que maximiza este lucro é dado por:

4n = 16 => n = 4O lucro será dado por:

20X4 – 2X16 – 4X4 = 32

Explorando um Garimpo

Como cada garimpeiro decide sem consultar os demais, é de se esperar que o garimpeiro vá ao garimpo se o ganho obtido for maior do que o custo dos equipamentos.Neste caso novos garimpeiros chegarão até que f(n)/n = c, ou seja, n = 8.Note que o lucro total agora é dado por 20X8 – 2X64 – 4X8 = 0

Recursos Comuns e Bem-Estar

Problemas como o uso de recursos comuns justificam a intervenção do governo em questões ambientais.

Equilíbrio de Nash no Par ou Impar

BPar Impar

1;-1-1;1

-1;11;-1Par

AImpar

Estratégias MistasAté aqui foi feita a hipótese que os jogadores escolhem ou não escolhem determinadas estratégias. Na verdade este é apenas um caso extremo dentre diversas possibilidades, em alguns casos é interessante dispensar tal hipótese. Devemos considerar casos onde ao invés de escolher uma estratégia (estratégia pura), o jogador escolhe uma distribuição de probabilidade das possíveis estratégias, chamada estratégia mista. Desta forma, uma estratégia pura pode ser vista como uma estratégia mista onde a probabilidade de escolher uma determinada estratégia é um.

Equilíbrio de Nash em Estratégias Mistas

Um conjunto de estratégias mistas é um Equilíbrio de Nash se, para todos os jogadores, a estratégia garante o melhor resultados das as escolhas de todos os outros jogadores.

Exemplo: Guerra dos Sexos

MFutebol Teatro

1;20;0

0;02;1Futebol

HTeatro

Jogos de Informação Incompleta

Um jogo é de informação incompleta quando um ou mais jogadores não sabe todas as informações a respeito do outros.

Exemplo: Prisioneiro Fiel e o Primo do Delegado

N•

p

1-p

A

BNC

NC

NC

NC NC

NC

C

C

C

C

C

C

-1,10

A

B

-5,-50,-2

0,-2

-10,-1

-10,-7-1,-10

-5,-11

Solução

Se o prisioneiro B for normal sempre escolherá confessar.Se o prisioneiro B for “fiel” sempre vais escolher não-confessar.

Solução

Prisioneiro B é normalA confessa -5A não confessa -10

Prisioneiro B é fielA confessa -1A não confessa 0

Solução

Ganho esperado de confessar:-5p – (1-p)

Ganho esperado de não confessar:-10p

A confessa se:-5p – (1-p) > -10p, ou seja, sep > 1/6

Jogos Repetidos Finitos

Quando o jogo é jogado por um número finito de vezes ele pode ser resolvido de “trás para frente”. Este processo é chamado indução reversa.

Exemplo: Dilema dos Prisioneiros

B

-1;-1-6;0

0;-6-3;-3

Não ConfessaConfessa

Confessa

ANãoConfessa

Jogos Repetidos Infinitos

Quando um jogo é repetido um número infinito de vezes não existe um último período. Neste caso é possível ocorrer uma estratégia de punição.