Jogos em Forma Extensaleandro/slide_Formaextensa.pdf · Informação Perfeita Estratégias...

99
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita Jogos em Forma Extensa Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 12 de Setembro de 2014

Transcript of Jogos em Forma Extensaleandro/slide_Formaextensa.pdf · Informação Perfeita Estratégias...

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos em Forma Extensa

Prof. Leandro Chaves Rêgo

Programa de Pós-Graduação em Estatística - UFPE

Programa de Pós-Graduação em Engenharia de Produção - UFPE

Recife, 12 de Setembro de 2014

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos em Forma Extensa

Até o momento estudamos apenas casos onde jogadores se movem ao mesmotempo e uma única vez. Contudo em muitas situações estratégicas os jogadoresimplementam suas estratégias ao longo do tempo e podem obter informaçõessobre as estratégias que estão sendo utilizadas pelos outros jogadores. Paraanalisar tais situações precisamos de uma outra forma de representar jogos, queé conhecida como representação em forma extensa de jogos.

Intuitivamente, um jogo em forma extensa descreve o conjunto de jogadores,quem se move e quando e quais são suas opções, a utilidade dos jogadores paracada possível maneira de jogo ser realizado, e finalmente, o que os jogadoressabem quando se movem em cada situação do jogo. Em um jogo em formaextensa admite-se a possibilidade de eventos aleatórios influenciarem narealização do jogo, como por exemplo, o resultado da jogada de um dado. Taiseventos aleatórios são representados no jogo como se fossem feitos por umoutro jogador denominado chance ou natureza, sendo que este jogador nãopossui preferências sobre os possíveis resultados do jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos com Informação Perfeita

Definição

Formalmente, temos que um jogo em forma extensa com informação perfeita éum vetor Γ = (N,M,H,P, fc , {ui : i ∈ N}), onde

N é um conjunto que consiste dos agentes participando do jogo.

M é um conjunto cujos elementos são os movimentos ou açõesdisponíveis aos jogadores ou a chance durante o jogo.

H é um conjunto de seqüências de movimentos (elementos de M) que éfechado com relação a prefixos, isto é, se h ∈ H e h′ for um prefixo de h,então h′ ∈ H.a Além disso, se 〈a1, . . . aK 〉 ∈ H para todo inteiro finito K ,então (an)

∞n=1 ∈ H. Denotaremos por X (h) o conjunto de prefixos de h.

aUm prefixo de uma seqüência (xn) de comprimento K é qualquersubseqüência de (xn) que consiste dos primeiros l ≤ K termos de (xn). Porexemplo, se h = 〈m5,m8,m1〉 os prefixos de h são 〈〉,〈m5〉,〈m5,m8〉, e〈m5,m8,m1〉.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos com Informação Perfeita

Definição

Intuitivamente, cada membro de H é uma possível história do jogo. Podemosidentificar nós em uma árvore com histórias em H. Cada nó n é caracterizadopor uma seqüência de ações necessárias para atingirmos n. Uma trajetória

completa em H é uma história terminal, uma que não é prefixo estrito denenhuma outra história em H. Seja Z o conjunto de trajetórias completas deH. Seja Mh = {m ∈ M : h · 〈m〉 ∈ H} (onde utilizamos · para denotarconcatenação de seqüências); Mh é o conjunto de ações que podem sertomadas após a história h.

P : (H − Z ) → N ∪ {c} é uma função que associa cada história nãoterminal h a um elemento de N ∪ {c}. (c representa movimentosaleatórios que podem ocorrer durante o jogo, usualmente chama-se c dejogador chance ou natureza.)

Se P(h) = i , então jogador i se move após história h; se P(h) = c, entãochance se move após h. Seja Hi = {h : P(h) = i} o conjunto de todashistórias após as quais o jogador i se move.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos com Informação Perfeita

Definição

fc é um função que associa a cada história em que P(h) = c uma medidade probabilidade fc(· | h) em Mh. Intuitivamente, fc (· | h) descreve umadistribuição de probabilidade sobre as ações disponíveis para a naturezauma vez que a história h é atingida.

ui : Z → IR é a função utilidade para o jogador i , que associa um númeroreal (utilidade de i) para cada trajetória completa do jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos com Informação Perfeita

Exemplo

Um jogo em forma extensa é finito se N,M, e H forem finitos. O próximoexemplo ilustra a relação entre um árvore de jogo e a definição formal de jogosem forma extensa dada acima.

Figura: Um jogo em forma extensa simples.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogos com Informação Perfeita

Exemplo

No jogo da Figura 1, temos

N = {A,B}, H = {〈 〉, 〈downA〉, 〈acrossA〉,〈acrossA, downB〉, 〈acrossA, acrossB 〉},

P(〈 〉) = A, P(〈acrossA〉) = B,

uA(〈downA〉) = uB(〈downA〉) = 1,

uA(〈acrossA, acrossB 〉) = 0,

uB(〈acrossA, acrossB 〉) = 2,

uA(〈acrossA, downB〉) = 2, e

uB(〈acrossA, downB 〉) = 3.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Competição de Stackelberg

Exemplo

Suponha que uma firma 1 desenvolve uma nova tecnologia antes que umafirma 2 e como conseqüência tem a oportunidade de construir uma fábrica eescolher um nível de produção q1 antes que a firma 2 comece sua produção. Afirma 2 então observa a escolha da firma 1 antes de escolher seu nível deprodução q2. Por exemplo, assuma que qi ∈ {0, 1, 2}, que o preço de mercadoé dado por p(q1, q2) = 3 − q1 − q2, e que o custo de produção é zero. Asfirmas são obrigadas a vender toda a produção pelo preço de mercado pois nãopossuem local para armazenagem e a destruição de produtos tem um customuito elevado.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Competição de Stackelberg

Exemplo

Deste modo temos que:

N = {1, 2}, H = {〈 〉, 〈0〉, 〈1〉, 〈2〉, 〈0, 0〉, 〈0, 1〉, 〈0, 2〉, 〈1, 0〉, 〈1, 1〉,〈1, 2〉, 〈2, 0〉, 〈2, 1〉, 〈2, 2〉},

P(〈 〉) = 1, P(〈0〉) = P(〈1〉) = P(〈2〉) = 2,

u1(〈0, q2〉) = u1(〈1, 2〉) = u1(〈2, 1〉) = 0,

u1(〈1, 0〉) = u1(〈2, 0〉) = 2,

u1(〈1, 1〉) = u2(〈1, 1〉) = 1,

u1(〈2, 2〉) = u2(〈2, 2〉) = −2,

u2(〈q1, 0〉) = u2(〈1, 2〉) = u2(〈2, 1〉) = 0, e

u2(〈0, 1〉) = u2(〈0, 2〉) = 2.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Estratégias

Definição 2.1

Uma ação para um jogador é uma opção disponível que pode escolher apósuma determinada história do jogo, onde uma história do jogo é umasequência de ações realizadas pelos jogadores no passado e pelo jogadorchance. Por exemplo, definição da capacidade instalada, quantidade derecursos destinados ao marketing, preços, etc.

Definição 2.2

Uma estratégia pura para o jogador i em um jogo em forma extensa cominformação perfeita é uma função si que associa cada história h ∈ Hi umelemento de Mh, ou seja, uma ação disponível para i em h.

Definição 2.3

Se Ci é o conjunto de estratégias puras para o jogador i em um jogo emforma extensa com informação perfeita, uma estratégia mista para ojogador i em um jogo em forma extensa é uma distribuição deprobabilidade δi em Ci , ou seja, um elemento de ∆(Ci ).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Estratégia Comportamental

Para jogos em forma extensa com informação perfeita existe uma outra noçãode estratégia, chamada de estratégia comportamental, que especifica umarandomização independente para cada história em que o jogador se move.

Definição 2.4

Uma estratégia comportamental para o jogador i em um jogo em formaextensa com informação perfeita é uma função σi que associa cada históriah ∈ Hi um elemento de ∆(Mh), ou seja, uma distribuição de probabilidadesobre as ações disponíveis para i em h.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Observação

Note que uma estratégia é um plano de contingência completo que explica oque um jogador irá fazer em cada situação que possa aparecer no jogo. Comouma estratégia é um plano de contingência completo, ao contrário das ações,ela não é observável. Uma ação é física, porém uma estratégia é apenasmental. A primeira vista, uma estratégia parece especificar ações em excesso,pois ações no começo do jogo podem tornar impossível que certas históriassejam atingidas. Então, por que temos que especificar como jogadores secomportam em histórias que nunca serão atingidas se os jogadores seguemcertas ações no começo do jogo? A razão é que como jogadores se comportamfora da trajetória de equilíbrio será crucial para determinar se um dado perfil deestratégias é um equilíbrio de Nash. Ameaças em caminhos fora do equilíbriopodem ser essenciais. Falaremos mais sobre isso adiante.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Figura: Um jogo em forma extensa no qual o jogador 1 se move antes e

depois do jogador 2.

Neste jogo, jogador 1 possui quatro estratégias puras: AE ,AF ,BE ,BF .Jogador 2 possui duas estratégias puras: C e D . Note que temos queespecificar o que o jogador 1 fará após a história 〈B,D〉, mesmo que ele tenhaescolhido A no começo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Representação em Formal Normal

Alguns conceitos de solução para jogos em forma extensiva utilizam umarepresentação forma normal que é derivada a partir da descrição em formaextensa do jogo. Veremos nesta seção três possíveis maneiras de representarum jogo em forma extensa em uma forma normal: forma normal, forma normalreduzida, e forma multiagente.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal

Antes de darmos a definição da representação em forma normal de um jogo emforma extensa, note que dado um perfil de estratégias puras para os jogadoresem um jogo em forma extensa, essas estratégias induzem uma distribuição deprobabilidade sobre as possíveis histórias do jogo em forma em extensa.Formalmente, suponha que os jogadores jogam o perfil de estratégias pura s,então Prs(h) representa a probabilidade do jogo atingir a história h dado que osjogadores seguem as estratégias em s.

Temos que Prs(〈 〉) = 1.

Se h = h′ · 〈m〉, o jogador chance se move após a história h′, e q é aprobabilidade com que a chance escolherá a ação m, então temos quePrs(h) = qPrs(h

′).

Se h = h′ · 〈m〉, e h′ ∈ Hi , então Prs(h) = Prs(h′) se si (h

′) = m, ePrs(h) = 0, se si (h

′) 6= m.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal

Antes de darmos a definição da representação em forma normal de um jogo emforma extensa, note que dado um perfil de estratégias puras para os jogadoresem um jogo em forma extensa, essas estratégias induzem uma distribuição deprobabilidade sobre as possíveis histórias do jogo em forma em extensa.Formalmente, suponha que os jogadores jogam o perfil de estratégias pura s,então Prs(h) representa a probabilidade do jogo atingir a história h dado que osjogadores seguem as estratégias em s.

Temos que Prs(〈 〉) = 1.

Se h = h′ · 〈m〉, o jogador chance se move após a história h′, e q é aprobabilidade com que a chance escolherá a ação m, então temos quePrs(h) = qPrs(h

′).

Se h = h′ · 〈m〉, e h′ ∈ Hi , então Prs(h) = Prs(h′) se si (h

′) = m, ePrs(h) = 0, se si (h

′) 6= m.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal

Antes de darmos a definição da representação em forma normal de um jogo emforma extensa, note que dado um perfil de estratégias puras para os jogadoresem um jogo em forma extensa, essas estratégias induzem uma distribuição deprobabilidade sobre as possíveis histórias do jogo em forma em extensa.Formalmente, suponha que os jogadores jogam o perfil de estratégias pura s,então Prs(h) representa a probabilidade do jogo atingir a história h dado que osjogadores seguem as estratégias em s.

Temos que Prs(〈 〉) = 1.

Se h = h′ · 〈m〉, o jogador chance se move após a história h′, e q é aprobabilidade com que a chance escolherá a ação m, então temos quePrs(h) = qPrs(h

′).

Se h = h′ · 〈m〉, e h′ ∈ Hi , então Prs(h) = Prs(h′) se si (h

′) = m, ePrs(h) = 0, se si (h

′) 6= m.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal

Podemos também definir de forma análoga, a probabilidade Prσ(h) dojogo atingir a história h dado que os jogadores seguem as estratégiascomportamentais em σ, a única diferença da definição anterior é que nocaso em que h = h′ · 〈m〉 e h′ ∈ Hi , temos que Prσ(h) = σi (m)Prσ(h

′).

A distribuição de probabilidade induzida por uma estratégia mistaδ ∈ ×i∈N∆(Ci ) é dada pelo valor esperado de acordo com δ dasdistribuições induzidas pelas estratégias puras, ou seja,Prδ(h) =

s∈C δ(s)Prs(h).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal

Podemos também definir de forma análoga, a probabilidade Prσ(h) dojogo atingir a história h dado que os jogadores seguem as estratégiascomportamentais em σ, a única diferença da definição anterior é que nocaso em que h = h′ · 〈m〉 e h′ ∈ Hi , temos que Prσ(h) = σi (m)Prσ(h

′).

A distribuição de probabilidade induzida por uma estratégia mistaδ ∈ ×i∈N∆(Ci ) é dada pelo valor esperado de acordo com δ dasdistribuições induzidas pelas estratégias puras, ou seja,Prδ(h) =

s∈C δ(s)Prs(h).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Definição

Definição 3.1

A representação em forma normal de um jogo em forma extensa cominformação perfeita Γ = (N,M,H,P, fc , {vi : i ∈ N}) é o jogo em formanormal Γn = (N, {Ci : i ∈ N}, {ui : i ∈ N}), onde Ci são as estratégias purasdo jogador i em Γ e para todo s ∈ ×i∈NCi , temos

ui (s) =∑

z∈Z

Prs(z)vi (z),

ou seja, ui é a utilidade esperada para o jogador i quando os jogadoresimplementam as estratégias especificadas em s.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Por exemplo, a representação em forma normal do jogo em forma extensadescrito no exemplo da figura anterior é dada por:

C D

AE 1,1 1,1AF 1,1 1,1BE 0,3 2,2BF 0,3 1,4

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal Reduzida

Existem alguns jogos em forma extensiva que podemos simplificar suarepresentação em forma normal, pois existem várias estratégias para algumjogador i que têm a mesma utilidade esperada para todos os jogadores nãoimporta qual é a estratégia adotada pelos outros jogadores. Formalmente, dadoqualquer jogo em forma normal Γ = (N, {Ci : i ∈ N}, {ui : i ∈ N}), duasestratégias puras em di , ei ∈ Ci são equivalentes em utilidade se, e somente se,

uj(di , c−i ) = uj(ei , c−i ),∀c−i ∈ C−i ,∀j ∈ N.

Portanto, duas estratégias para o jogador i são equivalentes em utilidade se, esomente se, não importa o que os outros jogadores façam, nenhum jogador seimportará se o jogador i escolherá di ou ei . Por exemplo, no jogo descrito noexemplo anterior, as estratégias do jogador 1 AE e AF são equivalentes emutilidade. Quando existem estratégias que são equivalentes em utilidadepodemos simplificar a representação em forma normal, denotando asestratégias equivalentes por uma única estratégia. O resultado destasimplificação é conhecido como forma normal puramente reduzida.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Por exemplo, a representação em forma normal puramente reduzida do jogo emforma extensa descrito no exemplo anterior é dada por:

C D

A 1,1 1,1BE 0,3 2,2BF 0,3 1,4

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Forma Normal Completamente Reduzida

Se permitirmos estratégias mistas, podemos ter um outro tipo de redundânciaem jogos chamada de redundância aleatória que pode nos permitir reduzirainda mais a representação em forma normal de um jogo. Uma estratégiadi ∈ Ci é aleatoriamente redundante se, e somente se, existe uma estratégiamista δi ∈ ∆(Ci ) tal que δi (di ) = 0 e

uj(di , c−i ) =∑

ei∈Ci

δi (ei )uj(ei , c−i ),∀c−i ∈ C−i ,∀j ∈ N.

Portanto, di é aleatoriamente redundante se, e somente se, existe algumamaneira para o jogador i escolher aleatoriamente entre suas outras estratégiaspuras de forma que, não importa qual estratégias serão usadas pelos outrosjogadores, todos os jogadores terão a mesma utilidade esperada quando i utilizadi ou δi . A forma normal completamente reduzida é derivada da forma normalpuramente reduzida eliminando estratégias que são aleatoriamente redundantes.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

D E

A 6,0 6,0B 0,8 8,0C 3,4 7,0

A estratégia C é aleatoriamente redundante, pois todos os jogadores recebem omesmo pagamento se o jogador linha escolhe C ou a estratégia mista queescolhe A e B com probabilidade igual a 1/2. Portanto a forma normalcompletamente reduzida deste jogo, não contém a última linha da tabela acima.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Representação Multiagente

Nesta representação cada jogador i do jogo em forma extensiva é representadopor múltiplos agentes um para cada história após a qual o jogador i se move.Dado um jogo com informação perfeita Γ = (N,M,H,P, fc , {vi : i ∈ N}) sejaHN = ∪i∈NHi o conjunto de histórias após a qual algum jogador i se move.

Definição 3.2

A representação multiagente de um jogo em forma extensa com informaçãoperfeita Γ = (N,M,H,P, fc , {vi : i ∈ N}) é o jogo em forma normalΓn = (HN , {Mh : h ∈ HN}, {uh : h ∈ HN}), onde relembrando se h ∈ Hi ,temos que Mh são as ações disponíveis ao jogador i após história h. Paratodo perfil de estratégias de Γn, t ∈ ×h∈HN

Mh, seja st um perfil deestratégias de Γ tal que para todo j ∈ N e h ∈ Hj temos st

j (h) = th. Então,se h ∈ Hi , uh : ×a∈HN

Ma → IR é uma função utilidade para um jogador h talque uh(t) =

z∈Z Prst (z)vi (z).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere novamente o jogo a seguir:

Figura: Um jogo em forma extensa no qual o jogador 1 se move antes e

depois do jogador 2.

A representação multiagente tem três jogadores 〈 〉, 〈B〉, e 〈B,D〉, o jogador 〈 〉possui duas ações disponíveis A e B, o jogador 〈B〉 possui também duas açõesdisponíveis C e D , e finalmente o jogador 〈B,D〉 possui também duas açõesdisponíveis E e F . As utilidades são descritas nas duas tabelas a seguir:

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Quando o agente 〈B,D〉 escolhe E , temos:

C D

A 1,1,1 1,1,1B 0,3,0 2,2,2

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

E quando o agente 〈B,D〉 escolhe F , temos:

C D

A 1,1,1 1,1,1B 0,3,0 1,4,1

Quando estamos considerando a representação multiagente, os diferentesagentes do jogo em forma normal que representa o mesmo jogador no jogo emforma extensa são conhecidos como agentes temporários. No exemplo, temosque 〈 〉 e 〈B,D〉 são dois agentes temporários para o jogador 1 do jogo emforma extensa. É importante ressaltar que os diversos agentes temporários paraum dado jogador i não podem correlacionar suas estratégias e agem de maneiraindependente na representação multiagente do jogo, apesar de possuírem amesma função utilidade.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Como existem três tipos de estratégias para um jogo em forma extensa,podemos definir três tipos de equilíbrios de Nash:

Definição 4.1

Dado um jogo em forma extensa com informação perfeitaΓ = (N,M,H,P, fc , {vi : i ∈ N}), um perfil de estratégias s é um equilíbriode Nash em estratégias puras de G se, e somente se,

ui (s) =∑

z∈Z

Prs(z)vi (z)

≥ ui (s−i , di ) =∑

z∈Z

Pr(s−i ,di )(z)vi (z)

para todo jogador i e toda estratégia di ∈ Ci .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Definição 4.2

Dado um jogo em forma extensa com informação perfeitaΓ = (N,M,H,P, fc , {vi : i ∈ N}), um perfil de estratégias δ é um equilíbriode Nash em estratégias mistas de G se, e somente se,

ui(δ) =∑

s∈C

δ(s)∑

z∈Z

Prs(z)vi (z)

≥ ui (δ−i , βi ) =∑

s∈C

δ−i (s−i )βi (si )∑

z∈Z

Prs(z)vi (z)

para todo jogador i e toda estratégia mista βi ∈ ∆(Ci ).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Definição 4.3

Dado um jogo em forma extensa com informação perfeitaΓ = (N,M,H,P, fc , {vi : i ∈ N}), um perfil de estratégias σ é um equilíbriode Nash em estratégias comportamentais de G se, e somente se,

ui (σ) =∑

z∈Z

Prσ(z)vi (z)

≥ ui (σ−i , τi ) =∑

z∈Z

Pr(σ−i ,τi )(z)vi (z)

para todo jogador i e toda estratégia comportamental τi ∈ ×h∈Hi∆(Mh).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Exemplo 4.4

No jogo do Exemplo 13, temos que (A,C ,E), (A,C ,F ), e (A,D ,F ) são osúnicos equilíbrios de Nash em estratégias puras.

Como veremos no exemplo a seguir, o Equilíbrio de Nash não é um conceito desolução muito razoável para alguns jogos extensivos, por que ele permite quemuitos perfis de estratégias sejam equilíbrios, alguns até não-intuitivos.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Figura: Jogo com equilíbrio de Nash não-intuitivo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Neste jogo temos que (downA,acrossB ) é um equilíbrio de Nash do jogo. Nesteequilíbrio, jogador A escolhe downA por que ele pensa que o jogador B

escolherá acrossB . Então, a ameaça do jogador B de jogar acrossB faz com queo jogador A escolha downA. Note que neste equilíbrio esta ameaça nunca seconcretiza, pois o jogador B não tem chance de escolher. Contudo, se ojogador B em algum caso tivesse oportunidade de participar deste jogo, temosque ele não cumpriria sua ameaça, pois lhe é vantajoso escolher downB .Portanto, a ameaça do jogador B é inacreditável. Isto sugere que devemosapenas considerar um subconjunto dos equilíbrios de Nash que não sãobaseados em ameaças inacreditáveis. O próximo conceito de solução éconhecido como equilíbrio de subjogo perfeito e impede que equilíbrioscontenham ameaças inacreditáveis.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Subjogo Perfeito

Definição de Subjogo

Um subjogo G de um jogo em forma extensivaΓ = (N,M,H,P, fc , {vi : i ∈ N}) é um outro jogo em forma extensiva quesatisfaz:

1 O conjunto de histórias HG em G consiste de uma única história em H etodos as histórias subseqüentes a h;

2 A distribuição de probabilidade sobre as ações da natureza em G são asmesmas das correspondentes ações em Γ;

3 A utilidades de trajetórias completas em G são as mesmas utilidades dascorrespondentes trajetórias completas em Γ.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Subjogo Perfeito

Definição de Subjogo

Definição 5.1

Um perfil de estratégia (puro, misto, ou comportamental) s∗ é um equilíbriode subjogo perfeito em estratégias (puras, mistas, ou comportamentais,respectivamente) de Γ se ele for equilíbrio de Nash em estratégias (puras,mistas, ou comportamentais, respectivamente) de todo subjogo de Γ.

Note que um equilíbrio de subjogo perfeito também é um equilíbrio de Nashporque o jogo Γ também é um subjogo degenerado dele mesmo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Indução Reversa

A técnica mais comum para encontrar os equilíbrios de subjogo perfeito de umjogo finito Γ é conhecida como indução reversa. Intuitivamente, temos que atécnica sugere que se comece pelo fim do jogo e vá resolvendo até chegar aocomeço do jogo. Podemos descrever mais formalmente esta técnica nosseguintes passos:

1 Seja k = 1 e Γ(k) = Γ.

2 Seja Z−1 o conjunto de todas as histórias que são antecessoras imediatasdas histórias terminais do jogo Γ(k). Para todo i ∈ N e h ∈ Z−1 ∩ Hi , ojogador i enfrenta um problema de decisão após história h, e portantodeve escolher a ação que maximiza sua utilidade esperada. Se houvermais de uma ação que produza a mesma utilidade esperada, existirá umequilíbrio de subjogo perfeito contendo cada uma dessas ações. Escolhauma delas para ser a ação escolhida por i segundo a estratégia s, isto é,faça si (h) = a ∈ argmaxb∈M

hui (〈h, b〉). Passe ao passo seguinte.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Indução Reversa

3 Defina o jogo Γ(k + 1) da seguinte maneira:

1 Para todo h ∈ Z−1∩ (∪i∈NHi), substitua as ações em Mh do

jogo Γ(k), pelo vetor de utilidades que corresponde a ação

escolhida no passo anterior. Passe ao passo seguinte.2 Para todo h ∈ Z−1

∩ (∪i∈NHi)c , isto é uma história

imediatamente antecessora a uma história terminal do jogo

Γ(k) onde chance se move, substitua as ações em Mh, pelo

vetor de utilidades que corresponde a utilidade esperada dos

jogadores de acordo com a distribuição de probabilidade que

descreve as probabilidades do jogador chance escolher cada

uma das ações em Mh. Passe ao passo seguinte.

4 Se o conjunto de todas as histórias de Γ(k + 1) em que algum jogadori ∈ N se move for vazio. Pare a iteração e temos que s é um equilíbrio desubjogo perfeito em estratégias puras de Γ. Caso contrário, passe aopasso seguinte.

5 Faça k = k + 1. Volte ao passo 2.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Indução Reversa

É fácil ver que como o jogo é finito, após um número finito de iterações oalgoritmo acima descrito produzirá um equilíbrio de subjogo perfeito emestratégias puras. Desta forma, provamos construtivamente o seguinte teorema:

Teorema 5.2

Qualquer jogo em forma extensiva com informação perfeita finito tem um

equilíbrio de subjogo perfeito puro.

Exemplo 5.3

No jogo do Exemplo 13, temos que (A,C ,E) é o único equilíbrio de subjogoperfeito.

Exemplo 5.4

No jogo do Exemplo 31, temos que (acrossA,downB) é o único equilíbrio desubjogo perfeito.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogo Extensivo com Informação Imperfeita

Agora, vamos estudar jogos extensivos onde os jogadores ao tomarem suadecisão após alguma história do jogo, podem ter somente uma informaçãoparcial sobre as ações que já foram tomadas no jogo. Note que um jogo emforma normal é um caso particular de um jogo extensivo com informaçãoimperfeita, pois neste caso todos os jogadores se movem uma única vez e cadaum deles não possui nenhuma informação a respeito das ações dos outrosjogadores quando toma a sua decisão.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Definição

Formalmente, temos que um jogo em forma extensa com informação imperfeita

é um vetor Γ = (N,M,H,P, fc , {Ii : i ∈ N}, {ui : i ∈ N}), onde

(N,M,H,P, fc , {ui : i ∈ N}) é um jogo em forma extensa cominformação perfeita, e

Ii é uma partição de Hi com a propriedade que se h e h′ estão na mesmacélula da partição, então Mh = Mh′ , ou seja, o mesmo conjunto de açõesestá disponível em todas as histórias de uma mesma célula da partição; seh ∈ I , onde I é uma célula da partição, denota-se por MI o conjunto Mh

de ações disponíveis. Intuitivamente, se h e h′ estão na mesma célula deIi , então h e h′ são indistinguíveis do ponto de vista do jogador i ; i

considera a história h′ possível se a verdadeira história for h, e vice versa.Uma célula I ∈ Ii é conhecida como um conjunto de informação para o

jogador i ou como um (i-)conjunto de informação. Quando desenhamosum jogo em forma extensa com informação imperfeita em uma árvorecirculamos ou interligamos os nós pertencentes a um mesmo conjunto deinformação com uma linha tracejada.

Como anteriormente, um jogo em forma extensa com informação imperfeita éfinito se N,M, e H forem finitos.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Figura: Jogo em Forma Extensiva com Informação Imperfeita.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

No jogo da figura anterior, temos

N = {1, 2},

H = {〈 〉, 〈A〉, 〈B〉, 〈C 〉, 〈B,D〉, 〈C ,D〉, 〈B,E〉, 〈C ,E〉 〈B,E , F 〉,〈B,E ,G〉, 〈C ,E ,H〉, 〈C ,E , I 〉},

P(〈 〉) = P(〈B,E〉) = P(〈C ,E〉) = 1, e P(〈B〉) = P(〈C 〉) = 2,

I1 = {{〈 〉}, {〈B,E〉}, {〈C ,E〉}}, I2 = {{〈B〉, 〈C 〉}},

u1(〈A〉) = u2(〈A〉) = u1(〈C ,D〉) = u1(〈C ,E , I 〉) = u1(〈B,E ,G〉) =u2(〈C ,E ,H〉) = 1,

u1(〈B,E ,F 〉) = u2(〈B,E ,F 〉) = 2,

u2(〈B,D〉) = u2(〈C ,E , I 〉) = 3,

u2(〈B,E ,G〉) = 4, e

u1(〈C ,E ,H〉) = u2(〈C ,D〉) = 5.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Memória Perfeita e Memória Imperfeita

Na maior parte deste curso, como na maioria dos trabalhos em teoria dosjogos, nós assumimos que jogadores têm memória perfeita: eles recordam detodas as ações que eles tomaram e de todos os conjuntos de informação pelosquais eles passaram. Formalmente, vamos requerer que

se h e h′ estão no mesmo conjunto de informação do jogador i e h1 é umprefixo de h tal que P(h1) = i , então existe um prefixo h′

1 de h′ tal queh1 e h′

1 estão no mesmo conjunto de informação; além disso, se h1 · 〈m〉for um prefixo de h (de forma que m foi a ação realizada quando h1 foiatingida na história h), então h′

1 · 〈m〉 é um prefixo de h′ (portanto, i

lembra que ele realizou ação m).

Podemos ver um jogo extenso com informação perfeita como um casoparticular do jogo extenso com informação imperfeita onde todos os conjuntosde informação contém uma única história. É fácil verificar que em todo jogocom informação perfeita, todos os jogadores têm memória perfeita.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Memória Imperfeita

Podemos distinguir 3 tipos diferentes de memória imperfeita:

Falta de memória sobre a seqüência de conjuntos de informação pelo qualo jogador passou;

Falta de memória sobre ações já realizadas pelo jogador; e

Falta de memória sobre se o jogador já realizou ou não uma dada ação.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplos

A próxima figura ilustra jogos extensivos da esquerda para a direita queapresentam estes 3 tipos de falta de memória, respectivamente.

Figura: Jogos Extensivos com Memória Imperfeita.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Observações

Apesar de não ter recebido muita atenção da literatura, jogos com memóriaimperfeita tem tido cada vez mais aplicações principalmente quando estamostratando de agentes computacionais que possuem memória finita e têm derealizar uma dada escolha repetidas vezes. Eventualmente, tais agentes não serecordam das ações que eles realizaram no passado, ou que conjuntos deinformação eles já visitaram. Existem outras situações onde também modelosde jogos com memória imperfeita parecem ser razoáveis. Suponha, porexemplo, que queremos modelar uma partida de xadrez. Parece razoável suporque os jogadores não necessariamente se lembram de todas as jogadasefetuadas ao longo da partida e em que ordem elas foram executadas.A análise de jogos com memória imperfeita envolve sutilezas fora do escopodeste curso. Portanto, no que se segue estaremos sempre assumindo jogos commemória perfeita, exceto quando mencionarmos explicitamente o contrário.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Estratégias

Podemos definir de maneira análoga ao caso de jogos com informação perfeita,o que são estratégias puras, mistas e comportamentais em jogos cominformação imperfeita. A única diferença é que as definições agora garantemque os jogadores só podem tomar a mesma decisão em histórias que eles nãoconseguem distinguir.

Definição 6.1

Uma estratégia pura para o jogador i em um jogo em forma extensa cominformação imperfeita é uma função si que associa cada conjunto deinformação Ii do jogador i um elemento de MIi , ou seja, uma açãodisponível para i quando se move no conjunto de informação Ii .

Definição 6.2

Se Ci é o conjunto de estratégias puras para o jogador i em um jogo emforma extensa com informação imperfeita, uma estratégia mista para ojogador i em um jogo em forma extensa é uma distribuição deprobabilidade δi em Ci , ou seja, um elemento de ∆(Ci ).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Estratégias

Definição 6.3

Uma estratégia comportamental para o jogador i em um jogo em formaextensa com informação imperfeita é uma função σi que associa cadaconjunto de informação Ii do jogador i um elemento de ∆(MIi ), ou seja,uma distribuição de probabilidade sobre as ações disponíveis para i quandose move no conjunto de informação Ii .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Estratégias

Exemplo

No jogo do Exemplo 40, temos que o jogador 1 possui 12 estratégias puras:AFH, AFI , AGH, AGI , BFH, BFI , BGH, BGI , CFH, CFI , CGH, e CGI . Ojogador 2 possui 2 estratégias puras: D e E .

Observação

Eventualmente, abusaremos um pouco da notação e para todo h ∈ I , usaremossi (h) e σi (h) para denotar as ações escolhidas pelas estratégias si e σi noconjunto de informação I .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equivalência entre Estratégias Mistas e

Comportamentais

Nosso objetivo nesta seção é provar que para jogos extensivos com informaçãoimperfeita finitos onde os jogadores possuem memória perfeita, existe umaequivalência entre estratégias mistas e comportamentais. Antes de enunciarmose provarmos a equivalência, precisamos de duas definições.

Definição 6.4

Definem-se duas estratégias (mistas ou comportamentais) de um dadojogador como equivalentes em utilidade, se para qualquer coleção deestratégias puras para os demais jogadores, as duas estratégias induzem amesma distribuição de probabilidade sobre as histórias terminais do jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equivalência entre Estratégias Mistas e

Comportamentais

Definição 6.5

Para qualquer história h, temos que uma estratégia pura si para o jogador i éconsistente com h, se para todo prefixo h′ · 〈m〉 de h, onde P(h′) = i , temosque si (h

′) = m. Intuitivamente, si é consistente com h se existe algum perfilde estratégias puras dos outros jogadores que juntamente com si tornempossível que a história h seja atingida com probabilidade positiva. NoExemplo do Jogo com Informação Imperfeita visto anteriormente, temosque a estratégia BGH do jogador i é consistente com a história 〈B,D〉, masnão é consistente com a história 〈B,E , F 〉 nem com a história 〈C ,E〉. SejaCi (h) o conjunto de estratégias puras do jogador i consistentes com ahistória h.

Teorema 6.6

Se em um jogo em forma extensiva finito, não existe falta de memória sobre se o

jogador já realizou ou não uma dada ação, então temos que toda estratégia

comportamental de um jogador tem uma estratégia mista equivalente em

utilidade.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Seja σi uma estratégia comportamental para o jogador i . Considere a seguinteestratégia mista δi que dá probabilidade

I∈Iiσi (I )(si (I )) a estratégia pura si .

Seja t−i um perfil de estratégias puras para os jogadores diferentes de i . Vamosverificar que Pr(σi ,t−i )

(h) = Pr(δi ,t−i )(h),∀h ∈ H, e consequentemente σi e δi

são equivalentes em utilidade.Seja h uma história qualquer do jogo. Temos que considerar dois casos.Primeiro, assuma que ∃j ∈ N − {i} tal que tj /∈ Cj(h). Neste caso, temos quePr(σi ,t−i )

(h) = Pr(δi ,t−i )(h) = 0. Assuma então que ∀j ∈ N − {i} temos

tj ∈ Cj(h). Então, temos que:

Pr(σi ,t−i )(h) = (

h′∈Hi ,

h′·〈m〉∈X (h)

σi (h′)(m))(

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′)),

pois ao longo da história h as escolhas feitas pelo jogador i são independentespor definição de σ e pelo fato que assumimos que não existe falta de memóriase um jogador já realizou ou não uma ação.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Por outro lado, para uma estratégia pura si temos que Pr(si ,t−i )(h) = 0 se

si /∈ Ci (h) e, em caso contrário temos:

Pr(si ,t−i )(h) =

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′).

Logo, temos que

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Pr(δi ,t−i )(h) =

si∈Ci

δ(si )Pr(si ,t−i )(h)

=∑

si∈Ci (h)

I∈Ii

σi (I )(si (I ))∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′)

=∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′)∑

si∈Ci (h)

I∈Ii

σi (I )(si (I ))

=∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′)∑

si∈Ci (h)

(∏

I∈Ii ,X (h)∩I 6=∅

σi (I )(si (I ))∏

I∈Ii ,X (h)∩I=∅

σi (I )(si (I )))

= (∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′))(∏

h′∈Hi ,

h′·〈m〉∈X (h)

σi (h′)(m))× A(h),

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

onde

A(h) =

si∈Ci (h)

I∈Ii ,X (h)∩I=∅

σi (I )(si (I )) , se h /∈ Hi

si∈Ci (h)σi (h)(si (h))

I∈Ii ,X (h)∩I=∅

σi (I )(si (I )) , se h ∈ Hi

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Como a única restrição para uma estratégia pura si pertencer a Ci(h) é que elaespecifique uma ação que leve a história h em qualquer prefixo estrito de h

onde o jogador i se move, então temos que essas estratégias podem especificarqualquer ação nos conjuntos de informação para o jogador que contém h ouque não contenham prefixos de estritos de h. Desta forma rearrumando ostermos dos somatório podemos reescrever:

A(h) =

I∈Ii ,X (h)∩I=∅

a∈MIσi (I )(a) , se h /∈ Hi

(∑

a∈Mhσi (h)(a))

I∈Ii ,X (h)∩I=∅

a∈MIσi (I )(a) , se h ∈ Hi

= 1.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Portanto,

Pr(δi ,t−i )(h)

= (∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc (m|h′))(∏

h′∈Hi ,

h′·〈m〉∈X (h)

σi (h′)(m))

= Pr(σi ,t−i )(h)

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere novamente o Exemplo de Jogo com Informação Imperfeita vistoanteriormente. Seja σ1 a estratégia comportamental do jogador 1 que escolheA com probabilidade 1/2, B e C com probabilidade 1/4 e G e H comprobabilidade 1. De acordo com a construção do teorema a estratégia mista δ1

que é equivalente em utilidade a σ1 é tal que AGH recebe probabilidade 1/2,BGH e CGH recebem probabilidade 1/4. Se o jogador 2 escolher a estratégiapura D , então

Pr(σ1,D) = Pr(δ1,D)(h) =

1/2, se h = 〈A〉1/4, se h = 〈B〉 ou h = 〈C 〉 ou h = 〈B,D〉

ou h = 〈C ,D〉0, caso contrário

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Enquanto se o jogador 2 escolher a estratégia pura E , então

Pr(σ1,E ) = Pr(δ1,E )(h) =

1/2, se h = 〈A〉1/4, se h = 〈B〉 ou h = 〈C 〉 ou h = 〈B,E〉

ou h = 〈C ,E〉 ou h = 〈B,E ,G〉 ou h = 〈C ,E ,H〉0, caso contrário

Representação Mista

Dada uma estratégia comportamental σi para o jogador i . A estratégia mistaδi que dá probabilidade

I∈Iiσi (I )(si (I )) a estratégia pura si é chamada uma

representação mista de σi .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogo Sem Estratégia Mista Equivalente

Para ver um exemplo da necessidade da hipótese que o jogo não pode ter faltade memória se um jogador já realizou ou não uma ação para encontrarmos umaestratégia mista equivalente considere o seguinte exemplo.

Exemplo

Figura: Jogo extensivo onde não existe estratégia mista equivalente.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Suponha a estratégia comportamental que escolhe ação a com probabilidadep ∈ (0, 1). Esta estratégia induz probabilidades p2, p(1 − p), 1− p nas históriasterminais 〈a, a〉, 〈a, b〉, 〈b〉, respectivamente. Contudo qualquer estratégia mistainduz probabilidade zero na história 〈a, b〉. Portanto, não existe estratégiamista equivalente a estratégia comportamental dada neste jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

A Recíproca

O próximo teorema prova a recíproca do teorema anterior para jogos commemória perfeita.

Teorema 6.7

Para qualquer estratégia mista de um jogo extensivo finito com memória

perfeita, existe uma estratégia comportamental equivalente em utilidade.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Seja δi uma estratégia mista para o jogador i . Para qualquer história h, seja

πi (h) =∑

si∈Ci (h)

δ(si ),

ou seja, πi (h) é a soma das probabilidades das estratégias puras do jogador i

consistentes com a estratégia h. Dizemos que δi é consistente com h se, esomente se, πi (h) > 0. Como o jogo tem memória perfeita, para quaisquerhistórias h e h′ no mesmo conjunto de informação do jogador i , temos queCi (h) = Ci (h

′) e, consequentemente, πi (h) = πi (h′). Além disso, como para

qualquer estratégia pura temos que o jogador i deve escolher uma mesma açãoem h e h′, temos que Ci (h · 〈m〉) = Ci (h

′ · 〈m〉) e, consequentemente,πi (h · 〈m〉) = πi (h

′ · 〈m〉).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Vamos agora, definir uma estratégia comportamental σi que provaremos serequivalente em utilidade a δi . Seja I um conjunto de informação qualquer parao jogador i . Seja h ∈ I tal que πi (h) > 0, defina σi (I )(m) = πi (h·〈m〉)

πi (h). Como

uma estratégia pura si é consistente com h se, e somente se, ela for consistentecom exatamente uma história h · 〈m〉, temos que

m∈MIπi (h · 〈m〉) = πi (h).

Portanto, temos que∑

m∈MIσi (I )(m) = 1. Se πi (h) = 0, defina σi (I ) de

forma arbitrária. σi é chamada de uma representação comportamental de δi .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Seja t−i um perfil de estratégias puras para os jogadores diferentes de i . Vamosverificar que Pr(σi ,t−i )

(h) = Pr(δi ,t−i )(h),∀h ∈ H, e consequentemente σi e δi

são equivalentes em utilidade.

Seja h uma história qualquer do jogo. Temos que considerar dois casos.Primeiro, assuma que ∃j ∈ N − {i} tal que tj /∈ Cj(h). Neste caso, temos quePr(σi ,t−i )

(h) = Pr(δi ,t−i )(h) = 0. Assuma então que ∀j ∈ N − {i} temos

tj ∈ Cj(h).

Como temos um jogo finito e πi (〈 〉) = 1, para qualquer história h tal queπi (h) = 0 existe um último prefixo h′ de h que é consistente com a estratégiaδi . Mais formalmente, se πi (h) = 0, então existe h′ ∈ X (h) tal que πi (h

′) > 0e para toda história h′′ ∈ X (h)− X (h′), temos que πi (h

′′) = 0. Se h′ ∈ I , eh′ · 〈m〉 ∈ X (h), então σi (I )(m) = 0. Consequentemente, temos quePr(σi ,t−i )

(h) = 0 = Pr(δi ,t−i )(h).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Finalmente, considere o caso em que πi (h) > 0. Por definição, temos queπi (h

′) > 0,∀h′ ∈ X (h). Note ainda que se h′ é o primeiro prefixo de h no qualo jogador i se move, temos que πi (h

′) = 1, e que se h′ · 〈m〉 e h′′ são doisprefixos de h tais que o jogador i se move em h′ e h′′, e não existe nenhumoutro prefixo de h entre h′ e h′′ no qual i se move, então πi (h

′ · 〈m〉) = πi (h′′).

Além disso, se h3 e h4 são dois prefixos de h tal que o jogador i não se moveentre h3 e h4, temos que πi (h

3) = πi (h4). Então, temos que:

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Pr(σi ,t−i )(h) = (

h′∈Hi ,

h′·〈m〉∈X (h)

σi (h′)(m))(

h′∈Hc ,

h′·〈m〉∈X (h)

fc (m|h′))

= (∏

h′∈Hi ,

h′·〈m〉∈X (h)

πi (h′ · 〈m〉)

πi (h′))(

h′∈Hc ,

h′·〈m〉∈X (h)

fc(m|h′))

= πi (h)(∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc (m|h′))

= (∑

si∈Ci (h)

δ(si ))(∏

h′∈Hc ,

h′·〈m〉∈X (h)

fc (m|h′))

=∑

si∈Ci (h)

δ(si )Pr(si ,t−i )(h) = Pr(δi ,t−i )

(h)

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere novamente o jogo do Exemplo 40. Seja δ1 a estratégia mista dojogador 1 que escolhe AFH com probabilidade 1/2, BFI e BGH comprobabilidade 1/4. Temos que π1(〈 〉) = 1, π1(〈A〉) = 1/2,π1(〈B〉) = π1(〈B,E〉) = 1/2, π1(〈C 〉) = 0,π1(〈B,E ,F 〉) = π1(〈B,E ,G〉) = 1/4. De acordo com a construção do teoremauma estratégia comportamental σ1 que é equivalente em utilidade a δ1 é talque σ1(〈 〉)(A) = σ1(〈 〉)(B) = 1/2, σ1(〈B,E〉)(F ) = σ1(〈B,E〉)(G) = 1/2 eσ1(〈C ,E〉) escolhe arbitrariamente entre H e I .O próximo exemplo ilustra a necessidade da hipótese de memória perfeita paraa existência de uma estratégia comportamental equivalente em utilidade a umaestratégia mista qualquer.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Jogo Sem Estratégia Comportamental Equivalente

Figura: Jogo extensivo onde não existe estratégia comportamental

equivalente.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere a estratégia mista na qual o jogador 1 escolhe LL com probabilidade12

e RR com probabilidade 12. Esta estratégia induz probabilidades 1/2, 0, 0, 1/2

nas histórias terminais 〈L, L〉, 〈L,R〉, 〈R, L〉, 〈R,R〉, respectivamente. Suponhauma estratégia comportamental σi tal que σi ({∅})(L) = p eσi ({〈L〉, 〈R〉})(L) = q. Note que esta estratégia induz probabilidade 0 ahistória 〈L,R〉 se, e somente se, p = 0 ou q = 0. Porém neste caso, temos queela também induz probabilidade 0 a 〈L, L〉 ou a 〈R,R〉. Portanto, não existeestratégia comportamental equivalente a estratégia mista dada.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Representação em Forma Normal

Note que as definições das representações em forma normal e normal reduzidapara jogos com informação imperfeita são idênticas a definiçõescorrespondentes para o caso de jogos com informação perfeita, apenas levandoem conta as mudanças na definição do que são agora estratégias puras. O casoda definição da representação multiagente precisa de mais algumas alterações.Agora ao invés de termos um agente temporário para cada história em que umdado jogador i se move no jogo Γ com informação imperfeita, teremos umagente temporário para cada conjunto de informação do jogador i .Formalmente,

Definição 6.8

A representação multiagente de um jogo em forma extensa com informaçãoimperfeita Γ = (N,M,H,P, fc , {Ii : i ∈ N}, {vi : i ∈ N}) é o jogo em formanormal Γn = ({I : I ∈ ∪i∈NIi}, {MI : I ∈ ∪i∈NIi}, {uI : I ∈ ∪i∈NIi}), onderelembrando se I ∈ Ii , temos que MI são as ações disponíveis ao jogador i

no conjunto de informação I . Para todo perfil de estratégias de Γn,t ∈ ×J∈∪i∈NIi

MJ , seja st um perfil de estratégias de Γ tal que para todoj ∈ N e J ∈ Ij temos st

j (J) = tJ . Então, uI : ×J∈∪i∈NIiMJ → IR é uma

função utilidade para um jogador I ∈ Ii tal que uI (t) =∑

z∈Z Prst (z)vi (z).

Novamente temos que todos os agentes temporários de um mesmo jogador

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere novamente o jogo a seguir:

Figura: Jogo em Forma Extensiva com Informação Imperfeita.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

A representação multiagente tem quatro jogadores jogadores〈 〉,{〈B〉, 〈C 〉},〈B,E〉, e 〈C ,E〉. Os jogadores 〈 〉, 〈B,E〉, e 〈C ,E〉 são agentestemporários do jogador 1 do jogo em forma extensiva, enquanto o jogador{〈B〉, 〈C 〉} é o único agente temporário do jogador 2. O jogador 〈 〉 possui trêsações disponíveis A, B e C , o jogador {〈B〉, 〈C 〉} possui duas ações disponíveisD e E , o jogador 〈B,E〉, possui duas ações disponíveis F e G , e finalmente ojogador 〈C ,E〉 possui também duas ações disponíveis H e I . Se 〈 〉 escolhe B,{〈B〉, 〈C 〉} escolhe E , 〈B,E〉, escolhe F , e 〈B,E〉, escolhe I , temos que todosos agentes temporários tem utilidade esperada igual a 2.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Assim como no caso de jogos em forma extensiva com informação perfeita,podemos definir três tipos de Equilíbrio de Nash, um para cada tipo de perfil deestratégias:

Definição 6.9

Dado um jogo em forma extensa com informação imperfeitaΓ = (N,M,H,P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias s éum equilíbrio de Nash em estratégias puras de Γ se, e somente se,

ui (s) =∑

z∈Z

Prs(z)vi (z)

≥ ui (s−i , di ) =∑

z∈Z

Pr(s−i ,di )(z)vi (z)

para todo jogador i e toda estratégia di ∈ Ci .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Definição 6.10

Dado um jogo em forma extensa com informação imperfeitaΓ = (N,M,H,P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias δ éum equilíbrio de Nash em estratégias mistas de Γ se, e somente se,

ui(δ) =∑

s∈C

δ(s)∑

z∈Z

Prs(z)vi (z)

≥ ui (δ−i , βi ) =∑

s∈C

δ−i (s−i )βi (si )∑

z∈Z

Prs(z)vi (z)

para todo jogador i e toda estratégia mista βi ∈ ∆(Ci ).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Nash

Definição 6.11

Dado um jogo em forma extensa com informação imperfeitaΓ = (N,M,H,P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias σ éum equilíbrio de Nash em estratégias comportamentais de Γ se, e somentese,

ui (σ) =∑

z∈Z

Prσ(z)vi (z)

≥ ui (σ−i , τi ) =∑

z∈Z

Pr(σ−i ,τi )(z)vi (z)

para todo jogador i e toda estratégia comportamental τi ∈ ×h∈Hi∆(Mh).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio de Subjogo Perfeito

Pode-se definir equilíbrio de subjogo perfeito de maneira análoga para jogoscom informação imperfeita. A única diferença é na definição do que é umsubjogo G de um jogo com informação imperfeita. Neste caso, temos que adefinição é idêntica, somente com a restrição que se I ∩ HG 6= ∅, entãoI ∩ H = I ∩ HG , isto é todos os conjuntos de informação do subjogo devem seridênticos aos conjuntos de informação do jogo original. Isto, por exemplo,implica que a história raiz de qualquer subjogo deve pertencer a um conjuntode informação que contém apenas uma única história no jogo original.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio Sequencial

Para jogos extensivos com informação imperfeita, existe ainda um outrorefinamento que evita alguns equilíbrios de Nash que não são intuitivosconhecido como equilíbrio seqüencial.Equilíbrio sequencial é definido com respeito a uma avaliação, um par (~σ, µ)onde ~σ é um perfil de estratégias comportamentais e µ é um sistema de

crenças, isto é, uma função que determina para cada conjunto de informação I

uma probabilidade µI sobre as histórias em I . Intuitivamente, se I é umconjunto de informação para o jogador i , µI é a avaliação subjetiva de i daverossimilhança relativa das histórias em I . Informalmente, uma avaliação é umequilíbrio sequencial se para todos os jogadores i , em todos os i-conjuntos deinformação, (a) i escolhe uma melhor resposta dada as crenças que ele temsobre as histórias neste conjunto de informação e as estratégias dos outrosjogadores, e (b) as crenças de i são consistentes com o perfil de estratégiassendo jogado, no sentido que elas são calculadas condicionando a distribuiçãode probabilidade induzida pelo perfil de estratégia sobre as histórias no dadoconjunto de informação.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio Sequencial

Note que µI é definido mesmo se I é atingido com probabilidade 0 de acordocom algum perfil de estratégia ~σ. Definir consistência em um conjunto deinformação que é atingido com probabilidade 0 é um pouco sutil. Neste caso,intuitivamente, quando o conjunto de informação I é atingido o jogador i quese move em I deve acreditar que o jogo está sendo jogado de acordo com umperfil de estratégias alternativo. Em um equilíbrio sequencial, este perfil deestratégias alternativo consiste de uma pequena perturbação da avaliaçãooriginal onde todas as ações são escolhidas com probabilidade positiva.Dado um perfil de estratégias ~σ, seja Pr~σ a distribuição de probabilidadeinduzida por ~σ sobre as possíveis histórias jogo como definido anteriormente.Intuitivamente, Pr~σ(h) é o produto das probabilidades de cada uma das açõesque levam a h. Por simplicidade, assumimos que fc > 0, de forma que se ~σ étal que todo jogador escolhe todas as suas ações com probabilidade positiva,então para toda história h, Pr~σ(h) > 0. Para qualquer história h do jogo,defina Pr~σ(· | h) como a distribuição de probabilidade condicional induzida por~σ sobre as possíveis histórias do jogo dado que a história atual é h.Intuitivamente, Pr~σ(h

′ | h) é igual a 0 se h não for um prefixo de h′, é igual a 1se h = h′, e é o produto da probabilidade de cada uma das ações no caminhoque leva h à h′ se h for um prefixo de h′.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio Sequencial

Formalmente, uma avaliação (~σ, µ) é um equilíbrio sequencial se ela satisfaz asseguintes condições:

Racionalidade sequencial. Para todo jogador i , conjunto de informaçãoI ∈ Ii , e toda estratégia comportamental τ para o jogador i ,

EUi ((~σ, µ) | I ) ≥ EUi (((~σ−i , τ ), µ) | I ),

onde EUi ((~σ, µ) | I ) =∑

h∈I

z∈Z µI (h)Pr~σ(z | h)ui (z).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio Sequencial

Consistência entre o sistema de crenças e o perfil de estratégias. Se ~σconsiste de estratégias comportamentais que dão probabilidade positiva atodas as ações em todos os conjuntos de informações, então para todoconjunto de informação I e história h em I ,

µI (h) =Pr~σ(h)

h′∈I Pr~σ(h′).

Caso contrário, existe uma sequência (~σn, µn), n = 1, 2, 3, . . ., deavaliações tal que ~σn é um perfil de estratégias que dá probabilidadepositiva a todas as ações em todos os conjuntos de informação, (~σn, µn) éconsistente no sentido do parágrafo anterior, e limn→∞(~σn, µn) = (~σ, µ).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Equilíbrio Sequencial versus Equilíbrio de Nash

Podemos agora enunciar dois importantes teoremas que justificam que esta éuma noção razoável de equilíbrio.

Teorema 6.12

Se (σ, µ) for um equilíbrio sequencial de um jogo em forma extensiva com

memória perfeita, então σ é um equilíbrio de Nash em estratégias

comportamentais do jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Suponha, por absurdo, que (σ, µ) é um equilíbrio sequencial, mas σ não é umequilíbrio de Nash. Então existe i ∈ N e τi uma estratégia comportamentalpara o jogador i tal que

ui (σ) =∑

z∈Z

Prσ(z)vi (z) < ui (σ−i , τi ) =∑

z∈Z

Pr(σ−i ,τi )(z)vi (z).

Escolha uma estratégia τi tal que ui (σ) < ui (σ−i , τi ) e||{I ∈ Ii : τi (I ) 6= σi (I )}|| ≤ ||{I ∈ Ii : ϕi (I ) 6= σi (I )}|| para toda estratégiacomportamental ϕi tal que ui(σ) < ui (σ−i , ϕi ).

Seja I ∗ um conjunto de informação para o jogador i tal que τi (I∗) 6= σi (I

∗) epara todo conjunto de informação I ∈ Ii tal que I contém somente históriasque possuem prefixos em I ∗, τi (I

∗) = σi (I∗), ou seja, τi e σi coincidem nas

histórias que se seguem ao conjunto de informação I ∗. Defina agoraτ∗i (I ) = τi (I ),∀I 6= I ∗, e τ∗

i (I∗) = σi (I

∗). Iremos provar queui (σ) < ui (σ−i , τ

∗i ), e como

||{I ∈ Ii : τi (I ) 6= σi (I )}|| > ||{I ∈ Ii : τ∗i (I ) 6= σi (I )}||, temos uma

contradição.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Denotaremos por (σ−i.I , τi (I )) o perfil de estratégias comportamentais que éigual a σ exceto na ação do jogador i no conjunto de informação I ; nesteconjunto de informação I a ação de i coincide com a ação escolhida por i em I

de acordo com a estratégia τi . Seja ainda Z (I ) o conjunto de históriasterminais que tem uma história em I como prefixo. Como σi , τi , e τ∗

i

coincidem em todas as histórias que se seguem ao conjunto de informação I ∗,temos que EUi ((σ−i , τ

∗i )|h) = EUi ((σ−i.I∗ , τ

∗i (I

∗))|h),∀h ∈ I ∗. Além disso,como τi e τ∗

i diferem apenas na ação escolhida em I ∗, temos quePr(σ−i ,τ

i)(h) = Pr(σ−i ,τi )

(h) para todo h ∈ I ∗ ∪ (Z − Z (I ∗)). Portanto,

ui (σ−i , τ∗i ) =

h∈I∗

Pr(σ−i ,τ∗

i)(h)EUi ((σ−i , τ

∗i )|h) +

z∈(Z−Z (I∗))

Pr(σ−i ,τ∗

i)(z)vi (z)

=∑

h∈I∗

Pr(σ−i ,τi )(h)EUi ((σ−i.I∗ , τ

∗i (I

∗))|h) +∑

z∈(Z−Z (I∗))

Pr(σ−i ,τi )(z)vi (z)

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Consideremos agora dois casos. Primeiro, se∑

h∈I∗ Pr(σ−i ,τi )(h) = 0, neste

caso temos então que ui (σ−i , τ∗i ) = ui (σ−i , τi ) > ui (σ). Segundo, suponha que

h∈I∗ Pr(σ−i ,τi )(h) > 0. Como temos um jogo com memória perfeita, para

qualquer estratégia ρ, temos que para qualquer h ∈ I , onde I ∈ Ii ,

Prρ(h)∑

h∈I Prρ(h)

não depende da estratégia ρi do jogador i , pois ρi contribui com o mesmo fatormultiplicativo para Prρ(h) qualquer que seja h ∈ I . Então, como (σ, µ) é umequilíbrio sequencial:

µ(I )(h) =Prσ(h)

h∈I Prσ(h)=

Pr(σ−i ,τi )(h)

h∈I Pr(σ−i ,τi )(h)

,∀h ∈ I .

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Logo,

ui (σ−i , τ∗i ) = (

h∈I∗

Pr(σ−i ,τi )(h))(

h∈I∗

µ(I ∗)(h)EUi ((σ−i.I∗ , τ∗i (I

∗))|h))

+∑

z∈(Z−Z (I∗))

Pr(σ−i ,τi )(h)vi (z)

Como τ∗i (I

∗) = σi (I∗) e σi é sequencialmente racional no conjunto de

informação I ∗, temos que∑

h∈I∗

µ(I ∗)(h)EUi (σ−i.I∗ , τ∗i (I

∗)|h) ≥∑

h∈I∗

µ(I ∗)(h)EUi (σ−i.I∗ , τi (I∗)|h)

=∑

h∈I∗

µ(I ∗)(h)EUi (σ−i , τi |h).

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Prova

Portanto,

ui (σ−i , τ∗i ) = (

h∈I∗

Pr(σ−i ,τi )(h))(

h∈I∗

µ(I ∗)(h)EUi ((σ−i.I∗ , τ∗i (I

∗))|h))

+∑

z∈(Z−Z (I∗))

Pr(σ−i ,τi )(h)vi (z)

≥ (∑

h∈I∗

Pr(σ−i ,τi )(h))(

h∈I∗

µ(I ∗)(h)EUi ((σ−i , τi )|h))

+∑

z∈(Z−Z (I∗))

Pr(σ−i ,τi )(h)vi (z)

= ui (σ−i , τi ) > ui (σ),

como queríamos demonstrar.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Existência do Equilíbrio Sequencial

Teorema 6.13

Para todo jogo finito em forma extensiva com memória perfeita, o conjunto de

avaliações que são equilíbrio sequencial é não vazio.

Prova: Veremos adiante.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere mais uma vez o jogo a seguir:

Figura: Jogo em Forma Extensiva com Informação Imperfeita.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Neste caso, em todos os equilíbrios sequenciais temos que o jogador 1 escolheação F com probabilidade 1 após a história 〈B,E〉, escolhe ação H comprobabilidade 1 após a história 〈C ,E〉, jogador 2 escolhe ação D comprobabilidade 1 no conjunto de informação {〈B〉, 〈C 〉}, e o jogador 1 escolheação B com probabilidade 0 no início do jogo. Nos equilíbrios sequenciais emque o jogador 1 escolhe ação C com probabilidade positivo temos que o sistemade crenças deve dá probabilidade 1 a história 〈C 〉. No caso em que o jogador 1escolhe A com probabilidade 1, qualquer sistema de crenças é consistente.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Cálculo de Equilíbrio Sequencial

Agora vamos ilustrar com um exemplo, como podemos calcular equilíbriossequenciais em jogos finitos. O procedimento é similar ao que estudamos parao cálculo de equilíbrio de Nash em estratégias mistas para jogos em formanormal. Iremos por tentativa, encontrar equilíbrios sequenciais cujas estratégiascomportamentais tenham determinando suporte. Faremos isso começandopelos conjuntos de informação mais perto dos nós terminais do jogo.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Considere o jogo a seguir:

Figura: Calculando Equilíbrios Sequenciais.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

É fácil ver que µ(1.1)(〈0, 95〉) = 0, 95 e µ(1.1)(〈0, 05〉) = 0, 05. Além disso,racionalidade sequencial implica que σ2(2.2)(o) = 1. Vamos então consideraros possíveis suportes de σ1(1.2). Existem três suportes possíveis paraconsiderar: 〈m〉, 〈n〉, 〈m, n〉. A utilidade esperada para o jogador 1 de escolhern no conjunto de informação 1.2 é8µ(1.2)(〈0, 05, g〉) + 3(1 − µ(1.2)(〈0, 05, g〉)), enquanto a utilidade esperadade escolher m é 4. Consistência entre µ e σ implica que:

µ(1.2)(〈0, 05, g〉) =0, 05σ1(1.1)(g)

0, 05σ1(1.1)(g) + 0, 95σ1(1.1)(g)σ2(2.1)(h)

=1

1 + 19σ2(2.1)(h).

Note que mesmo que σ1(1.1)(g) = 0, consistência implica a mesma fórmulaacima.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Vamos primeiro verificar se existe equilíbrio sequencial no qual σ1(1.2)(n) = 1.Então, racionalidade sequencial implica que8µ(1.2)(〈0, 05, g〉) + 3(1 − µ(1.2)(〈0, 05, g〉)) ≥ 4, ou seja,µ(1.2)(〈0, 05, g〉) ≥ 0, 2. Isto por sua vez, implica que σ2(2.1)(h) ≤ 4

19. Mas se

σ1(1.2)(n) = 1, a utilidade esperada do jogador 2 de escolher h no conjunto deinformação 2.1 é 9, enquanto a utilidade esperada de escolher i é 5. Portanto,σ2(2.1)(h) = 1, contradizendo a condição σ2(2.1)(h) ≤ 4

19. Logo, não existe

equilíbrio sequencial no qual σ1(1.2)(n) = 1.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Vamos tentar verificar se existe equilíbrio sequencial com σ1(1.2)(n) = 0.Então, racionalidade sequencial implica que8µ(1.2)(〈0, 05, g〉) + 3(1 − µ(1.2)(〈0, 05, g〉)) ≤ 4, ou seja,µ(1.2)(〈0, 05, g〉) ≤ 0, 2. Isto por sua vez, implica que σ2(2.1)(h) ≥ 4

19. Mas se

σ1(1.2)(n) = 0, a utilidade esperada do jogador 2 de escolher h no conjunto deinformação 2.1 é 4, enquanto a utilidade esperada de escolher i é 5. Portanto,σ2(2.1)(h) = 0, contradizendo a condição σ2(2.1)(h) ≥ 4

19. Logo, não existe

equilíbrio sequencial no qual σ1(1.2)(n) = 0.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Portanto, em qualquer equilíbrio sequencial devemos ter 0 < σ1(1.2)(n) < 1.Então, racionalidade sequencial implica que8µ(1.2)(〈0, 05, g〉) + 3(1 − µ(1.2)(〈0, 05, g〉)) = 4, ou seja,µ(1.2)(〈0, 05, g〉) = 0, 2. Isto por sua vez, implica que σ2(2.1)(h) = 4

19.

Portanto, temos que o jogador 2 deve ser indiferente entre h e i no conjunto deinformação 2.1. Mas neste caso, temos que a utilidade esperada do jogador 2de escolher h no conjunto de informação 2.1 é 9σ1(1.2)(n) + 4(1− σ1(1.2)(n)),enquanto a utilidade esperada de escolher i é 5. Portanto,9σ1(1.2)(n) + 4(1 − σ1(1.2)(n)) = 5, ou seja, σ1(1.2)(n) = 0, 2.

Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita

Exemplo

Resta-nos apenas determinar a estratégia do jogador 1 no conjunto deinformação 1.1. Se ele escolher f , ele tem utilidade esperada 0, enquanto se eleescolher g , ele tem utilidade esperada

0, 95(−1(15/19) + 4(4/19)0, 8 + 3(4/19)0, 2) + 0, 05(4(0, 8) + 8(0, 2)) = 0, 25

Portanto, σ1(1.1)(g) = 1.Observe que se tivéssemos um jogo onde o jogador chance só tivesse a opçãode escolher a alternativa superior, então no único equilíbrio sequencial do jogo,os jogadores escolheriam f , i , m, o, com probabilidade 1. Este exemplo, servepara ilustrar o importante papel que pequenas incertezas no jogo podem gerarno equilíbrio.

Observação

Vimos alguns refinamentos de equilíbrios de Nash para jogos em forma extensa.A seguir, analisaremos refinamentos de equilíbrio de Nash também para jogosem forma normal.