Download - Teoria de Jogos - eduardosantos-lab.weebly.com · Nem sempre existe um invencível... Fenótipo 1 Fenótipo 2 Fenótipo 1 1 2 Fenótipo 2 2 1 Frequências 0,5 0,5 𝑤1=0,5+1=1,5

Transcript

Teoria de Jogos

Danilo G. Muniz

Introdução à teoria de jogos

Onde será que esse cara vai investir?

John Nash

Introdução à teoria de jogos

“Teoria evolutiva de jogos é um modo de pensar sobre evolução no nível dos fenótipos em que a aptidão de cada fenótipo depende de sua frequência na população”

John Maynard-Smith

Em outras palavras...

Método (um pouco matemático) para gerarprevisões evolutivas quando a aptidão de umindivíduo depende tanto da própria estratégia,quanto da estratégia dos outros membros dapopulação.

O que tem a ver com jogos?

E como funciona?

Qual o cenário? Quais as estratégias possíveis?

Como montar um modelo de teoria de jogos?

Qual a teoria ecológica?

Como essas estratégias interagem entre si?

Matriz de payoffs

Análise e conclusões

Pressupostos dos modelos

• População infinita (vamos trabalhar com proporções)

• Existem N estratégias (fenótipos) diferentes na

população

• Indivíduos realizam interações um-a-um

• Encontros são totalmente ao acaso

• Interações entre os indivíduos influenciam sua

aptidão (fitness)

Matriz de ganhos (payoffs)

... na interação com:

Ganho líquido ... Fenótipo 1 Fenótipo 2

Fenótipo 1 a b

Fenótipo 2 c d

A matriz é lida do ponto de vista das linhas

Uma população qualquer...

... na interação com:

Ganho líquido ... Fenótipo 1 Fenótipo 2

Fenótipo 1 a bFenótipo 2 c d

Frequências

s1

s2

Matriz de payoffs Frequênciasfenotípicas

Aptidão dos fenótipos

Fenótipo 1 Fenótipo 2

Fenótipo 1 a b

Fenótipo 2 c d

Frequências

s1

s2

𝑤1 = 𝑎 ∙ 𝑠1 + 𝑏 ∙ 𝑠2

𝑤2 = 𝑐 ∙ 𝑠1 + 𝑑 ∙ 𝑠2

É como multiplicar matrizes!

Fenótipo 1 Fenótipo 2

Fenótipo 1 a b

Fenótipo 2 c d

Freq.

s1

s2

X

É como multiplicar matrizes!

Fenótipo 1 Fenótipo 2

Fenótipo 1 a b

Fenótipo 2 c d

Freq.

s1

s2

𝑤1 = 𝑎 ∙ 𝑠1 + 𝑏 ∙ 𝑠2

𝑤1 = 𝑐 ∙ 𝑠1 + 𝑑 ∙ 𝑠2

X =

Aptidões

w1

w2

Mas essas aptidões servem pra quê?

Frequência na próxima geração

ഥ𝑤 = 𝑤1 ∙ 𝑠1 + 𝑤2 ∙ 𝑠2𝑠(𝑡+1) = 𝑠(𝑡) ∙𝑤

ഥ𝑤

Aptidão média da população

Equação doreplicador

𝑠1(𝑡+1) = 𝑠1(𝑡) ∙𝑤1

ഥ𝑤

𝑠2(𝑡+1) = 𝑠2(𝑡) ∙𝑤2

ഥ𝑤

Estratégias evolutivamente estáveis

Estratégia evolutivamente estável

Evolutionary stable strategy (ESS)

Uninvadable strategy

1) Estratégia que não pode ser invadida por uma estratégia mutante inicialmente rara

2) Consegue invadir uma população quandoInicialmente rara

Como identificar o invencível?

... na interação com:

Ganho líquido ... Fenótipo 1 Fenótipo 2

Fenótipo 1 2 2

Fenótipo 2 1 1

Estratégia evolutivamente estável pura

Como identificar o invencível?

... na interação com:

Ganho líquido ... Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Nem sempre existe um invencível...

Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Frequências

0,5

0,5

𝑤1 = 0,5 + 1 = 1,5

𝑤2 = 1 + 0,5 = 1,5

Estratégia evolutivamente estável mista

... na interação com:

Ganho líquido ... Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Estratégia evolutivamente estável mista

Frequências

0,5

0,5

ESS mista

• Poderia ser imaginada como um ESTADO EVOLUTIVAMENTE ESTÁVEL

• Estado populacional que, mesmo se perturbado, tende a se reestabelecer

Nem sempre existe um invencível...

Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Frequências

0,3

0,7

𝑤1 = 0,3 + 1,4 = 1,7

𝑤2 = 0,6 + 0,7 = 1,3

Nem sempre existe um invencível...

Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Frequências

0,7

0,3

𝑤1 = 0,7 + 0,6 = 1,3

𝑤2 = 1,4 + 0,3 = 1,7

Voltamos ao estado estável

Fenótipo 1 Fenótipo 2

Fenótipo 1 1 2

Fenótipo 2 2 1

Frequências

0,5

0,5

𝑤1 = 0,5 + 1 = 1,5

𝑤2 = 1 + 0,5 = 1,5

Jogo gavião-pombo

Modelo gavião-pombo (hawk-dove)

• O gavião e o pombo simbolizam dois tipos de estratégias

Agressividade Paciência

Modelo gavião-pombo (hawk-dove)

• Modelo de disputa intraespecífica

• Duas estratégias

- Sempre luta pelo recurso- Sempre foge da luta

- Divide o recurso com outro pombo

Modelo Gavião-pombo

V = valor do recurso ; C = custo da luta

... na disputa contra:

Ganho líquido ...

𝑉 − 𝐶

2𝑉

0𝑉

2

Modelo Gavião-pombo

Equações de aptidão (fitness)

𝑤𝑔 = 𝑠𝑔

𝑉 − 𝐶

2+ 𝑠𝑝 ∙ 𝑉

𝑤𝑝 = 𝑠𝑝

𝑉

2

ѡ: aptidão; s: proporção (share) de cada estratégia ; g: gavião; p: pombo; V: benefício da vitória; C: custo da luta

Modelo Gavião-pombo

V = 5; C = 2

... na disputa contra:

Ganho líquido ...

𝑉−𝐶

2= 1,5 𝑉 = 5

0𝑉

2= 2,5

Modelo Gavião-pombo

V = 2; C = 5

... na disputa contra:

Ganho líquido ...

𝑉−𝐶

2= -1,5 𝑉 = 2

0𝑉

2= 1

A ESS nem sempre é a mesma...

E agora?

Modelo Gavião-pombo

𝑤𝑔 = 𝑤𝑝

𝑠𝑔𝑉−𝐶

2+ 𝑠𝑝 ∙ 𝑉 = 𝑠𝑝

𝑉

2

Quando a população entra em equilíbrio?

Modelo Gavião-pombo

𝑠𝑔𝑉−𝐶

2+ 𝑠𝑝 ∙ 𝑉 = 𝑠𝑝

𝑉

2

Vamos calcular a proporção de gaviões em equilíbrio...

Substitui (sp) por (1-sg)

𝑠𝑔𝑉−𝐶

2+ 1 − 𝑠𝑔 𝑉 = 1 − 𝑠𝑔

𝑉

2

𝑠𝑔𝑉

2−

𝑠𝑔𝐶

2+ 𝑉 − 𝑠𝑔𝑉 =

𝑉

2−

𝑠𝑔𝑉

2

Faz as multiplicações

Modelo Gavião-pombo

𝑠𝑔𝑉

2−

𝑠𝑔𝐶

2+ 𝑉 − 𝑠𝑔𝑉 =

𝑉

2−

𝑠𝑔𝑉

2

𝑠𝑔𝑉

2+

𝑠𝑔𝑉

2−

𝑠𝑔𝐶

2+ 𝑉 − 𝑠𝑔𝑉 =

𝑉

2

−𝑠𝑔𝐶

2+ 𝑉 =

𝑉

2

Modelo Gavião-pombo

−𝑠𝑔𝐶

2+ 𝑉 =

𝑉

2

x 2

−𝑠𝑔𝐶 + 2𝑉 = 𝑉

𝑉 = 𝑠𝑔𝐶

𝑠𝑔 =𝑉

𝐶

Modelo Gavião-pombo

V = 1

É agora que entra a equação do replicador?

Deve ser né...

Frequência na próxima geração

ഥ𝑤 = 𝑤1 ∙ 𝑠1 + 𝑤2 ∙ 𝑠2𝑠(𝑡+1) = 𝑠(𝑡) ∙𝑤

ഥ𝑤

Aptidão média da população

Equação doreplicador

𝑠1(𝑡+1) = 𝑠1(𝑡) ∙𝑤1

ഥ𝑤

𝑠2(𝑡+1) = 𝑠2(𝑡) ∙𝑤2

ഥ𝑤

Modelo Gavião-pombo

V = 1; C = 2

... na disputa contra:

Ganho líquido ...

𝑉 − 𝐶

2𝑉

0𝑉

2

Frequências

0,001

0,999

Modelo Gavião-pombo

V = 1

Modelo Gavião-pombo

V = 1; C = 2

... na disputa contra:

Ganho líquido ...

𝑉 − 𝐶

2𝑉

0𝑉

2

Frequências

0,001

0,999

Modelo Gavião-pombo

V = 1 ; C = 2

Jogo do altruísmo

Modelo simplificado de altruísmo

Altruísta Egoísta

Concede um benefícioem qualquer interação

Aceita benefícios

Jogo do altruísmo

... na interação com:

Ganho líquido ...Altruísta Egoísta

Altruísta 1 + 𝑏 − 𝑐 1 − 𝑐

Egoísta 1 + 𝑏 1

b = Benefício de interagir com um altruístac = custo do altruísta ao interagir

Equilíbrio

Equilíbrio ocorre quando c = 0

... na interação com:

Ganho líquido ...Altruísta Egoísta

Altruísta 1 + 𝑏 − 𝑐 1 − 𝑐

Egoísta 1 + 𝑏 1

Quando c > 0

b = 1 ; c = 0,5

Altruísta

Egoísta

Quando c > 0

Equilíbrio

Com c > 0, o altruísta sempre perece!

... na interação com:

Ganho líquido ...Altruísta Egoísta

Altruísta 1 + 𝑏 − 𝑐 1 − 𝑐

Egoísta 1 + 𝑏 1

Jogo do altruísmo

Quando c > 0, o egoísmo é a estratégia evolutivamente estável

O que acontece se o altruísta for seletivo?

• W.D. Hamilton – propõe a ideia do “altruísta seletivo”

• R. Dawkins – “Eu tenho uma barba verde, e serei altruísta com quem possui uma barba verde”

Jogo do barbaverde

Altruísta Egoísta

Concede um benefícioem qualquer interação

Aceita benefícios

Barbaverde

Concede um benefícioa outro barbaverde

Matriz de payoffs

... na interação com:

Ganho líquido ...Altruísta Egoísta Barbaverde

Altruísta 1 + 𝑏 − 𝑐 1 − 𝑐 1 − 𝑐

Egoísta 1 + 𝑏 1 1

Barbaverde 1 + 𝑏 1 1 + 𝑏 − 𝑐

b = Benefício do altruísmoc = custo do altruímo

Jogo do barbaverde

FrequênciasIniciais

Altruísta: 0,7Egoísta: 0,2

Barbaverde: 0,1

Jogo do barbaverde

FrequênciasIniciais

Altruísta: 0,7Egoísta: 0,2

Barbaverde: 0,1

Jogo do barbaverde

Quando b > c, ser um barbaverde é uma estratégia evolutivamente estável

... na interação com:

Ganho líquido ...Altruísta Egoísta Barbaverde

Altruísta 1 + 𝑏 − 𝑐 1 − 𝑐 1 − 𝑐

Egoísta 1 + 𝑏 1 1

Barbaverde 1 + 𝑏 1 1 + 𝑏 − 𝑐

Jogo do barbaverde

Ser egoísta nem sempre é a melhor alternativa.

Jogo pedra-papel-tesoura

Jogo pedra-papel-tesoura

Jogo pedra-papel-tesoura

Proposição teórica

Explicar a coexistência contínua de estratégias alternativas

Jogo pedra-papel-tesoura

Estratégia 1

Estratégia 3 Estratégia 2

Matriz pedra-papel-tesoura

... na interação com:

Ganho líquido ...Pedra Papel Tesoura

Pedra 1 ½ 2

Papel 2 1 ½

Tesoura ½ 2 1

Equilíbrio pedra-papel-tesoura

... na interação com:

Ganho líquido ...Pedra Papel Tesoura

Pedra 1 ½ 2

Papel 2 1 ½

Tesoura ½ 2 1

𝑠𝑝𝑒𝑑𝑟𝑎 = 𝑠𝑝𝑎𝑝𝑒𝑙 = 𝑠𝑡𝑒𝑠𝑜𝑢𝑟𝑎

Pedra-papel-tesoura

Lagarto pedra-papel-tesoura

Uta stansburiana

Lagarto pedra-papel-tesoura

AgressivoDefende haréns sozinho

Defende uma fêmea só.Cooperativo.

Imita fêmease copula furtivamente

Pedra-papel-tesoura-lagarto-spock?

Jogo da razão sexual

Pressupostos dos modelos

• População infinita

• Existem N estratégias (fenótipos) diferentes na população

• Encontros são totalmente ao acaso

• Indivíduos realizam interações um-a-um

• Estratégias influenciam interações que influenciam a aptidão

O que acontece se houver infinitas estratégias possíveis?

Infinitas estratégias?

Faz sentido isso?

Estrutura, atividade coisa assim 1

Recursos limitados

Estrutura, atividade coisa assim 2

Jogo da razão sexual

Filhotes machos

Ovos limitados

Filhotes fêmeas

Mas e a ESS?

1) Estratégia que não pode ser invadida por uma estratégia mutante inicialmente rara

2) Consegue invadir uma população quando

Inicialmente rara

O conceito de estratégia evolutivamente estável...

ESS em um mundo infinito...

Filhotes machos Filhotes fêmeas

Forma ideal de divisão de recursos

Razão sexual da prole

Fêmeas possuem uma quantidade fixa de ovos

Aptidão (fitness) medida como número de netos

Hora de calcular um pouco...

Mas o que a gente tem que calcular?

Aptidão de uma fêmea mutante em uma população que produz filhotes com uma razão

sexual característica

Hora de calcular um pouco...

Ovos por fêmea: N

Proporção de machos na prole da fêmea mutante: S

Proporção de machos gerados pelas outras fêmeas da população S’

Filhas: (1-S) ∙ N

Filhos: S ∙ N

Hora de calcular um pouco...

Netos gerados pelas filhas

(1-S) ∙ N2

Numero de filhas porfêmea

(1-S) ∙ N

Numero de filhotespor filha

N

Hora de calcular um pouco...

Netos gerados pelos filhos

(Machos precisam fertilizar fêmeas)

Hora de calcular um pouco...

Netos gerados pelos filhos

(Machos precisam fertilizar fêmeas)

Número médio de parceiras por macho:

Total de fêmeas / Total de machos

(1-S’)/ S’

Hora de calcular um pouco...

Filhotes por filho

N ∙ [ (1-S’)/ S’ ]

N ∙ [ (1-S’)/ S’ ] ∙ S ∙ N

S ∙ N2 ∙ [ (1-S’)/ S’ ]

(Total de netos gerados pelos filhos)

Número de filhos

Total de netos da fêmea mutante...

(1-S) ∙ N2 + S ∙ N2 ∙ [ (1-S’)/ S’ ]

𝑤 = 𝑁2 ∙ 1 − 𝑆 + 𝑆 ∙1 − 𝑆´

𝑆´

Total de netos da fêmea “dominante”

𝑤′ = 𝑁2 ∙ 1 − 𝑆′ + 𝑆′ ∙1 − 𝑆´

𝑆´

Total de netos da fêmea “dominante”

𝑤′ = 𝑁2 ∙ 1 − 𝑆′ + 𝑆′ ∙1 − 𝑆´

𝑆´

𝑤′ = 𝑁2 ∙ 1 − 𝑆′ + 1 − 𝑆´

𝑤′ = 𝑁2 ∙ 2 − 2 ∙ 𝑆′

𝑤′ = 2 ∙ 𝑁2 ∙ (1 − 𝑆′)

Em busca da ESS!!

S´ (razão sexual da prole da população)

Em busca da ESS!!

S´ (razão sexual da prole da população)

Em busca da ESS!

𝑤 = 𝑁2 ∙ 1 − 𝑆 + 𝑆 ∙1 − 𝑆´

𝑆´

𝑤′ = 2 ∙ 𝑁2 ∙ (1 − 𝑆′)

Encontrar o valor de S que faz com que w > w´

para qualquer S´?

Análise de invasibilidade

1) Vários valores de S e S´2) Calcula w e w’

Análise de invasibilidade

1) Vários valores de S e S´2) Calcula w e w’

w – w´> 0

w – w´<= 0

Análise de invasibilidade

1) Vários valores de S e S´2) Calcula w e w’

Análise de invasibilidade

Em busca da ESS!!

S´ (razão sexual da prole da população)

S = 0,5

Mensagens finais

A teoria de jogos é um método para gerar previsões evolutivas (não só na área de comportamento!).

O “jogo” é qualquer situação em que a aptidão de um indivíduo depende de sua estratégia e da estratégia dos

outros indivíduos

Boa parte da análise de um “jogo” é procurar a estratégia evolutivamente estável (que nem sempre

existe)

Bibliografia

Hora do intervalo!

Jogo Gavião-pombo no excel!

... na disputa contra:

Ganho líquido ...

𝑉 − 𝐶

2𝑉

0𝑉

2

ഥ𝑤 = 𝑤1 ∙ 𝑠1 + 𝑤2 ∙ 𝑠2𝑠(𝑡+1) = 𝑠(𝑡) ∙𝑤

ഥ𝑤

Jogo do cuidado parental

Maynard-Smith 1977. Anim. Behav.

Quem cuida da prole?

Fêmea guardiãFêmea

desertora

Macho guardião 𝐶𝑢𝑖𝑑𝑎𝑑𝑜𝑏𝑖𝑝𝑎𝑟𝑒𝑛𝑡𝑎𝑙

Cuidado paternal exclusivo

Macho desertorCuidado

maternal exclusivoSem cuidado

parental

Historinha do modelo

Se o macho cuidar da prole, ele se reproduz uma vez. Se desertar, ele tem uma segunda chance

Macho desertor tem probabilidade p de copular de novo

Fertilidade das fêmeas

Desertora: W ; guardiã: w

Parâmetros do modelo

Macho desertor tem probabilidade p de copular de novo

Fertilidade das fêmeas

Desertora: W ; guardiã: w

Sobrevivência da prole: P2 >= P1 >= P0

Matriz de payoffs

Fêmea

Macho Guarda Deserta

Guarda

Deserta

Matriz de payoffs

Fêmea

Macho Guarda Deserta

Guarda

Deserta

wP2

wP2

WP1

WP1

wP1

wP1(1+p)WP0(1+p)

WP0

Hora do exercício