Uma estratégia mista é considerada a melhor resposta de um jogo quando essa estratégia maximiza a utilidade de um jogador, dado que os demais sigam estratégias mistas específicas. Formalmente falando, dizemos que a melhor resposta do jogador
para o perfil de estratégia
é a estratégia
tal que
para todas as estratégias
, ou seja, a estratégia
gera a mesma ou maior utilidade que qualquer outra estratégia si.
Um equilíbrio de nash misto, por consequência, será um perfil de estratégia onde todos os jogadores escolhem suas melhores respostas, aquelas que maximizam suas utilidades dado o comportamento dos outros de forma que nenhum jogador consiga melhorar sua utilidade mudando sozinho sua estratégia.
Para encontrar o equilíbrio de nash misto precisamos encontrar probabilidades de cada jogador para com suas ações de modo que todos os jogadores fiquem indiferentes quanto as suas opções, ou seja, não possuam uma melhor resposta única visto que qualquer escolha resultaria em uma mesma utilidade esperada. Para isso precisamos:
- Definir as variáveis: para um jogo com duas ações teremos a 1° ação como
e a 2° como
por exemplo
- Calcular a utilidade do jogador que deseja tornar indiferente: por exemplo, se o jogador 1 pretende tornar o jogador 2 indiferente temos que calcular a utilidade de cada uma de suas ações, isso é feito somando o produto do payoff esperado da ação pela sua probabilidade de ocorrência para cada cenário de escolha do jogador 2. O mesmo vale para o jogador 2 que quer tornar o jogador 1 indiferente.
- Igualar os resultados obtidos e resolver a equação
|
|
|
|
|
|
|
|
|
Considere que o jogador 1 tem probabilidade
de escolher
, e
de escolher
, da mesma forma, o jogador 2 tem probabilidade
de escolher
, e
de escolher
. Vamos calcular a utilidade esperada de cada escolha para que o jogador 1 torne o jogador 2 indiferente:
Note que a utilidade esperada para cada ação (
e
) do jogador 2 é soma dos produtos do payoff esperado pela sua probabilidade de ocorrência em cada cenário de escolha do jogador 1, por exemplo, temos que a utilidade
é igual a
por que se o jogador 2 e 1 escolherem
o jogador 2 espera ganhar 1 com probabilidade
, caso contrário, jogador 2 escolhe
e jogador 1
, o jogador 2 espera ganhar 0 com probabilidade
.
Agora calcularemos a utilidade esperada para cada escolha para que o jogador 2 torne o jogador 1 indiferente:
Logo temos que o jogador escolherá
com probabilidade de
e
com probabilidade restante de
, e o jogador 2 escolherá
com probabilidade de
e
com probabilidade restante de
, portanto,
,
e
,
são os equilíbrios de nash misto desse jogo.
|
|
|
|
|
|
|
|
|
Considere que o jogador 1 tem probabilidade
de escolher
, e
de escolher
, e o jogador 2 tem probabilidade
de escolher
, e
de escolher
. Vamos calcular a utilidade esperada para cada jogada para que o jogador 1 torne o jogador 2 indiferente:
Agora vamos calcular a utilidade esperada de cada jogada para que o jogador 2 torne o jogador 1 indiferente:
Logo, temos que o jogador 1 escolherá
com probabilidade de
e
com probabilidade de
, enquanto o jogador 2 escolherá
com probabilidade de
e
com probabilidade de
, o equilíbrio de nash misto desse jogo é, portanto,
e
Agora calcularemos a utilidade esperada para cada jogador:
para o jogador 1 temos:
para o jogador 2 temos:
logo, a utilidade esperada do jogador 1 e 2 são ambas 0.