Ir para o conteúdo

CCT-UFCA/Ciência da Computação/Introdução à Teoria dos Jogos/Melhor resposta e equilíbrio de nash misto

De Wikiversidade

Melhor resposta e equilíbrio de nash misto

[editar | editar código]

Uma estratégia mista é considerada a melhor resposta de um jogo quando essa estratégia maximiza a utilidade de um jogador, dado que os demais sigam estratégias mistas específicas. Formalmente falando, dizemos que a melhor resposta do jogador para o perfil de estratégia é a estratégia tal que para todas as estratégias , ou seja, a estratégia gera a mesma ou maior utilidade que qualquer outra estratégia si.

Um equilíbrio de nash misto, por consequência, será um perfil de estratégia onde todos os jogadores escolhem suas melhores respostas, aquelas que maximizam suas utilidades dado o comportamento dos outros de forma que nenhum jogador consiga melhorar sua utilidade mudando sozinho sua estratégia.

Para encontrar o equilíbrio de nash misto precisamos encontrar probabilidades de cada jogador para com suas ações de modo que todos os jogadores fiquem indiferentes quanto as suas opções, ou seja, não possuam uma melhor resposta única visto que qualquer escolha resultaria em uma mesma utilidade esperada. Para isso precisamos:

  • Definir as variáveis: para um jogo com duas ações teremos a 1° ação como e a 2° como por exemplo
  • Calcular a utilidade do jogador que deseja tornar indiferente: por exemplo, se o jogador 1 pretende tornar o jogador 2 indiferente temos que calcular a utilidade de cada uma de suas ações, isso é feito somando o produto do payoff esperado da ação pela sua probabilidade de ocorrência para cada cenário de escolha do jogador 2. O mesmo vale para o jogador 2 que quer tornar o jogador 1 indiferente.
  • Igualar os resultados obtidos e resolver a equação

Exemplo prático

[editar | editar código]

Considere que o jogador 1 tem probabilidade de escolher , e de escolher , da mesma forma, o jogador 2 tem probabilidade de escolher , e de escolher . Vamos calcular a utilidade esperada de cada escolha para que o jogador 1 torne o jogador 2 indiferente:

Note que a utilidade esperada para cada ação ( e ) do jogador 2 é soma dos produtos do payoff esperado pela sua probabilidade de ocorrência em cada cenário de escolha do jogador 1, por exemplo, temos que a utilidade é igual a por que se o jogador 2 e 1 escolherem o jogador 2 espera ganhar 1 com probabilidade , caso contrário, jogador 2 escolhe e jogador 1 , o jogador 2 espera ganhar 0 com probabilidade .

Agora calcularemos a utilidade esperada para cada escolha para que o jogador 2 torne o jogador 1 indiferente:

Logo temos que o jogador escolherá com probabilidade de   e com probabilidade restante de , e o jogador 2 escolherá com probabilidade de e com probabilidade restante de , portanto, , e , são os equilíbrios de nash misto desse jogo.

Exemplo prático 2:

[editar | editar código]

Considere que o jogador 1 tem probabilidade de escolher , e de escolher , e o jogador 2 tem probabilidade de escolher , e de escolher . Vamos calcular a utilidade esperada para cada jogada para que o jogador 1 torne o jogador 2 indiferente:

Agora vamos calcular a utilidade esperada de cada jogada para que o jogador 2 torne o jogador 1 indiferente:

Logo, temos que o jogador 1 escolherá com probabilidade de com probabilidade de , enquanto o jogador 2 escolherá com probabilidade de e com probabilidade de , o equilíbrio de nash misto desse jogo é, portanto, e

Agora calcularemos a utilidade esperada para cada jogador:

para o jogador 1 temos:

para o jogador 2 temos:

logo, a utilidade esperada do jogador 1 e 2 são ambas 0.