Ir para o conteúdo

CCT-UFCA/Ciência da Computação/Introdução à Teoria dos Jogos/Remoção de estratégias estritamente dominadas

De Wikiversidade

Remoção de estratégias estritamente dominadas

[editar | editar código]

Considerando e estratégias do jogador , assim como o conjunto de todos os perfis de estratégia dos jogadores restantes exceto o do jogador , e um perfil de ação dos outros jogadores, formalmente falando temos que estritamente domina se: .

Intuitivamente falando, para qualquer escolha possível dos outros jogadores o jogador sempre ganha mais escolhendo do que , ou seja, não importa o que os outros jogadores façam sempre será melhor que . De maneira complementar dizemos que uma estratégia é estritamente dominada por se estritamente domina .

Dentro desse contexto um importante conceito de solução que podemos explorar é o de remoção de estratégias estritamente dominadas, que consiste em remover iterativamente estratégias estritamente dominadas até que não seja mais possível. O resultado gerado por esse processo geralmente coincide em um equilíbrio de Nash daquele jogo, do contrário o resultado obtido gera uma simplificação do mesmo jogo.

Exemplo 1: considere o jogo abaixo:

1/2 L C R
U
M
D

Analisando o jogo sobre a perspectiva do jogador 2, temos que R é estritamente dominada por C, pois independente da escolha do jogador 1 C sempre resultará em um valor de utilidade estritamente maior que R, conforme é possível observar ao analisar todas as possibilidades de escolha do jogador 1:

  • Jogador 1 escolhe U: estratégia C resulta em utilidade maior que R pois 1>0.
  • Jogador 1 escolhe M: estratégia C resulta em utilidade maior que R pois 1>0.
  • Jogador 1 escolhe D: estratégia C resulta em utilidade maior que R pois 2>1.

Logo removeremos a estratégia R do jogador 2.

1/2 L C
U
M
D

Analisando o jogo resultante sobre a perspectiva do jogador 1 temos que a estratégia M é estritamente dominada por U, pois independente da escolha do jogador 2 U sempre resultará em um valor de utilidade estritamente maior que M, conforme é possível observar ao analisar todas as possibilidades de escolha do jogador 2:

  • Jogador 2 escolhe L: estratégia U resulta em utilidade maior que M pois 3 > 1.
  • Jogador 2 escolhe C: estratégia U resulta em utilidade maior que M pois 2 > 1.

Logo removeremos a estratégia M do jogador 2.

1/2 L C
U
D

Analisando o jogo resultante sobre a perspectiva do jogador 2 temos que a estratégia L é estritamente dominada por C, pois independente da escolha do jogador 1 C sempre resultará em um valor de utilidade estritamente maior que L, logo removeremos a estratégia C.

1/2 C
U
D

Por fim, analisando o jogo resultante sobre a perspectiva do jogador 1 temos que a estratégia U é estritamente dominada por D, pois independente da escolha do jogador 2 D sempre resultará em um valor de utilidade estritamente maior que U, logo removeremos a estratégia U, chegando em uma versão simplificada do jogo composta apenas pelo perfil de ação ({D, C}) que corresponde ao equilíbrio de nash puro desse jogo.

Exemplo de aplicação prática

[editar | editar código]

Um exemplo notável da influência de estratégias dominantes sobre um fenômeno comportamental real pode ser verificado pelo artigo de e B.A Baldwin and G.B Meese (1979) ”Social Behavior in Pigs Studied by Means of Operant Conditioning” Animal Behavior, Vol27, p 947-957.

Nesse estudo foi criado um cenário isolado onde dois porcos de tamanhos diferentes encontram-se em uma jaula, em que a comida é colocada no lado oposto a um botão apenas quando esse é pressionado por um dos porcos. O experimento criado pelos pesquisadores foi modelado de acordo com os seguintes cenários e condições:

  • Se locomover para acionar o botão custa 2 unidades de energia de comida (-2 de utilidade).
  • Se o porco maior chegar na comida primeiro, significa que ele escolheu esperar enquanto o porco menor apertou o botão, então: 1, 9 (1 para o pequeno e 9 para o grande).
  • Se o porco menor chegar na comida primeiro significa que ele escolheu esperar enquanto o porco maior acionou o botão, então: 4,6.
  • Se os dois chegarem na comida ao mesmo tempo significa que ambos escolheram apertar o botão, então: 3,7.

Tais cenários e circunstâncias podem ser expressas como o jogo na forma normal abaixo com os seguintes valores de utilidade:

pequeno/grande Apertar botão Esperar
Apertar botão
Esperar

Utilizando o conceito de remoção de estratégias estritamente dominadas chegamos no resultado correspondente ao perfil de ação a = {(Esperar, Apertar botão)}. Esse experimento foi extensivamente testado 10 vezes em cenários onde os porcos foram deixados sozinhos e juntos na jaula, tendo cada teste duração de 15 minutos, resultando na seguinte tabela de verificação quando a frequência que cada porco acionou o botão em cada cenário:

sozinho juntos
porco pequeno 75 105
porco grande 70 5

Repare que para o cenário onde ambos se encontram juntos foi verificado que o porco maior aperta o botão em uma frequência muito maior que o porco pequeno, o que coincide com o resultado que encontramos no jogo na formal normal onde o porco pequeno escolhe esperar enquanto o grande aciona o botão, isso significa que porcos são racionais? Não, apenas sugerem que porcos aprendem e respondem a incentivos o que reflete em não escolherem estratégias estritamente dominadas, evidenciando que podemos utilizar a teoria dos jogos e o conceito de remoção de estratégias dominadas para modelar e prever diversas situações do mundo real.