22 Junho 2021 15:41

Indução para trás

O que é indução reversa?

A indução retroativa na teoria dos jogos é um processo iterativo de raciocínio retroativo no tempo, a partir do final de um problema ou situação, para resolver jogos de forma extensiva finita e sequenciais e inferir uma sequência de ações ótimas.

Indução para trás explicada

A indução reversa tem sido usada para resolver jogos desde que John von Neumann e Oskar Morgenstern estabeleceram a teoria dos jogos como um assunto acadêmico quando publicaram seu livro Teoria dos Jogos e Comportamento Econômico em 1944.

Em cada estágio do jogo, a indução para trás determina a estratégia ótima do jogador que faz o último movimento no jogo. Então, a ação ótima do penúltimo jogador em movimento é determinada, considerando a ação do último jogador como dada. Este processo continua para trás até que a melhor ação para cada momento tenha sido determinada. Efetivamente, está-se determinando o equilíbrio de Nash de cada subjogo do jogo original.

No entanto, os resultados inferidos da indução para trás muitas vezes falham em prever o jogo humano real. Estudos experimentais mostraram que o comportamento “racional” (conforme previsto pela teoria dos jogos) raramente é exibido na vida real. Jogadores irracionais podem, na verdade, acabar obtendo recompensas mais altas do que o previsto pela indução reversa, como ilustrado no jogo da centopéia.

No jogo da centopéia, dois jogadores alternadamente têm a chance de ficar com uma parte maior de um pote crescente de dinheiro ou de passar o pote para o outro jogador. Os pagamentos são arranjados de forma que se o pote for passado para o oponente e o oponente levar o pote na próxima rodada, a pessoa receba um pouco menos do que se tivesse levado o pote nesta rodada. O jogo termina assim que um jogador pega o estoque, com aquele jogador recebendo a maior parte e o outro jogador recebendo a menor.

Exemplo de indução para trás

Por exemplo, suponha que o Jogador A vá primeiro e tenha que decidir se deve “pegar” ou “passar” o estoque, que atualmente equivale a $ 2. Se ele pegar, então A e B recebem $ 1 cada, mas se A passar, a decisão de pegar ou passar agora deve ser feita pelo Jogador B. Se B pegar, ela recebe $ 3 (ou seja, o estoque anterior de $ 2 + $ 1) e A recebe $ 0. Mas se B passa, A agora decide se vai pegar ou passar, e assim por diante. Se os dois jogadores sempre decidirem passar, cada um receberá um pagamento de $ 100 no final do jogo.

O objetivo do jogo é se A e B cooperarem e continuarem a passar até o final do jogo, eles receberão o pagamento máximo de $ 100 cada. Mas se eles desconfiarem do outro jogador e esperarem que eles “aproveitem” na primeira oportunidade, o equilíbrio de Nash prevê que os jogadores farão a menor reclamação possível ($ 1 neste caso).

O equilíbrio de Nash deste jogo, onde nenhum jogador tem incentivo para se desviar de sua estratégia escolhida após considerar a escolha de um oponente, sugere que o primeiro jogador levaria o pote logo na primeira rodada do jogo. No entanto, na realidade, relativamente poucos jogadores o fazem. Como resultado, eles obtêm um ganho maior do que o previsto pela análise de equilíbrio.

Resolvendo jogos sequenciais usando indução reversa

Abaixo está um jogo sequencial simples entre dois jogadores. Os rótulos com Jogador 1 e Jogador 2 dentro deles são os conjuntos de informações para os jogadores um ou dois, respectivamente. Os números entre parênteses na parte inferior da árvore são os ganhos em cada ponto respectivo. O jogo também é sequencial, então o Jogador 1 toma a primeira decisão (esquerda ou direita) e o Jogador 2 toma sua decisão após o Jogador 1 (para cima ou para baixo).

A indução reversa, como toda teoria dos jogos, usa os pressupostos de racionalidade e maximização, o que significa que o Jogador 2 maximizará seu retorno em qualquer situação. Em qualquer conjunto de informações, temos duas opções, quatro ao todo. Ao eliminar as opções que o Jogador 2 não escolherá, podemos restringir nossa árvore. Desta forma, marcaremos as linhas em azul que maximizam o retorno do jogador no conjunto de informações fornecido.

Após essa redução, o Jogador 1 pode maximizar seus ganhos agora que as escolhas do Jogador 2 são conhecidas. O resultado é um equilíbrio encontrado pela indução retroativa do Jogador 1 escolhendo “certo” e o Jogador 2 escolhendo “para cima”. Abaixo está a solução para o jogo com o caminho de equilíbrio em negrito.

Por exemplo, pode-se facilmente configurar um jogo semelhante ao anterior usando empresas como jogadores. Este jogo pode incluir cenários de lançamento de produto. Se a Empresa 1 quisesse lançar um produto, o que a Empresa 2 poderia fazer em resposta? A Empresa 2 lançará um produto concorrente semelhante? Ao prever as vendas deste novo produto em diferentes cenários, podemos montar um jogo para prever como os eventos podem se desenrolar. Abaixo está um exemplo de como alguém pode modelar tal jogo.