23 Junho 2021 1:20

Dilema do Prisioneiro Iterado

Qual é o dilema do prisioneiro iterado?

O dilema do prisioneiro iterativo é uma extensão da forma geral, exceto que o jogo é repetidamente jogado pelos mesmos participantes. O dilema de um prisioneiro iterativo difere do conceito original de dilema de um prisioneiro porque os participantes podem aprender sobre as tendências comportamentais de sua contraparte.

O dilema do prisioneiro repetido às vezes é chamado de jogo da Guerra da Paz.

Compreendendo o dilema do prisioneiro iterado

Uma vez que o jogo é repetido, um indivíduo pode formular uma estratégia que não segue a convenção lógica regular de uma rodada isolada. Olhar por olho é uma estratégia de dilema iterativa comum do prisioneiro.

O jogo do dilema do prisioneiro iterativo é fundamental para muitas teorias de cooperação e confiança humanas. Com base no pressuposto de que o jogo pode modelar transações entre duas pessoas que exigem confiança, o comportamento cooperativo em populações pode ser modelado por uma versão iterativa de vários jogadores do jogo.

A teoria por trás do jogo cativou muitos estudiosos ao longo dos anos. Mais recentemente, pesquisadores de design organizacional usaram o jogo para modelar estratégias corporativas. O dilema do prisioneiro também é agora comum para as teorias dos jogos que se tornaram populares entre os estrategistas de investimento. A globalização e o comércio integrado impulsionaram ainda mais a demanda por modelos financeiros e operacionais que podem descrever questões geopolíticas.

Exemplo do jogo do dilema do prisioneiro iterado

Por exemplo, você e um colega estão na prisão e são suspeitos de cometer um crime. Vocês estão isolados um do outro e não sabem como o outro responderá ao questionamento. A polícia convida vocês dois a implicar um ao outro no crime (defeito). O que acontece depende do que vocês dois fazem, mas nenhum de vocês sabe como o outro vai reagir.

Se seu colega o trai (cede à tentação de desertar) enquanto você permanece em silêncio, você recebe a pena mais longa de prisão enquanto seu colega sai em liberdade (e vice-versa). Se vocês dois decidirem cooperar um com o outro (não com a polícia), permanecendo em silêncio, não há evidências suficientes para condenar ambos, então ambos recebem uma sentença leve por um crime menor. Se vocês dois decidirem desertar, então vocês se condenaram a penas ligeiramente reduzidas, mas ainda pesadas.

A recompensa neste jogo é uma redução nas sentenças de prisão de muito boa, razoavelmente boa, razoavelmente ruim ou muito ruim, que se traduz em um sistema de pontuação da seguinte forma:

O jogo é jogado iterativamente por uma série de rodadas até terminar (como se você fosse interrogado repetidamente por crimes separados). As pontuações de cada rodada são acumuladas, então o objetivo é otimizar a pontuação antes de terminar o jogo. O fim do jogo é determinado aleatoriamente em qualquer lugar entre 1 e 100 rodadas. No final do jogo, as pontuações são traduzidas em percentagens das melhores pontuações possíveis.