23 Junho 2021 5:02

Dilema do Prisioneiro

Qual é o dilema do prisioneiro?

O dilema do prisioneiro é um paradoxo na análise de decisão em que dois indivíduos agindo em seus próprios interesses não produzem o resultado ideal. O dilema do prisioneiro típico é estabelecido de tal forma que ambas as partes escolhem se proteger às custas do outro participante. Como resultado, ambos os participantes se encontram em um estado pior do que se tivessem cooperado no processo de tomada de decisão. O dilema do prisioneiro é um dos conceitos mais conhecidos da moderna teoria dos jogos.

Principais vantagens

  • O dilema do prisioneiro é uma situação em que os tomadores de decisão individuais sempre têm um incentivo para escolher de uma forma que crie um resultado inferior ao ideal para os indivíduos como um grupo.
  • Os dilemas do prisioneiro ocorrem em muitos aspectos da economia.
  • As pessoas desenvolveram muitos métodos de superar os dilemas dos prisioneiros para escolher melhores resultados coletivos, apesar dos incentivos individuais aparentemente desfavoráveis.

Compreendendo o dilema do prisioneiro

O dilema do prisioneiro apresenta uma situação em que duas partes, separadas e incapazes de se comunicar, devem cada uma escolher entre cooperar ou não. A maior recompensa para cada parte ocorre quando ambas as partes optam por cooperar. 

O dilema clássico do prisioneiro é o seguinte: dois membros de uma gangue de ladrões de banco, Dave e Henry, foram presos e interrogados em salas separadas. As autoridades não têm outras testemunhas e só podem provar o caso contra elas se conseguirem convencer pelo menos um dos ladrões a trair o seu cúmplice e testemunhar o crime. Cada assaltante de banco se depara com a escolha de cooperar com seu cúmplice e permanecer em silêncio ou desertar da gangue e testemunhar na acusação. Se ambos cooperarem e permanecerem em silêncio, então as autoridades só poderão condená-los com uma acusação menor de vadiagem, o que significará um ano de prisão cada (1 ano para Dave + 1 ano para Henry = 2 anos de prisão total Tempo). Se um testemunhar e o outro não, aquele que testemunhar ficará livre e o outro receberá três anos (0 anos para o que desertou + 3 para o condenado = 3 anos no total). No entanto, se ambos testemunharem contra o outro, cada um receberá dois anos de prisão por ser parcialmente responsável pelo roubo (2 anos para Dave + 2 anos para Henry = 4 anos de prisão total).

Nesse caso, cada ladrão sempre tem um incentivo para desertar, independentemente da escolha do outro. Do ponto de vista de Dave, se Henry permanecer em silêncio, então Dave pode cooperar com Henry e cumprir um ano de prisão ou desertar e ser libertado. Obviamente, seria melhor trair Henry e o resto da gangue neste caso. Por outro lado, se Henry desertar e testemunhar contra Dave, a escolha de Dave passa a ser permanecer em silêncio e cumprir três anos ou falar e cumprir dois anos de prisão. Novamente, obviamente, ele preferiria fazer os dois anos ao invés de três.

Em ambos os casos, independentemente de Henry cooperar com Dave ou denunciar a acusação, Dave ficará melhor se ele próprio desertar e testemunhar. Agora, como Henry enfrenta exatamente o mesmo conjunto de escolhas, será sempre melhor desertar também. O paradoxo do dilema do prisioneiro é este: ambos os ladrões podem minimizar o tempo total de prisão que os dois cumprirão apenas se ambos cooperarem (2 anos no total), mas os incentivos que cada um enfrenta separadamente sempre os motivará cada um trair e acabar cumprindo a pena máxima total de prisão entre os dois (4 anos no total).

Exemplos do dilema do prisioneiro

A economia está repleta de exemplos de dilemas dos prisioneiros que podem ter resultados benéficos ou prejudiciais para a economia e a sociedade como um todo. O traço comum são as situações em que os incentivos enfrentados por cada tomador de decisão individual que pode escolher induziria cada um a se comportar de uma forma que tornaria todos eles coletivamente piores, evitando individualmente escolhas que os tornariam todos coletivamente melhores se todos pudessem alguns escolhem de alguma forma cooperativamente. 

Um exemplo é a tragédia dos comuns. Pode ser uma vantagem coletiva para todos conservar e reinvestir na propagação de um recurso natural comum para poder continuar a consumi-lo, mas cada indivíduo sempre tem um incentivo para consumir o máximo possível o mais rápido possível, o que então esgota o recurso. Encontrar uma maneira de cooperar claramente deixaria todos melhor aqui.

Por outro lado, o comportamento dos cartéis também pode ser considerado um dilema do prisioneiro. Todos os membros de um cartel podem enriquecer coletivamente restringindo a produção para manter o preço que cada um recebe alto o suficiente para capturar as rendas econômicas dos consumidores, mas cada membro do cartel individualmente tem um incentivo para trapacear no cartel e aumentar a produção para também capturar as rendas de os outros membros do cartel. Em termos do bem-estar da sociedade em geral em que o cartel opera, este é um exemplo de como o dilema de um prisioneiro que destrói o cartel às vezes pode realmente melhorar a vida da sociedade como um todo. 

Fuga do Dilema do Prisioneiro

Com o tempo, as pessoas descobriram uma variedade de soluções para os dilemas dos prisioneiros, a fim de superar os incentivos individuais em favor do bem comum.

Primeiro, no mundo real, a maioria das interações econômicas e outras interações humanas se repetem mais de uma vez. O dilema de um verdadeiro prisioneiro é tipicamente jogado apenas uma vez, ou então é classificado como um dilema repetido do prisioneiro. No dilema de um prisioneiro repetido, os jogadores podem escolher estratégias que recompensam a cooperação ou punem a deserção ao longo do tempo. Ao interagir repetidamente com os mesmos indivíduos, podemos até passar deliberadamente do dilema de um prisioneiro de uma vez para o dilema de um prisioneiro repetido.

Em segundo lugar, as pessoas desenvolveram estratégias institucionais formais para alterar os incentivos que os tomadores de decisão individuais enfrentam. A ação coletiva para impor o comportamento cooperativo por meio de reputação, regras, leis, tomada de decisão democrática ou outra coletiva e punição social explícita para deserções transforma muitos dilemas dos prisioneiros em resultados cooperativos mais benéficos coletivamente.  

Por último, algumas pessoas e grupos de pessoas desenvolveram preconceitos psicológicos e comportamentais ao longo do tempo, como maior confiança uns nos outros, orientação futura de longo prazo em interações repetidas e inclinações para a reciprocidade positiva de comportamento cooperativo ou reciprocidade negativa de comportamentos de abandono. Essas tendências podem evoluir por meio de um tipo de seleção natural dentro de uma sociedade ao longo do tempo, ou seleção de grupo em diferentes sociedades concorrentes. Na verdade, eles levam grupos de indivíduos a escolher “irracionalmente” resultados que são realmente os mais benéficos para todos eles juntos.

Juntos, esses três fatores (os dilemas repetidos do prisioneiro, instituições formais que quebram os dilemas do prisioneiro e preconceitos comportamentais que minam a escolha individual “racional” nos dilemas do prisioneiro) ajudam a resolver os muitos dilemas do prisioneiro que todos enfrentaríamos.