Dilema do Viajante
Qual é o dilema do viajante?
O dilema do viajante, na teoria dos jogos, é um jogo de soma diferente de zero em que dois jogadores tentam maximizar seu próprio retorno, sem levar em conta o outro. O jogo demonstra o ” paradoxo da racionalidade ” – a ironia de que tomar decisões ilógica ou ingenuamente geralmente produz um retorno melhor na teoria dos jogos.
Principais vantagens
- O dilema do viajante é um jogo em que dois jogadores, cada um lance em um pagamento proposto e ambos recebem o lance mais baixo, mais ou menos um pagamento de bônus.
- De acordo com a teoria dos jogos, a estratégia racional para ambos os jogadores é escolher o menor retorno possível. Isso resulta em ambos os jogadores recebendo pagamentos mais baixos do que poderiam obter seguindo uma estratégia irracional.
- Em estudos experimentais, as pessoas escolheram consistentemente recompensas mais altas e alcançaram melhores resultados do que a estratégia racional prevista pela teoria dos jogos.
Compreendendo o dilema do viajante
O jogo do dilema do viajante, formulado em 1994 pelo economista Kaushik Basu, apresenta um cenário em que uma companhia aérea danifica gravemente antiguidades idênticas adquiridas por dois viajantes diferentes. O gerente da companhia aérea está disposto a compensá-los pela perda das antiguidades, mas como não tem ideia sobre seu valor, ele diz aos dois viajantes para escreverem separadamente sua estimativa do valor como qualquer número entre US $ 2 e US $ 100 sem conferir com um outro.
No entanto, existem algumas advertências:
- Se ambos os viajantes anotarem o mesmo número, ele reembolsará a cada um deles esse valor.
- Se escreverem números diferentes, o gerente presumirá que o preço mais baixo é o valor real e que a pessoa com o número mais alto está trapaceando. Embora ele pague a ambos o valor mais baixo, a pessoa com o número mais baixo receberá um bônus de $ 2 pela honestidade, enquanto aquele que escreveu o número mais alto receberá uma penalidade de $ 2.
A escolha racional, em termos de equilíbrio de Nash, é $ 2. O raciocínio é o seguinte. O primeiro impulso do Viajante A pode ser escrever $ 100; se o Viajante B também anotar $ 100, esse é o valor que ambos receberão do gerente da companhia aérea. Mas pensando bem, o Viajante A raciocina que se ele escrever $ 99 e B colocar $ 100, então A receberá $ 101 ($ 99 + $ 2 de bônus). Mas A acredita que essa linha de pensamento também ocorrerá a B, e se B também colocar $ 99, ambos receberão $ 99. Portanto, A seria realmente melhor apostar $ 98 e receber $ 100 ($ 98 + $ 2 de bônus) se B escrever $ 99. Mas, uma vez que esse mesmo pensamento de escrever $ 98 poderia ocorrer a B, A considera colocar $ 97 e assim por diante. Essa linha de indução reversa levará os viajantes até o menor número permitido, que é $ 2.
As pessoas realmente escolhem o equilíbrio de Nash?
Em estudos experimentais, ao contrário das previsões da teoria dos jogos, a maioria das pessoas escolhe $ 100 ou um número próximo a ele, sem pensar no problema ou com plena consciência de que está se desviando da escolha racional. Portanto, embora a maioria das pessoas intuitivamente sinta que selecionaria um número muito maior do que $ 2, essa intuição parece contradizer o resultado lógico previsto pela teoria dos jogos – que cada viajante selecionaria $ 2. Ao rejeitar a escolha lógica e agir ilogicamente ao escrever um número maior, as pessoas acabam obtendo uma recompensa substancialmente maior.
Esses resultados estão de acordo com estudos semelhantes que utilizaram outros jogos, como o Prisoner’s Dilemma e o Public Goods, em que sujeitos experimentais tendem a não escolher o equilíbrio de Nash. Com base nesses estudos, os pesquisadores propuseram que as pessoas parecem ter uma atitude natural e positiva em favor da cooperação. Essa atitude leva a equilíbrios cooperativos que fornecem recompensas mais altas a todos os jogadores em jogos de um único lance ou repetidos, e podem ser explicados por pressões evolutivas seletivas que favorecem esses tipos de estratégias aparentemente irracionais, mas benéficas.
No entanto, os estudos do dilema do viajante também mostraram que quando a penalidade / bônus é maior ou quando os jogadores consistem em equipes de várias pessoas que tomam uma decisão comum, então os jogadores optam mais frequentemente por seguir a estratégia racional que leva ao equilíbrio de Nash. Esses efeitos também interagem, em que times de jogadores não apenas escolhem a estratégia mais racional, mas também são ainda mais responsivos ao tamanho da penalidade / bônus do que jogadores individuais. Esses estudos sugerem que as estratégias desenvolvidas que tendem a criar resultados sociais benéficos podem ser compensadas por estratégias mais racionais que tendem ao equilíbrio de Nash, dependendo da estrutura dos incentivos e da presença de divisões sociais.