23 Junho 2021 10:04
O dilema do prisioneiro, uma das teorias de jogo mais famosas, foi conceituada por Merrill Flood e Melvin Dresher na Rand Corporation em 1950. Posteriormente, foi formalizada e nomeada pelo matemático de Princeton, Albert William Tucker.
O dilema do prisioneiro basicamente fornece uma estrutura para a compreensão de como encontrar um equilíbrio entre cooperação e competição e é uma ferramenta útil para a tomada de decisões estratégicas.
Como resultado, ele encontra aplicação em diversas áreas, desde negócios, finanças, economia e ciência política até filosofia, psicologia, biologia e sociologia.
Principais vantagens
- O dilema do prisioneiro descreve uma situação em que, de acordo com a teoria dos jogos, dois jogadores agindo estrategicamente resultarão em uma escolha subótima para ambos.
- Nos negócios, entender a estrutura de certas decisões como dilemas do prisioneiro pode resultar em resultados mais favoráveis.
- Esta configuração permite equilibrar competição e cooperação para benefício mútuo.
Princípios básicos do dilema do prisioneiro
O cenário do dilema do prisioneiro funciona da seguinte maneira: Dois suspeitos foram presos por um crime e agora estão em quartos separados em uma delegacia de polícia, sem meios de comunicação entre si. O promotor disse separadamente a eles o seguinte:
- Se você confessar e concordar em testemunhar contra o outro suspeito, que não confessa, as acusações contra você serão retiradas e você ficará impune.
- Se você não confessar, mas o outro suspeito o fizer, você será condenado e a promotoria buscará a sentença máxima de três anos.
- Se ambos confessarem, ambos serão condenados a dois anos de prisão.
- Se nenhum de vocês confessar, ambos serão acusados de contravenções e serão sentenciados a um ano de prisão.
O que os suspeitos devem fazer? Essa é a essência do dilema do prisioneiro.
Avaliando o melhor curso de ação
Vamos começar construindo uma matriz de payoff conforme mostrado na tabela abaixo. A “recompensa” aqui é mostrada em termos da duração de uma sentença de prisão (conforme simbolizado pelo sinal negativo; quanto maior o número, melhor). Os termos “cooperar” e “desertar” referem-se aos suspeitos cooperando uns com os outros (como, por exemplo, se nenhum deles confessar) ou desertando (ou seja, não cooperando com o outro jogador, que é o caso em que um suspeito confessa, mas o outro não). O primeiro numeral nas células (a) a (d) mostra o ganho para o Suspeito A, enquanto o segundo numeral o mostra para o Suspeito B.
A estratégia dominante para um jogador é aquela que produz o melhor retorno para aquele jogador, independentemente das estratégias empregadas pelos outros jogadores. A estratégia dominante aqui é cada jogador desertar (isto é, confessar), uma vez que confessar minimizaria o tempo médio passado na prisão. Aqui estão os resultados possíveis:
- Se A e B cooperarem e ficarem quietos, ambos pegam um ano de prisão – conforme mostrado na cela (a).
- Se A confessar, mas B não, A ficará livre e B terá três anos – representados na célula (b).
- Se A não confessa, mas B confessa, A recebe três anos e B fica livre – ver célula (c).
- Se A e B confessarem, ambos pegarão dois anos de prisão – como mostra a cela (d).
Portanto, se A confessar, eles serão libertados ou pegarão dois anos de prisão. Mas se eles não confessarem, eles pegam um ou três anos de prisão. B enfrenta exatamente o mesmo dilema. Obviamente, a melhor estratégia é confessar, independentemente do que o outro suspeito faça.
Implicações do dilema do prisioneiro
O dilema do prisioneiro mostra-se elegantemente, quando cada indivíduo busca seu próprio interesse, o resultado é pior do que se ambos tivessem cooperado. No exemplo acima, a cooperação – em que A e B ficam em silêncio e não confessam – daria aos dois suspeitos uma sentença de prisão total de dois anos. Todos os outros resultados resultariam em uma sentença combinada para dois de três anos ou quatro anos.
Na realidade, uma pessoa racional que está interessada apenas em obter o máximo benefício para si mesma geralmente prefere desertar em vez de cooperar. Se ambos escolherem desertar presumindo que o outro não o fará, em vez de terminar na opção da célula (b) ou (c) – como cada um deles esperava – eles acabariam na posição da célula (d) e cada um ganharia dois anos de prisão.
No exemplo do prisioneiro, cooperar com o outro suspeito resulta em uma sentença inevitável de um ano, ao passo que confessar, na melhor das hipóteses, resultaria em ser libertado ou, na pior, resultaria em uma sentença de dois anos. No entanto, não confessar acarreta o risco de incorrer na pena máxima de três anos, se, digamos, a confiança de A de que B também permanecerá calado se revelar equivocada e B realmente confessar (e vice-versa).
Esse dilema, em que o incentivo para desertar (não cooperar) é tão forte, embora a cooperação possa render os melhores resultados, ocorre de várias maneiras nos negócios e na economia, conforme discutido a seguir.
Aplicativos para negócios
Um exemplo clássico do dilema do prisioneiro no mundo real é encontrado quando dois concorrentes estão lutando no mercado. Freqüentemente, muitos setores da economia têm dois rivais principais. Nos Estados Unidos, por exemplo, há uma rivalidade acirrada entre a Coca-Cola (KO ) e a PepsiCo (PEP ) em refrigerantes e a Home Depot (HD ) contra a Lowe’s (LOW ) em materiais de construção. Esta competição deu origem a vários estudos de caso em escolas de negócios.2 Outras rivalidades ferozes incluem Starbucks ( SBUX ) versus Tim Horton’s ( THI ) no Canadá e Apple ( AAPL ) versus Samsung no setor global de telefonia móvel.
Considere o caso da Coca-Cola versus PepsiCo, e suponha que a primeira esteja pensando em cortar o preço de seu icônico refrigerante. Se o fizer, a Pepsi pode não ter escolha a não ser seguir o exemplo de sua cola para manter sua participação no mercado. Isso pode resultar em uma queda significativa nos lucros para ambas as empresas.
Uma queda de preço por qualquer uma das empresas pode, portanto, ser interpretada como traição, já que quebra um acordo implícito para manter os preços altos e maximizar os lucros. Assim, se a Coca-Cola baixar seu preço, mas a Pepsi continuar a mantê-los altos, a primeira está desertando, enquanto a segunda está cooperando (aderindo ao espírito do acordo implícito). Nesse cenário, a Coca-Cola pode ganhar participação de mercado e obter lucros incrementais com a venda de mais colas.
Matriz de Payoff
Vamos supor que os lucros incrementais acumulados para a Coca-Cola e a Pepsi sejam os seguintes:
- Se ambos mantiverem os preços altos, os lucros de cada empresa aumentam em $ 500 milhões (devido ao crescimento normal da demanda ).
- Se um reduzir os preços (ou seja, os defeitos), mas o outro não (cooperar), os lucros aumentam em $ 750 milhões para o primeiro devido à maior participação de mercado e permanecem inalterados para o último.
- Se ambas as empresas reduzirem os preços, o aumento no consumo de refrigerantes compensará o preço mais baixo e os lucros de cada empresa aumentam em US $ 250 milhões.
A matriz de recompensa é semelhante a esta (os números representam lucros incrementais em dólares em centenas de milhões):
Outros exemplos de dilemas de prisioneiros frequentemente citados são em áreas como desenvolvimento de novos produtos ou tecnologia ou despesas de publicidade e marketing por empresas.
Por exemplo, se duas empresas têm um acordo implícito para deixar os orçamentos de publicidade inalterados em um determinado ano, sua receita líquida pode permanecer em níveis relativamente altos. Mas, se um defende e aumenta seu orçamento de publicidade, pode obter lucros maiores às custas da outra empresa, pois as vendas mais altas compensam o aumento das despesas de publicidade. No entanto, se ambas as empresas aumentarem seus orçamentos de publicidade, os esforços crescentes de publicidade podem compensar um ao outro e se mostrar ineficazes, resultando em lucros menores – devido às despesas de publicidade mais altas – do que teria sido o caso se os orçamentos de publicidade não fossem alterados.
Aplicações para a economia
O impasse da dívida dos EUA entre democratas e republicanos que surge de vez em quando é um exemplo clássico do dilema do prisioneiro.
Digamos que a utilidade ou benefício de resolver a questão da dívida dos EUA seja ganhos eleitorais para os partidos nas próximas eleições. Cooperação, neste caso, refere-se à disposição de ambas as partes de trabalhar para manter o status quo em relação ao crescente déficit orçamentário dos Estados Unidos. A deserção implica recuar neste acordo implícito e tomar as medidas necessárias para controlar o déficit.
Se ambos os partidos cooperarem e mantiverem o bom funcionamento da economia, alguns ganhos eleitorais serão garantidos. Mas se o partido A tentar resolver a questão da dívida de maneira proativa, enquanto o partido B não cooperar, essa recalcitrância pode custar votos a B na próxima eleição, que pode ir para A.
No entanto, se ambas as partes se afastarem da cooperação e jogarem duro na tentativa de resolver a questão da dívida, a consequente turbulência econômica (mercados em queda, um possível rebaixamento de crédito e fechamento do governo ) pode resultar em ganhos eleitorais menores para ambos os partidos.
Como você pode usá-lo?
O dilema do prisioneiro pode ser usado para ajudar na tomada de decisões em várias áreas da vida pessoal, como a compra de um carro, negociações salariais e assim por diante.
Por exemplo, suponha que você esteja procurando um carro novo e entre em uma concessionária. A utilidade ou recompensa, neste caso, é um atributo não numérico (ou seja, satisfação com o negócio). Você deseja obter o melhor negócio possível em termos de preço, características do carro, etc., enquanto o vendedor de carros deseja obter o preço mais alto possível para maximizar sua comissão.
Cooperação neste contexto significa não pechinchar; você entra, paga o preço de etiqueta (para a alegria do vendedor) e sai com um carro novo. Por outro lado, desertar significa barganhar. Você quer um preço mais baixo, enquanto o vendedor quer um preço mais alto. Atribuindo valores numéricos aos níveis de satisfação, em que 10 significa totalmente satisfeito com o negócio e 0 significa nenhuma satisfação, a matriz de payoff é mostrada abaixo:
O que essa matriz nos diz? Se você fizer uma barganha difícil e conseguir uma redução substancial no preço do carro, provavelmente ficará totalmente satisfeito com o negócio, mas o vendedor provavelmente ficará insatisfeito por causa da perda de comissão (como pode ser visto na célula b).
Por outro lado, se o vendedor se mantiver firme e não mudar o preço, é provável que você não fique satisfeito com o negócio, enquanto o vendedor ficaria totalmente satisfeito (célula c).
Seu nível de satisfação pode ser menor se você simplesmente entrar e pagar o preço total de etiqueta (célula a). O vendedor nesta situação também tende a não estar totalmente satisfeito, já que sua disposição de pagar o preço integral pode deixá-lo se perguntando se ele poderia ter “direcionado” você para um modelo mais caro ou adicionado mais alguns sinos e assobios para ganhar mais comissão.
A célula (d) mostra um grau de satisfação muito menor tanto para o comprador quanto para o vendedor, uma vez que a negociação prolongada pode ter levado a um compromisso relutante no preço pago pelo carro.
Da mesma forma, com negociações salariais, pode ser imprudente aceitar a primeira oferta que um empregador em potencial lhe fizer (supondo que você saiba que vale mais).
Cooperar aceitando a primeira oferta pode parecer uma solução fácil em um mercado de trabalho difícil, mas pode resultar em você deixando algum dinheiro na mesa. A deserção (ou seja, a negociação) por um salário mais alto pode, de fato, render a você um pacote de remuneração mais gordo. Por outro lado, se o empregador não estiver disposto a pagar mais, você pode ficar insatisfeito com a oferta final.
Esperamos que as negociações salariais não fiquem acirradas, pois isso pode resultar em um menor nível de satisfação para você e para o empregador. A matriz de recompensa comprador-vendedor mostrada anteriormente pode ser facilmente estendida para mostrar o nível de satisfação do candidato a emprego em relação ao empregador.
The Bottom Line
O dilema do prisioneiro nos mostra que a mera cooperação nem sempre atende aos melhores interesses. Na verdade, ao comprar um item caro, como um carro, a barganha é o curso de ação preferido do ponto de vista do consumidor. Caso contrário, a concessionária pode adotar uma política de inflexibilidade nas negociações de preços, maximizando seus lucros, mas resultando em consumidores pagando a mais por seus veículos.
Compreender as recompensas relativas de cooperar versus desertar pode estimulá-lo a se envolver em negociações de preços significativas antes de fazer uma grande compra.