Como a estratégia da teoria dos jogos melhora a tomada de decisões - KamilTaylan.blog
22 Junho 2021 14:39

Como a estratégia da teoria dos jogos melhora a tomada de decisões

A teoria dos jogos, o estudo da tomada de decisões estratégicas, reúne disciplinas díspares, como matemática, psicologia e filosofia. A teoria dos jogos foi inventada por John von Neumann e Oskar Morgenstern em 1944 e já percorreu um longo caminho desde então. A importância da teoria dos jogos para a análise e tomada de decisão modernas pode ser avaliada pelo fato de que, desde 1970, até 12 economistas e cientistas importantes receberam o Prêmio Nobel de Ciências Econômicas por suas contribuições à teoria dos jogos.

A teoria dos jogos é aplicada em vários campos, incluindo negócios, finanças, economia, ciência política e psicologia. Compreender as estratégias da teoria dos jogos – tanto as populares quanto alguns dos estratagemas relativamente menos conhecidos – é importante para aprimorar o raciocínio e as habilidades de tomada de decisão em um mundo complexo.

Principais vantagens

  • A teoria dos jogos é uma estrutura para a compreensão da escolha em situações entre jogadores concorrentes.
  • A teoria dos jogos pode ajudar os jogadores a alcançar a melhor tomada de decisão quando confrontados por atores independentes e concorrentes em um cenário estratégico.
  • Uma forma de “jogo” comum que aparece em situações econômicas e de negócios é o dilema do prisioneiro, em que os tomadores de decisão individuais sempre têm um incentivo para escolher de uma forma que crie um resultado aquém do ideal para os indivíduos como um grupo.
  • Existem várias outras formas de jogo. A aplicação prática desses jogos pode ser uma ferramenta valiosa para auxiliar na análise de indústrias, setores, mercados e qualquer interação estratégica entre dois ou mais atores.

Dilema do Prisioneiro

Uma das estratégias mais populares e básicas da teoria dos jogos é o dilema do prisioneiro. Este conceito explora a estratégia de tomada de decisão tomada por dois indivíduos que, agindo em seu próprio interesse individual, acabam com resultados piores do que se tivessem cooperado inicialmente.

No dilema do prisioneiro, dois suspeitos detidos por um crime são mantidos em salas separadas e não podem se comunicar. O promotor informa o Suspeito 1 e o Suspeito 2 individualmente que se ele confessar e testemunhar contra o outro, ele pode ser libertado, mas se ele não cooperar e o outro suspeito o fizer, ele será condenado a três anos de prisão. Se ambos confessarem, receberão uma sentença de dois anos e, se nenhum confessar, serão sentenciados a um ano de prisão.

Embora a cooperação seja a melhor estratégia para os dois suspeitos, quando confrontados com tal dilema, a pesquisa mostra que a maioria das pessoas racionais prefere confessar e testemunhar contra a outra pessoa do que ficar em silêncio e arriscar que a outra parte confesse.



Presume-se que os jogadores dentro do jogo sejam racionais e se esforcem para maximizar seus ganhos no jogo.

O dilema do prisioneiro estabelece a base para estratégias avançadas de teoria dos jogos, das quais as mais populares incluem:

Centavos correspondentes

Este é um jogo de soma zero que envolve dois jogadores (chame-os de Jogador A e Jogador B) colocando simultaneamente um centavo na mesa, com o pagamento dependendo se os centavos coincidem. Se ambas as moedas forem cara ou coroa, o Jogador A ganha e fica com a moeda do Jogador B. Se eles não corresponderem, o Jogador B ganha e fica com o centavo do Jogador A.

Impasse

Este é um cenário de dilema social como o dilema do prisioneiro, em que dois jogadores podem cooperar ou desertar (ou seja, não cooperar). Em um impasse, se o Jogador A e o Jogador B cooperarem, cada um recebe um payoff de 1, e se ambos desertam, cada um recebe um payoff de 2. Mas se o Jogador A cooperar e o Jogador B desertar, então A recebe um payoff de 0 e B obtém um payoff de 3. No diagrama de payoff abaixo, o primeiro numeral nas células (a) a (d) representa o payoff do Jogador A, e o segundo numeral é o do Jogador B:

O impasse difere do dilema do prisioneiro porque a ação de maior benefício mútuo (ou seja, ambos os defeitos) também é a estratégia dominante. Uma estratégia dominante para um jogador é definida como aquela que produz o maior retorno de qualquer estratégia disponível, independentemente das estratégias empregadas pelos outros jogadores.

Um exemplo comumente citado de impasse é o de duas potências nucleares que tentam chegar a um acordo para eliminar seus arsenais de bombas nucleares. Neste caso, a cooperação implica a adesão ao acordo, enquanto a deserção significa a renúncia secreta ao acordo e a retenção do arsenal nuclear. O melhor resultado para qualquer uma das nações, infelizmente, é renegar o acordo e manter a opção nuclear, enquanto a outra nação elimina seu arsenal, pois isso dará à primeira uma tremenda vantagem oculta sobre a última se a guerra estourar entre as duas. A segunda melhor opção é ambos desertarem ou não cooperarem, uma vez que isso mantém seu status de potências nucleares.

Competição de Cournot

Esse modelo também é conceitualmente semelhante ao dilema do prisioneiro e leva o nome do matemático francês Augustin Cournot, que o introduziu em 1838. A aplicação mais comum do modelo de Cournot é descrever um duopólio ou dois produtores principais em um mercado.

Por exemplo, suponha que as empresas A e B produzam um produto idêntico e podem produzir grandes ou baixas quantidades. Se ambos cooperarem e concordarem em produzir em níveis baixos, a oferta limitada se traduzirá em um preço alto para o produto no mercado e lucros substanciais para ambas as empresas. Por outro lado, se desertarem e produzirem em patamares elevados, o mercado ficará atolado e resultará em um preço baixo para o produto e, conseqüentemente, menor lucro para ambos. Mas se um cooperar (isto é, produz em níveis baixos) e os outros defeitos (isto é, produz sub-repticiamente em níveis elevados), então o primeiro apenas atinge o ponto de equilíbrio, enquanto o último obtém um lucro maior do que se ambos cooperassem. 

A matriz de payoff para as empresas A e B é mostrada (os números representam o lucro em milhões de dólares). Assim, se A cooperar e produzir em níveis baixos, enquanto B defeituosos e produzir em níveis elevados, a recompensa é mostrada na célula (b) – equilíbrio para a empresa A e $ 7 milhões em lucros para a empresa B.

Jogo de Coordenação

Em coordenação, os jogadores ganham recompensas mais altas quando selecionam o mesmo curso de ação.

Como exemplo, considere dois gigantes da tecnologia que estão decidindo entre introduzir uma nova tecnologia radical em chips de memória que poderia render centenas de milhões de dólares em lucros, ou uma versão revisada de uma tecnologia mais antiga que os renderia muito menos. Se apenas uma empresa decidir seguir em frente com a nova tecnologia, a taxa de adoção pelos consumidores seria significativamente menor e, como resultado, ela ganharia menos do que se as duas empresas decidissem o mesmo curso de ação. A matriz de payoff é mostrada abaixo (os números representam o lucro em milhões de dólares).

Assim, se ambas as empresas decidirem introduzir a nova tecnologia, ganhariam US $ 600 milhões cada, enquanto a introdução de uma versão revisada da tecnologia mais antiga renderia US $ 300 milhões cada, conforme mostrado na célula (d). Mas se a empresa A decidir sozinha introduzir a nova tecnologia, ela ganhará apenas $ 150 milhões, embora a empresa B ganhe $ 0 (presumivelmente porque os consumidores podem não estar dispostos a pagar por sua tecnologia agora obsoleta). Nesse caso, faz sentido que ambas as empresas trabalhem juntas e não sozinhas. 

Jogo Centopéia 

Este é um jogo de forma extensiva em que dois jogadores alternadamente têm a chance de ficar com a maior parte de um estoque de dinheiro que aumenta lentamente. O jogo da centopéia é sequencial, pois os jogadores fazem seus movimentos um após o outro, e não simultaneamente; cada jogador também conhece as estratégias escolhidas pelos jogadores que jogaram antes deles. O jogo termina assim que um jogador pega o estoque, com aquele jogador recebendo a maior parte e o outro jogador recebendo a menor.

Por exemplo, suponha que o Jogador A vá primeiro e tenha que decidir se deve “pegar” ou “passar” o estoque, que atualmente equivale a $ 2. Se ele pegar, então A e B recebem $ 1 cada, mas se A passar, a decisão de pegar ou passar agora deve ser feita pelo Jogador B. Se B pegar, ela recebe $ 3 (ou seja, o estoque anterior de $ 2 + $ 1) e A recebe $ 0. Mas se B passa, A agora decide se vai pegar ou passar, e assim por diante. Se os dois jogadores sempre decidirem passar, cada um receberá um pagamento de $ 100 no final do jogo.

O objetivo do jogo é se A e B cooperarem e continuarem a passar até o final do jogo, eles receberão o pagamento máximo de $ 100 cada. Mas se eles desconfiarem do outro jogador e esperarem que eles “aproveitem” na primeira oportunidade, o  equilíbrio de Nash prevê que os jogadores farão a menor reivindicação possível ($ 1 neste caso). Estudos experimentais têm mostrado, no entanto, esse comportamento “racional” (conforme previsto pela teoria dos jogos) raramente é exibido na vida real. Isso não é intuitivamente surpreendente, dado o pequeno tamanho do pagamento inicial em relação ao final. Comportamento semelhante por sujeitos experimentais também foi exibido no dilema do viajante.

Dilema do Viajante 

Este jogo de soma diferente de zero, em que ambos os jogadores tentam maximizar seu próprio pagamento sem levar em conta o outro, foi idealizado pelo economista Kaushik Basu em 1994. Por exemplo, no dilema do viajante, uma companhia aérea concorda em pagar uma indenização a dois viajantes por danos a itens idênticos. No entanto, os dois viajantes devem estimar separadamente o valor do item, com um mínimo de $ 2 e um máximo de $ 100. Se ambos escreverem o mesmo valor, a companhia aérea reembolsará a cada um deles esse valor. Mas se os valores forem diferentes, a companhia aérea pagará a eles o valor mais baixo, com um bônus de $ 2 para o viajante que anotou esse valor mais baixo e uma multa de $ 2 para o viajante que anotou o valor mais alto.

O nível de equilíbrio de Nash, com base na indução para trás, é $ 2 neste cenário. Mas, como no jogo da centopéia, os experimentos de laboratório demonstram consistentemente que a maioria dos participantes, ingenuamente ou não, escolhe um número muito maior do que $ 2.

O dilema do viajante pode ser aplicado para analisar uma variedade de situações da vida real. O processo de indução para trás, por exemplo, pode ajudar a explicar como duas empresas envolvidas em uma competição acirrada podem reduzir constantemente os preços dos produtos em uma tentativa de ganhar participação de mercado, o que pode resultar em perdas cada vez maiores no processo.

Batalha dos sexos

Esta é outra forma do jogo de coordenação descrito anteriormente, mas com algumas assimetrias de recompensa. Basicamente, envolve um casal tentando coordenar sua saída à noite. Embora tenham concordado em se encontrar no jogo (preferência do homem) ou no jogo (preferência da mulher), eles se esqueceram do que decidiram e, para agravar o problema, não conseguem se comunicar. Para onde eles devem ir? A matriz de recompensa é mostrada abaixo com os numerais nas células que representam o grau relativo de gozo do evento para a mulher e o homem, respectivamente. Por exemplo, a célula (a) representa a recompensa (em termos de níveis de prazer) para a mulher e o homem na peça (ela gosta muito mais do que ele). A célula (d) é a recompensa se ambos chegarem ao jogo (ele gosta mais do que ela). A célula (c) representa a insatisfação se ambos vão não apenas para o local errado, mas também para o evento de que menos gostam – a mulher para o jogo e o homem para a jogada.

Jogo Ditador 

Este é um jogo simples em que o Jogador A deve decidir como dividir um prêmio em dinheiro com o Jogador B, que não tem nenhuma participação na decisão do Jogador A. Embora não seja uma estratégia da teoria dos jogos em si, ela fornece alguns insights interessantes sobre o comportamento das pessoas. Experimentos revelam que cerca de 50% mantém todo o dinheiro para si, 5% o divide igualmente e os outros 45% dão ao outro participante uma parcela menor. O jogo do ditador está intimamente relacionado ao jogo do ultimato, no qual o Jogador A recebe uma determinada quantia de dinheiro, parte da qual deve ser dada ao Jogador B, que pode aceitar ou rejeitar a quantia dada. O problema é que se o segundo jogador rejeitar a quantia oferecida, tanto A quanto B não recebem nada. Os jogos do ditador e do ultimato trazem lições importantes para questões como doações de caridade e filantropia.

Guerra da paz 

Esta é uma variação do dilema do prisioneiro em que as decisões de “cooperar ou desertar” são substituídas por “paz ou guerra”. Uma analogia poderia ser duas empresas guerra de preços reduziria drasticamente os retornos (célula d). No entanto, se A se envolver em corte de preços (ou seja, “guerra”), mas B não, A teria uma recompensa maior de 4, uma vez que pode ser capaz de capturar uma parcela de mercado substancial, e esse volume maior compensaria os preços mais baixos do produto.

Dilema do Voluntário

No dilema de um voluntário, alguém deve realizar uma tarefa ou tarefa para o bem comum. O pior resultado possível é alcançado se ninguém se oferecer. Por exemplo, considere uma empresa onde a fraude contábil é galopante, mas a alta administração não tem conhecimento disso. Alguns funcionários juniores do departamento de contabilidade estão cientes da fraude, mas hesitam em contar à alta administração porque isso resultaria na demissão dos funcionários envolvidos na fraude e, provavelmente, em processo judicial.

Ser rotulado como denunciante  também pode ter algumas repercussões no futuro. Mas, se ninguém se oferecer como voluntário, a fraude em grande escala pode resultar na eventual falência da empresa e na perda dos empregos de todos.

perguntas frequentes

Quais são os ‘jogos’ sendo jogados na teoria dos jogos?

É chamada de teoria dos jogos, uma vez que tenta entender as ações estratégicas de dois ou mais “jogadores” em uma determinada situação contendo regras e resultados definidos. Embora seja usada em várias disciplinas, a teoria dos jogos é mais notavelmente usada como uma ferramenta no estudo de negócios e economia. Os “jogos” podem, portanto, envolver como duas empresas concorrentes reagirão aos cortes de preços da outra, se uma empresa adquirir outra, ou como os negociantes em um mercado de ações podem reagir às mudanças de preços. Em termos teóricos, esses  jogos podem ser categorizados  como semelhantes aos dilemas do prisioneiro, ao jogo do ditador, ao falcão e à pomba e à batalha dos sexos, entre várias outras variações.

O que o dilema do prisioneiro nos ensina?

O dilema do prisioneiro mostra que a simples cooperação nem sempre atende aos melhores interesses. Na verdade, ao comprar um item caro, como um carro, a barganha é o curso de ação preferido do ponto de vista do consumidor. Caso contrário, a concessionária pode adotar uma política de inflexibilidade nas negociações de preços, maximizando seus lucros, mas resultando em consumidores pagando a mais por seus veículos. Compreender as recompensas relativas de cooperar versus desertar pode estimulá-lo a se envolver em negociações de preços significativas   antes de fazer uma grande compra.

O que é um equilíbrio de Nash na teoria dos jogos?

Equilíbrio de Nash na teoria dos jogos é uma situação em que um jogador continuará com sua estratégia escolhida, não tendo nenhum incentivo para se desviar dela, após levar em consideração a estratégia do oponente.

Como as empresas podem usar a teoria dos jogos enquanto competem entre si?

A competição de Cournot, por exemplo, é um modelo econômico que descreve uma estrutura de indústria na qual empresas rivais que oferecem um produto idêntico competem na quantidade de produção que produzem, de forma independente e ao mesmo tempo. É efetivamente um jogo do dilema do prisioneiro.

The Bottom Line

A teoria dos jogos pode ser usada de maneira muito eficaz como ferramenta para a tomada de decisões, seja em um ambiente adversário, de negócios ou pessoal.