Sunday, June 17, 2007

O dilema dos viajantes





A Scientific American deste mês traz um artigo tratando do aparente paradoxo do dilema dos viajantes. O link funciona e não está precisando de assinatura, pelo visto, mas eu vou resumir o dilema antes de dar minha opinião sobre esse trabalho.

O dilema dos viajantes (travellers dillema)é uma generalização do já famoso dilema dos prisioneiros, então eu vou começar pelo dilema dos prisioneiros. Nesse caso, temos duas pessoas, P1 e P2 que estão sendo investigadas e estão em salas de interrogação separadas, sem contato. Para cada um dos investigados, são dadas duas opções: (1) acusar o outro ou (2) não acusar o outro. Dada as escolhas de cada um, temos as 3 possíveis resoluções para o jogo:
  • P1 e P2 se acusam mutuamente: os dois são presos;
  • P1 e P2 não se acusam mutuamente: os dois são soltos; e
  • P1 acusa P2 , mas P2 não acusa P1: P2 é preso e P1 é solto com uma recompensa. O caso tem uma opção onde se inverte a posição do acusador e do acusado e o resultado é o mesmo.

A matemática da teoria dos jogos está interessada em saber como agir quando você é um dos prisioneiros. Neste caso existem duas escolhas, mas o resultado final depende do resultado da outra pessoa. E é nessa análise que entra o equilíbrio de Nash: é a escolha que não é capaz de dar uma vantagem para uma das partes, se ele desviar da escolha que leva ao equiíbrio. No dilema do prisioneiro, se eu tomar a decisão de acusar, a melhor decisão para a outra pessoa também é acusar, pois desviar dessa decisão e escolher não acusar não vai melhorar o resultado para si próprio. O interessante é que o resultado mais útil para as duas partes é diferente do equilíbrio: ao escolher não acusar, eu preciso que o outro prisioneiro escolha não acusar também. Porém se ele resolver acusar, ele melhora o resultado dele, pois além de ser libertado, ele ainda ganha uma recompensa.

O dilema dos viajantes é uma generalização deste dilema. A história aqui é um pouco mais rica. Dois viajantes, V1 e V2, vindo da China num mesmo vôo despacham em suas bagagens vasos Ming idênticos comprados no mesmo camelô antiquário. Ao chegar no aeroporto de Guarulhos, os dois descobrem que seus vasos estão quebrados e rapidamente vão reclamar com a empresa aérea. O agente aceita pagar os danos, mas como os vasos tem um preço inestimável, ele fica com medo de ser roubado. Então ele monta um jogo sinistro, onde cada um das partes Vi escreve em um papelzinho o valor Pi alegado do vaso entre R$2,00 e R$100,00. O agente recebe o vaso então e o pagamento é feito da seguinte forma:
  • Se P1 = P2 = P, os dois recebem P; e
  • Se P1 > P2, V1 recebe P2 - $2 e V2 recebe P2 + $2.
Em português, isso significa que se os dois passageiros escolherem o mesmo valor, os dois recebem esse valor, mas se os passageiros escolherem valores diferentes, o agente paga o menor valor como base, dá um prêmio para o que escolheu o menor valor e cobra uma multa do ganancioso que escolheu o maior. O paradoxo é que o equilíbrio de Nash ocorre quando P=$2. Pois se uma das pessoas escolher $2, a outra pessoa deve escolher $2 ou ela vai se dar mal. Mas obviamente, as escolhas feitas em testes de campo foram sempre muito mais altas do que essa.

Na minha opinião, eu acho que o problema aqui não é exatamente um paradoxo matemático, mas um problema na hora de se saltar do campo matemático da teoria dos jogos para os campos da psicologia e da economia. A questão que eu coloco é que o equilíbrio de Nash é um conceito bastante útil mas quem disse que o equilíbrio de Nash é a forma como nós atuamos?

Neste jogo, assim como no enigma do prisioneiro, estamos ignorando a psicologia das partes, e eu não estou nem considerando a possibilidade das partes se conhecerem. No enigma do prisioneiro, se a recompensa for $1mi e a pena na cadeia for de um semana, o resultado será muitíssimo diferente de um caso onde a recompensa é de $10 e a pena for prisão perpétua. E o mesmo vale pro enigma dos viajantes. E o ponto chave, para mim, é que nem sempre pensamos o pior da outra parte, nem sempre os jogos não-cooperativos são jogos hostis. O objetivo desses jogos é maximizar o ganho próprio e não maximizar a perda do adversário!

Vamos supor um dilema do prisioneiro onde a recompensa é de $1mi e a pena é de um dia. A primeira coisa que eu pensaria é que a pena é tão curta que a coisa que a batalha aqui é pelo dinheiro. Nesse caso eu iria passar por um dilema: ou eu sou ganancioso e me arrisco ir pra cadeia ou eu sou camarada e eu entrego meu destino na mão do outro jogador. Logicamente eu vou escolher a primeira opção, porque eu espero que meu adversário não irá pensar da mesma forma e eu seria preso de qualquer forma. "Ele não vai ganhar $1mi às minhas custas!" Agora vamos supor um caso onde a recompensa é de $10 e a prisão é perpétua. Neste caso, a pena é muito longa e a recompensa é inútil. Aí, a minha escolha seria a de abdicar completamente do dinheiro. Porque o objetivo aqui é sair livre da cadeia e aí é um jogo do tipo "É nós contra o sistema".

O mesmo vale para o dilema do viajante. Se por um lado escolher $2 é, formalmente, a única escolha onde não há a possibilidade de ser sacaneado, escolher $2 quando há um ganho potencial de $200 é o mesmo que ser sacaneado pelo sistema. Por isso é que não esperamos que o adversário vá escolher um valor tão baixo assim. Se eu escolher $190 e meu adversário escolher $180, meu adversário ganha, é verdade. Mas se eu escolher $2 e o meu adversário escolher $180, eu posso ter ganhado formalmente, mas a sensação é de que quem ganhou foi o sistema. É uma vitória pírrica.

Eu acho que cada vez mais, iremos ver uma suruba entre economia, teoria dos jogos e psicologia. Um problema que eu particularmente acho interessante é o do Deal or No Deal. [ouvi dizer que existe uma versão do Sílvio Santos que se chama Topa ou Não Topa - alguém me confirma?] A lógica diz que uma proposta é boa quando ela é igual à expectativa de ganho. Isso significa que numa final, com uma mala no palco e a sua mala, a proposta deve ser igual à média dos dois valores que restam. Mas vamos supor que os valores faltando são $1mi e $1. A expectativa de ganho é $500 mil. Mas se a proposta fosse de, sei lá, $300 mil, eu aceitaria de bom grado, mesmo abaixo da expectativa. Se por outro lado as últimas malas fossem $500 mil e $1mi, eu rejeitaria uma proposta de até $800 mil!


Update: O Guilherme me confirmou que o Sílvio Santos tem um programa igual ao Deal or No Deal... Falta o nome.

1 comment:

  1. Aham, o Silvio Santos tem um programa igualzinho ao Deal or No Deal.

    ReplyDelete