Pode ser um passo para a elaboração de Inteligências Artificiais capazes de lidar com problemas complexos que exigem flexibilidade.
A Meta criou uma Inteligência Artificial (IA) capaz de vencer os humanos em uma versão online do Diplomacia, um popular jogo de guerra e estratégia no qual sete jogadores competem pelo controlo da Europa na época da Primeira Guerra Mundial movendo peças em um mapa. Ao contrário de outros jogos de tabuleiro que a IA aprendeu a jogar e passou a dominar, como xadrez e Go, o Diplomacia exige que os jogadores conversem entre si para formar alianças, criar táticas de negociação, e identifiquem quando os outros estão blefando.
Ao jogar contra 82 utilizadores humanos (que não sabiam que estavam competindo contra um bot), a IA, chamada de Cicero, ficou entre os 10% dos melhores jogadores em 40 jogos online. Em um torneio de oito jogos envolvendo 21 utilizadores, Cícero ficou em primeiro lugar. A Meta descreveu o trabalho num artigo publicado na Science.
Aprender a jogar Diplomacia é importante por vários motivos. Não apenas envolve vários jogadores, que fazem jogadas simultaneamente, como também cada turno é precedido por uma breve negociação em que os jogadores conversam em pares na tentativa de formar alianças ou conspirar contra os rivais. Após essa rodada de negociação, os jogadores decidem quais peças mover e se devem honrar ou abdicar um acordo.
Em cada etapa do jogo, Cícero simula como os outros jogadores provavelmente agirão com base no estado do tabuleiro e em conversas anteriores com os participantes. Em seguida, ele descobre como os jogadores podem trabalhar juntos para benefício mútuo e gera mensagens destinadas a atingir esses objetivos.
Para construir o Cicero, a Meta combina dois tipos diferentes de IA: um modelo de reinforcement learning que descobre quais movimentos fazer e um grande modelo de linguagem que negocia com outros jogadores.
Cícero não é perfeito. Ainda enviava mensagens que continham equívocos, às vezes contrariando seus próprios objetivos ou cometendo erros estratégicos. Mas a Meta afirma que os humanos, frequentemente, optavam por colaborar com a IA em detrimento de outros jogadores.
E isso é relevante porque, embora jogos como xadrez ou Go terminem com um vencedor e um perdedor, os problemas do mundo real geralmente não têm resoluções tão simples e diretas. Encontrar compensações e soluções alternativas costuma ser mais valioso do que vencer. A Meta afirma que Cicero é um passo em direção à uma IA que pode ajudar a solucionar uma série de problemas complexos que exigem flexibilidade, desde o planejamento de rotas por conta de tráfego intenso de veículos, por exemplo, até a negociação de contratos.