Meta Cicero AI atinge desempenho de nível humano no jogo de tabuleiro Diplomacia

No conhecido jogo de tabuleiro Diplomacy, Meta Cicero AI era capaz de atuar em um nível comparável ao de um humano. Ele faz uso de um modelo semelhante ao GPT-3.

A Meta AI revelou a criação de Cicero na terça-feira, que afirma ser a primeira IA a atuar em nível humano no jogo de tabuleiro estratégico Diplomacy. É uma conquista digna de nota, visto que o jogo exige fortes habilidades de negociação interpessoal e que Cícero deve ter um certo nível de habilidade de linguagem para prevalecer.

Os jogos de tabuleiro há muito servem como uma medida eficaz do desenvolvimento da IA, mesmo antes da vitória do Deep Blue em 1997 sobre Garry Kasparov no xadrez. Quando AlphaGo derrotou o mestre Go Lee Sedol em 2015, outra barreira foi quebrada. Ambos os jogos aderem a um conjunto de regras analíticas que são razoavelmente explícitas (embora as regras de Go sejam geralmente modificadas para IA de computador).

Meta Cicero AI está perto de um desempenho de nível humano em um jogo de tabuleiro chamado Diplomacy

No entanto, um elemento significativo da jogabilidade em Diplomacy exige habilidades sociais. Para ter sucesso, os jogadores devem demonstrar empatia, falar naturalmente e desenvolver relacionamentos – uma façanha desafiadora para um jogador de computador. Diante disso, Meta fez a pergunta: “Podemos construir agentes mais eficazes e flexíveis que possam usar a linguagem para negociar, persuadir e trabalhar com pessoas para atingir objetivos estratégicos semelhantes aos humanos?”

Meta Cicero AI atinge desempenho de nível humano no jogo de tabuleiro Diplomacia — **Meta Cicero AI teve um desempenho muito próximo dos jogadores humanos no jogo de tabuleiro Diplomacy**

A resposta, segundo Meta, é sim. Meta Cicero AI desenvolveu suas habilidades jogando um jogo online de diplomacia em webdiplomacy.net. Ele alcançou “mais do que o dobro da pontuação média” de jogadores humanos ao longo do tempo e acabou classificado entre os 10% melhores jogadores em vários jogos, provando que havia dominado o jogo.

O Meta AI Cicero foi desenvolvido usando métodos de raciocínio estratégico (semelhante ao AlphaGo) e processamento de linguagem natural (semelhante ao GPT-3). Cícero faz previsões sobre o comportamento dos outros jogadores durante cada jogo, observando a condição do tabuleiro e o histórico do diálogo. Cria uma estratégia que põe em ação a partir de um modelo de linguagem capaz de produzir um diálogo que soe humano, permitindo-lhe trabalhar com outros participantes.

O núcleo da personalidade de Cícero pode ser encontrado em suas habilidades de linguagem natural, que Meta chama de “modelo de diálogo controlável”. Cicero usa um vasto corpus de texto extraído da web, semelhante ao GPT-3.

“Para construir um modelo de diálogo controlável, começamos com um modelo de linguagem semelhante ao BART de 2,7 bilhões de parâmetros pré-treinado em texto da Internet e ajustado em mais de 40.000 jogos humanos no webDiplomacy.net,” declarou Meta.

O modelo final captou as nuances de um jogo desafiador. De acordo com Meta, Cícero “pode deduzir, por exemplo, que mais tarde no jogo precisará do apoio de um determinado jogador”, diz Meta, “e então elaborar uma estratégia para ganhar o favor dessa pessoa – e até mesmo reconhecer os riscos e oportunidades que aquele jogador vê de seu ponto de vista particular”.

Sob o título “Jogo em nível humano no jogo da diplomacia, combinando modelos de linguagem com raciocínio estratégico”, o estudo da Meta Cicero AI foi publicado na revista Ciência.

Em termos de aplicações mais amplas, a Meta afirma que seu estudo Cicero pode “diminuir as barreiras de comunicação” entre as pessoas e a IA, por exemplo, sustentando uma discussão prolongada para ensinar uma nova habilidade a alguém. Ou pode ser a força motriz por trás de um videogame em que os NPCs podem conversar como pessoas, captando as intenções do jogador e mudando à medida que avançam.

Meta Cicero AI atinge desempenho de nível humano no jogo de tabuleiro Diplomacy — **O código do Meta Cicero AI é de código aberto e está disponível no GitHub**

Ao mesmo tempo, essa tecnologia pode ser usada para manipular humanos, passando-se por pessoas e enganando-as de maneiras potencialmente perigosas, dependendo do contexto. Nesse sentido, a Meta espera que outros pesquisadores possam desenvolver seu código “de maneira responsável” e diz que tomou medidas para detectar e remover “mensagens tóxicas neste novo domínio”, o que provavelmente se refere ao diálogo Meta Cicero AI aprendido na Internet. textos que ingeriu—sempre um risco para grandes modelos de linguagem.

A empresa forneceu um site detalhado para explicar como o Meta Cicero AI funciona e também tem código aberto do Cicero no GitHub. Conectados Diplomacia os fãs – e talvez até o resto de nós – podem precisar ficar atentos.

No entanto, dependendo da situação, essa tecnologia pode ser empregada para enganar os indivíduos e manipulá-los por meio da representação. Provavelmente referindo-se ao diálogo que Cícero pegou dos textos da Internet que ingeriu – sempre um risco para grandes modelos de linguagem – a Meta diz que tomou medidas para detectar e remover “mensagens tóxicas neste novo domínio” e que espera que outros pesquisadores desenvolvam seu código “de maneira responsável”.

Além de postar o código-fonte do Meta Cicero AI no GitHuba empresa mantém um site abrangente explicando como funciona. Os fãs da diplomacia online devem ficar atentos, assim como todos nós.

Como jogar webDiplomacy?

Ser o primeiro país a controlar metade dos centros de abastecimento do jogo é o objetivo da diplomacia. Você pode fazer isso movendo suas forças pelo tabuleiro e entrando em combate com outros jogadores para assumir o controle de seus centros de abastecimento. No final do ano, para cada centro de suprimentos que você controla, você pode construir uma nova unidade que pode usar para assumir mais centros de suprimentos e levar sua causa à vitória. Você deve dissolver uma unidade em vez de perder um centro de abastecimento para outro jogador, deixando você com menos unidades para competir por mais centros de abastecimento.