A Anthrópica introduziu um novo recurso, permitindo que seus modelos Claude Opus 4 e 4.1 AI para encerrar as conversas com os usuários. Essa capacidade, detalhada em um anúncio recente da empresa, destina -se a “casos raros e extremos de interações persistentemente prejudiciais ou abusivas do usuário”.

Exemplos de situações em que Claude podem encerrar um bate-papo incluem “solicitações de usuários de conteúdo sexual envolvendo menores e tentativas de solicitar informações que permitiriam violência em larga escala ou atos de terror”. Antrópica enfatiza que o término de uma conversa será um “último recurso”, implementado somente depois que “várias tentativas de redirecionamento falharam e a esperança de uma interação produtiva se esgota”. A empresa prevê que a maioria dos usuários não encontrará esse recurso, pois é reservado para “casos extremos de borda”, mesmo ao discutir assuntos altamente controversos.

Quando Claude termina uma conversa, os usuários são impedidos de enviar novas mensagens dentro desse bate -papo em particular. No entanto, eles mantêm a capacidade de iniciar uma nova conversa imediatamente. Anthrópica também esclareceu que uma conversa final não afeta outros bate -papos em andamento, e os usuários ainda podem editar ou repetir mensagens anteriores no thread terminado para seguir um caminho de conversação diferente.

Esse desenvolvimento faz parte do programa de pesquisa em andamento da Antrópico em bem -estar de IA. A empresa vê a capacidade de seus modelos de IA sair “interação potencialmente angustiante[s]”Como” maneira de baixo custo de gerenciar riscos para o bem-estar da IA “. Atualmente, a Anthropic está experimentando esse recurso e está incentivando ativamente o feedback do usuário sobre sua implementação.

Source: Claude AI ganha capacidade de acabar com bate -papos prejudiciais