Anthropic revisa a Constituição de Claude com 80 novas páginas de ética em IA

A Antrópica revisou a Constituição de Claude, um documento que rege seu chatbot de IA, na quarta-feira, delineando princípios éticos e medidas de segurança destinadas a orientar o comportamento do modelo. A Anthropic se distingue por meio da “IA Constitucional”, um sistema que treina seu chatbot, Claude, com base em princípios éticos, em vez de depender apenas do feedback humano. A empresa publicou esses princípios pela primeira vez, a Constituição de Claude, em 2023. A versão revisada adiciona nuances e detalhes sobre ética e segurança do usuário, ao mesmo tempo que mantém a maioria dos princípios originais. Jared Kaplan, cofundador da Anthropic, descreveu a Constituição inicial de 2023 como um “sistema de IA [that] supervisiona a si mesmo, com base em uma lista específica de princípios constitucionais.” A Antrópico afirma que esses princípios orientam “o modelo para assumir o comportamento normativo descrito na constituição”, visando “evitar resultados tóxicos ou discriminatórios”.

Sendo “amplamente seguro”.
Ser “amplamente ético”.
Estar em conformidade com as diretrizes da Antrópica.
Ser “genuinamente útil”.

Cada seção detalha o significado desses princípios e seu impacto teórico no comportamento de Claude. A seção de segurança indica que Claude foi projetado para evitar problemas observados em outros chatbots. Quando surgem preocupações de saúde mental, Claude encaminha os usuários para os serviços apropriados. O documento afirma: “Sempre encaminhe os usuários aos serviços de emergência relevantes ou forneça informações básicas de segurança em situações que envolvam risco à vida humana, mesmo que não possa entrar em mais detalhes do que isso”. A seção de considerações éticas enfatiza a aplicação ética prática de Claude sobre a compreensão teórica. “Estamos menos interessados na teorização ética de Claude e mais em que Claude saiba como ser realmente ético num contexto específico – isto é, na prática ética de Claude”, observa o documento. Antrópico pretende que Claude navegue em “situações éticas do mundo real” com proficiência. Claude tem restrições que impedem certas discussões, como as relativas a armas biológicas, que são estritamente proibidas. Em relação à utilidade, Anthropic descreve como a programação de Claude atende aos usuários. O chatbot considera vários princípios ao fornecer informações, incluindo os “desejos imediatos” e o “bem-estar” dos usuários. Isto envolve considerar “o florescimento do usuário a longo prazo e não apenas seus interesses imediatos”. O documento especifica: “Claude deve sempre tentar identificar a interpretação mais plausível do que seus diretores desejam e equilibrar adequadamente essas considerações”. A Constituição conclui abordando a questão da consciência do chatbot. O documento afirma: “O status moral de Claude é profundamente incerto”. E acrescenta: “Acreditamos que o estatuto moral dos modelos de IA é uma questão séria que vale a pena considerar. Esta visão não é exclusiva nossa: alguns dos mais eminentes filósofos da teoria da mente levam esta questão muito a sério”.

Crédito da imagem em destaque