A Antrópica revisou a Constituição de Claude, um documento que rege seu chatbot de IA, na quarta-feira, delineando princípios éticos e medidas de segurança destinadas a orientar o comportamento do modelo. A Anthropic se distingue por meio da “IA Constitucional”, um sistema que treina seu chatbot, Claude, com base em princípios éticos, em vez de depender apenas do feedback humano. A empresa publicou esses princípios pela primeira vez, a Constituição de Claude, em 2023. A versão revisada adiciona nuances e detalhes sobre ética e segurança do usuário, ao mesmo tempo que mantém a maioria dos princípios originais. Jared Kaplan, cofundador da Anthropic, descreveu a Constituição inicial de 2023 como um “sistema de IA [that] supervisiona a si mesmo, com base em uma lista específica de princípios constitucionais.” A Antrópico afirma que esses princípios orientam “o modelo para assumir o comportamento normativo descrito na constituição”, visando “evitar resultados tóxicos ou discriminatórios”.
- Sendo “amplamente seguro”.
- Ser “amplamente ético”.
- Estar em conformidade com as diretrizes da Antrópica.
- Ser “genuinamente útil”.
Cada seção detalha o significado desses princípios e seu impacto teórico no comportamento de Claude. A seção de segurança indica que Claude foi projetado para evitar problemas observados em outros chatbots. Quando surgem preocupações de saúde mental, Claude encaminha os usuários para os serviços apropriados. O documento afirma: “Sempre encaminhe os usuários aos serviços de emergência relevantes ou forneça informações básicas de segurança em situações que envolvam risco à vida humana, mesmo que não possa entrar em mais detalhes do que isso”. A seção de considerações éticas enfatiza a aplicação ética prática de Claude sobre a compreensão teórica. “Estamos menos interessados na teorização ética de Claude e mais em que Claude saiba como ser realmente ético num contexto específico – isto é, na prática ética de Claude”, observa o documento. Antrópico pretende que Claude navegue em “situações éticas do mundo real” com proficiência. Claude tem restrições que impedem certas discussões, como as relativas a armas biológicas, que são estritamente proibidas. Em relação à utilidade, Anthropic descreve como a programação de Claude atende aos usuários. O chatbot considera vários princípios ao fornecer informações, incluindo os “desejos imediatos” e o “bem-estar” dos usuários. Isto envolve considerar “o florescimento do usuário a longo prazo e não apenas seus interesses imediatos”. O documento especifica: “Claude deve sempre tentar identificar a interpretação mais plausível do que seus diretores desejam e equilibrar adequadamente essas considerações”. A Constituição conclui abordando a questão da consciência do chatbot. O documento afirma: “O status moral de Claude é profundamente incerto”. E acrescenta: “Acreditamos que o estatuto moral dos modelos de IA é uma questão séria que vale a pena considerar. Esta visão não é exclusiva nossa: alguns dos mais eminentes filósofos da teoria da mente levam esta questão muito a sério”.
Source: Anthropic revisa a Constituição de Claude com 80 novas páginas de ética em IA







