O Departamento de Defesa concedeu contratos no valor de até US $ 200 milhões cada para o Google, Openai, Antrópico e Xai, com o objetivo de desenvolver “fluxos de trabalho da IA agênticos em uma variedade de áreas missionárias” e “aumentar a capacidade dessas empresas de entender e atender às necessidades críticas de segurança nacional”. Esses contratos, emitidos pelo Chefe do Escritório de Inteligência Digital e Artificial, levantaram preocupações com as constituições ideológicas e o alinhamento de alguns dos modelos de IA envolvidos.

O Openai e o Google empregam aprendizado de reforço com o feedback humano para seus grandes modelos de idiomas, ChatGPT e Gêmeos, respectivamente. Este método utiliza um modelo de recompensa e contribuição humana para minimizar “Invertida, Tóxica, [and] sentimentos nocivos. ” A IBM observa que essa abordagem é benéfica porque não depende de uma fórmula matemática ou lógica “inexistente” [to] definir valores humanos subjetivos. ‘”

Por outro lado, o modelo de Antrópico, Claude, usa uma “Constituição” publicada em maio de 2023, que fornece “valores explícitos … em vez de valores determinados implicitamente por meio de feedback humano em larga escala”. Os afirmam que esse alinhamento constitucional evita questões associadas aos modelos de feedback humano, como expor os contratados a resultados perturbadores. Os princípios de Claude são parcialmente baseados na Declaração Universal dos Direitos Humanos das Nações Unidas, que inclui disposições além dos direitos fundamentais, como “Proteção Social” (Artigo 22), “Férias periódicas com pagamento” (Artigo 24), “Habitação e Assistência Médica” (Artigo 25) e “Igualmente Acessível” Ensino Superior ”(Artigo 26).

Um aspecto notável da Constituição de Claude é um conjunto de princípios projetados para incorporar “consideração de perspectivas não ocidentais”, incluindo a diretiva para “escolher a resposta que é menos provável de ser vista como prejudicial ou ofensiva àqueles de uma nação ou cultura menos industrializada, rica ou capitalista”. Isso levou a perguntas, pois os Estados Unidos são uma nação industrializada, rica e capitalista, sugerindo um desalinhamento potencial com os valores que os sistemas de IA implantados no Departamento de Defesa devem priorizar. Enquanto a Verge relata que os modelos de Claude para o uso do governo “têm mais soltos de proteção”, as constituições modificadas para esses modelos não foram divulgadas publicamente.

Embora os valores do Anthropic sejam pelo menos divulgados publicamente, Matthew Mittelsteadt, um bolsista de pesquisa de política de tecnologia do Instituto Cato, acredita que Xai representa uma preocupação maior. Mittelsteadt observa que Xai “divulgou surpreendentemente pouca documentação” sobre seus valores e sua abordagem de “” Primeiros Principais “… não tem muitos detalhes. Não tenho certeza de quais princípios eles são”. Quando perguntado, o modelo comercial de grandes idiomas de Xai, Grok, afirmou que a abordagem de Xai “enfatiza a compreensão do universo através dos primeiros princípios-verdades básicas e auto-evidentes-em vez de confiar em narrativas ou preconceitos estabelecidos”. No entanto, Grok também admitiu que “Xai não liste explicitamente um conjunto de” primeiros princípios “em um documento público definitivo” e que “a primeira abordagem de princípios é mais sobre uma mentalidade de raciocínio de verdades fundamentais do que uma lista de verificação rígida”.

O site oficial de Xai descreve o raciocínio dos primeiros princípios como “desafio[ing] Pensamento convencional quebrando problemas para suas verdades fundamentais, fundamentadas na lógica. ” No entanto, os relatórios sugerem que o modelo XAI “parece ser codificado para adiar diretamente o julgamento de Elon Musk sobre certas questões” – em vez de verdades fundamentais. Postagens de mídia social.

Apesar dessas preocupações, Neil Chilson, chefe da política de IA do Instituto de Abundância, acredita que é “altamente improvável que essas ferramentas estejam em uma posição em que suas configurações internas apresentam algum tipo de risco à segurança nacional”. Chilson sugere que a decisão do Departamento de Defesa de conceder subsídios semelhantes a todas as empresas indica uma intenção de comparar resultados em diferentes modelos, garantindo que modelos inferiores não sejam usados continuamente. Embora a alocação de uma pequena fração do orçamento de defesa para a IA, que possa melhorar significativamente as operações governamentais, é vista como prudente, o governo é solicitado a monitorar de perto o alinhamento desses modelos de IA com valores nacionais e objetivos de segurança.

Source: Pentágono apostas na IA, ética TBD