Um artigo da ARS Technica de setembro de 2025, intitulado “O Relatório de Segurança da AI DeepMind explora os perigos da IA desalinhada”, abrange a pesquisa e a perspectiva do Google DeepMind sobre segurança de inteligência artificial. O relatório dá atenção específica à inteligência geral artificial (AGI) e os riscos representados pelos sistemas de IA desalinhados, onde os objetivos de uma IA conflitam com valores ou intenções humanas. O artigo descreve a abordagem do DeepMind ao desenvolvimento responsável de IA, enfatizando um compromisso com a segurança técnica, a avaliação de riscos e a colaboração em toda a comunidade de IA para gerenciar riscos em potencial. Essa estratégia está particularmente focada em perigos que podem emergir de poderosos sistemas AGI. Uma parte central desse esforço é a estrutura de segurança da Frontier da DeepMind, um protocolo criado para identificar e mitigar proativamente riscos graves associados aos modelos de IA da fronteira. Os órgãos de governança interna do DeepMind também são detalhados, incluindo o Conselho de Responsabilidade e Segurança e o Conselho de Segurança da AGI. Esses grupos são responsáveis por supervisionar a pesquisa e o desenvolvimento para abordar os riscos éticos, técnicos e de segurança vinculados a tecnologias avançadas de IA. Um desafio significativo discutido é a IA desalinhada. Tais sistemas podem causar danos se seus objetivos operacionais estiverem em desacordo com o bem-estar social, mesmo que pareçam funcionar corretamente do ponto de vista técnico estreito. Para abordar isso, o DeepMind destaca a importância da transparência, colaboração externa e pesquisa proativa de segurança como parte integrante da criação responsável da AGI.
Source: DeepMind detalha a segurança da AGI via Frontier Safety Framework





