O OpenAI reduziu significativamente o tempo alocado para testes de segurança de seus modelos de IA, provocando preocupações sobre riscos e danos potenciais associados à liberação rápida de novos modelos.

Oito pessoas, funcionários do Openai ou testadores de terceiros, revelaram que agora têm “apenas dias” para concluir as avaliações sobre novos modelos, um processo que anteriormente levou “vários meses”. Essa redução drástica no tempo de teste é atribuída ao desejo da Openai de manter uma vantagem competitiva, principalmente diante da concorrência de modelos de peso aberto desenvolvidos por empresas como a startup de IA chinesa Deepseek.

As avaliações são cruciais na identificação de riscos e danos ao modelo, como o potencial para um modelo de queixa para fornecer instruções para criar biológicos. Para comparação, as fontes observaram que o OpenAI lhes deu seis meses para revisar o GPT-4 antes de seu lançamento, e eles só descobriram as capacidades após dois meses. O processo de teste atual para o novo modelo do OpenAI, O3, não é tão completo e carece do tempo e recursos necessários para capturar e mitigar adequadamente os riscos.

Uma pessoa atualmente testando a versão completa da O3 descreveu a mudança como “imprudente” e “uma receita para desastre”. Há rumores de que o OpenAI está lançando a O3 na próxima semana, o que, segundo fontes, apressou o cronograma de testes para menos de uma semana. Johannes Heidecke, chefe de sistemas de segurança da Openai, alegou que a empresa tem “um bom equilíbrio com a rapidez com que nos movemos e quão completos somos”. No entanto, testadores e especialistas no campo expressam alarme no tempo de teste reduzido e os riscos potenciais associados a ele.

A falta de regulamentação governamental na área dos modelos de IA é destacada pela mudança na linha do tempo dos testes da OpenAI. Apesar de assinar acordos voluntários com o governo Biden para realizar testes de rotina com o Instituto de Segurança da IA ​​dos EUA, os registros desses acordos caíram sob o governo Trump. O OpenAI defendeu um acordo semelhante para evitar a navegação em legislação estatal por estado. Por outro lado, a Lei da UE AI exigirá que as empresas tenham arriscado testar seus modelos e documentar os resultados.

Especialistas como Shayne Longpre, pesquisadora de IA do MIT, compartilham as preocupações sobre os riscos potenciais associados à rápida liberação de modelos de IA. A Longpre observa que a área de superfície para falhas nos sistemas de IA está aumentando, pois os sistemas de IA ganham mais acesso a fluxos de dados e ferramentas de software. Ele enfatiza a necessidade de investir em pesquisadores independentes de terceiros e sugere medidas como recompensas de insetos, acesso mais amplo à equipe vermelha e proteções legais para as descobertas dos testadores para melhorar a segurança da IA.

À medida que os sistemas de IA se tornam mais capazes e são usados ​​de maneiras novas e muitas vezes inesperadas, a necessidade de testes e avaliação completa se torna cada vez mais importante. Longpre enfatiza que as equipes de testes internas não são suficientes e que é necessária uma comunidade mais ampla de usuários, acadêmicos, jornalistas e hackers de chapéu branco para cobrir a área superficial de falhas, conhecimentos e diversas línguas que esses sistemas agora servem.

Source: O OpenAai apressa em testes de IA, levanta preocupações de segurança