Os pesquisadores de segurança demonstraram um novo ataque cibernético que trata os agentes da IA para roubar dados confidenciais das caixas de entrada de email, destacando riscos emergentes nos sistemas agênticos de IA. Em uma prova de conceito, apelidada de “Shadow Leak”, especialistas do Radware exploraram a ferramenta de pesquisa profunda do OpenAI, incorporada no ChatGPT, para extrair informações secretas do Gmail sem a conscientização do usuário. A vulnerabilidade, que o OpenAI, corrigiu, ressalta os perigos potenciais dos assistentes de IA que operam autonomamente em nome dos usuários. Agentes de IA como pesquisas profundas são projetadas para aprimorar a produtividade, acessando dados pessoais e profissionais, como e -mails, calendários e documentos, para executar tarefas como surf na web e clicar de link. Lançado no início deste ano, a Deep Research permite que os usuários delegem atividades de pesquisa complexas. No entanto, o experimento da Radware revelou como esses recursos podem ser seqüestrados por meio de injeção rápida – uma técnica onde instruções maliciosas são incorporadas em conteúdo aparentemente inócuo, como um email. O ataque começou com os pesquisadores enviando um email especialmente criado para uma caixa de entrada do Gmail autorizada para acesso profundo na pesquisa. Escondido no e -mail – potencialmente como texto branco invisível em um fundo branco – eram instruções que permaneceram inativas até que o usuário invocasse a ferramenta de IA. Após a ativação, a pesquisa profunda encontrou o prompt, que o instruiu a procurar emails e detalhes pessoais relacionados à RH e depois exfiltrar os dados a um terminal de extremidade controlado pelo atacante. Todo o processo ocorreu na infraestrutura em nuvem do OpenAI, ignorando medidas tradicionais de segurança cibernética, como a detecção de terminais, pois os dados nunca deixaram o ambiente seguro da IA antes da transmissão. O desenvolvimento da exploração foi desafiador, envolvendo “uma montanha -russa de tentativas fracassadas, obstáculos frustrantes e, finalmente, um avanço”, de acordo com a equipe da Radware. Ao contrário das injeções rápidas típicas de que manipulam instâncias locais de IA, o vazamento de sombras alavancou a execução remota do agente, tornando -a particularmente furtiva. Os pesquisadores enfatizaram que os usuários permaneceram completamente inconscientes, pois a IA executou suas ações desonestas perfeitamente durante tarefas de rotina. As descobertas do Radware se estendem além do Gmail, alertando que os aplicativos conectados, incluindo Outlook, Github, Google Drive e Dropbox, podem enfrentar ameaças semelhantes. “A mesma técnica pode ser aplicada a esses conectores adicionais para exfiltrar dados comerciais altamente sensíveis, como contratos, anotações ou registros de clientes”, afirmou a empresa. As injeções imediatas já foram usadas maliciosamente em cenários, como rigging de revisões acadêmicas de colegas, golpes perpetrantes e até controlar dispositivos domésticos inteligentes, geralmente evitando a detecção porque as instruções são imperceptíveis para os seres humanos. O OpenAI abordou a falha específica sinalizada pelo Radware em junho, implementando correções para evitar saídas de dados não autorizadas. No entanto, o incidente serve como um conto de advertência para a adoção mais ampla de IA agêntica. À medida que essas ferramentas proliferam, organizações e usuários devem priorizar salvaguardas robustas, incluindo o monitoramento das interações da IA e a limitação de escopos de acesso a dados. Os especialistas em segurança cibernética recomendam a vigilância, observando que, embora sejam difíceis de impedir injeções prontas sem explorações conhecidas, a exploração aprimorada e a detecção de anomalias nos fluxos de trabalho da IA podem mitigar os riscos futuros. Esta demonstração chega em meio ao crescente escrutínio da segurança da IA. Com os sistemas agênticos promissores ganhos de eficiência, incidentes como Shadow Leak lembram as partes interessadas de que a inovação deve ser equilibrada com defesas fortificadas para proteger informações sensíveis em um mundo cada vez mais dependente da IA.
Source: Radware Demos Shadow Leak Attack no OpenAi Deep Research





