O Google detalhou sua abordagem de segurança para os recursos de agente do Chrome, que permitem ações automatizadas como reserva de ingressos ou compras, abordando possíveis riscos financeiros e de dados. O Google emprega vários modelos para gerenciar ações de agentes. Um User Alignment Critic, desenvolvido com Gemini, examina os itens de ação gerados pelo modelo de planejador. Se o modelo crítico determinar que as tarefas planejadas não estão alinhadas com os objetivos do usuário, ele solicitará que o planejador reavalie a estratégia. O modelo crítico acessa apenas metadados de ações propostas, e não o conteúdo real da web. Para restringir o acesso do agente a sites não permitidos ou não confiáveis, o Google utiliza Agent Origin Sets. Esses conjuntos limitam o modelo a origens específicas somente leitura e graváveis. As origens somente leitura definem o conteúdo que o Gemini pode consumir; por exemplo, as listagens de produtos em um site de compras são relevantes, mas os banners não. O agente só pode interagir com iframes designados em uma página. Em uma postagem no blog, a empresa declarou: “Essa delineação impõe que apenas dados de um conjunto limitado de origens estejam disponíveis para o agente, e esses dados só podem ser repassados para as origens graváveis. Isso limita o vetor de ameaça de vazamentos de dados de origem cruzada. Isso também dá ao navegador a capacidade de impor parte dessa separação, como nem mesmo enviar para o modelo dados que estão fora do conjunto legível.” O Google monitora a navegação da página por meio de outro modelo de observador para evitar o acesso a URLs prejudiciais gerados por modelos. Para tarefas confidenciais, o Google exige o consentimento do usuário. Se um agente tentar acessar sites confidenciais, como plataformas bancárias ou médicas, ele solicitará permissão do usuário. Caso um site exija login, o Chrome solicitará permissão do usuário para utilizar o gerenciador de senhas; o modelo do agente não acessa dados de senha. Os usuários serão questionados antes que o agente inicie ações como fazer uma compra ou enviar uma mensagem. O Google também emprega um classificador de injeção imediata para evitar ações indesejadas e está avaliando as capacidades dos agentes contra ataques desenvolvidos por pesquisadores. No início deste mês, Perplexidade lançou um modelo de detecção de conteúdo de código aberto para combater ataques de injeção imediata contra agentes.
Source: Google usa Gêmeos "crítico" modelo para monitorar agentes do Chrome




