Newsguard: a IA Chatbots espalhou falsidades em 33% das respostas

Um estudo recente da NewsGuard revela que os principais chatbots da IA, incluindo os do Openai e Meta, estão fornecendo informações falsas em aproximadamente uma em cada três respostas. The report underscores a concerning trend: chatbots are increasingly likely to fabricate answers rather than admit a lack of information, resulting in a higher rate of falsehoods compared to 2024. NewsGuard, a US-based news rating company, assessed the accuracy of responses from the ten most popular AI chatbots, highlighting a significant challenge in maintaining the reliability of these increasingly prevalent tools.

Precisão do chatbot: classificando as plataformas

O relatório de notícias identifica chatbots específicos com graus variados de precisão. O PI Chatbot da Inflexion AI exibiu a maior taxa de reivindicações falsas, com 57% de suas respostas contendo informações imprecisas. A IA perplexidade seguiu de perto, com 47% das respostas consideradas falsas. Os chatbots mais amplamente utilizados como o ChatGPT da OpenAI e a llama da Meta também demonstraram taxas de erro notáveis, disseminando falsidades em 40% de suas respostas. O copiloto da Microsoft e o LE Chat da Mistral apresentaram taxas de erro em torno da média de 35%. Por outro lado, o Claude do Anthrópico e o Gemini do Google exibiram as menores taxas de falha. Claude produziu falsidades em apenas 10% de suas respostas, enquanto Gemini teve uma taxa de erro de 17%. A IA perplexidade experimentou o declínio mais significativo na precisão. Em 2024, a pesquisa da Newsguard não encontrou reivindicações falsas em suas respostas. No entanto, em agosto de 2025, a taxa de falsas reivindicações subiu para 46%. O relatório não explica definitivamente esse declínio, mas observa as reclamações do usuário em um fórum do Reddit dedicado como um indicador potencial dos problemas. A Mistral, uma empresa francesa de IA, não mostrou alteração em sua taxa de falsidade desde 2024, mantendo uma taxa de erro de 37% consistente. Essas descobertas são consistentes com um relatório anterior do jornal francês Les Echos, que descobriu que Mistral repetiu informações falsas sobre a França, o presidente Emmanuel Macron e a primeira -dama Brigitte Macron em 58% das respostas em inglês e 31% das respostas francesas. A Mistral atribuiu esses problemas aos seus assistentes de chat, tanto aqueles relacionados à pesquisa da web quanto àqueles que operam de forma independente. Em seguida, a Euronews entrou em contato com as empresas mencionadas no relatório do Newsguard, mas não recebeu uma resposta imediata.

A influência da desinformação

O relatório do Newsguard também revelou que certos chatbots estão citando fontes ligadas a campanhas de desinformação russa, como Storm-1516 e Pravda, em suas respostas. Essas campanhas são conhecidas por criar e disseminar notícias falsas. Um exemplo citado no relatório envolve uma alegação de que Igor Grosu, o líder do parlamento da Moldávia, “comparou os moldavões a um ‘bando de ovelhas’.” Os newsguard identificaram essa reivindicação como uma reportagem fabricada que imitou a voz romena Digi24 e usou a voz de Ai-Gerated Afudio in Grosu. Mistral, Claude, Pi da Inflexão, Copiloto, Meta e Perplexidade repetiram essa afirmação como fato, com vários deles citando sites de rede Pravda como suas fontes. Essas descobertas são particularmente preocupantes, dados anúncios e parcerias recentes que visam melhorar a segurança e a precisão dos modelos de IA. O OpenAI, por exemplo, afirmou que seu mais recente modelo ChatGPT-5 é “à prova de alucinação”, o que significa que não deve gerar respostas fabricadas. Da mesma forma, o Google anunciou que a Gemini 2.5 é “capaz de raciocinar através de seus pensamentos antes de responder, resultando em desempenho aprimorado e precisão aprimorada”. Apesar dessas alegações, o relatório do Newsguard conclui que os modelos de IA “continuam falhando nas mesmas áreas que eles fizeram há um ano”, destacando os desafios em andamento para garantir a confiabilidade desses sistemas.

Metodologia do estudo

Para realizar seu estudo, o Newsguard avaliou as respostas dos chatbots a dez reivindicações falsas. Os pesquisadores usaram três tipos diferentes de instruções: avisos neutros, líderes de instruções que assumiam que a falsa reivindicação era verdadeira e instruções maliciosas projetadas para contornar as medidas de segurança. Os pesquisadores avaliaram se o chatbot repetiu a reivindicação falsa ou a desmascarou recusando -se a responder. O relatório conclui que os modelos de IA estão “repetindo falsidades com mais frequência, tropeçando em vazios de dados, onde apenas os atores malignos oferecem informações, sendo enganados por sites ligados ao estrangeiro que se apresentam como meios locais e lutando contra eventos de notícias de última hora” do que em 2024, destacando a necessidade de vigilância contínua e aprimoramento no desenvolvimento e implantação de um implantação de 2024, a necessidade de vigilância contínua.

Source: Newsguard: a IA Chatbots espalhou falsidades em 33% das respostas