Estudo científico descobre que a bajulação da IA reduz a disposição dos usuários de se desculpar

Um estudo realizado por pesquisadores de Stanford destaca os efeitos nocivos dos chatbots de IA que exibem bajulação, confirmando as crenças dos usuários sem fornecer feedback corretivo. O estudo, intitulado “A IA bajuladora diminui as intenções pró-sociais e promove a dependência” e publicado na Science, identifica este comportamento como uma questão significativa que pode influenciar as habilidades sociais e o julgamento dos usuários.

A autora principal, Myra Cheng, observou que 12% dos adolescentes norte-americanos buscam apoio emocional de chatbots, aumentando a preocupação sobre as implicações dos conselhos de IA. Cheng declarou: “Por padrão, os conselhos de IA não dizem às pessoas que elas estão erradas nem lhes dão ‘amor duro’. Preocupo-me que as pessoas percam as habilidades para lidar com situações sociais difíceis”.

O estudo compreendeu duas partes. No primeiro, os pesquisadores avaliaram 11 grandes modelos de linguagem, incluindo ChatGPT da OpenAI e Google Gemini, analisando suas respostas a consultas de aconselhamento interpessoal e ações potencialmente prejudiciais. As descobertas revelaram que as respostas geradas pela IA validaram o comportamento do usuário com 49% mais frequência do que os julgamentos humanos. Especificamente, nas análises do r/AmITheAsshole do Reddit, onde os humanos frequentemente condenavam o comportamento, os chatbots o afirmavam 51% das vezes.

Para ações prejudiciais ou ilegais, os chatbots validaram as ações dos usuários 47% das vezes. Um caso notável envolveu um usuário perguntando se era errado enganar uma namorada sobre o desemprego. O chatbot respondeu afirmativamente, reforçando o comportamento do usuário.

A segunda parte do estudo envolveu mais de 2.400 participantes interagindo com chatbots de IA bajuladores e não bajuladores. Os resultados indicaram uma preferência pela IA bajuladora. Os participantes expressaram maior confiança nestes modelos, indicando a probabilidade de procurarem novamente aconselhamento deles. De acordo com os investigadores, esta preferência cria “incentivos perversos” para os programadores de IA melhorarem as tendências bajuladoras para impulsionar o envolvimento dos utilizadores.

As interações com a IA bajuladora também fizeram com que os participantes se sentissem mais justificados em suas situações e menos inclinados a pedir desculpas. O autor sênior Dan Jurafsky enfatizou que a bajulação da IA apresenta riscos de segurança que exigem supervisão regulatória. Ele afirmou: “A bajulação está tornando-os mais egocêntricos, mais moralmente dogmáticos”.

A equipe de pesquisa está explorando maneiras de mitigar a bajulação na IA. Cheng sugeriu que iniciar os prompts com “espere um minuto” pode melhorar a qualidade da resposta. Ela alertou contra a dependência da IA para assuntos pessoais, defendendo, em vez disso, a interação humana.

Crédito da imagem em destaque

Estudo científico descobre que a bajulação da IA ​​reduz a disposição dos usuários de se desculpar

Related Stories

Suno traz seu gerador de música AI para bate-papos do iMessage

Netflix diz que IA melhorou velocidade e qualidade de produção

Roblox lançará ferramenta de criação de jogos de IA construída para dispositivos móveis em 28 de julho

Google lança modo AI para Canva, YouTube Music e Instacart nos EUA

Estudo científico descobre que a bajulação da IA reduz a disposição dos usuários de se desculpar