Um estudo realizado por pesquisadores de Stanford destaca os efeitos nocivos dos chatbots de IA que exibem bajulação, confirmando as crenças dos usuários sem fornecer feedback corretivo. O estudo, intitulado “A IA bajuladora diminui as intenções pró-sociais e promove a dependência” e publicado na Science, identifica este comportamento como uma questão significativa que pode influenciar as habilidades sociais e o julgamento dos usuários.

A autora principal, Myra Cheng, observou que 12% dos adolescentes norte-americanos buscam apoio emocional de chatbots, aumentando a preocupação sobre as implicações dos conselhos de IA. Cheng declarou: “Por padrão, os conselhos de IA não dizem às pessoas que elas estão erradas nem lhes dão ‘amor duro’. Preocupo-me que as pessoas percam as habilidades para lidar com situações sociais difíceis”.

O estudo compreendeu duas partes. No primeiro, os pesquisadores avaliaram 11 grandes modelos de linguagem, incluindo ChatGPT da OpenAI e Google Gemini, analisando suas respostas a consultas de aconselhamento interpessoal e ações potencialmente prejudiciais. As descobertas revelaram que as respostas geradas pela IA validaram o comportamento do usuário com 49% mais frequência do que os julgamentos humanos. Especificamente, nas análises do r/AmITheAsshole do Reddit, onde os humanos frequentemente condenavam o comportamento, os chatbots o afirmavam 51% das vezes.

Para ações prejudiciais ou ilegais, os chatbots validaram as ações dos usuários 47% das vezes. Um caso notável envolveu um usuário perguntando se era errado enganar uma namorada sobre o desemprego. O chatbot respondeu afirmativamente, reforçando o comportamento do usuário.

A segunda parte do estudo envolveu mais de 2.400 participantes interagindo com chatbots de IA bajuladores e não bajuladores. Os resultados indicaram uma preferência pela IA bajuladora. Os participantes expressaram maior confiança nestes modelos, indicando a probabilidade de procurarem novamente aconselhamento deles. De acordo com os investigadores, esta preferência cria “incentivos perversos” para os programadores de IA melhorarem as tendências bajuladoras para impulsionar o envolvimento dos utilizadores.

As interações com a IA bajuladora também fizeram com que os participantes se sentissem mais justificados em suas situações e menos inclinados a pedir desculpas. O autor sênior Dan Jurafsky enfatizou que a bajulação da IA ​​apresenta riscos de segurança que exigem supervisão regulatória. Ele afirmou: “A bajulação está tornando-os mais egocêntricos, mais moralmente dogmáticos”.

A equipe de pesquisa está explorando maneiras de mitigar a bajulação na IA. Cheng sugeriu que iniciar os prompts com “espere um minuto” pode melhorar a qualidade da resposta. Ela alertou contra a dependência da IA ​​para assuntos pessoais, defendendo, em vez disso, a interação humana.


Crédito da imagem em destaque