OpenAI diz que erros de saúde gratuitos do ChatGPT caíram 71 por cento

OpenAI lançou GPT-5.5 Instant como modelo padrão para usuários ChatGPT gratuitos, alegando que agora corresponde ao desempenho de seus modelos de pensamento de fronteira em consultas de saúde com base em avaliações internas. As informações de saúde estão sob escrutínio intensificado, especialmente depois que uma investigação do Guardian citou imprecisões nas visões gerais de IA do Google, levando o Google a retirar esses recursos para certas questões relacionadas à saúde.

A OpenAI afirmou que suas atualizações representam uma melhoria na precisão das informações de saúde. Essa mudança permite que um grande público acesse respostas médicas do ChatGPT sem redirecionar para fontes externas, o que poderia impactar editores e SEOs no setor de saúde.

A empresa destacou os avanços em seus benchmarks HealthBench e HealthBench Professional, observando que o GPT-5.5 Instant supera seu antecessor, o GPT-5.3 Instant. A OpenAI também relatou uma redução de 71% nas respostas de saúde sinalizadas por possíveis problemas de factualidade ao longo de dois meses, referenciando seus sistemas de monitoramento de tráfego ao vivo.

Uma avaliação separada envolveu a comparação das respostas geradas pelo GPT-5.5 Instant com aquelas escritas por médicos em 3.500 conversas representativas sobre saúde. Nas avaliações, um painel de médicos classificou as respostas do modelo de IA como superiores às de autoria de médicos humanos em termos de precisão, comunicação e integridade.

A OpenAI afirmou que o GPT-5.5 Instant demonstra menos modos de falha do que versões mais antigas e respostas humanas, apontando menos sinais de alerta perdidos e uma probabilidade reduzida de não conseguir buscar contexto adicional dos usuários. O HealthBench foi desenvolvido com base na rede de médicos da empresa e utiliza rubricas criadas por médicos para avaliação.

A OpenAI trabalha com mais de 260 médicos em 60 países, que analisaram coletivamente mais de 700.000 exemplos de respostas. Embora este número tenha sido citado de forma consistente desde o lançamento do ChatGPT Health em janeiro, nenhum resultado de revisão independente foi divulgado.

De acordo com a OpenAI, as consultas sobre saúde e bem-estar representam uma parcela significativa das interações do ChatGPT, com mais de 230 milhões de usuários fazendo perguntas relacionadas à saúde semanalmente. Além disso, as discussões sobre saúde são classificadas sob políticas estritas que proíbem anúncios durante conversas sobre saúde, saúde mental ou política.

A demanda do mercado por informações de saúde por meio do nível gratuito do ChatGPT pode aumentar a pressão de zero clique sobre os editores, à medida que as respostas geradas por IA apresentam maior envolvimento, supostamente o mais alto entre as categorias analisadas nas visões gerais de IA do Google. As afirmações da OpenAI relativamente à precisão das respostas de saúde carecem atualmente de validação por terceiros, levantando preocupações sobre a fiabilidade das suas avaliações.

O anúncio não esclareceu como essas atualizações podem afetar os protocolos de citação, sugerindo que a responsabilidade de verificar as respostas e lidar com as perdas de tráfego poderia passar para os profissionais de saúde.

Crédito da imagem em destaque

OpenAI diz que erros de saúde gratuitos do ChatGPT caíram 71 por cento

Related Stories

Apple traz controles de fala Siri mais pessoais para beta 3

Estudo antrópico descobre que modelos de Claude formam um espaço de trabalho interno semelhante à consciência

Apple ativa Siri AI no Apple Watch no watchOS 27 beta 3

Midjourney pressiona a Disney e outros a revelar o uso interno de IA em processos judiciais