OpenAI lança recursos de vídeo em tempo real para ChatGPT

OpenAI lançou recursos de vídeo em tempo real para ChatGPT, integrando funcionalidades visuais em seu modo de voz avançado. Este anúncio foi feito durante um evento de transmissão ao vivo realizado em 12 de dezembro de 2024. A versão atualizada pode reconhecer objetos em tempo real por meio da câmera do dispositivo do usuário, processar informações visuais por meio de compartilhamento de tela e participar de conversas semelhantes às humanas. Disponível para assinantes do ChatGPT Plus, Team e Pro, a atualização será lançada na próxima semana, com alguns usuários na UE enfrentando possíveis atrasos.

Com essa melhoria, o ChatGPT pode responder aos usuários interpretando o que vê, como oferecer explicações sobre as configurações de um dispositivo ou fornecer sugestões para resolver problemas matemáticos. Para utilizar esses recursos, os usuários podem tocar no ícone de voz no aplicativo ChatGPT e ativar o compartilhamento de vídeo ou tela. O lançamento é priorizado para assinantes Plus, enquanto usuários ChatGPT Enterprise e Edu terão acesso em janeiro de 2025.

OpenAI apresenta recursos avançados em demonstração ao vivo

Durante a recente demonstração ao vivo, o presidente da OpenAI, Greg Brockman, destacou os recursos envolventes do Advanced Voice Mode com visão. Brockman questionou Anderson Cooper da CNN sobre anatomia enquanto demonstrava como o ChatGPT poderia compreender e comentar desenhos feitos por Cooper em um quadro negro. A interação ilustrou o potencial de aprendizagem interativa e feedback em tempo real, embora o ChatGPT exibisse alguns erros, como calcular mal um problema de geometria, enfatizando os desafios contínuos relacionados à precisão do modelo.

Este recurso atualizado enfrentou atrasos no desenvolvimento, com a OpenAI sugerindo anteriormente janelas de lançamento que foram finalmente estendidas. Demonstrado originalmente em maio de 2024, esperava-se que o Modo de Voz Avançado chegasse mais cedo. O recente anúncio mostra o culminar dos esforços para refinar e finalizar esta capacidade, indicando um foco estratégico na melhoria da experiência do utilizador e das capacidades tecnológicas do chatbot.

Além das novas funcionalidades visuais, a OpenAI também revelou um “Modo Papai Noel” para as festas de fim de ano, permitindo aos usuários interagir com o ChatGPT em tom festivo. Para acessar esse recurso, os usuários podem clicar no ícone do floco de neve no aplicativo. Esta opção sazonal redefine os limites de uso para a interação inicial, permitindo aos usuários mais oportunidades de interagir com o recurso festivo.

Rivais como Google e Meta estão desenvolvendo recursos semelhantes, como o Projeto Astra do Google, que foi disponibilizado recentemente para testadores selecionados no Android. Estes esforços refletem uma tendência mais ampla em que as principais empresas tecnológicas estão a trabalhar para integrar funcionalidades de vídeo interativo nos seus modelos de IA, melhorando o envolvimento do utilizador e a versatilidade das aplicações.

A OpenAI também indicou planos para lançar outras melhorias, como o reforço do seu Programa de Pesquisa de Ajuste Fino de Reforço, projetado para otimizar o desempenho do modelo em tarefas especializadas. Este programa destina-se a instituições de investigação e empresas, permitindo-lhes personalizar modelos OpenAI para aplicações complexas.

Crédito da imagem em destaque: OpenAI

O posto OpenAI lança recursos de vídeo em tempo real para ChatGPT apareceu pela primeira vez no TechBriefly.

Source: OpenAI lança recursos de vídeo em tempo real para ChatGPT