Hoje marca um marco significativo no desenvolvimento de IA com o lançamento do Modo de Voz Avançado ChatGPT iniciando sua fase alfa.

Um vazamento recente em X.com revela que um grupo seleto de usuários do ChatGPT Plus ganhará acesso antecipado a esse recurso muito aguardado, permitindo que eles se envolvam em conversas semelhantes às humanas com seu assistente de IA favorito.

Mas, embora a IA conversacional esteja avançando rapidamente, já há muita conversa — e não apenas sobre os novos recursos.

Quando será lançado o Modo de voz avançado do ChatGPT?

Embora o lançamento do Modo de Voz Avançado do ChatGPT hoje marque a primeira oportunidade para um grupo seleto de usuários do ChatGPT Plus experimentarem esse recurso, nem todos terão acesso imediato.

De acordo com o vazamento, a participação nesta fase alfa dependerá de uma variedade de fatores. Basicamente, nem todos os assinantes do Plus podem esperar experimentar esse recurso inovador ainda.

Um e-mail da equipe do ChatGPT confirma que o modo avançado faz parte de uma implementação alfa limitada que começa hoje, terça-feira, 24 de setembro de 2024. Embora a OpenAI tenha prometido que “todos os usuários Plus terão acesso até o final do outono”, este teste alfa é o primeiro passo tangível em direção a essa meta.

Apesar da natureza limitada do lançamento, há entusiasmo crescendo dentro da comunidade. Muitos veem isso como um sinal de que a OpenAI está comprometida em cumprir sua promessa de trazer esse novo modo de conversação para os usuários antes do fim do ano. E para aqueles que não tiverem acesso imediatamente, é um indicador seguro de que um lançamento público completo não está longe.

O que é o Modo de Voz Avançado do ChatGPT?

A OpenAI demonstrou pela primeira vez o Modo de Voz Avançado em maio de 2024, mostrando o próximo passo em como interagimos com a IA.

Diferentemente das versões anteriores, este novo modo permite interações dinâmicas, em tempo real e semelhantes às humanas com o ChatGPT, incluindo a capacidade de interromper ou redirecionar a conversa no meio da frase se ela sair do assunto ou se tornar muito detalhada.

Isso é especialmente emocionante para usuários que querem conversas mais naturais e fluidas sem ter que esperar por uma resposta de texto ou lutar com respostas longas. Agora você pode fazer perguntas complexas e esperar respostas sofisticadas e detalhadas do chatbot em tempo real!

Uma nova era de IA conversacional

Este lançamento aproxima o ChatGPT de um futuro em que interagir com a IA parece tão natural quanto falar com outra pessoa. Enquanto a OpenAI já esteve à frente da concorrência — tendo demonstrado o Advanced Voice Mode pela primeira vez — a empresa começou a sentir o calor de seus rivais. O Google já lançou o Gemini Live, uma IA de escopo semelhante, enquanto o rumoroso Siri 2.0 da Apple está gerando burburinho com seus recursos aprimorados de IA.

Implementação do modo de voz avançado do ChatGPT
Com o lançamento do modo de voz avançado do ChatGPT, a competição entre a OpenAI e os gigantes da tecnologia vai esquentar (Crédito da imagem)

O cenário competitivo para IA conversacional está esquentando, mas este teste alfa pode ser o empurrão que a OpenAI precisa para voltar à vanguarda da corrida. Espera-se que a capacidade aprimorada do modo de voz torne o ChatGPT mais amigável e acessível, especialmente para aqueles em movimento, onde digitar consultas longas nem sempre é viável.

Esperemos por uma viagem mais tranquila

No entanto, nem tudo são flores para a OpenAI à medida que a data de lançamento do Modo de Voz Avançado do ChatGPT se aproxima.

Em maio, a OpenAI foi pega em um escândalo envolvendo a atriz Scarlett Johansson, cuja voz foi usada para demonstrar o recurso. Johansson, conhecida por sua voz icônica, questionou o uso de sua voz sem seu consentimento explícito, gerando um debate sobre IA ética e o uso de semelhanças de celebridades em conteúdo gerado por IA. Enquanto a OpenAI alegava que era uma voz genérica que coincidentemente soava semelhante, a reação negativa destacou as complexidades da tecnologia de voz, especialmente quando se trata de propriedade intelectual e direitos pessoais.

A controvérsia em torno da voz de Johansson trouxe à tona discussões importantes sobre onde a linha deve ser traçada no conteúdo gerado por IA, particularmente quando envolve pessoas reais. À medida que a OpenAI continua a desenvolver e implementar o Advanced Voice Mode, ela precisará navegar cuidadosamente nessas águas legais e éticas para evitar mais contratempos.

O lançamento do ChatGPT Advanced Voice Mode marca um momento crucial na evolução da IA ​​conversacional. Ao permitir interações mais naturais e fluidas, esse recurso expande os limites do que a IA pode fazer. Com a OpenAI competindo com gigantes da tecnologia como Google e Apple, a pressão é para entregar um produto polido, ético e revolucionário. Mas o futuro parece brilhante para aqueles que esperam pela chance de falar com o ChatGPT — e, à medida que esse recurso entra em sua fase alfa, o lançamento completo pode estar chegando.


Crédito da imagem em destaque: Emre Çıtak/Ideograma IA

Source: O lançamento do Modo de Voz Avançado do ChatGPT está a caminho!