O Elevenlabs expandiu significativamente os recursos de idioma do seu modelo de texto para fala (TTS), agora suportando um total de 70 idiomas. A AI Startup, com sede em Nova York, anunciou na semana passada que a adição de 41 novos idiomas torna seu modelo acessível a aproximadamente 90% da população global.

A expansão foi implementada no modelo Onze V3 (Alpha), que o Elevenlabs lançou em 8 de junho, divulgando -o como seu “modelo TTS mais expressivo”. A empresa fez o anúncio por meio de sua conta X oficial, anteriormente conhecida como Twitter.

Os idiomas recém -apoiados incluem uma gama diversificada, como árabe, assamês, bengali, búlgaro, catalão, gujarati, letão, malaio, malaiala, marathi, nepaleses, suaíli, tâmil e telugu. Isso amplia a utilidade do modelo para criadores e empresas de conteúdo que visam alcançar um público mais amplo.

O Elevenlabs aconselha os usuários que desejam gerar texto em qualquer um dos novos idiomas para gravar um clone de voz instantâneo (IVC) enquanto seleciona o idioma desejado. Além disso, a empresa planeja adicionar vozes da biblioteca de voz para os idiomas recém -suportados nas próximas semanas.

Onze v3 se baseia na base dos modelos multilíngues V2 e V2.5 TTS. Uma característica fundamental do Onze V3 é seu suporte para tags de áudio em linha, incluindo “Whispers”, “EXCOLTADO” e “SUSPS”. Essas tags permitem que os usuários infundam nuances emocionais e pistas não verbais no áudio gerado, resultando em uma entrega mais dramática e envolvente.

Além disso, o modelo suporta interações multi-falantes, completas com interrupções, ritmo natural e diálogos sobrepostos, criando uma experiência de conversação mais realista. O Elevenlabs enfatiza que o Onze V3 demonstra manuseio aprimorado de elementos como estresse, cadência e consciência contextual.

O modelo Onze V3 está atualmente acessível através do site e dos aplicativos móveis da empresa. No entanto, ainda não está disponível como uma interface de programação de aplicativos (API).

Antes dessa expansão do idioma, em abril, o Elevenlabs introduziu a transferência de agentes, um novo recurso agêntico focado na empresa, projetado para a IA conversacional. Esse recurso permite que dois agentes de IA se comuniquem e entreguem conversas perfeitamente, juntamente com dados de conversação relevantes, a um agente mais especializado.

Source: Elevenlabs AI Text-to-falae agora suporta 70 idiomas