Em um anúncio recente, a Meta revelou seu mais recente desenvolvimento de IA, o inovador Meta caixa de voz. Esse tecnologia inovadora de geração de voz possui capacidades impressionantes que superam seus concorrentes.
No entanto, a Meta tomou a decisão de adiar seu lançamento devido a preocupações em torno do uso indevido potencial e ferir que pode resultar da sua disponibilidade irrestrita. Especialmente no que diz respeito à viabilidade do uso do Voicebox para o produção de áudios deepfake, Meta parece considerar que vale a pena ser cauteloso sobre o lançamento. Abaixo, você pode conferir os detalhes sobre as funcionalidades do Meta Voicebox e os motivos pelos quais ele pode ser perigoso.
Por que o lançamento do Meta Voicebox é arriscado?
A ascensão das tecnologias de IA, incluindo chatbots e geradores de voz, levantou preocupações sobre possíveis abusos e a criação de deepfakes. Meta Voicebox, com suas capacidades de imitar vozes, apresenta um risco semelhante segundo a empresa. Deepfakes, que envolvem a criação de conteúdo falso de áudio ou vídeo, podem prejudicar reputações, privacidade e credibilidade. Os fraudadores podem fazer uso indevido do Meta Voicebox para produzir mensagens de correio de voz falsas, personificar indivíduos, ou criar vídeos fabricados para enganar e manipular os outros.
Reconhecendo os riscos potenciais associados ao Voicebox, a Meta optou por compartilhar amostras de áudio e um artigo de pesquisa em vez de liberar a ferramenta em um estado totalmente operacional. Com isso, a Meta pretende promover a compreensão entre os acadêmicos e pesquisadores sobre o potencial desta tecnologia. A empresa reconhece que a Voicebox representa um passo importante em pesquisa generativa de IA e espera continuar explorando e colaborando no domínio do áudio.
A Meta se compromete com o uso responsável
A Meta está ciente dos desafios impostos pelos deepfakes e do potencial de uso indevido e danos não intencionais associados a tecnologias como o Voicebox. a empresa é trabalhando ativamente para abordar essas preocupações e pretende liberar um trabalho de pesquisa juntamente com uma ferramenta classificadora. Esta ferramenta ajudará distinguir entre a fala gerada pelo Voicebox e fala humana genuínaauxiliando na identificação de instâncias de manipulação potencial.
Apesar dos riscos, Meta destaca os benefícios potenciais da geração de fala por IA. caixa de voz poderia revolucionar a comunicação para indivíduos que estão mudo ou tem dificuldade em se expressar, quebrando barreiras à interação. Além disso, uma tradução em tempo real pode se tornar realidade, nos aproximando do conceito de “tradutor universal” retratado na ficção científica. O Voicebox também oferece aos criadores de conteúdo a capacidade de editar e melhorar a fala gravada, permitindo a remoção e substituição contínua de segmentos problemáticos.
O que é o Meta Voicebox?
Meta Voicebox apresenta uma nova era de geração de fala, indo além sua formação específica e destacando-se em tarefas para as quais não foi originalmente projetado. Ao contrário das plataformas geradoras de voz anteriores, o Voicebox pode gerar fala que soa convincentemente semelhante à fonte original, mesmo com um contexto mínimo fornecido. Ao utilizar a entrada de texto e um breve clipe de áudio, o Voicebox cria um discurso novo e com som autêntico, imitando o orador em destaque do clipe de origem. Aqui estão breves resumos de suas características distintas:
Síntese de conversão de texto em fala no contexto: O Voicebox, com sua capacidade de síntese de texto para fala no contexto, pode gerar fala usando apenas uma amostra de áudio de dois segundos como entrada. Ao combinar o estilo de áudio da amostra, o Voicebox se destaca na geração de conversão de texto em fala.
Transferência de estilo multilíngue: Um recurso intrigante do Voicebox é sua capacidade de transferir estilos entre idiomas. Ao fornecer uma amostra de fala e uma passagem de texto em inglês, francês, alemão, espanhol, polonês ou português, o Voicebox pode gerar uma leitura do texto no idioma especificado.
Redução de ruído e edição de fala: O aprendizado no contexto do Voicebox permite que ele execute edição e redução de ruídos de fala sem interrupções. Ele pode efetivamente restaurar segmentos de fala corrompidos por ruído de curta duração ou substituir palavras mal ditas sem exigir uma regravação completa de toda a fala. Os usuários podem facilmente identificar e cortar segmentos ruidosos, instruindo o Voicebox a regenerar essas partes.
Amostragem de fala diversificada: Extraindo insights de diversos dados do mundo real, o Voicebox produz uma fala que imita de perto como as pessoas falam naturalmente nos seis idiomas mencionados acima. Esse recurso abre portas para a geração de dados sintéticos para treinamento aprimorado de modelos de assistente de fala. Os resultados experimentais demonstram que os modelos de reconhecimento de fala treinados em fala sintética gerada pelo Voicebox exibem desempenho comparável àqueles treinados em fala real, com apenas 1% de degradação nas taxas de erro.
Meta text-to-speech AI tem muitas aplicações futuras possíveis
A Meta prevê o Voicebox como uma ferramenta multiuso com uma ampla gama de aplicações. assistentes virtuais e personagens não-jogadores no metaverso podem se beneficiar de vozes com som natural geradas pelo Voicebox. Adicionalmente, pessoas com deficiência visual poderiam ter lido mensagens escritas para eles nas vozes de seus amigos por meio da assistência da IA. Os criadores de conteúdo ganhariam acesso a novas ferramentas para facilmente criar e editar faixas de áudio para vídeos, abrindo possibilidades para experiências multimídia aprimoradas.
Voicebox possui recursos notáveis, incluindo a capacidade de editar, samplear, e estilizar fala, até sem treinamento explícito nestas áreas. Ele pode gerar clipes de áudio de alta qualidade e manipular áudio pré-gravado, preservando o estilo e o conteúdo da gravação original. Por exemplo, ele pode remover sons indesejados como buzinas de carros ou latidos de cachorro. A versatilidade de idiomas do Voicebox é igualmente impressionante, pois ele pode falar em seis idiomas diferentes e até combinações bilíngues.
O Voicebox da Meta representa um avanço significativo na Geração de fala orientada por IA, prometendo inúmeras aplicações e benefícios potenciais. No entanto, a decisão de adiar seu lançamento reflete o compromisso da Meta em desenvolvimento responsável e abordando os riscos associados à tecnologia. Ao adotar uma abordagem cautelosa e trabalhar ativamente para mitigar o potencial uso indevido, a Meta visa garantir que Voicebox contribui positivamente para a sociedade protegendo contra as consequências prejudiciais que podem advir de seu uso irrestrito.
Se você está interessado nos desenvolvimentos futuristas da empresa, confira as novas ferramentas Meta que podem maximizar seu impacto nas mídias sociais.
Source: O lançamento do Meta Voicebox foi cancelado devido a temores de uso indevido e danos