A Microsoft lançou o “MAI-Transscribe-1”, um modelo de transcrição de IA que alcança precisão de fala para texto em 25 idiomas amplamente falados. O modelo visa atender aplicações como reuniões, closed caption e ditado.

MAI-Transscribe-1 estará disponível no Microsoft Foundry junto com outros modelos, MAI-Voice-1 e MAI-Image-2. A Microsoft afirmou que este lançamento permite que “os modelos MAI se tornem amplamente disponíveis para uso comercial pela primeira vez”, permitindo que os clientes avaliem e construam aplicativos aproveitando a IA na transcrição, voz e geração de imagens.

MAI-Voice-1 apresenta geração de fala hiper-realista que mantém a identidade do locutor e as nuances emocionais em todo o conteúdo estendido. Inclui um recurso de prompt de voz que pode desenvolver vozes de marcas personalizadas a partir de apenas um minuto de áudio gravado.

Enquanto isso, MAI-Image-2 é um novo modelo de geração de texto para imagem que se destaca na renderização de iluminação natural, tons de pele precisos e texto nítido nas imagens. Este modelo foi classificado entre os três primeiros na tabela de classificação de texto para imagem da Arena.ai.

A Microsoft continua a reduzir a sua dependência da tecnologia OpenAI. A empresa criticou o GPT-4 pelos altos custos e tempos de resposta lentos. Como tal, a Microsoft iniciou o desenvolvimento dos seus próprios modelos internos de IA e está a avaliar modelos de terceiros para a sua funcionalidade Copilot.

Mustafa Suleyman, CEO de IA da Microsoft, confirmou o foco no desenvolvimento de modelos de IA “fora da fronteira”, observando que eles não alcançarão a sofisticação das ofertas da OpenAI. A recente reestruturação da liderança do Copilot da Microsoft resultou na formação de quatro divisões: experiência Copilot, plataforma Copilot, aplicativos Microsoft 365 e modelos de IA. Jacob Andreou, ex-executivo da Snap, liderará a divisão de experiências do Copilot e se reportará ao CEO da Microsoft, Satya Nadella.

O CEO da Salesforce, Marc Benioff, afirmou anteriormente que a Microsoft provavelmente descontinuaria o uso da tecnologia OpenAI, apontando para os desafios enfrentados pela OpenAI, incluindo o abandono de seu projeto Stargate de US$ 500 bilhões destinado à construção de data centers nos EUA.


Crédito da imagem em destaque