MiniMax lançou MMX-CLI, uma interface de linha de comando baseada em Node.js para sua plataforma de IA, permitindo que desenvolvedores e agentes de IA acessem recursos generativos diretamente.

MMX-CLI aborda desafios enfrentados por agentes baseados em modelos de linguagem grande (LLM), que lutam para gerar mídia sem camadas de integração adicionais. A nova interface permite que os usuários invoquem diversas funções de geração de mídia diretamente como comandos shell, eliminando a necessidade de protocolos de contexto de modelo.

A interface integra os recursos do MiniMax em sete grupos de comandos: texto mmx, imagem mmx, vídeo mmx, fala mmx, música mmx, visão mmx e pesquisa mmx. Cada comando fornece funcionalidades específicas adaptadas para desenvolvedores e aplicações de IA.

O comando de texto mmx suporta bate-papo multiturno e tem como alvo variantes específicas do modelo MiniMax. O padrão é usar MiniMax-M2.7, permitindo tarefas avançadas de geração de texto. O comando mmx image permite a geração de imagens a partir de prompts de texto, fornecendo opções de proporção de aspecto e consistência de assunto em várias saídas. Este recurso auxilia fluxos de trabalho que exigem continuidade visual. O comando mmx video utiliza MiniMax-Hailuo-2.3 para geração de vídeo, com opções para pesquisa síncrona ou rastreamento de tarefas assíncronas. Os usuários podem especificar um quadro de abertura para geração de vídeo usando os sinalizadores do comando.

O comando de fala mmx do MMX-CLI apresenta mais de 30 vozes de conversão de texto em fala. Ele permite que os usuários ajustem parâmetros como velocidade, volume e tom, ao mesmo tempo que oferece suporte ao tempo das legendas. A entrada é limitada a 10.000 caracteres.

Com o comando mmx music, os usuários podem gerar música a partir de entradas de texto e definir vários parâmetros de composição, como gênero e instrumentação. Opções para incorporar marcas d’água também estão incluídas. O comando mmx vision interpreta imagens usando um modelo de linguagem de visão, permitindo assim que os usuários perguntem sobre o conteúdo das imagens por meio de prompts.

O comando mmx search facilita pesquisas na web, retornando resultados em formato de texto ou JSON. Tanto a estrutura de comando quanto a arquitetura técnica subjacente são otimizadas para usabilidade em vários ambientes. MMX-CLI é desenvolvido principalmente em TypeScript e é compatível com Node.js 18+. Sua implantação é simples, apresentando tratamento estruturado de erros e suporte para roteamento de API de duas regiões.

MiniMax afirmou que o MMX-CLI reduz significativamente as barreiras de integração para o desenvolvimento de IA, fornecendo uma ferramenta unificada para diversos recursos de geração de mídia. Isso, combinado com a fácil configuração para agentes de IA, agiliza o processo de construção de aplicativos inteligentes.


Crédito da imagem em destaque