A gigante da tecnologia Apple quebrou o silêncio sobre a inteligência artificial e apresentou seus modelos multimodais de grande linguagem (LLMs) de próxima geração, chamados MM1.
O MM1, que executa com sucesso tarefas complexas, como legendagem de imagens, resposta a perguntas visuais e inferência de linguagem natural, é visto como um desenvolvimento importante no mundo da inteligência artificial.
O que é MM1?
Como mencionei acima, MM1 é um modelo multimodal de grande linguagem projetado para legendar imagens, responder perguntas visuais e realizar inferência de linguagem natural. Tem como objetivo realizar tarefas complexas combinando texto e dados visuais. Os pesquisadores da Apple relatam que o MM1 oferece resultados muito melhores em comparação com outros resultados preliminares de treinamento.

Especificações técnicas do MM1
Suportando até 30 bilhões de parâmetros, o MM1 se destaca como uma família de modelos que pode processar dados de imagem e texto juntos. Treinado em diferentes tipos de dados, como subcabeçalhos de imagem, texto de imagem intercalado e somente texto, o MM1 possui uma capacidade de processamento de informações mais abrangente.
Por outro lado, o desenvolvimento do MM1 também indica a importância que a Apple atribui à inteligência artificial. Apple, trabalhando em uma estrutura LLM com o codinome “Ájax” e incluindo iniciativas como DarwinAI, vê a inteligência artificial e o aprendizado de máquina como tecnologias centrais. A empresa planeja compartilhar os detalhes de seu trabalho nesta área em 2024 e fazer uma apresentação focada em IA na conferência de desenvolvedores WWDC em junho.

O MM1 da Apple é considerado um importante avanço no campo de LLMs multimodo. Isso mostra que a Apple está quebrando o silêncio sobre a IA, que poderá desempenhar um papel importante no futuro próximo. O desenvolvimento do MM1 contribuirá para o desenvolvimento da inteligência artificial em áreas como processamento de dados visuais e compreensão de linguagem natural.
Crédito da imagem em destaque: Sumudu Mohottige / Unsplash







