A Apple continua trabalhando na inteligência artificial a todo vapor. Por fim, lançou uma nova série de modelos de inteligência artificial de código aberto chamada OpenELM (.
Com o objetivo de oferecer aos usuários o poder e as funções da inteligência artificial sem a necessidade de servidores em nuvem, a Apple afirma que a característica mais importante desses modelos é que eles podem funcionar no aparelho.
Enquanto isso, compartilhamos recentemente com vocês as declarações e detalhes de Mark Gurman da Bloomberg sobre AI LLM no iOS 18. Aqui está tudo o que sabemos sobre os novos modelos de inteligência artificial.
O que é OpenELM?
OpenELM consiste em oito modelos. Quatro são pré-treinados, enquanto outros podem ser personalizados com instruções e informações específicas. Os modelos são relativamente pequenos (270 milhões a 3 bilhões de parâmetros) e otimizados para execução em dispositivos.
A Apple usa uma estratégia de escalonamento baseada em camadas para melhorar a precisão e a eficiência dos modelos.
Por outro lado, a utilização de modelos OpenELM oferece muitas vantagens:
- Processamento de IA no dispositivo: Com os modelos OpenELM, as funções de IA podem ser executadas diretamente no dispositivo, sem a necessidade de servidores em nuvem. Isso aumenta significativamente a privacidade e a segurança dos dados.
- Custos mais baixos: A dependência reduzida de servidores em nuvem resulta em economia de custos.
- Tempos de resposta mais rápidos: o processamento de dados no dispositivo permite tempos de resposta mais rápidos e uma experiência de usuário mais tranquila.
- Mais pesquisa e desenvolvimento: Os modelos OpenELM são de código aberto, permitindo que pesquisadores e desenvolvedores os estudem e melhorem. Isto acelera o avanço da tecnologia de IA e o desenvolvimento de aplicações de próxima geração.
A Apple fez o seguinte declaração sobre os novos modelos de linguagem:
A reprodutibilidade e a transparência de grandes modelos linguísticos são cruciais para o avanço da investigação aberta, garantindo a fiabilidade dos resultados e permitindo investigações sobre dados e preconceitos de modelos, bem como riscos potenciais. Para isso, lançamos o OpenELM, um modelo de linguagem aberta de última geração. OpenELM usa uma estratégia de escalonamento em camadas para alocar parâmetros com eficiência dentro de cada camada do modelo do transformador, levando a maior precisão. Por exemplo, com um orçamento de parâmetros de aproximadamente um bilhão de parâmetros, o OpenELM apresenta uma melhoria de 2,36% na precisão em comparação com o OLMo, ao mesmo tempo que requer 2 vezes menos tokens de pré-treinamento.
Divergindo das práticas anteriores que fornecem apenas pesos de modelo e código de inferência e pré-treinamento em conjuntos de dados privados, nosso lançamento inclui a estrutura completa para treinamento e avaliação do modelo de linguagem em conjuntos de dados disponíveis publicamente, incluindo registros de treinamento, vários pontos de verificação e pré-treinamento. configurações. Também lançamos código para converter modelos na biblioteca MLX para inferência e ajuste fino em dispositivos Apple. Esta versão abrangente visa capacitar e fortalecer a comunidade de pesquisa aberta, abrindo caminho para futuros empreendimentos de pesquisa aberta.
Além disso, se quiser saber mais sobre o OpenELM, você pode verificar isto relatório detalhado.
Os planos da Apple incluem disponibilizar modelos OpenELM no sistema operacional iOS 18. Espera-se que o iOS 18 inclua melhorias significativas focadas em IA e execute um grande modelo de linguagem (LLM) no dispositivo.
Os modelos OpenELM são considerados um passo importante para o futuro da inteligência artificial. Com novos modelos, espera-se que a IA se torne mais privada, segura e acessível.
A decisão da Apple pode ser importante para disseminar a inteligência artificial e integrá-la em todos os aspectos da vida diária.
Crédito da imagem em destaque: Keming Tan/Unsplash
Source: A Apple lança uma nova série de modelos de IA de código aberto chamados OpenELM