Llama 3.1 405b da Meta AI atinge benchmarks

O Llama 3.1 405b da Meta AI é um sucesso que conseguiu impressionar muitos usuários. O novo modelo não é um peixe pequeno – é um peixe grande em um conjunto cada vez maior de modelos de linguagem. Vamos dar uma olhada na IA que faz todo mundo falar e escrever.

O Llama 3.1 405b da Meta AI é, como o nome sugere, um grande modelo de linguagem com 405 bilhões de parâmetros. Ele faz parte da série Llama 3 da Meta, lançada em abril de 2024. Os primeiros benchmarks sugerem que esse modelo pode superar os líderes atuais em vários testes importantes de IA.

Um cavalo de uma cor diferente: especificações do Llama 3.1 405b da Meta AI

Meta AI, anteriormente conhecida como Facebook AI Research, é a divisão de pesquisa de inteligência artificial da Meta Platforms. Eles introduziram o Llama (Large Language Model Meta AI) em 2023 como uma alternativa de código aberto para modelos de linguagem proprietários. O Llama rapidamente ganhou popularidade na comunidade de IA. Com base nesse sucesso, a Meta lançou o Llama 2 em 2023, que mostrou melhorias significativas.

Agora, com o Llama 3, a Meta expandiu os limites ainda mais, culminando no poderoso modelo Llama 3.1 405b que estamos discutindo hoje. Essa rápida progressão demonstra o comprometimento da Meta em avançar a tecnologia de IA de código aberto.

Nesta era em que a inteligência artificial está por toda parte, as empresas não param. Em uma era em que olhamos para gráficos de jogos antigos e nos perguntamos o quanto mais pode ser melhorado, passamos a perdoar novos gráficos, e o mesmo é verdade para a inteligência artificial.

Meta AI não é desleixada quando se trata de desempenho. Este modelo tem 405 bilhões de parâmetros, o que o torna um peso pesado na arena de IA. Então, o que significa esse parâmetro 405b?

Vizinhos dizem nunca: Llama 3.1 405b da Meta AI vs concorrentes

Llama 3.1 405b da Meta AI está mostrando resultados impressionantes em benchmarks iniciais. Ele supera o GPT-4 em vários testes, incluindo GSM8K, Hellaswag, Boolq e várias categorias MMLU. No entanto, ele fica para trás em áreas como HumanEval e ciências sociais MMLU.

O desempenho do modelo é particularmente forte em tarefas de matemática e codificação. Por exemplo, no teste GSM8K, o Llama 3.1 405b da Meta AI obteve 96,8, enquanto sua contraparte 70B obteve 94,8. No HumanEval, o modelo 405B obteve 85,3, em comparação com 79,3 para a versão 70B.

Esses números são baseados no modelo base. O ajuste de instruções poderia potencialmente melhorar esses resultados ainda mais. Então podemos dizer que esses números representam poder de processamento, quanto maior o número, melhor (mas às vezes), mas às vezes os modelos são esmagados sob sua carga.

Llama 3.1 405b da Meta AI desfila pelos benchmarks — O que o usuário final pode querer é acesso gratuito a um bom produto (Crédito da imagem)

Hoof It para o futuro: Llama 3.1 405b da Meta AI e IA de código aberto

O fato de que o modelo Llama 3.1 405b da Meta AI é uma IA de código aberto e que, pela primeira vez, um modelo de código aberto pode superar o melhor LLM de código fechado disponível em vários benchmarks, pode ser um sinal do que está por vir, mesmo que não seja totalmente compreendido no momento. Por enquanto, podemos fazer nossos GPTs no ChatGPT. Essa dependência pode ser quebrada no futuro.

O Llama 3.1 405b da Meta AI é um novo e forte player no espaço da IA. Seu forte desempenho em vários benchmarks e natureza de código aberto o tornam um modelo a ser observado. À medida que a IA continua a evoluir, o Llama 3.1 405b da Meta AI pode desempenhar um papel importante na formação do futuro dos modelos de linguagem e da tecnologia de IA.

Crédito da imagem em destaque: Blog Meta AI

Source: Llama 3.1 405b da Meta AI atinge benchmarks

Llama 3.1 405b da Meta AI atinge benchmarks

Um cavalo de uma cor diferente: especificações do Llama 3.1 405b da Meta AI

Vizinhos dizem nunca: Llama 3.1 405b da Meta AI vs concorrentes

Hoof It para o futuro: Llama 3.1 405b da Meta AI e IA de código aberto

© 2021 TechBriefly is a Linkmedya brand.

Follow Us