Reflection 70B é uma IA que pode corrigir seus próprios erros

O Reflection 70B faz o que os grandões não conseguem e aprende com seus próprios erros. Esta IA com modelos de linguagem de código aberto pode ter encontrado uma contramedida contra delírios.

Lançado pela HyperWrite, uma startup liderada pelo cofundador e CEO Matt Shumer, o Reflection 70B é baseado no Llama 3.1-70B Instruct da Meta. O que torna esse modelo diferente dos outros é sua capacidade de autocorreção, uma capacidade única que chamou a atenção da comunidade de IA.

Estou feliz em anunciar o Reflection 70B, o melhor modelo de código aberto do mundo.
You Might Also Like
O Steam Replay 2022 não está funcionando: como ver o Steam Replay 2022?
27/12/2022
Não se deixe enganar pelo preço do Nothing CMF Phone 1!
08/07/2024
Icebergify: Como usar o gerador de gráficos de iceberg do Spotify?
29/06/2022
Treinado usando Reflection-Tuning, uma técnica desenvolvida para permitir que LLMs corrijam seus próprios erros.
405B chegando na próxima semana – esperamos que seja o melhor modelo do mundo.
Construído com/ @GlaiveAI.
Leia mais : foto.twitter.com/kZPW1plJuo
— Matt Shumer (@mattshumer_) 5 de setembro de 2024

O recurso de destaque do Reflection 70B

Sumer anunciou a chegada do Reflection 70B na X e enfatizou sua superioridade sobre outros modelos no mercado de código aberto. Ele afirmou com confiança que a IA é atualmente o melhor modelo de IA de código aberto, superando seus predecessores, incluindo a série Llama da Meta. Benchmarks como MLLU e Avaliação Humana também confirmou o alto desempenho do Reflection 70B, mostrando melhores resultados do que alternativas de código aberto e comerciais.

A razão pela qual o Reflection 70B alcança esses resultados, e um recurso que seus concorrentes não têm, é sua capacidade de detectar e corrigir erros. Este é um recurso inovador em IA porque, embora os modelos de linguagem frequentemente “alucinar” ou produzir informações falsas, a IA de Shumer pode reconhecer erros antes de fornecer uma resposta final. Shumer vem pensando sobre esse conceito há meses e, com esse novo modelo, agora é uma realidade.

O Reflection 70B se destaca até mesmo entre os principais modelos de código fechado (Claude 3.5 Sonnet, GPT-4o).
É o melhor LLM em (pelo menos) MMLU, MATH, IFEval, GSM8K.
Supera o GPT-4o em todos os benchmarks testados.
Ele supera o Llama 3.1 405B. Não chega nem perto. foto.twitter.com/win7cHUOob
— Matt Shumer (@mattshumer_) 5 de setembro de 2024

O nome do Reflection 70B representa suas capacidades de introspecção, pois “reflete” seu raciocínio para verificar a precisão do modelo. O design inclui ícones especiais que melhoram o raciocínio e a correção de erros, permitindo que os usuários interajam com o modelo de forma mais eficaz. Esses processos de raciocínio podem ser vistos na forma de rótulos especiais que permitem correções em tempo real.

Para demonstrar sua eficácia, os usuários podem interagir com o Reflection 70B em um site de demonstraçãomas há dificuldades de acesso ao site devido a tráfego pesado. Algumas tarefas, como determinar qual número é maior entre 9.11 e 9.9são projetados para desafiar a precisão do modelo. Enquanto muitos sistemas de IA lutam com tais consultas, o Reflection 70B conseguiu acertá-las, apesar de levar mais de 60 segundos. Apesar do atraso, esse nível de raciocínio faz com que o modelo se destaque para casos de uso em que a precisão é crítica.

A reflexão 70B é apenas o começo

O Reflection 70B é o primeiro modelo de uma série em expansão. Um modelo ainda maior, o Reflection 405B, será lançado em breve. A visão ambiciosa de Shumer para modelos Reflection inclui superar as capacidades de modelos de código fechado, como o GPT-4 da OpenAI. O Reflection 405B supostamente superará os melhores modelos proprietários e ultrapassar os limites do que a IA de código aberto pode alcançar.

Mas o Reflection 70B não é apenas um projeto independente. Shumer também anunciou planos para integrar o modelo em HiperEscritaplataforma de assistente de escrita do . HyperWrite, uma extensão do Chrome que ajuda os usuários a redigir e-mails, resumir texto e muito mais, já tem milhões de usuários. A futura integração do Reflection 70B a esta plataforma oferecerá aos usuários um novo nível de precisão e personalização, permitindo uma digitação ainda mais avançada com tecnologia de IA.

Um processo de treinamento rápido e eficiente

O Treinamento Reflexão 70B não foi um processo longo e demorado, graças a uma parceria com Gládiouma startup especializada em conjuntos de dados de IA. A plataforma da Glaive cria conjuntos de dados específicos para casos de uso, tornando mais fácil e rápido treinar modelos de linguagem. No caso do Reflection 70B, essa abordagem levou ao treinamento do modelo cinco vezes em apenas três semanas, um feito possível por meio do uso dos sistemas de geração de dados sintéticos da Glaive.

Quero ser bem claro — @GlaiveAI é a razão pela qual isso funcionou tão bem.
O controle que eles dão a você para gerar dados sintéticos é insano.
Usarei esses recursos em quase todos os modelos que construirei daqui para frente, e você também deveria fazer o mesmo. https://t.co/I789UIa5Yg
— Matt Shumer (@mattshumer_) 5 de setembro de 2024

Fundada por Sahil Chaudhary, a empresa visa fornecer conjuntos de dados de alta qualidade que podem treinar modelos de forma rápida e econômica. Seu sucesso no treinamento de modelos menores foi demonstrado no passado. Um modelo parametrizado 3D superou muitos grandes concorrentes de código aberto em certas tarefas.

Reflexão 70B em ação

O desenvolvimento do modelo mostra o quão importante isso é para a HyperWrite, que foi fundada em 2020 como Otherside AI. Originalmente sediada em Long Island, Nova York, a HyperWrite cresceu de uma pequena assistente de escrita de IA para uma plataforma com mais de dois milhões de usuários. Seu sucesso inicial rendeu a Shumer e ao cofundador Jason Kuperberg um ponto em Lista “30 Under 30” da Forbes em 2023.

Em março de 2023, a HyperWrite levantou US$ 2,8 milhões em financiamento de investidores como Grupo Madrona Ventureque ajudou a empresa a crescer. Novos recursos como assistentes de navegador que podem executar tarefas como reservar voos ou encontrar candidatos a emprego no LinkedIn mantiveram o HyperWrite na vanguarda da assistência pessoal com tecnologia de IA. integração Espera-se que o Reflection 70B aprimore esses recursos e solidifique ainda mais a posição da HyperWrite no setor de IA.

O Reflection 70B mudará a forma como pensamos sobre IA. Ele combina precisão e raciocínio como nenhum outro modelo faz. O modelo é útil para tarefas que exigem alta precisão, mas suas aplicações potenciais são muito mais amplas. O próximo lançamento do Reflection 405B mostra que Shumer e sua equipe ainda estão trabalhando duro. À medida que a HyperWrite melhora sua plataforma e cria novos recursos, a série Reflection provavelmente será muito importante. Com o Reflection 70B, será interessante ver como a comunidade de IA e os usuários respondem às capacidades únicas do modelo e como os modelos futuros serão construídos sobre sua fundação.

Crédito da imagem em destaque: Estúdio DC / Freepik

Source: Reflection 70B é uma IA que pode corrigir seus próprios erros