Meta AI: Neste post explicaremos o que é o lhama 2 e como utilizá-lo. A Meta revelou seu mais recente modelo de linguagem grande Llama 2 (LLM), que em testes superou outros modelos de chat de código aberto (incluindo GPT) na maioria dos benchmarks, incluindo utilidade e segurança.
Além de publicar três modelos alternativos como parte do novo lançamento – um treinado em 7 bilhões de parâmetros, um em 13 bilhões e, finalmente, uma versão de 70 bilhões – a Meta AI também está disponibilizando o “Llama 2 Chat”, uma variante mais refinada projetado exclusivamente para casos de uso de conversação.
Esta é uma conquista tecnológica por si só, mas o mais intrigante é que a Meta e a Microsoft também anunciaram um fortalecimento de sua colaboração, permitindo que os desenvolvedores que usam ferramentas da Microsoft selecionem entre os modelos Llama da Meta e GPT da OpenAI ao criar experiências de IA.
Meta AI: O que é lhama 2?
A arquitetura transformadora do modelo de linguagem auto-regressiva Llama 2 foi otimizada. O uso comercial e acadêmico em inglês do Llama 2 é intencional. Ele vem em uma variedade de variantes pré-treinadas e ajustadas, bem como tamanhos de parâmetros que variam de 7 bilhões a 70 bilhões.
De acordo com a Meta, as versões ajustadas se adaptam às preferências humanas de segurança e utilidade por meio de ajuste fino supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF). 2 trilhões de tokens de dados de fontes publicamente acessíveis foram usados para pré-treinar o Llama 2.
Embora os modelos pré-treinados possam ser modificados para uma variedade de tarefas de geração de linguagem natural, os modelos personalizados são projetados para conversas semelhantes a assistentes. Seja qual for o modelo que um desenvolvedor escolher, a orientação de uso responsável da Meta AI pode ajudar a direcionar qualquer ajuste adicional que possa ser necessário para adaptar e otimizar os modelos com as mitigações de segurança adequadas.
Como usar o lhama 2?
Há excelentes notícias se você quiser jogar o Llama 2 da Meta AI por conta própria. Huggingface tem uma versão de demonstração facilmente disponível. Basta aderir a estas etapas fáceis:
- Visite esta página.
- Quando você chegar ao site, role para baixo até ver uma seção marcada como “Demo”.
- Há uma caixa de bate-papo lá. Digite uma mensagem nele agora.
- Para enviar sua mensagem, aperte enter.
Por meio do SageMaker JumpStart na interface do usuário do SageMaker Studio e do SageMaker Python SDK, você pode acessar os modelos de base. Discutimos a localização de modelos no SageMaker Studio nesta seção.
Um ambiente de desenvolvimento integrado (IDE) chamado SageMaker Studio oferece uma única interface visual baseada na Web por meio da qual você pode acessar ferramentas criadas especificamente para realizar todas as tarefas de desenvolvimento de ML, desde a coleta de dados até a criação, teste e implantação de seus modelos de ML. Referir-se Amazon SageMaker Studio para obter mais informações sobre como instalar e configurar o SageMaker Studio.
Uma vez no SageMaker Studio, clique em Prebuilt and Automated Solutions para acessar o SageMaker JumpStart, que inclui modelos pré-treinados, notebooks e soluções pré-criadas.
Você pode pesquisar soluções, modelos, blocos de anotações e outros recursos na página inicial do SageMaker JumpStart. No carrossel Foundation Models: Text Generation, há dois modelos proeminentes do Llama 2 para escolher. Atualize sua versão do SageMaker Studio parando e retomando-a se não conseguir ver os modelos Llama 2. Consulte Desligar e atualizar aplicativos do Studio para obter detalhes adicionais sobre atualizações de versão.
Ao selecionar Explorar todos os modelos de geração de texto ou digitar “llama” na caixa de pesquisa, você também pode localizar as quatro variações de modelo restantes.
Para ler as informações sobre o modelo, incluindo seu licenciamento, os dados de treinamento usados e as instruções de uso, escolha o cartão do modelo. Implantar e Abrir Notebook são mais dois botões que auxiliam na utilização do modelo.
Você deve reconhecer o contrato de licenciamento do usuário final e a política de uso aceitável em um pop-up ao selecionar um dos botões.
Você passará para a próxima fase para utilizar o modelo após reconhecê-lo.
O exemplo a seguir demonstra como empregar modelos Llama com aprendizado no contexto de poucas tomadas, dando ao modelo acesso aos dados de treinamento. Lembre-se de que apenas tiramos conclusões do modelo que foi implantado e que os pesos do modelo permanecem constantes o tempo todo.
Entrada: Traduzir inglês para francês:
lontra marinha => loutre de mer
hortelã-pimenta => menthe poivrée
girafa de pelúcia => pelúcia girafa
queijo =>Saída:
fromage
chocolate => achocolatado
carro => voiture
hamster => hamster
cerveja => biere
bicicleta => bicicleta
banana => banana
morango => fraise
pizza => pizza
cheeseburger => cheeseburguer
abacaxi => ananás
cenoura => carote
melancia => pastèque
baleia => baleine
berinjela => berinjela
gato => conversar
pinguim => manchot
leão => leão
elefante => elefante
panda => panda
tigre => tigre
salmão => saumon
esquilo => écureuil
canguru => canguru
tartaruga => tortura
polvo => polvo
sapo => grenouille
porco => cochon
peixinho => poisson rouge
tubarão tigre => requin tigre
gorila => gorila
boneca
Meta AI
A disponibilidade do Llama 2 no IA do Azure biblioteca de modelos foi revelada por Microsoft em sua conferência Microsoft Inspire. Agora, os programadores podem usá-lo para criar. Além disso, ele foi projetado para operar localmente no Windows para simplificar os fluxos de trabalho para desenvolvedores de IA. da AWS Amazon SageMaker O hub Jumpstart também oferece o Llama 2, e outros fornecedores o seguirão.
O lançamento de um ecossistema aberto entre a Microsoft e a Meta AI para estruturas de IA trocáveis também foi revelado. O padrão Open Neural Network Exchange (ONNX) para modelos de aprendizado profundo foi anunciado pela primeira vez em 2017 pela Meta AI (anteriormente Facebook), e foi quando o desenvolvimento começou.
Os dois prometeram encorajar o desenvolvimento da IA aberta, principalmente concedendo a mais empresas em todo o mundo acesso à tecnologia fundamental de IA.
De acordo com a Meta AI, os modelos Llama 2 foram submetidos a um processo de red-teaming, no qual os funcionários foram encarregados de identificar pontos fracos na arquitetura de segurança dos modelos e garantir sua segurança. Além disso, fontes externas foram usadas para criar “prompts adversários” para ajudar no ajuste fino do modelo.
O esquema de transparência no Artigo de Pesquisa detalhar o Llama 2 descreve as desvantagens do modelo e também como a Meta planeja lidar com elas no futuro. Os usuários do Llama 2 são obrigados a aderir a um “uso aceitável” política, que proíbe o uso do modelo para produzir códigos nocivos, permitir a transferência não autorizada de informações ou materiais para menores ou produzir conteúdo que promova o terrorismo. Você pode acessar o lista completa aqui.
Para incentivar os programadores a adotarem o modelo de linguagem “para resolver problemas difíceis”, a Meta lançou o Desafio de Impacto de Lhamacom mais informações a seguir.
Antes de sair, leia nosso artigo: 15 melhores ideias de IA de personagens para aproveitar melhor suas conversas
Crédito da imagem em destaque: Unsplash.
Source: Meta AI: O que é o lhama 2 e como usá-lo?