Meta apresenta V-JEPA: solução orgânica para inteligência artificial

Meta IAs lançamento da arquitetura preditiva de incorporação conjunta de vídeo (V-JEPA) é um avanço no desenvolvimento da inteligência artificial e talvez em todo o nosso futuro.

Hoje pode realmente ser um ponto de viragem para a IA. Após o anúncio do Google do Gemini 1.5 Pro e do Sora da OpenAI, outro gigante da tecnologia lançou uma bomba.

Inspirado no trabalho pioneiro de Yann LeCun, o V-JEPA dá um salto ousado em direção a máquinas que podem aprender e compreender o mundo ao seu redor com uma intuitividade semelhante à humana.

Meta apresenta V-JEPA — **Meta se junta ao Google (Gemini 1.5 Pro) e OpenAI (Sora) na corrida para avançar a inteligência artificial** (Crédito da imagem)

Como o Meta V-JEPA reflete a aprendizagem humana?

Assim como uma criança aprende por meio da observação, captando passivamente imagens e sons para decifrar padrões e relacionamentos, o V-JEPA absorve informações de vídeos. No entanto, em vez de focar em pixels individuais, ele usa algoritmos avançados para analisar vídeos em um nível conceitual mais elevado. Procura compreender as relações entre objetos, o fluxo de eventos e as regras subjacentes que regem as interações físicas.

O que torna o V-JEPA tão único é a sua natureza preditiva. O modelo é treinado exibindo vídeos com seções cuidadosamente mascaradas. A tarefa do novo modelo é não apenas prever a informação visual que falta, mas também inferir os conceitos abstratos do que está acontecendo na cena. Isto força o modelo a desenvolver uma forte representação interna de um modelo virtual do mundo que observa.

Hoje estamos lançando o V-JEPA, um método para ensinar máquinas a compreender e modelar o mundo físico assistindo a vídeos. Este trabalho é mais um passo importante para @ylecunA visão delineada de modelos de IA que usam uma compreensão aprendida do mundo para planejar, raciocinar e… pic.twitter.com/5i6uNeFwJp
– IA na Meta (@AIatMeta) 15 de fevereiro de 2024

Eficiência e adaptabilidade são iguais a inovação

As principais inovações do V-JEPA residem na forma como aprende e como aplica o seu conhecimento:

Aprendizagem auto-supervisionada: pode ser treinado em grandes quantidades de dados de vídeo não rotulados. Não requer exemplos artesanais, reduzindo o custo e o tempo necessários para alcançar resultados impressionantes
Previsão seletiva: Projetado para ignorar detalhes menos relevantes e focar no panorama geral, levando a uma eficiência notável em comparação com modelos tradicionais de IA
Adaptabilidade notável: após o treinamento inicial, ele pode ser rapidamente ajustado em uma pequena quantidade de dados rotulados para realizar tarefas específicas. Isso abre a porta para sistemas de IA altamente flexíveis que podem aprender e melhorar continuamente

O novo modelo se destaca pela capacidade de desenvolver uma compreensão complexa de eventos visuais complexos. O V-JEPA pode dissecar interações complexas entre vários objetos, mesmo quando as ações são sutis ou ocorrem durante longos períodos. Isto pode ser vital para tarefas como análise detalhada de vídeo ou manipulação robótica.

Ao compreender o que está acontecendo em uma cena, o V-JEPA constrói uma base de conhecimento poderosa para a resolução de problemas do mundo real. Esta consciência contextual poderá revolucionar as tecnologias de apoio e os agentes de IA.

Quem é Yann LeCun?

Yann LeCun é um gigante no mundo da ciência da computação e da inteligência artificial. Ele é amplamente reconhecido como um dos fundadores do aprendizado profundo, especialmente por seu trabalho inovador em redes neurais convolucionais (CNNs). As CNNs mudaram completamente a forma como as máquinas veem o mundo, impulsionando grandes avanços na visão computacional, no reconhecimento de imagens e em inúmeras aplicações, como carros autônomos e diagnósticos médicos. A influência de LeCun vai além do aprendizado profundo, moldando abordagens mais amplas de aprendizado de máquina com sua pesquisa contínua em áreas como aprendizado por reforço e aprendizado não supervisionado.

Atualmente, LeCun ocupa o prestigiado cargo de vice-presidente e cientista-chefe de IA da Meta (antigo Facebook). Lá, ele orienta uma equipe de pesquisadores de IA de alto nível que estão explorando as próximas fronteiras da tecnologia para os produtos e serviços da Meta. As raízes acadêmicas de LeCun permanecem fortes, pois ele também atua como Professor Prata na Universidade de Nova York. Nesta função, ele orienta e inspira a próxima geração de inovadores em IA.

As notáveis contribuições de LeCun para a área não passaram despercebidas. Em 2018, ele dividiu o Prêmio ACM AM Turing com Geoffrey Hinton e Yoshua Bengio. Este prémio, muitas vezes chamado de “Prémio Nobel da Computação”, é a mais alta honraria na ciência da computação e reflete o impacto transformador da sua investigação em aprendizagem profunda.

Crédito da imagem em destaque: meta.

Source: Meta apresenta V-JEPA: solução orgânica para inteligência artificial