O Google tem lançado Gemini 2, um modelo sofisticado de IA que aprimora a capacidade dos usuários de interagir com a tecnologia. Este anúncio, feito durante um evento de imprensa, destaca as capacidades do Gemini 2 na execução de tarefas, habilidades de conversação e compreensão multimodal, representando um avanço significativo na tecnologia de IA.
Google lança Gemini 2: uma nova era para assistentes de IA
Demis Hassabis, CEO do Google DeepMind, observou que o Gemini 2 funciona como um assistente virtual capaz de “planejar e executar tarefas nos computadores de um usuário e na web”. O modelo visa ajudar os usuários a gerenciar várias atividades de maneira integrada, potencialmente abrindo caminho para a inteligência artificial geral (AGI), imitando funções cognitivas semelhantes às humanas. O CEO do Google, Sundar Pichai, enfatizou o compromisso da empresa em desenvolver “modelos agênticos” que possam compreender e agir no mundo de forma mais eficaz, indicando investimentos significativos feitos ao longo do último ano.
O Gemini 2 inclui funções “multimodais” melhoradas, que permitem à IA analisar áudio e vídeo de forma mais eficaz enquanto se envolve em conversas sofisticadas. Ao demonstrar estas capacidades, o Gemini 2 poderá redefinir a forma como a computação pessoal funciona, potencialmente poupando tempo através de tarefas automatizadas, como reserva de voos e gestão de documentos. No entanto, permanecem desafios em relação à capacidade da tecnologia de processar comandos abertos sem erros, o que pode levar a erros dispendiosos.
Agentes de IA especializados para codificação e ciência de dados também fazem parte da caixa de ferramentas do Gemini 2, permitindo aos usuários lidar com tarefas de programação complexas que estão além das capacidades dos modelos anteriores. Ao contrário das ferramentas de IA predominantes que se concentram na conclusão básica do código, esses agentes podem realizar tarefas abrangentes, como verificar o código em repositórios e facilitar a análise de dados.
Project Mariner: Nova abordagem à navegação web
Para mostrar os recursos do Gemini 2, o Google lançou o Project Mariner, uma extensão experimental do Chrome que auxilia os usuários na navegação na web. Numa demonstração recente, o agente de IA foi encarregado de planear uma refeição, navegando autonomamente até ao site de um supermercado, fazendo login e adicionando itens a um carrinho de compras, sugerindo mesmo substituições quando determinados itens não estavam disponíveis. Hassabis descreveu o Mariner como um protótipo de pesquisa que reimagina as interações do usuário com a IA, visando tarefas diárias.
O Gemini foi lançado inicialmente em dezembro de 2023 como parte da estratégia do Google para competir com o ChatGPT da OpenAI, que foi aclamado por sua utilidade em experiências assistidas por IA. Com a introdução do Gemini 2, o Google agora posiciona seu modelo tão capaz quanto as ofertas da OpenAI, com o objetivo de aprimorar a experiência de pesquisa por meio de funcionalidades orientadas por IA.
O Google também revelou a versão mais recente do Projeto Astra, uma iniciativa experimental que permite ao Gemini 2 interpretar o ambiente do usuário por meio de uma câmera de smartphone. Durante os testes, o Gemini 2 demonstrou sua habilidade em reconhecer garrafas de vinho, fornecendo informações geográficas, preços e características de sabor provenientes da web. Hassabis expressou o desejo de que o Astra evoluísse para um sistema de recomendação definitivo, capaz de vincular interesses em diferentes domínios para aprimorar as experiências do usuário.
O foco na memória do Gemini 2 permite que a IA retenha insights sobre as preferências do usuário, com o Google garantindo aos usuários que eles podem gerenciar seus dados, incluindo recursos de exclusão. Durante os testes com o Astra, a IA exibiu uma adaptabilidade impressionante ao manter o contexto de conversação enquanto respondia a interrupções.
Segurança e confiabilidade dos agentes de IA
À medida que a funcionalidade do Gemini 2 se expande, o Google enfatiza a importância de garantir segurança e confiabilidade. Embora os agentes se mostrem promissores, os riscos potenciais decorrem da forma como os utilizadores podem interagir com os sistemas e os dados que fornecem. O Project Mariner incorpora avisos que exigem a confirmação do usuário antes de executar ações confidenciais, protegendo assim contra transações não autorizadas.
O Google tem sido proativo na abordagem de questões de segurança, colaborando com especialistas internos e externos para avaliar os riscos associados ao uso de IA. Isto inclui explorar medidas para evitar o uso indevido da plataforma através de avisos ou instruções maliciosas, protegendo assim os utilizadores de ameaças potenciais, como fraude ou ataques de phishing.
O lançamento do Gemini 2 pelo Google marca um momento crucial no avanço da IA, à medida que a empresa continua a monitorar as experiências e o feedback do usuário. A jornada em direção à AGI se desenrola progressivamente a cada fase de desenvolvimento, destacando pesquisas em andamento que podem influenciar futuras iterações da tecnologia. À medida que as investigações sobre as interações e respostas dos usuários continuam, os próximos passos do Gemini 2 e seus projetos associados parecem ser monitorados de perto.
Créditos da imagem: Google
O post Gemini 2.0 do Google está aqui: Multimodal e poderoso apareceu pela primeira vez no TechBriefly.
Source: O Gemini 2.0 do Google está aqui: multimodal e poderoso