Google Gemini está se preparando para competir com GPT-4o

A corrida pela supremacia da inteligência artificial (IA) está esquentando entre Gemini e ChatGPT, com gigantes da tecnologia competindo para desenvolver os modelos de IA mais poderosos e versáteis.

Após a impressionante revelação do GPT-4o da OpenAI, o Google entrou na corrida da IA com uma demonstração cativante de seu próprio protótipo para seu imensamente popular chatbot, Gemini.

Um vídeo de Conta X do Google apresentou um telefone Pixel rodando Gemini analisando imagens ao vivo, provavelmente filmadas durante os preparativos para o próxima conferência de desenvolvedores do Google I/O.

A demonstração revela as proezas de conversação de Gêmeos

No vídeo apresentado, por meio de comandos falados, o usuário questiona a IA sobre a atividade na tela. A resposta de Gêmeos, pronunciada com uma voz natural, demonstra uma compreensão do contexto visual. Identifica corretamente a construção do palco como preparação para um grande evento. Quando questionado sobre a exibição de letras em uma tela, Gemini as reconhece como sinalização do Google I/O e oferece uma breve descrição do evento.

Semelhante à recente demonstração ChatGPT da OpenAI, o vídeo Gemini do Google é notável pelo fluxo natural da conversa. A interação do usuário parece quase humana, com as respostas de Gemini refletindo o ritmo de um diálogo amigável.

Mais um dia até #GoogleIO! Estamos sentindo . Vejo você amanhã para as últimas notícias sobre IA, Pesquisa e muito mais. pic.twitter.com/QiS1G8GBf9
– Google (@Google) 13 de maio de 2024

Esta abordagem conversacional é um afastamento significativo das interações muitas vezes afetadas experimentadas com modelos anteriores de IA. A capacidade de se envolver em trocas, esclarecendo informações e adaptando respostas com base nas consultas dos usuários, abre caminho para uma experiência de IA mais intuitiva e fácil de usar.

E parece que mais uma vez a inovação nascerá da competição: Gemini vs ChatGPT.

A consciência do contexto é a mina de ouro aqui

Embora a demonstração tenha se concentrado em um cenário alegre, as aplicações potenciais do Gemini vão muito além dos fins de entretenimento. A capacidade de analisar informações visuais em tempo real pode ser uma virada de jogo em vários campos.

Imagine um médico usando o Gemini durante uma consulta com um paciente, onde a IA pode analisar instantaneamente imagens médicas e fornecer insights ou diagnósticos potenciais. Na esfera educacional, os alunos podem utilizar o Gemini para aprimorar sua experiência de aprendizagem, fazendo com que a IA analise objetos, experimentos ou artefatos históricos em tempo real, promovendo uma compreensão mais profunda do assunto.

O protótipo ainda está em construção e todas as suas capacidades ainda não foram totalmente reveladas. No entanto, a demonstração oferece uma visão promissora do futuro da interação com IA. Ao combinar o processamento de linguagem natural com a análise de vídeo em tempo real, o Gemini tem o potencial de mudar e melhorar a forma como interagimos com a informação e o mundo que nos rodeia, tal como o GPT-4o da OpenAI.

Então, quando teremos mais detalhes? O evento Google I/O começará esta noite às 10h PT / 13h ET então fique ligado e continue nos lendo para testemunhar o futuro da tecnologia.

Crédito da imagem em destaque: Solen Feyissa/Remover respingo

Source: Google Gemini está se preparando para competir com GPT-4o