A corrida pela supremacia da inteligência artificial (IA) está esquentando entre Gemini e ChatGPT, com gigantes da tecnologia competindo para desenvolver os modelos de IA mais poderosos e versáteis.
Após a impressionante revelação do GPT-4o da OpenAI, o Google entrou na corrida da IA com uma demonstração cativante de seu próprio protótipo para seu imensamente popular chatbot, Gemini.
Um vídeo de Conta X do Google apresentou um telefone Pixel rodando Gemini analisando imagens ao vivo, provavelmente filmadas durante os preparativos para o próxima conferência de desenvolvedores do Google I/O.
A demonstração revela as proezas de conversação de Gêmeos
No vídeo apresentado, por meio de comandos falados, o usuário questiona a IA sobre a atividade na tela. A resposta de Gêmeos, pronunciada com uma voz natural, demonstra uma compreensão do contexto visual. Identifica corretamente a construção do palco como preparação para um grande evento. Quando questionado sobre a exibição de letras em uma tela, Gemini as reconhece como sinalização do Google I/O e oferece uma breve descrição do evento.
Semelhante à recente demonstração ChatGPT da OpenAI, o vídeo Gemini do Google é notável pelo fluxo natural da conversa. A interação do usuário parece quase humana, com as respostas de Gemini refletindo o ritmo de um diálogo amigável.
Mais um dia até #GoogleIO! Estamos sentindo
. Vejo você amanhã para as últimas notícias sobre IA, Pesquisa e muito mais. pic.twitter.com/QiS1G8GBf9
– Google (@Google) 13 de maio de 2024
Esta abordagem conversacional é um afastamento significativo das interações muitas vezes afetadas experimentadas com modelos anteriores de IA. A capacidade de se envolver em trocas, esclarecendo informações e adaptando respostas com base nas consultas dos usuários, abre caminho para uma experiência de IA mais intuitiva e fácil de usar.
E parece que mais uma vez a inovação nascerá da competição: Gemini vs ChatGPT.
A consciência do contexto é a mina de ouro aqui
Embora a demonstração tenha se concentrado em um cenário alegre, as aplicações potenciais do Gemini vão muito além dos fins de entretenimento. A capacidade de analisar informações visuais em tempo real pode ser uma virada de jogo em vários campos.
Imagine um médico usando o Gemini durante uma consulta com um paciente, onde a IA pode analisar instantaneamente imagens médicas e fornecer insights ou diagnósticos potenciais. Na esfera educacional, os alunos podem utilizar o Gemini para aprimorar sua experiência de aprendizagem, fazendo com que a IA analise objetos, experimentos ou artefatos históricos em tempo real, promovendo uma compreensão mais profunda do assunto.
O protótipo ainda está em construção e todas as suas capacidades ainda não foram totalmente reveladas. No entanto, a demonstração oferece uma visão promissora do futuro da interação com IA. Ao combinar o processamento de linguagem natural com a análise de vídeo em tempo real, o Gemini tem o potencial de mudar e melhorar a forma como interagimos com a informação e o mundo que nos rodeia, tal como o GPT-4o da OpenAI.
Então, quando teremos mais detalhes? O evento Google I/O começará esta noite às 10h PT / 13h ET então fique ligado e continue nos lendo para testemunhar o futuro da tecnologia.
Crédito da imagem em destaque: Solen Feyissa/Remover respingo
Source: Google Gemini está se preparando para competir com GPT-4o





. Vejo você amanhã para as últimas notícias sobre IA, Pesquisa e muito mais. 


