OpenAI planeja lançamento em janeiro para operador autônomo de ferramenta de IA

A OpenAI pode estar prestes a lançar sua ferramenta de IA, Operator, que pode assumir o controle de PCs para realizar tarefas de forma autônoma. Os relatórios sugerem uma data de lançamento prevista para janeiro.

Detalhes sobre a ferramenta Operador da OpenAI

Tibor Blaho, um engenheiro de software conhecido por vazar informações com precisão sobre os próximos produtos de IA, teria supostamente encontrado evidência da tão esperada ferramenta Operador. Bloomberg e outras publicações discutiram anteriormente o Operator como um sistema “agentico” capaz de lidar com tarefas como escrever código e reservar viagens.

De acordo com The Information, a OpenAI pretende lançar o Operator em janeiro. As descobertas recentes de Blaho, incluindo o código, reforçam esta linha do tempo.

O cliente ChatGPT para macOS recebeu atualizações, que incluem opções ocultas para definir atalhos para “Toggle Operator” e “Force Quit Operator”, conforme relatado por Blaho. Além disso, foram observadas referências ao Operador no site da OpenAI, embora ainda não estejam visíveis ao público.

Blaho também observou que o site da OpenAI apresenta tabelas comparando o desempenho do Operador com outros sistemas de IA que usam computadores, que podem ser espaços reservados. Se os dados nessas tabelas forem precisos, eles indicam que o Operador tem problemas de confiabilidade, variando de acordo com a tarefa.

Em benchmarks conduzidos pela OSWorld, denominado “OpenAI Computer Use Agent (CUA)” – presumivelmente o modelo que suporta o Operador – obteve pontuação de 38,1%. Embora esta pontuação exceda a do modelo de controle de computador da Anthropic, ela permanece significativamente abaixo da pontuação humana de 72,4%. O OpenAI CUA supera o desempenho humano no WebVoyager, um benchmark que avalia as habilidades de navegação de sites de IA, mas não atinge pontuações de nível humano em outro benchmark, o WebArena, de acordo com os dados vazados.

OpenAI planeja lançamento em janeiro para operador autônomo de ferramenta de IA — Imagem: Tibor Blaho

Operador tem demonstrado desafios na execução de tarefas que os humanos podem executar facilmente. Em um teste envolvendo a assinatura de um provedor de nuvem e o lançamento de uma máquina virtual, a Operator teve sucesso em apenas 60% das vezes. Em outra tarefa de criação de uma carteira Bitcoin, a Operadora só obteve sucesso em 10% das vezes, com base nas informações vazadas.

A introdução iminente do Operador pela OpenAI se alinha aos esforços de concorrentes como Anthropic e Google, que também estão investindo em agentes de IA. Apesar dos riscos e da natureza especulativa dos agentes de IA, os gigantes da tecnologia promovem-nos como o futuro da tecnologia de IA. Markets and Markets, uma empresa de análise, prevê que o mercado de agentes de IA poderá atingir uma avaliação de US$ 47,1 bilhões até 2030.

Os atuais agentes de IA são considerados primitivos, mas existem preocupações quanto à segurança caso a tecnologia avance rapidamente. Um gráfico vazado indica que a Operadora teve um bom desempenho em avaliações de segurança específicas, incluindo testes projetados para dissuadi-la de executar “atividades ilícitas” ou de pesquisar “dados pessoais confidenciais”. O foco na segurança é apontado como um fator que contribui para o prolongado ciclo de desenvolvimento da Operadora.

Em uma postagem recente no X, o cofundador da OpenAI, Wojciech Zaremba, criticou a Anthropic por lançar um agente que supostamente carece de mitigações de segurança, afirmando: “Só posso imaginar as reações negativas se a OpenAI fizesse um lançamento semelhante”.

A OpenAI tem enfrentado críticas de pesquisadores de IA, incluindo ex-funcionários, por supostamente priorizar o lançamento rápido de produtos em detrimento de considerações de segurança.

Crédito da imagem em destaque: Tibor Blahó

O posto OpenAI planeja lançamento em janeiro para operador autônomo de ferramenta de IA apareceu pela primeira vez em TechBriefly.

Source: OpenAI planeja lançamento em janeiro para operador autônomo de ferramenta de IA