O Thinking Machines Lab anunciou modelos de interação projetados para permitir processamento simultâneo de entradas e geração de respostas, marcando uma mudança na forma como a IA pode envolver os usuários. Esse recurso, denominado “full duplex”, permite que as interações se assemelhem a uma conversa telefônica, em vez de uma troca baseada em texto.
O modelo, TML-Interaction-Small, gera respostas em 0,40 segundos, refletindo a velocidade da conversa humana natural. A startup afirma que esse desempenho é significativamente mais rápido do que modelos comparáveis desenvolvidos pela OpenAI e Google.
Atualmente, o TML-Interaction-Small está em uma prévia de pesquisa e não está disponível ao público. Segundo a empresa, uma “prévia de pesquisa limitada” é esperada nos próximos meses, com um lançamento mais amplo planejado para o final do ano.
Apesar dos benchmarks impressionantes, permanece cepticismo sobre se a experiência do mundo real corresponderá às afirmações técnicas até que os utilizadores possam realizar testes reais. Mira Murati, ex-CTO da OpenAI e fundadora do Thinking Machines Lab, afirmou que a empresa pretende tornar a interatividade uma característica inerente aos modelos de IA.








