A Anthropic lançou o Claude Haiku 4.5, um modelo “pequeno” com latência otimizada e desempenho de codificação semelhante ao Claude Sonnet 4. A empresa relata que o Haiku 4.5 roda duas vezes mais rápido que o Sonnet 4, com um terço do custo. Ele está disponível imediatamente por meio da API da Anthropic e em catálogos de parceiros no Amazon Bedrock e Google Cloud Vertex AI. O preço do Haiku 4.5 é definido em US$ 1 por milhão de tokens de entrada e US$ 5 por milhão de tokens de saída. Para cache imediato, as taxas listadas são de US$ 1,25 por milhão de tokens de gravação e US$ 0,10 por milhão de tokens de leitura. A Anthropic posiciona o Haiku 4.5 para cargas de trabalho com orçamentos de latência apertados e alto rendimento, incluindo assistentes em tempo real, automações de suporte ao cliente e programação em pares. A empresa o sugere como um substituto imediato para o Haiku 3.5 e o Sonnet 4 em cargas de trabalho interativas e sensíveis ao custo. Ele supostamente supera o Sonnet 4 em tarefas de “uso do computador” envolvendo GUI e manipulação do navegador, como visto em produtos como Claude for Chrome. Também melhora a capacidade de resposta no Claude Code para projetos multiagentes e prototipagem rápida. Dentro da linha de modelos da Anthropic, o Sonnet 4.5 continua sendo o modelo de fronteira da empresa, que descreve como “o melhor modelo de codificação do mundo”. O Haiku 4.5 está posicionado para oferecer desempenho próximo da fronteira com maior eficiência de custos. A Anthropic recomenda um padrão de orquestração onde o Sonnet 4.5 lida com o planejamento em várias etapas, com um grupo de trabalhadores do Haiku 4.5 gerenciando a execução paralelizada. Os desenvolvedores podem acessar o modelo na API da Anthropic usando o identificador claude-haiku-4-5. Embora a Anthropic tenha confirmado sua disponibilidade no Amazon Bedrock e no Google Cloud Vertex AI no lançamento, a empresa observa que os IDs de catálogo de modelos específicos e a cobertura regional podem mudar com o tempo. A Antrópica forneceu resultados de benchmark para demonstrar as capacidades do modelo. No SWE-bench Verified, o Haiku 4.5 alcançou uma pontuação de 73,3% usando um andaime simples com bash e ferramentas de edição de arquivos. A média desse resultado foi calculada em 50 testes com um orçamento de pensamento de 128 mil e sem cálculo de tempo de teste. A empresa também compartilhou os resultados do Terminal-Bench, testado com um agente Terminus-2 em 11 execuções, e do OSWorld-Verified, testado com um máximo de 100 etapas em quatro execuções. O desempenho em AIME e MMMLU também foi medido usando amostragem padrão e orçamentos de pensamento de 128K. A empresa afirmou que esses resultados mostram paridade de codificação com o Sonnet 4 e ganhos de desempenho em tarefas de uso de computador sob estruturas de teste específicas. Ele aconselha os usuários a replicar testes com sua própria orquestração e pilhas de ferramentas antes de generalizar o desempenho. O modelo é lançado sob a licença ASL-2. Em testes internos, a Anthropic relata que o Haiku 4.5 teve uma taxa de desalinhamento medida mais baixa do que o Sonnet 4.5 e o Opus 4.1.




