Um capítulo se encerra com o lançamento do GPT-4o mini pela OpenAI. Algumas IAs se tornaram obsoletas, embora tenham sido lançadas recentemente. Este novo modelo substituirá o amplamente usado e gratuito ChatGPT 3.5. O GPT-4o mini, que é mais eficiente e economiza energia do que o modelo antigo, é considerado muito mais inteligente do que seu antecessor. Na transição do modelo que estamos acostumados para o GPT-4o mini, os usuários podem esperar novos recursos e o GPT-4o mini é totalmente gratuito.
Para entender completamente a importância dessa mudança, precisamos olhar para a jornada do ChatGPT 3.5. Lançado em 2022, o ChatGPT 3.5 rapidamente se tornou um nome familiar, cativando usuários com sua capacidade de gerar texto semelhante ao humano, responder perguntas e auxiliar em várias tarefas. Ele se tornou amplamente usado por indivíduos e empresas. Ele até serviu como uma ferramenta poderosa para criação de conteúdo, resolução de problemas e recuperação de informações gerais. Nos últimos anos, no entanto, outras IAs lançadas gratuitamente ultrapassaram o ChatGPT 3.5.
O que o GPT-4o mini pode fazer?
O GPT-4o mini vem com uma série de melhorias que naturalmente o diferenciam de seu antecessor, caso contrário, seria ilógico. Uma das melhorias mais notáveis é a capacidade de executar processamento de texto e imagem. Essa nova capacidade dupla permite que o modelo processe e entenda informações de várias fontes, resultando potencialmente em uma saída mais abrangente e precisa.
As capacidades do modelo foram testadas com vários benchmarks. No benchmark MMLU (Massive Multitask Language Understanding), que mede o raciocínio em uma ampla gama de tópicos, o GPT-4o mini alcançou uma pontuação de 82%. De acordo com esses resultados, o novo modelo da OpenAI supera outros pequenos modelos de IA no mercado. Faremos benchmarks em nossa própria família. E, claro, depende de você.
Outra área em que o GPT-4o mini é dito brilhar é o raciocínio matemático. O modelo marcou impressionantes 87% no benchmark MGSM (Mathematics Grade School Merge). Isso significa que nosso novo amigo pode escrever códigos lindos, resolver problemas de lógica ou ajudar você com tarefas de casa complexas.
Em termos de aplicações práticas, o GPT-4o mini suporta texto e imagem em sua API. Isso significa que você pode integrar o aplicativo em outras mídias em vez de apenas usá-lo em um site. A OpenAI também não para por aí, anunciando planos para estender as capacidades do modelo para incluir processamento de vídeo e áudio no futuro, expandindo ainda mais seus potenciais casos de uso.
Especificações do GPT-4o mini
Do ponto de vista técnico, o GPT-4o mini tenta representar um equilíbrio entre desempenho e eficiência. A OpenAI não revelou o tamanho exato do modelo, mas diz que ele está no mesmo nível de outros modelos pequenos de IA, como Llama 3 8b, Claude Haiku e Gemini 1.5 Flash. Quer dizer, o que mais seria, afinal?
Uma das vantagens mais importantes do GPT-4o mini é sua velocidade. Como você sabe, no modelo ChatGPT 3.5, as respostas às vezes levam até 20 segundos, agora elas levarão até 10 segundos. De acordo com os testes iniciais, o modelo tem uma taxa de transferência média de 202 moedas por segundo. Isso é mais que o dobro da velocidade do GPT-4o e do GPT-3.5 Turbo, tornando-o particularmente adequado para aplicações onde tempos de resposta rápidos são cruciais.
A janela de contexto do modelo é outro recurso técnico importante. O GPT-4o mini pode processar até 128.000 moedas por vez. Isso é equivalente ao tamanho de um livro médio. Essa grande janela de contexto permite que o modelo mantenha consistência e relevância em interações longas ou ao lidar com documentos longos.
O GPT-4o mini contém informações e dados até outubro de 2023. Esses dados podem ser atualizados com atualizações. Mas, por enquanto, você pode não obter respostas eficientes para um evento ou desenvolvimento após essa data.
É muito longo?
- Suporta processamento de texto e imagem
- Pontuação de referência MMLU: 82%
- Pontuação de referência MGSM: 87%
- A API suporta entrada de texto e visão
- Tamanho comparável a outros pequenos modelos de IA (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Velocidade média de saída: 202 tokens por segundo
- Janela de contexto: 128.000 tokens
- Limite de conhecimento: outubro de 2023
- Tempo de resposta de até 10 segundos
E quanto ao preço do GPT-4o mini?
Os preços da API ainda não foram anunciados, mas a OpenAI definiu o preço do modelo em 15 centavos por milhão de tokens de entrada e 60 centavos por milhão de tokens de saída para desenvolvedores usando suas APIs. Essa estrutura de preços torna o GPT-4o mini mais acessível do que seus predecessores e a OpenAI afirma que ele é 60% mais barato do que o GPT-3.5 Turbo.
O custo reduzido de execução do GPT-4o mini pode ter implicações de longo alcance para a acessibilidade da IA. Ao disponibilizar recursos avançados de IA a um preço mais baixo, a OpenAI está potencialmente abrindo a porta para uma adoção mais ampla da tecnologia de IA em uma variedade de indústrias e regiões.
A eficiência e a acessibilidade do modelo o tornam particularmente atraente para tarefas simples e de alto volume que exigem chamadas repetidas de modelo de IA. Isso pode ser particularmente benéfico para pequenas e médias empresas ou desenvolvedores trabalhando em projetos com orçamentos limitados.
GPT-4o mini vs outros modelos líderes
Para entender melhor o novo modelo, vamos fazer uma comparação técnica com outros modelos:
Modelo | Precisão (%) | MLLU | GPQA | DERRUBAR | MGSM | MATEMÁTICA | Avaliação Humana | MMU | MathVista |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70,2 | 87,2 | 59,4 | 56,7 | 63,8 |
Flash de Gêmeos | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58,4 | 0,0 |
Claude Haiku | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50,2 | 46,4 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70,2 | 56,3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69,1 | 0,0 | 0,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
GPT-4 Turbo | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
Gêmeos | 85,0 | 50,0 | 80,0 | 88,0 | 72,0 | 88,5 | 65,0 | 55,0 | 60,0 |
Gêmeos Avançado | 87,0 | 52,0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
- MMLU (Entendimento massivo de linguagem multitarefa): Um benchmark abrangente para avaliar modelos de linguagem em uma ampla gama de tarefas em diferentes domínios.
- GPQA (resposta a perguntas de uso geral): Uma referência para testar a capacidade de um modelo de responder a perguntas de conhecimento geral com precisão.
- DROP (Raciocínio discreto sobre parágrafos): Um benchmark de compreensão de leitura que requer modelos para realizar operações discretas como adição e subtração sobre texto.
- MGSM (matemática multietapas): Uma referência para avaliar a capacidade de um modelo de resolver problemas matemáticos de várias etapas.
- MATEMÁTICA: Um benchmark focado especificamente na avaliação das habilidades de resolução de problemas matemáticos de modelos de linguagem.
- Avaliação Humana: Um benchmark para avaliar a geração de código, onde os modelos são avaliados com base em sua capacidade de gerar código correto e funcional a partir de declarações de problemas.
- MMMU (Entendimento de Máquina Multimodal): Um benchmark que testa a capacidade de um modelo de entender e integrar informações de diversas modalidades, como texto, imagens e áudio.
- MathVista: Um benchmark específico projetado para avaliar o raciocínio matemático e as habilidades de resolução de problemas de modelos de linguagem em diversas disciplinas matemáticas.
No final das contas, o “melhor” modelo depende de suas necessidades. O GPT-4o mini oferece uma mistura impressionante de capacidades em um pacote mais compacto, tornando-o uma escolha atraente para muitos usuários.
Crédito da imagem em destaque: IA aberta
Source: O ChatGPT 3.5 está sendo substituído pelo GPT-4o mini