A pegada de carbono dos modelos de raciocínio de IA varia muito

Um estudo recente publicado em Fronteiras na comunicação lançou uma luz crítica sobre o impacto ambiental da inteligência artificial, revelando que nem todos os avisos de IA são criados iguais quando se trata de emissões de carbono. A pesquisa destaca que “modelos de raciocínio” mais complexos em grandes modelos de linguagem (LLMs) podem gerar significativamente mais CO₂ do que seus colegas “concisos”, provocando preocupações entre pesquisadores e defensores climáticos sobre as crescentes demandas de energia da IA.

O estudo, que avaliou meticulosamente 14 LLMs diferentes usando um conjunto padronizado de 500 questões em diversas áreas, encontrou uma correlação direta entre o número de “tokens de pensamento” gerados por um modelo por consulta e suas emissões de COI associadas. A Maximilian Dauner, um estudante de doutorado da Universidade de Ciências Aplicadas de Hochschule München e principal autor do artigo, enfatizou que “o impacto ambiental do interrogatório LLMs treinado é fortemente determinado por sua abordagem de raciocínio, com processos de raciocínio explícitos significativamente aumentando o consumo de energia e as emissões de carbono”.

Especificamente, as descobertas indicam que os modelos de raciocínio, que possuem conjuntos de treinamento maiores e exigem mais tempo de processamento, produziram resultados de CO₂ substancialmente mais altos. Em alguns casos, esses modelos sofisticados geraram até 50 vezes as emissões de modelos concisos. Essa disparidade é ainda mais exacerbada pela complexidade das perguntas colocadas; Consultas abertas ou intrincadas, como as que envolvem álgebra avançada ou conceitos filosóficos, resultaram em uma pegada de carbono maior em comparação com avisos mais simples, como questões de história do ensino médio.

Os modelos de raciocínio, às vezes chamados de “modelos de pensamento”, são otimizados para combater tarefas complexas que exigem lógica, quebras passo a passo ou instruções detalhadas. Esses modelos, exemplificados por versões como o GPT-4O e O1/O3-mini da OpenAI, empregam o que os pesquisadores da LLM terminam o processamento de “cadeia de pensamentos”. Isso permite que eles respondam mais deliberadamente e geram mais respostas do tipo humano, embora com o trade-off do aumento do tempo de processamento e, consequentemente, maior consumo de energia. Por outro lado, os modelos generalizados priorizam a velocidade e a clareza para tarefas mais diretas.

Os pesquisadores conduziram seus testes em duas fases: inicialmente com perguntas de múltipla escolha, seguidas de avisos de resposta livre. Em média, os modelos de raciocínio geraram surpreendentes 543,5 tokens por pergunta, um forte contraste com os meros 37,7 tokens produzidos por modelos concisos. Por exemplo, “COGITO”, identificado como o modelo de raciocínio mais preciso examinado, produziu três vezes mais CO₂ do que os modelos de tamanho semelhante otimizados para respostas concisas. O artigo afirma explicitamente que “de uma perspectiva ambiental, os modelos de raciocínio exibiram consistentemente emissões mais altas, impulsionadas principalmente por sua produção de token elevada”.

Embora a diferença de emissões por prompt individual possa parecer marginal, o efeito cumulativo em escala é significativo. O estudo projeta que fazer as perguntas do Modelo R1 de Deepseek geraria aproximadamente a mesma quantidade de CO₂ que um voo de ida e volta de Londres para Nova York. Em comparação, o modelo QWEN 2.5 não raciocínio pode responder três vezes mais perguntas antes de atingir um nível de emissão equivalente. Isso destaca uma troca crítica entre a precisão do LLM e a sustentabilidade ambiental, à medida que “à medida que o tamanho do modelo aumenta, a precisão tende a melhorar”, mas “esse ganho também está ligado ao crescimento substancial nas emissões de COP e no número de tokens gerados”.

Essas descobertas emergem em meio a uma concorrência global feroz entre os gigantes da tecnologia para desenvolver modelos de IA cada vez mais avançados. A crescente demanda por infraestrutura orientada a IA está pronta para colocar uma tensão considerável nas grades de energia existentes. No ano passado, a Apple anunciou planos de investir US $ 500 bilhões em fabricação e data centers nos próximos quatro anos. Da mesma forma, o Project Stargate, uma iniciativa colaborativa que envolve o OpenAI, Softbank e Oracle, prometeu um equivalente a US $ 500 bilhões em relação aos data centers focados em IA. Um relatório recente na revisão da tecnologia do MIT indica que, desde 2017, os data centers incorporam cada vez mais hardware intensivo em energia projetado especificamente para cálculos complexos de IA, levando a um aumento no consumo de energia.

O Instituto de Pesquisa em Energia Elétrica (EPRI) estima que os data centers que apoiam os modelos avançados de IA podem representar até 9,1 % da demanda total de energia dos Estados Unidos até o final da década, um aumento significativo de aproximadamente 4,4 % hoje. Para atender a essa crescente demanda de energia, as principais empresas de tecnologia estão explorando diversas estratégias de geração de energia. Meta, Google e Microsoft forçaram parcerias com usinas nucleares. Notavelmente, a Microsoft assinou um acordo de 20 anos para obter energia das instalações nucleares de três milhas da Ilha na Pensilvânia para alimentar sua crescente frota de data center. A Meta também está fazendo investimentos substanciais em tecnologia geotérmica, enquanto o CEO da OpenAI, Sam Altman, está investindo em fusão nuclear experimental, reconhecendo que a próxima era da IA exigirá uma “inovação energética”. Apesar desses esforços, pesquisas recentes sugerem que é quase certo que mais combustíveis fósseis, particularmente o gás natural, serão obrigados a atender totalmente aos requisitos de energia da IA.

No entanto, os pesquisadores acreditam que suas descobertas podem capacitar os usuários todos os dias da IA a mitigar seu impacto no carbono. Ao entender a intensidade energética significativamente mais alta dos modelos de raciocínio, os usuários podem optar por usá -los de maneira mais moderna, confiando em modelos concisos para tarefas diárias gerais, como pesquisas na web e resposta básica de perguntas. Dauner enfatizou esse ponto, afirmando: “Se os usuários souberem o custo exato de suas saídas geradas pela IA, como se transformar casualmente em uma figura de ação, eles podem ser mais seletivos e atenciosos sobre quando e como eles usam essas tecnologias”. Esse comportamento proativo do usuário, juntamente com os avanços contínuos no design da IA com eficiência energética, será crucial na navegação dos desafios ambientais apresentados pela rápida expansão da inteligência artificial.

Source: A pegada de carbono dos modelos de raciocínio de IA varia muito

A pegada de carbono dos modelos de raciocínio de IA varia muito

Related Stories

Meta atualiza óculos AI para desativar câmeras se o LED de privacidade for adulterado

Samsung revelará novos dobráveis ​​em 22 de julho Galaxy Unpacked em Londres

Discord corrige bug que baniu injustamente milhares de usuários por falha de imagem

Google revelará nova linha de Pixel no evento noturno de 12 de agosto

Samsung revelará novos dobráveis em 22 de julho Galaxy Unpacked em Londres