Crowdstrike e Meta revelaram o CyberSoceval, uma suíte de referência de código aberto projetado para avaliar o desempenho dos modelos de IA em Centros de Operações de Segurança (SOCs). Essa iniciativa visa ajudar as empresas a navegar na variedade de ferramentas de segurança cibernética movidas a IA, permitindo que eles selecionem soluções melhor alinhadas com seus requisitos específicos. O cenário de segurança cibernética está passando por uma transformação impulsionada pela inteligência artificial, que serve como uma ameaça potente e um mecanismo vital de defesa. À medida que a IA capacita os cibercriminosos com táticas avançadas-como a forçante bruta de senha automatizada-as organizações estão cada vez mais integrando a IA em suas estruturas de segurança para combater esses perigos em evolução. Essa dinâmica provocou uma corrida armamentista digital, remanescente da competição biológica dentro do sistema imunológico humano, onde os defensores devem se adaptar continuamente a patógenos cada vez mais sofisticados. O CyberSoceval aborda uma lacuna crítica no mercado, fornecendo testes padronizados para grandes modelos de idiomas (LLMS). O conjunto avalia modelos em tarefas essenciais de segurança cibernética, incluindo resposta a incidentes, compreensão da análise de ameaças e teste de malware. De acordo com o comunicado de imprensa da Crowdstrike, “sem benchmarks claros, é difícil saber quais sistemas, casos de uso e padrões de desempenho oferecem uma verdadeira vantagem de IA contra ataques do mundo real”. Essa falta de clareza há muito tempo complicou a tomada de decisões para os profissionais de segurança cibernética, pois as ferramentas variam amplamente em capacidades e custos. Ao formalizar avaliações para aplicações do mundo real, a CyberSoceval oferece às organizações uma visão transparente dos pontos fortes e fracos de cada modelo. Para os desenvolvedores de IA, a estrutura fornece informações mais profundas sobre os padrões de uso corporativo, potencialmente promovendo a criação de modelos mais adaptados e eficazes. Isso pode acelerar a inovação, garantindo que os sistemas de IA evoluam em conjunto com ameaças emergentes. Os benefícios da IA na segurança cibernética já são evidentes nas implantações práticas. Uma pesquisa recente da MasterCard e da Longitude do Financial Times revelou que inúmeras empresas de serviços financeiros economizaram milhões de dólares implementando ferramentas movidas a IA para combater a fraude habilitada para a AI. Essas economias enfatizam o retorno tangível do investimento, destacando como a IA não apenas mitiga os riscos, mas também aumenta a eficiência operacional em setores de alto risco. O envolvimento da Meta ressalta seu compromisso com os princípios de IA de código aberto. Ao contrário de modelos proprietários, como a série GPT da OpenAI, as alternativas de código aberto permitem aos desenvolvedores acesso livre aos pesos modelados e, em alguns casos, código-fonte. Essa acessibilidade promove melhorias rápidas orientadas pela comunidade. A parceria com a CrowdStrike exemplifica a estratégia da Meta para expandir os recursos de código aberto em segurança cibernética, disponibilizando ferramentas avançadas de avaliação para todos. Vincent Gonguet, diretor de produto da Genai na Divisão de Laboramentos de Superintelligência da Meta da Meta, enfatizou as implicações mais amplas em uma declaração: “Com esses benchmarks em vigor e aberto para a comunidade e a comunidade de IA para melhorar ainda mais, incluindo mais rapidamente como um setor para desbloquear o potencial da IA na proteção contra ataques avançados, incluindo AI, incluindo AI. As observações de Gonguet destacam o potencial colaborativo de tais iniciativas, posicionando o CyberSoceval como um catalisador para o progresso em todo o setor. O lançamento ocorre em um momento crucial, pois as empresas enfrentam pressão de montagem de ameaças cibernéticas de Mai-upmented projetadas para se intensificar em 2025. Os especialistas recomendam medidas proativas, como estruturas de teste robustas, para ficar à frente. A natureza de código aberto da Cybersocaval democratiza o acesso, capacitando organizações menores sem recursos extensos para avaliar e adotar ferramentas de ponta. A implementação prática é direta. O suíte de benchmark está disponível para download imediato no Github, com detalhes abrangentes e documentação acessíveis no site dedicado do projeto. Os primeiros adotantes podem começar a testar os LLMs imediatamente, contribuindo com o feedback para refinar ainda mais a estrutura.
Source: Crowdstrike e meta revelam o suíte de benchmark cibersocal





