Em resposta à popularidade do Google Bard, do Bing Chat da Microsoft e do ChatGPT da OpenAI, os pesquisadores desenvolveram um novo modelo de IA com uma reviravolta um pouco mais sinistra: DarkBERT.
O DarkBERT foi treinado puramente usando dados da dark web, em oposição aos modelos de linguagem grande (LLMs) que alimentam ChatGPT e Google Bard, que foram treinados com dados da web aberta. Sim, você leu certo: dados de hackers, fraudadores e outros vigaristas foram usados para treinar esse novo modelo de IA.
Usando informações da rede Tor, que é frequentemente usada para acessar a dark web, um grupo de acadêmicos sul-coreanos criou o DarkBERT e publicou um artigo descrevendo seu método. Eles foram capazes de construir um banco de dados na dark web rastreando-o, filtrando os dados brutos e treinando o DarkBERT nele.
Inesperadamente, o DarkBERT já superou outros modelos substanciais de linguagem, apesar de ter sido treinado em dados de uma fonte muito improvável.
DarkBERT: O lado sombrio dos modelos de linguagem
Embora o DarkBERT seja um novo modelo de IA, ele é baseado no RoBERTa arquitetura, uma estratégia de IA estabelecida em 2019 por pesquisadores do Facebook.
É descrito como um “método otimizado de forma robusta para o pré-treinamento do processamento de linguagem natural (PNL) systems” em um trabalho de pesquisa da Meta AI que se baseia no BERT (Representações de Codificadores Bidirecionais de Transformers), lançado pelo Google em 2018. A eficácia do BERT em um teste de replicação foi aprimorada como resultado do gigante do mecanismo de pesquisa tornando-o aberto fonte, de acordo com pesquisadores do Facebook.
O Facebook publicou o RoBERTa, que alcançou pontuações de ponta no benchmark de NLP Avaliação de Compreensão Geral de Linguagem (GLUE), como consequência de sua metodologia aprimorada.
RoBERTa foi lançado pela primeira vez com treinamento insuficiente, mas agora Sul coreano acadêmicos trabalhando no DarkBERT mostraram que ele é capaz de muito mais. Os pesquisadores foram capazes de construir o DarkBERT alimentando os dados do RoBERTa da dark web por quase 16 dias em dois conjuntos de dados (um bruto e outro pré-processado).
Felizmente, os pesquisadores não pretendem fazer DarkBERT disponíveis ao público em geral. No entanto, Dexerto (abre em nova guia) afirma que aceita solicitações por motivos acadêmicos. Mas o DarkBERT provavelmente fornecerá aos investigadores e agentes da lei uma compreensão muito maior de toda a dark web.
Dicas para utilizar chatbots de IA com segurança
Você deve usar chatbots AI com cautela, assim como faria com qualquer outro programa ou serviço online, pois eles podem infectá-lo com malware por meio de fraudes. ChatGPT aplicativos ou mesmo vazar informações importantes, como aconteceu recentemente com os funcionários da Samsung.
- Utilize chatbots de IA de fontes confiáveis e oficiais para garantir que você esteja no site correto.
- Versões oficiais de chatbots de IA populares, como ChatGPT, Bing Chate Google Bardo ainda não estão disponíveis ao público.
- Evite clicar em links em e-mails suspeitos que o direcionam para chatbots de IA ou prometem acesso imediato.
- Os golpistas estão aproveitando a tendência do chatbot de IA, portanto, tenha cuidado com as tentativas de phishing.
- Desconfie de anúncios que promovem chatbots de IA, pois os golpistas costumam usá-los para direcionar usuários desavisados a sites de phishing.
- Instale um software antivírus confiável em seu PC, Mace Smartphone para aumentar a segurança ao interagir com chatbots de IA.
- Um modelo especializado de IA chamado DarkBERT está sendo considerado um protótipo para futuros modelos de IA treinados em domínios específicos.
- Modelos semelhantes de IA podem ser desenvolvidos no futuro para atender a áreas específicas de especialização.
Mantenha-se informado sobre os avanços e riscos potenciais associados aos chatbots de IA para se proteger online.
Você pode ler nosso artigo A resposta da OpenAI à reação: Medidas de segurança e colaboração com os formuladores de políticas.
Source: DarkBERT: O modelo de IA treinado nos segredos da Dark Web