Um novo padrão de licenciamento, Licensing realmente simples (RSL), foi introduzido para permitir que os editores da Web definissem os termos sob os quais os desenvolvedores do sistema de IA podem utilizar seu conteúdo. A iniciativa visa estabelecer uma estrutura para as empresas de IA compensarem os editores por usar seus dados para treinar modelos de IA. Na quarta -feira, organizações proeminentes como Reddit, Yahoo, Medium, Quora e People Inc. anunciaram seu apoio ao RSL Standard, um protocolo de licenciamento de conteúdo aberto. Esse padrão permite que os editores especifiquem como os bots devem pagar para raspar seus sites para obter dados de treinamento de IA, com o objetivo de influenciar coletivamente as empresas de IA a adotar a estrutura. O padrão RSL se expande no protocolo robots.txt existente, que historicamente permitiu que os editores instruíssem os rastreadores da web em quais partes do site eles podem e não podem acessar. A RSL aprimora isso, permitindo que os sites incluam termos de licenciamento e royalties em seu arquivo robots.txt. Esses termos também podem ser incorporados em livros on -line, vídeos e conjuntos de dados de treinamento, permitindo que os editores busquem compensação pelo seu uso. O RSL Collective, uma organização de direitos recém -formada, está por trás do padrão RSL. É liderado por Eckart Walther, co-criador do padrão de sindicação realmente simples (RSS) e ex-CEO da Cardspring, e Doug Leeds, ex-CEO da IAC Publishing e Ask.com. Walther afirmou: “O objetivo é criar um novo modelo de negócios escalável para a Web. A RSL pega algumas dessas idéias iniciais do RSS e cria uma nova camada para toda a Internet, onde são definidos direitos de licenciamento e direitos de compensação”. O padrão RSL suporta vários modelos de licenciamento, incluindo opções gratuitas. Os proprietários do site podem solicitar que as empresas de IA paguem uma taxa de assinatura ou uma taxa de pagamento por cena através do padrão RSL, que seria cobrado cada vez que um AI Bot rasteja o site. Além disso, pode ser implementada uma taxa de inferência de pagamento por pagamento, permitindo que os sites recebam compensação quando um modelo de IA faz referência ao seu trabalho para gerar uma resposta. Os sites de rastreamento de bots para outros fins, como inclusão de arquivamento ou mecanismo de pesquisa, podem continuar como de costume. Várias empresas de mídia, incluindo a Vox Media (controladora da The Verge), News Corp (proprietária do Wall Street Journal) e do New York Times, já estabeleceram acordos de licenciamento com empresas individuais de IA como OpenAi e Amazon. O RSL Collective pretende otimizar esse processo, permitindo que qualquer proprietário ou criador do site receba o pagamento por seu trabalho sem negociar acordos separados. O sucesso da RSL depende da adoção pelos principais players do setor, principalmente empresas de IA. Os construtores de modelos de IA enfrentaram acusações de desconsiderar os arquivos robots.txt dos sites, e atualmente não existe um método direto para rastrear as taxas de inferência sem sua cooperação. O RSL Collective está se baseando na influência coletiva dos principais editores da Web para tornar a adoção do padrão mais atraente. Leeds afirmou: “Nosso trabalho é sair e fazer com que um grande grupo de pessoas diga que é do seu interesse, ambos com eficiência, porque você pode negociar com todos de uma vez e legalmente, porque se não, está violando todo mundo de uma só vez”. Ao contrário de sistemas como o “Pay por Crawl” da CloudFlare, o padrão RSL sozinho não pode impedir que os bots visitem um site. O RSL Collective está colaborando rapidamente, uma rede de entrega de conteúdo, para controlar o acesso do AI Bot a sites com base no fato de eles concordarem em licenciar conteúdo. Leeds descreveu rapidamente como “o segurança na porta do clube, e eles não deixam as pessoas entrarem, a menos que tenham a identificação certa. A RSL está emitindo os IDs. Então, dizemos: ‘Ei, você concordou em licenciar esse conteúdo’ e, em geral, as empresas de licenciamentos são, em que as empresas que não sejam mais que as empresas que não se soltem. Leeds acredita que o RSL Collective pode aplicar legalmente licenças, afirmando que “todos os participantes da organização de direitos coletivos participam da aplicação de qualquer infração”, divulgando os custos legais. Ele comparou esse sistema às organizações de direitos digitais existentes, como o Grupo de Direitos da Música ASCAP, que coleta e distribui taxas de licenciamento a seus membros. Enquanto a música convencional licenciamento se beneficia de um forte precedente legal para a proteção de direitos autorais, a raspagem não autorizada e o uso da mídia para o treinamento de sistemas de IA permanecem em uma área cinzenta legal. Atualmente, os principais jogadores da IA estão enfrentando ações judiciais de entidades como Reddit, Getty Images e vários editores on -line. Leeds e Walther declararam: “Sempre houve uma questão de saber se os bots concordaram com os termos que não vêem. A RSL altera fundamentalmente, colocando os rastreadores no aviso de quais são os termos antes de acessar um site”. O Leeds espera que o sistema crie uma maneira intuitiva de navegar no licenciamento funciona para o treinamento de IA, afirmando: “O que estamos fazendo é reinventar rodas ou inventar rodas – estamos apenas trazendo -os para um lugar que eles não existiam antes. ainda não aconteceu. ” O RSL Collective é gratuito para editores e criadores ingressarem. Outras grandes marcas como O’Reilly, Wikihow e Ziff Davis (proprietário da IGN) também se juntaram à organização.
Source: Reddit, Yahoo Back RSL Standard para dados de treinamento de IA





