O Reddit fez uma grande mudança esta semana para proteger seu conteúdo de ser capturado sem permissão. Eles atualizaram algo chamado arquivo robots.txt, que informa aos programas de computador (como aqueles usados pelos mecanismos de busca) se eles podem acessar um site. Este arquivo tem sido importante para permitir que os mecanismos de pesquisa mostrem sites quando você pesquisa algo.
Mas agora, com a ascensão da inteligência artificial, algumas empresas estão a utilizar conteúdos de websites como o Reddit para treinar os seus sistemas de IA sem pedir ou dar crédito aos criadores originais. Isso se tornou um grande problema porque não respeita as pessoas que criaram o conteúdo ou os sites que o hospedam.
O que o Reddit está fazendo?
A atualização do Reddit para o arquivo robots.txt visa controlar como seu conteúdo é usado. Eles também limitarão e bloquearão o acesso de programas de computador e bots desconhecidos ao site se não seguirem as regras do Reddit ou não tiverem permissão para usar o conteúdo.
O Reddit diz que essas mudanças não afetarão a maioria das pessoas ou boas organizações, como pesquisadores ou grupos que salvam o histórico da Internet (como o Internet Archive). Em vez disso, eles estão tentando impedir que empresas de IA usem o conteúdo do Reddit sem permissão. No entanto, estes programas de IA ainda podem ignorar as regras do Reddit.
Investigação e respostas recentes
O anúncio segue um relatório da Wired, que descobriu que uma empresa de busca baseada em IA chamada Perplexity estava retirando conteúdo de sites, embora tenha sido instruído a não fazê-lo no arquivo robots.txt. O CEO da Perplexity argumentou que estas regras não são requisitos legais, provocando um debate sobre como os sites podem proteger o seu conteúdo.
Os dados do Reddit pertencem ao Google, por enquanto
As novas regras do Reddit não afetarão as empresas que já possuem acordos com eles. Por exemplo, o Reddit tem um acordo de US$ 60 milhões com o Google, permitindo que o Google use os dados do Reddit para seus projetos de IA. Isso mostra que o Reddit é cuidadoso com quem pode usar seus dados e quer ter certeza de que são parceiros confiáveis.
“Todos que usam o conteúdo do Reddit devem seguir nossas regras para proteger os usuários do Reddit”, disse o Reddit em um comunicado. postagem de blog. “Escolhemos cuidadosamente com quem trabalhamos e confiamos no acesso ao conteúdo do Reddit.”
Olhando para frente
Essa mudança do Reddit faz parte de seu esforço para controlar como seus dados são utilizados, principalmente por empresas para fins comerciais. Isso mostra uma tendência crescente entre os sites de proteger seu conteúdo na era da IA e do big data.
A ação do Reddit envia uma mensagem clara: embora a IA tenha grande potencial, respeitar de onde os dados vêm e obter permissão é realmente importante. À medida que a internet muda, as ações do Reddit podem influenciar como outros sites protegem seu conteúdo e os direitos dos usuários.
Todas as imagens são geradas por Eray Eliaçık/Bing
Source: Reddit fará você pagar por seus dados