A OpenAI excluiu acidentalmente dados cruciais relacionados ao seu processo de direitos autorais com o The New York Times durante processos judiciais em andamento sobre reivindicações de violação de direitos autorais. O incidente envolveu dados de máquinas virtuais dedicadas fornecidas aos demandantes, que a OpenAI reconheceu ao tribunal em um processo recente. Como resultado, os advogados do Times afirmaram que perderam uma semana de trabalho relacionado ao caso.
OpenAI enfrenta revés na perda de dados em processo judicial com o The New York Times
De acordo com um carta do Times‘ equipe jurídica, essa perda de dados envolveu “uma semana inteira de trabalho de seus especialistas e advogados” e foi “irremediavelmente perdida”. Os demandantes estavam investigando alegações de que os modelos da OpenAI foram treinados em conteúdo não autorizado. Como parte deste processo, acumularam dados ao longo de 150 horas de pesquisa intensiva nos conjuntos de dados de formação da OpenAI, procurando especificamente casos de violação de direitos de autor. Um relatório de TechCrunch indicou que a exclusão ocorreu em 14 de novembro, quando “programas e dados de resultados de pesquisa armazenados em uma das máquinas virtuais dedicadas foram apagados pelos engenheiros da OpenAI”.
O núcleo do processo afirma que a OpenAI, juntamente com a Microsoft – sua parceira que usa a tecnologia da OpenAI para seu chatbot Bing AI – infringiu os direitos autorais do The New York Times ao utilizar conteúdo com acesso pago sem autorização. O Times afirma que os modelos da OpenAI produziram réplicas “quase literalmente” de seus artigos, formando seu argumento por danos. A OpenAI refutou consistentemente estas alegações, alegando que a sua formação se baseava em dados publicamente disponíveis, qualificando-se como utilização justa ao abrigo das leis de direitos de autor.
Um porta-voz da OpenAI comentou que o incidente foi uma “falha”. Ao mesmo tempo, recuperaram com sucesso a maior parte dos dados eliminados e elementos críticos, incluindo “a estrutura de pastas e nomes de ficheiros”, permanecem perdidos e, consequentemente, inutilizáveis. Como resultado, os advogados do Times enfrentam agora o desafio de reiniciar a recolha de provas a partir do zero. Apesar das circunstâncias, eles relataram não ter “nenhuma razão para acreditar [the erasure] foi intencional”, enfatizando que a OpenAI está melhor posicionada para pesquisar seus conjuntos de dados. No entanto, também notaram a relutância da empresa em divulgar detalhes sobre os seus dados de formação.
Para complicar ainda mais as coisas, surgiram reivindicações de direitos autorais semelhantes contra a OpenAI. Um processo recente contra a empresa movido pela Raw Story e pela AlterNet foi rejeitado porque os demandantes não conseguiram fornecer provas suficientes de danos relacionados às suas alegações. Em contraste, O jornal New York Times supostamente investiu mais de US$ 1 milhão em honorários advocatícios para prosseguir seu caso contra a OpenAI. Este compromisso financeiro ilustra o desafio distinto dos editores mais pequenos quando competem com empresas de tecnologia substancial.
A OpenAI, por outro lado, celebrou recentemente acordos de licenciamento com várias grandes empresas de comunicação social, permitindo a utilização do seu conteúdo para treinar os seus modelos de IA, proporcionando assim compensação e crédito. Relatórios indicam que a OpenAI está pagando à gigante editorial Dotdash Meredith pelo menos US$ 16 milhões anualmente por direitos de licenciamento, refletindo sua estratégia de buscar parcerias formais em vez de litígios contínuos.
Crédito da imagem: Furkan Demirkaya/Ideograma
A postagem O problema jurídico do NewYork Times se aprofunda à medida que o OpenAI exclui acidentalmente dados importantes apareceu pela primeira vez no TechBriefly.