É apresentado o Google MusicLM AI, um sistema de IA inovador capaz de compor peças musicais em qualquer gênero, a partir de uma descrição de texto. Apesar de suas capacidades impressionantes, a empresa optou por ser cautelosa e não tem planos atuais de disponibilizá-lo ao público. Embora os sistemas anteriores de IA generativa para música, como Riffusion e Dance Diffusion, tenham feito tentativas de compor músicas, eles foram limitados por restrições técnicas e dados de treinamento insuficientes, resultando em composições que carecem de complexidade e alta fidelidade. No entanto, o Google MusicLM AI representa um salto significativo e pode ser o primeiro sistema a superar esses desafios.
uau, isso é maior do que o ChatGPT para mim.
O Google quase resolveu a geração de música, eu diria. https://t.co/s9PQaJ5R6A— Keunwoo Choi (@keunwoochoi) 27 de janeiro de 2023
Conheça o Google MusicLM AI, a primeira ferramenta significativa de conversão de texto em música
Um recente trabalho acadêmico destaca o desenvolvimento do MusicLM, um sistema de IA treinado em um enorme conjunto de dados composto por 280.000 horas de música. O objetivo do sistema era gerar músicas com “complexidade significativa” com base em descrições textuais, como “canção de jazz encantadora com um solo de saxofone memorável e um cantor solo” ou “techno berlinense dos anos 90 com baixo baixo e chute forte”. A saída produzida pelo Google MusicLM AI, embora não necessariamente tão imaginativa ou musicalmente unificada como um artista humano, possui uma notável semelhança com a música composta por humanos.
Seria um eufemismo expressar o quão impressionante é a produção produzida pelo Google MusicLM AI, principalmente devido à ausência de músicos ou instrumentistas humanos no processo de criação. Apesar de receber descrições às vezes longas e complexas, o MusicLM tem a notável capacidade de incorporar elementos intrincados, como riffs instrumentais, linhas melódicas e tons emocionais em suas composições.
As habilidades do Google MusicLM AI vão além da mera geração de trechos musicais curtos. A equipe de pesquisa do Google demonstrou a capacidade do sistema de construir melodias pré-existentes, sejam elas cantaroladas, cantadas, assobiadas ou tocadas em um instrumento. Além disso, o MusicLM tem a capacidade de obter várias descrições sequenciais e criar uma narrativa melódica de vários minutos, tornando-o adequado para a trilha sonora de um filme.
A versatilidade do Google MusicLM AI se estende a ser direcionado por meio de uma combinação de imagens e legendas, além de produzir áudio que imita o som de um instrumento específico dentro de um gênero específico. A experiência do “músico” da IA também pode ser ajustada, permitindo que o sistema gere música influenciada por vários locais, períodos de tempo ou propósitos específicos, como música edificante para exercícios físicos.
Você pode acessar os AIs do Google MusicLM página GitHub para ouvir algumas amostras!
O compositor de música do Google AI é realmente bom?
No entanto, é importante observar que o Google MusicLM AI não é isento de falhas. Algumas das saídas produzidas pelo sistema podem exibir uma qualidade desconexa, um resultado natural do procedimento de treinamento. A capacidade do sistema de gerar vocais, incluindo harmonias de coral, fica aquém das expectativas. As letras geradas geralmente não são compreensíveis, consistindo em inglês quebrado ou sem sentido, e os vocais sintetizados carecem da sofisticação de um único artista e, em vez disso, soam como um híbrido de várias vozes.
O novo modelo de música do Google, MusicLM, é a novidade da semana.
Aqui está em ação.
Basta descrever a música e ela gerará a faixa: pic.twitter.com/xAhzHfGnMH
— Pete (@nonmayorpete) 27 de janeiro de 2023
Apesar de suas capacidades impressionantes, os pesquisadores do Google reconhecem os inúmeros dilemas éticos apresentados por um sistema como o MusicLM, incluindo a probabilidade de incorporar material protegido por direitos autorais dos dados de treinamento nas músicas geradas. Durante a experimentação, eles descobriram que aproximadamente 1% da música gerada era uma cópia exata das músicas do conjunto de dados de treinamento. Essa alta incidência de duplicação levou os pesquisadores a decidirem não lançar o Google MusicLM AI em sua forma atual.
“Reconhecemos o risco de potencial apropriação indébita de conteúdo criativo associado ao caso de uso. Enfatizamos fortemente a necessidade de mais trabalhos futuros para lidar com esses riscos associados à geração de música”, afirmaram os co-autores do artigo.
Se o MusicLM ou um sistema semelhante fosse lançado no futuro, é provável que surgissem questões legais significativas, independentemente de como o sistema é comercializado ou posicionado, seja como uma ajuda aos artistas ou não. Essa é uma preocupação que já surgiu em relação a sistemas de IA mais simples. Em 2020, a gravadora de Jay-Z entrou com uma ação de violação de direitos autorais contra o canal do YouTube, Vocal Synthesis, por usar IA para criar covers das canções de Jay-Z, incluindo “We Didn’t Start the Fire” de Billy Joel. Depois de inicialmente remover os vídeos, o YouTube os restabeleceu posteriormente, determinando que os pedidos de remoção estavam “incompletos”. A legalidade da música gerada por IA continua sendo uma área cinzenta.
Google anuncia MusicLM: um modelo para gerar música a partir de texto. Aqui estão algumas coisas malucas que ele pode fazer:
1. Dado o áudio de uma melodia, ele pode gerar uma nova música inspirada por essa melodia personalizada por prompts! Aqui está alguém cantarolando bella ciao transformado em coro a cappella, EDM, etc. pic.twitter.com/HKDnXI1C8U
—bleedingedgeai (@bleedingedgeai) 27 de janeiro de 2023
À medida que a tecnologia de IA para geração de música continua avançando, questões sobre sua legalidade permanecem em primeiro plano. Eric Sunray, estagiário jurídico da Music Publishers Association, escreveu um papel branco que argumenta que sistemas como o MusicLM infringem os direitos protegidos pela Lei de Direitos Autorais dos Estados Unidos por meio da criação de “tapeçarias de áudio coerente” a partir de material protegido por direitos autorais usado em seu treinamento.
Essas preocupações foram repetidas em relação aos sistemas de IA em outros campos, incluindo imagem, código e geração de texto, pois seus dados de treinamento geralmente são provenientes da Web sem o consentimento dos criadores. A questão do uso justo também foi debatida após o lançamento do OpenAI’s Jukebox, com alguns questionando o uso de material protegido por direitos autorais no treinamento de modelos de IA.
Conforme opinado por Andy Baio da Waxy, especula-se que a música gerada por sistemas de IA pode ser considerada um trabalho derivado da perspectiva do usuário, oferecendo assim apenas proteção de direitos autorais para seus componentes originais. A definição do que constitui “originalidade” nesse contexto permanece obscura, tornando a exploração comercial dessa música um território desconhecido. Se, no entanto, a música gerada se enquadrar no âmbito do uso justo, como paródia ou comentário, a questão se torna menos complicada. No entanto, Baio prevê que o sistema judicial precisaria adotar uma abordagem caso a caso para chegar a um veredicto.
À medida que o cenário legal continua a evoluir, a clareza sobre a questão em torno da IA de geração de música pode ser iminente. Vários processos em andamento, incluindo um que aborda os direitos de artistas cujo trabalho é utilizado no treinamento de sistemas de IA sem sua autorização ou conhecimento, provavelmente afetarão o setor. Só o tempo revelará o resultado desses procedimentos legais.
Você já ouviu falar do novo classificador de texto AI da OpenAI para detectar textos gerados por IA?