Eclética: IA do Google cria músicas de qualquer gênero com base em textos

A IA MusicLM tem capacidade de gerar músicas a 24 kHz a partir de descrições feitas pelo usuário. Também é capaz de mesclar estilos musicais!

Atualmente, muita polêmica gira em torno de Inteligência Artificial (IA) de criação de imagem. Isso acontece porque as IA podem elaborar diversos tipos de imagem utilizando-se de bancos de imagem na internet e com texto que o usuário redige.

Dada a facilidade de criação de imagens, muitos artistas estão se revoltando com essa tecnologia, que está sendo usada para ganhar concursos de pinturas e de obras de arte. Dessa forma, desmerece o esforço dos artistas.

Uma polêmica recente foi sobre a editora Shinchosha, que está realizando a publicação de um mangá com imagens feitas inteiramente por meio de uma IA.

Contudo, apesar das polêmicas, nada está barrando o desenvolvimento de novas tecnologias, e muito menos a sua expansão para outras áreas do entretenimento. É o caso da nova ferramenta que o Google lançou.

Google aposta em IA de desenvolvimento de músicas

Em uma publicação feita na última quinta-feira (26), o Google noticiou a existência de uma nova IA voltada para a área da música.

Essa nova IA foi nomeada como MusicLM e funciona da mesma forma como as IA de criação de imagem. Ou seja, o usuário descreve como deseja sua música e a IA buscará fontes e fará uma montagem cumprindo os requisitos descritos.

Os exemplos dessa IA podem ser vistos no seguinte endereço: https://google-research.github.io/seanet/musiclm/examples/. Na página, há, além do áudio criado, a descrição feita para a sua criação. Segundo o texto da publicação, o MusicLM tem a capacidade de criar músicas a uma taxa de 24 kHz.

Além disso, o texto descreve que os testes com a nova IA comprovam que ela possui uma capacidade superior a outras IA de criação de músicas anteriormente desenvolvidas, sendo capaz de superá-las em termos de qualidade de áudio e compreensão do texto-base.

Entretanto, como dissemos, muitas polêmicas têm envolvido as IA e os artistas. Portanto, para evitar eventuais transtornos e possíveis processos, o Google não deixará a ferramenta disponível para todos, sendo exclusiva para estúdios especializados na área.

Mesmo com esse cuidado, a criação de uma IA capaz de mesclar estilos de música pode ser um passo muito grande para a indústria e ainda assim gerar discussão entre os envolvidos na área.

Resta esperar para saber como o MusicLM deve influenciar a criação de áudios e músicas. O texto apresentado na publicação pode ser lido logo abaixo:

“Apresentamos o MusicLM, um modelo que gera música de alta fidelidade a partir de descrições de texto como ‘uma melodia calmante de violino apoiada por um riff de guitarra distorcido’.

O MusicLM lança o processo de geração condicional de música como uma tarefa de modelagem hierárquica de sequência a sequência e gera música a 24 kHz, que permanece consistente por vários minutos. Nossos experimentos mostram que o MusicLM supera os sistemas anteriores tanto em qualidade de áudio quanto em aderência à descrição do texto.

Além disso, demonstramos que o MusicLM pode ser condicionado tanto a um texto quanto a uma melodia, na medida em que pode transformar melodias assobiadas e sussurradas de acordo com o estilo descrito em uma legenda de texto.

Para dar suporte a pesquisas futuras, lançamos publicamente o MusicCaps, um conjunto de dados composto por 5,5 mil pares de música e texto, com descrições em rich text fornecidas por especialistas humanos.”

você pode gostar também