Google Musiclm: l’IA che crea musica partendo da un testo scritto

Antonietta Della FeminaMarzo 8, 2023

937 2 minuti letti

Forse è il caso di cominciare ad abituarsi all’idea di un futuro di “latta”, un futuro dove robotica e tecnologia artificiale non vogliono surclassare l’uomo – anzi tutt’altro – un futuro dove si collabora con essa e si lavora a pieno regime per migliorare la società.

Seguendo la scia dei modelli di machine learning, come DALL-E 2, Stable Diffusion o Midjourney, che generano immagini partendo da un testo scritto dall’utente, Google presenta al mercato MusicLM, un’IA capace di generare musica, anche cantata, partendo da un testo scritto.

“MusicLM genera musica a 24 kHz che rimane coerente per diversi minuti, così si legge nel paper firmato dai ricercatori Google. I nostri esperimenti mostrano che MusicLM supera i modelli precedenti sia in termini di qualità audio che di aderenza alla descrizione testuale”.

I modelli di intelligenza artificiale simili a MusicLM, che potremmo quindi presentare come le sue “versioni precedenti” seppur quasi contemporanee, sono Dance Diffusion, sviluppato anch’esso da Google; Riffusion, perfezionato dagli sviluppatori Seth Forsgren e Hayk Martiros, il quale consente di generare musica a partire da un’immagine, per la precisione da uno spettrogramma.

MusicLM, successiva e quindi con un quid in più, si basa su un set di dati – chiamato MusicCaps – che include 5.500 spezzoni musicali che Google ha rilasciato pubblicamente. È possibile ascoltarli qui.

Attualmente il codice di MusicLM non è pubblico, e i ricercatori di Google non prevedono di rilasciarlo per il momento. Analizzando il documento accademico di presentazione, qui consultabile e scaricabile in versione pdf, si nota come vengano evidenziati alcuni aspetti e il potenziale impatto negativo di una tecnologia di questo tipo: copyright e problemi di appropriazione culturale, quelli più evidenti.

Ci costerà attendere che vengano, quindi, attuati affinamenti, indicati come necessari dagli stessi ricercatori.

E se c’è qualcuno che sogna un mondo alla IoRobot, c’è chi giustamente esprime il suo dissenso, non verso l’IA in sé, ma verso la disumanizzazione dell’essere umano; tra questi vi è Nick Cave, cantautore australiano, che ha più volte espresso il suo “attrito” – a seguito di tentativi di creare “testi e canzoni che rispecchiassero Nick Cave” – nei confronti di ChatGPT, un prototipo di chatbot basato su intelligenza artificiale e machine learning, sviluppato da OpenAI, specializzato nella conversazione con un utente umano.

“Le canzoni nascono dalla sofferenza e gli algoritmi, per quanto ne so, non sono in grado di predire la complessa lotta umana per la creazione. I dati non soffrono. […] La malinconia del ruolo di ChatGPT è quella di essere destinato ad imitare un’esperienza umana che non potrà mai vivere, e non importa quanto la stessa esperienza umana verrà svalutata in futuro.” E ancora: “Ciò che rende una canzone una grande canzone non può richiamare qualcos’altro che già esiste. Scrivere una bella canzone non è fare una copia, una replica, o un pastiche, ma l’opposto. È un atto di distruzione di tutto ciò che è stato prodotto in passato.”

Chissà, ma è indiscusso l’imbrutimento dell’uomo. “Nostra culpa, l’uomo si raffredda più velocemente del pianeta su cui vive”, come disse, e probabilmente confermerebbe, Albert Einstein.

Antonietta Della Femina

Forse è il caso di cominciare ad abituarsi all’idea di un futuro di “latta”, un futuro dove robotica e tecnologia artificiale non vogliono surclassare l’uomo – anzi tutt’altro – un futuro dove si collabora con essa e si lavora a pieno regime per migliorare la società.

Seguendo la scia dei modelli di machine learning, come DALL-E 2, Stable Diffusion o Midjourney, che generano immagini partendo da un testo scritto dall’utente, Google presenta al mercato MusicLM, un’IA capace di generare musica, anche cantata, partendo da un testo scritto.

Antonietta Della Femina

Related Articles

L’ascesa dell’estrema destra europea: una lettura psicosociale

GALATTICA: Un viaggio tra innovazione e tradizione nella Comunicazione Visiva e Editoriale

L’amica geniale e gli altri libri più belli del secolo

La docuserie su Yara Gambirasio sta dividendo l’opinione pubblica