Genera musica da testo utilizzando Google MusicLM

'Generate music from text using Google MusicLM.'

Presentando l’ultima innovazione del modello di intelligenza artificiale musicale di Google.

Lo sviluppo dell’IA è diventato più grande che mai, soprattutto nel campo dell’IA generativa. Dalla generazione di testi simili a una conversazione con le persone alla generazione di immagini a partire da testi, tutto ciò è diventato ora possibile.

Questo avanzamento si riscontra anche nel campo della generazione di musica, come dimostrato da Google, che ha lanciato un modello di generazione musicale chiamato MusicLM. Questo modello è stato rilasciato nel gennaio 2023 e le persone hanno provato le sue capacità da allora. Quindi, cosa è esattamente MusicLM e come puoi provarlo? Discutiamone.

Google MusicLM

MusicLM è stato introdotto per la prima volta nel paper di Agostinelli et al. (2023), in cui il gruppo di ricerca ha spiegato MusicLM come un modello per generare musica ad alta fedeltà a partire da una descrizione testuale. Il modello è generalmente basato su AudioLM e gli esperimenti hanno dimostrato che il modello poteva produrre diversi minuti di musica di alta qualità a 24 kHz, rispettando comunque la descrizione testuale.

Inoltre, la ricerca ha prodotto il dataset pubblico musiccaps, che permette a chiunque desideri sviluppare un modello simile o estendere la ricerca di farlo. I dati sono selezionati manualmente da musicisti professionisti.

Inoltre, MusicLM è stato sviluppato seguendo pratiche responsabili di sviluppo dei modelli per le persone che temono la possibile appropriazione impropria di contenuti creativi a causa della generazione di musica. Estendendo il lavoro di Carlini et al. (2022), il token generato da MusicLM è significativamente diverso dai dati di addestramento.

Prova di MusicLM

Se vuoi esplorare un campione dei risultati di MusicLM, il gruppo di ricerca di Google ha fornito un semplice sito web per vedere quanto MusicLM sia capace. Ad esempio, puoi esplorare i campioni audio generati dalla didascalia di testo sul sito web.

Un altro esempio è il mio campione preferito, la generazione di musica in modalità storia, in cui stili musicali diversi possono essere integrati in uno utilizzando diverse indicazioni di testo.

È anche possibile generare musica basata sulla didascalia di un dipinto, catturando possibilmente l’umore dell’immagine.

Il risultato suona incredibile, ma come possiamo provare il modello? Fortunatamente, Google ha accettato le registrazioni per testare MusicLM dal maggio 2023 presso l’AI Test Kitchen. Vai al sito web e registrati con il tuo account Google.

Dopo la registrazione, dovremo aspettare il nostro turno per provare MusicLM. Quindi, tieni d’occhio la tua email.

Questo è tutto per ora; spero che tu possa avere presto la tua occasione per provare l’entusiasmante MusicLM.

Conclusioni

MusicLM è un modello del gruppo di ricerca di Google per generare musica a partire da un testo. Il modello può fornire diversi minuti di musica di alta qualità seguendo le istruzioni testuali. Possiamo provare MusicLM registrandoci all’AI Test Kitchen. Tuttavia, possiamo visitare il sito web della ricerca di Google se siamo interessati solo ai risultati campione. Cornellius Yudha Wijaya è un assistente manager di data science e scrittore di dati. Mentre lavora a tempo pieno presso Allianz Indonesia, ama condividere consigli su Python e dati tramite i social media e i media scritti.