Quanto tempo è passato dall’ultima volta che hai cantato e ballato mentre scrivevi una canzone con l’intelligenza artificiale?

Quanto tempo è passato dall'ultima volta che hai cantato e ballato mentre scrivevi una canzone con l'intelligenza artificiale?

Nessuno canta e balla mentre usa l'intelligenza artificiale per scrivere canzoni! — No, alcuni insegnanti lo fanno.

Si tratta di un blogger musicale su YouTube che originariamente intendeva usare un software di generazione musicale per creare della terribile musica AI per prendere in giro l'intelligenza artificiale, ma inaspettatamente ha prodotto della musica metal rock giapponese "autentica", che è rapidamente diventata una hit su TikTok.

La "sorpresa" è stata che non ha fornito uno spunto o un brano di riferimento, bensì una serie dei suoi… ruggiti.

Suno, sbatti le palpebre se sei stato rapito.

La storia inizia con questo blogger musicale che vuole accettare una sfida e vedere a che livello sono arrivati ​​gli attuali strumenti di generazione musicale basati sull'intelligenza artificiale, ovviamente con un pizzico di malizia.

Tra gli strumenti da lui testati c'erano popolari strumenti di musica generativa come Suno, Mureka, ElevenLabs e Udio, e il suo metodo di test era piuttosto audace.

Ad esempio, urlare al computer come nell'esempio qui sopra. Oppure imitare Yoko Ono urlando e strepitando…

Questa è un'opera di "performance art" creata da Yoko Ono per il suo 90° compleanno. È completamente priva di significato; sta solo urlando. Tuttavia, l'IA non sa come darle un titolo; accetta tutto senza discutere, ottimizzando attentamente il testo e aggiungendo una melodia.

Sai cosa? Sono tutti piuttosto buoni.

L'introduzione di "My Name is Jeff" è in realtà piuttosto buona, soprattutto la sezione di prompt, dove ha forzatamente inserito un mucchio di parole descrittive stilistiche, rendendola un completo disastro. Poi c'è la canzone che è uscita direttamente dal testo automatico del sistema, che suona molto simile alla band svedese Meshuggah: il database dell'IA è imperscrutabile; è così di nicchia, che lascia completamente disorientati coloro che conoscono solo la musica pop.

La parte più sorprendente è arrivata dopo: il blogger stava divagando in modo completamente insensato, e l'IA ha prodotto una canzone heavy metal giapponese intitolata "Isugaku: Never Say Goodbye". Le sue urla casuali sono state identificate dall'IA come giapponesi, da qui lo stile corrispondente. E sapete una cosa? In realtà si è amalgamato piuttosto bene.

Questa è l'essenza della musica generata dall'intelligenza artificiale: affinché gli esseri umani imparino la musica e comprendano la teoria musicale, hanno bisogno di un lungo periodo di studio e accumulo, ascoltando una grande quantità di musica. Anche l'intelligenza artificiale ha bisogno di imparare, ma apprende le caratteristiche intrinseche dei dati delle opere musicali, inclusi, a titolo esemplificativo ma non esaustivo: accordi, melodie, ritmi e forme strutturali.

Per coincidenza, la musica pop si basa ampiamente su alcuni accordi comuni. La sua elevata ripetitività e prevedibilità consente all'intelligenza artificiale di trovare rapidamente degli schemi durante l'apprendimento di queste "formule" fondamentali e di generare musica che suoni plausibile e che piaccia al grande pubblico.

Astratto, ma non abbastanza astratto per gli esseri umani.

Ma è questo il significato della creatività?

C'è un po', ma non molto. Rispetto alla vera creatività, l'intelligenza artificiale è insignificante.

Ad esempio, il meme di internet più virale di quest'anno, "Skill Gomoku", è nato da un tentativo simile a quello del blogger di cui sopra: vedere che tipo di canzone avrebbe potuto scrivere l'intelligenza artificiale.

Chi avrebbe mai pensato che questa sarebbe diventata la canzone più orecchiabile dell'autunno? Quanto tempo è passato dall'ultima volta che hai cantato e ballato giocando a Gomoku?

In "Skill Five", Zhang Xingchao ha rivelato direttamente che il brano è stato scritto da un'intelligenza artificiale, e anche il pubblico ha avuto la sensazione che fosse stato scritto da un'intelligenza artificiale: la melodia era contorta e stranamente manipolatrice una volta assemblata.

A dire il vero, questa canzone potrebbe aver beneficiato dell'intelligenza artificiale, ma non è stato certamente merito esclusivo delle sue capacità. Ho provato a ricreare questa fantastica canzone usando Suno (lo stesso usato dal Maestro Wu) e ho scoperto che non è così semplice come giocare a Forza 4!

Innanzitutto, non avevo idea di cosa fare, quindi potevo usare solo il prompt più elementare nella modalità di creazione semplice per fargli scrivere una canzone: sarebbe stato molto noioso, ma ero preparato.

L'intelligenza artificiale è rimasta in silenzio, limitandosi a generare due serie di testi e quattro versioni di arrangiamenti musicali.

A dire il vero, è così noioso e tedioso. L'importanza del testo in una canzone è evidente. E nella canzone "Skill Gomoku", il testo costituisce metà della canzone. I due gruppi di testi generati dall'IA non sono particolarmente problematici, sono tutti plausibili, ma sono totalmente privi di interesse.

Non c'è altro modo se non quello di usare l'originale; non si può omettere una sola parola.

Non ho specificato uno stile musicale particolare, solo un ritmo leggero e divertente. Non credo che la modella abbia capito nemmeno il testo; è troppo astratto. Tuttavia, è riuscita comunque a catturare i momenti salienti, come la pausa con "it's going to explode", o a enfatizzare la presenza di quelle tre parole.

Ho poi eseguito altre versioni a caso, ma nessuna ha funzionato, il che è strano. Significa forse che non si può riprodurre l'immagine senza capirne il testo? Trovo difficile spiegare un testo così astratto al modello!

Per risolvere il problema, dobbiamo tornare al nocciolo della questione: l'intelligenza artificiale è la migliore nel riconoscimento delle caratteristiche, ma quei pochi accordi pop sono troppo semplici, alcuni persino troppo banali, soprattutto senza istruzioni di stile specifiche. Quindi, indipendentemente da come funzioni, non funziona e non riesce a creare un senso di contrasto con il testo di "Skill Five-in-a-Row"!

Così, dopo aver quasi consumato il video originale, mi sono reso conto della sua musicalità: la musica di questa canzone utilizzava una sorta di ritmo simile alla ginnastica, regolare, con un ritmo chiaro e un senso di movimento.

Ok, Suno supporta il caricamento e il campionamento di musica locale, quindi ho cercato appositamente la musica per la terza serie di esercizi di ginnastica trasmessi in modo che l'IA la studiasse sicuramente correttamente questa volta.

In modalità personalizzata, è possibile anche scegliere la larghezza e la consapevolezza dello stile, ma purtroppo si tratta di funzionalità a pagamento. Questa volta, possiamo utilizzare solo elementi in stile broadcast come fonte di ispirazione generale.

Meglio questa volta? Un po' meglio. Il modello ha riconosciuto che la terza serie di esercizi trasmessi era in stile jazz, quindi questa volta la musica generata era molto allegra, con un ritmo libero e ritmato, che inaspettatamente si adattava un po' al gioco "Skill Gomoku".

Ma non era ancora del tutto a posto, quindi ho cancellato completamente la descrizione dello stile e ho riprovato. L'IA è rimasta in silenzio, generando semplicemente quattro tracce finite, ognuna con uno stile diverso. Non c'erano solo ballate e canzoni allegre, ma persino una versione folk…

Suno: Non ho proprio tempo per perdere tempo con te.

Dopo più di una dozzina di versioni, nessuna è riuscita a eguagliare il talento di Teacher Skill Five. E questo anche utilizzando il testo originale. AI, non sei all'altezza!

L'effetto comico del gioco "Skill Gomoku" si riduce in definitiva all'opposto dell'intelligenza artificiale. L'intelligenza artificiale analizza e apprende le caratteristiche della musica, e la musica che produce è teoricamente valida e accattivante, in linea con le tendenze attuali, eppure nessuna di queste può eguagliare gli elementi memorabili dell'originale.

Strano, la versione originale non era stata scritta anche da AI?

Non sappiamo ancora esattamente quanto l'intelligenza artificiale abbia contribuito al processo di creazione originale. Ma questa riproduzione mi fa credere che, anche se avesse contribuito, non avrebbe superato il talento del creatore.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo