Esilarante! I Guerrieri di Terracotta ballano il K-Pop sull’app Qianwen, e sono persino più agili delle tirocinanti!

Com'è far ballare il K-Pop ai guerrieri di terracotta?

Se oggi vi imbattete in un video: un guerriero di terracotta di 2000 anni che tiene in mano un microfono e si muove a destra e a sinistra a ritmo di musica, i suoi movimenti sono più fluidi di quelli di un tirocinante e le sue espressioni facciali sono più precise di quelle di un idolo.

Non c'è bisogno di farsi prendere dal panico: questo è solo un altro esempio di come l'intelligenza artificiale stia creando scalpore.

Questa scena contrastante, bizzarra e divertente proviene da una funzionalità recentemente aggiornata dell'app Alibaba Qianwen.

Grazie alla capacità di uscita audio e video simultanea di Wan2.5, il gameplay basato sull'intelligenza artificiale di Qianwen è stato ulteriormente migliorato! Con una semplice foto e un prompt, è possibile generare un video di "canto e ballo" con movimenti labiali precisi e fluidi, con una durata massima di 10 secondi e un'uscita 1080P.

▲ (Non preoccupatevi, ci sono altri esperti, sta arrivando la boy band dei Guerrieri di Terracotta con eccellenti doti canore e di ballo)

E non ci sono restrizioni. Che si tratti di foto vere, teneri animali domestici, personaggi di anime, cimeli culturali o personaggi dei cartoni animati, l'app Qianwen può dar loro vita.

Naturalmente, è necessario chiarire subito una cosa: l'audio nel video non è preregistrato, né si tratta di una semplice sintesi vocale, né si basa su un modello predefinito. Viene invece generato dall'intelligenza artificiale in base alla propria comprensione e al proprio ragionamento. L'intelligenza artificiale abbinerà automaticamente il timbro e la melodia appropriati al personaggio.

Potrebbe essere un po' diverso da come lo cantiamo noi, ma è proprio questa interpretazione unica "dal sapore di intelligenza artificiale" che lo rende così delizioso!

Un'immagine + una frase e tutto può essere cantato e ballato.

Con l'avvicinarsi del Capodanno lunare, "Gong Xi Fa Cai" di Andy Lau sta per uscire.

Stanchi della versione del Re Celeste? Allora perché non provare a cantare il Dio della Ricchezza in persona? Ho caricato un'immagine del Dio della Ricchezza e ho inserito il prompt. E indovinate un po'? Il Dio della Ricchezza ha preso vita, ondeggiando a destra e a sinistra mentre cantava "Congratulazioni per la tua fortuna, la ricchezza arriverà sicuramente!"

Questa è davvero la benedizione del Dio della Ricchezza.

Pertanto, quando lo consegnate ai vostri anziani per gli auguri di Capodanno, sarebbe irragionevole non raddoppiare l'importo nella busta rossa.

Anche il grande poeta Li Bai dovette stare al passo con i tempi.

Ho tirato fuori un ritratto di Li Bai e gli ho chiesto di cantare la canzone di tendenza del momento "Dao Ma Dao Ma". Due minuti dopo, Li Bai "è tornato in vita" dal dipinto, ondeggiando a destra e a sinistra al ritmo della melodia orecchiabile.

Sfortunatamente, l'IA non è riuscita a fargli eseguire un'autentica danza Dao Ma, quindi sembra che la sua comprensione della musica e della danza abbia ancora bisogno di pratica. Tuttavia, sebbene i passi di danza fossero fuori tema, la scena complessiva generata dall'IA aveva un umorismo unico, e bisogna dire che Qianwen App è davvero il re dell'astrazione tramite IA.

Zootropolis 2 è diventato di recente un successo al botteghino e il classico duo Nick e Judy è tornato ad essere popolare.

Visto che sono già così popolari, perché non farli cantare in duetto? Nick canta "Friends for Life", mentre Judy ondeggia e annuisce accanto a lui; tra i due sembra esserci una certa sintonia. L'intera scena sembra tratta da uno spin-off ufficiale del musical.

Tuttavia, lo stile canoro unico di Nick è diventato inaspettatamente fonte di risate in tutto il video, e l'app Qianwen ha recentemente regalato risate a gente comune che lavora nelle loro monotone giornate lavorative.

Ricordate come si presentò Xu Song all'epoca? "Ciao a tutti, sono Vae e questo è il mio primo album originale, 'Customized', che sta per uscire". Pensavo: perché non farne fare uno simile anche a Einstein? Aprì la bocca e recitò solennemente questo classico, annuendo a ritmo, e la cosa ancora più sorprendente è che i movimenti delle sue labbra si sposavano perfettamente.

Tutto quello che posso dire è che Xu Song resterebbe senza parole dopo aver visto questo, mentre Einstein scoppierebbe a piangere.

Tom e Jerry è un classico cartone animato pantomimico, ma con l'intelligenza artificiale possiamo far cantare Tom e persino fargli fare l'elegante danza del pinguino, attualmente molto popolare. Quanti punti gli daresti su 10?

Infine, ho chiesto alla Gioconda, che era rimasta al Louvre per 500 anni, di indossare gli occhiali da sole e di iniziare a cantare. Una canzone orecchiabile abbinata a un capolavoro di Leonardo da Vinci: questa combinazione, da sola, è arte performativa. Un altro modo per rivitalizzare i reperti culturali, lo capisco!

1000 immagini P + video in diretta = felicità²

Naturalmente, l'APP Qianwen può generare non solo video, ma anche immagini.

Questo aggiornamento integra il modello di generazione e modifica delle immagini Qwen-Image, recentemente rinnovato, raggiungendo risultati straordinari in termini di coerenza nell'editing delle immagini, conversione multi-vista e fusione multi-immagine. In parole povere, inserendo comandi nell'interfaccia di dialogo, le funzionalità del modello vengono richiamate automaticamente, consentendo una varietà di operazioni intuitive e intuitive.

Ad esempio, cambiando posa: i guerrieri di terracotta che originariamente erano seduti in posizione eretta, dopo aver ricevuto l'ordine hanno subito assunto una postura eroica, tenendo in mano un pallone da basket e tirando a mezz'aria, il che è stato visivamente sorprendente.

Ad esempio, considera la trasformazione dei vestiti: vuoi pubblicare una foto del tuo outfit nel weekend ma sei troppo pigro per cambiarti? Carica un selfie e, con una sola frase, puoi trasformare la tua maglietta in un abito, o persino vestire la statua di David con una maglia di Messi.

Quanto più un'idea è fantasiosa, tanto più creativa può essere l'intelligenza artificiale.

A questo punto possiamo sperimentare tecniche avanzate:

Modifica prima l'immagine, poi rigenera il video.

In parole povere: prima, modifica l'immagine con Photoshop per ottenere l'aspetto desiderato, poi falla muovere, cantare e ballare. Questa combinazione massimizza la libertà creativa.

Ad esempio, lo scorso fine settimana ho riguardato Titanic e poi all'improvviso mi è venuto in mente: e se usassimo Photoshop per inserire Elon Musk e Ultraman nella classica scena di prua di Titanic?

Il primo passo, l'immagine grezza: ho caricato le foto di noi due, ho inserito il comando e l'app Qianwen ha generato direttamente un'immagine composita ad alta definizione per me, una versione maschile di Elon Musk e una versione femminile di Ultraman. Si è scoperto che si tratta di una coppia di amanti sfortunati, il cui odio dura più a lungo del loro amore.

Il secondo passaggio consiste nel generare un video: sulla base di questa immagine, continua inserendo "Aiutami a generare un video in cui la persona nell'immagine canta mentre fa movimenti di volo, la brezza marina deve essere forte e le emozioni devono essere intense".

Poi… due giganti dell'industria tecnologica hanno iniziato a cantare appassionatamente sul mio telefono.

Una volta arrivato a questo punto, non sono più riuscito a fermarmi.

Poi ho chiesto all'app Qianwen di generare un fagiolo rosso personificato. Poi gli ho chiesto di cantare la sua versione di "Hakimi North and South Green Bean, Ashiga Ashi" con la sua melodia.

Di conseguenza, questo piccolo fagiolo rosso, con i suoi enormi occhi, agitava le sue piccole mani e ondeggiava a destra e a sinistra seguendo un ritmo orecchiabile. Tuttavia, la sua voce non era affatto carina; era piuttosto roca , e il suo potere distruttivo era quasi tre ordini di grandezza superiore a quello dell'originale.

Ascoltarlo è come mangiare funghi selvatici dello Yunnan: la combinazione di immagini e suoni crea dipendenza.

Visto che è possibile esibirsi da solisti, perché non formare un gruppo per debuttare? Ho avuto un'ispirazione improvvisa: perché non far formare una band ai personaggi principali dei Quattro Grandi Romanzi Classici?

Ci sono andato dritto. Per prima cosa, ho usato la funzione di fusione delle immagini dell'app Qianwen per modificare con Photoshop le cinque figure classiche in una formazione di band perfettamente posizionata:

Sun Wukong era il cantante solista, Guan Yu suonava la chitarra elettrica, Lin Daiyu sedeva alla tastiera, Wu Song suonava la batteria e Cao Cao suonava il basso. Dopo aver scattato le foto in costume, la parte più semplice era farle muovere. Due minuti dopo, era nato un concerto rock che trascendeva il tempo e lo spazio.

Devo dire che questa generazione di IA sa davvero come giocare.

Un'immagine + una frase = video virale di 10 secondi. Non serve alcun software di editing, non servono effetti speciali, e nemmeno capacità di canto o ballo. Tutto ciò che serve è un'immaginazione sufficientemente sviluppata, e l'intelligenza artificiale può realizzarlo per te.

Oltre a essere un po' uno scherzo, questa funzione è anche molto pratica se usata seriamente.

I video degli auguri di Capodanno possono essere affidati all'intelligenza artificiale, i festeggiati possono ballare per gli amici, i programmi delle feste aziendali annuali non mancheranno mai di creatività e persino le confessioni d'amore possono essere rivisitate…

Naturalmente, se vuoi solo divertirti un po', apri l'app Qianwen, carica un'immagine, digita la tua idea bizzarra e lascia il resto all'IA. In 2-5 minuti, avrai un video virale che diventerà sicuramente virale sui social media.

A quanto pare, la felicità nell'era dell'intelligenza artificiale è davvero così semplice.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo