Ecco i video creati con l’intelligenza artificiale in pochi secondi! L’ho usato per creare il Labubu più magico, e anche i principianti che non sanno scrivere prompt possono usarlo in pochi secondi.

Quest'anno, quasi ogni giorno, si possono vedere vari video di maestri dell'intelligenza artificiale inondare gli schermi, come Ultraman contro Pomask, Snow King contro Oriental Pearl, ASMR che tagliano metallo e vetro… Fa venire voglia a tutti.

Ma quando lo provi davvero, ti rendi conto che si tratta di pura roba da scatola cieca, e il costo è esorbitante. Le ore di fila sono all'ordine del giorno, i punti si consumano più velocemente della carta e i video risultanti hanno personaggi distorti, stili artistici strani o semplicemente ignorano i tuoi suggerimenti.

Di fronte all'"assassino video AI", c'è davvero un "Re delle Pergamene" che si erge .

PixVerse, divenuto popolare l'anno scorso con gli "effetti speciali di Venom", ha rilasciato oggi in sordina un grande successo: PixVerse V5 .

Questa volta hanno affermato di aver svolto un duro lavoro di "generazione quasi in tempo reale", ottimizzando in modo completo la dinamica, la chiarezza, la coerenza e le capacità di comprensione dei comandi.

▲ Homepage di PixVerse Cina

PixVerse V5 non è solo un piccolo aggiornamento, ma ha introdotto tre novità importanti:

1. Generazione rapida
Questo è sempre stato il punto di forza di pixVerse . Grazie a una tecnologia all'avanguardia, hanno compresso la generazione video fino al "secondo livello". Un cortometraggio a 360p può essere prodotto in 5 secondi e un video HD a 1080p in 1 minuto .

2. Meno simile all'intelligenza artificiale
La versione V5 sfrutta dati estetici estesi e l'adattamento delle preferenze umane (RLHF) per migliorare la comprensione del modello sia in termini di estetica che di realismo. Ciò migliora significativamente sia i movimenti complessi dei personaggi sia il realismo di luci e ombre, producendo immagini più vicine alla fotografia reale.

3. Punta e scatta <br /> Utilizzano la tecnologia "Unified Feature Space" per risolvere il problema sempre più preoccupante dell'"IA che non comprende il linguaggio umano". In parole povere, che le si fornisca una frase, un'immagine o un video di riferimento, può comprendere con maggiore precisione le proprie intenzioni , consentendo una creatività multimodale complessa con immagini, testo e video, offrendo un controllo davvero preciso.

Detto questo, non mi sto vantando, ma ho subito la licenza per la versione beta, quindi ci proverò.

Incredibilmente veloce, prezzo incredibile

La prima impressione che mi dà V5 è la velocità.

Nei test reali, un video a 360p di 8 secondi con audio impiega meno di 30 secondi dall'inserimento in coda al completamento, inclusi i tempi di inserimento in coda e di generazione; mentre un video a definizione ultra-alta 1080p impiega un po' più di tempo, ma in pratica dura circa 2 minuti.

▲ Confrontandolo con il video generato da Keling, il tempo di attesa è di 3 ore

Oltre a essere incredibilmente veloce, V5 è anche incredibilmente conveniente . Accedi ogni giorno per guadagnare 60 punti (creare un video muto a 360p di 5 secondi costa solo 20 punti) e sono disponibili numerose opzioni di abbonamento, che riducono notevolmente il costo di "pescaggio delle carte".

In confronto, Keling offre 166 punti al mese, e creare un video standard di 5 secondi costa anch'esso 20 punti. Attualmente, aggiungere effetti sonori a Keling è gratuito, mentre PixVerse richiede 10 punti aggiuntivi.

PixVerse V5 offre una soluzione piuttosto elegante ai due principali problemi di tempo e denaro . Ma che dire della qualità, un fattore fondamentale?

Prova di resistenza: dall'"apertura della scatola cieca" all'"esame del libro semi-aperto"

Andiamo dritti al punto e mettiamo alla prova la sua vera qualità con alcuni casi popolari.

Cominciamo con una foto semplice: una ripresa aerea della Guangzhou Tower.

Segnale: Riprese aeree cinematografiche con drone incentrate sulla Canton Tower. Girate su pellicola Kodak 35mm con grana. Riprese aeree dinamiche con movimento di ripresa circolare. Mantenimento della composizione, dell'inquadratura e dei dettagli strutturali dell'immagine di riferimento.

PixVerse fa un ottimo lavoro ed è veloce. Inoltre, a differenza di Veo 3, che attualmente genera solo video in 16:9, PixVerse può adattare automaticamente il video generato alle proporzioni dell'immagine caricata.

Successivamente, aumenteremo la difficoltà per testare la coerenza dei personaggi e la capacità di comprensione delle scene.

La nano-banana è stata molto popolare di recente. L'abbiamo usata per generare molte foto interessanti qualche giorno fa. Molte persone sui social media l'hanno usata anche per realizzare una storia completa, grazie alla sua potente coerenza nei personaggi, nell'ambiente, nello stile fotografico e nei contenuti.

Abbiamo trovato alcuni set di foto interessanti per verificare se PixVerse V5 potesse generare un video.

Per prima cosa, c'erano queste due ragazze che giocavano a biliardo, hanno iniziato davanti a farsi dei selfie, poi ho voluto che venissero dietro, prendessero le loro stecche da biliardo e iniziassero a giocare.

Il risultato è stato un po' sorprendente. La scena era ben curata, e anche i movimenti e le espressioni erano perfetti. Ma… inspiegabilmente hanno inserito una ragazza in più presa dalla strada!

Sembra che l'intelligenza artificiale abbia ancora difficoltà a comprendere le complesse interazioni tra due persone e le relazioni spaziali. Tuttavia, rispetto alla versione 4.5 (che in precedenza generava alcuni filmati in slow motion incomprensibili), la versione 5 almeno comprende meglio l'intenzione di "camminare".

Di recente, la nano banana è diventata popolare anche per realizzare figurine. Dopo aver scattato le foto, possiamo creare molti video interessanti.

Suggerimento: crea un modello di personaggio da questa foto. Posiziona una scatola con l'immagine del personaggio stampata sopra e uno schermo di computer che mostri il processo di modellazione di Blender. Aggiungi una base rotonda di plastica davanti alla scatola su cui appoggiare il modello del personaggio. Rendi il materiale in PVC trasparente e, se possibile, ambienta la scena in un ambiente interno.

Per prima cosa abbiamo utilizzato la nano banana per realizzare un labubu che sembrava stampato in 3D da noi stessi, e poi abbiamo inviato questa immagine a PixVerse.

▲ Suggerimento: la figura fisica marrone inizia a esplorare il desktop. Cammina verso sinistra, guarda a destra e infine salta di nuovo nella scatola accanto. Non spostare il labubu sulla scatola, mantienilo statico. L'animazione della figura 3D visualizzata sul computer è in modalità anteprima e ruota automaticamente.

Abbiamo anche utilizzato PixVerse per testare il convincente video di visione notturna con intelligenza artificiale, recentemente popolare. Onestamente, l'effetto è incredibilmente convincente. Il gattino, appollaiato sulla schiena dell'orso, saltella avanti e indietro con cautela, il suo contatto con l'orso e i suoi balzi sembrano autentici.

Se eseguire movimenti così semplici non fosse già abbastanza difficile, gli mostreremo direttamente un primo piano dei suoi passi sullo skateboard e gli faremo completare questi movimenti complessi.

PixVerse V5 genera anche i movimenti dei piedi in modo accurato e senza errori. L'abbiamo provato con la versione 4.5, e a volte le scarpe venivano indossate al contrario, e c'erano situazioni strane in cui lo skateboard sembrava molto caldo e i giocatori non sapevano come mettere i piedi.

Si può affermare con certezza che PixVerse ha effettivamente visto molti miglioramenti nella qualità della produzione. Nel complesso, la versione V5 ha visto miglioramenti significativi in ​​termini di coerenza e realismo, rendendo le immagini più simili a scatti reali piuttosto che a immagini eccessivamente ispirate all'intelligenza artificiale.

Un'altra cosa e l'assistente per la creazione degli agenti

Oltre alla conversione da immagine a video, PixVerse V5 offre anche una serie di funzionalità sofisticate ma pratiche, come la continuazione, il multi-agente e l'intelligenza dell'agente.

Il mio preferito è " Continua ". Attualmente, la maggior parte dei video realizzati con l'intelligenza artificiale può generare solo pochi secondi alla volta. Se si vuole realizzare un video lungo, bisogna catturare manualmente l'ultimo fotogramma e rigenerarlo, il che è molto noioso.

La funzione di riscrittura può estendere il video in modo relativamente fluido e supporta video della durata massima di 30 secondi. L'ho usata per realizzare un breve video di "Gatto che sogna di fare lo chef" e l'effetto è davvero carino.

Guarda il sorriso soddisfatto del gattino alla fine!

Per affrontare la sfida più grande, ovvero l'impossibilità di scrivere parole chiave, V5 ha anche lanciato un agente . Si tratta di una sorta di libreria di modelli creativi. Basta trovare un modello che ti piace, inserire le parole chiave e l'agente completerà automaticamente l'intero processo, dalla comprensione dell'intento alla generazione dello script e alla creazione del video.

Attualmente, PixVerse offre oltre dieci progetti all'interno della sua IA. Tra questi, il trampolino per conigli di recente successo, la possibilità di cambiare il materiale di un personaggio o di un oggetto, la possibilità di combinare più oggetti per creare una nuova specie e persino un'IA che permette al tuo animale domestico di indossare un costume da scarafaggio e di ballare.

Ho caricato la foto di Labubu che usavamo prima. Il processo dell'agente intelligente è ancora diverso dal modello. Il modello applica semplicemente una serie di parole di prompt, mentre l'agente intelligente PixVerse automatizza tutte le operazioni proprio come facciamo con l'agente ChatGPT, risparmiandoci il processo di generazione delle immagini in nano banana.

Anche se a volte commette degli errori, come scambiare la mia statuetta di Labubu per una statuetta che indossa un costume da scarafaggio marrone (mi dispiace, Labubu!).

Ma questo balletto ben fatto dimostra il potenziale della funzionalità dell'agente: abbassa notevolmente la soglia che impedisce alle persone comuni di realizzare la propria creatività.

Attualmente, PixVerse V5 e l'assistente per la creazione di agenti sono stati completamente lanciati sul web, sull'app e sull'API della piattaforma aperta della versione internazionale di PixVerse (https://app.pixverse.ai/) e della versione nazionale di Pai Wo AI (https://pai.video/).

Il video basato sull'intelligenza artificiale è finalmente passato dall'essere una "grande scommessa" a una "lotteria gratta e vinci"

Dopo un'esperienza completa, questo aggiornamento di PixVerse V5 può essere chiaramente riassunto in due parole: più veloce e migliore .

Forse non è ancora il modello video più perfetto, e risulta ancora confuso quando si gestiscono interazioni complesse tra più persone. Ma mi ricorda le immagini raw di Doubao. La qualità potrebbe non essere buona come quella di Midjourney, ma è gratuito, ha una grande quantità di contenuti ed è pieno di contenuti. Puoi provarlo.

▲ Doubao può generare 20 immagini alla volta

PixVerse V5 segue questa strada, cambiando completamente la mentalità creativa grazie alla sua velocità di generazione quasi in tempo reale e ai costi estremamente bassi di tentativi ed errori.

In passato, aspettare in coda per ore, bruciare innumerevoli punti e infine ricevere una scatola cieca insoddisfacente era un'esperienza dolorosa e frustrante. Ora, i risultati sono visibili in pochi secondi e, se non si è soddisfatti, si può semplicemente riprovare. L'esperienza è più simile a quella di un gratta e vinci della lotteria: facile, frequente e piena di attesa costante per il prossimo biglietto vincente.

Da questa prospettiva, la competitività principale di PixVerse V5 potrebbe non risiedere tanto nella qualità dei video che genera, quanto piuttosto nel fatto che offre un'esperienza di creazione ad alta frequenza e senza intoppi .

Quando il costo di apertura di una scatola cieca diventerà sufficientemente basso e quando l'instabilità dell'intelligenza artificiale non vi farà più sentire dispiaciuti per il vostro tempo e denaro, la creazione di video tramite intelligenza artificiale passerà davvero dall'altare di pochi grandi nomi alla vita quotidiana di ognuno di noi.

Testo|Li Chaofan e Zhang Zihao

Link originale: https://mp.weixin.qq.com/s/Q0_1JM-2tJa9VyMP0LYUBQ

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo