OpenAI rilascia Sora 2! È il momento del video AI GPT-3.5, oltre a un TikTok basato sull’intelligenza artificiale. Link per il download incluso.
Nel primo giorno di festa nazionale, OpenAI ha sganciato direttamente una vera e propria "bomba nucleare": Sora 2 e una nuova applicazione, Sora, che potrebbe rimodellare il panorama sociale.
Se Sora più di un anno fa ci ha mostrato l'alba dei video basati sull'intelligenza artificiale, Sora 2 ci trascina direttamente sotto il sole di mezzogiorno, che è abbagliante, cocente ed estremamente reale.
Questa volta non si tratta più solo di una dimostrazione tecnica, ma di una nuova app sviluppata direttamente per l'esperienza dell'utente finale.
OpenAI ha anche compiuto l'insolita iniziativa di definire direttamente Sora 2 il "momento GPT-3.5" per la generazione di video tramite intelligenza artificiale .
Dopo aver visto l'uscita e provato Sora 2, ho scoperto che questa volta la fiducia di OpenAI è davvero ben fondata e non si tratta solo di vanterie in stile Ultraman.
La definizione di realtà ha raggiunto un punto in cui deve essere rivisitata . Una specie completamente nuova, una nuova era, è iniziata.
Ultraman ha appena pubblicato un lungo articolo, in cui sostiene che questo sia il momento "ChatGPT" nel campo creativo e che la creatività darà il via a una "esplosione cambriana".
APPSO è stata la prima a fornirti un riepilogo completo delle funzioni principali, del nuovo gameplay e dell'utilizzo di Sora 2 e dell'app Sora.
Sora 2:
1. Per la prima volta viene ottenuta la generazione sincrona di audio e video: l'immagine viene generata simultaneamente con il suono ambientale di accompagnamento, i suoni di interazione con gli oggetti e persino il dialogo contestuale.
2. Fisica incredibilmente accurata: consente simulazioni fisiche più coerenti con le dinamiche del mondo reale.
3. Realismo notevolmente migliorato: la risoluzione delle immagini, i dettagli e il realismo sono stati tutti migliorati.
4. Può adattarsi in modo più flessibile allo stile desiderato dall'utente e la capacità di controllo dello stile è migliorata.
5. Maggiore coerenza e migliore conformità alle istruzioni per l'uso rispetto ai modelli precedenti.
Applicazione Sora
1. Cameo: la caratteristica più importante dell'app Sora è che gli utenti possono integrare se stessi o i propri amici in qualsiasi scena generata dall'intelligenza artificiale con effetti realistici.
2. Remix: gli utenti possono remixare o creare lavori secondari dai video degli altri e lavorarci insieme.
Come usare
1. Link per il download dell'app Sora (Attualmente solo iOS, non Android)
https://apps.apple.com/us/app/sora-by-openai/id6744034028
2. Versione web sora.com
3. Supporto regionale: a partire da oggi negli Stati Uniti e in Canada, altri paesi e regioni saranno gradualmente aperti
4. Meccanismo del codice di invito: sia l'app iOS che la versione web richiedono un codice di invito per essere utilizzate. Puoi scaricare l'app o visitare il sito web per registrarti e metterti in coda ora.
5. Prezzo: Sora 2 sarà inizialmente gratuito e avrà restrizioni d'uso relativamente flessibili. Gli utenti di ChatGPT Pro potranno anche provare i modelli Sora 2 Pro di qualità superiore sulla versione web.
6. OpenAI rilascerà anche un'API per consentire a più sviluppatori di unirsi.
Sora 2: Non più "generare", ma "simulare il mondo"
La svolta fondamentale di Sora 2 è l'evoluzione da "generatore video" a "simulatore di mondo".
Comprendere il mondo fisico è sempre stata la sfida più grande per i video di intelligenza artificiale. I precedenti video di intelligenza artificiale mostravano spesso oggetti che sembravano intrecciati o fluttuare in modo strano, proprio a causa dell'incapacità di comprendere accuratamente le interazioni nel mondo fisico.
Nel video di Sora 2, i movimenti ginnici, i continui salti mortali all'indietro sul posto, i tuffi, ecc. sono tutti molto naturali e in linea con la meccanica, e anche gli schizzi d'acqua sono conformi alla meccanica dei fluidi.
L'obiettivo finale di OpenAI è quello di costruire un "simulatore del mondo di uso generale", ovvero uno che consenta all'intelligenza artificiale di comprendere le regole fisiche del nostro mondo.
Sora 2 è un passaggio fondamentale in questo processo. Potete immaginarlo come uno studente impegnato a condurre costantemente esperimenti di fisica nel mondo virtuale, osservando innumerevoli video e ricapitolando le leggi di Newton, la meccanica dei fluidi e l'ottica.
Questa è una capacità estremamente importante per qualsiasi simulatore mondiale utile: bisogna essere in grado di simulare il fallimento, non solo il successo.
Questa simulazione della complessità del mondo reale è l'evoluzione più terrificante di Sora 2.
Un'altra importante innovazione di Sora 2 è che, mentre genera immagini, può anche generare in modo sincrono suoni ambientali corrispondenti, suoni di interazione con gli oggetti e persino conversazioni coerenti con il contesto.
Sebbene video e audio basati sull'intelligenza artificiale siano ormai molto potenti, il senso di realtà offerto dall'"integrazione di suono e immagine" è completamente diverso, il che conferisce ai video basati sull'intelligenza artificiale una vera e propria "anima".
Ciò pone requisiti estremamente elevati al modello. Ad esempio, se l'IA genera l'immagine di un gatto che cammina su una tastiera e miagola insoddisfatto, il modello deve conoscere l'aspetto di un gatto e imparare come miagola, collegando strettamente le due cose. Deve anche comprendere l'azione di "toccare la tastiera" per produrre il suono "clic".
Sora ha fatto anche un enorme passo avanti nella controllabilità, riuscendo a seguire istruzioni complesse attraverso più telecamere mantenendo con precisione lo stato del mondo, ed è relativamente bravo negli stili realistico, cinematografico e anime.
App Sora: costruisci la tua vita con l'intelligenza artificiale
L'app Sora supporta direttamente la generazione di modelli Sora 2. La caratteristica più interessante è probabilmente "Cameo". Basta registrare un breve video e audio (per la verifica della liveness e l'acquisizione delle immagini) e puoi "inserirti" in qualsiasi scena generata dall'IA.
Un secondo prima eri in ufficio e quello dopo potevi essere su un pianeta desertico in Dune, a guardare le due lune gemelle, mentre Sora aggiungeva luci e ombre realistiche al tuo viso basandosi sulla luce del deserto.
Ha un sapore simile alla versione video della banana nano?
L'intero processo è semplice come girare un video selfie. Sora catturerà la tua immagine, la tua voce e la tua espressione, e poi potrai "incollarti" nel video generato, come se stessi scegliendo un adesivo, e il risultato sarà 3D, fluido e altamente realistico.
Grazie a questa funzionalità, i dipendenti di OpenAI hanno già stretto nuove amicizie all'interno dell'azienda.
Puoi recitare come guest star nella stessa scena con i tuoi amici e mettere in scena il tuo blockbuster fantascientifico. Si tratta di un modo di comunicare completamente nuovo, che si evolve da testo, emoji e voce all'esperienza condivisa del video.
Nel feed dell'app Sora, ogni video che vedi è generato dall'intelligenza artificiale.
Se vedi un video che ti piace, clicca semplicemente su "Remix". Puoi modificare le parole del prompt, cambiare "Cyberpunk Rainy Night" in "Sunny Afternoon" o usare la funzione "Guest Star" per aggiungerti e diventare il protagonista della storia.
Sora manterrà la struttura o lo stile del video originale, consentendoti di modificarlo e ricrearlo, proprio come ripubblicare un post su Weibo con un commento.
Naturalmente, queste caratteristiche sollevano inevitabilmente preoccupazioni in materia di privacy e violazioni.
Sora ha adottato misure per affrontare questo problema. Solo l'utente può decidere chi può utilizzare la sua immagine "ospite". L'utente può revocare i diritti di accesso in qualsiasi momento o eliminare qualsiasi video contenente la sua immagine, anche se si tratta di una bozza non pubblicata creata da altri.
OpenAI ha affermato che i caricamenti contenenti immagini di persone reali tratte da film o video saranno vietati o severamente regolamentati nella fase iniziale, e i contenuti che coinvolgono bambini saranno severamente filtrati: le scene che contengono bambini saranno soggette a rigide soglie di revisione.
La realtà, questa volta non esiste davvero?
Sora 2 e Sora App offrono molto più che semplice divertimento: stanno rivoluzionando radicalmente la nostra definizione di "realtà".
L'uscita di Sora 2 potrebbe segnare l'inizio di una nuova era nel nostro rapporto con la realtà. Ognuno di noi ha acquisito la "magia" per rimodellare il mondo e se stesso.
Ora, forse non stiamo scegliendo attivamente di fuggire dalla realtà, ma la "realtà" stessa sta perdendo la sua posizione fondamentale come sistema di riferimento della nostra vita.
L'app Sora sta costruendo un nuovo centro di realtà con un'attrattiva estremamente forte, offrendo il massimo del divertimento creativo e della socializzazione. Non fornisce un "clone virtuale" esterno alla tua vita reale, ma cerca di diventare lo "sfondo predefinito" della tua vita.
Quando le tue relazioni sociali (avventure con gli amici nel mondo dell'intelligenza artificiale), il riconoscimento dell'identità (diventare un supereroe nel mondo virtuale) e l'espressione creativa (remixare il mondo) avranno luogo prima su questa piattaforma, il mondo fisico che ti richiede di "disconnetterti" occasionalmente per tornare indietro e occuparti delle bollette diventerà una "copia" a cui dovrai accedere solo occasionalmente.
Questo è davvero Ready Player One, quindi la fine di OpenAI è il metaverso? Zuckerberg annuì silenziosamente con un pollice in su.
La stessa OpenAI ha ammesso di essere scettica riguardo al flusso di informazioni puramente generato dall'intelligenza artificiale, ma alla fine è rimasta piacevolmente sorpresa dal senso di connessione interpersonale che ha portato.
Nel suo ultimo post sul blog, Altman ha affermato senza mezzi termini che la generazione di video basati sull'intelligenza artificiale potrebbe imboccare la strada della corruzione, portandoci tutti a essere risucchiati in un "flusso di informazioni spazzatura" ottimizzato dall'apprendimento per rinforzo.
Afferma che Open AI sta cercando di capire come realizzare un prodotto che offra piacere senza cadere in quella trappola.
L'app Sora è il loro primo successo. Sulla strada verso l'AGI, i progressi non dovrebbero riguardare solo la produttività, ma anche la creatività e la gioia.
Benvenuti in questo nuovo mondo guidato dall'immaginazione. Ora, la domanda è: hai il codice invito?
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.