Il modello di immagine raw con cui sta giocando l’intera rete, l’ho usato per rilasciare in anticipo l’iPhone 17

Ultimamente, Nano Banana è apparso su WeChat Moments, TikTok e Xiaohongshu. Questo modello a forma di banana sembra destinato a rendere obsoleto il termine "photo-editing", portando direttamente 10 milioni di nuovi utenti su Gemini e rendendolo un successo strepitoso.

C'è una quantità impressionante di gameplay non convenzionale di vari maestri, tra cui figure 3D e foto con i pezzi grossi. Sebbene Nano Banana sia incredibilmente potente, la sezione commenti riceve ancora molte domande e richieste dagli utenti.

In primo luogo, la barriera iniziale all'ingresso ha scoraggiato molti utenti, rendendo l'utilizzo di ChatGPT ancora più difficile rispetto a quello in Cina. Durante il processo di editing delle immagini, le lamentele più comuni riguardavano la risoluzione insufficiente delle immagini di Nano Banana e il rapporto d'aspetto incontrollabile.

A dire il vero, anch'io mi sento un po' esigente, ma non mi aspettavo che qualcuno ascoltasse davvero queste richieste e le implementasse, e si trattava del nostro produttore nazionale.

Proprio ora, Volcano Engine ha lanciato ufficialmente il modello di creazione di immagini Doubao Seedream 4.0.

Oltre alle funzionalità principali, come "eccellente coerenza del soggetto, creazione flessibile di più immagini e generazione continua di immagini", Seedream 4.0 ha anche una caratteristica che Nano Banana non ha : il supporto per l'output di immagini ad alta definizione fino a 4K .

Questo è anche il primo modello a supportare immagini RAW multimodali fino a 4K. Attualmente, gli utenti aziendali possono sperimentare Volcano Ark in anteprima.

I singoli utenti non devono essere gelosi, poiché la versione 4K sarà disponibile per la prima volta alle 20:00 di stasera. Cercate "Volcano Ark Experience Center" per provarla in prima persona.

Seedream 4.0 è disponibile anche su Doubao e Jimeng e supporta un output fino a 2K.

Dobbiamo vedere come si comporta realmente. APPSO ha avuto un beta tester per qualche giorno e vorremmo dargli un po' più di potenza rispetto al Nano Banana.

Dopo il test effettivo, ho scoperto che, sebbene non possa essere considerata perfetta, la grafica nazionale è effettivamente entrata in una nuova fase.

Ho rilasciato in anticipo l'iPhone 17 Air per Apple

Stasera si terrà la conferenza autunnale di Apple. Non c'è bisogno di stare alzati fino a tardi per seguire la diretta. APPSO aiuterà Apple a lanciare online per prima l'iPhone 17.

Abbiamo utilizzato Seedream 4.0 per generare due pagine prodotto per il famoso iPhone 17 Air, il modello di punta ultrasottile più venduto quest'anno.

Fare riferimento alla pagina ufficiale del sito Web di iPhone 16Pro, sostituire il telefono e il relativo copywriting per garantire il pieno sapore fruttato

Questa composizione sembra un po' antiquata. Regolate il carattere piccolo e aggiungete la scritta più in evidenza, "Solo 5,5 mm di spessore". Potete vedere che l'angolazione dell'iPhone 17 Air generata da Seedream4.0 è appena parallela al lato destro della lettera A, che ha l'estetica di un designer senior.

Questa volta, non abbiamo chiesto a Tim Cook di presentare il prodotto, ma abbiamo invece invitato un robot umanoide Tesla a fare un cameo. Era la solita scena familiare, lo stesso familiare "Buongiorno" (doge).

Questa serie di immagini utilizza tre immagini di riferimento: un robot umanoide, un iPhone 17 Air e le immagini scattate da Cook sul posto. La coerenza di Seedream4.0 è davvero notevole.

In realtà, c'è un dettaglio incredibile che passa spesso inosservato. Prestate molta attenzione ai dettagli riflessi sul casco del robot nell'immagine generata. L'immagine originale è completamente nera. Ciò significa che Seedream 4.0 ha dedotto i riflessi previsti del robot basandosi sul cielo azzurro, sulle nuvole bianche e sullo sfondo dell'edificio nella Figura 3. I dettagli sono incredibilmente dettagliati.

Cerchiamo di essere un po' più fantasiosi. Si dice che l'iPhone 17 Air sia in preparazione per il telefono pieghevole del prossimo anno. APPSO ha anche utilizzato Seedream 4.0 per mostrare a tutti un'anteprima delle "foto reali" del primo telefono pieghevole di iPhone.

I lettori più attenti avranno notato che assomiglia un po' al nuovo telefono tri-fold di Huawei. Sì, l'ho usato come immagine di riferimento e ho sostituito la fotocamera e il logo Apple. I dettagli della composizione, dello sfondo e della filigrana sono stati tutti perfettamente preservati.

Allora costruisci un telefono Apple pieghevole in tre parti. In realtà, nessuno sa cosa sia successo tra Apple e Huawei quella notte.

Se fosse Steve Jobs, come lancerebbe questo prodotto? Invitiamo l'IA Steve Jobs a tornare per un periodo limitato.

La figura familiare, con la sua aura che penetra lo schermo, ci fa esclamare di nuovo "Incredibile".

Oltre ad essere divertente, è anche molto utile

La popolarità di Nano Banana deriva non solo dal suo successo sui social media, ma anche dalla sua lungimiranza tecnologica. Che si tratti di coerenza, modifica parziale, cambio di colore o combinazione di più immagini, può essere applicato direttamente all'e-commerce, al marketing, ai social media e ad altri scenari.

Per quanto impressionante possa essere la tecnologia, se non può essere applicata a scenari di produttività, è solo un giocattolo.

Ora vediamo se Seeddream 4.0 può essere utilizzato in alcuni scenari pratici.

Prendiamo innanzitutto la luna rossa che ultimamente è comparsa su tutti gli schermi e integriamola nel design delle sneaker.

Voglio anche vedere questo paio di sneaker da diverse angolazioni. Mi basta inserire un prompt come "Genera una sneaker bianca, mostrando la vista frontale, laterale e dall'alto". Che si tratti di bozze o schizzi di design, è possibile farlo in un unico passaggio.


E se volessi trovare un modello per mostrare il prodotto in diverse pose? Non importa se non riesco a trovare una foto di riferimento adatta, posso semplicemente disegnare un omino stilizzato.

Seeddream 4.0 è in grado di controllare efficacemente la coerenza della postura del modello in base a disegni fatti a mano, ottenendo al contempo ragionevoli variazioni negli angoli e prestazioni accurate nella presentazione multi-angolo.

Come nel caso seguente, non ho specificato le posizioni in piedi delle due persone nelle parole chiave, quindi le 4 foto generate includono entrambe le posizioni in piedi e l'effetto è ottimo. È come una festa premurosa B. Se le tue esigenze non sono molto chiare, prenderà in considerazione tutte le possibili situazioni e ti fornirà i prodotti finiti tra cui scegliere.

▲ Suggerimento: combina l'uomo nella Figura 1 e la donna nella Figura 2 in un'unica immagine e fai riferimento alla posa nella Figura 3

Se abbracciare è troppo semplice, eseguiamo un'azione di sollevamento e questa volta specifichiamo un'immagine di sfondo aggiuntiva.

▲ Suggerimento: combina la Figura 3 e la Figura 1 in un'unica immagine, usando la posa della Figura 2 come riferimento. La Figura 1 mostra il bambino che viene sollevato. Usa anche la Figura 4 come sfondo. Lo sfondo nella Figura 4 è del Monte Langlang e i due personaggi sono Luo Xiaohei e il suo maestro.

Seedream 4.0 riesce a gestire molto bene anche l'immagine di riferimento di quattro persone, mantenendo la postura coerente con quella della figura stilizzata.

▲ Suggerimento: disponi i quattro personaggi nella Figura 1 (i quattro maestri e apprendisti di Viaggio in Occidente, ovvero il Monaco Sha, il Monaco Tang, Pigsy e il Re Scimmia) secondo la postura nella Figura 2 (Arhat impilati), con il Monaco Sha, il Re Scimmia e Pigsy in basso e il Monaco Tang in alto.

Se vogliamo cambiare il trucco della modella, abbiamo scoperto che Seeddream 4.0 riesce a cogliere con precisione anche le caratteristiche delle diverse acconciature: la morbidezza dei capelli lunghi e lisci, l'efficacia delle acconciature raccolte e la curvatura dei capelli ricci sono tutte presentate in modo chiaro.

Allo stesso tempo, lo sfondo e il corpo umano rimangono estremamente coerenti, senza sfocature o problemi di deformazione dei bordi, ottenendo con successo una conversione precisa del trucco e delle acconciature, pur mantenendo le caratteristiche principali, con un notevole risparmio sui costi del trucco dei modelli.

Ciò che mi ha sorpreso di più è stata la generazione del disegno lineare. I disegni lineari sono solitamente semplici contorni che contengono solo i contorni e la struttura di base degli oggetti, privi di dettagli, colori e texture. In termini di funzionalità di conversione da schizzo a rendering, Seeddream 4.0 può trasformare semplici disegni lineari in prodotti finiti di alta qualità.

Non solo è in grado di riempire con precisione i colori intensi per rendere gli oggetti visivamente distinti, ma è anche in grado di elaborare luci e ombre in modo delicato e di simulare i materiali, come la texture della pelle delle borse e la lucentezza degli accessori in metallo.

La sua capacità di "rendering di alta qualità" è sorprendente. Oltre alle nature morte, include anche ritratti e scene. Ha pensato a tutto ciò a cui non avevi pensato.

A dire il vero, dopo l'aggiornamento di Seeddream 4.0, la gestione delle texture realistiche ha superato di gran lunga le mie aspettative.

Texture come la pelle e il metallo sono già molto stabili, ma quando ho visto come è stata generata la texture della pelle umana, sono rimasto comunque colpito.

La consistenza della pelle, le vene blu appena visibili, perfino la sensazione naturale dei peli del sudore sul polso e l'effetto trasparente della luce che colpisce la pelle… tutti i dettagli sono resi molto bene e, quando sono combinati insieme, esiste una sola parola: reale.

Qual è l'immagine di riferimento originale di questa serie di immagini?

Questo è tutto.

La riproduzione dettagliata è come se fosse una foto reale, soddisfacendo perfettamente i requisiti di adattamento fotografico del mondo reale. Ciò significa che il modello è in grado di "creare" in modo appropriato, offrendo prestazioni ragionevoli nell'ambito dell'immagine di riferimento e delle parole richieste.

Questa capacità creativa può essere sfruttata in modi più interessanti. Ad esempio, è sufficiente un'immagine vettoriale per generare un set completo di design periferici per APPSO.

▲ Suggerimenti: fai riferimento a questo LOGO e crea un design visivo del marchio per il nome del marchio APPSO, inclusi sacchetti per imballaggio, cappelli, scatole di carta, biglietti, braccialetti, cordini, ecc. Il rosso è il colore visivo principale, con uno stile divertente, semplice e moderno.

Le capacità creative di Seeddream 4.0 e la capacità di generare campioni direttamente hanno ridotto significativamente i costi di produzione. I risultati sono stati impressionanti, catturando lo stile fondamentale del brand: "giocoso, minimalista e moderno", integrando sapientemente il logo del brand in cover per smartphone, porta carte, cordini e cappelli.

Un altro aspetto positivo è che Seeddream 4.0 supporta l'output a una risoluzione massima di 4K, mentre l'output diretto a una risoluzione di 2K richiede solo pochi secondi, il che consente un output di livello professionale in scenari come l'e-commerce, lasciando più spazio alla post-produzione.

Un gameplay più malvagio

Inoltre, APPSO ha scoperto alcuni interessanti modi malvagi di giocare e vorrebbe condividerli con voi.

La figura da tavolo più elementare non è ovviamente un problema. Proviamo a lasciare che sia il personaggio stesso a tenere la figura.

Fonte dell'immagine: https://x.com/oden_ai_ai/status/1957414144417910924/photo/1

Suggerimento: crea un modello di personaggio da questa foto. Posiziona una scatola con l'immagine del personaggio stampata sopra e uno schermo di computer che mostri il processo di modellazione di Blender. Aggiungi una base rotonda di plastica davanti alla scatola su cui appoggiare il modello del personaggio. Prova a creare un'ambientazione interna.

▲ Suggerimento: Fotorealismo. La persona nella foto tiene in mano un modello, un modello di personaggio basato sul soggetto nella foto, nella sua stanza, sorridendo soddisfatta. Su una scrivania del computer nella stanza, uno schermo mostra il processo di modellazione di Blender. C'è anche una scatola con l'immagine del personaggio stampata sopra e una base rotonda di plastica davanti.

Non solo puoi tenerlo in mano, ma puoi anche appenderlo a una borsa. Il realismo e la coerenza delle foto sono davvero impressionanti.

▲ Suggerimento: Fotorealismo. Per prima cosa, trasforma questa foto in un grazioso ciondolo/portachiavi piatto in acrilico/portachiavi piatto in gomma e appendilo alla borsa LV/alla borsa nella seconda foto. Così potrà indossare la borsa con lo stesso ciondolo raffigurante il personaggio.

Oltre a realizzare statuette, l'abbiamo usato anche per creare foto con un forte stile fotografico, pur mantenendone l'autenticità. Il tuo fotografo di fiducia potrebbe essere Seedream 4.0.

Oltre a una solida coerenza e alle capacità di editing multi-immagine, Seedream 4.0 offre anche ampie capacità di conoscenza del mondo. Il modello di immagine raw può anche dedurre e prevedere, comprendendo a fondo le nostre parole e immagini, e le intenzioni che le sottintendono.

Ad esempio, abbiamo caricato l'immagine di una tazza che stava per cadere a terra e poi abbiamo inserito la parola chiave "Come dovrebbe apparire questa immagine tra un secondo?"

La tazza cadde a terra e si poté vedere l'acqua sul terreno, che rifletteva parte della tazza e la luce della finestra.

Oltre a sapere cosa accadrà in un secondo, Seedream 4.0 può anche usare la sua capacità di ragionamento per riordinare la nostra stanza.

▲ Suggerimento: piega la trapunta e i vestiti sul divano

Oltre a piegare ordinatamente i vestiti e pulire i pavimenti ricoperti di vernice, Seedream è anche in grado di mantenere la coerenza degli elementi esistenti all'interno dell'immagine durante la pulizia.

▲ Suggerimento: togli tutta la vernice e pulisci il pavimento (anche se sembra un tavolo)

Grazie alla sua capacità di ragionamento, esiste un modo di giocare ancora più entusiasmante.

Nell'esempio seguente, il riferimento caricato è la foto di una modella, che chiede a Seedream 4.0 di visualizzare i dettagli dei suoi abiti. L'istruzione ricevuta dalla modella è l'immagine dettagliata: la distanza tra le due dipende dalla modella stessa, che dovrà "capirla" da sola.

Il risultato è piuttosto buono. Non solo il modello è accurato, ma anche le istruzioni per la visualizzazione dei dettagli sono state seguite senza problemi. È quasi pronto per la pubblicazione immediata.

Seedream 4.0 è anche un buon strumento per generare emoji

Facendo riferimento ai suggerimenti del netizen @op7418, abbiamo anche creato diverse versioni di pacchetti di emoticon sui modelli di intelligenza artificiale. Se non ci riuscite una volta, basta pescare le carte ancora un paio di volte. Fortunatamente, la velocità di generazione è sufficientemente elevata.

▲ Suggerimento: aiutami a trasformare il personaggio in un adesivo con contorno bianco simile alla Figura 1 e aggiungi una frase giocosa con contorno bianco "XXXX".

▲ Immagine 1 (sinistra) di @fenxxxx, Immagine 2 (destra)

Forse hai visto il famoso dipinto "Mille miglia di fiumi e montagne", ma potresti esserti perso miliardi di dettagli.

Allo stesso modo, chi ha detto che non ci sia un grazioso Labubu in "La processione dell'imperatore Taizong per incontrare il monaco buddista Xuanzong"? E ho anche la sensazione che non ci sia alcun senso di disobbedienza quando un famoso Shiba Inu Kabosu, arrivato da tempi moderni, appare improvvisamente al banchetto in "Il banchetto notturno di Han Xizai".

Non è solo uno strumento per creare immagini, è anche una piattaforma di produttività creativa

Se dovessi descrivere Seedream 4.0 in una sola parola, direi "guerriero esagonale". È come un versatile direttore creativo unito a un team di produzione altamente efficiente, che ti consente di raggiungere rapidamente i risultati desiderati, offrendoti al contempo un maggiore controllo sul tuo processo creativo.

La velocità è la prima sensazione.

Basato sull'architettura DiT-MoE, Seedream 4.0 vanta un'efficienza di calcolo oltre 10 volte superiore rispetto alla generazione precedente, generando un'immagine ad alta definizione 2K in soli 1,8 secondi. Questo tempo di risposta di "secondo livello" si traduce in costi di tentativi ed errori estremamente bassi.

La stabilità è la pietra angolare della produttività.

La potente funzionalità di coerenza dei soggetti di Seedream 4.0 ti consente di mantenere inalterate le caratteristiche originali del tuo personaggio, sia che tu voglia cambiare la scena, lo stile o regolare la postura e la prospettiva, evitando così l'imbarazzo di "improvvisi cambiamenti di stile".

Per molti designer di e-commerce e marchi, l'intelligenza artificiale non consiste più nel cambiare il colore di un poster, ma nel poter fare riferimento a un logo e generare un set completo di design visivi del marchio con un clic, dalle confezioni ai braccialetti, con uno stile altamente unificato.

Le linee guida del marchio hanno iniziato a trasformarsi da un voluminoso manuale VI in righe di prompt eseguibili.

In quanto creatori di contenuti come noi, ciò consente di fare riferimento all'ambientazione di un personaggio e di generare storyboard di fumetti o libri illustrati di storie in batch, migliorando notevolmente l'efficienza e la coerenza della serializzazione dei contenuti.

Le parole del prompt sono ispirate da @阿真Irene

Inoltre, dopo l'uscita di Nano Banana, molti hanno sviluppato giochi leggeri o strumenti pratici basati su di esso. Abbiamo visto che questi strumenti consentono a un numero sempre maggiore di sviluppatori di piccole e medie dimensioni di trasformare rapidamente le proprie idee in prodotti e ottenere il riconoscimento degli utenti.

Seedream 4.0 è stato ampiamente discusso sui social media in questi ultimi tempi. Oltre all'entusiasmo, abbiamo anche notato che Seedream 4.0 non si accontenta più di essere un semplice giocattolo; punta a diventare una piattaforma di produttività creativa scalabile e commercialmente valida .

Testo di Li Chaofan, Mo Chongyu, Liu Ya e Zhang Zihao

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo