Nano Banana Pro ha fatto scalpore a tarda notte, ma la vera novità non sono state le immagini generate dall’intelligenza artificiale.

Ultraman affronta il suo momento più buio.

L'offensiva AI di Google non accenna a placarsi. Se qualche giorno fa la falce del Gemini 3 Pro aveva toccato il campo del "front-end", oggi è il settore del design a essere sconvolto, con il nuovo Nano Banana Pro (Gemini 3 Pro Image) che ancora una volta sferra un duro colpo alle capacità di generazione di immagini.

Il lavoro dei giovani designer è probabilmente a rischio.

Le funzioni principali sono le seguenti:

  • Supporto risoluzione: può riprodurre immagini con risoluzione 1K, 2K e 4K.
  • Modifica multi-round: supporta flussi di lavoro di modifica delle immagini conversazionali e multi-round
  • Sintesi multi-immagine: è possibile combinare fino a 14 immagini di input in un'unica immagine di output.
  • Miglioramento della ricerca: integra le funzionalità di ricerca di Google per fornire un supporto informativo più accurato e aggiornato.

Basta con le supposizioni! Nano Banana Pro ha finalmente imparato a pensare prima di disegnare.

Le caratteristiche distintive di Nano Banana sono la forte coerenza dei personaggi e l'editing dei dialoghi, mentre l'evoluzione fondamentale di Nano Banana Pro risiede nella completa integrazione delle capacità di pensiero profondo di Gemini 3 nel processo di generazione delle immagini.

Prima di generare un'immagine, esegue una simulazione fisica e una deduzione logica, anziché limitarsi a "indovinare" in base a schemi visivi.

▲Suggerimento: disegna un'immagine a quattro riquadri, in cui ciascuna delle quattro immagini raffigura lo stesso giovane che indossa un cappello di paglia e pronuncia le parole "I", "up", "early" e "eight". L'aspetto dell'uomo deve rimanere coerente, i movimenti delle sue labbra devono corrispondere accuratamente alla pronuncia di ogni parola e lo stile generale deve essere uniforme. Formato 16:9, 4K.

La comprensione intermodale è dimostrata in modo più approfondito anche nel Nano Banana Pro.

Grazie alle funzionalità di ragionamento multilingue avanzate di Gemini 3, puoi generare direttamente testo in più lingue oppure localizzare e tradurre i tuoi contenuti con un solo clic.

Un amico mi ha mandato un fumetto e ha chiesto al modello di colorarlo e di tradurre in cinese il testo inglese nei fumetti. Il Nano Banana Pro l'ha colorato in modo pulito, con illuminazione naturale e un riconoscimento del testo accurato. Anche il layout del testo inglese si adattava perfettamente alla forma dei fumetti. L'intero processo, dal riconoscimento alla traduzione alla riorganizzazione, è stato fluido, come se avesse davvero "capito" l'immagine.

▲Suggerimento: traduci il testo nell'immagine in cinese e coloralo, lasciando tutto il resto invariato.

In alternativa, fumetti multilingue, poster internazionali e materiali promozionali che i designer in passato dovevano modificare ripetutamente possono ora essere gestiti dall'intelligenza artificiale in un unico passaggio. Ad esempio, il modello può tradurre l'inglese di un poster inglese in cinese. Questa elaborazione fluida, dal riconoscimento e dalla traduzione alla progettazione, è proprio l'aspetto più potente dell'architettura multimodale nativa.

In termini di capacità di generazione di testo, Nano Banana Pro offre prestazioni eccezionali. Che si tratti di un breve slogan o di un intero paragrafo, il testo può essere letto chiaramente e supporta persino la composizione tipografica più precisa con diverse texture, font e stili calligrafici.

▲Parole chiave: Le illustrazioni sono nello stile delle antiche illustrazioni di libri cinesi, raffigurando Guan Yu seduto accanto a una lampada a olio, vestito con una tunica da battaglia a maniche larghe, con un'espressione concentrata e composta. Sul tavolo ci sono foglietti di bambù degli *Annali delle Primavere e degli Autunni*, un coltello dorato, un pennello da scrittura e altri manufatti, resi con linee delicate, che preservano lo stile della stampa antica. Lo sfondo è semplicemente delineato con pochi tratti che raffigurano un angolo, un paravento e un porta-armi, semplici ma intrisi di un fascino antico. I colori sono principalmente ocra chiaro, inchiostro grigio e azzurro pallido, presentando il sapore culturale e l'atmosfera storica delle antiche illustrazioni di libri, in un rapporto 4:3.

Il limite di 64k token di input consente di comprendere testi estremamente lunghi. Ciò consente una migliore comprensione di qualsiasi cosa, dagli storyboard dettagliati ai complessi requisiti di formattazione multilingue.

▲Suggerimento: Genera un dipinto antico in 4K con la seguente iscrizione: "Quando la luna sarà limpida e luminosa? Alzo la mia coppa per chiedere al cielo. Mi chiedo che anno sia stasera nel palazzo celeste. Desidero cavalcare il vento e tornare, eppure temo le torri di giada e i palazzi di cristallo, dove il freddo è insopportabile a tali altezze. Danzo con la mia ombra, quanto diversa dal mondo degli uomini! La luna gira attraverso il padiglione rosso, abbassa la sua luce attraverso le finestre ricamate, illuminando la mia insonnia. Non dovrebbe esserci risentimento, eppure perché la luna è sempre piena quando siamo separati? Le persone provano dolore e gioia, separazione e riunione; la luna ha le sue fasi di crescita e di declino, e queste cose sono sempre state imperfette. Desidero solo che possiamo vivere tutti a lungo e condividere la bellezza della luna, anche da lontano."

Risolvendo l'annoso problema della bassa risoluzione del suo predecessore, Nano Banana Pro aumenta la qualità dell'immagine a 4K e consente di impostare liberamente qualsiasi rapporto d'aspetto. Poster cinematografici, sfondi widescreen e layout di pannelli verticali possono essere generati direttamente.

Nano Banana Pro supporta anche la modifica combinata di un massimo di 14 immagini di input, mantenendo la coerenza dell'aspetto fino a 5 caratteri.

Grazie alle funzionalità di dialogo multi-turn, gli utenti possono modificare e integrare continuamente più materiali fino a ottenere l'effetto desiderato. Che si tratti di trasformare schizzi in prodotti o progetti in edifici 3D realistici, il passaggio dal concept al prodotto finito è semplice.

▲Suggerimento: Doraemon e Li Bai stanno bevendo insieme sotto la luna. La luna piena è alta, antichi padiglioni e torri si ergono nelle vicinanze. Doraemon indossa abiti della dinastia Tang, Li Bai tiene in mano una brocca di vino e altri contenitori per il vino sono disposti su un tavolo di pietra. La scena è eterea, un mix di stili artistici cinese e giapponese, con dettagli squisiti.

Ancora più avanzata è la capacità di controllare le idee creative a livello professionale.

È possibile selezionare, perfezionare o trasformare qualsiasi parte di un'immagine, dalla regolazione dell'angolazione dell'obiettivo alla modifica della messa a fuoco, fino all'applicazione di correzioni colore avanzate e persino alla modifica dell'illuminazione della scena, trasformando il giorno in notte o creando effetti bokeh. Queste attività che un tempo richiedevano un lavoro meticoloso in Photoshop ora possono essere eseguite con una sola frase.

▲Suggerimenti: Trasforma la [fotocamera] della foto caricata in un'illustrazione cartoon audace e colorata, mantenendo il resto della foto realistico e invariato. Dettagli in stile cartoon: contorni neri spessi, colori piatti vibranti (come ciano, magenta, giallo, rosa brillanti), effetti di schizzi e gocce di vernice, energia giocosa da fumetto. La maggior parte delle gocce scorrono verso il basso. L'oggetto cartoon dovrebbe sembrare che si stia sciogliendo o esplodendo di colori, fondendosi naturalmente con la foto reale. Mantieni tutti gli altri elementi (sfondo, altri oggetti, ambiente) fotorealistici senza alterazioni. Alta risoluzione, estetica pop-art, contrasto surreale tra realismo e cartoon.

Cerca + Genera = ? Google fornisce la risposta definitiva.

Se la ricerca è l'"emisfero sinistro" di Gemini 3, allora la generazione di immagini è il suo "emisfero destro".

Questa è anche la funzionalità più sottovalutata e al contempo rivoluzionaria dell'architettura di Nano Banana Pro (Gemini 3 Pro Image). La ricerca tradizionale prevede che l'utente effettui la ricerca, il motore di ricerca fornisca un link, l'utente clicchi sul sito web e il sito web fornisca l'interfaccia. Nano Banana Pro, tuttavia, introduce funzionalità di miglioramento della ricerca (Grounding with Search).

Quando un utente richiede un'immagine visiva che illustri il suo viaggio di 2 giorni a Guangzhou, Nano Banana Pro genera un'immagine che include una mappa dettagliata dell'itinerario, annotazioni in cinese e inglese e foto delle attrazioni.

Ad esempio, Nano Banana Pro può recuperare le ultime condizioni meteorologiche dalla ricerca in base ai prompt e quindi trasformare dati chiave come temperatura, velocità del vento, umidità e tendenze meteorologiche in contenuti visivi vividi e ben progettati.

▲ Suggerimento: cerca informazioni meteorologiche in tempo reale a Guangzhou e crea un'infografica in stile pop art cinese, 4:3

Questa capacità è importante perché fornisce al processo di creazione una base fattuale, aggiornamenti in tempo reale e verificabilità. Si può affermare con certezza che la ricerca è davvero all'altezza della reputazione di Google come forza formidabile, sia in termini di profondità tecnologica che di comprensione della materia.

In termini di posizionamento del prodotto, Google ha adottato una strategia a doppio modello: la versione precedente di Nano Banana è pensata per l'editing quotidiano rapido e divertente, mentre Nano Banana Pro si concentra su esigenze professionali come composizioni complesse e qualità d'immagine di prim'ordine. Gli utenti possono scegliere liberamente in base alle proprie esigenze.

Per consumatori e studenti, Nano Banana Pro è ora disponibile a livello globale all'interno dell'app Gemini. Basta selezionare "Genera immagine" e abilitare la modalità "Riflessione" per utilizzarla. Gli utenti della versione gratuita riceveranno un credito limitato, superato il quale torneranno automaticamente alla versione originale di Nano Banana.

Gli abbonati a Google AI Plus, Pro e Ultra beneficiano di tariffe ancora più elevate. Negli Stati Uniti, gli utenti Pro e Ultra possono già provare Nano Banana Pro nella modalità AI di Ricerca Google. Nano Banana Pro in NotebookLM è disponibile anche per gli abbonati globali.

Vale la pena notare che Google ha adottato un approccio duplice alla questione della trasparenza dell'IA.

Tutti i contenuti generati dall'intelligenza artificiale saranno incorporati con una filigrana digitale invisibile SynthID e gli utenti potranno ora caricare direttamente le immagini nell'app Gemini e chiedere se sono state generate dall'intelligenza artificiale di Google. Questa funzionalità sarà presto estesa anche ad audio e video.

Ora che il Nano Banana Pro è così potente, la domanda è: come può la gente comune sfruttarne al massimo le capacità?

Bea Alessio, product manager di Google DeepMind, ha fornito una guida utente dettagliata che rivela molte informazioni chiave. Il modo più semplice per utilizzarla è semplicemente dire qualcosa e lasciare che il modello indovini cosa si desidera. Ma se si vuole raggiungere un livello professionale, è necessario pensare come un regista.

Una parola chiave completa dovrebbe contenere sei elementi: soggetto (chi o cosa), composizione (come inquadrare l'inquadratura), azione (cosa sta succedendo), ambientazione (dove), stile (quale estetica) e istruzioni di modifica (come modificare).

Per un controllo più preciso, è necessario chiarire ulteriormente: rapporto d'aspetto (poster verticale 9:16 o widescreen cinematografico 21:9), parametri dell'obiettivo (angolo basso, profondità di campo ridotta f/1.8), dettagli dell'illuminazione (momento d'oro della retroilluminazione, ombre allungate), direzione della correzione del colore (correzione del colore cinematografica, tendenza verso i toni ciano e verde), nonché contenuto e stile specifici del testo.

Ecco l'indirizzo ufficiale del blog: https://blog.google/products/gemini/prompting-tips-nano-banana-pro/

Questo stile di "guida fotografica" è ciò che distingue Nano Banana Pro dai tradizionali modelli di generazione di immagini. Comprende appieno i termini tecnici e li traduce accuratamente in output visivi.

Dopo aver visto tutto questo, non è difficile capire cosa Google stia cercando di comunicare se si considera la serie di prodotti lanciati negli ultimi giorni.

Che si tratti dell'anteprima di Gemini 3 Pro rilasciata qualche giorno fa o di Nano Banana Pro svelata oggi, Google sta cercando di dimostrare al mondo che il percorso verso l'AGI (Intelligenza Artificiale Generale) deve essere multimodale e nativo.

Solo un modello in grado di vedere, sentire, comprendere la struttura e la logica dei processi può "pensare" pienamente il mondo.

Da un punto di vista tecnico, la serie di modelli Nano Banana ha ufficialmente inaugurato la fase di "comprensione prima dell'espressione" per la generazione delle immagini.

Quando l'intelligenza artificiale inizia a comprendere i percorsi dei labirinti, le strutture degli oggetti, il significato del testo e persino la logica di interazione dell'interfaccia utente, non è più solo uno strumento di disegno, ma un agente intelligente con capacità di pensiero visivo.

Da una prospettiva aziendale, i costi di ragionamento estremamente bassi e l'emergere di interfacce utente generative cambieranno radicalmente la logica della produzione di contenuti e della distribuzione delle informazioni. L'Internet del passato era costituito da pagine web fisse, mentre l'Internet del futuro sarà più probabilmente costituito da interfacce che crescono in tempo reale in base alle esigenze.

Il design non sarà più un'attività esclusivamente umana e le interfacce non saranno più il risultato di livelli di perfezionamento da parte di un team. Sempre più contenuti visivi saranno prima affidati all'intelligenza artificiale e poi integrati o perfezionati dagli esseri umani. Google ha chiaramente previsto questo nuovo mondo e sta iniziando a spingere l'accesso a tutti.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo