Proprio ora è arrivata l’intelligenza artificiale più potente dell’anno! Elon Musk ha elogiato Gemini 3 e, dopo averlo provato, ho capito che ChatGPT dovrebbe preoccuparsi.

Proprio ora è stata rilasciata ufficialmente la versione di anteprima di Gemini 3 Pro.
Il mondo dell'intelligenza artificiale non è mai a corto di novità a fine anno, ma quest'anno è particolarmente rumoroso. Se non succede nulla di inaspettato, questo sarà il modello di grandi dimensioni più atteso al debutto oltreoceano nel 2025. Si potrebbe persino dire che il Gemini 3 Pro sia diventato l'unico protagonista in questa finestra temporale.

Negli ultimi due mesi, Google ha praticamente replicato le tattiche di marketing di Sam Altman. Dal rinomato responsabile della pubblicità di Gemini, Logan Kilpatrick, al CEO Pichai, gli addetti ai lavori hanno costantemente utilizzato un linguaggio criptico sui social media per alimentare l'hype e aumentare le aspettative per Gemini 3.

È interessante notare che il CEO di OpenAI, Sam Altman, ha appena pubblicato sulla piattaforma X: "Congratulazioni a Google per il lancio di successo di Gemini 3! Sembra un modello fantastico".
Considerando il racconto ammonitore di Ultraman, l'approccio dell'Enigmista è estremamente rischioso: se il prodotto non dovesse essere all'altezza, la sua reputazione potrebbe crollare all'istante. Tuttavia, Google nutre chiaramente un'immensa fiducia nel suo prodotto. Quindi, cosa offre esattamente Gemini 3 Pro questa volta?
La versione con salvataggio dati è la seguente:
- La versione di anteprima di Gemini 3 Pro supporta nativamente formati multimodali (testo, immagini, video e audio).
- Ha raggiunto il vertice della classifica LMARaena e si è distinto nei test più importanti, tra cui inferenza, multimodalità e programmazione.
- Capacità di ragionamento da record (GPQA Diamond 91,9%, MathArena Apex 23,4%)
- Disponibile la modalità di inferenza avanzata di Deep Think (disponibile nelle prossime settimane).
- Finestra di contesto da 1 milione di token + output da 64K
- È stato lanciato Google Antigravity, un nuovissimo IDE per l'intelligenza artificiale. I nuovi modelli ora integrano strumenti come Cursor, GitHub e JetBrains.
Meritandosi il nome "Pro", il modello di intelligenza artificiale più potente di Google è stato rilasciato a tarda notte.
Secondo Google, Gemini 3 Pro è il "modello più intelligente e adattabile" fino ad oggi, progettato per risolvere complessi problemi del mondo reale, in particolare quelli che richiedono ragionamento di livello superiore, creatività, pianificazione strategica e miglioramento incrementale.
I suoi scenari applicativi tipici includono: applicazioni con capacità di comportamento autonomo, programmazione avanzata, comprensione contestuale ultra-lunga, elaborazione cross-modale (come la combinazione di testo, immagini e audio) e sviluppo di algoritmi.
La versione di anteprima di Gemini 3 Pro ha raggiunto il primo posto nella classifica LMARaena con un punteggio di 1501, superando di gran lunga il suo predecessore in quasi tutti i principali benchmark di intelligenza artificiale. Ancora più importante, non solo è in grado di riconoscere il contenuto delle immagini, ma anche di comprendere informazioni implicite e relazioni contestuali.

Nello specifico, in termini di capacità di ragionamento, ha ottenuto un punteggio di ragionamento a livello di dottorato del 37,5% nell'"Humanity's Last Exam", del 91,9% nel test GPQA Diamond e ha stabilito un nuovo record del settore del 23,4% nel MathArena Apex.
Nel ragionamento multimodale, MMMU-Pro ha ottenuto un punteggio dell'81%, Video-MMMU ha ottenuto un punteggio dell'87,6% e SimpleQA Verified ha raggiunto un'accuratezza dei fatti del 72,1%.
Ciò significa anche che Gemini 3 Pro è in grado di fornire in modo affidabile risposte di alta qualità a una varietà di problemi complessi in ambito scientifico, matematico e in altri campi, e le sue risposte offrono approfondimenti diretti e autentici, dicendoti ciò che devi sapere, non solo ciò che vuoi sentire.
Oltre alla modalità standard, Gemini 3 offre anche un'opzione di inferenza avanzata chiamata Deep Think.
Questo modello di ragionamento avanzato ha ottenuto un punteggio del 41,0% nel "Last Test for Humanity", è migliorato al 93,8% nel GPQA Diamond e ha ottenuto un punteggio senza precedenti del 45,1% nel test ARC-AGI-2.

Tuttavia, questo modello è ancora in fase di valutazione della sicurezza e si prevede che verrà distribuito agli abbonati a Google AI Ultra nelle prossime settimane.
Oltre ai dati dei test, le prestazioni di Gemini 3 in scenari applicativi reali sono ancora più degne di nota.
Ad esempio, se trovi il ricettario di famiglia scritto a mano, che contiene ricette scritte da tua nonna in più lingue, Gemini 3 può riconoscere queste parole scritte a mano e organizzarle in un ricettario condivisibile.

Oppure, se vuoi imparare un nuovo campo, può elaborare articoli accademici e lunghe videolezioni, generando schede di apprendimento interattive. Può persino analizzare i video delle tue partite di pickleball per generare piani di allenamento mirati.
Questo perché Gemini è stato progettato fin dall'inizio per la comprensione multimodale, in grado di integrare vari tipi di informazioni come testo, immagini, video, audio e codice, insieme a una finestra di contesto fino a 1 milione di token e supporto per output fino a 64K.
Vale la pena ricordare che Gemini 3 è stato ufficialmente rilasciato e integrato nella Ricerca Google il suo primo giorno.

Non solo migliora significativamente la capacità del motore di ricerca di comprendere problemi complessi e di estrarre informazioni, ma genera anche interfacce visive dinamiche, strumenti interattivi e sistemi di simulazione in tempo reale basati su query, come un simulatore di fisica a tre corpi o un calcolatore di prestiti.

Inoltre, secondo le schede modello rilasciate da Google, Gemini 3 Pro adotta un modello ibrido esperto (MoE) sparso basato su Transformer, che supporta nativamente input multimodali come testo, immagini e audio. Il vantaggio principale di questa architettura è che il modello seleziona dinamicamente l'attivazione di alcuni parametri in base al contenuto di ciascun token di input, raggiungendo così un equilibrio tra consumo di risorse di elaborazione, costo del servizio e capacità totale.
Per quanto riguarda l'hardware, Gemini 3 Pro utilizza la Tensor Processing Unit (TPU) sviluppata internamente da Google per l'addestramento. Rispetto alla CPU, la TPU è più veloce nella gestione dei calcoli su larga scala richiesti per modelli linguistici di grandi dimensioni, e la sua ampia capacità e la memoria ad alta larghezza di banda le consentono di gestire modelli e batch di dati di grandi dimensioni.
Se sei uno sviluppatore, i cambiamenti apportati da Gemini 3 saranno ancora più immediati.
Il blog ufficiale di Google afferma che Gemini 3 è il modello di "vide coding" più potente finora: basta descrivere ciò che si desidera in linguaggio naturale e il sistema è in grado di generare applicazioni interattive completamente funzionali.

I dati parlano chiaro: Elo si è classificato al 1487° posto nella classifica WebDev Arena, con un punteggio del 54,2% su Terminal-Bench 2.0 e del 76,2% su SWE-bench Verified.

Google ha anche lanciato un nuovissimo IDE per l'intelligenza artificiale: Google Antigravity.
L'agente intelligente integrato può pianificare ed eseguire autonomamente complesse attività software end-to-end e verificare automaticamente la correttezza del codice. Se si desidera creare un'applicazione di tracciamento dei voli, l'agente può pianificare e scrivere codice in modo indipendente, verificarne le prestazioni tramite un browser e persino funzionare senza problemi contemporaneamente su editor, terminale e browser.
In termini di capacità di pianificazione a lungo termine, il Gemini 3 si classifica al primo posto nella lista Vending-Bench 2.

Nelle applicazioni pratiche, le nuove funzionalità sperimentali di Gemini Agent possono eseguire complessi processi multi-step dall'inizio alla fine. Se dici "Organizza la mia posta in arrivo", l'agente assegnerà la priorità alle tue attività e creerà una bozza di risposta via email per la tua conferma.
Oppure potresti dire: "Trova informazioni e prenota un SUV di medie dimensioni per me, con un budget non superiore a 80 dollari al giorno. Usa le informazioni nella mia email per pianificare il tuo viaggio la prossima settimana". Gemini troverà le informazioni sui voli, confronterà le opzioni di noleggio auto e preparerà per te la procedura di prenotazione.
Manterrai il controllo durante tutto il processo e i Gemelli chiederanno conferma prima di operazioni importanti.
Inoltre, in Google AI Studio e Vertex AI, il prezzo per l'utilizzo dell'anteprima di Gemini 3 Pro tramite l'API Gemini è di 2 dollari per milione di token in input e di 12 dollari per milione di token in output. L'utilizzo è gratuito anche in Google AI Studio, ma sono previste delle limitazioni.

Gemini 3 è stato integrato nell'ecosistema degli strumenti di sviluppo, tra cui Cursor, GitHub, JetBrains e Replit.
Parallelamente al lancio del prodotto, Google ha aperto contemporaneamente più punti di accesso.
A partire da oggi, l'anteprima di Gemini 3 verrà distribuita gradualmente: tutti gli utenti potranno utilizzarla nell'app Gemini; gli abbonati a Google AI Pro e Ultra potranno sperimentarla nella modalità di ricerca AI; gli sviluppatori potranno accedervi tramite Gemini API, Google Antigravity e Gemini CLI; e gli utenti aziendali potranno accedere al servizio tramite Vertex AI e Gemini Enterprise.
È arrivato il rivale di ChatGPT. Quanto è competitivo il Gemini 3 nei test reali?
Naturalmente le aziende tecnologiche esagerano sempre le proprie capacità, quindi abbiamo testato anche alcuni aspetti.
La prima sfida è stata quella di ricreare una console portatile Game Boy completa in un singolo file HTML, con giochi classici come Tetris e Pokémon Rosso/Blu preinstallati e tutti i controlli che dovevano supportare l'interazione sia tramite tastiera che tramite touchscreen.
A dire il vero, non ho grandi aspettative per questo requisito.
Questo tipo di compito, che richiede la gestione simultanea della progettazione dell'interfaccia utente, della logica di gioco e degli effetti sonori, richiederebbe diversi giorni anche a un ingegnere front-end professionista. Ma le prestazioni di Gemini sono state inaspettate: l'interfaccia interattiva ha raggiunto un punteggio del 60-70% e i pulsanti producevano persino effetti sonori distintivi quando venivano premuti. Per essere un codice generato in un'unica soluzione, è stato davvero impressionante.

Ora che le console per videogiochi retrò funzionano, diamoci dentro.

▲ Progetta e crea un sistema operativo web come macOS con funzionalità complete, dall'editor di testo, al terminale con Python e all'editor di codice, un gioco che può essere giocato con il gestore di file, Paint, l'editor video e tutti i software pre-inclusi importanti del sistema operativo Windows. Usa qualsiasi libreria per farlo, ma assicurati di poter incollare tutto in un singolo file HTML e aprirlo in Chrome. Rendilo interessante e molto dettagliato, mostra dettagli che nessuno si aspettava, diventa completamente creativo e di grande bellezza in un unico blocco di codice.
Gli ho chiesto di replicare un sistema macOS completo utilizzando un singolo file HTML, inclusi software preinstallati come un editor di testo, un terminale, un editor di codice, un file manager, Paint e un editor video. Sebbene il prodotto risultante non sia esteticamente gradevole, la logica interattiva di base è implementata.

Oltre alle sue capacità di programmazione, abbiamo testato anche le sue capacità di generazione visiva e di ragionamento.
Seguendo l'approccio dell'utente @lepadphone (X), ho chiesto a Gemini di implementare l'effetto visivo di un ventilatore elettrico utilizzando il codice front-end. Ho suggerito di utilizzare la tecnologia SVG per disegnarlo, includendo dettagli strutturali come le pale del ventilatore, la griglia di protezione, la base e i pulsanti di controllo, e implementando effetti dinamici come la rotazione delle pale e la regolazione della velocità. L'SVG generato non solo ha una struttura completa, ma anche l'animazione della rotazione delle pale del ventilatore è molto naturale.
Poi, gli ho chiesto di disegnare un pellicano in bicicletta: una combinazione insolita che ha messo alla prova l'immaginazione spaziale dell'IA. Il risultato è stato un'immagine ben proporzionata, con la posa del pellicano e la prospettiva della bicicletta gestite piuttosto bene.

▲Parola di suggerimento: crea il codice per un SVG di un pellicano che va in bicicletta nel modo più gradevole possibile
In termini di capacità di ragionamento, ho usato il classico problema della scimmia e delle pesche. La risposta di Gemini non solo era corretta, ma l'ha anche verificata due volte.
Cinque scimmie trovarono un mucchio di pesche sulla spiaggia e decisero di dividerle equamente il giorno dopo. La prima scimmia arrivò la mattina presto. Incapace di dividere le pesche correttamente, ne gettò una in mare, creando cinque gruppi uguali. La scimmia prese la sua parte. La seconda, la terza, la quarta e la quinta scimmia incontrarono lo stesso problema e usarono lo stesso metodo, gettando via una pesca ogni volta per creare cinque gruppi uguali. Qual è il numero minimo di pesche nel mucchio?

Ancora più interessante è il fatto che abbiamo testato anche la sua capacità di comprendere la "letteratura senza senso".
Di fronte a questo tipo di pretenzioso gioco di parole – "Chi capisce capirà, chi è ignorante rimarrà ignorante; i segreti del cielo si comprendono se non vengono espressi, ma rivelare i segreti del cielo non è vera comprensione" – l'approccio di Gemini è intelligente: prima, lo classifica come "letteratura senza senso" per rassicurare; poi, scava nei riferimenti culturali sottostanti come i concetti taoisti di "esistenza e non esistenza" e quelli buddisti di "forma e vuoto"; infine, fornisce una traduzione in linguaggio semplice. Questa risposta è molto più sofisticata di una semplice frase "questa è una sciocchezza".

Era inclusa anche la prova scritta.
Abbiamo chiesto a Gemini di scrivere "Un giorno nella vita di una goccia di pioggia" in prima persona, e lei ha prodotto una poesia in prosa: l'affollamento e l'attesa tra le nuvole, la gioia di cadere e la tranquillità di immergersi nel fiume. Il testo è ricco di dettagli sensoriali: il tocco tremolante, il riflesso visivo delle luci al neon, il suono udibile del vento che ulula. Le emozioni sono autentiche e le immagini ricche. Sebbene vi siano ancora tracce di una scrittura stereotipata tipica degli "esempi eccellenti", ha già superato la sufficienza.
Per essere onesti, tralasciando le specifiche sulla carta, le prestazioni effettive del Gemini 3 sono innegabili. La capacità di Google di raggiungere o addirittura superare gli anni di esperienza di OpenAI in un breve lasso di tempo è inscindibile dalla sua solidità come uno dei pochi fornitori di intelligenza artificiale full-stack.
I vantaggi di Google sono evidenti: l'autonomia di calcolo offerta dai processori TPU sviluppati internamente, unita al più grande archivio dati al mondo (indici di ricerca, letteratura accademica e videoteca di YouTube), fornisce un potente supporto all'addestramento di Gemini. Questo potrebbe anche spiegare perché offre prestazioni più stabili nella gestione di informazioni in tempo reale, attività multilingue e comprensione di video.
Proprio ora, Omar Sanseviero, responsabile dell'esperienza degli sviluppatori di DeepMind, ha scritto su X che l'evento di stasera era solo un "riscaldamento" e che presto saranno rilasciate altre funzionalità. Considerando le indiscrezioni precedenti, l'attesissimo Nano Banana 2 potrebbe davvero essere dietro l'angolo.
#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

