Risultati dei test effettivi per GPT-5.2: leggero aumento della capacità di impennata dei prezzi, cosa lo rende in grado di contrastare Gemini?

GPT 5.2, progettato per superare Gemini in termini di prestazioni, è stato rilasciato ufficialmente questa mattina presto e distribuito a tutti gli utenti.
Ho appena annullato il mio abbonamento a ChatGPT Plus il mese scorso e sono passato a Gemini. Devo riattivarlo ora a causa di GPT-5.2?
Dopo aver letto le esperienze reali degli utenti condivise dagli internauti e il test pratico di APPSO, potresti trovare una risposta.

▲Questa volta finalmente non ho sbagliato a disegnare la tabella.
GPT 5.2 aggiorna in realtà tre modelli: GPT-5.2 Instant, Thinking e Pro. Se sei abituato alla riflessione attenta che caratterizza ogni domanda e risposta in Gemini 3.0 Pro, scoprirai che la velocità di elaborazione di ChatGPT è inferiore e richiede più tempo rispetto a prima quando inizi a utilizzare GPT-5.2 Thinking/Pro.
Questo è anche il feedback condiviso dalla maggior parte degli utenti che hanno avuto accesso anticipato sui social media. In altre parole, GPT-5.2 rappresenta un miglioramento rispetto alla versione 5.1 sotto ogni aspetto e GPT-5.2 Pro è particolarmente adatto per attività di inferenza professionale che richiedono molto tempo per essere completate; tuttavia, i tempi di attesa per i risultati si allungano.
Ad esempio, un utente ha raccontato che quando ha inserito il prompt "Aiutami a disegnare un grafico dei punteggi del test HLE", GPT-5.2 Pro ha impiegato ben 24 minuti per generare il grafico.

▲Fonte dell'immagine: https://x.com/emollick/status/1999185755617300796/photo/1
Fortunatamente, tutte le informazioni erano accurate e persino il risultato migliore sul grafico mostrava ancora Gemini 3.0 Pro.
Ciò è dovuto anche al fatto che la data di scadenza della conoscenza per GPT-5.2 è stata spostata ad agosto 2025 , mentre la data di scadenza della conoscenza per GPT-5.1 era settembre 2024 e la data di scadenza della conoscenza per Gemini 3.0, appena rilasciato il mese scorso, è 2025.1.
Quando abbiamo utilizzato GPT-5.2 Thinking per generare un grafico della cronologia delle release del modello OpenAI, non ci è voluto molto tempo e le informazioni sono risultate piuttosto accurate. Per attività semplici, il tempo impiegato utilizzando il modello Thinking è significativamente diverso da quello del modello Pro.

▲ Prompt: genera un grafico del rilascio del modello OpenAI nel tempo
Grazie al suo ragionamento ad "ultra-intensità" e alle più recenti conoscenze mondiali, unite alla comprensione multimodale e alle capacità di ragionamento delle immagini, GPT 5.2 ha rapidamente raggiunto il secondo posto nell'arena dei modelli di grandi dimensioni. GPT-5.2-High si è classificato al secondo posto nel progetto WebDev (sviluppo web) , mentre GPT-5.2 si è classificato al sesto posto. In confronto, Gemini 3.0 Pro si è classificato al terzo posto, con Claude ancora al primo posto.
LMArena ha anche pubblicato un video di prova che mostra l'utilizzo di GPT-5.2 per completare una serie di attività di modellazione 3D con un livello di precisione molto elevato. Tuttavia, alcuni utenti hanno commentato qui sotto: "Siamo ancora nel 2003?"

▲Fonte video: https://x.com/arena/status/1999189215603753445
Questo effetto 3D ottenuto utilizzando three.js richiede un elevato grado di comprensione multimodale e capacità di ragionamento del modello, nonché l'ottimizzazione nello sviluppo della programmazione e nella progettazione del programma; GPT-5.2 vale sicuramente questo aggiornamento 0.1.
Attualmente, molti test condivisi dagli utenti si concentrano principalmente sulla creazione di motori 3D completi, e GPT-5.2 offre ottime prestazioni. Ad esempio, ci sono anche test che utilizzano la modalità di ragionamento ad alta difficoltà di GPT-5.2 Thinking, che, in un file di una sola pagina, ha costruito un modello 3D di un regno innevato e ghiacciato che supporta il controllo interattivo ed è esportabile in risoluzione 4K.

▲ https://x.com/skirano/status/1999182295685644366
Sono presenti anche edifici urbani gotici turbolenti in 3D creati utilizzando GPT-5.2 Pro.

▲Parola di suggerimento: crea uno shader visivamente interessante che possa essere eseguito in twigl-dot-app, rendendolo simile a una città infinita di torri neogotiche parzialmente sommerse in un oceano in tempesta con grandi onde.|Fonte: https://x.com/emollick/status/1999185085719887978?s=20
Per quanto riguarda le capacità di comprensione e ragionamento 3D, abbiamo anche utilizzato il prompt utilizzato da Ian Goodfellow dopo il rilascio di Gemini 3.0 Pro, che consiste nel caricare un'immagine e poi dire al modello di generare una splendida scena di applicazione Three.js a pagina singola con voxel art basata sull'immagine.

▲ Poiché ChatGPT non lo ha generato per me all'interno dell'area di disegno, ho copiato il codice generato nella finestra di dialogo e l'ho aperto nella vista HTML, come mostrato nell'immagine a destra.
La differenza è piuttosto evidente. Sebbene ChatGPT leggesse anche il contenuto dell'immagine caricata (un libro rosa, un campo verde, un ruscello grigio e acqua bianca), l'animazione 3D generata era piuttosto rudimentale rispetto a Gemini 3.0 Pro.
Tutto quello che posso dire è che il fatto che Ultraman abbia lanciato questo "allarme rosso" dimostra la vera qualità di Gemini.
Mettere alla prova le competenze di programmazione implica inevitabilmente simulazioni fisiche classiche con sfere esagonali. Un blogger ha aumentato la difficoltà utilizzando sfere 3D rosse completamente illuminate. L'effetto è molto bello e molti utenti si chiedono come sia stato ottenuto; tuttavia, alcuni hanno sottolineato che queste sfere sembrano non essere influenzate dalla gravità.
Poi alcuni internauti hanno risposto che si trattava di una simulazione dello spazio.

▲Fonte video: https://x.com/flavioAd/status/1999183432203567339
C'è anche un test del codice SVG e un pellicano in bicicletta.

▲ Fonte dell'immagine: https://arena.jit.dev/
Alcuni internauti hanno anche raccontato di aver realizzato un simulatore di incendi boschivi utilizzando GPT-5.2, in grado di regolare la velocità, le dimensioni dell'area e la portata dell'incendio, ecc.

▲Fonte dell'immagine: https://x.com/1littlecoder/status/1999191170581434557?s=20
Abbiamo creato una pagina web per i segnali planetari, con un layout quasi identico a questa pagina web sulla visualizzazione degli incendi boschivi. L'unica differenza è che il contenuto visualizzato sul lato sinistro è stato modificato da stelle sparse a corpi celesti.

▲ Parole chiave: creare una simulazione interattiva in HTML, CSS e JavaScript di un sistema satellitare che trasmette segnali a ricevitori terrestri. La simulazione dovrebbe mostrare un satellite in orbita attorno alla Terra che invia periodicamente segnali che vengono ricevuti da più ricevitori.
Abbiamo anche utilizzato la fotocamera istantanea che abbiamo realizzato con la Gemini 3 per testare la GPT-5.2. Abbiamo inserito gli stessi prompt, chiedendole di sviluppare un'applicazione web in stile retrò per fotocamere istantanea.

▲Suggerimento: Sviluppa un'app per fotocamera skeuomorfica a pagina singola in stile retrò. Lo sfondo della pagina dovrebbe essere progettato come un pannello di sughero o un materiale con venature di legno scuro. Un modello di fotocamera istantanea skeuomorfica, disegnato interamente con CSS o SVG, dovrebbe essere fissato nell'angolo in basso a sinistra, con l'area dell'obiettivo che mostra la vista della fotocamera dell'utente in tempo reale. In termini di logica di interazione, quando l'utente clicca sul pulsante di scatto, dovrebbe essere riprodotto un effetto sonoro e una carta fotografica con un bordo bianco dovrebbe emergere lentamente dalla parte superiore della fotocamera. Utilizza filtri CSS per rendere la foto emergente inizialmente molto sfocata e in bianco e nero, passando gradualmente a uno stato nitido e a colori entro 5 secondi. Infine, tutte le foto sviluppate devono essere trascinabili, consentendo agli utenti di posizionarle liberamente ovunque sulla pagina, con lievi angoli di rotazione e ombre casuali. Cliccando su una foto, questa dovrebbe posizionarsi in cima, creando un realistico collage di foto a forma libera.
Sorprendentemente, ChatGPT può anche scattare foto istantanee in una sola volta.
Quando abbiamo testato Gemini 3.0 Pro in precedenza, le sue capacità più potenti erano la programmazione e il fatto che non richiedeva l'inserimento di molti comandi. Ci bastava inviare uno screenshot o un video e chiedergli di replicarlo, e Gemini lo faceva.
Questa volta gli abbiamo anche fornito un video e gli abbiamo chiesto di replicare la pagina web che genera questa antica poesia. 
▲ https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581
Rispetto a GPT-5.1, che ignorava completamente la combinazione di colori dei miei video caricati, questa volta sembra aver imparato qualcosa. Tuttavia, poiché le pagine web generate da Gemini possono incorporare direttamente funzionalità di intelligenza artificiale tramite la sua API, ChatGPT non ha ancora integrato l'intelligenza artificiale in queste pagine web generate. Pertanto, le poesie qui presenti possono essere solo quelle già scritte.
Oltre ai classici test di abilità di programmazione e alla semplice creazione di un file HTML di una sola pagina, alcuni utenti lo utilizzano anche per scrivere codice Python.
Il suggerimento inserito dall'utente era "scrivi un codice Python che visualizzi il funzionamento di un semaforo in una strada a senso unico con auto che entrano a velocità casuale".
Ha testato sia GPT 5.2 Extended Thinking che Claude Opus 4.5, e i risultati sono stati evidenti. Si può dire che spesso ci viene chiesto quale sia il modello di programmazione migliore, e c'è un motivo per cui Claude è così popolare tra gli sviluppatori.


▲ Di seguito è riportato GPT-5.2, fonte: https://x.com/diegocabezas01/status/1999228052379754508
Inoltre, il principale svantaggio del modello Claude precedente era il suo prezzo elevato. Claude Opus 4.5 costava 5 dollari per milione di token in input e 25 dollari per milione di token in output. Ora, il prezzo di GPT-5.2 ha recuperato terreno, ed è circa il 40% più costoso di GPT-5.1. GPT-5.2 Pro costa 21 dollari per token in input e 168 dollari per token in output.
Nel suo blog ufficiale, OpenAI ha affermato che GPT-5.2 ha migliorato anche le sue capacità di elaborazione delle immagini.
GPT-5.2 Thinking è il nostro modello visivo più potente fino ad oggi, in grado di ridurre di circa la metà il tasso di errore nel ragionamento grafico e nella comprensione dell'interfaccia software.
Fornisce anche un esempio di utilizzo dell'intelligenza artificiale per aggiungere alcune marcature in riquadro a una scheda madre che appare sfocata; rispetto a GPT-5.1, GPT-5.2, sebbene commetta anch'esso errori, contrassegna più aree.
Ma che dire di Nano Banana Pro? Alcuni utenti hanno utilizzato Nano Banana Pro per rimuovere le annotazioni dalle immagini e poi hanno chiesto di aggiungere nuovi riquadri per la posizione di destinazione. Quale pensate sia migliore?

▲Da sinistra a destra: GPT-5.1, GPT-5.2, Nano Banana Pro | Fonte immagine: https://x.com/bcaine/status/1999212747213656072
La mia sensazione è che ChatGPT si stia "umiliando" in ambiti in cui altri eccellono. Nano Banana è ormai il leader indiscusso nel lavoro sulle immagini; anche se GPT-5.2 offre più informazioni sulle annotazioni, molti riquadri di delimitazione non sono ancora posizionati correttamente.
La programmazione e l'elaborazione delle immagini hanno registrato miglioramenti significativi rispetto alla precedente generazione GPT-5.1. Se utilizzate ChatGPT da un po' di tempo, dovreste essere in grado di percepire direttamente la differenza dopo l'aggiornamento. Tuttavia, rispetto ad altri modelli, in termini di programmazione ed elaborazione delle immagini, non raggiunge ancora lo stesso livello di predominio di Nano Banana al suo debutto.
Per quanto riguarda l'estetica del web design, alcuni utenti hanno condiviso alcune pagine web front-end create utilizzando GPT-5.2. Vedremo se i programmatori front-end verranno tirati fuori e "uccisi" anche questa volta.

▲Fonte dell'immagine: https://x.com/secondfret/status/1999235822034547011
Rispetto al precedente, onnipresente viola sfumato, il livello di design di GPT-5.2 è effettivamente migliorato. Tuttavia, come ha affermato lo stesso blogger, GPT-5.2 sembra preferire in particolar modo disegnare quadrati sullo schermo, con strati di griglie ovunque.
C'è anche una classifica speciale relativa alle capacità di progettazione. GPT-5.2 ha fatto un balzo in avanti, passando da GPT-5.1, che in precedenza si classificava fuori dalla top ten, al terzo posto. Tuttavia, il punteggio più alto rimane Gemini 3.0 Pro.

▲ Fonte immagine: https://www.designarena.ai/leaderboard
Abbiamo anche dato a GPT-5.2 alcuni requisiti per creare un sito web "di fascia alta", in particolare per la homepage di un'azienda di intelligenza artificiale. Il risultato? GPT-5.2 adora usare i box; e in qualche modo sono finito di nuovo con il viola sfumato.

▲Parole chiave: Sei il miglior designer e sviluppatore dello 0,1% per l'innovazione all'avanguardia al mondo nel design e nello sviluppo front-end. Il tuo compito è creare una landing page completa con {Dither + Shader} utilizzando {WebGL + ThreeJs} nello stile di un'immagine caricata per l'azienda di intelligenza artificiale. – Concentrati principalmente sulla parte di design, non sullo sviluppo. Importa tutti i file e le librerie necessari: Three.js, WebGL, GSAP, qualsiasi altra libreria di animazione relativa allo sviluppo 3D.
Infine, per quanto riguarda la scrittura, secondo il feedback di alcuni utenti con esperienza avanzata, GPT-5.2 sta iniziando ad avere la capacità di completare la creazione di alcuni romanzi lunghi.
Ad esempio, quando a ChatGPT viene chiesto di generare 50 idee per la trama, le completa tutte, invece di generarne solo una parte come altri modelli. E quando gli viene chiesto di scrivere un libro di 200 pagine, ChatGPT non si limita a dire che non può farlo; al contrario, ci prova davvero, non solo costruendo l'intera struttura del libro, ma anche generando un file PDF.
Gli internauti hanno commentato che, nonostante le pagine siano piuttosto sottili e il libro sia breve… dopotutto, al momento è impossibile scrivere un romanzo che possa essere pubblicato in una sola volta, ma il fatto che riesca effettivamente a farlo, proponendo 50 idee e scrivendo un libro di 200 pagine, dimostra che ha una sufficiente profondità di pensiero.
La cosa più notevole di GPT-5.2 è la sua capacità di seguire molto bene le istruzioni… non solo di fare sostanzialmente ciò che dico, ma di completare l'intero compito che descrivo.

GPT-5.2 dovrebbe ora essere gradualmente distribuito a tutti gli utenti. Qual è la tua esperienza pratica?
L'aggiornamento a GPT-5.2 non è stato sufficiente a convincermi a lasciare Gemini. Sebbene avesse dimostrato di aver scalato molte classifiche, ottenendo buoni risultati sia nei test interni che in quelli pubblici, l'esperienza effettiva era carente. Nella parte di generazione del programma 3D, gli errori di codice erano frequenti e l'estetica generale non aveva visto miglioramenti significativi, il tutto a fronte del prezzo.

▲ Commenti taglienti degli internauti
Anche Gemini non si è fermata, continuando a mettere pressione a Ultraman. Questa mattina, sebbene non sia stato rilasciato alcun nuovo modello, Gemini Deep Research è stato riprogettato ed è ora accessibile tramite API. Futuri aggiornamenti saranno disponibili anche per Gemini, Google Search e NotebookLM.

Il nuovo Gemini Deep Research Agent ha superato il GPT-5.2 Thinking appena rilasciato (45,5%) nell'Human Last Exam (HLE) con un punteggio del 46,4% e ha ottenuto buoni risultati anche nel test DeepSearchQA e nel test BrowseComp di Google.
L'allerta rossa di Ultraman probabilmente durerà ancora per un po'.
#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

