GPT-5.2 è appena stato rilasciato ufficialmente! Ridurrà l’orario di lavoro di 10 ore a settimana per gli impiegati; la modalità per adulti sarà disponibile l’anno prossimo.

In 1106 giorni, OpenAI è passata dall'essere quella che ribaltava il tavolo all'essere quella a cui il tavolo veniva ribaltato.
Con il rilascio di Google Gemini 3, la scorsa settimana il CEO di OpenAI Altman ha emesso un raro avviso "Codice rosso", annunciando che tutte le risorse sarebbero state reindirizzate alla linea principale di ChatGPT e che altre attività sarebbero state messe da parte.
È la prima volta dalla sua nascita che OpenAI entra in stato di "allerta rossa" ed è anche la prima volta che riconosce così chiaramente che la pressione competitiva è diventata così forte da doverla gestire con tutte le sue forze.

Proprio ora, OpenAI ha rilasciato il modello GPT-5.2, sferrando un duro colpo. GPT-5.2 sarà disponibile per gli utenti a pagamento e gli sviluppatori di ChatGPT tramite API e sarà rilasciato in tre versioni:
- Instant: una versione ottimizzata per la velocità, adatta per attività di routine come il recupero di informazioni, la scrittura e la traduzione;
- Pensiero: Abile nel gestire compiti strutturati e complessi, come programmazione, analisi di documenti lunghi, matematica e pianificazione;
- Pro: la versione di fascia alta, incentrata sulla massima precisione e affidabilità per le attività più impegnative.
Niente chiacchiere, solo lavoro vero: GPT-5.2 irrompe nei luoghi di lavoro dei professionisti.
Si pensava che OpenAI si sarebbe concentrata sul miglioramento della personalizzazione e dell'esperienza utente di ChatGPT, ma il rilascio di GPT-5.2 segue ancora la strada del pragmatismo sul posto di lavoro.
Come afferma Fidji Simo, CEO di OpenAI, "Abbiamo progettato GPT-5.2 per creare più valore economico per gli utenti".
Cos'è il valore economico?
L'obiettivo è consentire all'intelligenza artificiale di svolgere effettivamente attività come creare fogli di calcolo, scrivere presentazioni PowerPoint, programmare, visualizzare immagini, leggere articoli lunghi, richiamare strumenti e gestire progetti complessi, tutte attività che sono il punto di forza di GPT-5.2.
I dati sono davvero impressionanti. In media, ogni utente di ChatGPT Enterprise afferma che l'intelligenza artificiale gli fa risparmiare dai 40 ai 60 minuti al giorno, e gli utenti più assidui risparmiano ancora di più, più di 10 ore a settimana.

GPT-5.2 Thinking è il punto forte di questa versione.
Nel test GDPval, che valuta 44 compiti professionali basati sulla conoscenza, è diventato il primo modello a raggiungere o superare le prestazioni complessive degli esperti umani. Nello specifico, rispetto agli esperti del settore, GPT-5.2 Thinking ha superato o eguagliato gli esperti umani nel 70,9% dei compiti.

Questi compiti non sono arbitrari; riguardano i primi nove settori nella classifica del PIL degli Stati Uniti, tra cui presentazioni di vendita, rendiconti contabili, piani di programmazione del pronto soccorso, progetti di produzione, produzione di brevi video e molto altro ancora: tutti compiti impegnativi tratti da scenari lavorativi reali.
Il miglioramento delle competenze di programmazione è ancora più evidente.
SWE-Bench Pro è un test molto rigoroso che valuta le capacità di un modello nell'ingegneria del software nel mondo reale. Coinvolge quattro linguaggi di programmazione ed è molto più difficile della versione solo Python. GPT-5.2 Thinking ha ottenuto un punteggio del 55,6% in questo test, stabilendo un nuovo record del settore.

Ancora più impressionante, ha raggiunto un punteggio dell'80% in SWE-bench Verified, stabilendo un nuovo record. Ciò significa che GPT-5.2 Thinking può eseguire il debug del codice in modo più affidabile negli ambienti di produzione, implementare requisiti funzionali e rifattorizzare basi di codice di grandi dimensioni, rendendo le correzioni end-to-end più efficienti e riducendo l'intervento umano.
Anche lo sviluppo front-end ha registrato notevoli miglioramenti.
I primi tester affermano che offre prestazioni migliori nella gestione di attività di interfaccia utente front-end complesse o non convenzionali, in particolare quelle che coinvolgono elementi 3D, il che lo rende un vero e proprio assistente per gli ingegneri full-stack.
OpenAI ha anche pubblicato diversi esempi generati da un singolo prompt: un simulatore di onde, un generatore di biglietti d'auguri per le vacanze e un gioco di digitazione sulla pioggia. Con un solo prompt, si crea un'intera applicazione di una sola pagina, completa di parametri regolabili, animazioni realistiche e un'interfaccia utente dallo stile sereno.

Tasso di illusione ridotto del 30%, capacità di testo lungo quasi perfetta.
In termini di accuratezza fattuale, il pensiero GPT-5.2 presenta un "tasso di illusione" inferiore rispetto al pensiero GPT-5.1.
In un set di query anonime di ChatGPT, il numero di risposte errate è diminuito di circa il 30%. Per i professionisti, questo si traduce in minori tassi di errore e maggiore fiducia nell'utilizzo del servizio per attività quali ricerca, scrittura, analisi e supporto decisionale.
Tuttavia, OpenAI avverte anche che, come tutti i modelli, GPT-5.2 non è perfetto e che le attività chiave richiedono ancora una verifica manuale.
Anche la capacità di ragionamento su testi lunghi ha stabilito un nuovo standard.
Nel benchmark OpenAI MRCRv2, GPT-5.2 ha superato GPT-5.1. Questo test valuta la capacità di un modello di integrare correttamente informazioni distribuite su documenti lunghi. Per attività come l'analisi approfondita dei documenti, che comporta l'integrazione di informazioni tra documenti che coinvolgono centinaia di migliaia di token, l'accuratezza di GPT-5.2 supera di gran lunga quella di GPT-5.1.
In particolare nel test MRCR a 4 aghi (che è diverso dal "cercare un ago in un pagliaio" ma richiede al modello di distinguere e trovare un ago specifico tra più "aghi" identici in una grande quantità di testo), con un contesto fino a 256k token, GPT-5.2 è il primo modello a raggiungere una precisione vicina al 100%.
Ciò significa che gli utenti professionali possono elaborare in modo efficiente documenti estremamente lunghi con GPT-5.2, inclusi report, contratti, articoli accademici, trascrizioni di interviste e progetti multi-file. Mantiene coerenza logica e accuratezza delle informazioni anche quando gestisce centinaia di pagine di contenuto. In termini di comprensione visiva, GPT-5.2 Thinking è attualmente il modello visivo più potente di OpenAI. Nel ragionamento grafico e nella comprensione dell'interfaccia software, il tasso di errore è stato ridotto di circa la metà.
Per l'uso professionale quotidiano, ciò significa che il modello può interpretare con maggiore accuratezza dashboard di dati, schermate di prodotti, disegni tecnici e report visivi, rendendolo adatto a scenari di lavoro incentrati sulla visione, come finanza, operazioni, ingegneria, progettazione e assistenza clienti.

Anche la comprensione spaziale e le capacità di utilizzo degli strumenti sono migliorate. Nel test Tau2-bench Telecom, GPT-5.2 Thinking ha raggiunto un nuovo punteggio massimo del 98,7%, dimostrando la sua capacità di utilizzare in modo affidabile gli strumenti in attività lunghe e multi-round.
Anche impostando la forza dell'inferenza al livello più basso, GPT-5.2 supera comunque significativamente GPT-5.1 e GPT-4.1.
Ciò significa che il pensiero GPT-5.2 è più efficace nell'esecuzione di flussi di lavoro end-to-end, nella gestione dei casi di assistenza clienti, nell'estrazione di dati da più sistemi, nell'esecuzione di attività di analisi, nel completamento efficiente dell'intero output del processo e nella riduzione al minimo degli errori nei passaggi intermedi.
Il potenziamento delle competenze matematiche e scientifiche è probabilmente la parte più impegnativa di questa versione.
Nei test scientifici di livello universitario come GPQA Diamond, che coprono campi come fisica, chimica e biologia, GPT-5.2 ottiene risultati significativamente migliori. Può anche gestire test di riferimento come FrontierMath, che valutano le capacità di problem solving matematico di livello esperto.

Ancora più impressionante è il fatto che nel test ARC-AGI-1, GPT-5.2 Pro è stato il primo modello a superare il 90% di precisione, superando l'87% dell'o3-preview dell'anno scorso, riducendo al contempo i costi di circa 390 volte.

La versione ARC-AGI-2 è più difficile e si concentra sulla verifica della capacità di ragionamento sulla liquidità. Il punteggio GPT-5.2 Thinking è del 52,9%, stabilendo un nuovo record per il "modello di pensiero a catena". Il GPT-5.2 Pro si spinge ancora oltre, raggiungendo il 54,2%.
Il blog ufficiale menziona un caso impressionante: GPT-5.2 Pro fornisce addirittura una dimostrazione fattibile per un problema aperto nella teoria dell'apprendimento statistico.
Questa domanda nasce da un problema irrisolto sollevato alla Learning Theory Conference (COLT) del 2019: se il modello è configurato perfettamente e i dati seguono una distribuzione normale standard, la curva di apprendimento è monotona in questo caso "pulito" da manuale?

I ricercatori non hanno progettato un algoritmo né fornito una dimostrazione in anticipo, né hanno inserito passaggi intermedi o suggerimenti. Hanno invece richiesto direttamente una dimostrazione completa a GPT-5.2 Pro. Di conseguenza, il modello ha proposto una soluzione fattibile, la cui correttezza è stata confermata attraverso la verifica manuale e la revisione di esperti esterni.
Ciò dimostra che GPT-5.2 Pro può svolgere un ruolo più sostanziale nel supportare la ricerca scientifica in campi con chiare basi assiomatiche, come la matematica e l'informatica teorica: esplorando percorsi di dimostrazione, verificando ipotesi e scoprendo connessioni nascoste.

▲Prezzo API GPT-5.2
Prestazioni così impressionanti hanno un prezzo elevato.
Le modalità Thinking e Deep Research consumano molta più potenza di calcolo rispetto ai chatbot tradizionali, perché devono "pensare" in modo molto più approfondito. Questo perché OpenAI ora spende la maggior parte delle sue risorse per l'inferenza dei modelli direttamente in denaro, anziché utilizzare i crediti del servizio cloud di Microsoft Azure.
È difficile dire quanto a lungo possa durare questo tipo di strategia, che prevede l'investimento costante di denaro.
Nel complesso, GPT-5.2 è più simile a un'integrazione dei due precedenti aggiornamenti del modello che a una ricostruzione completa.
La versione GPT-5 di agosto ha rappresentato un reboot architetturale, introducendo un meccanismo di routing che consente di passare dalla modalità di risposta rapida a quella di "pensiero" profondo. La versione GPT-5.1 di novembre ha reso il sistema più "gentile", più colloquiale e più adatto ad agenti e attività di codifica.
L'attuale GPT-5.2 mira a sfruttare questi vantaggi per creare un modello di produzione più affidabile. E un dettaglio molto importante: la knowledge base di base di tutti e tre i modelli GPT-5.2 rilasciati questa volta è stata aggiornata.

GPT-5.2 è stato distribuito gradualmente su ChatGPT, inizialmente disponibile per gli utenti a pagamento. GPT-5.1 rimarrà nell'opzione "Modello Tradizionale" per tre mesi prima di essere ufficialmente interrotto.
Anche l'API è disponibile e gli sviluppatori possono già utilizzarla. È leggermente più costosa di GPT-5.1, ma OpenAI afferma che, poiché il token è più efficiente, il costo totale effettivo è inferiore.
Una cattiva notizia e una buona notizia
Oltre al modello in sé, ci sono due notizie molto contrastanti riguardo alla commercializzazione di OpenAI.
Sebbene in questa versione non sia stato introdotto alcun nuovo modello di generazione delle immagini, oggi OpenAI ha raggiunto un accordo di licenza triennale con Disney.
Gli utenti possono creare video social con oltre 200 personaggi Disney, Marvel, Pixar e Star Wars; alcuni di questi video possono essere riprodotti anche su Disney+.
In cambio, Disney ha investito 1 miliardo di dollari in OpenAI e diventerà un cliente importante. La combinazione di proprietà intellettuale sui contenuti e generazione di intelligenza artificiale offre sicuramente un grande potenziale.

Un'altra notizia degna di nota è che la "modalità per adulti" di ChatGPT ha finalmente una tempistica chiara.
Con l'aumento delle chatbot AI che si avventurano nei contenuti per adulti, OpenAI non è più un santo. Secondo Bloomberg, Fidji Simo ha confermato che la funzionalità dovrebbe essere lanciata nel primo trimestre del 2026.
Prima di ciò, OpenAI continuerà a ottimizzare le sue capacità di riconoscimento dell'età per garantire che i meccanismi di protezione dei contenuti vengano attivati automaticamente per i minori. Attualmente, il modello di previsione dell'età è in fase di test preliminare in alcuni paesi per valutarne la capacità di identificare gli adolescenti e garantire che non identifichi erroneamente gli adulti.
Di fronte alla pressione incessante di Google Gemini, OpenAI ha risposto con una combinazione di misure, tra cui GPT-5.2. È più veloce, più potente e più simile a un prodotto commerciale maturo.
Allo stesso tempo, oltre ad abbracciare il Topolino della Disney, OpenAI si sta preparando a lanciare una modalità per adulti. Deve mantenere la sua leadership tecnologica e al contempo monetizzare rapidamente i suoi prodotti; deve conquistare il mercato enterprise senza perdere alcun punto di ingresso nel traffico.
Fortunatamente, OpenAI, che celebra il suo decimo anniversario, alla fine ha dato una bella prova di sé in questo contrattacco.

▲ C'è anche un piccolo Easter egg
#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

