Prova GPT-5 gratuitamente! Tutti possono usarlo gratuitamente, e Musk non è soddisfatto.

Se c'è un prodotto tecnologico che, dopo essere stato ampiamente divulgato, riesce ancora a far sì che le persone guardino le trasmissioni in diretta la mattina presto, oltre all'iPhone di Apple, è ChatGPT di OpenAI.

Per molto tempo dopo il suo debutto, GPT-4 è rimasto l'unico vero concorrente dei suoi concorrenti nel campo dell'intelligenza artificiale. Il mondo sta gradualmente accettando il fatto che l'intelligenza artificiale sta superando gli esseri umani in un numero crescente di compiti.

Oggi, GPT-5 ha finalmente fatto il suo debutto, elevando lo standard noto come "linea di passaggio" a una dimensione superiore.

Prova GPT-5 gratuitamente! Tutti possono usarlo gratuitamente, e Musk non è soddisfatto.

Abbiamo anche iniziato con GPT-5 e gli abbiamo chiesto di scrivere una poesia per il suo compleanno. Il punteggio massimo è 10. Quanti punti pensi che possa ottenere?

Rimanendo nel segmento delle classiche schede meteo, la qualità estetica dell'interfaccia utente di GPT-5 è davvero impressionante.

Abbiamo anche testato le capacità di programmazione di GPT-5 in Flowith.

Per maggiori dettagli, clicca sul link per andare a: Esperienza diretta con GPT-5! Tutti possono usarlo gratuitamente, Musk ha espresso insoddisfazione

Il CEO di OpenAI, Sam Altman, ha parlato molto bene di GPT-5, definendolo un enorme passo avanti rispetto a tutti i modelli precedenti. A suo parere, avere un sistema di intelligenza artificiale come GPT-5 sarebbe stato inimmaginabile in qualsiasi momento della storia.

▲ (Interfaccia principale)

Tuttavia, la conferenza stampa ha avuto anche la sua dose di "crolli", con evidenti errori di "fabbricazione" che sono comparsi nelle sezioni dei grafici e dei dati, e persino Ultraman non ha potuto fare a meno di pubblicare un post autoironico.

Naturalmente Musk non si è lasciato sfuggire questa ghiotta occasione per "cavalcare la popolarità".

Ha affermato che Grok 4 ha sconfitto GPT-5 nel test ARC-AGI e ha colto l'occasione per criticarlo, rivelando che Grok 5 verrà rilasciato prima della fine dell'anno e che si prevede che avrà prestazioni ancora migliori.

GPT-5 è qui, con miglioramenti significativi alle capacità di programmazione e scrittura, e può anche essere il tuo medico di intelligenza artificiale

GPT-5 realizza miglioramenti significativi in ambiti quali la codifica, la matematica, la scrittura, la salute e la percezione visiva, oltre a compiere progressi significativi nella riduzione delle allucinazioni, nel miglioramento dell'esecuzione delle istruzioni e nella riduzione dell'adulazione.

GPT-5 utilizza un nuovo design di sistema unificato con tre componenti principali: un modello di base efficiente per la gestione di problemi di routine, un modello di "pensiero GPT-5" con capacità di ragionamento approfondito specifiche per attività complesse e un router in tempo reale responsabile della selezione del modello appropriato in base a fattori quali la complessità della conversazione e i requisiti degli strumenti.

Questo "sistema di routing" apprende costantemente i comportamenti di commutazione degli utenti, le preferenze di feedback e l'accuratezza delle risposte, ottimizzando costantemente la strategia di allocazione. Quando gli utenti raggiungono il limite di utilizzo, il sistema passa automaticamente a una versione semplificata di ciascun modello per continuare a fornire i servizi.

GPT-5 è il modello di programmazione più potente di OpenAI fino ad oggi, in grado di gestire lo sviluppo front-end complesso e il debug di ampie basi di codice. Altman ha affermato: "Il concetto di software generato su richiesta sarà una caratteristica fondamentale dell'era GPT-5".

Ad esempio, può creare siti web, app e giochi completamente funzionali e dal design accattivante a partire da un singolo prompt. Dato il prompt seguente, GPT-5 ha creato con successo un gioco chiamato "Jumping Ball Runner", completo di tutte le funzionalità richieste, tra cui un aumento di velocità, un sistema di punteggio, effetti sonori e uno sfondo a scorrimento parallasse.

Suggerimento: per creare un'applicazione a pagina singola, i requisiti sono i seguenti e sono tutti scritti in un unico file HTML:
– Nome: Jumping Ball Runner
– Obiettivo: saltare gli ostacoli e sopravvivere il più a lungo possibile.
– Caratteristiche: velocità gradualmente crescente, record di punteggi elevati, pulsante di ripetizione e divertenti effetti sonori per azioni ed eventi.
– L'interfaccia dovrebbe essere colorata con uno sfondo a scorrimento parallasse.
– I personaggi dovrebbero avere un aspetto cartoonesco e divertente da guardare.
– I giochi dovrebbero essere divertenti per tutti.”

Quando si tratta di scrittura, GPT-5 è in grado di trasformare idee approssimative in testo dotato di ritmo e profondità letteraria.

È più affidabile nella gestione di moduli scritti complessi, come la manutenzione del contatore, bilanciando al contempo standard formali e chiarezza. Questi miglioramenti rendono ChatGPT più pratico per le attività quotidiane come l'elaborazione di documenti e la scrittura di email.

Inoltre, GPT-5 è il modello di OpenAI più performante per quanto riguarda i problemi legati alla salute.

Nella valutazione di HealthBench, basata su scenari reali e standard medici, GPT-5 ha superato significativamente tutti i modelli precedenti. Il nuovo modello identifica proattivamente potenziali problemi, pone domande mirate e fornisce raccomandazioni personalizzate in base al background, al livello di conoscenza e alla posizione geografica dell'utente.

Altman è stato responsabile dell'introduzione della parte sanitaria del GPT-5. Alla conferenza stampa, ha invitato Carolina e Filipe a condividere le loro esperienze personali.

A Carolina sono stati diagnosticati tre diversi tipi di cancro nel giro di una settimana. Dopo aver inviato questi referti pieni di termini medici a ChatGPT, ChatGPT ha tradotto il contenuto complesso in un linguaggio semplice e comprensibile in pochi secondi, aiutandola a comunicare meglio con il suo medico.

Quando le è stata posta la questione se sottoporsi o meno alla radioterapia, una questione sulla quale nemmeno i medici riuscivano a raggiungere un consenso, ChatGPT le ha fornito un'analisi dettagliata delle sfumature del caso, dei rischi e dei benefici, ecc. Ha affermato che questo le è stato più utile di una conversazione di 30 minuti con un medico.

Naturalmente, ChatGPT non sostituisce il parere di un medico e si consiglia cautela.

I risultati del benchmark mostrano che GPT-5 stabilisce nuovi record in molteplici benchmark:

  • Capacità matematica: punteggio del test AIME 2025 (senza strumenti) del 94,6%
  • Capacità di programmazione: SWE-bench Verified (con capacità di pensiero) punteggio 74,9%, Aider Polyglot (con capacità di pensiero) punteggio 88%
  • Comprensione multimodale: MMMU ha ottenuto un punteggio dell'84,2%
  • Salute: punteggio HealthBench Hard 46,2%

GPT-5 ha anche migliorato la sua capacità di eseguire istruzioni e richiamare autonomamente gli strumenti. Può completare richieste multi-step in modo più stabile, coordinare più strumenti in modo flessibile e adattare in modo intelligente le strategie comportamentali in base al contesto, dimostrando una maggiore adattabilità alle attività.

GPT-5 ha inoltre ottenuto prestazioni impressionanti in diversi benchmark multimodali, che includono riconoscimento visivo, comprensione video, giudizio spaziale e ragionamento scientifico. Grazie alle sue capacità di percezione e ragionamento migliorate, ChatGPT è ora in grado di elaborare immagini e altri input non testuali con maggiore precisione.

Nei test di benchmark interni di OpenAI, GPT-5 ha raggiunto o superato i livelli di esperto in circa il 50% delle attività di lavoro di conoscenza complesse, coprendo più di 40 settori professionali come diritto, logistica, vendite, ingegneria, ecc., e ha ottenuto risultati migliori di o3 e ChatGPT Agent.

OpenAI ha sottolineato in particolare che GPT-5 è stato addestrato sul supercomputer Azure AI di Microsoft.

Inoltre, GPT-5 ha raggiunto risultati straordinari anche in termini di efficienza del ragionamento. In compiti come il ragionamento visivo, la codifica e la risoluzione di problemi scientifici a livello universitario, GPT-5 ha superato OpenAI o3, riducendo al contempo il numero di token di output del 50-80%.

Le allucinazioni sono sempre state un problema importante per l'intelligenza artificiale. Rispetto ai precedenti modelli di OpenAI, la possibilità di allucinazioni in GPT-5 è stata notevolmente ridotta e il modello è più adatto ad affrontare problemi complessi e aperti.

Nei test anonimi rappresentativi del traffico di produzione di ChatGPT, GPT-5 ha ottenuto un tasso di errore effettivo inferiore di circa il 45% rispetto a GPT-4o e un tasso di errore inferiore di circa l'80% rispetto a OpenAI o3 quando l'inferenza era abilitata.

Nei test di benchmark sull'accuratezza dei fatti aperti LongFact e FActScore, il tasso di allucinazioni del "pensiero GPT-5" è circa sei volte inferiore a quello di o3, segnando un miglioramento significativo nell'accuratezza della generazione di contenuti di lunga durata.

Oltre a una maggiore accuratezza fattuale, GPT-5 (che ha la capacità di pensare) può comunicare in modo più onesto il suo comportamento e le sue capacità agli utenti. Secondo Alex Beutel, responsabile della ricerca sulla sicurezza dei modelli, OpenAI ha testato GPT-5 per "oltre 5.000 ore" per comprenderne i rischi per la sicurezza.

GPT-5 introduce anche un nuovo metodo di addestramento sicuro chiamato "Completamento Sicuro", che consente al modello di fornire risposte utili mantenendo al contempo i limiti di sicurezza. Quando una richiesta deve essere respinta, GPT-5 ne spiega in modo trasparente il motivo e offre un'alternativa sicura.

In termini di esperienza utente, GPT-5 riduce i comportamenti eccessivamente reattivi, riducendo il tasso di risposte lusinghiere in un test di adulazione appositamente progettato dal 14,5% a meno del 6%. Il nuovo modello utilizza meno emoji inutili e le sue risposte sono più sfumate e ponderate.

Inoltre, OpenAI ha lanciato quattro personalità preimpostate per tutti gli utenti: Cinico, Robot, Ascoltatore e Nerd. Queste personalità sono inizialmente disponibili per la chat testuale e saranno successivamente disponibili anche per la chat vocale. Gli utenti possono adattare lo stile di interazione di ChatGPT alle proprie preferenze personali.

Nella dimostrazione dal vivo, l'interazione vocale è diventata molto naturale e controllabile.

I ricercatori di OpenAI hanno chiesto a GPT-5 di rispondere alle domande con una sola parola da quel momento in poi. Quando gli è stato chiesto di condividere una parola di saggezza, GPT-5 ha risposto: "Pazienza". Tutti i partecipanti all'evento di lancio hanno riso e il presentatore ha suggerito che questo potrebbe essere il modo del modello di ringraziare tutti per la pazienza dimostrata nell'attesa del rilascio di GPT-5.

Anche gli utenti gratuiti possono utilizzarlo, ed esiste anche un modello davvero profumato

In sostituzione di OpenAI o3-pro, OpenAI ha rilasciato anche GPT-5 pro, una variante di GPT-5 in grado di elaborare calcoli più lunghi e di utilizzare un calcolo parallelo in tempo reale, scalabile ma efficiente, per fornire risposte di altissima qualità e più complete.

In una valutazione di oltre 1.000 prompt di ragionamento pratico economicamente validi, gli esperti esterni hanno preferito GPT-5 Pro nel 67,8% dei casi. Il suo tasso di errore principale è risultato inferiore del 22% rispetto a quello di GPT-5 e ha ottenuto buoni risultati in ambito sanitario, scientifico, matematico e di programmazione, ricevendo elogi unanimi dagli esperti.

GPT-5 sta iniziando a diventare il nuovo modello predefinito per ChatGPT a partire da oggi, e verrà distribuito a tutti gli utenti Plus, Pro, Team e Free, mentre gli utenti Enterprise ed Edu avranno accesso una settimana dopo.

Gli utenti della versione gratuita possono inviare 10 messaggi ogni 5 ore, mentre gli utenti Plus possono inviare 80 messaggi ogni 3 ore.

Gli utenti Pro hanno accesso illimitato a GPT-5 e GPT-5 Pro, mentre gli utenti gratuiti passeranno automaticamente a GPT-5 mini al raggiungimento del limite di utilizzo. Gli utenti Pro, Plus e Team possono anche accedere alla Codex CLI tramite ChatGPT e richiamare GPT-5 dall'interno del proprio ambiente di sviluppo per completare attività come la codifica e il debug.

Sebbene GPT-5 sia ora disponibile per tutti gli utenti, gli utenti della versione gratuita di ChatGPT non potranno usufruire immediatamente dell'esperienza completa di GPT-5. Una volta raggiunto il limite di utilizzo di GPT-5, gli utenti della versione gratuita passeranno a un modello più piccolo, veloce e ottimizzato, GPT-5 mini.

Per gli sviluppatori, OpenAI ha inoltre lanciato tre diverse versioni della piattaforma API: gpt-5, gpt-5-mini e gpt-5-nano. Gli sviluppatori possono scegliere in modo flessibile in base ai diversi requisiti del progetto in termini di prestazioni, costi e velocità di risposta.

GPT-5 supporta interfacce tradizionali come l'API di risposta e l'API di completamento chat, ed è ora il modello predefinito per la CLI del Codex. Tutte le versioni includono il controllo sui parametri reasoning_effort e verbosity, nonché funzionalità di strumenti personalizzati.

Oltre alle capacità conversazionali di base, GPT-5 integra anche funzioni principali come chiamate di strumenti paralleli, strumenti integrati (ricerca web, elaborazione file, generazione immagini), elaborazione streaming, output strutturato e funzionalità di ottimizzazione dei costi come memorizzazione nella cache dei prompt e API batch.

L'API GPT-5 introduce inoltre quattro nuove funzionalità fondamentali che migliorano significativamente l'esperienza degli sviluppatori.

In primo luogo, il parametro reasoning_effort consente agli sviluppatori di passare in modo flessibile tra impostazioni minime, basse, medie e alte in base ai diversi scenari di attività. L'utilizzo dell'impostazione minima per risposte rapide a compiti semplici e di quella alta per riflessioni più approfondite in domande complesse consente agli sviluppatori di trovare l'equilibrio ottimale tra qualità e velocità di risposta.

Il parametro "verbosità" supporta tre impostazioni: bassa, media e alta, aiutandoti a controllare il livello di dettaglio delle tue risposte. Ad esempio, per la domanda "Perché il cielo è blu?", un'impostazione bassa fornisce una risposta concisa e chiara, mentre un'impostazione alta include una spiegazione scientifica dettagliata.

La nuova funzionalità di strumenti personalizzati supporta la formattazione del testo normale, eliminando la necessità di utilizzare caratteri di escape JSON. Gli sviluppatori non devono più preoccuparsi di errori di formattazione durante l'elaborazione di grandi quantità di codice o documenti lunghi.

Vale la pena notare che l'intero processo di esecuzione è tracciabile. GPT-5 fornirà aggiornamenti attivi sullo stato di avanzamento durante l'esecuzione delle chiamate degli strumenti, consentendo agli sviluppatori di comprendere il piano di esecuzione dell'IA e lo stato attuale.

Inoltre, a differenza del sistema GPT-5 in ChatGPT, la versione API è ottimizzata appositamente per le esigenze degli sviluppatori ed è più adatta per scenari di programmazione e attività degli agenti.

Strumenti e piattaforme di sviluppo noti, tra cui Windsurf, Vercel e JetBrains, hanno elogiato GPT-5. Windsurf ha osservato che GPT-5 ha raggiunto prestazioni all'avanguardia nella sua valutazione, ottenendo "un tasso di errore di chiamata dello strumento pari alla metà di quello di altri modelli all'avanguardia".

Il rilascio di GPT-5 potrebbe rappresentare un colpo fatale per Claude.

Secondo The Information, oltre il 60% dei 5 miliardi di dollari di fatturato annuo di Anthropic proviene dalle API, con Cursor e GitHub Copilot che da soli contribuiscono per 1,4 miliardi di dollari. Questa struttura di fatturato "tutto in uno" mette a nudo la vulnerabilità di Anthropic.

La crudeltà del mercato degli strumenti di programmazione è che le prestazioni sono tutto. Anche un aumento del 5% della precisione significa risparmiare agli sviluppatori ore di debug ogni giorno. In passato, Claude è riuscito a crescere rapidamente nel campo della programmazione, soprattutto perché ChatGPT era relativamente arretrato nelle capacità di programmazione.

Ma la finestra di opportunità prima o poi si chiuderà. Con il miglioramento di GPT-5 nelle attività di programmazione del codice e nelle capacità degli agenti, unito al più solido legame ecologico e ai canali di distribuzione dei prodotti di OpenAI, il ritorno di Cursor e Copilot su OpenAI avrà un impatto significativo sui ricavi di Anthropic.

Forse presto assisteremo all'arrivo di Claude 5.

Autori: Li Chaofan, Mo Chongyu, Zhang Zihao

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo