Proprio ora, OpenAI ha annunciato la creazione del “sistema operativo ChatGPT” e 800 milioni di utenti daranno il benvenuto a una nuova esperienza
Nel 2023, OpenAI avrà solo 2 milioni di sviluppatori attivi ogni settimana e 100 milioni di utenti attivi ogni settimana.
Due anni dopo, in occasione del Dev Day di OpenAI appena tenutosi, il CEO Sam Altman ha dichiarato: Ora 4 milioni di sviluppatori utilizzano OpenAI per creare prodotti, più di 800 milioni di persone utilizzano ChatGPT ogni settimana e l'API elabora 6 miliardi di token al minuto.
Grazie a tutti voi, l'intelligenza artificiale è passata dall'essere qualcosa con cui le persone giocavano a uno strumento che le persone usano per creare ogni giorno.
Sulla base di questo tasso di crescita, possiamo dire che abbiamo vinto.
E proprio la scorsa settimana, la valutazione di OpenAI è salita a 500 miliardi di dollari attraverso una transazione azionaria da 6,6 miliardi di dollari, superando SpaceX di Musk e diventando la startup più quotata al mondo.
Momenti salienti del DevDay:
- ChatGPT diventa una super app: le applicazioni di terze parti possono essere richiamate direttamente durante le conversazioni, l'intelligenza artificiale può consigliare strumenti in modo proattivo e le transazioni in-app possono essere utilizzate per la monetizzazione.
- Il toolkit AgentKit è ora online: trascina e rilascia visivamente per creare flussi di lavoro multi-agente, completando l'intero processo, dallo sviluppo alla distribuzione, in pochi minuti.
- Codex è completamente aperto: scrivi codice in tempo reale utilizzando il linguaggio naturale, supporta il controllo vocale e l'integrazione con Slack e rivedi automaticamente le PR per aumentare l'efficienza del team del 70%.
- Importante aggiornamento dell'API del modello: l'API aperta GPT-5 Pro più potente, costi vocali ridotti del 70%, Sora 2 supporta la generazione di video all'interno del prodotto e un controllo dettagliato.
Installa l'app direttamente in ChatGPT
Oggi OpenAI ha lanciato una bomba: ChatGPT può ora chiamare direttamente applicazioni di terze parti.
In passato, forse era necessario scaricare un'app specifica; ora, con una sola frase, app come Spotify e Canva possono essere richiamate automaticamente nella conversazione e fornire un'interfaccia interattiva che può essere utilizzata direttamente.
Se hai già sottoscritto un abbonamento a un servizio esterno, puoi accedere al tuo account direttamente in ChatGPT per una connessione fluida.
A partire da oggi, è disponibile per tutti gli utenti registrati, ad eccezione di quelli residenti nell'UE, con i piani Free, Go, Plus e Pro. Il programma pilota iniziale include una serie di partner importanti, tra cui Booking.com, Canva, Coursera, Figma, Expedia, Spotify e Zillow.
La dimostrazione in loco è stata ancora più emozionante.
Un dipendente di OpenAI ha aperto ChatGPT e ha chiesto a Canva di progettare un poster promozionale per un servizio di dog walking. In pochi secondi, Canva ha proposto diverse opzioni di design.
Poi questo tizio ha chiesto di creare una presentazione aziendale PPT basata sul contenuto del poster: questa combinazione di colpi era liscia come la seta.
Ha quindi utilizzato ChatGPT per contattare Zillow e visualizzare le case in vendita nella zona di Pittsburgh. Zillow ha generato immediatamente una mappa interattiva e l'utente ha potuto porre ulteriori domande per ottenere maggiori dettagli.
La cosa ancora più intelligente è che quando ChatGPT ritiene che una determinata app possa aiutarti, te la consiglierà attivamente.
Ad esempio, se dici "aiutami a creare una playlist per una festa", potresti chiamare direttamente Spotify per aiutarti: questa operazione è davvero importante.
Dietro tutto questo c'è il nuovo Apps SDK (Application Development Kit). Gli sviluppatori possono ora utilizzare l'anteprima di Apps SDK per iniziare a sviluppare le proprie applicazioni ChatGPT.
Vale la pena ricordare che l'Apps SDK è basato sul Model Context Protocol (MCP), uno standard aperto che consente agli sviluppatori di connettere fonti di dati esterne ai sistemi di intelligenza artificiale. Ciò significa anche che le applicazioni sviluppate con questo standard possono essere eseguite su qualsiasi piattaforma compatibile.
Proprio come iOS fornisce il sistema operativo e l'App Store gestisce la distribuzione e la monetizzazione, formando in ultima analisi l'ecosistema dell'internet mobile, ChatGPT ora funge da sistema operativo, l'Apps SDK funge da strumento di sviluppo e i suoi 800 milioni di utenti costituiscono il fondamento dell'ecosistema. In poche parole, ChatGPT è pronta a diventare una super app.
Inoltre, più avanti nel corso dell'anno, OpenAI avvierà una procedura di invio delle domande, lancerà un catalogo di applicazioni dedicato e annuncerà meccanismi di monetizzazione, tra cui il supporto per il nuovo protocollo Agentic Commerce, che consente il checkout e le transazioni istantanee all'interno di ChatGPT.
AgentKit è qui, rendendo la creazione di agenti un gioco da ragazzi
Oggi OpenAI ha lanciato ufficialmente AgentKit, un set completo di strumenti progettati per sviluppatori e aziende.
In passato, creare un agente era un incubo: complessa orchestrazione dei processi, connettori personalizzati, valutazione manuale e settimane di sviluppo front-end prima di essere pubblicato. Ora, con AgentKit, include tre componenti principali:
- Agent Builder: una tela visiva per la creazione e la gestione di versioni di flussi di lavoro multi-agente
- Registro dei connettori: un luogo centrale in cui gli amministratori possono gestire l'interoperabilità dei dati e degli strumenti
- ChatKit: un toolkit per integrare nei tuoi prodotti esperienze personalizzabili basate sulla chat degli agenti
Nello specifico, Agent Builder fornisce un'area di lavoro visiva che consente di orchestrare la logica, connettere strumenti e configurare regole di sicurezza personalizzate trascinando e rilasciando i nodi. Supporta inoltre esecuzioni di anteprima, impostazioni di valutazione integrate e controllo completo delle versioni.
Durante la conferenza stampa, Altman ha anche paragonato questa funzionalità a "Canva per la creazione di agenti intelligenti".
OpenAI ha inoltre lanciato il Connector Registry, che consente agli sviluppatori di connettere in modo sicuro gli agenti a strumenti interni o sistemi di terze parti tramite un pannello di controllo dell'amministratore, garantendo al contempo la sicurezza dei dati e il controllo degli accessi.
ChatKit consente agli sviluppatori di integrare facilmente agenti intelligenti basati su chat nei propri prodotti, siano essi app o siti web, consentendo una personalizzazione approfondita in base ai temi del brand. Esempi di collaborazioni includono Canva, LegalOn e HubSpot.
L'anno scorso, OpenAI ha lanciato Evals per aiutare gli sviluppatori a testare i prompt e misurare le prestazioni dei modelli. Quest'anno ha aggiunto quattro potenti funzionalità: set di dati, punteggi di tracciamento, ottimizzazione automatica dei prompt e supporto per modelli di terze parti.
Inoltre, la tecnologia Reinforced Fine-Tuning (RFT) consente agli sviluppatori di personalizzare i modelli di inferenza di OpenAI. RFT è ora completamente disponibile su GPT-5-mini e in versione beta privata su GPT-5, introducendo due nuove funzionalità: chiamate di strumenti personalizzate e scorer personalizzati.
In soli 7 minuti e 11 secondi, i dipendenti di OpenAI hanno creato da zero un assistente AI per il sito web del Dev Day. Hanno aggiunto visivamente un agente di classificazione, nodi di routing, un agente Sessions per gestire la pianificazione delle riunioni, un agente Dev Day per gestire le query generali e hanno persino implementato la protezione PII.
Una volta completata la configurazione, quando un utente chiede in Agent Builder "A quale conferenza dovrei partecipare per imparare a creare un agente?", il sistema esegue automaticamente l'intero processo: verifica delle linee guida, classificazione dell'intento, estrazione delle informazioni dai documenti, visualizzazione tramite widget e, infine, raccomandazione di conferenze appropriate e pertinenti.
Dopo aver verificato che il flusso di lavoro funzionava, lo ha chiamato "Ask Frog" e lo ha pubblicato per ottenere un ID del flusso di lavoro.
Abbiamo quindi integrato l'agente nel codice del sito web del Dev Day utilizzando il componente React Chat Kit, lo abbiamo configurato con i colori, i segnaposto e il tooltip di avvio del tema Frog, abbiamo aggiunto un'interfaccia di chat a scomparsa e abbiamo posizionato un link "Chiedi a Frog" nella parte superiore del sito, immediatamente disponibile per tutti i partecipanti.
L'intero processo si è svolto nel modo più fluido possibile.
OpenAI apre ufficialmente il Codex, consentendo all'intelligenza artificiale di scrivere codice semplicemente parlando
Dall'inizio di agosto, l'utilizzo attivo giornaliero di Codex è cresciuto di oltre 10 volte e GPT-5-Codex ha elaborato oltre 40 trilioni di token entro tre settimane dal suo rilascio.
Durante la conferenza stampa, è stato affermato che all'interno di OpenAI, quasi tutti gli ingegneri ora utilizzano Codex. Il team ha registrato un aumento del 70% nel numero di pull request elaborate ogni settimana, con Codex che le esamina automaticamente quasi tutte.
Oggi OpenAI ha annunciato ufficialmente la disponibilità generale di Codex, che introduce tre nuove funzionalità:
- Nuova integrazione con Slack: delega attività o poni domande direttamente a Codex in un canale o thread del team
- Codex SDK: integra lo stesso agente intelligente che alimenta Codex CLI nel tuo flusso di lavoro
- Nuovi strumenti di amministrazione: visualizzazione e gestione più intuitive dell'utilizzo su larga scala del Codex
Con l'SDK Codex, puoi introdurre lo stesso agente nel tuo flusso di lavoro o applicazione di progettazione con poche righe di codice. L'SDK supporta attualmente TypeScript e supporterà altri linguaggi in futuro.
A partire da oggi, l'integrazione con Slack e Codex SDK sono disponibili per gli utenti dei piani ChatGPT Plus, Pro, Business, Edu ed Enterprise.
I dipendenti di OpenAI hanno realizzato un sistema completo di controllo della telecamera sul palco, compresa la creazione di un server Node, la scrittura di tutta la logica di elaborazione dei pacchetti UDP e sono persino riusciti a controllare la telecamera con un controller Xbox, oltre a controllare la telecamera e le luci del locale comunicando con l'intelligenza artificiale.
Infine, il relatore ha illustrato le capacità di programmazione in tempo reale dell'SDK Codex, utilizzando comandi vocali per richiedere all'IA di chiamare Codex per modificare il codice dell'app React in tempo reale, creando un effetto di sottotitoli a scorrimento cinematografico. L'intera dimostrazione è stata completata utilizzando il linguaggio naturale, senza scrivere una sola riga di codice.
Il modello e l'API sono stati completamente aggiornati. Questa wave è davvero ottima.
GPT-5 Pro apre ufficialmente l'accesso alle API a tutti gli sviluppatori.
Si tratta del modello più intelligente mai rilasciato da OpenAI. È particolarmente adatto alla gestione di compiti complessi che richiedono elevata precisione e ragionamento approfondito. I suoi ambiti di applicazione spaziano in settori professionali come finanza, diritto e medicina.
Per quanto riguarda il parlato, OpenAI ha rilasciato anche gpt-realtime-mini, che riduce il prezzo del 70% mantenendo la stessa qualità e capacità di espressione del parlato.
Sam Altman ha sottolineato in particolare che la voce diventerà uno dei principali modi in cui le persone interagiscono con l'intelligenza artificiale.
Ciò che è ancora più degno di nota è che la versione di anteprima API di Sora 2 è stata ufficialmente rilasciata e gli sviluppatori possono ora generare video di alta qualità direttamente nei propri prodotti.
L'API di Sora 2 è molto flessibile e consente agli sviluppatori di controllare la lunghezza, le proporzioni e la risoluzione dei video, di mixare e tagliare facilmente i video e di dotare tutti i video di effetti sonori sincronizzati completamente realistici.
Al termine della conferenza stampa, Sam Altman ha sottolineato nel suo riassunto che lo sviluppo del software è stato ridotto da un lungo ciclo di mesi o anni a pochi minuti.
Gli sviluppatori non hanno più bisogno di un team numeroso: hanno solo bisogno di una buona idea per trasformarla rapidamente in realtà.
L'intera catena di strumenti presentata durante la conferenza, da Apps SDK ad AgentKit fino a Codex, è basata su queste potenti API modello.
Devo dire che questo Dev Day contiene molte informazioni.
Questa ondata di aggiornamenti di OpenAI copre quasi tutti gli ambiti di interesse degli sviluppatori: dall'ecologia delle applicazioni agli strumenti degli agenti, dagli assistenti di codice alla generazione di video, senza tralasciarne nemmeno uno.
I lanci di prodotti di fascia alta sono spesso molto semplici e senza pretese.
Infine, quale funzione ritieni sia la più pratica? Sentiti libero di condividere le tue opinioni nella sezione commenti.
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.