Sette versioni consecutive del modello aggiornano il livello SOTA, la Cina sta dando alla luce l’Android dell’era dell’intelligenza artificiale
600 milioni di download, 170.000 modelli derivati, al servizio di oltre 1 milione di clienti.
Nel 2025, quando le guerre dell'intelligenza artificiale erano al culmine, il modello di intelligenza artificiale open source più utilizzato al mondo proveniva dal Tongyi Big Model di Alibaba. Non è esagerato affermare che, quando gli sviluppatori di tutto il mondo hanno bisogno di un modello gratuito, facile da usare e senza restrizioni commerciali, questo è diventato la scelta predefinita.
Alla conferenza Yunqi di oggi sono stati presentati sette nuovi membri della grande famiglia di modelli Tongyi, che coprono molteplici ambiti come linguaggio, visione, voce, multimodalità e codice. Dall'ecologia open source ai servizi commerciali, coprono quasi tutti i collegamenti chiave delle attuali applicazioni di intelligenza artificiale.
Questi sette modelli hanno una chiara divisione del lavoro: Qwen3-Max svolge il ruolo di "soffitto", con migliaia di miliardi di parametri confrontati con i modelli più potenti del mondo; Qwen3-Next si concentra sull'"inclusività", ottenendo prestazioni da auto sportiva con i consumi di carburante di una berlina; Qwen3-VL trasforma gli schizzi in codice in pochi secondi, Qwen3-Omni è un assistente completamente modale, Qwen3-Coder è specializzato nella programmazione, Wan2.5-preview realizza la creazione di video di livello cinematografico e Tongyi Bailing Fun fornisce centinaia di servizi audio.
Il CEO del gruppo Alibaba, Wu Yongming, ha annunciato direttamente due importanti roadmap per Alibaba Cloud: la prima è che Tongyi Qianwen insiste sull'open source e punta a diventare "l'Android dell'era dell'intelligenza artificiale"; la seconda è quella di costruire il "computer di prossima generazione", il super cloud AI, per fornire al mondo una rete di elaborazione intelligente.
Guardando indietro, Alibaba potrebbe aver preso la decisione più importante di quest'epoca: le aziende di intelligenza artificiale non dovrebbero solo raccontare storie sul superamento dell'intelligenza umana, ma anche raccontare storie su come consentire a tutti di avere l'intelligenza artificiale, e quest'ultima potrebbe essere più fantasiosa.
Dai modelli agli ecosistemi, la gamma completa di prodotti di Tongyi Qianwen è qui
Con sette modelli lanciati di seguito, quali "nuove carte" specifiche ha svelato questa volta la famiglia di modellini di grandi dimensioni Tongyi Qianwen? Dopo averle analizzate, sembrano abbaglianti, ma il tema principale è molto chiaro: due carte vincenti, più un tavolo di piatti hardcore.
▲Diversi modelli sono stati resi open source su Hugging Face durante la conferenza stampa
La prima carta vincente è Qwen3-Max.
Questo è il "tetto" di Alibaba, con oltre un trilione di parametri totali e 36 trilioni di token utilizzati per il pre-addestramento. Sebbene la sua architettura continui a seguire il design MoE della serie Qwen3, ha apportato miglioramenti significativi ai suoi metodi di addestramento.
Ad esempio, il bilanciamento del carico globale e il parallelismo della pipeline rendono il processo di addestramento più stabile e prevengono fluttuazioni anomale; l'efficienza è più veloce del 30% rispetto alla generazione precedente; può anche supportare testi lunghi di 1 milione di parole; persino i comuni guasti hardware nei cluster su larga scala possono ridurre la perdita di tempo a un quinto dell'originale.
Punti chiave:
Il modello di punta, Qwen3-Max, migliora significativamente le capacità di programmazione e di agente intelligente, ottenendo risultati eccezionali in numerosi benchmark.
- Qwen3-Max-Base: enfatizza l'allenamento efficiente su larga scala, il contesto lungo e la stabilità eccezionale.
- Qwen3-Max-Instruct: classificato tra i primi tre a livello mondiale nella classifica testuale di LMArena, superando GPT-5-Chat. Ha ottenuto un punteggio di 69,6 nel test di codice verificato SWE-Bench e un punteggio di 74,8 nel benchmark di chiamata dello strumento di agente intelligente Tau2-Bench, superando sia Claude Opus 4 che DeepSeek-V3.1.
- Qwen3-Max-Thinking (Heavy): una versione di ragionamento avanzata che combina un interprete di codice con il calcolo parallelo. Raggiunge il 100% di accuratezza su benchmark di ragionamento matematico complessi come AIME 25 e HMMT, dimostrando un forte potenziale di ragionamento. È ancora in fase di addestramento.
Nel complesso, Qwen3-Max ha portato la sua architettura ingegneristica, l'efficienza di training, il contesto esteso, le capacità di ragionamento e le attività di agente intelligente a livelli leader a livello mondiale. Le sue prestazioni, sia nei benchmark di codice che di ragionamento, dimostrano che i modelli cinesi stanno davvero entrando in una fase in cui possono competere a testa alta con i concorrenti più forti.
La seconda carta vincente è Qwen3-Next.
Se Max è il volto di Alibaba, Next ne è il cuore: lo rende davvero accessibile e fattibile per sviluppatori e aziende.
I modelli di grandi dimensioni si trovano spesso di fronte a un "triangolo impossibile" (alte prestazioni, basso costo e facilità di implementazione), ed è difficile raggiungere tutti e tre gli obiettivi. I modelli di fascia alta (come GPT-4/5) spesso comportano costi di inferenza elevati, diventando il principale ostacolo all'adozione dell'IA.
▲L'efficienza di addestramento e inferenza di Qwen3-Next è stata notevolmente migliorata
La soluzione di Alibaba è quella di utilizzare Qwen3-Max per superare il "tetto" delle prestazioni e poi utilizzare Qwen3-Next per superare il "piano" dei costi.
Grazie a innovazioni architetturali di nuova generazione, come MoE altamente sparse e attenzione ibrida, si ottengono le prestazioni di un modello denso da 235 miliardi di bit con soli 3 miliardi di parametri di attivazione. Ciò equivale a raggiungere le prestazioni di un'auto sportiva con i consumi di una berlina. Il risultato finale è una riduzione del 90% dei costi di addestramento e un aumento di dieci volte dell'efficienza di inferenza di testo lungo.
▲ Qwen3-Next adotta una nuova architettura di modello di nuova generazione che combina attenzione lineare e attenzione standard. Songlin Yang, autore di Gated Delta Networks, ha ritwittato Qwen
Questa capacità sistematica trasforma la visione "tutti possono usare l'intelligenza artificiale" da uno slogan in realtà, ed è molto più rivoluzionaria per il settore rispetto al semplice rilascio di un modello ad alte prestazioni.
Una tavola piena di piatti deliziosi: copre tutto il lavoro che puoi immaginare
▲Il modello di linguaggio visivo Qwen3-VL supera Gemini 2.5 Pro in numerosi test di benchmark
- Qwen3-VL: Il modello visivo è stato reso open source, evolvendosi dal riconoscimento delle immagini al ragionamento e all'esecuzione. Può gestire interfacce per computer e dispositivi mobili e può anche generare codice HTML/CSS direttamente da uno schizzo. Per molti product manager, questo significa che "ciò che vedi è ciò che ottieni" è diventato davvero una realtà.
- Qwen3-Omni: una piattaforma multimodale in grado di elaborare simultaneamente testo, immagini, audio e video. Ha ottenuto il primo posto in 32 test open source su 36 benchmark disponibili al pubblico, e ha raggiunto prestazioni all'avanguardia in 22. Supporta inoltre conversazioni vocali in tempo reale e persino personalità personalizzabili, come un assistente personale che parla più di una dozzina di lingue.
▲ In una valutazione completa delle prestazioni, Qwen3-Omni ha superato modelli closed-source come Gemini-2.5-Pro, Seed-ASR e GPT-4o-Transcribe in numerosi test.
- Qwen3-Coder: Con un modello di programmazione aggiornato, è più veloce e sicuro. Può aiutarti direttamente a implementare un progetto completo e a correggere facilmente i bug. Per gli sviluppatori, è più simile a un "partner di programmazione in coppia" sempre attivo.
- Anteprima Wan2.5: una funzionalità rivoluzionaria nella direzione AIGC. Offre funzionalità avanzate per la generazione di video e immagini, la generazione di immagini e l'editing di immagini. Fondamentalmente, raggiunge per la prima volta la generazione di video di qualità cinematografica con audio e video sincronizzati. Con velocità da 5 a 10 secondi, risoluzione 1080p e 24 fotogrammi al secondo, non è più solo un giocattolo; è uno strumento che consente ai singoli creatori di realizzare cortometraggi.
Inoltre, c'è la famiglia di modelli vocali su larga scala Tongyi Bailing Fun, che offre centinaia di voci per scenari come servizio clienti, streaming live, e-commerce e audiolibri. C'è anche Qwen3Guard, un modello di audit di sicurezza sviluppato per la sicurezza globale basata sull'intelligenza artificiale in tempo reale e basato su Qwen3, e Qwen3-LiveTranslate-Flash, un modello di traduzione multimodale in tempo reale.
Mettendo insieme tutto questo, scoprirete che Alibaba sta inviando un messaggio molto diretto: volete le massime prestazioni? Ecco Max. Volete la massima efficienza? Ecco Next. Volete l'esplorazione multimodale? Ecco VL e Omni. Volete la produttività nella codifica e nella creazione? Ecco Coder e Wan…
▲Qwen3-Omni è una nuova generazione di modelli omnimodali nativi di grandi dimensioni in grado di elaborare senza problemi molteplici tipi di input, come testo, immagini, audio e video. Ora può essere attivato tramite chat vocale e video in Qwen Chat.
Non si tratta di una semplice "pila di nuovi prodotti", ma di un ecosistema completo di tutte le dimensioni e modalità. Alibaba li sta consegnando tutti agli utenti contemporaneamente, comunicando a tutte le aziende, ai privati e agli sviluppatori: qualunque cosa stiate facendo, la famiglia di modelli Tongyi ha un elemento costitutivo che può fare al caso vostro.
Ma l'importanza di questa "versione completa" non risiede solo nell'arricchimento del prodotto. La presentazione simultanea di sette modelli dimostra chiaramente che la famiglia di modelli Tongyi Qianwen copre ora tutte le taglie e le modalità, e che ogni modello ha raggiunto prestazioni all'avanguardia nelle recensioni mainstream.
È proprio questa solida base che ci ha garantito una posizione unica nel settore. Come ha affermato Wu Yongming, CEO di Alibaba Group, durante la conferenza stampa di oggi: "Tongyi Qianwen è probabilmente il modello più diffuso al mondo per dispositivi informatici".
Su Hugging Face, la più grande community di modelli di intelligenza artificiale open source al mondo, la ricerca della parola chiave "qwen" produce oltre 160.000 modelli correlati, tutti con milioni di download. Attualmente, il modello della serie Qwen ha il numero più alto di download, raggiungendo i 7 milioni (Qwen2.5-3B-Instruct).
Ad oggi, Tongyi Qianwen ha reso open source oltre 300 modelli, che coprono tutte le modalità e le dimensioni. Questi modelli sono i più utilizzati in Cina e i più popolari tra gli sviluppatori di tutto il mondo. I modelli di grandi dimensioni di Tongyi sono stati scaricati oltre 600 milioni di volte in tutto il mondo, con oltre 170.000 modelli derivati, rendendolo la più grande matrice di modelli open source al mondo.
Ovviamente, in questo percorso di modelli su larga scala ancora dominato dai giganti internazionali, una famiglia di modelli open source proveniente dalla Cina sta facendo sentire la sua presenza a modo suo, rinnovando lo status storico dell'intelligenza artificiale nazionale.
Nella seconda metà dell'era dei grandi modelli, Tongyi Qianwen punta a diventare l'Androide dell'era dell'intelligenza artificiale
Nel 2019, quando Alibaba ha testato un modello da 10 trilioni di parametri sul suo M6, il concetto di "grandi modelli" è rimasto in gran parte accademico, lontano dall'industrializzazione. Quattro anni dopo, il lancio ufficiale di Tongyi Qianwen ha segnato una svolta.
Da Qwen-7B, 14B a 72B, e poi agli attuali trilioni di parametri, il percorso di Qwen non è complicato. Si tratta di espandere costantemente la scala, ottimizzare e verificare, ed espandere una famiglia di modelli passo dopo passo.
I parametri totali dei modelli Qwen2 e Qwen2.5 nel 2024 e del Qwen3-Max rilasciato oggi superano 1T e per il pre-addestramento vengono utilizzati token da 36T, migliorando ulteriormente le capacità di codifica e degli agenti.
Mentre i grandi modelli entrano nella loro fase finale, i modelli open source stanno diventando una tendenza irreversibile. La Cina è diventata quasi l'attore più importante nell'open source globale, con Alibaba e DeepSeek che svolgono i ruoli più importanti.
Wu Yongming è sincero al riguardo: "Nell'era dell'LLM, il valore creato dai modelli open source e dagli scenari in cui possono penetrare sarà di gran lunga maggiore di quello dei modelli closed source".
Le più grandi aziende modello al mondo hanno ciascuna un proprio focus: alcune servono principalmente i propri ecosistemi, mentre altre contribuiscono ai social e alla pubblicità. Alcune si concentrano su strumenti e crescita degli utenti, mentre altre enfatizzano l'integrazione full-modal e l'integrazione con la ricerca. Alibaba, d'altra parte, aspira a diventare "l'Android dell'era dell'intelligenza artificiale".
Il successo di Android non risiede nel fatto che sia più forte e più perfetto di iOS, ma nella sua capacità di adattarsi a un'ampia gamma di dispositivi, dai vecchi telefoni che costano poche centinaia di yuan agli schermi pieghevoli che costano decine di migliaia di yuan, consentendo al mercato degli smartphone di prosperare davvero.
La logica di Qwen è esattamente la stessa. Dal Qwen3-Max da 0,5 miliardi di bit al Qwen3-Max "full-scale" con trilioni di parametri, dal Qwen3-Coder per la scrittura di codice al Qwen3-VL per la "codifica tramite l'osservazione delle immagini", ai dispositivi Tongyi Wanxiang e Tongyi Bailing in grado di ascoltare e parlare con audio e video sincronizzati, e persino al Qwen3-Omni che consente conversazioni vocali in tempo reale come con una persona reale, Alibaba offre praticamente tutti gli strumenti che uno sviluppatore possa immaginare.
Dietro a tutto questo c'è un cambiamento di mentalità: Alibaba non decide più per te "cosa usare", ma restituisce al mercato il diritto di scelta, di definizione e persino il controllo finale dei costi.
Qwen svolge il ruolo più difficile e faticoso, ma insostituibile: il sistema Android nell'era dell'intelligenza artificiale, che fornisce "acqua, elettricità e gas" di base per l'implementazione di applicazioni e scenari di intelligenza artificiale.
Oltre un milione di aziende, infatti, ha già avuto accesso ai servizi di modelli su larga scala di Tongyi tramite Alibaba Cloud. Proprio come l'accesso all'acqua e all'elettricità, l'intelligenza artificiale è considerata la forma più fondamentale di produttività. Nonostante i ripetuti ritardi, il lancio dell'intelligenza artificiale di Apple in Cina è stato quasi certamente confermato, in collaborazione con Qwen. Questa è la prima volta che un modello cinese su larga scala entra nel mercato degli iPhone.
Alla conferenza Yunqi di oggi, Wu Yongming ha anche annunciato che Alibaba investirà oltre 380 miliardi di yuan nei prossimi tre anni in infrastrutture hardware per cloud e intelligenza artificiale, con piani per investimenti ancora maggiori. Secondo i piani a lungo termine, per prepararsi all'avvento dell'era ASI, si prevede che il consumo energetico globale dei data center di Alibaba Cloud aumenterà di dieci volte entro il 2032 rispetto al 2022, il primo anno di GenAI.
Si tratta anche del "Modello come servizio" (MaaS) a cui Alibaba Cloud aderisce dal 2022. Esso pone i modelli di grandi dimensioni come elemento centrale della produttività e si affida alla potenza di calcolo e all'infrastruttura di Alibaba Cloud per fornire alle aziende funzionalità di intelligenza artificiale ad alte prestazioni e a basso costo.
Quando una piattaforma cerca di abbassare la soglia di innovazione per l'intera società, ciò che può sostenere non è solo il suo valore commerciale.
Per gli sviluppatori e le aziende alle prese con la questione "quale modello utilizzare", l'emergere di un sistema "AI Android" aperto, economico e facile da usare è come tornare all'era delle scoperte, quando qualcuno ha costruito un porto per te e ha anche reso accessibili al pubblico tutte le carte nautiche del mondo.
Sembra che non ci sia altra scelta che salpare.
Autori: Li Chaofan, Zhang Zihao, Mo Chongyu
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.