Intervista di quattro ore di MiniMax Yan Junjie e Luo Yonghao: tracciare una terza via per l’intelligenza artificiale in Cina: le montagne non sono insormontabili.

Mentre l'intero settore dell'intelligenza artificiale è preoccupato per i DAU (utenti attivi giornalieri) e per gli importi dei finanziamenti, il fondatore di MiniMax, Yan Junjie, ha mostrato un'indifferenza quasi fredda.

Seduto di fronte a Luo Yonghao, Yan Junjie non sembra un novellino del settore tecnologico che dirige un'azienda unicorno nel campo dell'intelligenza artificiale.

Si rifiutò di parlare di cambiare il mondo, ammettendo invece candidamente le sue paure. Queste paure non derivavano dalla concorrenza tra aziende, ma dalla tecnologia stessa: quando i modelli iniziano a superare le capacità umane, i creatori diventano i primi a sentirsi a disagio.

Se qualcosa può essere quantificato, il modello sarà inevitabilmente superiore agli esseri umani, o almeno raggiungerà il livello dei migliori esseri umani. Tutti i modelli di maggior successo sono stati inizialmente accolti con una certa apprensione.

Secondo un'intervista con LatePost, all'interno di MiniMax, DAU, considerato il gold standard nel settore di Internet, è stato definito direttamente da Yan Junjie come una "metrica di vanità".

Nel 2025, in mezzo alla forte concorrenza dei giganti, alla carenza di potenza di calcolo e al ritiro del denaro caldo, MiniMax sta cambiando idea: non segue più la logica dell'Internet mobile, che consiste nel raggiungere la crescita attraverso una distribuzione su larga scala e fidelizzare gli utenti aggiungendo funzionalità, ma torna all'essenza: tratta il modello come il prodotto più importante .

Nell'era dei grandi modelli, il vero prodotto è in realtà il modello stesso; il prodotto tradizionale è più simile a un canale di distribuzione. Se il modello non è abbastanza intelligente, non importa quanto sia buono il prodotto, è inutile.

In questa conversazione tra Luo Yonghao e Yan Junjie, ho scoperto che MiniMax, un'azienda di intelligenza artificiale, ha scelto un percorso tecnologico destinato ad andare controcorrente fin dal primo giorno della sua fondazione.

Mentre tutti cercano l'OpenAI cinese e Sam Altman, Yan Junjie cerca di dimostrare il valore dei "non geni". La storia di MiniMax non parla di un lampo di genio, ma di un esperimento preciso su come aprire una porta stretta all'intelligenza artificiale nelle lacune delle risorse limitate attraverso calcoli e correzioni estremamente razionali.

Usa 1/50 delle tue fiches per raggiungere AGI

La tabella di marcia tecnica di MiniMax degli ultimi tre anni sembra essere una serie di scommesse isolate, ma in realtà nasconde un filo logico unificato: come ottimizzare in modo più intelligente, anziché accumulare più potenza di calcolo, per avvicinarsi al limite superiore dell'AGI partendo dal presupposto di risorse limitate .

Mentre il settore era ancora focalizzato sul testo, MiniMax prese una decisione estremamente rischiosa: puntare fin dall'inizio sull'informatica multimodale. Yan Junjie spiegò in seguito che avevano ben chiaro fin dall'inizio che una vera intelligenza artificiale globale (AGI) doveva includere input e output multimodali.

Quando hanno avviato la loro attività, più di tre anni fa, non esisteva una roadmap tecnica già pronta. La loro strategia era quella di far funzionare prima ogni modalità e poi integrarle al momento opportuno. Questa perseveranza fu accolta con molto scetticismo all'epoca: la corrente principale del settore riteneva che dovessero prima concentrarsi sul perfezionamento di una singola modalità.

Tuttavia, la logica di Yan Junjie è che l'essenza dell'AGI sia la fusione multimodale. Se non viene promossa in modo sincrono ora, il debito tecnico diventerà un difetto fatale quando la fusione sarà necessaria in seguito. Questa insistenza non consensuale ha permesso a MiniMax di raggiungere il primo posto al mondo nell'audio, il secondo posto nel video e di posizionarsi saldamente al vertice nelle capacità di testo entro il 2025.

Sora 2 di OpenAI ha recentemente ottenuto risultati notevoli grazie alla fusione multimodale, il che conferma in una certa misura la lungimiranza di MiniMax nello scegliere questo percorso tecnologico all'inizio del suo percorso imprenditoriale.

Ma ciò che è ancora più radicale è che Yan Junjie ha infranto il modello tradizionale della ricerca sull'intelligenza artificiale nelle prime fasi della sua attività imprenditoriale.

Questa è stata la prima serie di convinzioni ad essere messa in discussione quando l'azienda è stata fondata: quando si tratta di costruire un modello di grandi dimensioni, non ci si può basare ciecamente sull'esperienza precedente; bisogna scomporlo utilizzando principi di base. Circa quattro o cinque anni fa, l'attenzione nel campo dell'intelligenza artificiale era rivolta alla scrittura di numerose formule matematiche e alla formulazione di teorie molto elaborate e sofisticate.

Ma il fulcro di questa generazione di intelligenza artificiale è in realtà la scalabilità, che consente di ottenere risultati migliori nel modo più semplice, e i risultati possono continuare a migliorare con l'aumento dei dati e della potenza di calcolo.

L'intuizione tecnica di Yan Junjie nasce dal suo tirocinio presso Baidu nel 2014. A quel tempo, anche il CEO di Anthropic, Dario Amodei, era tirocinante presso Baidu e fu lì che scoprì il prototipo di Scaling Law.

Yan Junjie ha affermato che le leggi di scala sono state effettivamente scoperte nel 2014, quando lavoravano sul riconoscimento vocale, ma sono state ampiamente riconosciute solo intorno al 2020. "Esistevano sei anni fa e quell'incidente è accaduto in un'azienda cinese, quindi quello che è successo dopo è stato un peccato".

Questa esperienza fece capire a Yan Junjie che la Cina non era priva di opportunità, ma che anzi aveva perso l'occasione di trasformare le intuizioni tecnologiche in vantaggi industriali .

La realtà è dura. Yan Junjie è ben consapevole del divario tra Cina e Stati Uniti. Ha fatto i conti: la valutazione delle migliori aziende americane è 100 volte superiore a quella delle startup cinesi, e anche il loro fatturato è circa 100 volte superiore a quello delle startup cinesi, ma la loro tecnologia potrebbe essere solo del 5% superiore, mentre spendono dalle 50 alle 100 volte di più.

Allora perché le aziende cinesi riescono a ottenere gli stessi risultati con solo 1/50 del budget, con una differenza di circa il 5%? Il motivo principale è che la Cina dispone di un bacino di talenti di altissima qualità. Ancora più importante, la potenza di calcolo cinese è molto inferiore a quella degli Stati Uniti, il che richiede metodi più innovativi per ottenere gli stessi risultati.

I principi possono essere gli stessi, ma in realtà ci sono molte innovazioni nei metodi e in ogni modulo.

Le limitazioni della potenza di calcolo non sono necessariamente una maledizione; al contrario, possono diventare una frusta che stimola l'innovazione .

Questo spiega perché MiniMax ha avviato l'esplorazione dell'architettura MoE a partire dal 2023, perché ha osato scommettere sul meccanismo di attenzione lineare nel 2025 e perché è tornata al meccanismo di attenzione completo nel modello M2.

Ogni scelta tecnologica implica la ricerca di un equilibrio triangolare tra qualità, velocità e prezzo, con risorse limitate .

Se la logica di DeepSeek è "spremere ogni bit di potenza di calcolo dall'estremo attraverso l'ottimizzazione ingegneristica", allora MiniMax mira a sfruttare maggiori possibilità con risorse limitate attraverso scoperte algoritmiche e innovazioni nei meccanismi.

Uno adotta un approccio costante e metodico, mentre l'altro ne adotta uno non convenzionale e rischioso.

Una delle innovazioni più sorprendenti è il "pensiero interlacciato" di MiniMax nel suo meccanismo di ragionamento modello, che consente al modello di far progredire il compito in un ciclo di "fare le cose – fermarsi a pensare – fare di nuovo le cose".

Questo nuovo meccanismo ha rapidamente facilitato l'adattamento e il supporto dei principali framework di inferenza stranieri, come OpenRouter e Ollam, e ha anche spinto modelli nazionali come Kimi e DeepSeek ad aggiungere gradualmente funzionalità simili.

Ma dietro a questi successi, ciò che merita maggiore attenzione è: come ha fatto un team senza ex dipendenti della Silicon Valley al timone, e considerato dagli outsider come "di base", a creare un modello leader a livello mondiale?

La risposta di Yan Junjie fu inaspettata.

L'intelligenza artificiale non è un concetto mistico, ma un problema ingegneristico che può essere scomposto utilizzando principi fondamentali. Ad esempio, come dovrebbe essere progettato l'algoritmo, come dovrebbe essere costruita la pipeline di dati e come dovrebbe essere ottimizzata l'efficienza dell'addestramento? Ognuno di questi ha un obiettivo molto chiaro.

Fu sulla base di questa convinzione che Yan Junjie abbandonò la ricerca di "geni" e credette invece che la metodologia scientifica potesse permettere alle persone comuni di realizzare un valore straordinario. Ha anche sottolineato che ci sono parecchi rientrati in azienda, ma molti dei compagni di corso che potrebbero davvero svolgere un ruolo chiave sono praticamente al loro primo impiego.

Sulla parete della sala riunioni di MiniMax c'è una scritta: "Intelligenza per tutti ". Questa è l'intenzione originaria di Yan Junjie quando ha avviato la sua attività, ed è anche il motivo per cui molte persone scelgono di unirsi a MiniMax.

Questa linea sta diventando realtà oggi, con utenti in oltre 200 paesi e regioni in tutto il mondo che utilizzano i modelli multimodali di MiniMax. Tra questi, 212 milioni di utenti e oltre 100.000 aziende e sviluppatori stanno creando nuovi prodotti e servizi.

Leader dell'intelligenza artificiale non geniali

Se la mancanza di consenso sugli approcci tecnologici è esplicita, allora il percorso di crescita personale di Yan Junjie è un viaggio di auto-coltivazione riguardante l'"antifragilità".

Yan Junjie è nato in una piccola contea nella provincia di Henan, dove ha sviluppato una forte capacità di apprendimento autonomo nonostante l'estrema scarsità di risorse.

Quando ero alle elementari, leggevo molti libri, e alcuni di questi potrebbero non essere stati pensati per qualcuno di quell'età. Ad esempio, ho letto molti libri delle superiori e persino dell'università prima di iniziare le elementari. Mio padre insegnava alle medie, quindi ho iniziato a leggere libri delle medie, e quando ero alle medie, ho iniziato a leggere libri delle superiori. Al liceo, ho persino iniziato a studiare analisi matematica. In realtà, nessuno mi ha insegnato queste cose; le ho semplicemente lette io stesso.

Il percorso imprenditoriale di Yan Junjie è stato caratterizzato dal suo approccio autodidatta all'apprendimento, dalle elementari alle medie, e dalle superiori all'analisi matematica. Questa capacità di apprendere in anticipo sui tempi, senza i vincoli imposti dall'ambiente, è stata una costante durante tutta la sua carriera imprenditoriale. Mentre altri aspettavano che dei mentori li guidassero, lui aveva già risolto i problemi partendo dai principi fondamentali; mentre altri si lamentavano dell'insufficienza delle risorse, lui aveva già colmato il divario grazie alle sue eccezionali capacità di autoapprendimento.

Tuttavia, la capacità di autoapprendimento non garantisce un percorso senza intoppi. Questo è indubbiamente legato al "brutale addestramento" ricevuto da Yan Junjie presso SenseTime. Fu allora che iniziò a rendersi conto che per creare davvero il prodotto migliore, avrebbe dovuto sviluppare il riconoscimento facciale, e gli ci volle circa un anno e mezzo per passare dall'ultimo al primo posto.

L'ultimo anno e mezzo è stato incredibilmente doloroso. Si è classificato costantemente tra gli ultimi in ogni test tecnico, un calvario che avrebbe distrutto la maggior parte delle persone. Ma Yan Junjie non si è arreso. Anzi, ha tratto da questa esperienza una metodologia fondamentale: bisogna fare delle scelte; bisogna scegliere cose che abbiano un impatto a lungo termine e possano cambiare radicalmente le cose, piuttosto che apportare piccole modifiche .

Dopo aver vissuto questa esperienza, la cosa più importante è avere fiducia nei miei giudizi di base.

Questo periodo di difficoltà ha forgiato due qualità fondamentali in Yan Junjie: in primo luogo, un'eccezionale capacità di fare scelte, la volontà di rinunciare a soluzioni a breve termine e di concentrarsi su innovazioni a lungo termine; e in secondo luogo, un'altissima resilienza psicologica, capace di sopportare lunghi periodi di fallimenti e dubbi.

Sono proprio queste due qualità a consentire a MiniMax di mantenere la sua compostezza quasi "buddista" nell'aderire a un approccio non consensuale alla tecnologia, consentendo a Yan Junjie di restare calmo anche di fronte a difficoltà come la crisi della Silicon Valley Bank e i fallimenti nella formazione dei modelli.

La terza via per l'intelligenza artificiale in Cina

Ora che la storia di MiniMax è conclusa, sorge spontanea una domanda più ampia: dato che lo sviluppo dei talenti richiede tempo e il recupero tecnologico richiede un ciclo, come possono le aziende cinesi di intelligenza artificiale ritagliarsi un proprio spazio di sopravvivenza nel presente?

MiniMax potrebbe non essere la risposta standard, ma Yan Junjie ha tre principi a cui si attiene fin dall'inizio della sua attività:

Innanzitutto, non realizziamo progetti, ma solo utenti; in secondo luogo, svolgiamo contemporaneamente operazioni sia a livello nazionale che all'estero.

Nel 2022, le principali aziende nazionali stavano ancora valutando se valesse la pena investire nell'intelligenza artificiale, mentre le startup sceglievano generalmente la strada ToB (sviluppo di progetti e vendita di soluzioni) per monetizzare rapidamente le proprie attività. Ma Yan Junjie scelse la strada più difficile: ToC, e si concentrò sul mercato globale fin dal primo giorno.

Pertanto, Yan Junjie ha scelto di affinare la sua tecnologia affrontando la più agguerrita concorrenza estera, piuttosto che impegnarsi nella lotta per il traffico con i giganti del mercato interno. Questa si è rivelata la decisione giusta: il numero di utenti giornalieri (DAU) e la tariffa di abbonamento a pagamento di MiniMax si sono mantenuti solidi nei mercati esteri, e questo sta diventando il suo vantaggio competitivo.

Ma il principio più difficile è il terzo: crescita guidata dalla tecnologia vs. crescita degli utenti.

Questa è la prova definitiva per tutte le startup di intelligenza artificiale. Yan Junjie ha ammesso di aver avuto difficoltà anche lui con questa decisione, ma alla fine ha scelto la prima, anche se ciò ha significato sacrificare dati a breve termine, perdere il management intermedio e affrontare lo scetticismo esterno.

Guidare lo sviluppo di prodotti e business attraverso le capacità del modello, o attraverso i metodi di crescita dell'era dell'internet mobile, può essere una scelta corretta, ma non può coesistere. Alla fine, abbiamo scoperto che un approccio basato sulla tecnologia era la soluzione giusta per noi.

Nell'ambito della strategia basata sulla tecnologia, Yan Junjie ha fatto un'altra scelta fondamentale: l'open source.

Poco dopo il rilascio di DeepSeek R1 all'inizio dell'anno, Yan Junjie dichiarò che, se avesse potuto scegliere di nuovo, lo avrebbe reso open source fin dal primo giorno. Ha ribadito questo punto in una conversazione con Luo Yonghao.

In effetti, il concetto di open source è già stato introdotto nel campo dei sistemi operativi mobili. Apple è closed source, Android è open source e altre aziende dopo Apple devono adottare l'open source per affermare la propria posizione unica e creare un nuovo ecosistema.

Per fare progressi, gli altri hanno bisogno di un motivo per sceglierci, e l'apertura del modello è un motivo molto importante, perché consente di avere una fiducia tecnica sufficientemente forte, di conoscere le proprie capacità di ricerca e sviluppo e di essere disposti a collaborare più a fondo.

MiniMax prosegue l'ondata open source avviata da DeepSeek. Dopo il rilascio di MiniMax M2, la piattaforma di analisi di modelli di grandi dimensioni Artificial Analysis lo ha descritto come segue:

China AI Labs continua a mantenere una posizione di leadership nel campo dell'open source.

Il rilascio di MiniMax consolida la posizione di leadership della Cina nel campo dell'intelligenza artificiale open source, una posizione avviata da DeepSeek alla fine del 2024 e mantenuta dalle successive versioni di DeepSeek, Alibaba, Zhipu e Kimi, tra gli altri.


Di recente, OpenRouter, una piattaforma globale di aggregazione di modelli, in collaborazione con a16z, ha pubblicato un rapporto sui 100 trilioni di token dello stato dell'intelligenza artificiale, dimostrando che M2 è stato rapidamente accolto e adottato dagli sviluppatori di tutto il mondo da quando è stato reso open source.

La quota cinese nell'utilizzo globale dell'open source è aumentata dall'1,2% all'inizio del 2024 al 30% attuale, il che indica che il baricentro dell'ecosistema open source globale si è spostato verso la Cina.

Ma questa competizione è tutt'altro che conclusa. Yan Junjie ritiene che i limiti fisici della potenza di calcolo e dei chip impongano limiti al numero di parametri del modello e ai relativi costi. Con un numero limitato di parametri, persone diverse che adottano compromessi diversi otterranno inevitabilmente risultati diversi.

L'intelligenza artificiale non sarà dominata da una sola azienda, né sarà un'attività indiscriminata. Alla fine, convergerà in un modello di coesistenza tra poche aziende, basato su compromessi diversi.

In risposta alla domanda successiva di Luo Yonghao sul fatto che "la Cina si stia perdendo il GPT-3.5", Yan Junjie ha mostrato un ottimismo pragmatico. Ha affermato che le cose più importanti per fare bene la tecnologia si riducono in definitiva a due parole: immaginazione e fiducia .

Molte aziende americane hanno guidato numerose tendenze, il che ha dato loro la sicurezza di essere leader nei loro settori. Questo vale anche per alcuni settori cinesi, come le telecomunicazioni e altri.

Almeno il settore dell'intelligenza artificiale non è ancora al punto di essere leader in questo ambito, ma sta diventando sempre più quello in grado di farlo.

Questa potrebbe essere la terza strada che le aziende cinesi di intelligenza artificiale devono intraprendere:

Utilizzare una progettazione architettonica più intelligente per colmare il divario di potenza di calcolo;

Coltivare talenti nativi dell'intelligenza artificiale attraverso l'evoluzione organizzativa scientifica;

Piuttosto che sottomettersi ai giganti, sviluppa la propria forma nelle crepe.

La storia di MiniMax continua, e l'inchiostro sul capitolo dell'intelligenza artificiale cinese è ancora a malapena asciutto. La vittoria o la sconfitta non sono determinate dalla linea di partenza, ma dal percorso scelto, dal ritmo mantenuto e dalla perseveranza.

Yan Junjie ha dichiarato nell'intervista:

Guardando avanti di tre anni, anche se non saremo noi, altre persone in Cina saranno in grado di farlo.

Tra tre anni, chi sarà? E in che modo?

Nessun sequel è atteso quanto questo, perché saremo tutti personaggi.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo