100 trilioni di token rivelano come gli utenti globali utilizzano l’intelligenza artificiale: metà della potenza di calcolo viene utilizzata in luoghi “indicibili”

È appena stato pubblicato il più grande record mai registrato sul comportamento degli utenti nel campo dell'intelligenza artificiale.

Questo è un rapporto pubblicato da OpenRouter, una piattaforma globale di aggregazione di modelli, in collaborazione con a16z, una delle principali società di venture capital della Silicon Valley. Si basa su 100 trilioni di chiamate API reali in tutto il mondo, che coprono oltre 300 modelli di intelligenza artificiale, oltre 60 fornitori e oltre il 50% di utenti non statunitensi .

Da ciò possiamo vedere come gli esseri umani stanno realmente utilizzando l'intelligenza artificiale, in particolare quelle conversazioni che non appariranno nei casi ufficiali o saranno scritte nei white paper.

L'APPSO ne ha tratto tre conclusioni estremamente controintuitive:

1. I bisogni più genuini e fondamentali dell'umanità non sono la produttività, ma gli "ormoni" e il "giocare a fare la mamma". Oltre il 50% della potenza di calcolo dei modelli open source viene utilizzata per giochi di ruolo, incontri virtuali e contenuti NSFW. Scrivere codice? Questo è secondario.

2. Gli utenti di fascia alta non guardano nemmeno il prezzo, mentre i modelli così economici da essere praticamente gratuiti tendono a fallire ancora più velocemente. I modelli che affrontano i punti deboli degli utenti fin dall'inizio hanno maggiori probabilità di fidelizzarli.

3. I modelli cinesi hanno violato le difese in un solo anno. Dall'1,2% al 30%, i modelli sviluppati internamente, rappresentati da DeepSeek e Qwen, sono diventati i re dell'open source.

È importante notare che questo rapporto contiene inevitabilmente dei "bias".

Gli utenti di OpenRouter sono principalmente singoli sviluppatori, piccole e medie imprese e appassionati di open source, piuttosto che aziende Fortune 500. Le grandi aziende che spendono milioni di dollari al mese in budget per l'intelligenza artificiale di Azure e AWS non sono incluse in questi dati. Pertanto:

  • La quota di modelli cinesi sarà amplificata (gli sviluppatori di piccole e medie dimensioni saranno più propensi a provare soluzioni open source e a basso costo).
  • La quota di modelli open source sarà maggiore (gli utenti aziendali preferiscono la stabilità delle API closed-source).
  • I giochi di ruolo e altri scenari "orientati all'intrattenimento" avranno un tasso di utilizzo significativamente più elevato (le grandi aziende non utilizzeranno API pubbliche per questi).
  • L'utilizzo effettivo delle distribuzioni ibride a livello aziendale non è visibile (tutte utilizzano server privati ​​e il servizio Azure OpenAI).

Ma guardando indietro, è proprio qui che risiede il valore di questo rapporto.

Mentre tutti alle conferenze stampa decantano il modo in cui l'intelligenza artificiale trasformerà la produttività, diventa chiaro chi sta nuotando nudo, chi si sta prendendo tutto il bottino e chi sta dominando silenziosamente quegli ambiti indicibili.

Dall'1% al 30%, i modelli cinesi hanno aperto le crepe nell'impero OpenAI.

Se consideriamo il mercato dell'intelligenza artificiale come una mappa del mondo, prima del 2024 era un impero closed-source di proprietà di OpenAI e Anthropic. Hanno costruito alte barriere attorno alle API, riscosso pedaggi e definito le regole.

Ma il muro crollò.

Osservando questo grafico di distribuzione dell'utilizzo, l'utilizzo dei token nel modello Open Source (OSS) è aumentato a un terzo del totale e questo numero continua a crescere a un ritmo allarmante.

L'estate del 2024 è stata un momento spartiacque.

Prima di allora, il mercato era stagnante. La serie GPT di OpenAI e Claude di Anthropic dominavano il mercato, con i modelli open source che svolgevano solo un ruolo di supporto.

In seguito, con il rapido rilascio di Llama 3.3 70B, DeepSeek V3 e Qwen 3 Coder, lo scenario è cambiato radicalmente. Il volume di chiamate API, un tempo dominante, ha iniziato a subire un calo drastico.

In questa sede è necessario discutere dell'ascesa del modello cinese, che è stata la narrazione più aggressiva dell'anno scorso.

I dati mostrano:

  • Inizio 2024: la quota cinese nell'utilizzo globale del modello open source era pari solo all'1,2%, una percentuale pressoché trascurabile.
  • Entro la fine del 2025: questa cifra salirà al 30%, raggiungendo addirittura il picco in alcune settimane.

Dall'1,2% al 30%, si tratta di una battaglia di accerchiamento dal basso.

DeepSeek detiene saldamente il primo posto nella classifica open source con un totale di 14,37 trilioni di token utilizzati. Sebbene la sua posizione dominante si stia diluendo, la sua portata rimane sorprendente. Qwen segue a ruota, classificandosi al secondo posto con 5,59 trilioni di token, e le sue prestazioni nel campo della programmazione sono estremamente elevate, rivaleggiando direttamente con Claude.

Ma, cosa ancora più importante, c'è il ritmo. I modelli cinesi vengono rilasciati con estrema frequenza. DeepSeek rilascia aggiornamenti importanti quasi ogni trimestre e Qwen li aggiorna ancora più velocemente. Questo "approccio ad alta frequenza" fa sì che i giganti della Silicon Valley facciano fatica a tenere il passo: hanno appena rilasciato un nuovo modello quando i loro concorrenti ne hanno già rilasciate tre varianti.

Scoppiare la bolla dell'intelligenza artificiale: tre verità trascurate

Ora, sfatiamo queste ipotesi fantasiose e vediamo a cosa serve realmente l'intelligenza artificiale nel mondo reale.

Verità n. 1: "I modelli piccoli sono morti, quelli medi stanno crescendo."

Il mercato sta votando con i piedi, abbandonando quei micro-modelli "veloci e stupidi".

I dati mostrano che la quota di mercato dei modelli con meno di 15 byte di parametri sta crollando. Gli utenti stanno scoprendo che la velocità è inutile se l'IA è stupida come un disco rotto; è meglio non usarla affatto.

I modelli di medie dimensioni (parametri 15B-70B) sono diventati i nuovi preferiti. Questo mercato è stato addirittura creato dal Qwen2.5 Coder 32B nel novembre 2024. Prima di allora, questo intervallo di parametri era praticamente nullo; da allora, modelli come il Mistral Small 3 e il GPT-OSS 20B hanno rapidamente seguito, formando un nuovo campo di battaglia.

I modelli che non sono né economici né sufficientemente potenti stanno perdendo quote di mercato. O si cerca la massima potenza o la massima convenienza.

Verità n. 2: non è programmazione, è più una questione di gioco.

Sebbene spesso leggiamo notizie su come l'intelligenza artificiale migliori la produttività, nell'uso di modelli open source, oltre il 50% del traffico è destinato al "gioco di ruolo" .

Per dirla senza mezzi termini:

Oltre la metà della potenza di calcolo dell'intelligenza artificiale open source viene utilizzata per questi scopi:

  • Conversazione virtuale tra amanti ("Chatta con me, ricorda le mie preferenze")
  • Gioco di ruolo ("Ora sei una principessa elfa…")
  • Generazione di romanzi interattivi ("Continua la storia e aggiungi altri dettagli")
  • Creazione di contenuti per adulti (contrassegnati come "per adulti" nel rapporto, pari al 15,4%)

Questo è il risultato dell'analisi di centinaia di milioni di richieste reali utilizzando l'API di classificazione del linguaggio naturale di Google Cloud. Una richiesta viene contrassegnata quando l'IA rileva che appartiene a /Adulti o /Arte e intrattenimento/Giochi di ruolo.

Ciò significa che per un numero enorme di utenti finali l'intelligenza artificiale è prima di tutto un "oggetto di proiezione emotiva" e solo in secondo luogo uno strumento .

Nel frattempo, i servizi di streaming e i giganti della Silicon Valley, per motivi di sicurezza del marchio, hanno deliberatamente evitato o addirittura soppresso questa domanda. Ma questo ha creato un enorme "vuoto di domanda e offerta". Il desiderio degli utenti di interazione emotiva, storie coinvolgenti e persino contenuti NSFW (non adatti ai bambini o a chi non è adatto al lavoro) è stato represso dal pubblico mainstream e alla fine ha fatto irruzione nella comunità open source.

La programmazione è il secondo caso d'uso più importante, con una percentuale del 15-20%. Esatto, la scrittura di codice, decantata dai media, è al secondo posto nel mondo reale.

Allora qual è la verità?

Basta fingere. I due bisogni più genuini e fondamentali dell'umanità sono gli ormoni e il codice. I primi offrono compagnia ed entusiasmo, mentre i secondi ci permettono di guadagnare denaro. Tutte le altre forme di "condivisione della conoscenza", "riepilogo di documenti" e "tutoraggio educativo" messe insieme equivalgono a meno di una frazione di questi due.

Questo spiega anche perché i modelli open source si sono diffusi così rapidamente: in genere sono soggetti a meno censura, consentendo agli utenti una maggiore libertà di personalizzare personaggi e trame, il che li rende ideali per interazioni emotivamente sfumate.

Verità n. 3: gli utenti di DeepSeek ossessionati dall'intrattenimento

Se estraiamo separatamente i dati DeepSeek, troveremo una distribuzione ancora più estrema:

– Gioco di ruolo + Chat informale: circa il 67%
– Programmazione: solo una piccola parte

In questo rapporto, DeepSeek viene descritto quasi più come uno strumento di intrattenimento rivolto al consumatore che come uno strumento di produttività. I ​​suoi utenti non scrivono codice; stanno "frequentando" l'intelligenza artificiale.

Ciò contrasta nettamente con Claude.

C'è una sola possibilità: il vincitore prende tutto.

Perché alcuni modelli hanno solo un breve periodo di popolarità, mentre altri restano impressi nella mente degli utenti come la colla?

Il rapporto introduce un concetto: l'effetto "scarpetta di cristallo" di Cenerentola .

Definizione: quando viene rilasciato un nuovo modello, se risolve perfettamente un problema di vecchia data per gli utenti (come la scarpetta di cristallo che calza perfettamente ai piedi di Cenerentola), questi utenti diventeranno "fan sfegatati" del modello (utenti fidelizzati di base) e avranno difficoltà a migrare, indipendentemente dal numero di nuovi modelli rilasciati in futuro.

È importante sottolineare che si tratta di un'opportunità irripetibile. Se non si raggiunge un'innovazione tecnologica durante il lancio iniziale (finestra di frontiera) per fidelizzare questi utenti chiave, per quanto ci si impegni in seguito, il tasso di fidelizzazione sarà estremamente basso.

Perché?

Poiché gli utenti hanno già creato un flusso di lavoro completo attorno a questo modello:

– Gli sviluppatori hanno integrato Claude nel processo CI/CD.
I creatori di contenuti hanno salvato decine di versioni del personaggio di DeepSeek.
I costi di commutazione non sono solo tecnici, ma anche cognitivi e abituali.

Profilo del vincitore: "Effetto Boomerang" di DeepSeek

La curva di fidelizzazione di DeepSeek è molto strana:

Prova utente → Abbandono (per provare altri modelli) → Dopo un po', tornano a lamentarsi.

Questo è noto come "effetto boomerang". I dati mostrano che la base utenti di DeepSeek R1 nell'aprile 2025 ha registrato un aumento significativo del tasso di fidelizzazione nel terzo mese.

Perché sono tornati?

Perché è "davvero buono". Dopo aver provato tutti i modelli sul mercato, ho scoperto che DeepSeek offre ancora il miglior rapporto qualità-prezzo.

  • Gratis o a prezzi molto bassi
  • Capacità di gioco di ruolo abbastanza buona
  • Nessuna censura fastidiosa dei contenuti

Ritratto dei perdenti: la tragedia di Llama 4 Mavericks

Al contrario, modelli come il Llama 4 Maverick e il Gemini 2.0 Flash hanno tassi di fidelizzazione incredibilmente bassi.

È iniziata una spirale discendente fin dalla prima settimana, senza possibilità di ritorno.

Perché? Perché arrivarono troppo tardi e non avevano caratteristiche particolari. Quando furono lanciati, gli utenti avevano già trovato le loro "scarpette di cristallo" e i nuovi modelli potevano solo diventare "opzioni di riserva".

Nel mercato dei modelli di intelligenza artificiale, arrivare in ritardo significa essere emarginati in modo permanente.

I design dei personaggi di ogni IA

In questa guerra, nessuno può vincere tutto; ognuno soffre o si diverte con la propria musica di sottofondo. Assegniamo a ogni giocatore l'etichetta più appropriata:

Claude (Anthropic): Il "Dio" degli ingegneri eterosessuali

Personaggio: un ragazzo esperto di scienza e ingegneria che eccelle solo nella programmazione e non ha alcun senso del romanticismo.

I dati non mentono: Claude detiene da tempo oltre il 60% della quota di mercato della programmazione. Sebbene di recente sia leggermente diminuita, rimane una barriera insormontabile quando si tratta di scrivere codice.

Profilo utente:
Oltre l'80% del traffico di Claude è correlato alla tecnologia e al codice.
– Quasi nessuno lo usa per conversazioni informali o giochi di ruolo.

Claude è come lo studente migliore della tua classe: lo cerchi solo durante gli esami; altrimenti non lo frequenti mai.

OpenAI: da "L'unico Dio" a "Il vecchio re mediocre"

Profilo del personaggio: ex Signore Supremo, ora una cassetta degli attrezzi

I cambiamenti nella quota di mercato di OpenAI sono stati estremamente drastici:
– Inizio 2024: le query relative alla scienza rappresentavano oltre il 50%
– Entro la fine del 2025: la percentuale di laureati in materie scientifiche scenderà a meno del 15%.

Si sta trasformando da "un dio unico" in una "cassetta degli attrezzi che può fare tutto ma non è brava a fare nulla". Sebbene il GPT-4o Mini vanti ancora un alto tasso di fidelizzazione, non è più l'unica opzione nei mercati verticali.

Il problema principale è che è rimasta intrappolata nel suo stesso successo. ChatGPT si è affermata come marchio di massa, ma questo ha anche fatto perdere il suo vantaggio in ambito professionale.

Google (Gemini): l'ansia dei generalisti

Caratteristiche caratteriali: vuole tutto, ma non eccelle in nulla.

Google è come un generalista disorientato. È presente in questioni di diritto, scienza, traduzione e domande e risposte di cultura generale, ma:
– Solo il 15% di quota di mercato nel campo della programmazione.
– Quasi inesistente nel campo del gioco di ruolo

Ma in un mercato sempre più verticale, il generalismo significa mediocrità.

DeepSeek: La vittoria dei barbari

Personaggio: Un innovatore che non rispetta le regole, il re dell'intrattenimento di fascia C.

DeepSeek si è ritagliato una nicchia grazie al suo eccezionale rapporto qualità-prezzo, dimostrando che anche senza il ragionamento logico più forte è possibile conquistare il mercato essendo "divertente" e "gratuito".

Dati chiave:
– Utilizzo totale: 14,37 trilioni di token (primo in open source)
– Il 67% del traffico è costituito da intrattenimento e giochi di ruolo.
– L’effetto boomerang è evidente: gli utenti torneranno anche dopo aver provato altre cose.

Il suo successo dimostra una cosa: nel mercato dei beni di consumo, "abbastanza buono" + "abbastanza economico" + "senza restrizioni" possono vincere su tutto.

xAI (Grok): l'approccio "Random Fist" di Musk

Personaggio: Un attacco a sorpresa da parte della folla, che conquista quote di mercato offrendo servizi gratuiti.

I dati di Grok sono molto interessanti:
– All'inizio, l'80% degli utenti erano programmatori (Grok Code Fast è ottimizzato per la programmazione).
– Dopo la promozione gratuita, un gran numero di utenti comuni si è riversato all'improvviso, rendendo immediatamente il profilo utente più complesso.

Offrire servizi gratuiti può attrarre traffico, ma traffico ≠ fedeltà. Una volta che inizi a far pagare, questi utenti abbandoneranno immediatamente.

Infine, cerchiamo di comprendere questo mondo con una sola immagine.

L'attuale mercato dei modelli di grandi dimensioni ha chiaramente formato una struttura a quattro punte:

In primo luogo, c'è il campo dei "giganti dell'efficienza", rappresentato da DeepSeek e Gemini Flash. Il loro vantaggio principale risiede nell'elevato rapporto costo-prestazioni, ovvero "economico e abbondante", progettato specificamente per scenari ad alto volume. Sono particolarmente adatti per lavori ripetitivi "sporchi e faticosi" che non richiedono ragionamenti logici complessi, il che li rende la prima scelta per chi cerca un equilibrio tra efficienza e costi.

In secondo luogo, c'è la categoria "esperti di fascia alta", con Claude 3.7 e GPT-4 come punti di riferimento in questo campo. Nonostante il prezzo elevato, hanno conquistato il favore degli utenti aziendali grazie alla loro elevata precisione e alla capacità di gestire attività complesse.

Allo stesso tempo, lo spazio vitale del campo "long tail" si sta riducendo e un gran numero di piccoli modelli viene gradualmente eliminato dal mercato a causa della mancanza di vantaggi differenziati e delle barriere tecnologiche.

Inoltre, il settore dei "disruptors", incentrato sui modelli cinesi, è in rapida ascesa. Grazie ai suoi aggiornamenti tecnologici ad alta frequenza, alle strategie di prezzo convenienti e alle profonde capacità di localizzazione, la sua quota di mercato continua ad espandersi, rendendolo una forza chiave nel rimodellare il panorama del settore.

La tendenza nascosta dietro 100 trilioni di token

In qualità di osservatori, APPSO ha individuato in questo rapporto alcune tendenze che potrebbero definire il futuro panorama competitivo dell'IA:

1. Un ecosistema multi-modello è la norma; l'adorazione del modello singolo è patologica . Gli sviluppatori costruiranno come blocchi, usando Claude per scrivere il codice, DeepSeek per rifinire la documentazione e Llama per la distribuzione locale. Lealtà? Non esiste.

2. Gli agenti hanno già conquistato metà del mercato. I modelli di ragionamento rappresentano ormai oltre il 50%. Non vogliamo più che l'IA fornisca solo una risposta; vogliamo che l'IA fornisca un "processo di pensiero". Il ragionamento multi-step, le chiamate degli strumenti e i contesti lunghi sono i nuovi campi di battaglia.

3. Fidelizzazione > Crescita <br /> Oltre al tasso di fidelizzazione iniziale degli utenti, altre metriche di crescita sono metriche di vanità.

4. La specializzazione in un campo verticale è più preziosa della versatilità.
Claude eccelle nella programmazione, mentre DeepSeek regna sovrano nell'intrattenimento. Un modello che cerca di fare tutto finisce per non fare nulla di buono.

5. Il prezzo non è l'unica variabile, ma la "facilità d'uso" è sempre una valuta forte . I dati mostrano una correlazione molto debole tra prezzo e utilizzo. Gli utenti di fascia alta sono insensibili al prezzo, mentre quelli di fascia bassa riconoscono solo pochi dispositivi con un "buon rapporto qualità-prezzo". I modelli mediocri, intrappolati nel mezzo, muoiono più velocemente.

6. L'offensiva del modello cinese è appena iniziata . Ci è voluto solo un anno per passare dall'1,2% al 30%. Dopo aver consolidato la propria posizione, cosa succederà? Definirà le regole o ne sarà domato? Questa sarà la storia più degna di nota del 2026.

Il mondo dell'intelligenza artificiale non è definito dalla visione presentata durante un evento di lancio di un prodotto, ma dai trilioni di token che gli utenti inviano effettivamente ogni giorno.

Tra questi token, alcune persone scrivono codice per cambiare il mondo, mentre altre danno la buonanotte alle fidanzate virtuali; codice razionale e conversazioni emotive coesistono armoniosamente.

Forse dobbiamo ammettere che lo sviluppo dell'intelligenza artificiale è anche un'estensione dei desideri umani.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo