La versione europea di DeepSeek lancia un nuovo modello, che prende di mira l’intelligenza artificiale cinese.

Dopo essere stata schiacciata per più di sei mesi da OpenAI, Google e dai modelli open source cinesi DeepSeek e Qwen, Mistral AI, nota come la "versione europea di DeepSeek" , alla fine non è riuscita a stare ferma e ha rilasciato ufficialmente la nuova generazione di modelli della serie Mistral 3.
Mistral AI è una grande azienda di modellazione con sede in Francia. A settembre di quest'anno, Nvidia avrebbe investito nella startup per la terza volta. Questo ha portato la valutazione di Mistral a circa 13,5 miliardi di dollari, rendendola uno degli unicorni più importanti nel settore dell'intelligenza artificiale in Europa.

Questa volta Mistral si è concentrata solo sull'attacco al modello cinese.
Questa volta, Mistral 3 porta con sé il modello di punta Mistral Large 3, oltre a tre modelli più piccoli, convenienti e ad alte prestazioni: Ministral (3B, 8B, 14B).
Tra questi, il Mistral Large 3 è il protagonista assoluto, con un totale di 675 parametri, di cui 41 attivi. Si tratta del primo modello Mistral per esperti misti con pesi aperti dopo il Mixtral 8x7B e 8x22B, lanciato tra fine 2023 e inizio 2024.
Ma ciò che trovo più "inquietante" è la strategia ufficiale di confronto.
Nelle classifiche di benchmark ufficiali, Mistral ha completamente ignorato GPT-5.1 o Gemini 3, e invece ha preso di mira direttamente DeepSeek-V3.1 e Kimi-K2 della Cina.
La logica di Mistral è semplice: ho solo circa la metà dei parametri di Kimi, ma le mie prestazioni sono pari alle tue, o addirittura migliori.
I risultati ufficiali sono i seguenti:
- Possibilità di vittoria: su MMMLU e AMC, Mistral Large 3 ha ottenuto rispettivamente 85,5 e 52,0, leggermente in vantaggio su DeepSeek-V3.1.
- Sconfitta: in LiveCodeBench e SimpleQA, che destano maggiore preoccupazione tra i programmatori, Mistral Large 3 ha comunque perso contro Kimi-K2.


È più stupido di DeepSeek e tre volte più costoso?
Sebbene Mistral stia cercando di affermarsi come il "re dell'efficienza", i blogger tecnologici su X gli hanno gettato acqua sul fuoco, arrivando persino a usare la dura espressione "Mistral sta morendo lentamente".
La sua valutazione è stata concisa e schietta, elencando tre difetti principali del nuovo modello di Mistral:
1. Più stupido: non è intelligente quanto DeepSeek.
2. Più costoso: costa tre volte di più di DeepSeek.
3. Più lento: la sua velocità di inferenza è ancora più lenta di GPT-5.

Questo coglie sicuramente nel segno. Nell'ultima classifica completa dell'indice di intelligenza artificiale di Artificial Analysis, Mistral Large 3 ha ottenuto solo 38 punti.
Vediamo chi è in testa: Gemini 3 Pro (73 punti), Claude Opus 4.5 (70 punti) e GPT-5.1 (70 punti). Il divario di Mistral con i titoli di punta non è solo un "recupero", è una vera e propria discontinuità.

Nella classifica LMARaena, si colloca al secondo posto tra i modelli non inferenziali open source e al sesto posto in assoluto. I risultati sono rispettabili, ma non si può certo definire un "leadership sweeper".

I tester hanno scoperto che il Mistral Large 3 ha avuto prestazioni scadenti sotto tutti gli aspetti:
- Questo modello ha difficoltà a eseguire correttamente le chiamate degli strumenti, spesso restituendo istruzioni di chiamata degli strumenti formattate in modo errato o non valide.
- Nei benchmark basati sulle immagini, le prestazioni sono solo moderatamente buone.

Ciò in cui vale davvero la pena investire è il modello su piccola scala.
Ministral 3 è il prodotto più conveniente tra tutti i modelli open source. Offre versioni base, didattiche e di inferenza per ogni scala di parametri, tutte con funzionalità di comprensione delle immagini, ed è interamente open source con licenza Apache 2.0.
Cosa significa? Puoi usarlo gratuitamente e modificarlo come preferisci.
- Versatile: supporta la comprensione delle immagini in tutte le dimensioni, non più "cieca".
- Prestazioni: la versione inferenziale di 14B ha raggiunto un'accuratezza dell'85% nel test AIME'25.

Mistral 3 ha effettivamente fatto progressi. Come hanno affermato i netizen, esiste ancora un produttore leader di modelli in Europa che riesce sostanzialmente a tenere il passo con i modelli open source in Cina. Sebbene Mistral non abbia ancora rilasciato un motore di inferenza, le sue prestazioni effettive sono ancora al di sotto dei tempi.

Ma con DeepSeek che abbassa il prezzo dei modelli di grandi dimensioni, offrire semplicemente "prestazioni decenti" non è più sufficiente. Gli utenti desiderano la massima intelligenza o la massima convenienza.
Al momento, Mistral sembra bloccata in una scomoda posizione intermedia. Se riuscirà a diventare un "faro di speranza per l'Europa" potrebbe dipendere dalle successive iterazioni.
#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

