È stato rilasciato il modello “più profumato” di Claude, con velocità doppia e prezzo ridotto, con capacità di programmazione prossime a GPT-5

Proprio ora Anthropic ha rilasciato Claude Haiku 4.5.

Permettetemi di fare una breve introduzione. La famiglia Claude comprende tre modelli con diverse grandezze dei parametri: Claude Opus (tazza grande), Sonnet (tazza media) e Haiku (tazza piccola).

La novità più importante di questo aggiornamento è che Claude Haiku 4.5 è più veloce e più economico, pur mantenendo elevate le prestazioni del modello .

Cinque mesi fa, il Claude Sonnet 4 era uno dei modelli più avanzati. Ora il nuovo Haiku 4.5 offre prestazioni di codifica quasi equivalenti, ma a un terzo del prezzo e a più del doppio della velocità.

▲Grafico che confronta i modelli di frontiera su SWE-bench Verificato che misura le prestazioni nelle attività di codifica del mondo reale

Nello specifico, su SWE-bench Verified, un set di test utilizzato per misurare le capacità di programmazione dell'intelligenza artificiale, Haiku 4.5 ha ottenuto un punteggio del 73%. Un risultato notevole! Questo lo pone alla pari con Claude Sonnet 4 e l'ultimo GPT-5 di OpenAI.

In alcuni compiti, come il controllo del computer, Haiku 4.5 supera addirittura il suo fratello maggiore Sonnet 4.

Per gli scenari in cui l'intelligenza artificiale è necessaria per attività in tempo reale e a bassa latenza, come assistenti di chat, agenti del servizio clienti o assistenti di programmazione in coppia, Haiku 4.5 combina un'elevata intelligenza con un'eccellente velocità per offrire un'esperienza migliore.

Gli sviluppatori che utilizzano Claude Code scopriranno inoltre che Haiku 4.5 rende l'intero processo di programmazione, dalla collaborazione multi-agente alla prototipazione rapida, più reattivo ed efficiente.

Naturalmente, Sonnet 4.5, rilasciato due settimane fa, rimane il modello di punta di Anthropic, un modello di programmazione di alto livello a livello mondiale. Ma Haiku 4.5 offre un'altra opzione: prestazioni quasi al top a un prezzo molto più accessibile.

Inoltre, il modello è più flessibile. Sonnet 4.5 può scomporre problemi complessi in N piccoli compiti, per poi comandare a un gruppo di Haiku 4.5 di lavorare in parallelo. La cooperazione è piuttosto tacita.

Anthropic ha eseguito test dettagliati di sicurezza e allineamento su Haiku 4.5.

I risultati mostrano che il modello presenta una minore incidenza di comportamenti scorretti e un allineamento significativamente migliorato rispetto al suo predecessore, Haiku 3.5. Nelle valutazioni automatiche dell'allineamento, Haiku 4.5 ha mostrato un numero complessivo inferiore di comportamenti scorretti rispetto a Sonnet 4.5 e Opus 4.1.

Detto questo, al momento è il modello più sicuro della famiglia Anthropic.

▲Tabella comparativa dei modelli di frontiera tra i benchmark più diffusi

Per quanto riguarda il prezzo… Haiku 4.5 ha un prezzo di 1 dollaro per milione di token in input e 5 dollari per milione di token in output.

Per fare un paragone, GPT-5 mini costa circa 0,25 dollari per milione di input e 2,5 dollari per milione di output, mentre Gemini 2.5 Flash di Google costa più o meno la stessa cifra. In altre parole, Haiku 4.5 costa circa quattro volte di più di GPT-5 mini o Flash.

Tuttavia, rispetto a Sonnet 4.5, è circa tre volte più economico e offre quasi le stesse prestazioni, il che significa riduzione dei costi e miglioramento dell'efficienza per gli sviluppatori.

Ma a dire il vero, la matematica non è il suo forte.

Il noto blogger Dan Shipper ci ha provato e ha scoperto che l'aritmetica di Haiku era un po'… confusa.

Ad esempio, nel test della fattura di Uber, Haiku ha trovato perfettamente tutte le email rilevanti, ma ha sbagliato completamente nel calcolo del totale. Ancora più imbarazzante, dopo essere stato segnalato, ha ammesso l'errore, per poi tornare sui suoi passi e ripetere lo stesso errore.

La valutazione di Dan Shipper è la seguente:

Se sei uno sviluppatore o un imprenditore che sta sviluppando un'applicazione complessa basata su agenti intelligenti utilizzando Sonnet 4.5, valuta la possibilità di passare ad Haiku ora. Risparmierai notevolmente sui costi con una perdita di prestazioni trascurabile.

Se attualmente utilizzi Gemini 2.5 Flash o GPT-5 mini, ti consiglio di provare Haiku. Sebbene sia più costoso, offre prestazioni migliori in scenari in cui è necessario richiamare strumenti e mantenere l'autonomia.

▲Indirizzo del blog allegato:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

Attualmente, Claude Haiku 4.5 è disponibile su Claude Code e varie applicazioni.

Gli sviluppatori possono utilizzare Haiku 4.5 tramite l'API Claude, Amazon Bedrock e Vertex AI di Google Cloud, sostituendo direttamente Haiku 3.5 e Sonnet 4, e il prezzo rientra nella migliore fascia di prezzo di Anthropic.

Abbiamo seguito il suggerimento di @zb1992 e abbiamo eseguito una demo di clock su Claude 4.5 Haiku. Nel complesso, abbiamo riscontrato che la velocità di generazione del codice era effettivamente maggiore e il prodotto finale era soddisfacente.

Nel seguente classico problema di ragionamento e calcolo, il vantaggio in termini di velocità di risposta di Claude 4.5 Haiku è ancora più evidente. Naturalmente, questa è anche la competitività fondamentale dei modelli leggeri nelle applicazioni pratiche.

Inoltre, secondo The Information, Anthropic, valutata 170 miliardi di dollari, nelle ultime settimane ha dichiarato ai consulenti delle banche d'investimento che intende introdurre più talenti tecnici tramite acquisizioni e ampliare le sue capacità oltre gli assistenti alla programmazione: dopotutto, la programmazione rappresenta ancora la maggior parte delle sue entrate.

Persone a conoscenza della questione hanno affermato che, dato il successo di Anthropic nel fornire prodotti di programmazione AI agli sviluppatori, l'azienda potrebbe in seguito espandersi ad altri strumenti software comunemente utilizzati dagli sviluppatori, come strumenti che testano automaticamente le vulnerabilità del codice o strumenti che assistono nella progettazione del software.

Si dice anche che Anthropic potrebbe sviluppare prodotti per settori specifici tramite acquisizioni, come servizi finanziari, assistenza sanitaria o sicurezza informatica, ma preferisce piccole acquisizioni con importi di transazione inferiori a 500 milioni di dollari.

Sembra che, mentre Anthropic sta potenziando le capacità dei suoi modelli, stia anche sviluppando attivamente il suo ecosistema. Il settore dell'intelligenza artificiale è in corsa contro il tempo, ma i beneficiari finali sono sviluppatori e utenti: modelli potenti, prezzi più bassi e più scelta.

Autore: Mo Chongyu

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo