Claude 4.5 è appena uscito e può durare per oltre 30 ore consecutive. È nata l’intelligenza artificiale più avvincente della storia.
Quando si parla di programmazione, bisogna guardare a Claude.
Proprio ora Anthropic ha rilasciato ufficialmente Claude Sonnet 4.5.
Parliamo innanzitutto delle prestazioni di Claude Sonnet 4.5. Nel test SWE-bench Verified, che esamina le reali competenze di programmazione, Claude Sonnet 4.5 ha superato nettamente il test del settore.
Ancora più scandaloso è il fatto che possa concentrarsi sul lavoro per più di 30 ore consecutive.
Bene, bene, il vantaggio dell'IA che sostituisce gli esseri umani è aumentato di un altro +1.
Ad esempio, se gli si chiede di scrivere un'app di chat come Slack o Teams, può scrivere circa 11.000 righe di codice in una sola volta. In confronto, i precedenti Claude Opus 4 e Codex potevano lavorare in modo indipendente solo per un massimo di sette ore.
Secondo Anthropic, Claude Sonnet 4.5 è ora il modello di programmazione più potente al mondo: crea agenti intelligenti complessi, gestisce computer, ragionamento e matematica, tutti aspetti che sono stati notevolmente migliorati.
Ad esempio, nel benchmark OSWorld, che testa le prestazioni di un computer in situazioni reali, ha ottenuto un punteggio del 61,4%, piazzandosi nettamente al primo posto. Solo quattro mesi fa, il Sonnet 4 era nettamente più avanti con un punteggio del 42,2%, e le sue prestazioni sono migliorate significativamente in poco tempo.
L'estensione Claude Chrome di Anthropic ti permette persino di navigare su siti web, compilare moduli e completare attività direttamente nel browser, proprio come una persona reale. Anche i miei punteggi nei test di Ragionamento e Finanza sono migliorati significativamente, con tutti gli indicatori in crescita.
Con capacità così potenti, questa volta Anthropic non si limiterà a rilasciare un modello.
Nello specifico:
- Claude Code ha aggiunto una funzione "checkpoint", che consente di salvare i progressi in qualsiasi momento e di tornare a uno stato precedente con un clic.
- L'interfaccia del terminale è stata rinnovata ed è stato rilasciato un plugin nativo di VS Code.
- L'API di Claude aggiunge strumenti di modifica contestuale e di memoria
- L'esecuzione del codice e la creazione di file sono ora integrate direttamente nella finestra di dialogo
Anthropic ha addirittura aperto la propria infrastruttura interna sottostante per la creazione di Claude Code, denominata Claude Agent SDK.
Come gestiscono la memoria gli agenti intelligenti durante le attività a lungo termine? Come progettiamo sistemi di autorizzazione per trovare un equilibrio tra autonomia e controllo da parte dell'utente? Come facciamo a far collaborare più sub-agenti per raggiungere gli obiettivi? Sono tutte questioni spinose nella progettazione e nello sviluppo di agenti di intelligenza artificiale.
E con Claude Agent SDK, ora puoi creare i tuoi prodotti.
A partire da oggi, gli sviluppatori possono accedere a claude-sonnet-4-5 anche tramite l'API di Claude. Il prezzo rimane lo stesso di Claude Sonnet 4, ovvero 3/15 dollari per milione di token. Il prezzo rimane invariato, ma le funzionalità sono ancora più avanzate.
L'utente @vasumanmoza ha scritto direttamente dopo averlo sperimentato:
"Claude 4.5 Sonnet ha appena rifattorizzato l'intera base di codice in una singola invocazione, 25 invocazioni di strumenti, oltre 3.000 nuove righe di codice e 12 file nuovi di zecca. Ha modularizzato tutto, scomposto il monolite e ripulito il codice spaghetti. È completamente inutile, ma oh mio dio, è elegante." Questo è un commento di amore-odio.
Cursor ha affermato di aver riscontrato prestazioni di programmazione all'avanguardia in Claude Sonnet 4.5, con miglioramenti significativi soprattutto nella gestione di attività a lungo termine. Questo dimostra ulteriormente perché molti utenti Cursor scelgono Claude per risolvere i loro problemi più complessi.
Il noto blogger di recensioni Dan Shipper ha affermato che la nuova versione di Sonnet 4.5 offre una velocità di risposta più rapida, una maggiore controllabilità e una maggiore stabilità in termini di esperienza utente.
Ottenere ottime prestazioni è una cosa, ma anche la sicurezza deve tenere il passo.
Si dice che il Claude Sonnet 4.5 sia anche il modello più all'avanguardia di Anthropic fino ad oggi.
Sfruttando le capacità avanzate di Claude e la formazione completa in materia di sicurezza, Anthropic ha ottenuto miglioramenti significativi nel comportamento del suo modello, riducendo comportamenti come lusinghe, inganni, ricerca di potere e incoraggiamento di illusioni. Inoltre, Anthropic ha compiuto progressi significativi nella difesa contro gli attacchi di iniezione rapida e nella riduzione dell'errata classificazione dei contenuti.
Ciò che trovo più interessante è che Anthropic ha lanciato anche una funzionalità di anteprima temporanea della ricerca chiamata "Imagine with Claude" contemporaneamente al rilascio di Claude Sonnet 4.5.
In questa funzionalità, Claude genera software in tempo reale. Nessuna funzionalità è preimpostata e nessun codice è pre-scritto. Tutto ciò che vedi viene creato e modificato da Claude al momento, mentre interagisci con esso.
Tuttavia, "Imagine with Claude" sarà disponibile per gli abbonati Max solo per i prossimi cinque giorni.
Il portale allegato è claude.ai/imagine.
Non c'è dubbio che il percorso AI di quest'anno sia ancora un anno di programmazione competitiva.
L'attuale valutazione di Anthropic ha raggiunto i 183 miliardi di dollari e ha raggiunto un fatturato annuo di 5 miliardi di dollari ad agosto, ma una parte significativa di questa crescita è dovuta alla popolarità del software di programmazione. Il problema è che anche i suoi rivali di lunga data, OpenAI e Google Gemini, stanno promuovendo aggressivamente strumenti simili per attrarre programmatori.
Anche se la conferenza annuale degli sviluppatori di OpenAI è prevista tra solo una settimana, Anthropic ha già rilasciato Claude Sonnet 4.5. Il tempismo è molto preciso, ed è ovvio che l'obiettivo sia quello di mettere pressione ai concorrenti.
Jared Kaplan, co-fondatore e direttore scientifico di Anthropic, ha inoltre affermato che il modello Opus più avanzato dovrebbe essere lanciato entro la fine dell'anno: "Anthropic presenta vantaggi nell'uso di modelli sia grandi che piccoli".
Ma per essere onesti, Anthropic ha i suoi problemi da affrontare in questo momento.
Negli ultimi due mesi, la serie di modelli Claude è stata oggetto di una controversia sul suo "degrado". Gli utenti hanno segnalato un drastico calo della qualità del ragionamento, del codice, della formattazione e degli strumenti del modello, che ha interessato anche gli utenti Max paganti.
Sebbene Anthropic abbia poi urgentemente annullato l'aggiornamento Opus 4.1, riconosciuto due bug indipendenti e dichiarato che "non si è trattato di una riduzione deliberata dell'intelligence per risparmiare sui costi", si è verificata un'ondata di cancellazioni su piattaforme come GitHub e X perché non sono stati forniti risarcimenti o rimborsi e molti utenti sono passati direttamente a Codex.
Il rilascio di Claude Sonnet 4.5 è chiaramente il tentativo di Anthropic di riconquistare gli utenti persi con sostanziali miglioramenti delle prestazioni. Il successo dell'iniziativa dipenderà dalle prestazioni nelle prossime settimane.
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.