L’architettura a memoria condivisa di Qualcomm mira ad aiutare i laptop Windows a raggiungere le prestazioni del MacBook Pro.

Un laptop da 14 o 16 pollici può integrare decine o addirittura centinaia di gigabyte di memoria direttamente in un SoC, raggiungendo una larghezza di banda di memoria ad alte prestazioni superiore a 200 GB/s, pur mantenendo un design sottile e leggero e prestazioni potenti ma silenziose…

Potreste pensare che si tratti di un MacBook Pro, ma cosa succederebbe se vi dicessi che è un laptop Windows sottile e leggero con architettura ARM?

Il 27 aprile, ASUS ha rilasciato la versione Snapdragon dello ZenBook 16 Air, equipaggiata con la piattaforma Qualcomm Snapdragon X2 Elite Extreme, nota anche come processore Windows on ARM di seconda generazione di Qualcomm, lanciato lo scorso anno.

Questa è la prima piattaforma PC di punta Snapdragon a integrare la memoria LPDDR5X in un package SoC, una soluzione parallela coerente e simile nell'implementazione al concetto di "architettura di memoria unificata" di Apple. Sebbene non abbia raggiunto il 100% delle prestazioni del chip M, rimane il tentativo più importante di Qualcomm in questa nuova direzione.

Questo ASUS ZenBook 16 Air Snapdragon Edition pesa 1,2 kg, ha uno spessore di 13,9 mm, dispone di 48 GB di RAM (9523 MT/s) e offre un'autonomia della batteria di 20-30 ore. È stato lanciato per la prima volta su JD.com il 28 aprile, al prezzo di 13.999 yuan. ASUS offre anche una versione da 14 pollici.

È stato inoltre presentato il laptop 2-in-1 ProArt X 2026 per i creatori, dal peso di soli 0,82 kg, con un'autonomia di 22 ore e uno schermo OLED 2.8K a 144Hz. Questi modelli, nel loro insieme, costituiscono la nuova gamma di prodotti ASUS 2026 per il settore ARM Windows.

Tornando all'architettura a memoria condivisa del modello di punta X2 Elite Extreme: posizionare la memoria all'interno del package del chip, accanto a CPU, GPU e NPU, non è semplicemente un cambiamento nel layout del circuito stampato. Di fatto, l'intero metodo di pianificazione delle risorse di calcolo ha subito una trasformazione significativa.

A partire dal chip M1 nel 2020, Apple non solo ha integrato la memoria in un chip di classe PC, ma ha anche reso la pianificazione più flessibile, riducendo il numero di operazioni di lettura e scrittura ripetute. Ciò ha comportato un notevole aumento della larghezza di banda della memoria, una caratteristica nota come Unified Memory Architecture. I modelli M5 Pro e M5 Max, rilasciati a marzo, hanno ulteriormente incrementato la larghezza di banda della memoria, raggiungendo rispettivamente 307 GB/s e 614 GB/s.

Lo Snapdragon X2 Elite Extreme è il primo laptop Windows su ARM a utilizzare il concetto di incapsulamento in memoria, consentendo a un laptop leggero, del peso di circa 1,2 kg, di godere di vantaggi simili a quelli di un'architettura a memoria unificata.

Dietro a tutto ciò si cela il tentativo di Qualcomm, ASUS e altri importanti produttori di rendere i laptop Windows competitivi quanto i MacBook Pro.

Rendi il trasferimento di memoria ancora più veloce

Va notato che "architettura di memoria unificata" è il termine utilizzato da Apple, mentre Qualcomm chiama ufficialmente la sua soluzione SiP (System-in-Package).

I due termini non si riferiscono esattamente alla stessa cosa: UMA descrive l'architettura di accesso alla memoria, mentre SiP si riferisce a specifiche tecnologie di incapsulamento. Tuttavia, i loro effetti e obiettivi di implementazione sono molto simili: pool di memoria fisica condivisi e caching a blocchi coerente tra IP diversi.

La quantità massima di memoria video disponibile per attività computazionalmente intensive (come l'inferenza AI) è direttamente pari alla quantità massima di RAM dell'intero sistema. Anche un laptop sottile e leggero con 48 GB di memoria dedicata può teoricamente eseguire localmente modelli complessi con centinaia di miliardi di parametri, un'operazione che le architetture tradizionali richiedono schede grafiche dedicate di livello workstation, rendendola difficile da realizzare per i laptop sottili e leggeri con grafica integrata. (La configurazione più performante dell'X2 Elite Extreme dispone di 128 GB di memoria condivisa.)

La cache a livello di sistema (SLC) può essere allocata dinamicamente tra CPU, GPU Adreno X2 e NPU Hexagon, offrendo una larghezza di banda superiore del 70% rispetto alla generazione precedente; il bus di memoria a 192 bit, abbinato a LPDDR5X-9523, consente una larghezza di banda di memoria condivisa fino a 228 GB/s tra C/G/NPU.

I tradizionali carichi di lavoro di elaborazione ibrida (che si basano simultaneamente su C/G/NPU), ostacolati da problemi di trasferimento della memoria, sono stati notevolmente alleviati. Inoltre, il consumo energetico complessivo può essere mantenuto a un livello accettabile per laptop sottili e leggeri.

In particolare, questa generazione di NPU Hexagon ha aggiornato l'unità DMA all'indirizzamento virtuale a 64 bit, consentendo finalmente all'NPU di accedere a più di 4 GB di memoria, il che in una certa misura supera il collo di bottiglia delle attività di inferenza di modelli di grandi dimensioni sul desktop dell'NPU.

Non è certo la prima volta che il team Windows tenta una soluzione simile per un'architettura di memoria unificata. Anche Intel e AMD hanno già fatto tentativi analoghi in passato (maggiori dettagli in seguito).

Tuttavia, oggi, il modello di punta ASUS ZenBook 16 Air Snapdragon Edition è il primo nel mondo Windows a raggiungere una soluzione che si avvicina il più possibile all'effetto di un'architettura di memoria unificata, ottenendo inoltre lo stesso risultato di un laptop ARM sottile e leggero, con un peso di circa 1,2 kg.

Consentire a un maggior numero di laptop Windows di utilizzare la nuova architettura

Sulla strada verso un'architettura di memoria condivisa/unificata, ogni gigante dei chip ha un'opinione diversa. In primo luogo, è una questione ingegneristica e, a un livello più profondo, è una questione commerciale.

Un esperto che lavora per un colosso dei semiconduttori ha dichiarato a iFanr che nessuno nel settore mette in discussione l'eccellenza di un'architettura di memoria unificata, ma il dibattito sull'opportunità di adottarla o meno, e se continuare a farlo, si basa sul giusto equilibrio tra gli obiettivi di prestazioni e i costi per i produttori.

Secondo l'attuale visione di Qualcomm riguardo alla SKU di punta X2, le potenti prestazioni offerte dall'architettura di memoria unificata dovrebbero essere riservate agli utenti più esigenti che ne hanno realmente bisogno, in particolare ai professionisti e ai creatori i cui flussi di lavoro si basano in larga misura su modelli e funzioni di intelligenza artificiale. Si tratta di un investimento che vale la pena fare.

Osservando Intel, si nota che avevano tentato qualcosa di simile con l'architettura Lunar Lake di precedente generazione, ma i costi erano lievitati a tal punto da diventare incontrollabili, costringendoli ad abbandonare il progetto. L'ex CEO di Intel, Pat Gelsinger, definì esplicitamente questo tentativo come "una tantum" durante una conference call sui risultati finanziari, sostenendo che l'imballaggio delle memorie aveva ridotto eccessivamente i margini di profitto lordo.

I modelli Panther Lake rilasciati a gennaio di quest'anno sono tornati al tradizionale approccio con memoria esterna, e si ritiene che anche la successiva architettura Nova Lake continuerà su questa strada. Intel detiene ancora una posizione di rilievo nel mercato dei laptop di fascia alta per l'intelligenza artificiale, ma è lecito affermare che non adotterà nuovamente un'architettura di memoria unificata nel breve termine.

Sul fronte AMD, anche il Ryzen AI Max+ 395 (Strix Halo) utilizza un'architettura di memoria condivisa simile, con fino a 128 GB di LPDDR5X integrata, che può raggiungere una larghezza di banda di memoria fino a 256 GB/s, persino più elevata rispetto all'X2 Elite Extreme.

Per questo motivo, AMD definisce Strix Halo come un chip per workstation mobili, utilizzato in laptop più costosi e ingombranti o in mini workstation, e non rientra nella fascia di prezzo dei consumatori di laptop personali.

Tre produttori di chip, tre risposte diverse. Il laptop consumer Snapdragon X2 Elite Extreme è stato lanciato ufficialmente in questo periodo. Sebbene sia difficile affermare che il lancio abbia coinciso con un periodo di sostituzione (visto quanto costa la memoria quest'anno), quantomeno colma una lacuna nel mercato consumer.

Quando raggiungerà le prestazioni del MacBook Pro?

A dire il vero, al momento lo Snapdragon X2 Elite Extreme può competere solo con il modello base M5 di Apple, ed è ancora ben lontano dai processori "top di gamma" di livello workstation come l'M5 Pro/Max.

La differenza più evidente risiede nella larghezza di banda massima della memoria: la larghezza di banda dichiarata dell'X2 Elite Extreme è di 228 GB/s, circa un terzo di quella dell'M5 Max e poco più di un terzo di quella dell'M5 Pro.

Naturalmente, dobbiamo ancora riabilitare la reputazione dell'X2, dato che questa generazione utilizza ancora un singolo chip e la larghezza di banda della memoria ha un limite fisico.

Apple ha utilizzato una nuova tecnologia di "fusion packaging" nella generazione M5 Pro/Max, che combina due chip per estendere il bus di memoria a un livello superiore.

Nei compiti di inferenza di modelli su larga scala più diretti, la differenza nella larghezza di banda della memoria si traduce direttamente in una differenza nella velocità di elaborazione dei token; questa differenza sarà evidente anche nel montaggio video ad altissima definizione e nelle attività di elaborazione AI come 4K/8K, o in attività computazionalmente intensive di altri software di ingegneria.

Tuttavia, almeno la piattaforma Windows è migliore di macOS in termini di compatibilità con questi programmi software professionali/industriali…

Credo che l'importanza dell'introduzione dell'architettura a memoria condivisa di Snapdragon nel mercato dei laptop Windows per i consumatori non debba limitarsi a discutere chi supera chi in termini di prestazioni.

Il punto è che gli utenti della piattaforma Windows non dovrebbero continuare a essere trattati come "cittadini di seconda classe".

Anche un laptop con schermo grande, sottile e leggero, che pesa non più di 1,5 kg, può comunque offrire una potenza di calcolo per l'intelligenza artificiale di gran lunga superiore a quella di altri laptop Windows ad alte prestazioni, mantenendo al contempo il vantaggio in termini di consumo energetico che ci si aspetta da un laptop sottile e leggero: questo è ciò che conta davvero.

Naturalmente, i vari problemi relativi a Windows su ARM, come l'ecosistema software, la stabilità del livello di emulazione x86 e l'adattamento del software professionale, non possono ancora essere risolti una volta per tutte dalla memoria condivisa.

Dai produttori di chip a Microsoft e agli ISV, tutti stanno intensificando i propri sforzi. Ad esempio, Photoshop e Lightroom possono già funzionare stabilmente sulle versioni native per ARM; anche DaVinci Resolve ha completato il supporto nativo per Windows su ARM due anni fa, persino prima di Adobe.

Tuttavia, la compatibilità dell'ecosistema software è ancora imperfetta. Ad esempio, alcuni motori di rendering e flussi di lavoro di Adobe After Effects possono essere utilizzati solo sulla piattaforma x86; anche alcune funzioni di rendering di Blender subiscono un degrado delle prestazioni sull'architettura ARM.

Questa è un'era in cui il software insegue l'hardware. Solo quando la generazione X2 riuscirà a conquistare un numero sufficiente di utenti, soprattutto creatori di contenuti e professionisti, da indurli a considerare i laptop con Snapdragon come dispositivi principali, l'ecosistema ARM entrerà in un circolo virtuoso in cui "più utenti, più adozioni, e più adozioni, più utenti".

Anche Apple ha seguito lo stesso procedimento, quindi non si tratta affatto di un'impresa impossibile.

#Vi invitiamo a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove troverete al più presto contenuti ancora più interessanti.