Dopo 9 anni, Huang Renxun ha consegnato di nuovo il progetto a Musk, e il supercomputer personale AI, ritardato per più di sei mesi, è finalmente qui.


Oggi si è concluso con successo l'undicesimo volo della Starship e, inaspettatamente, sulla scena si è presentato anche Jensen Huang.

Si scopre che Huang Renxun si è recato personalmente alla base stellare in Texas, accanto alla nave spaziale in volo, solo per consegnare a Musk una "bomba nucleare" appena prodotta.

Ecco cosa tutti aspettavano dall'inizio dell'anno : il supercomputer personale con intelligenza artificiale NVIDIA DGX Spark .

Questa scena ha riportato alla mente ricordi memorabili per tutti gli appassionati di tecnologia, riportandoli al 2016. All'epoca, Musk era ancora il co-fondatore di OpenAI e, prima che lui e Altman litigassero, Huang consegnò personalmente il primo supercomputer DGX-1 al mondo all'ufficio della loro startup.

Huang Renxun scherzò all'epoca:

Se questo fosse l'unico prodotto ad essere spedito, il progetto costerebbe fino a 2 miliardi di dollari.

Quella "macchina da 2 miliardi di dollari" inaugurò in seguito l'era dei modelli di grandi dimensioni.

L'anno successivo, Google annunciò una nuova architettura di addestramento delle reti neurali, Transformer.

Questa nuova svolta è stata colta nuovamente da Sutskever, portando OpenAI a realizzare il primo modello GPT, interamente basato sul supercomputer di Nvidia.

Sono passati nove anni, Musk è diventato un personaggio fisso nella lista degli uomini più ricchi del mondo e Jensen Huang un tempo dirigeva l'azienda con il più grande valore di mercato al mondo.

Il DGX di NVIDIA questa volta non è più un colosso, ma un mostro di prestazioni che può essere posizionato sulla tua scrivania. Ancora una volta, NVIDIA ha annunciato nel modo più cool possibile: l'era del supercomputing AI per tutti inizia qui.

Attenzione spoiler: anche DGX Spark di APPSO è in arrivo. Vi forniremo maggiori dettagli in futuro, quindi rimanete sintonizzati.

A dire il vero, non è stato facile consegnare con successo questo DGX Spark a Lao Ma.

Dal suo sorprendente debutto al CES di gennaio con il nome "Project Digits", Nvidia ha mancato le date di uscita originali di maggio ed estate e non ha ancora spedito una singola unità. Questa attesa di sei mesi ha lasciato molti a disagio, con alcuni sviluppatori che hanno persino ipotizzato che il prodotto potesse essere rimandato del tutto.

Sebbene i funzionari rimangano a bocca cucita, le speculazioni del settore puntano sul chip Grace Blackwell GB10 come cuore del progetto. Questo chip è una "combinazione di forze", con la GPU Blackwell (la stessa architettura della nota scheda grafica 5090) già pronta. Tuttavia, la CPU Grace, sviluppata in collaborazione con MediaTek, ha tardato ad adeguarsi alla produzione, ostacolando l'intero progetto.

La storia del "tutto è pronto tranne la CPU" è accaduta inaspettatamente a NVIDIA.

Quindi, mentre concorrenti come l'M3 Ultra Mac Studio attirano l'attenzione con la loro elevata larghezza di banda di memoria, vale ancora la pena aspettare questo DGX Spark, arrivato in ritardo e 1.000 dollari più costoso di quanto inizialmente vociferato?

La risposta è: ne vale assolutamente la pena! Perché il suo approccio è unico e colpisce direttamente i punti critici.

Dopo oltre sei mesi di attesa, cosa rende DGX Spark così popolare? APPSO vi spiega il processo.

L'anima dell'intera macchina è il super chip Grace Blackwell GB10.

Combina una CPU ARM Grace a 20 core e una potente GPU Blackwell in un unico superchip, offrendo fino a 1 petaflop di prestazioni di elaborazione AI, garantendoti una potenza di livello data center sul tuo desktop.

DGX Spark ha un'altra caratteristica eccezionale: la CPU e la GPU tramite NVIDIA NVLink. ™ – La tecnologia C2C si connette in modo fluido, condividendo un enorme pool di memoria unificata da 128 GB.

Questa tecnologia di connessione vanta una larghezza di banda cinque volte superiore a quella del tradizionale PCIe di quinta generazione, garantendo un trasferimento dati ad alta velocità tra CPU e GPU con latenza praticamente nulla. Sebbene la larghezza di banda della memoria (273 GB/s) sia, sulla carta, significativamente inferiore a quella del Mac Studio M3 Ultra (819 GB/s), la filosofia di NVIDIA è quella di "sfruttare al massimo la potenza".

Nelle attività di intelligenza artificiale, soprattutto quando si eseguono modelli di grandi dimensioni, il valore strategico di poter inserire l'intero modello in memoria contemporaneamente supera di gran lunga la semplice larghezza di banda. Ciò significa che è possibile eseguire senza problemi un modello linguistico di grandi dimensioni con fino a 200 miliardi di parametri direttamente sulla propria scrivania, senza la necessità di un partizionamento complesso del modello. Questa esperienza non ha eguali.

La GPU Blackwell è dotata di Tensor Core di quinta generazione e supporta formati a precisione ultra-bassa come FP4/FP8, con prestazioni migliorate di 5 volte rispetto alla precedente generazione FP8.

È come attivare una modalità "turbo" per l'elaborazione dell'intelligenza artificiale, che aumenta notevolmente la velocità di inferenza, ottenendo al contempo una straordinaria efficienza energetica.

Una macchina non basta? DGX Spark integra anche un'interfaccia di rete NVIDIA ConnectX®-7 da 200 Gb/s. È possibile collegare facilmente due macchine per creare un micro cluster con 256 GB di memoria condivisa.

Nvidia ha affermato che questa combinazione è sufficiente per gestire modelli giganti con fino a 400 miliardi di parametri, il che va oltre l'immaginazione dei singoli sviluppatori.

Mettendo da parte l'hardware, non dimentichiamo il punto di forza di NVIDIA: l'ecosistema software. DGX Spark è preinstallato con lo stack software completo di NVIDIA AI, incluse le librerie CUDA, TensorRT e vari NVIDIA NIM. ™ Microservizi, tutto è integrato su un DGXOS personalizzato (basato su Ubuntu) e ottimizzato per te.

Ciò significa che non dovrete più preoccuparvi della compatibilità e potrete accedere alla modalità combattimento direttamente dopo aver aperto la scatola. Per gli sviluppatori, il risparmio di tempo è incommensurabile.

Questo "cambio di secolo" che avviene nella base spaziale è solo l'inizio.

A partire dal 15 ottobre, DGX Spark sarà ufficialmente disponibile sul sito web ufficiale di NVIDIA e presso i partner globali al prezzo di circa 4.000 dollari. Quasi tutti i giganti del PC, tra cui Acer, Asus, Dell e Lenovo, hanno già aderito all'iniziativa.

A dire il vero, questo prezzo è di 1.000 dollari in più rispetto ai 3.000 dollari inizialmente promessi, ed è più o meno lo stesso di un Mac Studio M3 Ultra di fascia alta. Tuttavia, il posizionamento è completamente diverso: il DGX Spark è dotato di DGXOS preinstallato (basato su Ubuntu) e non può essere installato con Windows o macOS. È una vera e propria "macchina da battaglia" pensata per sviluppatori di intelligenza artificiale e appassionati incalliti.

Il suo fascino risiede nel fatto che per 4.000 dollari si ottiene la potenza di gestire localmente un modello da 200 miliardi di parametri, oltre al pieno supporto dell'intero ecosistema CUDA che lo supporta. Per i professionisti che hanno bisogno di elaborare dati sensibili localmente, puntare a prestazioni estreme o desiderano il pieno controllo dei propri flussi di lavoro di intelligenza artificiale, questo prezzo è in realtà piuttosto competitivo.

Cosa ne pensi di questo dispositivo "di parte", con punti di forza e di debolezza ben distinti? Se hai altri dettagli che vorresti conoscere, faccelo sapere nella sezione commenti.

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo