5月19日,英偉達(dá)CEO黃仁勛宣布,全球最小AI超級計算機DGX Spark已全面投產(chǎn),將于數(shù)周內(nèi)就緒。這款被稱為 “桌面級AI超算” 的設(shè)備,由英偉達(dá)超級芯片驅(qū)動,將數(shù)據(jù)中心級算力首次壓縮至150×150×50.5mm的臺式機形態(tài)機身內(nèi),支持開發(fā)者在本地完成大模型的訓(xùn)練、微調(diào)和推理,并實現(xiàn)與云端算力的無縫遷移。AI開發(fā)正式進(jìn)入了 “個人時代”。
DGX Spark的核心是英偉達(dá)專為臺式機優(yōu)化的GB10 Grace Blackwell超級芯片,采用第五代Tensor Core架構(gòu),支持FP4精度計算,每秒運算能力高達(dá)1,000萬億次,專為生成式AI和物理AI模型設(shè)計。通過NVLink-C2C互連技術(shù),CPU與GPU間的數(shù)據(jù)帶寬提升至第五代PCIe的五倍,解決了傳統(tǒng)架構(gòu)中內(nèi)存密集型任務(wù)效率低下的痛點。
DGX Spark的性能參數(shù)使其能夠本地運行2000億參數(shù)的AI大模型,雙機互聯(lián)時可擴展至4050億參數(shù),遠(yuǎn)超普通AI工作站。此外,DGX Spark預(yù)裝了NVIDIA全棧AI平臺,用戶可直接調(diào)用Cosmos-Reason世界基礎(chǔ)模型和GR00T N1機器人模型,大幅降低開發(fā)門檻。
DGX Spark的研發(fā)始于英偉達(dá)2022年啟動的Project DIGITS項目,今年1月,該項目以 “全球最小AI超算” 身份亮相CES展,引發(fā)行業(yè)關(guān)注。經(jīng)過三個月的優(yōu)化,英偉達(dá)于3月19日正式發(fā)布 DGX Spark,并同步開放預(yù)訂。DGX Spark的量產(chǎn)由華碩、戴爾、惠普和聯(lián)想等頭部廠商共同完成,預(yù)計年內(nèi)覆蓋全球數(shù)百萬開發(fā)者。
黃仁勛稱,DGX Spark的推出不僅是硬件突破,更是“AI原生計算機”這一新品類誕生的標(biāo)志,未來將推動邊緣計算與生成式AI的深度融合。
DGX Spark的投產(chǎn)正值A(chǔ)I行業(yè)從 “云端壟斷” 向 “端云協(xié)同” 轉(zhuǎn)型的關(guān)鍵期。隨著生成式AI應(yīng)用爆發(fā),開發(fā)者對本地化算力的需求激增。據(jù)廣發(fā)證券測算,2025年全球AI推理算力需求將是訓(xùn)練算力的3倍以上,而傳統(tǒng)云端部署面臨數(shù)據(jù)隱私、延遲和成本壓力。DGX Spark的出現(xiàn),使中小型企業(yè)和個人開發(fā)者能夠以消費級成本獲得超算級算力,推動AI創(chuàng)新門檻大幅降低。