英偉達(dá)在GTC 2024大會(huì)上以革命性架構(gòu)引爆行業(yè)的NVL72機(jī)柜,僅一年時(shí)間便從技術(shù)標(biāo)桿蛻變?yōu)楫a(chǎn)業(yè)生態(tài)標(biāo)桿。GTC 2025大會(huì)上,業(yè)界不同設(shè)計(jì)的NVL72量產(chǎn)級(jí)樣機(jī)亮相,標(biāo)志著全互聯(lián)GPU架構(gòu)正式進(jìn)入商業(yè)化落地階段。以NVL72為代表的全互聯(lián)GPU架構(gòu),在算力密度、散熱效率、節(jié)能降耗、可擴(kuò)展性等領(lǐng)域優(yōu)勢(shì)明顯,是面向百億億級(jí) (Exascale) AI 超級(jí)計(jì)算應(yīng)用的最佳方向選擇。
圖片來(lái)源:NIDIA GTC 2025 Online Press Kits
華勤技術(shù)ETH-X架構(gòu)AI RACK 本土化高性能計(jì)算的創(chuàng)新答案
全互聯(lián)GPU產(chǎn)品架構(gòu)設(shè)計(jì)十分復(fù)雜,涉及GPU、Switch、Cable Tray、Power Shelf、Busbar供電、液冷等一列復(fù)雜內(nèi)容,尤其是GPU間的互聯(lián)能力,對(duì)系統(tǒng)廠商的綜合能力提出了前所未有的要求。
華勤技術(shù)作為國(guó)內(nèi)為數(shù)不多的同時(shí)具備服務(wù)器和交換機(jī)技術(shù)能力的廠商,在ODCC(開(kāi)放數(shù)據(jù)中心委員會(huì))網(wǎng)絡(luò)工作組的指導(dǎo)下,牽頭設(shè)計(jì)符合ETH-X超節(jié)點(diǎn)架構(gòu)的整機(jī)柜服務(wù)器,成功打造了一款集高密度、綠色、智能于一體的三總線架構(gòu)液冷整機(jī)柜系統(tǒng),并在2024年9月正式發(fā)布《ETH-X 超節(jié)點(diǎn) AI 整機(jī)柜設(shè)計(jì)規(guī)范》。
基于ETH-X架構(gòu)開(kāi)發(fā)的華勤技術(shù)AI RACK整體系統(tǒng),關(guān)鍵設(shè)計(jì)參數(shù)如下:
1)RACK:52U, 兼容標(biāo)準(zhǔn)21寸機(jī)柜;
2)節(jié)點(diǎn):16個(gè)計(jì)算節(jié)點(diǎn),8~12個(gè)交換節(jié)點(diǎn)(視不同廠家GPU而定);
3)供電:4個(gè)Power Shelf,Busbar供電,整機(jī)支持120KW;
4)散熱:液冷為主,風(fēng)冷為輔;支持漏液檢測(cè);
5)計(jì)算節(jié)點(diǎn):1個(gè)CPU搭配4GPU,支持主流國(guó)產(chǎn)GPU新一代芯片;
6)交換節(jié)點(diǎn):?jiǎn)蝹€(gè)或多個(gè)Switch芯片;
7)系統(tǒng)設(shè)計(jì)支持多家GPU/Switch/NIC芯片設(shè)計(jì)。
在核心的互聯(lián)方面,華勤技術(shù)AI RACK針對(duì)不同國(guó)產(chǎn)GPU特性,設(shè)計(jì)兩款通用型計(jì)算節(jié)點(diǎn),支持多種系統(tǒng)互聯(lián)方式。華勤技術(shù)充分發(fā)揮在網(wǎng)絡(luò)交換方面的技術(shù)積累優(yōu)勢(shì),交換節(jié)點(diǎn)采用5nm交換芯片,可支持51.2T超算級(jí)帶寬,專為萬(wàn)卡AI訓(xùn)練集群設(shè)計(jì),可實(shí)現(xiàn)低時(shí)延高帶寬AI智算網(wǎng)絡(luò)。對(duì)外支持32個(gè)800G OSFP端口,向下兼容400G/200G/100G,同時(shí)支持銅纜DAC、AEC和光模塊互聯(lián),可支持跨柜Scale up 模型搭建。背板Cable Tray互聯(lián)設(shè)計(jì),差分對(duì)數(shù)量最大達(dá)到6144對(duì),通過(guò)搭配不同的Cable tray,即可實(shí)現(xiàn)單柜最高64pcs GPU的互聯(lián)。
面向國(guó)產(chǎn)算力基建的全新選擇
在全球AI競(jìng)速時(shí)代,華勤技術(shù)AI RACK采用國(guó)內(nèi)ETH-X最新架構(gòu)設(shè)計(jì),通過(guò)本土化創(chuàng)新開(kāi)辟了一條更適配國(guó)產(chǎn)GPU的高性能計(jì)算路徑。在算力自主化與AI應(yīng)用爆發(fā)的大趨勢(shì)下,華勤技術(shù)ETH-X架構(gòu)AI RACK以開(kāi)放生態(tài)、靈活架構(gòu)和成本優(yōu)勢(shì),為采用國(guó)產(chǎn)GPU構(gòu)建下一代智算中心提供了全新選擇。