自ChatGPT橫空出世掀起國內(nèi)百模大戰(zhàn)以來,拉動算力需求出現(xiàn)爆發(fā)式增長,也促進算力基礎(chǔ)設(shè)施由通用算力為主向通算、智算、超算一體化演進。據(jù)IDC預(yù)計,2021-2026年期間,中國智能算力規(guī)模年復(fù)合增長率達52.3%,預(yù)計到2026年智能算力規(guī)模將進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到1271.4 EFLOPS。
在這一趨勢作用下,作為算力底座的云計算技術(shù),對異構(gòu)算力需求越來越高。中科馭數(shù)高級副總裁張宇認為,算力核心來源將是三U即GPU、CPU、DPU一體,CPU實現(xiàn)通用算力,GPU釋放智能算力,DPU支撐基礎(chǔ)I/O算力,實現(xiàn)多卡、多機數(shù)據(jù)的高速同步,缺一不可。
DPU作為新型算力基礎(chǔ)設(shè)施的一股新生力量,在各行各業(yè)數(shù)據(jù)中心的應(yīng)用也在逐步深入,而不同的場景需要多元化的DPU支持,在這方面一直專注于DPU研發(fā)、基于自研KPU芯片架構(gòu)率先發(fā)布三代DPU、持續(xù)構(gòu)建生態(tài)和擴展應(yīng)用的中科馭數(shù),顯現(xiàn)出強勁的競爭力。
在最近舉辦的以“DPU構(gòu)建高性能云算力底座”為主題的線上技術(shù)開放日活動上,中科馭數(shù)集中展現(xiàn)了其在低時延、云原生及智算中心三大關(guān)鍵場景下的技術(shù)成果與五大核心DPU解決方案,凸顯了中科馭數(shù)在高性能數(shù)據(jù)中心建設(shè)與云算力基礎(chǔ)設(shè)施升級中的堅實力量。
推動算力基礎(chǔ)設(shè)施發(fā)展 應(yīng)用多點開花
“DPU是解決數(shù)據(jù)中心計算效率低、資源利用率低、安全性低‘三低’問題的關(guān)鍵技術(shù)。中科馭數(shù)正不遺余力地參與并積極推動算力基礎(chǔ)設(shè)施的發(fā)展,DPU技術(shù)開放日既是對DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細分場景走向成熟的標(biāo)志?!敝锌岂S數(shù)創(chuàng)始人、CEO鄢貴海表示。
在云計算方面,中科馭數(shù)高性能云原生底座方案為DPU在云計算中落地應(yīng)用夯實基礎(chǔ),帶來物理隔離、業(yè)務(wù)卸載、硬件加速、業(yè)務(wù)快速迭代等諸多優(yōu)勢。通過將工作節(jié)點的存儲、網(wǎng)絡(luò)、管理等基礎(chǔ)設(shè)施組件完全卸載到DPU硬件,釋放Worker節(jié)點的CPU算力資源給到業(yè)務(wù)系統(tǒng),幫助集群算效比大幅提升,極大提升了云基礎(chǔ)設(shè)施的服務(wù)效能與穩(wěn)定性。
張宇介紹,DPU已在某頭部云計算廠商的云數(shù)據(jù)中心中落地?;贒PU的方案使得裸金屬服務(wù)的業(yè)務(wù)邏輯發(fā)生了明顯變化,可以大大縮短裸金屬服務(wù)的交付時間,實現(xiàn)了虛擬網(wǎng)絡(luò)功能的全面卸載,也為存算分離相關(guān)的多種存儲技術(shù)提供了統(tǒng)一的接口。
針對云原生業(yè)務(wù)的復(fù)雜性和高時效性需求,中科馭數(shù)提出了基于DPU的極速服務(wù)網(wǎng)格方案,以服務(wù)網(wǎng)格化繁為簡,有效降低了系統(tǒng)時延,為用戶帶來了前所未有的極致云原生業(yè)務(wù)體驗。目前,基于DPU的服務(wù)網(wǎng)格方案已成功應(yīng)用于國內(nèi)某知名證券機構(gòu),引入中科馭數(shù)方案后,在七層服務(wù)治理下,時延降至100-130微秒;在四層流量下僅需40微秒。
在數(shù)據(jù)安全領(lǐng)域,中科馭數(shù)展示了高性能國產(chǎn)密碼卸載方案,依托自主研發(fā)的加解密引擎,確保安全業(yè)務(wù)在保證極高效率的同時,實現(xiàn)了自主可控的安全保障。采用此方案,可降低主機CPU利用率至90%以上,確保業(yè)務(wù)零丟包,提高安全性能,減少客戶工作量。
在智算、超算領(lǐng)域,并行文件系統(tǒng)是一種常見且重要的分布式文件存儲系統(tǒng)。中科馭數(shù)推出的RDMA加速并行文件系統(tǒng)解決方案,采用RDMA網(wǎng)絡(luò)DPU卡代替?zhèn)鹘y(tǒng)網(wǎng)卡,將RDMA網(wǎng)絡(luò)應(yīng)用與并行文件系統(tǒng),突破了傳統(tǒng)的存算速度瓶頸,解鎖了存算之間的高速通道,以更少的計算資源提供更強的網(wǎng)絡(luò)傳輸能力。
面對證券期貨交易領(lǐng)域?qū)Φ蜁r延的嚴苛要求,中科馭數(shù)信創(chuàng)低時延網(wǎng)絡(luò)解決方案憑借異構(gòu)加速技術(shù)的創(chuàng)新應(yīng)用,實現(xiàn)了自主安全且時延領(lǐng)先的技術(shù)突破,在系統(tǒng)層兼容各類國產(chǎn)操作系統(tǒng),在應(yīng)用層廣泛適配多家業(yè)內(nèi)金融軟件廠商的交易系統(tǒng),從而支撐核心交易業(yè)務(wù)從底層硬件到上層軟件,向全信創(chuàng)平臺遷移,同時還能獲取媲美非信創(chuàng)的時延性能。
軟硬協(xié)同發(fā)展 持續(xù)增添新動能
伴隨著數(shù)字經(jīng)濟時代的全面開啟,算力不僅成為新的關(guān)鍵生產(chǎn)力,也成為大國博弈的核心競爭力。國內(nèi)DPU賽道也站滿了各路玩家,如阿里云、騰訊、字節(jié)跳動等互聯(lián)網(wǎng)巨頭,以及一些DPU創(chuàng)業(yè)公司中科馭數(shù)、星云智聯(lián)、云脈芯聯(lián)、大禹智芯、益思芯、芯啟源等。
隨著大模型作為一種新型基礎(chǔ)設(shè)施逐漸普及,AI將賦能千行百業(yè),算力資源需求爆發(fā)性增長,數(shù)據(jù)中心將迎來新一輪的大規(guī)模擴容和升級,發(fā)展云端算力成為明確方向,對DPU需求也持續(xù)增長。有數(shù)據(jù)顯示,未來幾年云與數(shù)據(jù)中心領(lǐng)域每年國內(nèi)服務(wù)器出貨量將維持在500萬臺左右,其中DPU滲透率在10%左右,單臺服務(wù)器可以配置一塊到多塊DPU板卡,預(yù)計每年DPU需求量將在100萬片左右。
尤其是最近加快建設(shè)算力基礎(chǔ)設(shè)施的各種重磅政策和方案接連出臺,利好DPU產(chǎn)業(yè)發(fā)展。2023年10月,工信部、中央網(wǎng)信辦、國務(wù)院國資委等六部門2023年10月聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,提出到2025年算力規(guī)模超過300 EFLOPS,并將DPU設(shè)為重要任務(wù)之一。
在DPU比拼層面,一方面盡管DPU發(fā)展有不同的路線,但DPU SoC已成為當(dāng)前國外頭部云服務(wù)提供商和DPU廠商的主流技術(shù)路線。另一方面,生態(tài)至關(guān)重要。
中科馭數(shù)獨辟蹊徑,創(chuàng)新性地提出了軟件定義加速器技術(shù)路線,自主開發(fā)敏捷異構(gòu)KPU創(chuàng)新架構(gòu),解決了DPU設(shè)計碎片化的問題,且具有軟件定義可配置、低設(shè)計成本、計算高效的優(yōu)勢,目前已迭代三代,第四代DPU也即將上市。
在軟件生態(tài)方面,中科馭數(shù)自研的DPU軟件開發(fā)平臺HADOS,可兼容多種操作系統(tǒng),大幅降低應(yīng)用軟件開發(fā)難度。目前,中科馭數(shù)全面擁抱國產(chǎn)化生態(tài),已與國內(nèi)6大CPU芯片、12家主流操作系統(tǒng)、9家主流數(shù)據(jù)庫廠商、8家頭部云/云原生廠商、17家TOP級服務(wù)器廠商完成兼容性適配。并且參與了10大開源社區(qū)平臺建設(shè),共同推動技術(shù)發(fā)展。
值得一提的是,中科馭數(shù)還牽頭并參與了30余項行業(yè)標(biāo)準(zhǔn)及團隊標(biāo)準(zhǔn)的制定,成為DPU標(biāo)準(zhǔn)的重要推動者和參與者。
發(fā)展至今,中科馭數(shù)從芯片底層架構(gòu),到網(wǎng)絡(luò)、存儲、計算等上層應(yīng)用系統(tǒng)已形成深厚的核心技術(shù)積累。面向未來,張宇總結(jié)道,DPU將帶動算力基礎(chǔ)設(shè)施計算體系結(jié)構(gòu)的變化,在軟硬件協(xié)同、架構(gòu)層面快速迭代,中科馭數(shù)也將持續(xù)優(yōu)化DPU的低時延、高吞吐,加強推進在低時延、云原生及智算中心等關(guān)鍵場景的落地,為國內(nèi)算力基礎(chǔ)設(shè)施增添新動能。