亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

夯實(shí)人工智能算力底座:國(guó)產(chǎn)PCIe 5.0 SSD,為AI訓(xùn)練而生

來(lái)源:英韌科技 #英韌科技# #存儲(chǔ)SSD#
7549

Dongting-N3以卓越的性能、低延遲和高可靠性,深度契合AI大模型的存儲(chǔ)需求,為AI大數(shù)據(jù)訓(xùn)練提供了高效的存儲(chǔ)解決方案。

AI模型訓(xùn)練和推理過(guò)程高度依賴于大量數(shù)據(jù)的快速訪問(wèn)與處理,尤其是在像DeepSeek這樣的數(shù)據(jù)密集型應(yīng)用場(chǎng)景中。隨著AI技術(shù)的迅速發(fā)展,對(duì)存儲(chǔ)設(shè)備的要求也在不斷提高,尤其是對(duì)高容量、高速NVMe SSD的需求顯著增加。在這些場(chǎng)景下,基于NVMe協(xié)議的固態(tài)硬盤(SSD)因其卓越的性能和可靠性成為了確保訓(xùn)練效率的關(guān)鍵因素。而PCIe 5.0 SSD憑借其更高的帶寬和更低的延遲特性,進(jìn)一步滿足了現(xiàn)代AI應(yīng)用對(duì)于存儲(chǔ)解決方案的苛刻要求。

英韌科技推出的PCIe 5.0 SSD——洞庭-N3(Dongting-N3)系列,憑借其卓越的性能、超低延遲與高可靠性,全面滿足AI大模型在訓(xùn)練過(guò)程中的嚴(yán)苛需求,為數(shù)據(jù)中心提供高效、穩(wěn)定的存儲(chǔ)支持。

高吞吐量——保障數(shù)據(jù)“高速喂養(yǎng)”GPU

AI訓(xùn)練涉及海量數(shù)據(jù)(如大規(guī)模圖像、文本或視頻數(shù)據(jù)集)的快速加載和處理。模型訓(xùn)練時(shí),數(shù)據(jù)需要從存儲(chǔ)設(shè)備快速傳輸?shù)紾PU/加速卡內(nèi)存。

洞庭-N3(Dongting-N3)系列采用自研PCIe 5.0主控,搭配長(zhǎng)江存儲(chǔ)NAND 閃存顆粒,順序讀取速度高達(dá)14.5 GB/s,當(dāng)AI模型需要“進(jìn)食”數(shù)據(jù)時(shí),它會(huì)像一臺(tái)超高速傳送帶,源源不斷地將數(shù)據(jù)“投喂”給GPU。

高IOPS——應(yīng)對(duì)復(fù)雜混合負(fù)載場(chǎng)景

AI訓(xùn)練中混合負(fù)載常見(jiàn)(如隨機(jī)讀取元數(shù)據(jù)、連續(xù)讀取大文件),需要高IOPS確保多任務(wù)并發(fā)時(shí)性能穩(wěn)定。這需要隨機(jī)讀/寫IOPS達(dá)到百萬(wàn)級(jí),尤其是應(yīng)對(duì)小文件隨機(jī)訪問(wèn)場(chǎng)景(如特征數(shù)據(jù)加載)。

洞庭-N3(Dongting-N3)利用硬件加速增強(qiáng)了IO并行處理能力,支持更高的IO并發(fā)讀寫,Dongting-N3出色的多路并行存取數(shù)據(jù)表現(xiàn),能夠在多臺(tái)機(jī)器或者多個(gè)GPU之間高效傳輸數(shù)據(jù),進(jìn)一步提升AI系統(tǒng)性能,從而提升大規(guī)模AI應(yīng)用的訓(xùn)練速度和精度。

低延遲——加快模型迭代效率

在數(shù)據(jù)訓(xùn)練過(guò)程中,GPU需要頻繁訪問(wèn)數(shù)據(jù)(如小批量數(shù)據(jù)加載、隨機(jī)讀取),存儲(chǔ)延遲直接影響訓(xùn)練迭代速度,在此類場(chǎng)景下,4K隨機(jī)讀寫延遲需控制在微秒級(jí)。

洞庭-N3(Dongting-N3)的讀寫延遲低至55/4 μs,超低讀寫延遲設(shè)計(jì)可顯著增強(qiáng)數(shù)據(jù)訪問(wèn)的響應(yīng)速度,更大程度助力AI系統(tǒng)的實(shí)時(shí)性和可靠性。顯著提升了AI模型訓(xùn)練和推理時(shí)數(shù)據(jù)訪問(wèn)速度,以便AI系統(tǒng)能夠更快處理實(shí)時(shí)數(shù)據(jù)流,增強(qiáng)AI系統(tǒng)整體效率。

高可靠性——守護(hù)數(shù)據(jù)完整性與模型準(zhǔn)確性

訓(xùn)練時(shí)若數(shù)據(jù)出錯(cuò)(比如圖片損壞),AI會(huì)學(xué)錯(cuò)知識(shí),輸出錯(cuò)誤結(jié)果。這就需求企業(yè)級(jí)PCIe SSD通過(guò)多重校驗(yàn)和斷電保護(hù),確保數(shù)據(jù)從存儲(chǔ)到計(jì)算的全程“純凈”,某種程度上數(shù)據(jù)可靠性也代表著訓(xùn)練成果的可信度。

英韌科技于2018年成功研發(fā)并全面啟用4K LDPC(低密度奇偶校驗(yàn)Low-Density Parity-Check)糾錯(cuò)技術(shù),并廣泛應(yīng)用于自主研發(fā)的消費(fèi)級(jí)和企業(yè)級(jí)主控芯片中。通常的企業(yè)級(jí)SSD UBER(不可恢復(fù)錯(cuò)誤率)需滿足≤1E-17,基于業(yè)界領(lǐng)先的 LDPC 算法,洞庭-N3(Dongting-N3)具備超強(qiáng)的糾錯(cuò)能力,將UBER提升至1E-18,能夠精準(zhǔn)識(shí)別并修正數(shù)據(jù)傳輸與存儲(chǔ)過(guò)程中出現(xiàn)的各類錯(cuò)誤。

AI大規(guī)模語(yǔ)言模型的快速發(fā)展,對(duì)存儲(chǔ)設(shè)備提出了前所未有的高要求。英韌科技PCIe 5.0 SSD洞庭-N3(Dongting-N3)系列憑借其卓越的性能、低延遲和高可靠性,深度契合了AI大模型的存儲(chǔ)需求,為AI大數(shù)據(jù)訓(xùn)練提供了高效的存儲(chǔ)解決方案。

英韌科技將全面支持AI時(shí)代數(shù)據(jù)中心對(duì)存儲(chǔ)設(shè)備的高帶寬、低延遲及高密度部署需求, 為高密度算力集群和實(shí)時(shí)數(shù)據(jù)處理場(chǎng)景提供更多不同場(chǎng)景的存儲(chǔ)解決方案及可靠保障。

責(zé)編: 愛(ài)集微
來(lái)源:英韌科技 #英韌科技# #存儲(chǔ)SSD#
THE END
關(guān)閉
加載

PDF 加載中...