亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

Nidish Kamath:GDDR7重塑AI推理內(nèi)存生態(tài)

來源:愛集微 #GDDR7#
9180

GDDR7作為顯存領(lǐng)域的革命性產(chǎn)品,自2024年3月JEDEC(固態(tài)存儲協(xié)會)發(fā)布其正式標(biāo)準(zhǔn)和規(guī)范后,GDDR7其正以高性能特性在越來越多的人工智能應(yīng)用場景中發(fā)揮積極作用。

集微網(wǎng)日前就“GDDR7賦能AI推理”話題與Rambus半導(dǎo)體IP產(chǎn)品管理總監(jiān)Nidish Kamath作交流,探討其面對新一代技術(shù)標(biāo)準(zhǔn)的前瞻觀點,以及如何塑造AI 2.0世界。

AI推理堆高內(nèi)存挑戰(zhàn)

人工智能浪潮之下,GPT-4在內(nèi)大型語言模型(LLM),正以日趨復(fù)雜的特性對現(xiàn)有內(nèi)存技術(shù)構(gòu)成重大挑戰(zhàn),要求更大的容量、更高的帶寬、更低的延遲以及更優(yōu)的能效。Nidish Kamath認(rèn)為,AI的進一步成熟將對內(nèi)存提出更多訴求,而核心挑戰(zhàn)是提供更高性能的同時實現(xiàn)更佳能效。內(nèi)存與互連技術(shù)將在此扮演關(guān)鍵角色,如果處理器要運行得更快,那么也必須同樣地加速數(shù)據(jù)傳輸。

另一個關(guān)鍵挑戰(zhàn)是,在處理器與內(nèi)存之間,以及處理器與處理器之間的通道和鏈路上,以更高數(shù)據(jù)速率實現(xiàn)可靠的數(shù)據(jù)傳輸,這是新技術(shù)大有可為的領(lǐng)域——Multi-PAM信令技術(shù)就是可能被采用以支持?jǐn)?shù)據(jù)速率持續(xù)提升的一個技術(shù)范例。

而對于內(nèi)存可靠性而言,提升單芯片的比特密度也是一項挑戰(zhàn)。因為隨著存儲單元微縮以在芯片上容納更多比特,需要管控其他一些效應(yīng),其中包括片上錯誤;此外,還需應(yīng)對諸如“RowHammer”和“RowPress”等其他效應(yīng),在這些效應(yīng)下,對特定單元的訪問可能會干擾鄰近區(qū)域的單元。

在此背景下,業(yè)界開始關(guān)注新一代GDDR技術(shù)。根據(jù)JEDEC?發(fā)布的標(biāo)準(zhǔn)和規(guī)范,GDDR7規(guī)范可提供高達每引腳48 Gbps的速度(遠(yuǎn)高于GDDR6和GDDR6X的24?Gbps),以及每設(shè)備192 GB/s的帶寬。除游戲領(lǐng)域,GDDR已成為AI加速器和GPU的重要解決方案,用以處理AI推理等要求嚴(yán)苛的工作負(fù)載,最新一代的GPU和AI系統(tǒng)正利用GDDR7滿足這些高級應(yīng)用的性能需求。

眼下,GDDR7正獲得廣泛的市場應(yīng)用,三星(Samsung)和美光(Micron)等內(nèi)存供應(yīng)商已推出GDDR7產(chǎn)品。2024年,三星宣布已開發(fā)出業(yè)界首款24Gb GDDR7 DRAM,該產(chǎn)品還采用脈沖幅度調(diào)制(PAM3)信號技術(shù),使其速度在圖形DRAM中達到40Gbps,與前代產(chǎn)品相比提高25%。

隨著AI推理應(yīng)用日益普及,并從數(shù)據(jù)中心擴展至邊緣及端點設(shè)備,整個計算領(lǐng)域都需要更強大的處理引擎,以及為其量身定制的高性能內(nèi)存解決方案。

“GPU向來是首選的推理引擎,在服務(wù)器和臺式機等邊緣與終端應(yīng)用中,這些GPU過去一直使用GDDR6內(nèi)存。然而,GDDR6在24 Gbps的數(shù)據(jù)速率下已達到標(biāo)準(zhǔn)NRZ信令的實際極限,”Nidish Kamath強調(diào),為滿足未來GPU的帶寬需求,采用全新信令方案的新一代GDDR勢在必行——應(yīng)用PAM3信令的GDDR7內(nèi)存應(yīng)運而生,可將數(shù)據(jù)速率一舉提升至40 Gbps乃至更高水平。

巨頭加持GDDR7走勢向好

那么,哪些應(yīng)用有望率先采用GDDR7?Nidish Kamath向集微網(wǎng)表示,至少AI/ML、數(shù)據(jù)中心和云計算、汽車行業(yè)、高性能計算等領(lǐng)域?qū)⒙氏瓤吹紾DDR7發(fā)揮作用:

① AI/ML:AI與ML應(yīng)用需要高速處理海量數(shù)據(jù)集。GDDR7所提升的性能將有助于加速AI模型的訓(xùn)練與推理過程。隨著AI在電信、機器人、汽車等領(lǐng)域的應(yīng)用不斷擴展,GDDR7的重要性將愈發(fā)凸顯。

② 數(shù)據(jù)中心和云計算:隨著全球云服務(wù)需求的持續(xù)增長,數(shù)據(jù)中心需要更高效、更快速的內(nèi)存解決方案。GDDR7將在增強服務(wù)器性能方面扮演關(guān)鍵角色,從而提升云計算服務(wù)的效率與可靠性。

③ 汽車行業(yè):對于處理自動駕駛汽車中傳感器和攝像頭所產(chǎn)生的海量數(shù)據(jù)而言,GDDR7將至關(guān)重要,它能有效提升車輛的決策能力與整體安全性。

④ 高性能計算:科學(xué)模擬、金融建模及其他HPC應(yīng)用都需要強大的計算能力。GDDR7的卓越性能可為用于科學(xué)研究、模擬和復(fù)雜計算的HPC系統(tǒng)帶來顯著助益。

市調(diào)機構(gòu)認(rèn)為,2025年,三星將持續(xù)于GDDR7生產(chǎn)時程與產(chǎn)能擴充領(lǐng)先,市占率高達70%,英偉達亦對三星制造的GDDR7高度依賴。在這種供應(yīng)格局下,預(yù)期未來GDDR7價格波動幅度將會收斂,走勢呈現(xiàn)持平或小幅上漲。

AI 2.0浪潮中的GDDR7

顯而易見,GDDR7的廣泛采用將有助于降低AI推理延遲,以其增強的內(nèi)存容量和帶寬支持更大、更復(fù)雜的模型,并改善內(nèi)存系統(tǒng)的能效。面對這一重要技術(shù),Rambus推出了GDDR7內(nèi)存控制器IP,提供業(yè)界領(lǐng)先的GDDR7性能,每引腳速率高達40 Gbps,每個GDDR7內(nèi)存設(shè)備可提供160 GB/s的可用帶寬。

Nidish Kamath介紹,Rambus的GDDR7控制器核專為需要高內(nèi)存吞吐量、高時鐘頻率和完全可編程性的應(yīng)用而設(shè)計。該控制器核通過AXI接口或簡單的本地接口接受命令,并將其轉(zhuǎn)換為GDDR7 SGRAM設(shè)備所需的命令序列,也支持所有低功耗模式。

此外,該核心使用先進調(diào)度算法來重新排序隊列中的用戶請求,以此最大限度地提高總線效率,并減少DRAM訪問規(guī)則造成的內(nèi)存總線空閑時間。核心在維持訪問限制和一致性規(guī)則的同時,會選擇處理隊列中的下一個最佳請求,以此實現(xiàn)高效率,并將所有請求的延遲時間降至最低。

最后,Nidish Kamath以Rambus的角度談了內(nèi)存技術(shù)的未來發(fā)展:“伴隨全球AI‘民主化’趨勢的不斷發(fā)展,許多AI應(yīng)用正從數(shù)據(jù)中心擴展至邊緣和端點,這對現(xiàn)有內(nèi)存系統(tǒng)在帶寬、延遲、容量等方面提出了日益增長的需求。在AI 2.0的演進浪潮中,Rambus在內(nèi)存接口芯片、內(nèi)存接口IP和安全IP解決方案方面具有深厚的專業(yè)知識,正與行業(yè)伙伴緊密合作,共同開發(fā)尖端的內(nèi)存解決方案,以完全釋放人工智能技術(shù)的巨大潛力?!?/p>

責(zé)編: 張軼群
來源:愛集微 #GDDR7#
THE END

*此內(nèi)容為集微網(wǎng)原創(chuàng),著作權(quán)歸集微網(wǎng)所有,愛集微,愛原創(chuàng)

關(guān)閉
加載

PDF 加載中...