亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

知合計算:RISC-V架構賦能大模型創(chuàng)新,推動AI走向認知時代

來源:愛集微 #知合計算#
3874

7月18日,第五屆RISC-V中國峰會在上海舉行。在人工智能分論壇上,知合計算解決方案總監(jiān)黃怡皓發(fā)表了題為《大模型在RISC-V架構上的技術創(chuàng)新與應用》的演講,深入探討了RISC-V架構在大模型領域的創(chuàng)新實踐以及未來發(fā)展方向。

自2017年6月Google團隊發(fā)表《Attention Is All You Need》論文,提出自注意力機制以來,Transformer架構徹底改變了人工智能的發(fā)展軌跡。它摒棄了傳統(tǒng)的RNN和CNN,憑借高度并行化的特點,極大地提升了人工智能訓練速度。

ChatGPT的橫空出世,更是讓人工智能擺脫了“人工智障”的刻板印象,開啟了新的發(fā)展高潮。而今年1月份DeepSeek的出現(xiàn),又將國產化及開源大模型的認知提升到了新的高度。盡管大模型在這些年的發(fā)展過程中經歷了諸多變化,但其底層架構始終是Transformer。

從最早的GPT-2到通義千問以及DeepSeek R1模型,這些模型的架構都非常統(tǒng)一,變化主要集中在具體架構內部,而沒有改變整個Transformer的結構。其算子數(shù)量也基本趨同,大致在22個左右。以DeepSeek 7B模型為例,其核心算子共11個,其中Matmul計算量占比約95%。這表明大模型的算力需求高度集中,核心算子的優(yōu)化對于提升大模型性能至關重要。

RISC-V作為一種開源的指令集,具有強大的可擴展性。知合計算在其基礎上集成了AME指令,完美適配了Matmul算子。除了3個算子外,其他算子均可采用AME進行優(yōu)化。AME算子指令能夠支持矩陣大小為16行,每行約512bit,一次可處理相當于一個字節(jié)的矩陣大小。

這種優(yōu)化能力使得RISC-V架構在大模型算子處理上具有顯著優(yōu)勢。隨著大模型的發(fā)展,算子的數(shù)據格式也在不斷調整,從最早的FP32到現(xiàn)在的FP8等,RISC-V架構均能提供支持。這種靈活性和可擴展性使得RISC-V在大模型算子優(yōu)化方面具有廣闊的應用前景。

黃怡皓指出,目前AI在視覺方面已經從單純的識別功能走向了更為高階的認知功能。傳統(tǒng)卷積算法只能實現(xiàn)對圖像中物體的識別,例如人、動物、汽車等,但無法判斷物體之間的關系。而基于Transformer的大模型則可以進一步判斷不同物體之間的動作及相互關系,例如“熊貓吃竹子”“植物上的昆蟲”等場景。

知合計算與客戶合作的家庭場景項目也驗證了這一點。傳統(tǒng)卷積算法需要經過復雜的流程才能判斷視圖中的小孩子是在學習還是在玩手機,而基于Transformer算法的大模型只需通過搜索“兒童玩手機”的指令,即可快速、準確地分辨。

知合計算推出的首代通推一體CPU產品A210,支持Transformer架構,算力達到12TOPS,采用自研Torq架構實現(xiàn)算子抽象,通過自研Zmedia架構實現(xiàn)多媒體抽象?;贏210平臺的AI智能體可以實現(xiàn)流暢的點餐等復雜指令執(zhí)行,展現(xiàn)了強大的AI處理能力。

然而,黃怡皓也指出,作為端測芯片,A210更適合用于標準化的細分場景的AI智能體。隨著人工智能的發(fā)展,通用計算和AI推理都需要更加高效。在算子趨同的背景下,原本在生態(tài)方面不如ARM的RISC-V,如今與ARM站在了同一起跑線上。

得益于開源的特點,開發(fā)團隊對算子的優(yōu)化將更加直接和迅速。黃怡皓強調,目前AI能力已經開始從“識別”走向“認知”,如何將新的AI能力與通用計算能力結合起來,是知合計算未來主要推進的方向。RISC-V架構的開源性和可擴展性為這一目標的實現(xiàn)提供了堅實的基礎。

在人工智能快速發(fā)展的當下,RISC-V架構憑借其開源、靈活、可定制的特點,正在成為構建自主AI算力基石的戰(zhàn)略支點。知合計算通過在RISC-V架構上的創(chuàng)新實踐,展示了其在大模型技術創(chuàng)新與應用方面的強大實力。隨著AI從識別走向認知,RISC-V與通用計算的結合將為人工智能的發(fā)展帶來更多的可能性,推動AI技術在更多領域的落地應用,為人類社會的發(fā)展帶來更大的價值。
責編: 愛集微
來源:愛集微 #知合計算#
THE END

*此內容為集微網原創(chuàng),著作權歸集微網所有,愛集微,愛原創(chuàng)

關閉
加載

PDF 加載中...