近日,深圳市邁特芯科技有限公司推出了全新一代的大模型具身智能卡,為機(jī)器人提供大模型大腦,提供全新的智能體驗(yàn)和前所未有的人機(jī)互動方式。在人形機(jī)器人身上運(yùn)行大模型,可以實(shí)現(xiàn)高效的對話交互,以及實(shí)現(xiàn)多模態(tài)全自動踢球技能。
視頻一:具身智能卡
第一個(gè)視頻是邁特芯具身智能卡。邁特芯自研剪枝量化算法實(shí)現(xiàn)本地化部署,同時(shí)實(shí)現(xiàn)FPGA硬件加速,可以人機(jī)對話交互,為具身智能鋪墊堅(jiān)實(shí)平臺基礎(chǔ)。
在這個(gè)視頻中,機(jī)器人能夠與人類進(jìn)行自由的對話交互,借助大模型具身智能卡的強(qiáng)大推理能力,人形機(jī)器人可以根據(jù)用戶的輸入信息進(jìn)行推理,生成符合語義邏輯的文本,從而極大地提高了對話的質(zhì)量和效率,帶來了全新的智能化體驗(yàn)。
視頻二:機(jī)器人語言大模型
第二個(gè)視頻基于具身智能卡,可以本地化部署機(jī)器人語言大模型,實(shí)現(xiàn)兩個(gè)人形機(jī)器人實(shí)時(shí)對話。它們具備自動主題管理的能力,可以主動提問,自動管理對話主題,并有效地參與圍繞當(dāng)前主題的討論。
在這個(gè)視頻中,兩個(gè)人形機(jī)器人之間的精彩對話,它們不僅可以自動管理對話主題,還可以主動提問、參與討論,展現(xiàn)了超越人類想象的智能交流能力。借助大模型具身智能卡的強(qiáng)大推理和管理能力,人形機(jī)器人的對話將更加富有深度和豐富多彩。
視頻三:機(jī)器人多模態(tài)大模型
第三個(gè)視頻基于具身智能卡,可以本地化部署機(jī)器人多模態(tài)大模型,實(shí)現(xiàn)踢球機(jī)器人。以大語言模型的推理能力以及視覺計(jì)算為基礎(chǔ),通過提示詞工程,結(jié)合各類工具以及記憶能力,實(shí)現(xiàn)了踢球技能的全自動執(zhí)行。
在這個(gè)視頻中,人形機(jī)器人在足球場上展現(xiàn)出驚人的技術(shù),借助大模型具身智能卡,人形機(jī)器人實(shí)現(xiàn)了踢球、解說等多模態(tài)技能的全自動執(zhí)行。
這次邁特芯開發(fā)的具身智能卡實(shí)現(xiàn)了28個(gè)大模型BLOCK,每個(gè)大模型BLOCK包含近12個(gè)算子,總共包含338個(gè)算子。大模型部署到FPGA的具身智能卡,通過機(jī)器人輸入語音對話后,轉(zhuǎn)換為輸入矩陣數(shù)據(jù),不同的對話則對應(yīng)不同的Token數(shù)量,輸入到大模型硬件,經(jīng)由338個(gè)算子的計(jì)算得出Index結(jié)果,該部分為提問過程;Index結(jié)果經(jīng)過字典查閱和數(shù)據(jù)轉(zhuǎn)換后,得到一個(gè)Token,再次輸入到大模型硬件中進(jìn)行計(jì)算,得出新的Index,循環(huán)往復(fù)直到產(chǎn)生終止符的Index,該部分為回答過程,其中Index經(jīng)字典查閱后便是回答的文字或語音。經(jīng)優(yōu)化后該具身智能卡可達(dá)每秒100 個(gè)Token,在國內(nèi)外屬于領(lǐng)先水平。