韓國研究人員根據(jù)模仿人類大腦的結(jié)構(gòu)和功能的原理,開發(fā)出了世界上第一個以超低功耗處理大型語言模型(LLM)的超高速人工智能(AI)半導(dǎo)體。該半導(dǎo)體成功運行了GPT 2,功耗僅為英偉達A100 GPU的1/625,尺寸僅為英偉達A100的1/41。這一突破被認(rèn)為是正在升級的全球人工智能半導(dǎo)體戰(zhàn)爭的關(guān)鍵進展。
韓國科學(xué)技術(shù)院(KAIST)PIM半導(dǎo)體研究中心和AI半導(dǎo)體研究生院的Yu Hoi-jun教授研究組3月6日發(fā)表了利用三星電子28納米工藝開發(fā)出的超低功耗“互補變壓器”半導(dǎo)體。
據(jù)悉,以往操作GPT 2需要多個GPU并消耗250瓦的功率。但是,Yu Hoi-jun教授的研究小組利用4.5×4.5毫米的單個AI半導(dǎo)體,僅用400毫瓦的功率就在0.4秒內(nèi)處理了GPT 2。這項研究的結(jié)果于2月19日至23日在美國舊金山舉行的國際固態(tài)電路會議(ISSCC)上發(fā)表并展示。
“互補變壓器”是一種可以選擇性地使用模擬大腦神經(jīng)元處理信息方式的“尖峰神經(jīng)網(wǎng)絡(luò)”(SNNs)和能夠識別復(fù)雜模式并通過多層神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí)的人工智能模型“深度神經(jīng)網(wǎng)絡(luò)” (DNNs)的技術(shù)。它模仿了人類大腦運作的原理,即能量消耗隨認(rèn)知負(fù)荷而變化。該技術(shù)通過對大輸入值使用DNNs和對小輸入值使用SNNs來最大限度地降低功耗。
(校對/劉昕煒)