尖端AI推理模型DeepSeek R1一經(jīng)問世,便在整個科技行業(yè)引起波瀾。因其性能能夠媲美甚至超越先進的同類模型,顛覆了關(guān)于AI發(fā)展的傳統(tǒng)認(rèn)知。
這一關(guān)鍵時刻是更廣泛趨勢的一部分,凸顯了行業(yè)在打造高質(zhì)量小語言模型和多模態(tài)推理模型方面的創(chuàng)新,以及這些創(chuàng)新正在為AI的商用應(yīng)用和終端側(cè)推理落地做好準(zhǔn)備。這些新模型能夠在終端側(cè)運行,將加速強大邊緣側(cè)芯片的規(guī)?;瘮U展,并創(chuàng)造對此類芯片的需求。
四大趨勢正在顯著提高目前可在終端側(cè)運行的AI模型的質(zhì)量、性能和效率,從而推動上述變革:
當(dāng)前先進的AI小模型已具有卓越性能。模型蒸餾和新穎的AI網(wǎng)絡(luò)架構(gòu)等新技術(shù)能夠在不影響質(zhì)量的情況下簡化開發(fā)流程,讓新模型的表現(xiàn)超越一年前推出的僅能在云端運行的更大模型。
模型參數(shù)規(guī)模正在快速縮小。先進的量化和剪枝技術(shù)使開發(fā)者能夠在不對準(zhǔn)確性產(chǎn)生實質(zhì)影響的情況下,縮小模型參數(shù)規(guī)模。
開發(fā)者能夠在邊緣側(cè)打造更豐富的應(yīng)用。高質(zhì)量AI模型快速激增,意味著文本摘要、編程助手和實時翻譯等特性在智能手機等終端上的普及,讓AI能夠支持跨邊緣側(cè)規(guī)?;渴鸬纳逃脩?yīng)用。
AI正在成為新的UI。個性化多模態(tài)AI智能體將簡化交互,高效地跨越各種應(yīng)用完成任務(wù)。
高通技術(shù)公司在引領(lǐng)并利用從AI訓(xùn)練向大規(guī)模推理轉(zhuǎn)型,以及AI計算處理從云端向邊緣側(cè)擴展方面具有戰(zhàn)略優(yōu)勢。公司在開發(fā)定制CPU、NPU、GPU和低功耗子系統(tǒng)領(lǐng)域取得了廣泛的成就。通過與模型廠商展開合作,以及面向跨不同邊緣終端領(lǐng)域的模型部署提供工具、框架和SDK,高通技術(shù)公司賦能開發(fā)者在邊緣側(cè)加速采用AI智能體和應(yīng)用。
近期對AI模型訓(xùn)練方式的顛覆變革和重新評估驗證了AI格局即將向大規(guī)模推理轉(zhuǎn)變的趨勢,這將形成全新邊緣側(cè)推理計算的創(chuàng)新和升級周期。盡管模型訓(xùn)練仍將在云端進行,但推理將受益于采用高通?技術(shù)的廣泛終端規(guī)模,并催生更多邊緣側(cè)AI賦能處理器的需求。
*本文內(nèi)容來自高通技術(shù)公司高級副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉(Durga Malladi)、高通技術(shù)公司市場資深經(jīng)理Jerry Chang的博客文章。
點擊此處鏈接可下載高通白皮書,了解更多內(nèi)容。