6月18日,GSMA 2025 MWC上海正式拉開帷幕。在大會首日舉辦的“代理式人工智能峰會”上,高通技術(shù)公司AI/生成式AI產(chǎn)品管理副總裁Vinesh Sukumar博士發(fā)表主題演講,分享了對于AI發(fā)展新趨勢的看法。
Vinesh Sukumar博士指出,AI發(fā)展正在進(jìn)入全新階段,AI發(fā)展重心正在向邊緣終端轉(zhuǎn)移。當(dāng)前,AI正在向智能體AI領(lǐng)域轉(zhuǎn)型,高通相信AI將成為新的UI,并覆蓋廣泛終端。與此同時,為實(shí)現(xiàn)這一愿景,高通公司已經(jīng)構(gòu)建了覆蓋廣泛邊緣終端的硬件和軟件技術(shù),為智能體AI體驗在終端側(cè)的發(fā)展打造了堅實(shí)基礎(chǔ)。
縱觀AI的發(fā)展歷程,早期AI技術(shù)主要集中在分割、檢測、分類、圖像增強(qiáng)等感知AI領(lǐng)域,為賦能智能手機(jī)體驗奠定了基礎(chǔ)。但隨著時間的推移,上述體驗也在快速進(jìn)行演變,類似技術(shù)擴(kuò)展到了汽車、PC等市場,以及XR和工業(yè)網(wǎng)絡(luò)等新興領(lǐng)域。
在這些領(lǐng)域中,行業(yè)探討的重點(diǎn)從感知數(shù)據(jù)到多模態(tài)數(shù)據(jù)的轉(zhuǎn)變,多模態(tài)數(shù)據(jù)可以是文本、圖像或視頻形式,且全部都基于提示(prompt)生成。將這些技術(shù)匹配到不同的應(yīng)用賽道上,從而幫助在生產(chǎn)力、游戲甚至內(nèi)容生成領(lǐng)域打造全新的用戶體驗。而高通正在將這些知識積累應(yīng)用到所有相關(guān)領(lǐng)域。
Vinesh Sukumar博士強(qiáng)調(diào),高通非常重視生成式AI和智能體AI,是最早展示大模型可以完全在邊緣運(yùn)行的芯片平臺廠商之一。
對于AI未來的發(fā)展方向,Vinesh Sukumar博士表示,高通非常重視與眾多的模型開發(fā)者合作,致力于推動大型基礎(chǔ)模型向更加垂直行業(yè)或任務(wù)專用型模型轉(zhuǎn)變,并助力實(shí)現(xiàn)邊緣終端運(yùn)行。這些行業(yè)專用模型可能會非常龐大,參數(shù)量可能達(dá)到70-100億,高通已經(jīng)開始推動這些模型在不同形態(tài)的終端上運(yùn)行。
“在模型領(lǐng)域,過去人們通常認(rèn)為更大的模型意味著更好的質(zhì)量,但縱觀大模型的發(fā)展過程,從通義千問、Meta、Google或微軟推出的模型中可以看出,小模型的質(zhì)量正在快速提升并追趕大模型的能力。以模型智能指數(shù)對比為例,眾多的小語言模型(SLM)已經(jīng)達(dá)到了Llama 3 700億參數(shù)大模型的水平。”Vinesh Sukumar博士說。
為何邊緣模型正在變得愈發(fā)重要和關(guān)鍵?Vinesh Sukumar博士指出,這是因為它們能夠在生產(chǎn)力或內(nèi)容創(chuàng)作領(lǐng)域為用戶提供豐富的體驗。過去,模型會面臨如何真正實(shí)現(xiàn)終端側(cè)部署的挑戰(zhàn)。針對這一挑戰(zhàn),高通提供了高通AI軟件棧,能夠支持模型完全在邊緣平臺部署。高通始終致力于為包括開發(fā)者在內(nèi)的生態(tài)系統(tǒng)合作伙伴提供機(jī)會,讓應(yīng)用能夠?qū)崿F(xiàn)云端訓(xùn)練,并在高通平臺賦能的終端上運(yùn)行。
在過去的12到18個月里,高通在邊緣AI領(lǐng)域?qū)崿F(xiàn)了諸多關(guān)鍵用例的商業(yè)化應(yīng)用,每年賦能大約200到300個AI應(yīng)用。在過去的12個月里,高通更加重視生成式AI領(lǐng)域。在消費(fèi)領(lǐng)域,邊緣AI已經(jīng)能夠支持內(nèi)容創(chuàng)作、照片編輯、圖像修復(fù)、圖像擴(kuò)展等諸多應(yīng)用;在企業(yè)領(lǐng)域,包括代碼生成等更多應(yīng)用。
“在過去,生成式AI已經(jīng)帶來了諸多助力,但其僅支持單一模態(tài)?,F(xiàn)在,我們正在向所謂的智能體AI領(lǐng)域轉(zhuǎn)型。我們相信,AI將成為新的UI(用戶界面),并覆蓋廣泛終端?!盫inesh Sukumar博士表示。
那么,如何實(shí)現(xiàn)這一目標(biāo)?Vinesh Sukumar博士指出,首先取決于期望打造什么樣的用戶體驗。為此,高通致力于融合多種數(shù)據(jù)模態(tài)。這些數(shù)據(jù)模態(tài)可能基于圖像、音頻、文本、語音甚至視頻?;谶@些模態(tài)支持,可以理解用戶意圖,并匹配連接多個應(yīng)用以調(diào)用AI處理能力,從而滿足用戶需求。這催生了AI智能體概念。智能體AI側(cè)重于解讀需求并采取行動,從而走向自動化。雖然實(shí)現(xiàn)智能體體驗頗具挑戰(zhàn)性,但高通正在不斷強(qiáng)化基礎(chǔ)技術(shù)構(gòu)建,為這些智能體AI用例筑牢根基。
“我們可以推動包括娛樂、電商、禮賓服務(wù)、地圖導(dǎo)航甚至音樂等多種領(lǐng)域的智能體AI用例發(fā)展。為了實(shí)現(xiàn)這些目標(biāo),需要廣泛的邊緣側(cè)布局,能夠理解用戶需求且將其轉(zhuǎn)化為恰當(dāng)操作的強(qiáng)大軟件棧?!盫inesh Sukumar博士說。
據(jù)Vinesh Sukumar博士介紹,在將用戶意圖轉(zhuǎn)化為恰當(dāng)?shù)牟僮鲿r,總會出現(xiàn)某一設(shè)備可能無法回答或響應(yīng)用戶查詢(query)的情況。這時如果用戶需要進(jìn)行設(shè)備間通信,可以通過高通AI軟件棧來實(shí)現(xiàn)。高通的產(chǎn)品覆蓋廣泛的邊緣終端,涵蓋從手機(jī)到PC、XR等多種產(chǎn)品形態(tài),因此這對高通而言來說更容易。此外,憑借在這些終端上收集到的海量用戶數(shù)據(jù),也能更成功地解讀用戶意圖并采取行動。
Vinesh Sukumar博士還指出,智能體AI在進(jìn)行商用部署時也面臨許多挑戰(zhàn),比如智能體AI的準(zhǔn)確性、可預(yù)測性、一致性表現(xiàn),否能夠精準(zhǔn)匹配用戶需求等。為此,擁有必要的軟件棧支持至關(guān)重要。而高通AI軟件棧非常強(qiáng)大,經(jīng)過長期技術(shù)積累,可以支持針對特定任務(wù)的多種小語言模型。
其次,要實(shí)現(xiàn)更好的服務(wù)質(zhì)量意味著當(dāng)用戶提出特定提示(prompt)時,AI能夠以最快速度響應(yīng),這需要在硬件方面大力投入。為實(shí)現(xiàn)這一目標(biāo),高通打造了CPU、GPU等通用計算單元,以及Hexagon NPU這樣的專用加速器。
最后是如何實(shí)現(xiàn)規(guī)?;瘮U(kuò)展,為開發(fā)者社區(qū)提供靈活性。這一關(guān)鍵在于提供必要的工具和軟件支持,使開發(fā)者可以更輕松適應(yīng)不同的環(huán)境和情況。
“而我們已經(jīng)為這些需求打造了技術(shù)基礎(chǔ)設(shè)施。各位將在未來6個月內(nèi),看到更多來自高通的發(fā)布,將助力推出更豐富的面向消費(fèi)者的應(yīng)用?!盫inesh Sukumar博士說。
此外,在向AI推理時代邁進(jìn)之時,會面臨邊緣平臺因性能受限而無法解決用戶查詢(query)的問題。在這種情況下,如何確保用戶體驗不受影響?
Vinesh Sukumar博士表示,高通已經(jīng)將邊緣推理進(jìn)行了跨多個終端的分布式部署。如果某些查詢無法通過終端側(cè)算力解決,就轉(zhuǎn)而使用基于高通平臺的本地邊緣服務(wù)器來繼續(xù)查看、理解和回答查詢;如果本地邊緣平臺無法解決,AI會獲取用戶的上下文信息,然后將任務(wù)轉(zhuǎn)移到中央云子系統(tǒng),根據(jù)用戶的個人知識圖譜來處理查詢,然后給出更合理的回復(fù)。