(6月20日,上海)近日,商湯科技與云知聲智能科技股份有限公司(以下簡稱“云知聲”)正式簽署戰(zhàn)略合作協(xié)議。雙方將基于各自領(lǐng)域的技術(shù)積累與資源優(yōu)勢,圍繞多模態(tài)大模型、行業(yè)應(yīng)用、智能終端等核心領(lǐng)域展開深度合作,探索大模型在垂直行業(yè)的落地實踐。通過模型能力的深度融合,雙方將在語音與視覺等多模態(tài)交互方面協(xié)同創(chuàng)新,為行業(yè)客戶提供更自然、更高效的智能交互體驗,加速智能技術(shù)的規(guī)?;涞?,推動多行業(yè)的智能化升級。
云知聲創(chuàng)始人&CEO黃偉(后排左二)和商湯科技董事長&CEO徐立(后排左三)見證簽約
隨著AI的快速發(fā)展與深度賦能各行各業(yè),多模態(tài)模型逐漸邁向舞臺中央,通過更廣泛、更深度的信息交互與整合,可以為用戶更完整的場景價值。從海外的Gemini 2.5、GPT 4.5到國內(nèi)商湯日日新大模型、云知聲山海大模型等,均可見產(chǎn)業(yè)界持續(xù)提升原生多模態(tài)能力。讓大模型能夠有思考,具備處理復(fù)雜信息和解決復(fù)雜問題能力,融入真實的業(yè)務(wù)應(yīng)用;同時,讓大模型以更有親和力的方式與人交互,與人共情、實時互動,是大模型發(fā)展和商業(yè)落地并行的兩個關(guān)鍵方向。
作為亞洲領(lǐng)先的人工智能軟件公司,商湯科技專注于原創(chuàng)技術(shù)研發(fā),不斷增強(qiáng)行業(yè)領(lǐng)先的多模態(tài)、多任務(wù)人工智能能力,涵蓋感知智能、自然語言處理、智慧內(nèi)容生成等關(guān)鍵技術(shù)領(lǐng)域,同時包含AI芯片、AI傳感器及AI算力基礎(chǔ)設(shè)施在內(nèi)的關(guān)鍵能力。今年4月,商湯重磅推出全新升級的原生多模態(tài)通用大模型日日新 SenseNova V6,通過多模態(tài)長思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)的技術(shù)突破,形成領(lǐng)先的多模態(tài)推理能力,并突破成本邊界。日日新V6采用了 6000 億參數(shù)的混合專家架構(gòu),實現(xiàn)文本、圖像和視頻的原生融合,并可進(jìn)行視頻-語音交融的端到端輸入輸出,在純文本和多模態(tài)任務(wù)上都表現(xiàn)出優(yōu)秀的綜合性能。目前,日日新大模型已廣泛賦能金融、智能汽車、具身智能、AI教育、智能辦公等領(lǐng)域。
云知聲成立于2012年,是最早將深度學(xué)習(xí)算法應(yīng)用于商業(yè)語音識別的公司之一,也是國內(nèi)AGI技術(shù)的先行者,始終深耕AI領(lǐng)域前沿,逐步構(gòu)建起涵蓋大模型技術(shù)、多模態(tài)交互技術(shù)、AI芯片、領(lǐng)域知識圖譜等在內(nèi)的全棧式AI硬核技術(shù)體系,并成功將技術(shù)成果應(yīng)用于醫(yī)療、交通、家居等多個實體場景。其自主研發(fā)的“山海大模型”通用能力位居世界前列,在醫(yī)療等領(lǐng)域的專業(yè)能力更是達(dá)到世界領(lǐng)先水平,同時還拓展出文生圖、音圖問答等多模態(tài)交互能力,大幅拓寬應(yīng)用邊界。以“山海大模型”為核心,云知聲打造的行業(yè)智能體已廣泛應(yīng)用于輔助診療、醫(yī)保核賠、智慧座艙等垂直領(lǐng)域。