在2025商湯技術(shù)交流日上,作為最懂大模型的AI基礎(chǔ)設(shè)施,商湯大裝置SenseCore 2.0全新升級,致力于為企業(yè)提供敏捷、靈活、可靠的全棧AI基礎(chǔ)設(shè)施服務(wù),以極致性價比推動大模型技術(shù)的高效落地與規(guī)?;瘧?yīng)用。
商湯大裝置還發(fā)布了面向具身智能、AIGC、AI4S(AI For Science)以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型的四大行業(yè)解決方案,更重磅推出1億元代金券計劃,為企業(yè)提供全流程AI服務(wù)支持,全棧賦能各行業(yè)智能化升級。
當(dāng)下,大模型產(chǎn)業(yè)正展現(xiàn)出三大全新趨勢,亟待AI基礎(chǔ)設(shè)施的全面升級。
隨著開源模型和工具逐漸成為主流,AI基礎(chǔ)設(shè)施需要與開源產(chǎn)品進(jìn)行深度集成與整合;性價比已成為大模型應(yīng)用的生死線,需要持續(xù)推動訓(xùn)練和推理成本的降低;多模態(tài)技術(shù)推動新一代智能終端與應(yīng)用場景的爆發(fā),企業(yè)亟需獲得從產(chǎn)品到場景的端到端全鏈路支持。
專為AI 2.0時代量身打造的商湯大裝置SenseCore 2.0,從技術(shù)突破、商業(yè)落地到生態(tài)協(xié)同等多個維度發(fā)力,助力大模型突破規(guī)?;瘧?yīng)用的卡點、堵點,創(chuàng)造增量價值。
商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆表示:“商湯大裝置SenseCore 2.0希望依托更敏捷、更靈活、更可靠的平臺能力,積極擁抱開源生態(tài),通過提供更高性價比的產(chǎn)品服務(wù)和一系列行業(yè)解決方案,將商湯多年積累的核心能力與生態(tài)伙伴的行業(yè)優(yōu)勢充分整合,為不同行業(yè)、不同場景的客戶提供貼身的解決方案,切實幫助客戶解決技術(shù)問題、產(chǎn)品問題和商業(yè)化問題,從而推動人工智能產(chǎn)業(yè)的長遠(yuǎn)發(fā)展。”
實現(xiàn)國產(chǎn)算力規(guī)?;逃茫嗄B(tài)推理成本持平大語言模型實現(xiàn)極性價比
性價比是大模型應(yīng)用的生死線。
目前AI產(chǎn)業(yè)發(fā)展面臨多重成本壓力:供應(yīng)鏈成本變化快導(dǎo)致算力供需波動大,國產(chǎn)芯片亦存在產(chǎn)能有限、種類繁多以及利用率較低等挑戰(zhàn);模型參數(shù)量的指數(shù)級增長,使訓(xùn)練成本持續(xù)增加;推理成本大幅下降帶動需求爆發(fā)增長,導(dǎo)致總算力消耗進(jìn)一步加劇。
商湯大裝置實現(xiàn)了異構(gòu)算力混合計算利用率和推理成本的顯著突破,以極致性價比幫助客戶更早突破成本限制。
在國產(chǎn)芯片方面,商湯大裝置異構(gòu)訓(xùn)練效率可達(dá)同構(gòu)訓(xùn)練的95%。商湯大裝置還聯(lián)合某頭部客戶進(jìn)行了大規(guī)模異構(gòu)混訓(xùn),基于異構(gòu)算力調(diào)度、自動并行策略、跨芯通信、自動容錯恢復(fù)等核心技術(shù),在5000張國產(chǎn)GPU集群上實現(xiàn)1個月穩(wěn)定異構(gòu)混訓(xùn),算力利用率達(dá)到80%,成功突破單一GPU限制,有力推動國產(chǎn)算力的規(guī)模化商用進(jìn)程。
另外,通過基礎(chǔ)設(shè)施、模型優(yōu)化和動態(tài)負(fù)載均衡優(yōu)化,商湯大裝置實現(xiàn)了多模態(tài)大模型推理成本與大語言模型持平。
同時在線推理性能較頭部廠商提升15%,離線推理Prefill階段實現(xiàn)提速5倍、Decode階段提速3.5倍,為大模型技術(shù)的應(yīng)用提供極致性價比的基礎(chǔ)設(shè)施服務(wù)。
擁抱開源,打造零成本、零門檻、零開發(fā)的一站式模型服務(wù)
數(shù)據(jù)顯示,開源模型能力已逼近閉源模型,這帶動了企業(yè)應(yīng)用需求快速涌現(xiàn)。商湯大裝置積極擁抱開源主流趨勢,通過OpenAPI兼容、K8S原生平臺適配、開源大模型托管服務(wù)、全棧開源工具鏈及豐富的開源組件等,實現(xiàn)了技術(shù)棧的無縫整合與敏捷迭代,滿足快速發(fā)展的技術(shù)棧應(yīng)用訴求。
面向不同客戶群體,商湯大裝置可提供“零成本遷移、零門檻使用、零開發(fā)部署”的一站式模型服務(wù)。
其中,極客創(chuàng)業(yè)團(tuán)隊可通過標(biāo)準(zhǔn)化的 k8s API直接對接商湯大裝置,完成應(yīng)用組件、日志、監(jiān)控等無縫遷移并實現(xiàn)彈性擴(kuò)展;應(yīng)用企業(yè)可在模型廣場中直接選擇DeepSeek等開源主流模型,一鍵部署和微調(diào),實現(xiàn)模型托管與零門檻使用;互聯(lián)網(wǎng)平臺企業(yè)則可借助 JuiceFS 緩存和 Volcano 優(yōu)化等技術(shù),提升開源方案在生產(chǎn)環(huán)境的穩(wěn)定性等。
四大行業(yè)解決方案亮相,從場景定義到業(yè)務(wù)落地全鏈路賦能
多模態(tài)大模型的突破,正快速激活各類新場景、新模式,比如席卷全球的GPT-4o“吉卜力風(fēng)”、形態(tài)各異的AI機(jī)器人等,激發(fā)行業(yè)大量跨模態(tài)能力需求。打通從產(chǎn)品到多模態(tài)場景的端到端行業(yè)解決方案,是AI 2.0時代新興行業(yè)加速技術(shù)落地,傳統(tǒng)行業(yè)實現(xiàn)數(shù)智升級的“快車道”。
此次,商湯大裝置面向具身智能、AIGC、AI4S以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型推出四大行業(yè)解決方案,針對不同行業(yè)客戶提供從場景定義到業(yè)務(wù)落地的全鏈路賦能,真正解決智能化落地最后一公里難題。
其中,具身智能解決方案能夠端到端賦能技術(shù)研發(fā),覆蓋數(shù)據(jù)生產(chǎn)、工具支撐及模型研發(fā)全流程。
針對具身智能數(shù)據(jù)生產(chǎn)需求,可提供"仿真+真機(jī)"雙通道,云上通過全棧工具鏈實現(xiàn)仿真數(shù)據(jù)生成、模型驗證;并依托商湯全國智算布局支持跨地域數(shù)據(jù)采集匯聚,實現(xiàn)分鐘級同步,并結(jié)合智能分級存儲有效控制成本。
會上,商湯與松應(yīng)科技簽署戰(zhàn)略合作協(xié)議,雙方將在數(shù)據(jù)仿真、研發(fā)管線、客戶服務(wù)層面展開全面合作。
重磅發(fā)放“1億元代金券”,全棧賦能AI場景落地
為加速 AI 全場景落地,商湯科技宣布重磅投入1億元專項代金券,聚焦具身智能、AIGC等多行業(yè),通過多維度的精準(zhǔn)扶持,為企業(yè)提供從專家咨詢到模型訓(xùn)練、推理驗證的全流程AI服務(wù)支持,打造"高效率、低成本、端到端"的一站式賦能方案。通過從技術(shù)、產(chǎn)品到服務(wù)的多層次支持,商湯大裝置希望助力各行業(yè)客戶加速推動大模型的商業(yè)化落地,推動中國人工智能產(chǎn)業(yè)繁榮發(fā)展。