亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

階躍星辰發(fā)布推理效率更高的基模Step 3,聯(lián)合近10家芯片廠商發(fā)起「模芯生態(tài)創(chuàng)新聯(lián)盟」

來(lái)源:愛集微 #階躍星辰#
3645

基礎(chǔ)大模型研發(fā)已步入深水區(qū),模型廠商和芯片廠商正通過(guò)聯(lián)合技術(shù)創(chuàng)新的模式,讓大模型和算力雙向?qū)崿F(xiàn)價(jià)值最大化,加速推動(dòng)大模型真正被各行各業(yè)用起來(lái)。

7 月 25 日,階躍星辰在上海召開「Step 3 大模型發(fā)布會(huì)暨生態(tài)聯(lián)盟成立大會(huì)」,會(huì)上階躍發(fā)布了新一代基礎(chǔ)大模型 Step 3,這款模型兼顧智能與效率,旨在面向推理時(shí)代打造最適合應(yīng)用的模型,將于7月31日面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻(xiàn)最強(qiáng)多模態(tài)推理模型。憑借系統(tǒng)和架構(gòu)創(chuàng)新,Step 3 實(shí)現(xiàn)了行業(yè)領(lǐng)先的推理解碼效率。根據(jù)原理分析,Step 3 在國(guó)產(chǎn)芯片上的推理效率最高可達(dá) DeepSeek-R1 的300%,且對(duì)所有芯片友好。在基于 NVIDIA Hopper 架構(gòu)的芯片進(jìn)行分布式推理時(shí),實(shí)測(cè) Step 3 相較于 DeepSeek-R1 的吞吐量提升超 70%。

值得關(guān)注的是,為了通過(guò)底層聯(lián)合創(chuàng)新提升大模型適配性和算力效率,階躍星辰聯(lián)合近 10 家芯片及基礎(chǔ)設(shè)施廠商發(fā)起「模芯生態(tài)創(chuàng)新聯(lián)盟」,打通芯片、模型和平臺(tái)全鏈路技術(shù)。該聯(lián)盟將為企業(yè)和開發(fā)者提供高效易用的大模型解決方案,加速應(yīng)用落地。該聯(lián)盟首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無(wú)問(wèn)芯穹、寒武紀(jì)、摩爾線程、硅基流動(dòng)等。目前,華為昇騰芯片已首先實(shí)現(xiàn) Step 3 的搭載和運(yùn)行。沐曦、天數(shù)智芯和燧原等也已初步實(shí)現(xiàn)運(yùn)行 Step 3。其它聯(lián)盟廠商的適配工作正在開展。

 面向推理時(shí)代,能否降低推理成本也是決定大模型應(yīng)用滲透率的關(guān)鍵問(wèn)題。業(yè)內(nèi)人士認(rèn)為,API 價(jià)格戰(zhàn)帶來(lái)的普及只有短期效應(yīng),要徹底推動(dòng) AI 技術(shù)惠民需要發(fā)展可持續(xù)模式,通過(guò)模型系統(tǒng)架構(gòu)創(chuàng)新是最本質(zhì)的解題思路?!改P旧鷳B(tài)創(chuàng)新聯(lián)盟」的發(fā)起,是模型、芯片、基礎(chǔ)設(shè)施全鏈路技術(shù)廠商協(xié)同探索創(chuàng)新的良好開始。Step 3 已經(jīng)通過(guò)開源技術(shù)報(bào)告,與全球開發(fā)者分享了大幅降低推理成本背后的系統(tǒng)架構(gòu)創(chuàng)新。

此外,本次 WAIC 期間,階躍亦升級(jí)了多模態(tài)模型,包括階躍首個(gè)多模理解生成一體化模型 Step 3o Vision,第二代端到端語(yǔ)音大模型 Step-Audio 2。目前,所有這些模型都可以在“階躍 AI”官網(wǎng)(stepfun.com)和“階躍 AI”App(應(yīng)用商店搜索下載)進(jìn)行體驗(yàn)。

責(zé)編: 愛集微
來(lái)源:愛集微 #階躍星辰#
THE END

*此內(nèi)容為集微網(wǎng)原創(chuàng),著作權(quán)歸集微網(wǎng)所有,愛集微,愛原創(chuàng)

關(guān)閉
加載

PDF 加載中...