微軟等美系云端服務(wù)供應(yīng)商(CSP)對AI需求雜音四起,中國AI大語言模型市場則從AI新創(chuàng)DeepSeek的R1橫空出世以來,更加百花齊放,阿里、騰訊等科技大廠持續(xù)加快模型推進(jìn)腳步,搶占市場話語權(quán)。
華爾街唱空AI前景,中國大語言模型競爭升溫,中國云端服務(wù)龍頭廠、阿里巴巴旗下阿里云,26日推出通義千問(Qwen)系列最新AI模型Qwen2.5-Omni-7B,號稱為「端對端多模態(tài)模型」,能在智能手機(jī)手機(jī)或筆電等終端設(shè)備運(yùn)行。
阿里云指出,即使Qwen2.5-Omni-7B使用70億個(gè)參數(shù),較月初發(fā)布的通義千問QwQ-32B參數(shù)量少78%,但依然可以提供「沒有妥協(xié)」的性能和多模態(tài)處理能力,有利開發(fā)靈活和具成本效益的AI代理。
騰訊21日也推出深度思考模型「混元T1」正式版,一次可處理大量數(shù)據(jù),號稱推理能力與DeepSeek的R1模型不相上下,且輸出價(jià)格僅為DeepSeek-R1標(biāo)準(zhǔn)時(shí)段的四分之一,試圖與DeepSeek隔空較勁。
DeepSeek也于24日釋出DeepSeek V3-0324模型更新,號稱較上個(gè)版本大幅改進(jìn),推理、網(wǎng)路開發(fā)及搜尋能力都更強(qiáng),還具備更強(qiáng)大的中文寫作能力和搜尋能力。