月之暗面因DeepSeek調(diào)整工作重心？內(nèi)部人士：強(qiáng)化學(xué)習(xí)或許會是個方向

作者：愛集微 02-16 07:01

來源：新浪科技 #月之暗面# #DeepSeek#

1.5w

2月15日下午消息，據(jù)媒體報道，月之暗面內(nèi)部已經(jīng)將“持續(xù)拿到SOTA結(jié)果”確定為當(dāng)下最重要的工作目標(biāo)。2025年，月之暗面圍繞模型能力的關(guān)鍵方向除了繼續(xù)強(qiáng)化多模態(tài)部分外，還會繼續(xù)強(qiáng)化長文本推理能力。

報道分析稱，DeepSeek爆火后，DeepSeek與月之暗面存在的路線差異，讓外界面臨重新審視月之暗面技術(shù)模式、用戶增長模式的情況。其中，月之暗面閉源，堅持預(yù)訓(xùn)練（需要大量卡和算力資源），且不把蒸餾技術(shù)作為關(guān)鍵，在C端市場通過大量投流實(shí)現(xiàn)拉新；而DeepSeek則是開源，雖然也采取預(yù)訓(xùn)練，但把蒸餾技術(shù)作為關(guān)鍵手段大幅度節(jié)省成本，在C端市場并未投流。

而今，DeepSeek采用區(qū)別與月之暗面的路線，也取得了現(xiàn)階段更為出色的效果。業(yè)內(nèi)人士認(rèn)為，月之暗面如果想守住生態(tài)位，“需要做一些改變或者嘗試，比如開源，比如調(diào)整引流策略等?！辈贿^目前，月之暗面尚未明確是否“接入”DeepSeek，對于接下來是否“開源”，公司也未置評媒體問詢。

對于月之暗面是否會因DeepSeek而調(diào)整工作重心一事，新浪科技向月之暗面方面求證，截止發(fā)稿公司暫無回應(yīng)。不過有內(nèi)部人士透露稱，“RL（強(qiáng)化學(xué)習(xí)）大概率會是一個（工作重點(diǎn)）方向”。

作為此次DeepSeek出圈后最受關(guān)注的熱門技術(shù)話題，DeepSeek通過大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù)得到比肩OpenAI o1能力的DeepSeek-R1-Zero，令業(yè)界倍感興奮。新浪科技了解到，去年11月份月之暗面宣布推出新一代數(shù)學(xué)推理模型k0-math之際，Kimi探索版便通過運(yùn)用強(qiáng)化學(xué)習(xí)技術(shù)創(chuàng)新了搜索體驗(yàn)，在意圖增強(qiáng)、信源分析和鏈?zhǔn)剿伎既笸评砟芰ι蠈?shí)現(xiàn)突破。彼時，月之暗面Kimi創(chuàng)始人楊植麟便對強(qiáng)化學(xué)習(xí)這一技術(shù)路線帶來的模型能力提升給予了高度評價。

而在近日OpenAI發(fā)布關(guān)于推理模型在競技編程中應(yīng)用的研究論文報告《Competitive Programming with Large Reasoning Models》中，論文也特別提到，“中國的DeepSeek-R1和Kimi k1.5通過獨(dú)立研究顯示，利用思維鏈學(xué)習(xí)（COT）方法，可顯著提升模型在數(shù)學(xué)解題與編程挑戰(zhàn)中的綜合表現(xiàn)。其中k1.5便是DeepSeek和Kimi在1月20日同時發(fā)布的新型推理模型?！?/p>