巨頭的動(dòng)作,無(wú)疑是行業(yè)的真正風(fēng)向標(biāo)。繼騰訊調(diào)整組織架構(gòu)專攻AI產(chǎn)品之后,阿里也宣布未來(lái)三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過(guò)去十年的總和。AI的發(fā)令槍,已經(jīng)響了。
“領(lǐng)導(dǎo)都認(rèn)真了”
春節(jié)復(fù)工之后,在深圳一家傳統(tǒng)企業(yè)擔(dān)任行政崗位的棘棘,被通知她多了一項(xiàng)工作內(nèi)容:“用DeepSeek完成部分工作、提升工作效率,部門領(lǐng)導(dǎo)要求每周梳理上報(bào)AI工具使用成果?!?/p>
這讓她感到驚訝,“我們是傳統(tǒng)行業(yè),雖然之前有使用一些AI技術(shù),但是僅限于研發(fā)同事,沒(méi)有涉及到我們行政部。”棘棘為此犯起了嘀咕:“行政日常不過(guò)是收發(fā)快遞、貼發(fā)票、跑跑腿,有必要用AI嗎?”
但很快,她就意識(shí)到這一次公司領(lǐng)導(dǎo)層尤為認(rèn)真。據(jù)她透露,在短短幾天之內(nèi),公司迅速組建出一個(gè)“AI戰(zhàn)略部”,還從外部請(qǐng)來(lái)講師培訓(xùn)全體員工使用DeepSeek,并且要求所有部門按周提交成果。推行AI的力度也是前所未有——培訓(xùn)會(huì)上有領(lǐng)導(dǎo)講到,從下個(gè)月開(kāi)始,公司計(jì)劃逐步優(yōu)化掉部分可用AI替代掉的崗位人員。
在北京一家互聯(lián)網(wǎng)公司總部工作的秋然,也感受到了DeepSeek卷起的熱潮。
她向鳳凰網(wǎng)科技回憶道,節(jié)后復(fù)工約一星期后,公司向全體成員發(fā)送了一條通知,大意為:“請(qǐng)各位同學(xué)集思廣益,深入思考DeepSeek可能為業(yè)務(wù)帶來(lái)哪些促進(jìn),或者可以落地在什么場(chǎng)景中,并提交思考成果?!?/p>
技術(shù)支持部門的動(dòng)作很快,借助DeepSeek的開(kāi)源思路便搭建了一些工具。秋然稱:“我們作為互聯(lián)網(wǎng)公司,本身就有AI方面的能力儲(chǔ)備,而且業(yè)務(wù)形態(tài)已經(jīng)很成熟了,所以之前老板一直是非常謹(jǐn)慎的,不愿意刻意向外求、為了AI而AI?!?/p>
但DeepSeek打破了此前的所有猶疑,“聽(tīng)部門領(lǐng)導(dǎo)說(shuō),老板覺(jué)得如果此時(shí)不做動(dòng)作,可能就要在這一波里被甩下了?!鼻锶煌嘎?。
老板們的緊迫感不難理解,DeepSeek效果驚艷,這直接促進(jìn)了各家的決策。棘棘告訴鳳凰網(wǎng)科技,員工私下里悄悄交流,發(fā)現(xiàn)領(lǐng)導(dǎo)層都被DeepSeek的效果“震到了”,“之前ChatGPT、Claude發(fā)布的時(shí)候,公司也有小范圍讓業(yè)務(wù)同事試用過(guò),但都是各有各的‘智障’,過(guò)幾天就不提這事了?!?/p>
DeepSeek打破了這種對(duì)AI是“人工智障”的刻板印象,棘棘講道,據(jù)她從新成立的AI部門同事處了解,公司甚至還在考慮加大AI技術(shù)方面的投入。
如果說(shuō)小公司的判斷還有失誤的可能性,那么巨頭的動(dòng)作,無(wú)疑就是這個(gè)行業(yè)的真正風(fēng)向標(biāo)。
2月20日晚,阿里發(fā)布財(cái)報(bào),阿里集團(tuán)CEO吳泳銘在財(cái)報(bào)電話會(huì)上稱,“ AI時(shí)代對(duì)于基礎(chǔ)設(shè)施有明確而巨大的需求,將積極投資于AI基礎(chǔ)設(shè)施建設(shè),未來(lái)三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過(guò)去十年的總和?!?/p>
“阿里也正在AItoC業(yè)務(wù)層面大舉地招兵買馬”,一位與阿里有過(guò)接觸的候選人士對(duì)鳳凰網(wǎng)科技表示,“看得出來(lái),非常積極”。
就在幾天之前,騰訊同樣宣布組織架構(gòu)調(diào)整,主要針對(duì)AI產(chǎn)品線,繼騰訊元寶從TEG(技術(shù)工程事業(yè)群)轉(zhuǎn)入CSIG(騰訊云與產(chǎn)業(yè)事業(yè)群)之后,QQ瀏覽器、搜狗輸入法、ima等更多產(chǎn)品和應(yīng)用也會(huì)匯入CSIG。
騰訊也是這一輪最先接入DeepSeek的巨頭,微信在接入DeepSeek-R1后迅速掀起市場(chǎng)波瀾。
AI的發(fā)令槍,已經(jīng)響了。
狂歡與隱憂并存
盡管新涌入者很多,但身處其中的一些人并不感到意外,在蘇州一家智能制造企業(yè)擔(dān)任CTO的馮牧便是其中之一。
他告訴鳳凰網(wǎng)科技:“成本、技術(shù)、環(huán)境,各方面的因素共同造就了行業(yè)的狂歡。對(duì)很多我們這樣的企業(yè)而言,自己并沒(méi)有深厚的大模型研發(fā)能力,在產(chǎn)業(yè)革命的過(guò)程中是很被動(dòng)的,而DeepSeek開(kāi)源了這樣強(qiáng)大的模型,(為我們)提供的是一劑良藥、一個(gè)蕩平從0到1技術(shù)壁壘的方法論。”
如他所言,上游技術(shù)創(chuàng)新所帶來(lái)的利好自然流淌到了下游環(huán)節(jié)。但與此同時(shí),壓力也給到了與DeepSeek同處于基座大模型研發(fā)環(huán)節(jié)的友商。
同樣有著出色研究能力的企業(yè),開(kāi)始反思自己到底錯(cuò)過(guò)了什么。
DeepSeek V3與R1的最大功能亮點(diǎn),是尤為出眾的思維鏈(Long-CoT)能力。
月之暗面研究員Flood Sung透露,早在一年多以前,月之暗面聯(lián)合創(chuàng)始人周昕宇就已經(jīng)驗(yàn)證了長(zhǎng)思維鏈的有效性,但公司先意識(shí)到了長(zhǎng)文本(Long-Text)的重要性,以及考慮到成本問(wèn)題,讓Kimi選擇了優(yōu)先選擇攻關(guān)長(zhǎng)文本功能。
在DeepSeek爆火前,這一路線也完全沒(méi)有問(wèn)題。
2024年,月之暗面一度借長(zhǎng)文本成為國(guó)內(nèi)最炙手可熱的大模型創(chuàng)企,但長(zhǎng)文本的商業(yè)化場(chǎng)景始終不夠明朗,如今仍在探索過(guò)程中。
馮牧向鳳凰網(wǎng)科技解釋道:“你可以把長(zhǎng)思維鏈理解為對(duì)復(fù)雜問(wèn)題的解決能力,當(dāng)大模型擁有了推理思維,那么在編程、數(shù)學(xué)計(jì)算等等領(lǐng)域的應(yīng)用能力就會(huì)提升。這也是為什么DeepSeek要對(duì)標(biāo)OpenAI的o1大模型,后者也是一個(gè)標(biāo)榜思維能力的大模型。”
馮牧強(qiáng)調(diào)了o1與DeepSeek V3發(fā)布的時(shí)間差:“o1正式版是2024年12月初發(fā)布的,V3是12月末發(fā)布的,而這兩者的性能是可以掰手腕的。我們之前總說(shuō)國(guó)內(nèi)大模型和國(guó)外發(fā)展差了幾年,至少在這類模型方面,DeepSeek幫我們把差距抹平了一些?!?/p>
驚艷的效果,也讓DeepSeek迅速下沉,撬動(dòng)了過(guò)去任何一家大模型公司都沒(méi)能撬動(dòng)的用戶盤。
QuestMobile統(tǒng)計(jì)顯示,DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包,并于2月1日突破3000萬(wàn)大關(guān),成為史上最快達(dá)成這一里程碑的應(yīng)用。而隨著各大手機(jī)廠商、微信等企業(yè)官宣接入DeepSeek,流量瘋狂涌向后者的態(tài)勢(shì)還是有增無(wú)減。
這樣的背景之下,從互聯(lián)網(wǎng)時(shí)代沿襲而來(lái)的大力投放模式還有效嗎?鳳凰網(wǎng)科技詢問(wèn)百度、騰訊、昆侖萬(wàn)維等企業(yè),接下來(lái)是否考慮大模型產(chǎn)品調(diào)整投放策略,截至發(fā)文暫無(wú)回復(fù)。
但從數(shù)據(jù)中,或許可以看到市場(chǎng)的答案。
AppGrowing數(shù)據(jù)顯示,近日豆包App、Kimi等廣告投放量大幅減少,幾乎降低至近180天的最低水平。
圖|Kimi近180天廣告投放量級(jí)變化情況,圖源/AppGrowing
那些未被察覺(jué)的改變
數(shù)天之前,DeepSeek悄悄撤下了張貼在辦公樓下的LOGO。那是DeepSeek風(fēng)暴席卷而來(lái)半個(gè)月后,作為DeepSeek與英特爾、中金、德州儀器等公司共享的辦公所在地,北京的融科資訊中心意外成為一個(gè)景點(diǎn)。
DeepSeek猶如一條鯰魚(yú),攪動(dòng)市場(chǎng)。就連在DeepSeek樓上辦公的百度風(fēng)投,也無(wú)法躲避,被質(zhì)疑距離如此之近卻錯(cuò)過(guò)投資機(jī)會(huì)。引得百度風(fēng)投CEO高雪不得不親自下場(chǎng)回應(yīng),申明是對(duì)方無(wú)意外部融資。
盡管DeepSeek刻意低調(diào),但今天開(kāi)始,許多人的工作仍舊和DeepSeek密不可分了。
除了思維鏈模型,DeepSeek身上的獨(dú)特標(biāo)簽還有開(kāi)源模式和低算力需求。而這三點(diǎn)幾乎跳脫于國(guó)內(nèi)市場(chǎng)主流玩家押注的所有玩法,甚至重新定義了游戲規(guī)則。
原本固守閉源路線的百度,決定從4月1日零時(shí)起,允許所有PC端和APP端用戶免費(fèi)使用模型服務(wù),并且計(jì)劃從下一代模型起正式開(kāi)源。
作為長(zhǎng)思維鏈代名詞的“深度思考”功能,也開(kāi)始成為了諸多大模型主打的核心標(biāo)簽。無(wú)論是百度、阿里、字節(jié),還是科大訊飛、百川智能、月之暗面等AI企業(yè),從1月份開(kāi)始密集為旗下模型升級(jí)了深度思考能力。
該怎么看待DeepSeek另辟蹊徑給出的答案?
“沒(méi)有人敢下定義說(shuō)它就是對(duì)的,只能說(shuō)的確是一種不可忽視的創(chuàng)新?!盇I領(lǐng)域連續(xù)創(chuàng)業(yè)者、北京市朝陽(yáng)區(qū)一家AI大模型訓(xùn)練服務(wù)企業(yè)創(chuàng)始人這樣告訴鳳凰網(wǎng)科技。
“有關(guān)開(kāi)源還是閉源的模式,我也想過(guò)很久,最后得到的答案是這是囚徒困境——如果閉源,作為初創(chuàng)公司,有誰(shuí)會(huì)來(lái)用你的東西?你憑什么和大廠競(jìng)爭(zhēng)?所以初創(chuàng)公司只能開(kāi)源,但開(kāi)發(fā)者們肯定是唯效果論,那在DeepSeek之前,全球最好的開(kāi)源模型是海外的Llama,你該怎么追上Meta?”他講道,“所以我最開(kāi)始的預(yù)測(cè)是,國(guó)內(nèi)的大廠快速軍備競(jìng)賽,做出一些效果還不錯(cuò)的模型,然后開(kāi)源一部分,千行百業(yè)都集中用大廠的基座。”
這位創(chuàng)業(yè)者承認(rèn),自己并未預(yù)料到DeepSeek能在這場(chǎng)有關(guān)背景實(shí)力的競(jìng)賽中脫穎而出。如今就職于西二旗一家大廠,曾有硅谷工作背景的算法工程師,也表達(dá)了類似的情緒。
這股席卷了市場(chǎng)的“DeepSeek效應(yīng)”,還蔓延至產(chǎn)業(yè)鏈上游。
根據(jù)DeepSeek公開(kāi)相關(guān)論文中的表述,訓(xùn)練V3的僅僅使用了280萬(wàn)GPU小時(shí)。而按照OpenAI創(chuàng)始成員之一Andrej Karpathy解讀,作為對(duì)比,同等性能的模型訓(xùn)練成本卻是DeepSeek的十倍多(Llama 3 405B使用了3080萬(wàn)GPU小時(shí))。
正因如此,DeepSeek-V3與R1模型被譽(yù)為“有限算力下的美妙工程”,也引起了市場(chǎng)對(duì)持續(xù)已久的GPU淘金熱的反思。
DeepSeek發(fā)布后,全球GPU龍頭英偉達(dá)股價(jià)一度大跌,其中單日跌幅最大達(dá)到了17%。不過(guò)截至成文,英偉達(dá)股價(jià)已基本回升至本輪下跌前水平。
盡管如此,當(dāng)DeepSeek指出一條更經(jīng)濟(jì)的道路,下場(chǎng)玩家們還要不要繼續(xù)沉湎于這場(chǎng)有關(guān)算力資源的“無(wú)限戰(zhàn)爭(zhēng)”?接下來(lái)或許有人會(huì)給出更保守的答案。
(文中馮牧為化名)