DeepSeek讓騰訊阿里重新上桌了

作者：集小微 02-23 11:15

來(lái)源：鳳凰網(wǎng) #騰訊# #阿里# #DeepSeek#

1.4w

巨頭的動(dòng)作，無(wú)疑是行業(yè)的真正風(fēng)向標(biāo)。繼騰訊調(diào)整組織架構(gòu)專攻AI產(chǎn)品之后，阿里也宣布未來(lái)三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過(guò)去十年的總和。AI的發(fā)令槍，已經(jīng)響了。

“領(lǐng)導(dǎo)都認(rèn)真了”

春節(jié)復(fù)工之后，在深圳一家傳統(tǒng)企業(yè)擔(dān)任行政崗位的棘棘，被通知她多了一項(xiàng)工作內(nèi)容：“用DeepSeek完成部分工作、提升工作效率，部門領(lǐng)導(dǎo)要求每周梳理上報(bào)AI工具使用成果?！?/p>

這讓她感到驚訝，“我們是傳統(tǒng)行業(yè)，雖然之前有使用一些AI技術(shù)，但是僅限于研發(fā)同事，沒(méi)有涉及到我們行政部。”棘棘為此犯起了嘀咕：“行政日常不過(guò)是收發(fā)快遞、貼發(fā)票、跑跑腿，有必要用AI嗎？”

但很快，她就意識(shí)到這一次公司領(lǐng)導(dǎo)層尤為認(rèn)真。據(jù)她透露，在短短幾天之內(nèi)，公司迅速組建出一個(gè)“AI戰(zhàn)略部”，還從外部請(qǐng)來(lái)講師培訓(xùn)全體員工使用DeepSeek，并且要求所有部門按周提交成果。推行AI的力度也是前所未有——培訓(xùn)會(huì)上有領(lǐng)導(dǎo)講到，從下個(gè)月開(kāi)始，公司計(jì)劃逐步優(yōu)化掉部分可用AI替代掉的崗位人員。

在北京一家互聯(lián)網(wǎng)公司總部工作的秋然，也感受到了DeepSeek卷起的熱潮。

她向鳳凰網(wǎng)科技回憶道，節(jié)后復(fù)工約一星期后，公司向全體成員發(fā)送了一條通知，大意為：“請(qǐng)各位同學(xué)集思廣益，深入思考DeepSeek可能為業(yè)務(wù)帶來(lái)哪些促進(jìn)，或者可以落地在什么場(chǎng)景中，并提交思考成果?！?/p>

技術(shù)支持部門的動(dòng)作很快，借助DeepSeek的開(kāi)源思路便搭建了一些工具。秋然稱：“我們作為互聯(lián)網(wǎng)公司，本身就有AI方面的能力儲(chǔ)備，而且業(yè)務(wù)形態(tài)已經(jīng)很成熟了，所以之前老板一直是非常謹(jǐn)慎的，不愿意刻意向外求、為了AI而AI?！?/p>

但DeepSeek打破了此前的所有猶疑，“聽(tīng)部門領(lǐng)導(dǎo)說(shuō)，老板覺(jué)得如果此時(shí)不做動(dòng)作，可能就要在這一波里被甩下了?！鼻锶煌嘎?。

老板們的緊迫感不難理解，DeepSeek效果驚艷，這直接促進(jìn)了各家的決策。棘棘告訴鳳凰網(wǎng)科技，員工私下里悄悄交流，發(fā)現(xiàn)領(lǐng)導(dǎo)層都被DeepSeek的效果“震到了”，“之前ChatGPT、Claude發(fā)布的時(shí)候，公司也有小范圍讓業(yè)務(wù)同事試用過(guò)，但都是各有各的‘智障’，過(guò)幾天就不提這事了?！?/p>

DeepSeek打破了這種對(duì)AI是“人工智障”的刻板印象，棘棘講道，據(jù)她從新成立的AI部門同事處了解，公司甚至還在考慮加大AI技術(shù)方面的投入。

如果說(shuō)小公司的判斷還有失誤的可能性，那么巨頭的動(dòng)作，無(wú)疑就是這個(gè)行業(yè)的真正風(fēng)向標(biāo)。

2月20日晚，阿里發(fā)布財(cái)報(bào)，阿里集團(tuán)CEO吳泳銘在財(cái)報(bào)電話會(huì)上稱，“ AI時(shí)代對(duì)于基礎(chǔ)設(shè)施有明確而巨大的需求，將積極投資于AI基礎(chǔ)設(shè)施建設(shè)，未來(lái)三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過(guò)去十年的總和?！?/p>

“阿里也正在AItoC業(yè)務(wù)層面大舉地招兵買馬”，一位與阿里有過(guò)接觸的候選人士對(duì)鳳凰網(wǎng)科技表示，“看得出來(lái)，非常積極”。

就在幾天之前，騰訊同樣宣布組織架構(gòu)調(diào)整，主要針對(duì)AI產(chǎn)品線，繼騰訊元寶從TEG（技術(shù)工程事業(yè)群）轉(zhuǎn)入CSIG（騰訊云與產(chǎn)業(yè)事業(yè)群）之后，QQ瀏覽器、搜狗輸入法、ima等更多產(chǎn)品和應(yīng)用也會(huì)匯入CSIG。

騰訊也是這一輪最先接入DeepSeek的巨頭，微信在接入DeepSeek-R1后迅速掀起市場(chǎng)波瀾。

AI的發(fā)令槍，已經(jīng)響了。

狂歡與隱憂并存

盡管新涌入者很多，但身處其中的一些人并不感到意外，在蘇州一家智能制造企業(yè)擔(dān)任CTO的馮牧便是其中之一。

他告訴鳳凰網(wǎng)科技：“成本、技術(shù)、環(huán)境，各方面的因素共同造就了行業(yè)的狂歡。對(duì)很多我們這樣的企業(yè)而言，自己并沒(méi)有深厚的大模型研發(fā)能力，在產(chǎn)業(yè)革命的過(guò)程中是很被動(dòng)的，而DeepSeek開(kāi)源了這樣強(qiáng)大的模型，（為我們）提供的是一劑良藥、一個(gè)蕩平從0到1技術(shù)壁壘的方法論。”

如他所言，上游技術(shù)創(chuàng)新所帶來(lái)的利好自然流淌到了下游環(huán)節(jié)。但與此同時(shí)，壓力也給到了與DeepSeek同處于基座大模型研發(fā)環(huán)節(jié)的友商。

同樣有著出色研究能力的企業(yè)，開(kāi)始反思自己到底錯(cuò)過(guò)了什么。

DeepSeek V3與R1的最大功能亮點(diǎn)，是尤為出眾的思維鏈（Long-CoT）能力。

月之暗面研究員Flood Sung透露，早在一年多以前，月之暗面聯(lián)合創(chuàng)始人周昕宇就已經(jīng)驗(yàn)證了長(zhǎng)思維鏈的有效性，但公司先意識(shí)到了長(zhǎng)文本（Long-Text）的重要性，以及考慮到成本問(wèn)題，讓Kimi選擇了優(yōu)先選擇攻關(guān)長(zhǎng)文本功能。

在DeepSeek爆火前，這一路線也完全沒(méi)有問(wèn)題。

2024年，月之暗面一度借長(zhǎng)文本成為國(guó)內(nèi)最炙手可熱的大模型創(chuàng)企，但長(zhǎng)文本的商業(yè)化場(chǎng)景始終不夠明朗，如今仍在探索過(guò)程中。

馮牧向鳳凰網(wǎng)科技解釋道：“你可以把長(zhǎng)思維鏈理解為對(duì)復(fù)雜問(wèn)題的解決能力，當(dāng)大模型擁有了推理思維，那么在編程、數(shù)學(xué)計(jì)算等等領(lǐng)域的應(yīng)用能力就會(huì)提升。這也是為什么DeepSeek要對(duì)標(biāo)OpenAI的o1大模型，后者也是一個(gè)標(biāo)榜思維能力的大模型。”

馮牧強(qiáng)調(diào)了o1與DeepSeek V3發(fā)布的時(shí)間差：“o1正式版是2024年12月初發(fā)布的，V3是12月末發(fā)布的，而這兩者的性能是可以掰手腕的。我們之前總說(shuō)國(guó)內(nèi)大模型和國(guó)外發(fā)展差了幾年，至少在這類模型方面，DeepSeek幫我們把差距抹平了一些?！?/p>

驚艷的效果，也讓DeepSeek迅速下沉，撬動(dòng)了過(guò)去任何一家大模型公司都沒(méi)能撬動(dòng)的用戶盤。

QuestMobile統(tǒng)計(jì)顯示，DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包，并于2月1日突破3000萬(wàn)大關(guān)，成為史上最快達(dá)成這一里程碑的應(yīng)用。而隨著各大手機(jī)廠商、微信等企業(yè)官宣接入DeepSeek，流量瘋狂涌向后者的態(tài)勢(shì)還是有增無(wú)減。

這樣的背景之下，從互聯(lián)網(wǎng)時(shí)代沿襲而來(lái)的大力投放模式還有效嗎？鳳凰網(wǎng)科技詢問(wèn)百度、騰訊、昆侖萬(wàn)維等企業(yè)，接下來(lái)是否考慮大模型產(chǎn)品調(diào)整投放策略，截至發(fā)文暫無(wú)回復(fù)。

但從數(shù)據(jù)中，或許可以看到市場(chǎng)的答案。

AppGrowing數(shù)據(jù)顯示，近日豆包App、Kimi等廣告投放量大幅減少，幾乎降低至近180天的最低水平。

圖｜Kimi近180天廣告投放量級(jí)變化情況，圖源/AppGrowing

那些未被察覺(jué)的改變

數(shù)天之前，DeepSeek悄悄撤下了張貼在辦公樓下的LOGO。那是DeepSeek風(fēng)暴席卷而來(lái)半個(gè)月后，作為DeepSeek與英特爾、中金、德州儀器等公司共享的辦公所在地，北京的融科資訊中心意外成為一個(gè)景點(diǎn)。

DeepSeek猶如一條鯰魚(yú)，攪動(dòng)市場(chǎng)。就連在DeepSeek樓上辦公的百度風(fēng)投，也無(wú)法躲避，被質(zhì)疑距離如此之近卻錯(cuò)過(guò)投資機(jī)會(huì)。引得百度風(fēng)投CEO高雪不得不親自下場(chǎng)回應(yīng)，申明是對(duì)方無(wú)意外部融資。

盡管DeepSeek刻意低調(diào)，但今天開(kāi)始，許多人的工作仍舊和DeepSeek密不可分了。

除了思維鏈模型，DeepSeek身上的獨(dú)特標(biāo)簽還有開(kāi)源模式和低算力需求。而這三點(diǎn)幾乎跳脫于國(guó)內(nèi)市場(chǎng)主流玩家押注的所有玩法，甚至重新定義了游戲規(guī)則。

原本固守閉源路線的百度，決定從4月1日零時(shí)起，允許所有PC端和APP端用戶免費(fèi)使用模型服務(wù)，并且計(jì)劃從下一代模型起正式開(kāi)源。

作為長(zhǎng)思維鏈代名詞的“深度思考”功能，也開(kāi)始成為了諸多大模型主打的核心標(biāo)簽。無(wú)論是百度、阿里、字節(jié)，還是科大訊飛、百川智能、月之暗面等AI企業(yè)，從1月份開(kāi)始密集為旗下模型升級(jí)了深度思考能力。

該怎么看待DeepSeek另辟蹊徑給出的答案？

“沒(méi)有人敢下定義說(shuō)它就是對(duì)的，只能說(shuō)的確是一種不可忽視的創(chuàng)新?！盇I領(lǐng)域連續(xù)創(chuàng)業(yè)者、北京市朝陽(yáng)區(qū)一家AI大模型訓(xùn)練服務(wù)企業(yè)創(chuàng)始人這樣告訴鳳凰網(wǎng)科技。

“有關(guān)開(kāi)源還是閉源的模式，我也想過(guò)很久，最后得到的答案是這是囚徒困境——如果閉源，作為初創(chuàng)公司，有誰(shuí)會(huì)來(lái)用你的東西？你憑什么和大廠競(jìng)爭(zhēng)？所以初創(chuàng)公司只能開(kāi)源，但開(kāi)發(fā)者們肯定是唯效果論，那在DeepSeek之前，全球最好的開(kāi)源模型是海外的Llama，你該怎么追上Meta？”他講道，“所以我最開(kāi)始的預(yù)測(cè)是，國(guó)內(nèi)的大廠快速軍備競(jìng)賽，做出一些效果還不錯(cuò)的模型，然后開(kāi)源一部分，千行百業(yè)都集中用大廠的基座。”

這位創(chuàng)業(yè)者承認(rèn)，自己并未預(yù)料到DeepSeek能在這場(chǎng)有關(guān)背景實(shí)力的競(jìng)賽中脫穎而出。如今就職于西二旗一家大廠，曾有硅谷工作背景的算法工程師，也表達(dá)了類似的情緒。

這股席卷了市場(chǎng)的“DeepSeek效應(yīng)”，還蔓延至產(chǎn)業(yè)鏈上游。

根據(jù)DeepSeek公開(kāi)相關(guān)論文中的表述，訓(xùn)練V3的僅僅使用了280萬(wàn)GPU小時(shí)。而按照OpenAI創(chuàng)始成員之一Andrej Karpathy解讀，作為對(duì)比，同等性能的模型訓(xùn)練成本卻是DeepSeek的十倍多（Llama 3 405B使用了3080萬(wàn)GPU小時(shí)）。

正因如此，DeepSeek-V3與R1模型被譽(yù)為“有限算力下的美妙工程”，也引起了市場(chǎng)對(duì)持續(xù)已久的GPU淘金熱的反思。

DeepSeek發(fā)布后，全球GPU龍頭英偉達(dá)股價(jià)一度大跌，其中單日跌幅最大達(dá)到了17%。不過(guò)截至成文，英偉達(dá)股價(jià)已基本回升至本輪下跌前水平。

盡管如此，當(dāng)DeepSeek指出一條更經(jīng)濟(jì)的道路，下場(chǎng)玩家們還要不要繼續(xù)沉湎于這場(chǎng)有關(guān)算力資源的“無(wú)限戰(zhàn)爭(zhēng)”？接下來(lái)或許有人會(huì)給出更保守的答案。

（文中馮牧為化名）