3月1日,DeepSeek在其“開源周”第六日發(fā)布?jí)狠S成果,首次披露DeepSeek-V3/R1推理系統(tǒng)的核心技術(shù)細(xì)節(jié)與商業(yè)化數(shù)據(jù)。根據(jù)官方數(shù)據(jù),該系統(tǒng)理論成本利潤率高達(dá)545%。
DeepSeek統(tǒng)計(jì)了2月27日24點(diǎn)到2月28日24點(diǎn),計(jì)算出其每日總成本為87072美元(折合人民幣約63萬元)。如果所有Token都以DeepSeek-R1的價(jià)格計(jì)費(fèi),每日總收入將為562027美元(折合人民幣約409萬元),成本利潤率達(dá)到545%。這意味著,理論上DeepSeek每日凈賺474955美元(折合人民幣約346萬元)。
然而,實(shí)際情況卻大相徑庭,DeepSeek的收入出現(xiàn)大幅下滑。由于DeepSeek-V3定價(jià)低于R1;網(wǎng)頁端和應(yīng)用程序免費(fèi),只有部分服務(wù)有收入;非高峰時(shí)段還有夜間折扣,導(dǎo)致其實(shí)際收入遠(yuǎn)不及理論數(shù)值。
值得注意的是,DeepSeek還公布了DeepSeek-V3/R1推理系統(tǒng)技術(shù)“秘籍”概述,即為實(shí)現(xiàn)更高的推理吞吐量與更低延遲,研究人員采用了跨節(jié)點(diǎn)的專家咨詢(EP)。通過EP增大batch size、將通信延遲隱藏在計(jì)算之后,并執(zhí)行負(fù)載均衡,以此應(yīng)對(duì)EP帶來的系統(tǒng)復(fù)雜性挑戰(zhàn)。