大道至簡(jiǎn),大巧不工。最根本最具價(jià)值的問(wèn)題,往往樸素平凡。
袁隆平,畢生研究一個(gè)問(wèn)題——水稻產(chǎn)量。這是伴隨人類幾千年的古老問(wèn)題,不新奇,不性感;就連高考招生,都難找到自愿選擇研究這個(gè)古老問(wèn)題的年輕人。盡管,誰(shuí)都明白一個(gè)簡(jiǎn)單的道理——每畝水稻單產(chǎn)哪怕只提高10%,都意味著同樣的地球資源可以多養(yǎng)活10%的人口,價(jià)值難以估量。
那么,這個(gè)眾所周知也是極具價(jià)值的問(wèn)題,為什么偏偏難以吸引眾人的興趣呢?原因同樣可以理解,一個(gè)字,難。既然是研究了幾千年的重要問(wèn)題,要是有什么容易想到的好方法好技術(shù),只怕早已被人研究過(guò)了,投資過(guò)了,輪不到自己吧?不看也罷,還是看看新東西,大概更有機(jī)會(huì)。趨利避害,畏難取巧,在商業(yè)的世界里也不妨稱為理性,代表人群中99%的主流思維邏輯。
然而,世界往往恰是由并非如此這般理性的那1%人群推動(dòng)的。SpaceX這種常人不敢、不信、不肯、不能做的重大科技創(chuàng)新,如果沒有其創(chuàng)始人和放棄其它選擇投身其中的精英人才,可能很長(zhǎng)時(shí)間內(nèi)都不會(huì)有其他人敢于、能夠做這些事情。所以,是Elon Musk們,是特斯拉們,是愛因斯坦們,才真正改變了世界。
HBO美劇《硅谷》截圖
先后播出六季的HBO高分人氣美劇《硅谷》,演繹的正是這樣一個(gè)大巧不工改變世界的IT創(chuàng)業(yè)故事。主人公Richard,木訥靦腆,拙于言談,單身宅男一枚;做起計(jì)算機(jī)技術(shù)來(lái),卻是一位奇思妙想腦洞大開不走尋常路的科技達(dá)人。他的創(chuàng)業(yè)項(xiàng)目PiedPiper不是什么追風(fēng)新潮的熱門概念,而是埋頭突破了一個(gè)無(wú)人問(wèn)津的古老經(jīng)典問(wèn)題——數(shù)據(jù)壓縮。數(shù)據(jù)壓縮比例哪怕只提高10%,就意味著整個(gè)人類數(shù)字世界的存儲(chǔ)、傳輸成本降低10%。這是與水稻單產(chǎn)提高10%類似的基礎(chǔ)技術(shù)進(jìn)步。正是憑借數(shù)據(jù)壓縮技術(shù)的突破,PiedPiper先后突破了存儲(chǔ)、VR、視頻等一系列想象空間巨大的下游產(chǎn)業(yè),并最終催生了革命性的去中心化新一代互聯(lián)網(wǎng)。
美劇《硅谷》贏得了高分人氣,而現(xiàn)實(shí)中的IT產(chǎn)業(yè)在觀劇調(diào)侃之余,依舊波瀾不興。究其原因,數(shù)據(jù)壓縮技術(shù)的價(jià)值毋庸贅言,然而說(shuō)起來(lái)容易,做起來(lái)難。全球芯片產(chǎn)業(yè)巨頭Intel推出了數(shù)據(jù)壓縮功能芯片,國(guó)內(nèi)IT產(chǎn)業(yè)排頭兵華為研制了數(shù)據(jù)壓縮功能芯片并作為大數(shù)據(jù)、存儲(chǔ)領(lǐng)域的服務(wù)器整機(jī)產(chǎn)品亮點(diǎn)技術(shù)隆重推出,世界電子產(chǎn)業(yè)領(lǐng)頭羊三星在SSD產(chǎn)品中集成了數(shù)據(jù)壓縮功能芯片……甚至,就連上述產(chǎn)業(yè)巨頭的下游客戶,例如BAT這類互聯(lián)網(wǎng)巨頭企業(yè),研發(fā)實(shí)力強(qiáng)的也干脆自己研發(fā)起了數(shù)據(jù)壓縮功能芯片,中國(guó)就有不止一家這樣的互聯(lián)網(wǎng)巨頭企業(yè)。意在數(shù)據(jù)壓縮芯片技術(shù)的產(chǎn)業(yè)陣容不可謂不強(qiáng)大,然而十年下來(lái),并未取得實(shí)質(zhì)性突破,瓶頸依舊。以上述巨頭所用的開源壓縮算法Gzip為例,代表壓縮倍數(shù)的總共9個(gè)壓縮等級(jí),歷經(jīng)十年努力,上述巨頭研發(fā)的數(shù)據(jù)壓縮芯片通常不超過(guò)最低等級(jí)1和2,甚至連這都達(dá)不到。
在科技行業(yè),歷經(jīng)多年才有一波技術(shù)突破是常有的事情,越是跨越時(shí)代的經(jīng)典技術(shù)問(wèn)題,越是如此。如今炙手可熱的人工智能領(lǐng)域,曾經(jīng)沉寂了二三十年的漫長(zhǎng)低谷,近年才終于迎來(lái)深度學(xué)習(xí)技術(shù)的突破?,F(xiàn)在,美劇《硅谷》中突破一系列行業(yè)邊界的數(shù)據(jù)壓縮技術(shù),也開始在一家中國(guó)科技創(chuàng)業(yè)公司走進(jìn)現(xiàn)實(shí)。
2020年,注定是一個(gè)不平凡的年份,對(duì)于DataBox和它所在的行業(yè)來(lái)說(shuō)也是如此。一份DataBox VS Intel的Gzip對(duì)比測(cè)試數(shù)據(jù)顯示,在行業(yè)標(biāo)準(zhǔn)數(shù)據(jù)集和客戶業(yè)務(wù)數(shù)據(jù)集上,DataBox實(shí)現(xiàn)的數(shù)據(jù)壓縮倍數(shù)最高可達(dá)Intel的2.09倍。實(shí)際上,DataBox不僅大幅超越了Intel數(shù)據(jù)壓縮芯片的技術(shù)水平,甚至也超越了行業(yè)標(biāo)準(zhǔn)最高壓縮等級(jí)9。在不止一位來(lái)自BAT級(jí)別產(chǎn)業(yè)巨頭的技術(shù)專家看來(lái),這個(gè)結(jié)果給人的第一感覺是“反常識(shí)”的。從常理邏輯分析,Gzip壓縮算法需要耗費(fèi)極高的計(jì)算代價(jià)才能實(shí)現(xiàn)最高壓縮等級(jí)9,無(wú)論軟件還是芯片都無(wú)法承受,因此一直以來(lái)都停留在理論上,產(chǎn)業(yè)實(shí)戰(zhàn)中無(wú)法使用。尤其是對(duì)于芯片設(shè)計(jì)來(lái)說(shuō),由于芯片上的電路資源非常有限,又必須實(shí)現(xiàn)非常高的處理速度,只能進(jìn)行相對(duì)簡(jiǎn)單的處理,從而只能實(shí)現(xiàn)低等級(jí)的壓縮效果。研發(fā)數(shù)據(jù)壓縮芯片的產(chǎn)業(yè)巨頭,皆受困于此。DataBox能設(shè)計(jì)芯片實(shí)現(xiàn)超越Gzip最高等級(jí)9的壓縮效果,這是顛覆上述常理邏輯的。
但這不僅是事實(shí),甚至實(shí)際上并不是DataBox數(shù)據(jù)壓縮芯片技術(shù)的最高水平。設(shè)定必須兼容開源Gzip壓縮算法,理論上明顯限制了DataBox的芯片設(shè)計(jì)空間。排除這個(gè)兼容限制,DataBox數(shù)據(jù)壓縮芯片的壓縮倍數(shù)還能進(jìn)一步提升。在上述行業(yè)標(biāo)準(zhǔn)數(shù)據(jù)集和客戶業(yè)務(wù)數(shù)據(jù)集上,DataBox非兼容芯片實(shí)現(xiàn)的數(shù)據(jù)壓縮倍數(shù)最高可達(dá)Intel的3.66倍!
還記得文章開頭關(guān)于水稻單產(chǎn)提高10%的比喻嗎?這些數(shù)字背后的價(jià)值與意義不言而喻。
憑借卓越的數(shù)據(jù)壓縮技術(shù),美劇《硅谷》中的PiedPiper重塑了存儲(chǔ)、VR、視頻等一系列下游產(chǎn)業(yè)?,F(xiàn)在,這個(gè)劇情正在DataBox走進(jìn)現(xiàn)實(shí)。作為其中一個(gè)目標(biāo)應(yīng)用行業(yè),DataBox瞄準(zhǔn)了近年興起的In-Storage Computing領(lǐng)域,也稱為Computational Storage,中文可翻譯為“存算一體”、“近存計(jì)算”或“可計(jì)算存儲(chǔ)”。其產(chǎn)品形態(tài)是把計(jì)算器件(e.g. FPGA)與存儲(chǔ)器件(e.g. SSD)集成在一塊板子上,直接在FPGA上就近對(duì)SSD存儲(chǔ)的數(shù)據(jù)進(jìn)行處理,而不必通過(guò)外部數(shù)據(jù)總線(e.g. PCIE)送到CPU處理完畢再送回SSD存儲(chǔ),從而提升整體效率。有的廠商如三星把這個(gè)產(chǎn)品形態(tài)稱之為Smart SSD。數(shù)據(jù)壓縮正是三星Smart SSD標(biāo)配的數(shù)據(jù)處理功能,通過(guò)對(duì)數(shù)據(jù)進(jìn)行壓縮后再存儲(chǔ),可允許用戶實(shí)際存儲(chǔ)數(shù)倍于SSD物理容量的數(shù)據(jù)。假設(shè)三星Smart SSD可實(shí)現(xiàn)3倍數(shù)據(jù)壓縮,8TB物理容量的Smart SSD即可存儲(chǔ)24TB的用戶數(shù)據(jù)。按照一塊8TB物理容量的普通SSD硬盤價(jià)值10000元計(jì)算,同等物理容量的三星Smart SSD可給用戶提供價(jià)值30000元的實(shí)際存儲(chǔ)容量。如果售價(jià)20000元,客戶相比采用普通SSD硬盤可節(jié)省10000元;FPGA成本按照2000元計(jì)算,每塊三星Smart SSD可比普通SSD硬盤多收獲8000元利潤(rùn),與客戶實(shí)現(xiàn)雙贏。
三星Smart SSD資料圖
據(jù)透露,DataBox將發(fā)布一款Smart SSD產(chǎn)品,內(nèi)部集成DataBox數(shù)據(jù)壓縮芯片技術(shù),可以用同樣的SSD物理容量提供比行業(yè)現(xiàn)有產(chǎn)品更大的實(shí)際存儲(chǔ)容量,存儲(chǔ)性價(jià)比極具優(yōu)勢(shì)。即使只按照4倍數(shù)據(jù)壓縮計(jì)算,一塊8TB物理容量的DataBox Smart SSD可給用戶提供相當(dāng)于32TB = 40000元的實(shí)際存儲(chǔ)容量。假設(shè)一家企業(yè)客戶需要采購(gòu)部署24PB實(shí)際存儲(chǔ)容量,可采用1000塊三星Smart SSD或750塊DataBox Smart SSD。如果DataBox單價(jià)16000元,客戶總采購(gòu)成本1200萬(wàn)元,與三星單價(jià)12000元的總采購(gòu)成本相當(dāng)。DataBox每塊硬盤可收獲4000元利潤(rùn),與客戶實(shí)現(xiàn)雙贏。三星則已無(wú)利可圖。
如果DataBox為了奪取市場(chǎng)主導(dǎo)地位,適當(dāng)放棄一部分利潤(rùn),單價(jià)降低到15000元以內(nèi),那么三星即使不賺錢,產(chǎn)品性價(jià)比也將敗給DataBox,而DataBox每塊SSD硬盤仍可獲得3000元利潤(rùn)。DataBox這家初創(chuàng)核心業(yè)務(wù)并非Smart SSD的中國(guó)芯片設(shè)計(jì)企業(yè),將憑借核心芯片技術(shù)優(yōu)勢(shì)對(duì)三星這樣的全球產(chǎn)業(yè)巨頭乃至Smart SSD這個(gè)行業(yè)進(jìn)行顛覆性“降維打擊”。
DataBox成立5年很少露面,最近一次見諸媒體還是一年多前,DataBox的另一門類產(chǎn)品——大數(shù)據(jù)專用芯片硬件加速解決方案——被中國(guó)聯(lián)通首次正式商用的時(shí)候。這也是中國(guó)電信運(yùn)營(yíng)商行業(yè)從0到1首次采用這個(gè)芯片新品類。經(jīng)過(guò)至今長(zhǎng)達(dá)一年的商用運(yùn)行,部署的客戶大數(shù)據(jù)集群平穩(wěn)運(yùn)行,順利完成整體驗(yàn)收。(大數(shù)據(jù)芯片千億風(fēng)口來(lái)臨,中國(guó)“芯”DataBox技?jí)喝蚓揞^奪得電信業(yè)首單)除了2019年完成估值達(dá)5億美金的一輪融資之外,外界對(duì)這家中國(guó)科技公司了解并不多。此次發(fā)布Smart SSD產(chǎn)品,是DataBox首次詳細(xì)具體地公開旗下一款產(chǎn)品的功能、性能與核心技術(shù)競(jìng)爭(zhēng)力,掀起了面紗的一角。談及DataBox的產(chǎn)品布局,以及這究竟是一家什么樣定位的企業(yè), DataBox始終保持低調(diào)不多置評(píng),而是講述了一段鮮為人知的趣聞?shì)W事。
某全球知名VC機(jī)構(gòu)的合伙人有一次與DataBox取得聯(lián)系,表達(dá)了進(jìn)一步了解投資的興趣。當(dāng)時(shí),DataBox并未涉足Smart SSD。有趣的是,這家VC機(jī)構(gòu)當(dāng)時(shí)已是一家Smart SSD創(chuàng)業(yè)公司的投資者之一。交談過(guò)程中,對(duì)方亦問(wèn)起DataBox的定位和產(chǎn)品布局。DataBox表示,公司雖然研制銷售各類芯片產(chǎn)品,但本質(zhì)上并不是一家研發(fā)具體產(chǎn)品的產(chǎn)品型公司,更不是追逐熱門的概念型公司,而是一家研發(fā)硬件加速算法與芯片技術(shù)的能力型公司。這種核心能力,應(yīng)用在大數(shù)據(jù)行業(yè),就體現(xiàn)為對(duì)方看到的大數(shù)據(jù)專用芯片這樣的產(chǎn)品形態(tài)。但,產(chǎn)品和行業(yè)都不足以定義DataBox這樣的能力型公司;公司必然,而且已經(jīng),開始運(yùn)用這種核心能力進(jìn)入更多行業(yè)領(lǐng)域。越來(lái)越多的頭部企業(yè)客戶使用了DataBox產(chǎn)品之后,不斷引薦數(shù)據(jù)庫(kù)、存儲(chǔ)、網(wǎng)絡(luò)、安全等業(yè)務(wù)部門與DataBox商談合作,共同研發(fā)各類企業(yè)級(jí)應(yīng)用的硬件加速芯片方案。未來(lái)DataBox再次跨界進(jìn)入其他行業(yè)推出新門類產(chǎn)品,毫不奇怪。
彼時(shí),DataBox沒說(shuō)的是,這種核心能力如果運(yùn)用于In-Storage Computing領(lǐng)域,就表現(xiàn)為Smart SSD這樣的產(chǎn)品形態(tài),Smart SSD將成為DataBox核心能力降維打擊的下游行業(yè)。
化繁為簡(jiǎn),吹沙見金。商業(yè)模式創(chuàng)新的局限性日益被大眾所認(rèn)知,尤其是中美貿(mào)易戰(zhàn)以來(lái),核心技術(shù)被卡脖子的“芯”痛,促使中國(guó)創(chuàng)投圈越來(lái)越重視硬科技創(chuàng)新。不過(guò)平心而論,中國(guó)的硬科技創(chuàng)投圈常見的是另一種短平快的商業(yè)模式創(chuàng)新——把In-Storage Computing、Smart SSD之類的高大上新概念搬到國(guó)內(nèi),依靠模仿、收購(gòu)或是挖人獲取國(guó)際上的已有技術(shù),做出一款跟國(guó)際廠商產(chǎn)品差不多甚至差一些的產(chǎn)品,最終,還是要依靠血崩價(jià)格戰(zhàn)乃至政策保護(hù)壁壘跟對(duì)方競(jìng)爭(zhēng)市場(chǎng)。炒概念,靠模仿,拼加班,砍利潤(rùn)……招數(shù)用盡,唯獨(dú)沒有過(guò)硬的核心技術(shù)優(yōu)勢(shì)。國(guó)產(chǎn)替代之類的情懷包裝,并不能掩蓋本質(zhì)上更像是硬科技版的商業(yè)模式創(chuàng)新。真正敢于、能夠去攻克全球行業(yè)核心技術(shù)制高點(diǎn)的企業(yè),并不多見。
隨著集成電路制程工藝日益接近物理極限,芯片性能每18個(gè)月翻倍的摩爾定律不可持續(xù),采用針對(duì)特定功能專門設(shè)計(jì)的專用芯片進(jìn)行硬件加速,相比采用CPU通用處理器來(lái)實(shí)現(xiàn)這些功能,性能、成本、功耗均可極大優(yōu)化,已成為芯片產(chǎn)業(yè)技術(shù)的大勢(shì)所趨。實(shí)際上,過(guò)去幾十年,專用芯片硬件加速在每一個(gè)重要領(lǐng)域的崛起都造就了該領(lǐng)域的全球產(chǎn)業(yè)領(lǐng)導(dǎo)者。20世紀(jì)末,核心網(wǎng)絡(luò)系統(tǒng)、大型數(shù)據(jù)庫(kù)系統(tǒng)和3D圖形顯示系統(tǒng)采用專用芯片硬件加速,造就了高性能網(wǎng)絡(luò)設(shè)備巨頭Cisco、高性能數(shù)據(jù)庫(kù)系統(tǒng)巨頭Oracle和高性能顯卡巨頭nVidia;時(shí)間來(lái)到21世紀(jì),比特幣礦機(jī)系統(tǒng)、人工智能系統(tǒng)采用硬件加速芯片,又成就了比特大陸和全球眾多AI芯片獨(dú)角獸。大數(shù)據(jù)等越來(lái)越多的應(yīng)用領(lǐng)域采用硬件加速專用芯片,造就的將是DataBox這類新世代全球產(chǎn)業(yè)領(lǐng)導(dǎo)者。
(校對(duì)/范蓉)