亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

單卡支持大模型 首個(gè)高稀疏率AI計(jì)算卡S100在浪潮內(nèi)測(cè)中表現(xiàn)優(yōu)異

來(lái)源:墨芯 #人工智能# #墨芯#
3.9w

2022年7月5日,墨芯人工智能首次發(fā)布SparseOne?? S100在浪潮服務(wù)器中的測(cè)試數(shù)據(jù), S100是全球首個(gè)高稀疏率AI計(jì)算卡,運(yùn)行多個(gè)AI主流模型,性能表現(xiàn)為國(guó)際大廠(chǎng)主流AI推理卡的6倍。更重要的是,它不僅性能優(yōu)秀,能效比、功耗和精度同樣能給業(yè)界帶來(lái)驚喜,并具有良好的通用性。 

墨芯人工智能是稀疏化計(jì)算的全球引領(lǐng)者,以稀疏化算法為核心,打造云端和終端AI計(jì)算加速方案,可廣泛應(yīng)用于數(shù)據(jù)中心、互聯(lián)網(wǎng)、運(yùn)營(yíng)商、生命科學(xué)等場(chǎng)景,推動(dòng)稀疏化計(jì)算生態(tài)建設(shè)。浪潮是墨芯人工智能的戰(zhàn)略投資者和生態(tài)合作伙伴。

S100單卡力挑T5-8B

可支持千億級(jí)別大模型

該報(bào)告在以下測(cè)試環(huán)境中進(jìn)行,測(cè)試結(jié)果僅對(duì)被測(cè)系統(tǒng)當(dāng)時(shí)的狀態(tài)有效。 

測(cè)試環(huán)境 

報(bào)告中的實(shí)測(cè)數(shù)據(jù)顯示,與國(guó)際大廠(chǎng)主流AI推理卡對(duì)比,S100運(yùn)行多個(gè)AI主流模型如T5、BERT和ResNet-50,性能為后者6倍。

值得注意的是,這是墨芯首次披露S100運(yùn)行能夠?qū)崿F(xiàn)單卡推理大模型,突破單卡難以滿(mǎn)足高算力需求的瓶頸,有效解決業(yè)界對(duì)大模型,普遍采取多機(jī)多卡分布式的方式,完成推理所帶來(lái)的時(shí)間長(zhǎng)、功耗高、成本高等問(wèn)題。

近年來(lái)新興的NLP模型——T5,曾被稱(chēng)為“全新NLP SOTA預(yù)訓(xùn)練模型”,以其高參數(shù)量,讓許多計(jì)算卡“望而卻步”。但在本次測(cè)試中,S100在單機(jī)單卡環(huán)境下就能運(yùn)行T5-8B模型,算力高達(dá)141.8 SPS。

除了高算力的優(yōu)勢(shì),相較于當(dāng)前國(guó)際大廠(chǎng)主流推理卡單卡只能支持百億參數(shù)級(jí)別的模型,墨芯S100可以支持千億參數(shù)級(jí)別的模型。

S100不僅運(yùn)行大模型性能測(cè)試表現(xiàn)優(yōu)秀,運(yùn)行其他經(jīng)典AI模型,如自然語(yǔ)言處理領(lǐng)軍模型BERT、圖像分類(lèi)識(shí)別模型ResNet-50的性能數(shù)據(jù)也很亮眼,為國(guó)際大廠(chǎng)主流AI推理卡的6倍以上。

S100運(yùn)行BERT模型,SST-2數(shù)據(jù)集,在單機(jī)單卡環(huán)境下,不影響精度的前提下,性能達(dá)12176 SPS。 

S100運(yùn)行ResNet-50模型,ImageNet數(shù)據(jù)集,在單機(jī)單卡環(huán)境下,不影響精度的前提下,性能達(dá)28260 FPS。 

在主頻800 MHz的測(cè)試環(huán)境中,S100運(yùn)行ResNet-50模型時(shí)算力達(dá)33197 FPS。浪潮內(nèi)測(cè)主頻為700 MHz。

所有測(cè)試均是在實(shí)際環(huán)境中,意味著S100計(jì)算卡能夠直接投入實(shí)際場(chǎng)景的使用,“實(shí)戰(zhàn)能力”超群,擁有極高的應(yīng)用價(jià)值。這意味著,S100不僅能夠提供高性能,還能同時(shí)滿(mǎn)足高能效比、低功耗和高精度,為企業(yè)大幅降低部署成本和運(yùn)維成本。 

稀疏化計(jì)算:不止于快

S100超高性能的秘密武器是稀疏化計(jì)算。簡(jiǎn)單來(lái)說(shuō),稀疏化的原理是指,在AI矩陣運(yùn)算中,將無(wú)效元素剔除,極大加快計(jì)算速度,降低計(jì)算成本。它在需要海量數(shù)據(jù)處理的AI加速計(jì)算中優(yōu)勢(shì)尤為突出,能在提供高性能的同時(shí),為企業(yè)提供高能效比、高精度和低功耗,為企業(yè)降本增效。

2021年8月,谷歌人工智能主管Jeff Dean在一次TED演講中表示,稀疏化是下一代AI架構(gòu)中最重要的趨勢(shì)之一。他認(rèn)為當(dāng)前模型密集且效率低下,而谷歌的研發(fā)方向會(huì)把模型變得稀疏而高效。

如果說(shuō)谷歌現(xiàn)在是稀疏化算法的推動(dòng)者、稀疏化架構(gòu)的倡導(dǎo)者,那么墨芯已是稀疏化產(chǎn)業(yè)實(shí)踐者。早在2018年,墨芯即致力于稀疏計(jì)算的4產(chǎn)業(yè)化進(jìn)程,采用軟硬協(xié)同的設(shè)計(jì)創(chuàng)新方法,將稀疏化算法升級(jí)到計(jì)算層面,實(shí)現(xiàn)高性能和高能效。

現(xiàn)在,根據(jù)潛在客戶(hù)的反饋,稀疏化計(jì)算成為極富有競(jìng)爭(zhēng)力的AI計(jì)算解決方案,因?yàn)樗饶軌蛲黄扑懔O限,又具有良好的通用靈活性,企業(yè)能夠能以極低的遷移成本,一鍵式地將稀疏計(jì)算功能添加到現(xiàn)有的計(jì)算設(shè)施中。

因此,墨芯的稀疏化計(jì)算解決方案具有廣闊的生態(tài)前景。墨芯人工智能創(chuàng)始人兼CEO王維表示,墨芯將構(gòu)建涵蓋軟件、硬件、應(yīng)用的AI計(jì)算平臺(tái),與研究人員、開(kāi)發(fā)者、軟件開(kāi)發(fā)商等合作伙伴一起,為各行各業(yè)用戶(hù)提供高性能AI計(jì)算服務(wù),共同構(gòu)筑場(chǎng)景豐富、生機(jī)勃勃的稀疏化生態(tài)。

責(zé)編: 愛(ài)集微
來(lái)源:墨芯 #人工智能# #墨芯#
THE END
愛(ài)集微

微信:

郵箱:laoyaoba@gmail.com


10.8w文章總數(shù)
12012.5w總瀏覽量
最新資訊
關(guān)閉
加載

PDF 加載中...

亚洲AV无码一区二区三区天堂古| 日本免费无码一区二区到五区| 国精品午夜福利视频导航| 国产无圣光一区福利二区| 白虎美女被大基吧操| 热精品韩国毛久久久久久| 美女扒开腿让男人桶爽揉| 日本熟人妻中文字幕在线| 三级片在线无码播放| 成人男女做爰免费视频网| 日韩av一区二区三区激情在线| 国产精品操大屁股老淑女| 人妻熟女av一区二区三区| 无码av一区二区大桥久未| 中文字幕在线观一二三区| 九九在线精品亚洲国产| 亚洲午夜国产片在线观看| 欧美日韩久久久一区二区三区 | 欧美一区二区三区四区五区精品| 黑丝美女被操到高潮| 国产A级黄片下载| 农村胖肥胖女人操逼视频| 久久精品男人的天堂av| 无遮挡粉嫩久久久久久久| 欧美黄色三级成人小视频| 激情亚洲人妻精品| 久久综合娱乐中文网| 夜色成人免费观看| 九九视频这里只有精品| 国产午夜久久精品一区四虎| 亚洲av一区二区在线看| 精品免费久久久久久久久| 日韩午夜资源在线观看| 中日韩国内精品视频| 国产高清免费一级a久久| 无码成人一区二区| 日韩美女叉B视频| 日本av在线一区二区| 91video国产一区| 久久久精品欧美一区二区三免费| 天美传媒精品1区2区3区|