AMD計劃打造120萬顆GPU超級計算機耗資可達千億美元

作者：劉昕煒 2024-06-26

來源：愛集微 #amd# #gpu# #超算# #AMD#

2.4w

當前數(shù)據(jù)中心對算力的需求正以驚人的速度增長，AMD透露，該公司正計劃打造多達120萬顆GPU的超級計算機集群。業(yè)界認為，此舉是為與英偉達競爭。

AMD的這一表態(tài)來自于該公司執(zhí)行副總裁兼數(shù)據(jù)中心解決方案事業(yè)部總經(jīng)理Forrest Norrod，在被問及AMD是否已接到關(guān)于120萬顆GPU集群的咨詢時，F(xiàn)orrest表示，這一表述幾乎是準確的。

業(yè)界表示，通常來說人工智能（AI）訓練集群由幾千個GPU構(gòu)建，通過高速互聯(lián)能力進行連接。相比之下，擁有120萬個GPU的集群幾乎是不可能的。延遲、功耗、不可避免的硬件故障，將是構(gòu)建這一集群需考慮的因素。

AI工作負載對延遲極為敏感，在這種情況下，如果某些數(shù)據(jù)傳輸比其他數(shù)據(jù)傳輸耗時更長，會干擾正常工作。此外，目前的超級計算機每隔幾小時就會發(fā)生一次硬件故障，當規(guī)模擴大至目前已知最大集群的30倍時，這些問題將變得更加突出。

目前已知運行速度最快的超級計算機之一Frontier，GPU數(shù)量“僅有”37888個。

關(guān)于數(shù)量多達百萬顆GPU的構(gòu)思，表明了2020年代AI競賽的嚴肅性，AMD Forrest沒有透露哪個組織正考慮構(gòu)建如此規(guī)模的系統(tǒng)，但確實提到有“非常清醒的人”正考慮花費數(shù)百億乃至千億美元在AI訓練集群上。

（校對/劉昕煒）

責編：劉昕煒

來源：愛集微 #amd# #gpu# #超算# #AMD#

THE END

*此內(nèi)容為集微網(wǎng)原創(chuàng)，著作權(quán)歸集微網(wǎng)所有，愛集微，愛原創(chuàng)

劉昕煒

微信：Andix402857

郵箱：liuxw@ijiwei.com

1767文章總數(shù)

4446.9w總瀏覽量

亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看