(文/朱秩磊)ChatGPT為代表的AIGC 引發(fā)AI計(jì)算中心需求井噴,英偉達(dá)高性能GPU成為了新一輪AI掘金熱的硬通貨。如果AI進(jìn)步的瓶頸在于算力,那么現(xiàn)階段計(jì)算能力的主要限制則是英偉達(dá)的GPU供應(yīng)能力,隨著需求持續(xù)攀升,其生產(chǎn)正越來(lái)越受限于臺(tái)積電CoWoS的產(chǎn)能。
盡管臺(tái)積電在最新的業(yè)績(jī)說(shuō)明會(huì)中強(qiáng)調(diào)不認(rèn)為在 AI 能在今年下半年驅(qū)動(dòng)半導(dǎo)體需求恢復(fù)增長(zhǎng),但仍然為英偉達(dá)等主要AI芯片的客戶啟動(dòng)了CoWoS產(chǎn)能擴(kuò)張計(jì)劃。然而遠(yuǎn)水救不了近火,CoWoS嚴(yán)重短缺的當(dāng)下,誰(shuí)有機(jī)會(huì)分得一杯羹?
代工、封測(cè)產(chǎn)能過(guò)剩,CoWoS緣何逆襲?
2022年下半年以來(lái),半導(dǎo)體行業(yè)景氣度急轉(zhuǎn)直下,過(guò)高的產(chǎn)業(yè)鏈庫(kù)存,使得除汽車(chē)領(lǐng)域之外的大部分代工、封測(cè)市場(chǎng)進(jìn)入了產(chǎn)能過(guò)剩的狀態(tài)。近期TrendForce的數(shù)據(jù)顯示,與前兩年的訂單滿載截然不同的是,當(dāng)前各大晶圓廠的產(chǎn)能利用率未達(dá)到峰值。8英寸晶圓產(chǎn)線中,臺(tái)積電、聯(lián)電、世界先進(jìn)、力積電和中芯國(guó)際(約當(dāng)8英寸晶圓)的產(chǎn)能利用率預(yù)計(jì)分別下降至97%、80%、73%、86%和79.5%;12英寸晶圓產(chǎn)線,臺(tái)積電、三星、聯(lián)電產(chǎn)能利用率分別下降至96%、90%、92%。
封測(cè)方面,IDC最新研究顯示,由于封測(cè)廠仍處于清庫(kù)存階段,上半年產(chǎn)能利用率大部分維持在50%-65%,隨著庫(kù)存調(diào)整后的需求溫和復(fù)蘇,下半年有望回升至60%-75%,甚至來(lái)自先進(jìn)封裝的部分急單能讓產(chǎn)能利用率提升至80%,然而仍與2022年的70%-85%仍有差距。
然而就在這樣的頹勢(shì)下,臺(tái)積電連月來(lái)不斷傳出CoWoS先進(jìn)封裝產(chǎn)能告急的聲音。究其原因,正是ChatGPT為代表的AIGC驅(qū)動(dòng)英偉達(dá)、AMD等公司的高性能計(jì)算芯片GPU、CPU等需求井噴,而這些芯片大多采用了臺(tái)積電的CoWoS封裝。
TrendForce最新報(bào)告指出,目前主要由搭載英偉達(dá)A100、H100、AMD MI300,以及大型數(shù)據(jù)中心廠商如谷歌、AWS等自主研發(fā)的AI服務(wù)器成長(zhǎng)需求強(qiáng)勁,預(yù)計(jì)2023年AI服務(wù)器(包含搭載GPU、FPGA、ASIC等)出貨量預(yù)估近120萬(wàn)臺(tái),年增率近38%,AI芯片出貨量同步看漲,可望成長(zhǎng)突破五成。
在全球?qū)τ贏I數(shù)據(jù)中心算力的旺盛需求推動(dòng)下,英偉達(dá)的GPU訂單也在不斷飆升,其最高端的H100在明年第一季度之前都是售罄狀態(tài)。為此,英偉達(dá)近月來(lái)都在爭(zhēng)取臺(tái)積電對(duì)其A100、H100等AI GPU的產(chǎn)能支持,同時(shí)亞馬遜AWS、博通、思科和賽靈思等公司也都提高了對(duì)臺(tái)積電的產(chǎn)能需求。這些芯片無(wú)一例外都使用了臺(tái)積電的CoWoS封裝。
英偉達(dá)A100 SEM掃描圖 來(lái)源:semianalysis
例如英偉達(dá)H100采用臺(tái)積電4N工藝、CoWoS-S 2.5D封裝。芯片流片在臺(tái)積電位于臺(tái)南的Fab 18廠,與其N(xiāo)5工藝共用相同的機(jī)臺(tái),由于PC、智能手機(jī)和非AI相關(guān)數(shù)據(jù)中心芯片的需求嚴(yán)重疲軟,臺(tái)積電N5工藝的產(chǎn)能利用率降至70%以下,因此H100的晶圓生產(chǎn)沒(méi)有任何問(wèn)題,甚至因吸收了臺(tái)積電的閑置先進(jìn)產(chǎn)能而獲得一些定價(jià)優(yōu)勢(shì)。而這些流好片的晶圓(WIP)存放在晶圓庫(kù)中,等待CoWoS產(chǎn)能才能繼續(xù)封裝成為最后的成品。
供應(yīng)鏈消息顯示,僅英偉達(dá)今年對(duì)CoWoS的需求就達(dá)到4.5萬(wàn)片,比年初預(yù)計(jì)的3萬(wàn)片大幅增加了50%,臺(tái)積電原本產(chǎn)能就不多的CoWoS濕制程更難以滿足如此龐大的需求。
AI推動(dòng)HBM成存儲(chǔ)廠商救命稻草,但產(chǎn)能難以即時(shí)滿足
除了CoWoS產(chǎn)能,HBM(高帶寬存儲(chǔ))也正成為限制AI處理器的另一個(gè)重要瓶頸。
用于數(shù)據(jù)中心中的GPU,擴(kuò)展內(nèi)存帶寬越來(lái)越重要,尤其AI服務(wù)器中推理和訓(xùn)練工作負(fù)載是內(nèi)存密集型的,隨著人工智能模型中參數(shù)量的指數(shù)級(jí)增長(zhǎng),僅模型權(quán)重參數(shù)的大小就已達(dá)到TB級(jí)。因此,AI處理器的性能受到從內(nèi)存中存儲(chǔ)和檢索訓(xùn)練和推理數(shù)據(jù)的能力的制約,這就是俗稱的“內(nèi)存墻”問(wèn)題。
集微分析師指出,由于HBM擁有比DDR SDRAM更高的帶寬和更低的耗能,已經(jīng)成為HPC處理器的首選內(nèi)存技術(shù),現(xiàn)階段沒(méi)有其他替代選擇,在高端AI服務(wù)器GPU搭載HBM芯片更已是主流。比如英偉達(dá)A100,H100,以及在最新整合CPU及GPU的Grace Hopper芯片中,單顆芯片HBM搭載容量提升20%,達(dá)96GB;AMD更是大量采用HBM,其中MI300搭載HBM3,MI300A達(dá)128GB,更高端的MI300X則提升了50%,高達(dá)192GB。而谷歌在下半年推出的TPU張量處理器,據(jù)傳也搭載HBM存儲(chǔ)器,以擴(kuò)建AI基礎(chǔ)設(shè)施。
這極大地推動(dòng)了HBM的技術(shù)更新以及市場(chǎng)增長(zhǎng)。作為新一代內(nèi)存解決方案,HBM市場(chǎng)被SK海力士、三星、美光三大DRAM原廠牢牢占據(jù)。TrendForce調(diào)查顯示,2022年HBM市占率分別為SK海力士50%、三星約40%、美光約10%,預(yù)計(jì)2023年全球HBM需求量將年增近六成,達(dá)到2.9億GB,2024年將再增長(zhǎng)30%。
作為HBM的先驅(qū),SK海力士在技術(shù)和市場(chǎng)占有率上都更勝一籌,是最新一代的HBM3的唯一大批量供應(yīng)商,市場(chǎng)份額超過(guò)95%,今年將推出具備8Gbps數(shù)據(jù)傳輸性能的HBM3E樣品,并將于2024年投入量產(chǎn)。與此同時(shí),三星和美光也將HBM作為下一步業(yè)務(wù)增長(zhǎng)的關(guān)鍵動(dòng)力。三星表示將投資1萬(wàn)億韓元擴(kuò)大HBM產(chǎn)能,并于今年推出HBM3產(chǎn)品;美光預(yù)計(jì)其相關(guān)HBM產(chǎn)品“將在2024財(cái)年貢獻(xiàn)有意義的收入,并在2025年貢獻(xiàn)大幅增加的收入”。
在存儲(chǔ)市場(chǎng)仍處于寒冬的背景下,幾大存儲(chǔ)廠商在過(guò)去一段時(shí)間都進(jìn)行了減產(chǎn)動(dòng)作,而HBM的需求突然降臨無(wú)疑被其視為“救命稻草”。不過(guò),雖然這三大存儲(chǔ)芯片制造商正將更多產(chǎn)能轉(zhuǎn)移至生產(chǎn)HBM,但由于調(diào)整產(chǎn)能需要時(shí)間,很難迅速增加HBM產(chǎn)量,預(yù)計(jì)未來(lái)兩年HBM供應(yīng)仍將緊張。
由于GPU核心與HBM堆棧通過(guò)CoWoS封裝在同一基板上,HBM的產(chǎn)能緊張也在一定程度上限制了AI處理器的出貨。
CoWoS產(chǎn)能不足,哪些廠商有望受益?
在產(chǎn)能需求持續(xù)升級(jí)之下,臺(tái)積電才從一開(kāi)始的保守轉(zhuǎn)而在Q2業(yè)績(jī)法說(shuō)會(huì)上確認(rèn)將積極擴(kuò)充CoWoS產(chǎn)能,將投資900億元新臺(tái)幣(約28.7504億美元)打造位于竹科銅鑼園區(qū)的先進(jìn)封裝廠,預(yù)計(jì)2026年底建廠完成、2027年第三季開(kāi)始量產(chǎn),月產(chǎn)能達(dá)11萬(wàn)片12英寸晶圓,涵蓋SoIC、InFO以及CoWoS等先進(jìn)封裝技術(shù),同時(shí)將明年的CoWoS月產(chǎn)能提升至今年的2倍。
CoWoS是臺(tái)積電于2011年發(fā)布的2.5D先進(jìn)封裝技術(shù),至今已演進(jìn)至第六代,根據(jù)不同的中介層主要分為CoWoS-S(硅中介層)、CoWoS-R(RDL中介層)、CoWoS-L(LSI+RDL中介層)三種。
簡(jiǎn)單來(lái)說(shuō),CoWoS是先將芯片通過(guò)Chip on Wafer(CoW)的封裝制程連接至硅晶圓,再把CoW芯片與基板連接,整合成CoWoS。利用這種封裝模式,使得多顆芯片可以封裝到一起,通過(guò)硅中介層互聯(lián),達(dá)到了封裝體積小、功耗低、引腳少的效果。
臺(tái)積電CoWoS-S
“其核心關(guān)鍵技術(shù)包括中介層、RDL、TSV、μBump等,需要前后道工藝結(jié)合,挑戰(zhàn)在于散熱、芯片間的信號(hào)串?dāng)_和延遲、設(shè)計(jì)布局以及可靠性等問(wèn)題?!奔⒆稍兎治鰩熤赋觥?/p>
多年來(lái),臺(tái)積電針對(duì)CoWoS技術(shù)的開(kāi)發(fā)重點(diǎn)之一是支持不斷增加的硅中介層尺寸,以支持構(gòu)建在中介層之上的處理器和HBM堆棧,而面臨產(chǎn)能緊張的一個(gè)重要原因,正是中介層的生產(chǎn)以及相關(guān)設(shè)備的供應(yīng)緊張。因此,臺(tái)積電才會(huì)傳出需要尋求合作,并可能外包給合作伙伴。
目前,日月光、安靠、聯(lián)電和三星等廠商都被指因臺(tái)積電產(chǎn)能緊張而受益,那么究竟誰(shuí)能分得一杯羹呢?
根據(jù)臺(tái)媒消息,英偉達(dá)從6月下旬起,已開(kāi)始推動(dòng)臺(tái)積電向傳統(tǒng)封裝廠商合作伙伴發(fā)送硅中介層載板產(chǎn)能需求,并同步推動(dòng)聯(lián)電擴(kuò)大2024年硅中介層載板產(chǎn)能;同時(shí)近期安靠和日月光均在與CoWoS設(shè)備供應(yīng)商密集洽談,很可能意味著將進(jìn)行擴(kuò)產(chǎn)。
CoWoS工藝流程 來(lái)源:Counterpoint Research
其中,一種方案是臺(tái)積電完成晶圓和中介層生產(chǎn),即CoWoS的“CoW”部分,然后交由自家(比如空余InFO產(chǎn)能)或別家封裝廠完成“oS”部分;另一種方案是聯(lián)電生產(chǎn)硅中介層,即“Co”部分,再送往安靠或日月光完成“WoS”部分。
先進(jìn)封裝技術(shù)專家王為(化名)對(duì)集微網(wǎng)分析,CoWoS生產(chǎn)拆分成兩個(gè)部分是可行的,但是涉及到很多工藝的know-how,并且材料成本很貴,“能做”和“能做好”有很大的差別?!翱蛻舻腟oC Die、HBM堆棧等成本都很貴,如果良率不佳,將導(dǎo)致最終封測(cè)成品價(jià)格遠(yuǎn)高于臺(tái)積電?!彼赋?,“如果一個(gè)完整流程涉及不同公司,或半成品在不同廠房之間運(yùn)輸,也會(huì)帶來(lái)商務(wù)糾紛的風(fēng)險(xiǎn)以及運(yùn)輸方面的麻煩。”
聯(lián)電2.5D硅中介層解決方案
比如聯(lián)電,最近在先進(jìn)封裝方面頻頻發(fā)力。根據(jù)該公司官網(wǎng)資料,聯(lián)電是全球首個(gè)提供硅中介層制造開(kāi)放解決方案的代工廠,即通過(guò)聯(lián)電+OSAT的合作模式,由聯(lián)電完成前段2.5D TSI硅中介層晶圓(FEoL+TSV+FS RDL),然后交由封測(cè)廠完成中段MEoL和后段BEoL工序。
在7月28日的日月光法說(shuō)會(huì)上,該公司已經(jīng)證實(shí),正在與代工廠合作中介層相關(guān)技術(shù),并具備CoWoS整套制程的完整解決方案,預(yù)計(jì)今年下半年或明年初量產(chǎn)。
不過(guò),相比臺(tái)積電,聯(lián)電目前在中介層方面的產(chǎn)能仍然很小,原因之一與臺(tái)積電一樣,均是TSV所需刻蝕(DRIE)設(shè)備不足,并且由于在封裝間距方面的限制,聯(lián)電暫時(shí)只能做A100。
集微分析師指出,雖然各家的2.5D工藝,對(duì)應(yīng)的中介層層數(shù)、TSV的尺寸、所用的材料、曝光次數(shù)及效率的差異都會(huì)影響最終成本,在某種程度上也是資金實(shí)力的競(jìng)爭(zhēng),因?yàn)楦叨嗽O(shè)備十分昂貴,買(mǎi)得起更好的設(shè)備生產(chǎn)出來(lái)的產(chǎn)品也更好。在這方面,臺(tái)積電因?yàn)橄冗M(jìn)制程的優(yōu)勢(shì)自然也具備更高端的設(shè)備?!?/strong>CoWoS需要在晶圓上對(duì)芯片進(jìn)行更精確的堆疊和互連,因此更高精度的電鍍等先進(jìn)設(shè)備必不可少?!?/strong>
例如,硅中介層的最大尺寸受掩模版的曝光尺寸限制,因而與所用的光刻機(jī)種類(lèi)相關(guān)。根據(jù)此前臺(tái)積電公布的CoWoS路線圖,今年推出的第六代CoWoS_S工藝,硅中介層尺寸達(dá)到了3400mm2左右,可支持更多HBM堆棧,而這無(wú)疑對(duì)光刻機(jī)提出了更高要求。此外,TSV的制作挑戰(zhàn)在于高深寬比的通孔和高密度引腳的對(duì)齊,生產(chǎn)過(guò)程中包括深孔刻蝕、氣相沉積、銅填充、CMP、晶圓減薄、晶圓鍵合等工藝涉及的設(shè)備均與TSV性能息息相關(guān)。
CoWoS的潛在替代方案?
另一位業(yè)內(nèi)專家大可(化名)告訴集微網(wǎng),與臺(tái)積電CoWoS類(lèi)似的2.5D先進(jìn)封裝技術(shù)還有三星的I-Cube/H-Cube、日月光的FOCoS-Bridge、英特爾的EMIB等。
三星的I-Cube包括I-CubeS和I-CubeE量子方案,最新一代的I-CubeS,I-CubeS 8的硅中介層擁有3倍標(biāo)線尺寸,可容納8個(gè)HBM堆棧和2個(gè)邏輯裸片;I-CubeE支持嵌入式硅橋裸片,對(duì)大中介層而言,更具成本效益。H-Cube是三星推出的另一種2.5D封裝解決方案,主要是采用面積較小的ABF基板或FBGA基板疊加大面積的HDI基板的方式,來(lái)解決當(dāng)前PCB嚴(yán)重短缺的問(wèn)題。
三星I-Cube/H-Cube
“雖然三星在2.5D先進(jìn)封裝方面已經(jīng)布局多年,百度2018年推出的第一代百度昆侖AI芯片正是基于三星14nm工藝及I-Cube封裝解決方案,但是前道代工業(yè)務(wù)較弱也在一定程度上影響了其先進(jìn)封裝業(yè)務(wù)的進(jìn)展,因而至今客戶仍然很少?!贝罂芍赋?。不過(guò)隨著臺(tái)積電CoWoS短期內(nèi)難以滿足客戶需求,三星有希望能接到部分訂單,并且三星的優(yōu)勢(shì)在于它是唯一一家擁有從內(nèi)存,處理器芯片設(shè)計(jì)、制造到先進(jìn)封裝業(yè)務(wù)組合的公司。
日月光FOCoS-Bridge
日月光方面,除了與代工廠合作完成2.5D封裝,也在開(kāi)發(fā)自己的完整解決方案。該公司在今年5月底推出了FOCoS-Bridge,在70mmx78mm尺寸的大型高效能封裝載板中,包含兩顆相同尺寸47mmx31mm的FOCoS-Bridge的扇出型封裝結(jié),可通過(guò)8個(gè)硅橋(Bridge)整合2顆ASIC和8個(gè)HBM堆棧,面向AI和HPC應(yīng)用。日月光強(qiáng)調(diào),F(xiàn)OCoS-Bridge可提供與硅中介層相似的電氣、信號(hào)和電源完整性性能,但成本更低,并且沒(méi)有掩模版尺寸限制。
最后,大陸整體封裝產(chǎn)業(yè)盡管已躍居全球領(lǐng)先地位,但是在以TSV為代表的2.5D/3D等先進(jìn)封裝領(lǐng)域仍然較為薄弱。尤其當(dāng)前采用2.5D/3D先進(jìn)封裝的芯片都是前沿先進(jìn)工藝制程,線寬和芯片間距越來(lái)越小,比如當(dāng)下主流的HBM3對(duì)線寬的最低要求是1.8/1.8μm,目前只有代工廠有能力在硅中介層上將線寬降至1.8/1.8μm以下,封裝廠還不具備這一能力;國(guó)內(nèi)封測(cè)龍頭長(zhǎng)電科技披露的XDFOI平臺(tái)當(dāng)前可以實(shí)現(xiàn)3-4層高密度的RDL走線,其中介層線寬/線距最小可達(dá)2μm。
而根據(jù)集微咨詢發(fā)布《2022年中國(guó)集成電路封測(cè)產(chǎn)業(yè)白皮書(shū)》,2022年中國(guó)大陸本士綜合性封測(cè)企業(yè)營(yíng)收TOP10中,僅有長(zhǎng)電科技、通富微電、華天已具備2.5/3D封裝能力。據(jù)悉,國(guó)內(nèi)在這一領(lǐng)域的主導(dǎo)者和主要推動(dòng)者是H公司。
長(zhǎng)電科技XDFOI
當(dāng)越來(lái)越多的國(guó)產(chǎn)大模型進(jìn)入到追趕GPT的隊(duì)伍中,在進(jìn)口高性能AI處理器受限的情況下,國(guó)產(chǎn)GPU的發(fā)展有望迎來(lái)隨著巨大的算力需求缺口而產(chǎn)生蝶變,這就要求下游制造、封裝技術(shù)也盡快提升,為突破AI領(lǐng)域的封鎖補(bǔ)齊短板。并且,在國(guó)內(nèi)先進(jìn)制程發(fā)展受阻的情況下,加速2.5/3D等先進(jìn)封裝領(lǐng)域的追趕才能盡力彌補(bǔ)先進(jìn)制程能力不足的遺憾。