2025年,以 ChatGPT 為起點,生成式 AI 掀起了全球技術革命,將人工智能的發(fā)展推向了新的高潮。而今年春節(jié)中國科技企業(yè) DeepSeek 推出的千億參數(shù)大模型橫空出世,迅速在全球范圍內獲得了廣泛關注和應用,其 APP 上線一個月下載量便破 1 億,展示出了強大的影響力。
在自然語言處理領域,DeepSeek 能夠理解和生成自然語言,實現(xiàn)人機對話、文本生成、機器翻譯等功能。在與用戶的對話中,它能夠準確理解用戶的意圖,并給出富有邏輯和深度的回答,甚至在某些任務上超越了被譽為 “最強推理模型” 的 OpenAI GPT 系列模型,其強大的推理能力和語言生成質量贏得了廣泛的認可。在圖像生成領域,DeepSeek 可以根據(jù)用戶的描述生成高質量的圖像,為設計、藝術創(chuàng)作等領域提供了新的工具和思路。
DeepSeek 的成功,離不開其背后強大的算力支持。盡管DeepSeek開辟了全新的技術路徑,對算力的需求遠小于以往的ChatGPT等模型,然而訓練和運行這樣的大模型,仍然需要消耗天文數(shù)字級的算力,單次訓練需調用數(shù)萬張 GPU,每秒處理超萬億次浮點運算。在摩爾定律逐漸逼近極限的當下,面對如此龐大的算力需求,AI芯片在內存帶寬、芯片互聯(lián)效率等方面面臨著極致的挑戰(zhàn),先進封裝技術作為實現(xiàn)這些高性能AI芯片的關鍵手段,其重要性愈發(fā)凸顯。
超算與數(shù)據(jù)中心:AI 算力的基石
在生成式 AI 的發(fā)展進程中,超算和數(shù)據(jù)中心扮演著舉足輕重的角色,是 AI 算力的核心基石。超算和數(shù)據(jù)中心作為 AI 計算的核心基礎設施,承擔著巨大的算力任務。超算主要針對大規(guī)模、高復雜度的計算任務,如深度學習模型的訓練;而數(shù)據(jù)中心則側重于大規(guī)模數(shù)據(jù)的處理和存儲,支持模型的推理和應用。
為了滿足這些需求,超算和數(shù)據(jù)中心需要配備高性能的芯片和先進的封裝技術,以實現(xiàn)高效的數(shù)據(jù)處理和傳輸。
在構建支持大規(guī)模AI算力的超算和數(shù)據(jù)中心時,最為核心的高性能計算芯片、互聯(lián)和存儲芯片及其這些芯片的封裝技術的選擇尤為關鍵:
-GPU(圖形處理器)
GPU 是 AI 計算的核心芯片之一,擅長處理大規(guī)模的并行計算任務,如深度學習中的矩陣運算。NVIDIA 的 A100 和 H100 芯片是目前廣泛使用的高性能 GPU。
封裝類型:通常采用先進的 2.5D 封裝技術,如臺積電的 CoWoS(Chip on Wafer on Substrate)封裝工藝。這種封裝通過硅中介層(interposer)將多個芯片整合在一起,提高了芯片之間的數(shù)據(jù)傳輸效率。
-CPU(中央處理器)
CPU 是數(shù)據(jù)中心的基礎芯片,負責處理通用計算任務和控制數(shù)據(jù)流。在 AI 計算中,CPU 通常與 GPU 或 ASIC 等加速芯片協(xié)同工作。
封裝類型:現(xiàn)代 CPU 芯片通常采用 LGA(Land Grid Array)或 PGA(Pin Grid Array)封裝類型。這些封裝類型具有高密度的引腳布局,能夠提供良好的電氣性能和散熱性能。
-ASIC(專用集成電路)
ASIC 是為特定應用設計的芯片,如谷歌的 TPU(Tensor Processing Unit)和寒武紀的思元系列芯片等,專門用于加速深度學習中的特定計算任務。
封裝類型:常見的有 BGA(Ball Grid Array)和 FC-BGA(Flip Chip Ball Grid Array)等。這些封裝類型具有高密度、高性能的特點,能夠滿足 ASIC 芯片在 AI 計算中的高性能需求。
-FPGA(現(xiàn)場可編程門陣列)
FPGA 是一種可編程的硬件芯片,可以通過編程實現(xiàn)不同的功能,適用于 AI 推理中的靈活配置和優(yōu)化。
封裝類型:通常采用 BGA 封裝,這種封裝類型具有良好的散熱性能和高密度的引腳布局,能夠支持 FPGA 在 AI 計算中的高效運行。
-光模塊
光模塊是數(shù)據(jù)中心中用于高速數(shù)據(jù)傳輸?shù)年P鍵組件,特別是在 AI 計算中,光模塊能夠提供高帶寬、低延遲的數(shù)據(jù)傳輸。
封裝類型:常見的封裝類型包括 SFP(Small Form-factor Pluggable)、QSFP(Quad Small Form-factor Pluggable)等。這些封裝類型具有小型化、高密度的特點,能夠滿足數(shù)據(jù)中心對空間和性能的雙重需求。
-HBM(高帶寬內存)
HBM 是一種新型的內存技術,因其高數(shù)據(jù)傳輸速率和低功耗特點,廣泛應用于圖形處理單元(GPU)、深度學習加速器和高性能計算(HPC)等領域。HBM 允許芯片以更高的速度處理數(shù)據(jù),這對于當今數(shù)據(jù)暴增的時代顯得尤為重要。
封裝技術:HBM 通常采用先進的 3D 堆疊技術,通過硅通孔(TSV)技術將多個 DRAM 芯片垂直堆疊在一起,結合 2.5D 先進封裝,實現(xiàn)高帶寬、高容量與低功耗特性。
這些芯片在超算和數(shù)據(jù)中心中協(xié)同工作,共同為生成式 AI 提供強大的算力支持。GPU 負責處理大規(guī)模的并行計算任務,ASIC 專注于特定算法的高效執(zhí)行,F(xiàn)PGA 提供了靈活的定制化能力,而 CPU 則負責整體的控制和協(xié)調。它們的有機結合,使得超算和數(shù)據(jù)中心能夠滿足生成式 AI 對算力的極高要求,推動 AI 技術的不斷發(fā)展和創(chuàng)新。
除此之外,同時隨著算力需求的激增,超算與數(shù)據(jù)中心的核心硬件架構正在發(fā)生根本性變革。
首先是芯片類型,正從單一GPU到異構集成:
Chiplet(芯粒):將大算力芯片拆分為多個功能模塊(如計算單元、存儲、I/O),通過先進封裝重新集成,提升良率與靈活性。例如,AMD MI300X通過13顆Chiplet集成,算力較前代提升3倍。
高帶寬內存(HBM):HBM3堆疊內存可提供超過1TB/s的帶寬,成為大模型訓練標配。但其高達12層的垂直堆疊,對封裝精度提出嚴苛要求。
其次,先進封裝扮演越來越重要的角色,2.5D/3D架構成破局關鍵:
CoWoS(Chip-on-Wafer-on-Substrate):臺積電的2.5D封裝方案,通過硅中介層連接GPU與HBM,互連密度提升10倍,成為NVIDIA H100等AI芯片的“心臟”。如今業(yè)內還在開發(fā)更高密度的芯片垂直互連,例如臺積電的3D SoIC等。
混合鍵合(Hybrid Bonding):直接以銅-銅鍵合替代傳統(tǒng)焊料,將互連間距縮至微米級,突破散熱與信號延遲瓶頸,被視作3D封裝終極方案。
不難看出,在超算和數(shù)據(jù)中心中,為了充分發(fā)揮各類芯片的性能優(yōu)勢,滿足 AI 算力對芯片性能、散熱和集成度的嚴格要求, AI算力芯片通常采用先進的封裝類型,如BGA、FC-BGA、LGA、PGA、SFP、QSFP、SiP、SoC等。BGA封裝通過底部的球形金屬焊盤實現(xiàn)芯片與PCB的連接,具有高引腳密度和良好的電氣性能。FC-BGA封裝則通過倒裝芯片技術進一步提高了I/O密度和電性性能,同時降低了電磁干擾。LGA封裝適用于高性能處理器,具有高引腳密度和良好的散熱性能。PGA封裝則以其可靠的連接性能和高頻率適應性被廣泛應用于微處理器領域。SFP和QSFP封裝主要用于光通信模塊,支持高速數(shù)據(jù)傳輸。SiP將多個具有不同功能的有源電子元件與可選無源器等通過并排或疊加的方式集成在一個封裝內,實現(xiàn)一定功能的單個標準封裝件,形成一個(子)系統(tǒng)。該方案的集成度相對較低,但可以更加務實地滿足包括模擬/RF器件以及電源管理器等方面的市場需求。SoC是一種將系統(tǒng)所需的全部組件(如數(shù)據(jù)處理單元、嵌入式存儲器等)壓縮到同一個芯片上的集成電路,需要2.5D、3D集成以及多芯片模塊等先進封裝技術的支持。作為按照摩爾定律繼續(xù)往下發(fā)展并追求極高集成度的方案,SoC在人工智能和高性能計算等領域不可或缺。
這些封裝技術在提升芯片性能和可靠性方面起著至關重要的作用,通過優(yōu)化封裝設計,可以有效提高芯片的散熱性能,確保其在高負荷運行下的穩(wěn)定性和壽命。同時,先進的封裝技術能夠增加芯片的集成度,減少占用空間,從而在有限的超算和數(shù)據(jù)中心空間內實現(xiàn)更高的算力密度。這些技術進步直接推動了AI算力的提升,使得更大規(guī)模、更復雜的AI模型得以高效訓練和部署。
奧芯明:封裝技術先鋒,算力革命的“中國答案”
算力瓶頸的本質,是芯片性能與封裝技術的雙重挑戰(zhàn):超算需求方面,生成式AI依賴分布式計算集群,要求芯片間通信延遲低至納秒級;能效焦慮方面,訓練單次模型的碳排放堪比數(shù)百輛汽車全年排放,需通過芯片設計優(yōu)化與封裝創(chuàng)新降低功耗;成本壓力方面,大模型商業(yè)化落地要求單位算力成本下降,而傳統(tǒng)芯片架構已逼近物理極限。
因此,這場算力革命,正在倒逼半導體產業(yè)從“制程微縮”轉向“封裝創(chuàng)新”。行業(yè)內已有共識,封裝技術對芯片性能的影響已超過30%,成為AI算力競賽的核心戰(zhàn)場,這也對封裝設備提出了前所未有的挑戰(zhàn)和新的需求。在性能、精度、效率等關鍵方面,封裝設備正經歷著深刻的變革,以適應生成式 AI 時代的要求。
性能方面,生成式 AI 需要處理海量的數(shù)據(jù)和復雜的計算任務,這就要求芯片具備更高的性能。為了滿足這一需求,封裝設備需要能夠支持更高密度的芯片集成,實現(xiàn)芯片之間更高速、更穩(wěn)定的信號傳輸。例如,在先進的 2.5D 和 3D 封裝技術中,封裝設備需要具備高精度的對準和鍵合能力,以確保芯片之間的互連精度和可靠性。
精度方面,隨著芯片集成度的不斷提高,對封裝精度的要求也越來越高。封裝設備需要具備亞微米級甚至納米級的精度,以確保芯片在封裝過程中的位置準確性和互連質量。例如,在倒裝芯片封裝中,封裝設備需要將芯片上的微小焊點與基板上的焊盤精確對準,實現(xiàn)可靠的電氣連接。如果封裝精度不足,可能會導致焊點虛焊、短路等問題,嚴重影響芯片的性能和可靠性。為了實現(xiàn)高精度的封裝,封裝設備采用了先進的視覺識別、運動控制和微機電系統(tǒng)(MEMS)等技術,能夠對芯片和基板進行精確的定位和操作。
效率方面,面對生成式 AI 市場對芯片的巨大需求,封裝設備需要具備更高的生產效率,以滿足大規(guī)模生產的要求。這就要求封裝設備能夠實現(xiàn)自動化、智能化的生產流程,減少人工干預,提高生產速度和一致性。一些先進的封裝設備采用了機器人自動化技術,能夠實現(xiàn)芯片的自動上料、定位、封裝和檢測等全過程的自動化操作,大大提高了生產效率和產品質量。同時,通過引入人工智能和機器學習算法,封裝設備還能夠實現(xiàn)生產過程的優(yōu)化和故障預測,進一步提高生產效率和設備的可靠性。
為了適應這些新需求,封裝設備制造商不斷進行技術創(chuàng)新和產品升級。在這場全新的技術博弈中,奧芯明作為 ASMPT 在中國市場設立的獨立運營品牌,致力于提供先進封裝設備與解決方案。奧芯明不僅整合 ASMPT 的全球技術優(yōu)勢,還結合本土研發(fā)、供應鏈優(yōu)化及行業(yè)定制化能力,為中國市場提供更具適配性的封裝設備與工藝技術。
目前,奧芯明提供的解決方案覆蓋了從薄膜沉積、激光開槽切割,到精密電子和光學元件的成型、組裝、封裝和檢測等一系列環(huán)節(jié),產品組合豐富多樣,可以滿足大規(guī)模生產的需求,并被廣泛應用于HPC、AI、光通信、IGBT和新能源等領域。
在人工智能領域,奧芯明依托ASMPT的全球技術積累,同時結合本地工程優(yōu)化與工藝創(chuàng)新,提供熱壓式固晶(TCB)、混合鍵合(HB)等先進封裝技術,助力AI算力芯片和高性能計算的突破。奧芯明在本土設立研發(fā)團隊,與行業(yè)客戶深度合作,優(yōu)化封裝工藝,以適配中國 AI 芯片產業(yè)的特定需求。
公司的熱壓式固晶廣泛應用于各種先進邏輯以及存儲芯片;混合鍵合式固晶(HB)從早期的CIS和3D NAND堆疊等應用的晶圓到晶圓混合鍵合,到現(xiàn)在最新die to wafer的HPC和數(shù)據(jù)中心的邏輯芯片異質集成以及存儲器的3D堆疊;Fan-out固晶適用于2.5D、扇出和嵌入式應用;覆晶(FC)高精度固晶亦在AI算力芯片占據(jù)一定的市場。
通過提供卓越的一站式封裝解決方案,奧芯明正在助力客戶在高性能計算領域取得更大的突破和創(chuàng)新。例如:
-熱壓鍵合機(TCB Bonders)
作為AI及其服務器中最高端邏輯芯片組裝的關鍵技術,奧芯明的熱壓鍵合(TCB)從芯片到基板(C2S)、芯片到晶圓(C2W)逐步進化,現(xiàn)已成為超精密、高吞吐量的可擴展解決方案。它能夠滿足未來行業(yè)需求,提升集成度和效率,增強芯片整體的性能。
ASMPT是全球首家開創(chuàng)具有惰性氣體保護環(huán)境的TCB機臺的公司,奧芯明的 TCB 設備基于 ASMPT 在惰性氣體保護環(huán)境技術上的全球領先經驗,并針對中國封測市場的實際需求進行了優(yōu)化。通過在所有 TCB 機臺上配置氮氣保護,奧芯明進一步提升了鍵合的穩(wěn)定性與封裝可靠性,為 HPC 和 AI 芯片制造提供高精度、高一致性的封裝工藝。
-無助焊劑熱壓鍵合(Fluxless TCB)技術:
在先進封裝的互連密度不斷提升的趨勢下, ASMPT 率先推出 fluxless TCB 技術,并在全球范圍內廣泛應用。奧芯明基于這一技術突破,結合中國封測行業(yè)的需求,對其工藝進行了本地優(yōu)化,提供更高效的封裝方案,進一步幫助客戶可以通過TCB鍵合提升產品互聯(lián)密度并且降低成本,同時該技術支持30微米甚至更薄的芯片封裝,適用于 HBM(高帶寬存儲)堆疊,并能大幅提高封裝良率。
Firebird 系列機型主要針對先進TCB技術應用,主要機型包括FB-SW、FB-XD、FB-XHI等,可以處理不同的產品以及要求。
-HBM封裝技術
HBM作為一種新型的內存技術,因其高數(shù)據(jù)傳輸速率和低功耗特點,廣泛應用于圖形處理單元(GPU)、深度學習加速器和高性能計算(HPC)等領域。HBM允許芯片以更高的速度處理數(shù)據(jù),這在當今數(shù)據(jù)暴增的時代顯得尤為重要。
針對這一市場需求,奧芯明依托ASMPT的技術積累提供的FB-XHI熱壓鍵合機,結合flux less TCB技術能夠有效提升HBM模塊的生產效率和良率,通過精確的溫度控制和精細的焊接工藝,確保多層芯片之間的連接質量。通過將多層DRAM芯片封裝在一起,HBM顯著提升了存儲性能和容量,優(yōu)化能效,為AI和大數(shù)據(jù)處理提供了強有力的支持。
結語
盡管DeepSeek通過算法層三大突破——低秩鍵值壓縮、動態(tài)稀疏MoE架構及GRPO強化學習框架,顯著降低千億參數(shù)模型的推理延遲與算力需求,其API成本僅為OpenAI同級別模型的千分之一,但是AI芯片性能的瓶頸仍將催生先進封裝技術加速突破,進而帶動上游先進封裝及封裝設備的需求攀升。
從Deepseek大模型的驚艷亮相,到幕后的奧芯明在封裝技術的默默深耕,中國科技企業(yè)正在兩條戰(zhàn)線上同步突破:一面以算法創(chuàng)新定義應用場景,一面以硬核技術夯實算力底座。在這場生成式AI驅動的變革中,奧芯明不僅是先進封裝設備的供應商,更是中國半導體產業(yè)從“跟隨”到“引領”的關鍵支點。
可以預見,新人工智能經濟即將到來,而生成式AI的爆發(fā)僅是起點,隨著量子計算、腦機接口等技術的演進,算力需求將呈指數(shù)級增長。這將帶動半導體需求的增長,并加速先進封裝技術的發(fā)展。面對這一趨勢,奧芯明的技術布局,正為這場持久戰(zhàn)儲備關鍵彈藥,公司將繼續(xù)專注于下一代先進集成封裝技術,如HI/SiP、硅光子學(SiPh)和共封裝光學(CPO)等,積極探索其在生成式 AI 領域的應用,為AI芯片性能釋放構建堅實底座。