英偉達將引入Chiplet實現高性能AI芯片,這種材料需求量爆發
Chiplet對 Nvidia 來說并不陌生。該公告還為Chiplet作為一個概念增加了更多驗證——許多半導體制造商都指望這一概念在未來幾年幫助保持摩爾定律的活力。
小芯片背后的想法幾乎不是一個新概念。幾十年來,該行業一直在制造多芯片模塊:例如,Mostek 在 1979 年將兩個 MK4116 16-Kbit DRAM 芯片放入雙腔陶瓷封裝中,創建了 MK4332D 32Kbit DRAM。英特爾還將 CPU 芯片和一個1995 年底推出的 Pentium Pro 中的 SRAM 芯片。這些多芯片模塊 (MCM) 使 Mostek 和 Intel 能夠超越其半導體工藝的局限,創造出“超越摩爾”的封裝設備。
Chiplets 的兩大優勢
Xilinx Virtex-7 2000T 和 580HT 展示了小芯片提供的兩個最大優勢。
對于 Virtex-7 2000T,使用硅中介層將四個 28 納米 FPGA 小芯片組裝到一個封裝中,使 Xilinx 能夠構建更大的 FPGA,這可以通過單片 28 納米芯片實現。中介層允許半導體制造商通過將大型芯片組裝成比單個芯片可能更大的馬賽克來超越晶圓步進機的光罩限制。
Virtex-7 580HT 刪除了 Virtex-7 2000T 的四個 FPGA 小芯片之一,并用 28Gbps 收發器小芯片取而代之,當時無法使用主流 28nm 數字 CMOS 工藝制造 28Gbps 收發器FPGA小芯片。
因此,小芯片提供的第二個優勢是能夠混合和匹配使用不同工藝節點制造的芯片,很可能來自不同的代工廠。與主流和前沿數字工藝節點明顯不同的重要工藝節點包括模擬工藝、內存工藝(例如 DRAM 工藝,特別是高帶寬內存(HBM)內存堆棧的形式)和高電流或高電壓工藝——尤其是特殊工藝,例如用于光子學的砷化鎵 (GaAs) 和用于功率半導體的碳化硅 (SiC)。
Chiplet:AI 芯片算力破局之路
伴隨摩爾定律逼近物理極限,提升制程工藝和芯片面積將面臨大幅的良率下降、成本增加,性能提升收益邊際降低。此外,2022 年 10 月以來,美國持續對國內半導體產業施壓,限制中國獲取先進制程芯片產品和代工服務,對于國內 AI 芯片廠商而言,架構創新或將成為提升算力另辟蹊徑的選擇。
chiplet 工藝讓我們看到通過架構創新實現算力跨越的可能,國內AI 芯片廠商亦已經進行了成功嘗試。
2022 年 8 月,國產 GPU 廠商壁仞科技發布 BR100 系列 GPU,其采用 7nm 制程,實現了高達 2048TOPS INT8 算力,創下全球 GPU 算力新紀錄。BR100 之所以能實現強大的性能,得益于 Chiplet 工藝的運用。BR100 包含 2 顆計算芯粒,通過臺積電 CoWoS-S 工藝 die to die 互連,實現算力的跨越式提升。
但是,AI 芯片、GPGPU 芯片在設計難度、生態壁壘上較 CPU、GPU 更低,同時軟件棧的支持也是 AI 芯片能否大規模導入云服務商的主要矛盾,這導致了國內云計算企業如阿里、百度等均嘗試自研 AI 芯片;這意味著國產芯片供應鏈的機會(如接口芯片、IP 核等)比 AI 芯片的機會更具備確定性。
算力需求提升,導熱材料需求有望放量
最先進的 NLP 模型中參數的數量呈指數級增長。近年來,自然語言處理(NLP)中 的基于 Transformer 的語言模型借助于大規模計算、海量數據以及先進的算法和軟件取得 快速進展。擁有大量參數、更多數據和更長訓練時間的語言模型可以獲得更加豐富、更加 細致的語言理解能力。因此,從 2018 年開始,NLP 模型參數以每年近乎一個數量級的速 度在增長。
AI 大模型的持續推出帶動算力需求放量。ChatGPT-3 模型版本擁有 1750 億個參數, 而此前的 GPT-2 只有 1.5 億個參數。由于參數數量的增加,ChatGPT-3 的訓練時間和算 力需求也大幅增加。為了訓練 GPT-3 模型,OpenAI 需要使用超過 285,000 個 CPU 核心 和 10,000 多個 GPU。訓練 ChatGPT-3 模型的總計算量大約相當于在普通筆記本電腦上 運行 175 億年的計算量,大約是 GPT-2 的數百倍(數據源自 OpenAI 官網)。而且,在推 理過程中,ChatGPT 也需要大量的算力來生成連貫、準確的文本。以中國近年算力規??矗?2016-2021 年算力規模 CAGR 為 47%(數據源自中國信通院)。隨著 AI 大模型等對參數 需求大幅提升,全球對于算力的需求預計將呈現爆發式的增加。
面對算力缺口,Chiplet 或成 AI 芯片“破局”之路。ChatGPT 等 AI 應用蓬勃發展, 對上游 AI 芯片算力提出了更高的要求,頭部廠商通過不斷提升制程工藝和擴大芯片面積推 出更高算力的芯片產品。然而在后摩爾時代,制程升級和芯片面積擴大帶來的經濟效益銳 減,架構創新如 Chiplet 或將成為提升芯片算力的重要途徑。Chiplet 技術除了成本和良率 端的優勢,還能夠在最大程度上提升芯片的算力以滿足不同應用的需求。
Chiplet 技術是提升芯片集成度的全新方法。Chiplet 指的是將芯片的不同芯粒分開制 備后再通過互聯封裝形成一個完整芯片。Chiplet 較小的硅片面積不太容易產生制造缺陷, 因此可以避免大算力芯片良率太低的問題。芯粒可以采用不同工藝進行分離制造,可以顯著降低成本。此外,Chiplet 技術帶來高速的 Die to Die 互連,使得芯片設計廠商得以將多 顆計算芯粒集成在一顆芯片中,以實現算力的大幅提升。
芯片算力提升對導熱材料的要求不斷提升。Chiplet 技術的核心思路在于盡可能多在物 理距離短的范圍內堆疊大量芯片,以使得芯片間的信息傳輸速度足夠快。隨著更多芯片的 堆疊,不斷提高封裝密度已經成為一種趨勢。隨著封裝密度的提高,單位電路的功率也不 斷増大以減小電路延遲,提高運行速度;同時,芯片和封裝模組的熱通量也不斷増大,顯 著提高導熱材料需求。
全球 Chiplet 市場增長強勢。隨著下游人工智能(AI)、虛擬現實(MR)、物聯網(IoT) 的不斷發展,高算力的要求成為的未來趨勢,Chiplet 技術或成為未來的主流芯片制造方案。 據 Omida 測算,全球 Chiplet 市場規模將從 2018 年的 6.45 億美元逐步攀升至 2024 年的 24 億美元,CAGR 為 44.2%。近年,全球頭部導體公司都已經開始布局 Chiplet,已經有 商業化設備公布。
數據中心的算力需求與日俱增,導熱材料需求會提升。根據中國信通院發布的《中國 數據中心能耗現狀白皮書》,2021 年,散熱的能耗占數據中心總能耗的 43%,提高散熱能 力最為緊迫。隨著 AI 帶動數據中心產業進一步發展,數據中心單機柜功率將越來越大,疊 加數據中心機架數的增多,驅動導熱材料需求有望快速增長。
5G 通信基站相比于 4G 基站功耗更大,對于熱管理的要求更高。根據廣州 4G/5G 基 站功耗的實際測試結果,5G 基站的有源天線單元(Active Antenna Unit,AAU)或遠端射 頻單元(Radio Remote Unit,RRU)的能耗相比于 4G 基站高出 3-5 倍,基帶處理單元(Base Band Unit,BUU)的功耗也比 4G 基站高出 30%-50%。綜合來看,5G 基站能耗大約為4G 基站的 3-4 倍。能耗的提升對導熱材料提出更高要求,因此 5G 基站中多采用高效導熱 的 TIM 材料以應對高能耗帶來的高熱負載。
未來 5G 全球建設會為導熱材料帶來新增量。截止 2022 年 12 月,我國完成的 5G 基 站數超過 230 萬個,占全球基站的超過 60%。當前我國的萬人人均 5G 基站數已經達到了 16.3 個,遠遠大于全球平均水平。伴隨著未來全球的 5G 基站逐步建設,對導熱材料的需 求預計將持續存在。
消費電子在實現智能化的同時逐步向輕薄化、高性能和多功能方向發展。隨著集成電 路芯片和電子元器件體積不斷縮小,手機機身厚度越來越薄,但由于功能件數量增多,手 機功率密度和發熱量快速增加。此外,無線充電和快充技術的普及也加大了散熱的需求和 難度。簡而言之,電子產品的性能越來越強大,而集成度和組裝密度不斷提高,導致其工 作功耗和發熱量的急劇增大,提高散熱需求。
新能源車產銷量不斷提升,帶動導熱材料需求。2017-2022 年我國新能源汽車產銷量 迅速攀升。據中國汽車工業協會披露,2022 年國內新能源汽車銷量為 688.7 萬輛,同比 增加 96%,產量為 705.8 萬輛,同比增加 99%。由于新能源車單車導熱材料的價值高于 傳統燃油車,新能源車滲透率的上升將帶動導熱材料的需求上漲。
