越來越多企業“相中”AI能力,AI芯片需求強勁增長
Omdia的最新研究表明,經過最近幾個季度的戰略庫存調整,預計到2024年,全球半導體供應鏈將達到約6000億美元。令人鼓舞的是,隨著企業越來越多地利用生成式人工智能(AI)的能力,推動整個供應鏈的新需求以至半導體行業的發展。
純晶圓代工行業,是半導體供應鏈不可分割的一部分,呼應了半導體供應鏈的基本基調。Omdia預測,由于需求逐漸恢復以及越來越多的應用端芯片的去庫存完成,純晶圓代工行業將在2024年增長約16%。
值得注意的是,主要科技公司和企業,對生成式AI技術的最新進展產生了濃厚興趣,對人工智能芯片的需求因而增加。Omdia的研究,將探討除GPU主導地位之外的AI加速技術未來格局的關鍵問題,并在即將舉行的2024 Omdia臺灣科技產業研討會上,闡明AI領域當前和未來的競爭動態。
Omdia半導體研究高級分析師溫璟如(Claire Wen)評論道:“NVIDIA目前在AI加速器市場占據主導地位,尤其是在云端和數據中心部署方面。同時,像谷歌、亞馬遜和微軟這樣的主要超大規模云服務提供商,正在開發自己的AI應用專用集成電路(ASIC),以提高針對其獨特的AI工作負載量身定制的成本效率和性能。此外,支持離線AI應用程序執行的緊湊型人工智能模型的問世,邊緣人工智能的采用率顯著提高,尤其是在人工智能電腦和智能手機中。高通利用其在智能手機領域AI功能方面的豐富經驗,在AI電腦市場取得顯著進步。”
HBM需求將增長10倍
韓國存儲巨頭SK海力士的首席執行官Kwak Noh-Jung周三表示,預計到2024年,用于人工智能(AI)芯片組的高帶寬內存(HBM)芯片在其DRAM芯片銷售中的比例將從2023年的個位數上升到兩位數。高盛也看好HBM市場,認為HBM市場供不應求的情況未來幾年將持續,并預計市場規模將從2022年到2026年前增長10倍。
據了解,HBM存儲系統自2023年以來因AI芯片需求而呈現爆炸式增長。SK海力士和美光(MU.US)一樣,均已成為英偉達(NVDA.US)新款AI GPU的HBM存儲系統供應商,提供的產品均為最新款的“HBM3E”。
高盛日前發布研報稱,由于更強的生成式人工智能(Gen AI)需求推動了更高的AI服務器出貨量和每個GPU中更高的HBM密度,該行大幅提高了HBM總市場規模預估,現在預計市場規模將從2022年到2026年前增長10倍(4年復合年增長率77%),從2022年的23億美元增長至2026年的230億美元。
高盛認為,HBM市場供不應求的情況未來幾年將持續,SK海力士、三星和美光等主要玩家將持續受益。與同行的解決方案相比,海力士生產力和產量更佳。高盛預計,海力士在未來2-3年將保持其50%以上的市場份額。
終端市場格局分析
除了云端市場外,我們預計人工智能對于終端市場也有更強的需求,這也將推動人工智能成為終端計算芯片中越來越重要的差異化元素。
在手機端,人工智能的使用頻率將會進一步增強,這也會推動芯片加入更多相應的算力,并且將人工智能支持作為SoC的核心亮點。例如高通發布的Snapdragon 8 Gen 3就以“低于一秒的延遲實現圖像生成任務”作為一個重要賣點,估計這樣的人工智能能力將會深度集成到手機廠商的操作系統中。除了高通這樣的第三方芯片公司之外,自研手機芯片的系統廠商預計也會繼續加碼人工智能;蘋果雖然在這方面保持低調,但是預計在未來會以各種方式(加大NPU算力,或者是加大軟件支持)的方法來開始賦能更多人工智能在iPhone上的新拍攝用戶體驗。vivo在自研ISP芯片領域已經有了數年積累,而目前生成式人工智能對于拍攝體驗的提升恰好和ISP有很強的協同作用,這也是2023年8月vivo發布的v3 ISP芯片強調了生成式人工智能作為一個核心亮點。未來,預計會看到越來越多這樣的芯片強調人工智能對于用戶體驗上的賦能作用。
在智能汽車領域,Nvidia雖然不如在云端強勢,但是其Orin系列芯片仍然是各大車廠考慮的標準芯片模組。我們認為,隨著人工智能大模型對于智能駕駛的賦能作用逐漸加強,無論是第三方芯片還是車廠自研的芯片都將會進一步強化對于人工智能算力的投入,同時也推動芯片性能的快速提升——最近,無論是蔚來發布新自研芯片的算力規格,還是特斯拉傳出將使用TSMC 3nm作為下一代芯片的生產工藝,都在提示著我們2024年人工智能將在智能車芯片領域扮演越來越重要的角色。
推理芯片成新戰場
AI芯片大致可分為訓練芯片和推理芯片兩大類。訓練芯片主要用于深度學習模型的訓練過程,對算力要求極高,因此追求盡可能強大的并行運算能力。而推理芯片則是將訓練好的AI模型部署到實際應用中,完成預測和決策任務。相比之下,推理芯片對算力的需求較小,但對功耗、時延等實時性要求更高。
傳統的CPU和GPU芯片在推理運算方面存在著明顯的能效比不足等缺陷,很難完全滿足推理對實時性的苛刻要求。這直接限制了AI技術在智能手機、無人駕駛汽車等終端設備和邊緣應用中的落地。因此,專門的AI推理芯片應運而生,被認為是釋放邊緣智能潛能的關鍵所在。
借助人工智能的東風,推理芯片市場前景極為廣闊,成為了各路企業新的必爭之地。無論是傳統IT巨頭,還是新興AI芯片創業公司,都在加大力度布局推理芯片賽道。
一方面,英特爾、英偉達、谷歌等科技巨頭憑借資金、技術和生態優勢,已經陸續推出多款專門的AI推理芯片產品。如英偉達的Jetson系列、谷歌的TPU推理加速器等,針對不同場景提供高性能的邊緣AI計算解決方案。
另一方面,一批新興的AI芯片創業公司也站穩了腳跟。寒武紀推出的TerminatorIP產品則提出了一種Cloud-Edge一體化的計算架構,結合推理芯片和訓練芯片,打造無縫連接的端云協同AI系統。地平線則設計了專用于視頻分析的視覺AI芯片及算法,可廣泛應用于安防監控、智能駕駛等領域。
展望未來,推理芯片市場潛力巨大,預計在可預見的幾年內將保持高速增長態勢。這主要得益于人工智能算力需求的持續增長和推理芯片自身先天優勢的釋放。
一方面,隨著AI技術的深入應用,人工智能算力需求正在爆發式增長。據第三方研究機構預測,到2025年,全球AI算力需求將比2022年增長7倍以上。面對如此龐大的算力缺口,單純依賴云端訓練模型已不夠,推理芯片將成為釋放算力潛能的關鍵所在。
另一方面,作為專門設計用于邊緣推理任務的芯片,推理芯片具有低功耗、實時響應等優勢。隨著5G、邊緣計算等技術發展,越來越多智能設備和應用將遷移至邊緣側,對推理芯片的需求也將與日俱增。
在這一背景下,云~邊緣一體化的AI計算架構正在成為行業趨勢。企業期望通過訓練芯片和推理芯片的協同,實現在云端和終端設備上無縫銜接的AI服務交付。未來,更多創新的計算架構和芯片方案有望出現。
