被炒至30萬元一顆!這顆英偉達芯片對產業的影響分析
3月21日,英偉達在美國召開年度開發者大會(GTC)上表示,ChatGPT等生成式AI的出現,標志著AI的“iPhone”時刻來臨,以英偉達H100為代表的AI 訓練芯片有望迎來量價齊升。
英偉達DGX——AI大語言模型背后的核心引擎
2023年3月15日,OpenAI正式官宣了多模態大模型GPT4,其能力已接近人類水平。通過以搜索引擎和辦公軟件為支點,AI下游應用多點開花。GPT4作為大型多模態模型支持圖像和文本的輸入,背后是大語言模型的演進與參數量、訓練數據量的指數級增長,帶動AI服務器需求量快速上漲。 AI邁入大模型時代,參數量過千億 資料來源:浙商證券 根據GTC2023,DGX配有8個H100GPU模組,H100配有Transformer引擎,旨在支持類似ChatGPT的大模型。這8個H100模組通過NVLINKSwitch彼此相連,以實現全面無阻塞通信。8個H100協同工作,形成一個巨型GPU。通過400Gbps超低延遲的NVIDIAQuantumInfiniBand進行網絡內計算,將成千上萬個DGX節點連接成一臺AI超級計算機,并不斷擴展應用范圍,成為全球客戶構建AI基礎設施的藍圖。
NVIDIA DGXH 100 超級計算機結構 資料來源:GTC2023 根據英偉達測算,要完成一次10000億參數大語言模型的訓練,使用4096顆A100 GPU約需4周時間,使用4096顆H100GPU約需1周時間。按每臺服務器配備8顆H100GPU計算,則完成一次萬億參數的大語言模型訓練需約500臺服務器,配備8個H100GPU的服務器價格約為40萬美元,則單個大語言模型訓練驅動AI訓練服務器約2億美元需求。 從下游需求看,ChatGPT、文心一言等AIGC大模型帶來計算資源需求井噴,催生AI服務器需求快速增長。據IDC數據,2021年全球AI服務器市場規模156億美元,預計到2025年全球AI服務器市場將達到318億美元,21-25CAGR為19.5%;2021年中國AI服務器市場規模達52億美元,預計2025年中國AI服務器市場規模將達到105億元,2021-2025年的CAGR為19.0%。按照中高端服務器GPU占比35%-60%測算,則2025年全球AI服務器GPU芯片規模不低于111億美元。
資料來源:IDC
下游客戶看,2022年AI服務器采購量中,北美四大云端供應商微軟、谷歌、Meta、亞馬遜合計占比約66%,而中國近年來AI建設浪潮持續升溫,字節跳動年采購占比達6.2%,騰訊、阿里巴巴、百度緊接其后,分別約為2.3%、1.5%與1.5%。 資料來源:IDC 近期,隨著市場熱度及終端需求飆升,英偉達最新的顯卡H100芯片在美國電商平臺eBay上的售價已經超過4萬美元,甚至有些賣家標價高達6.5萬美元。短期來看,作為服務器GPU領導者,英偉達將直接受益于AIGC大熱帶來的核心算力硬件性能需求提升。 資料來源:英偉達、芯八哥整理
AI訓練芯片競爭格局
從全球市場來看,英偉達和AMD為AI訓練GPU芯片領域代表性廠商,二者占據市場絕大部分份額,Intel和谷歌為代表競爭對手仍處于早期階段。 資料來源:IDC 具體而言,目前AI訓練市場主要采用英偉達V100/A100/H100芯片,以及AMD推出的AI訓練芯片包括MI250/250X/300等。 資料來源:芯八哥整理 中國市場方面,英偉達占比超過92%,呈現出“一家獨大”,但以寒武紀及華為海思為代表的國產廠商取得了一定突破。 資料來源:IDC 具體來看,近年來國內AI訓練芯片進展較快,但與英偉達在性能和生態有一定差距。以云邃T20產品為例,其32位單精度浮點性能達32TFLOPS,高于A100的19.5TFLOPS,且在功耗上更具優勢,但內存寬帶不足A100的1/3,在應對機器學習和深度學習的帶寬需求上仍有差距。寒武紀去年年底推出思元590系列可能在部分模型上由于其ASIC專用性表現出更優異的性能,但仍需要后期適配和技術支持。 資料來源:各公司官網、芯八哥整理
H100對產業格局的影響分析
當前,AI正在成為這個時代最具影響力的技術力量,各類 AI+應用即將落地,像ChatGPT對話機器人,以及特斯拉即將自動駕駛中引入AI學習框架,傳統應用在引入AI后將迎來巨變。可以看到,英偉達發布H100后,逐漸完成了由 GPU 顯卡供應商向軟硬件一體 AI 解決方案供應商的轉變后,形成了競爭對手難以企及的平臺化優勢。 具體來看,其相對于競爭對手而言,對于產業格局的影響力在于: (1)硬件端產品布局齊全且性能突出,公司在數據中心業務中完成CPU+DPU+GPU的組合布局。數據中心GPU市占率遙遙領先,H100、A100等高端訓練卡供不應求,且性能大幅度領先競爭對手AMD的同代產品,而英特爾仍處于起步階段。 (2)軟件端前瞻布局,競爭對手稀少。CUDA平臺是目前最適合深度學習、AI訓練的GPU架構。主要競爭對手AMD的ROCm平臺在用戶生態和性能優化上還存在差距。其本身豐富的工具、領先的技術疊加沒有競爭對手的先發優勢將持續鞏固公司在元宇宙以及數字工業領域的優勢。 短期內,AIGC產品與應用的步落地催生了巨大的算力需求,英偉達將直接受益于AIGC大熱帶來的核心算力硬件性能需求提升,H100為代表的業務有望迎來量價齊升。 長期來看,以H100為代表的軟硬件結合的平臺化布局隨著未來AI應用范圍的深入和拓展,英偉達有望成為平臺化布局的最大受益者。
