繼續打破摩爾定律,Blackwell芯片發展到了哪一步了?
英偉達的路線圖將每年更新
在最近的演講中,黃仁勛詳細闡述了英偉達芯片產品的年度升級周期計劃,該計劃將堅持遵循數據中心規模、年度更新頻率、技術約束以及統一架構的發展路徑。
具體而言,英偉達將依托當前最先進的半導體制程技術,通過采用統一的架構來覆蓋整個數據中心GPU產品線,并致力于實現每年一次的產品更新迭代。
黃仁勛強調指出,英偉達憑借CUDA+GPU的組合策略,成功構建了安裝量持續增長、開發者及應用日益豐富、研發規模不斷擴大、性能持續提升的良性生態循環。
目前,CUDA生態已遍布全球各地,得到了廣泛應用。
例如,谷歌已宣布將cuDF納入其云計算平臺,以加速世界范圍內受歡迎的數據科學庫Pandas的運行。
此外,在深度學習cuDNN、物理模擬Modulus、通信Aerial RAN、基因序列分析Parabricks以及量子計算模擬cuQUANTUM、數據處理cuDF等多個領域,均有專業的CUDA軟件提供支持。
黃仁勛表示,英偉達的路線圖將保持年度更新的節奏,其核心思想在于[構建數據中心規模的產品體系,以年度為周期逐步推進并實現技術突破,向客戶提供高質量的產品和服務]。
他進一步承諾,英偉達不會滿足于現狀,將繼續致力于提升產品性能、降低訓練和推理成本,以及拓展AI功能,以滿足不斷增長的市場需求和技術挑戰。
量產Blackwell及Rubin架構的路線圖亮相
今年三月,英偉達在其盛大的年度GTC大會上,正式發布了具備2080億晶體管的Blackwell芯片。
這款芯片是英偉達首次采用MCM(多芯片封裝)技術設計的GPU,實現了在同一芯片上集成雙GPU的突破。
英偉達創始人兼CEO黃仁勛在會上指出,在短短八年的時間里,英偉達的AI算力實現了驚人的飛躍。
從2016年Pascal芯片的19 TFLOPS,到2024年Blackwell芯片的20000 TFLOPS,算力提升了高達1000倍,這一增速幾乎超越了摩爾定律在最佳時期的發展速度。
搭載Blackwell芯片的最新DGX超算系統在各項性能指標上均實現了顯著提升。
相較于上一代Hopper系統,Blackwell系統不僅在NVLink域集成了72個GPU,實現了性能9倍的提升,同時在NVLink帶寬方面也實現了18倍的增長,AI算力更是提升了45倍,供能效率也提高了10倍。
目前,市場對GB200充滿期待,業界普遍預測,到2025年,GB200的出貨量有望突破百萬顆,占據英偉達高端GPU出貨量的近40%至50%。
此外,黃仁勛還公布了英偉達未來三代芯片的發展路線圖,包括計劃于2025年推出的Blackwell Ultra,2026年亮相的Rubin,以及2027年預計推出的Rubin Ultra。
值得一提的是,這也是下一代AI平臺Rubin的首次公開亮相。
目前,英偉達已經開始量產其高性能GPU架構Blackwell,相關產品將陸續上市,包括適用于HPC/AI領域的B200/GB200系列,以及面向游戲市場的RTX 50系列。
同時,黃仁勛還透露了Rubin架構的未來發展藍圖,該架構將配備全新的GPU、基于Arm架構的Vera CPU,以及采用NVLink 6、CX9 SuperNIC和X1600融合InfiniBand/以太網交換機的高級網絡技術。
展望未來,英偉達將繼續按照既定的發展計劃推進芯片研發與生產。
預計2024年Blackwell芯片將全面投入生產,2025年推出Blackwell Ultra產品,2026年發布Rubin系列,最終在2027年推出集大成之作——Rubin Ultra,并配備基于Arm的Vera CPU和先進的NVLink 6 Switch技術。
數據中心將進入數百萬GPU時代
NVIDIA創始人兼CEO黃仁勛正式宣布,公司將每年定期推出全新的Spectrum-X系列產品。
作為全球首款專為AI領域打造的以太網網絡平臺,NVIDIA Spectrum-X相較傳統以太網網絡平臺,在網絡性能上實現了顯著提升,高達1.6倍,有效加速了AI工作負載的處理、分析以及執行速度。
在Spectrum-X系列中,Spectrum-X800專為數萬個GPU量身打造,而X800 Ultra則針對數十萬個GPU進行了優化,至于X1600,其擴展能力可支持至數百萬個GPU,展現出強大的靈活性與可擴展性。
目前,在競爭激烈的高性能以太網市場中,NVIDIA Spectrum-X亦面臨著來自行業巨頭如Intel和Mellanox的強勁挑戰。
值得一提的是,CoreWeave、GMO Internet Group、Lambda、Scaleway以及STPX Global Yotta等眾多領先的AI云服務提供商已率先采用NVIDIA Spectrum-X,為其AI基礎設施帶來了前所未有的極致網絡性能體驗。
用Isaac生態系統迎接機器人時代
黃仁勛明確指出,英偉達正致力于通過推進機器人技術堆棧以加速物理AI的生成。
這一進程涵蓋了多個關鍵組件,包括適用于模擬應用的Omniverse平臺、具備人形基礎模型特征的Project GR00T,以及提供強大計算能力的Jetson Thor機器人計算機。
英偉達發布的NVIDIA Isaac平臺,旨在為開發人員提供一套功能強大的工具集合,用以構建各類AI機器人,這些機器人類型廣泛,包括但不限于自主移動機器人(AMR)、工業機械手臂以及人形機器人。
這一平臺的強大能力得益于AI模型的支持,以及Jetson Orin和Thor等超級計算機的運算能力。
NVIDIA Isaac Lab作為Isaac Sim中的參考應用程序,特別針對AI機器人基礎模型的訓練進行了優化,包括強化學習、模仿學習和遷移學習等多種方法。
這一功能為機器人應用提供了強大的基礎模型訓練支持,覆蓋了多個應用場景,從而顯著提升了機器人的性能和智能化水平。
目前,Isaac生態系統正經歷著迅猛的發展。全球多家領先的機器人行業企業,如比亞迪、西門子、泰瑞達和Intrinsic等,已將NVIDIA Isaac加速庫、基于物理學的仿真技術以及AI模型集成至其軟件框架和機器人模型中。
這些舉措極大地提高了工廠、倉庫和配送中心的工作效率,使得機器人成為執行重復性、高精度任務的智能助手,為各行各業帶來了革命性的變革。
新一輪工業革命開始,AI工廠正在誕生
在今年的五月份財報會議上,黃仁勛明確指出,下一場工業革命已然拉開帷幕。
此次革命不僅限于云服務提供商,生成式AI技術已廣泛滲透到消費互聯網公司、各類企業、主權AI、汽車制造以及醫療保健等諸多領域,成功塑造了多個價值數十億美元的垂直市場。
英偉達,作為技術領域的領軍企業,正站在新一輪增長浪潮的起點之上。
為積極響應并推動此次技術革命,英偉達攜手眾多制造廠商,共同推出了一系列基于NVIDIA Blackwell架構的先進系統。
這些系統不僅配備了Grace CPU,還融入了NVIDIA領先的網絡和基礎設施技術。
為加快不同規模與配置的系統開發進程,英偉達旗下的MGX模塊化參考設計平臺已全面支持這一系列新系統。
英偉達向世界展示了一個全新的未來圖景,即加速計算正成為引領新一輪產業革命的核心力量。
人類首次通過僅3萬億美元的IT產業,創造出能夠直接服務于100萬億美元產業的全方位技術解決方案。
此外,隨著傳統軟件工廠向現代化AI工廠的轉型,我們見證了從CPU到GPU、從信息檢索到內容生成、從簡單指令處理到大模型應用、從單一工具使用到多元技能融合的全面升級。
這一變革不僅推動了技術棧的深刻重塑,更預示著未來產業發展的無限可能與廣闊前景。
建立350+加速庫,算力將增長1000倍
為了充分發揮GPU加速計算的潛力,開發專業的加速庫顯得尤為重要。
英偉達團隊已成功推出超過350個面向特定領域的加速庫。
這些卓越的加速庫囊括了業界聞名的深度學習加速庫cuDNN、物理模擬庫、5G無線電加速庫Aerial、芯片制造加速平臺Coolitho、基因測序加速庫Pair of Bricks以及組合優化加速庫Co OPT等。
它們被廣泛應用于醫療健康、金融、計算機、汽車等多個行業領域,并深入覆蓋至科學研究的前沿陣地,如量子計算機仿真系統Coup Quantum等。
值得一提的是,谷歌云端已率先部署了英偉達的數據處理加速庫QDF,使得廣受歡迎的數據科學庫Pandas的性能得以數百倍的提升。
在展望未來時,黃仁勛公開披露了英偉達的長期戰略規劃藍圖。
公司已為未來八年做好了充分準備,預計屆時算力將實現驚人的千倍增長。
為實現這一具有里程碑意義的宏偉目標,黃仁勛先生透露了英偉達即將啟動的重大舉措——即實施令牌(Token)計劃。
展望未來,無論編寫何種類型的代碼,都需要將其轉化為AI系統能夠理解的令牌序列。
英偉達期望通過這一創新性的方式,構建出一個真正統一的AI編程模型,為未來的科技發展奠定堅實基礎。
結尾:
業內人士普遍認為,科技巨頭們致力于追求的核心目標,便是率先實現通用人工智能的突破。
盡管目前尚無法準確預測AGI的實現還需多久,但顯而易見的是,在新一輪的創新周期中,AI將成為決定科技競爭格局的關鍵因素。
