行業巨頭都在打造靠異構算力,這種架構已經“搶跑”
根據IDC的預測,到2023年,中國的人工智能芯片出貨量將達到133.5萬片,同比增長22.5%。這一預測得到了11月29日在北京舉行的2023人工智能計算大會的證實。
會上,與大模型和生成式人工智能的發展相關的智能算力市場的增長被強調,智能算力規模增速快于通用算力,預計2022年至2027年中國智能算力規模年均復合增長率將達到33.9%,而同期通用算力規模年均復合增長率僅為16.6%。 業內人士指出,打造異構算力、建立開放生態、突破高性能算力瓶頸已成為共識。目前,許多大模型企業都愿意主動適配國產芯片,這將為國產芯片帶來新的發展機遇。
“通用”與“專用”相向而行
從20世紀60年代的字符終端時代到如今的智能計算時代,數據的量和質都發生了顯著的變化。以文本、圖表為主的結構化數據比例不斷下降,融媒體數據、實時處理的傳感級數據等非結構數據,以及深度學習的元數據的持續激增,將越來越多種類、精度的數據以更快的速度進行傳輸和處理,并成為智能計算的剛需。
作為通用處理器的代表型廠商,英特爾已經將異構計算作為應對AI時代算力挑戰的關鍵戰略。如果將數據看作食材,CPU就相當于“瑞士軍刀”,適用于一切食材,卻不一定能將所有食材處理得又快又好。GPU、FPGA、DSP等專用處理器的加入,讓計算架構能更有效地應對場景化數據。
“異構計算的產業的基礎是數據的爆炸式增長,這其實是我們發展異構計算的主要驅動力。”英特爾架構、圖形和軟件集團副總裁兼中國區總經理謝曉清在接受《中國電子報》采訪時指出,“CPU提供的是通用型計算的能力,解決的問題很廣義。但是GPU、FPGA,或者AI加速芯片解決的是特定領域的問題。現在很多數據的產生都有一定的特點,以至于在CPU上的運算效果不一定是最理想的,在GPU或者其他并行計算能力高的芯片上會跑得更好,這是異構計算的主要驅動力。”
作為專用處理器廠商,賽靈思從器件向異構平臺的轉變也已開始。賽靈思大中華區核心市場業務發展總監酆毅向《中國電子報》記者指出,智能駕駛正在從ADAS逐漸向全面自動駕駛持續演進,傳感器數量的增多勢必會帶來爆炸式的數據增長,這就需要汽車具備強大的異構計算平臺。在工業視覺領域,機器人技術、工業PC、I/O的模塊、智能傳感器、人機界面等都在產生不同類型的數據。在專業音視頻和廣播領域,從內容采集到內容消費的全部過程也需要遠程管理不同的服務器和計算平臺。
“單獨的計算架構,無法滿足越來越多樣的開發需求,因此,異構計算是未來的發展之路。”酆毅指出,“伴隨工藝的進步,FPGA也打破了傳統的應用邊界,進入到AI、數據中心、視頻處理、自動駕駛、5G等新興領域中。而FPGA也通過集成標量處理引擎、自適應硬件引擎和智能引擎,完成了從器件到異構平臺的轉變。”
三大廠商引領異構計算
現在隨著5G、AI、云計算等新興領域對計算量的需求,已經超過了通用CPU的發展速度,僅通過提升CPU時鐘頻率和內核數量而提高計算能力的傳統方式遇到了散熱和能耗瓶頸,所以需要GPU、FPGA、DSP,現在還多了DPU,這些計算單元去配合CPU進行并行計算,大家分工協作,“專人干專事”,以此來很好的滿足這些計算需求。
而英特爾、AMD、英偉達三大廠商最近的一些列集中的動作更是把異構計算推上了風口浪尖:
英特爾CPU+GPU新架構Falcon Shores
英特爾在最近的投資者會議中提出了一個新架構——Falcon Shores。這是一款將X86和Xe GPU 整合到一個Xeon插槽中的新架構。該架構將利用英特爾埃米時代工藝技術、下一代封裝、英特爾正在開發的新型超帶寬共享內存以及領先的I/O技術。他們預計,相對于當前平臺,Falcon Shores將提供超過5倍的每瓦性能、超過5倍的計算密度增加以及超過5倍的內存容量和帶寬提升。
英偉達Grace CPU
2021年4月,英偉達公布了其首款代號為Grace的CPU產品,這是專為人工智能和超算使用需求打造的。該產品采用下一代Arm Neoverse內核,在NVIDIA放出的設計示圖中,Grace CPU是以MCM(Multi-Chip Module,多芯片模組)形式構成,包括CPU、GPU、DPU和帶有ECC的LPDDR5x的新型高帶寬內存子系統,輔以使用 NVLink 通道技術。可以說是專為連接英偉達GPU所設計。據悉,Grace預計在2023年發布。
對于英偉達來說,Grace CPU的研發將對其意義深遠,使其不必完全受制于AMD和英特爾在CPU上的的合作關系,可以說是自立自強的一個表現。因為即使GPU的并行能力不斷提高,但GPU終究在加速運算中扮演資料運算,仍需搭配CPU執行基本的系統,以及由CPU 發號運算的命令,所以GPU和CPU之間的溝通很重要。而x86架構的CPU又受限PCIe頻寬的影響,GPU與CPU之間溝通效率很低,無法滿足巨量數據傳輸處理效率需求,此前英偉達為了解決這個問題,研發了高速通道技術NVLink,但合作伙伴只有較冷門的IBM Power,而市場占有率較大的英特爾和AMD都有自身的加速器,自然也不會加入英偉達的支援陣列。
AMD收購賽靈思,補齊FPGA產品線
近日AMD完成了對賽靈思的收購,AMD的CPU和賽靈思的FPGA,未來也將走向CPU+FPGA的異構整合中。因為,這條路英特爾已經趟過,收購了Altera之后,FPGA產品線在英特爾中發揮的不錯,2018 年,英特爾宣布將“Skylake”至強SP處理器 Arria 10 FPGA 混合在一個封裝中的產品。FPGA在現成CPU 上運行的編程語言和用于實現某些功能或軟件堆棧的定制ASIC之間的邊界仍然具有吸引力。
總之,收購賽靈思之后,AMD 設計的每個計算設備,無論是單芯片還是封裝中的Chiplet集合,都可以在 AMD 認為合適的時候添加一些可編程邏輯。
英特爾向GPU擴展的動作很大,英偉達研究CPU自立自強的決心也很大,氣勢正旺的AMD有了FPGA也如虎添翼。隨著三大廠商逐漸補齊產品線,異構計算或將進入全面爆發。未來,異構計算會越來越多的取代原來通用計算不擅長的部分。
國內芯片廠商跟進
不同于國際大廠在各方面實力雄厚,國內廠商難以在短時間內形成如此全的產品線,但是國產芯片廠商現在已經漸漸開始選擇通過投資和合作的方式埋下異構的種子。
2021年11月,GPU芯片企業壁仞科技,與IDG資本、字節跳動等共同參與了國產DPU初創企業云脈芯聯數億元的天使輪投資。據壁仞科技創始人、董事長、CEO張文透露,除了DPU之外,從布局整體計算產業出發,壁仞科技正在密切關注國產CPU的最新發展,未來形成CPU+GPU+DPU的全國產系統級解決方案。
日前,DPU芯片廠商云豹智能與AI芯片廠商燧原科技達成了戰略合作,共同研發和提供大規模高性能AI算力平臺解決方案。基于云豹智能云霄DPU和燧原科技云燧T20率先推出了DataDirectPathStorage解決方案,為AI訓練儲存訪問提供更高效的解決方案。在傳統解決方案中,云燧T20訪問存儲時,需要將數據先搬移到系統內存,再由系統內存搬移到目標設備。而基于DataDirectPath Storage技術,云燧T20可通過DPU直接獲得數據,從而繞過系統內存和CPU,讓數據訪問速度更快,訪問延遲更短,系統開銷更小。
此外,國內還有異構處理器IP提供商華夏芯,通過自主設計的Unity統一指令集架構和基于此架構的CPU、DSP、GPU、AI專用處理器系列IP與SoC,在提升性能價格比的同時,顯著降低計算芯片研發成本和研發復雜度,同時縮短研發周期,減少開發人員工作量和降低開發門檻。據悉,華夏芯的Unity和英特爾的OneAPI都是為了簡化編程環境,但不同的是,OneAPI是面向不同體系架構的統一編程環境,Unity是面向不同微架構的統一體系架構和統一編程環境。
RISC-V架構與異構計算相當適配
在異構計算的框架下,RISC-V可謂是如有得水,其提供了遠超x86架構和ARM架構的靈活性,并因為是后起架構,沒有歷史包袱,創新限制更少,因此RISC-V在異構計算時代擁有廣闊的應用前景。
RISC-V在異構計算領域的發展前景是極好的,當然所面對的挑戰也不小。我們都知道,對于RISC-V而言,其在異構計算方面的進展和在高性能方面的進展是同步,異構計算可以被看作是RISC-V沖擊高性能計算市場的重要抓手,那么面臨的挑戰其實和基于RISC-V實現高性能計算便較為一致,當然也會有一些挑戰是從異構計算理念出發的。
實際上,電子發燒友網此前的報道有過此方面的表述,相關言論來自中國科學院軟件研究所總工程師武延軍研究員。對于RISC-V在高性能領域的硬件發展,他表示,“當RISC-V生態發展到一定程度后,將不會再籠統地說一個處理器有多少個核,主頻多少,算力多少。而是講一個處理器中有多少種類型的核心,每一個核心有怎樣的定制能力。這些不同類型的核心集中在一個平臺上,能夠滿足豐富的應用場景需求。”
很顯然,RISC-V想要在異構計算領域有所作為,產品的豐富度和定制性要能夠完美展現,比如目前異構計算延伸出了“XPU”的概念,RISC-V對此都要進行實現。并且,XPU理念現階段還是以ARM架構為主導,RISC-V需要先模仿后超越,全面釋放自己的模塊化和靈活性優勢。在此過程中,基于RISC-V打造的計算芯片還需要滿足通用標準,未來也主導通用互聯標準。
武延軍研究員也在軟件層面講到了RISC-V后續需要強化的點,“往高性能去發展,對于上面的軟件生態是一個非常大的挑戰。可以看到目前還有很多核心的基礎軟件沒有很好地跑在RISC-V平臺上。這里可能會有指令集規范還不成熟的問題,但更多的是這些基礎軟件包之前都是在x86和ARM平臺上面跑,從維護者、社區的角度,還沒有把RISC-V當成Tier-1或者First-Class-Citizen去對待。這里面有理念問題,有投入問題,也有商業利益回報問題。”他對此講到。
因此,RISC-V做異構計算其實并不只是單純豐富芯片種類,提升芯片性能,也需要完善軟件生態,這個難度可能比硬件更大。但無論前路如何充滿荊棘,異構計算都是RISC-V必須把握好的一個產業大趨勢,在處理器架構方面,RISC-V要想實現和x86架構以及ARM架構三分天下,不能一直靠模仿ARM,而異構計算有足夠的市場容量和市場廣度讓RISC-V走出自己的路,這是至關重要的。
