Imagination:數據中心跨入“智算”時代 “軟硬協同”能否成“芯變”良方?
Imagination人工智能產品營銷高級總監Andrew Grant:“相比從硬件轉向軟件,將會更多地出現從使用GPU這樣更通用的元件轉向關注ASIC。尤其在AI領域,擁有專為與GPU協同工作及增強GPU批量計算能力而設計的電路,就可以持續支撐AI任務中不斷增加的數據量和復雜性。NNA就是這樣一種ASIC,它將持續開拓數據中心的AI和機器學習功能。當與GPU的通用計算協同實現,并與高效、豐富的數據集和算法集成在一起時,跟上AI的發展步伐將變得更加可控。”
如今的服務器芯片市場正積極擁抱“多樣化”。結合當前的市場形勢,這種多樣化不僅限于指令集和IP核,在微架構層面上,為解決當下實際應用中日益突出的算力不足、功耗過高以及由此衍生的各類成本問題,行業也迫切需要發起一場“芯變”。
服務器芯片市場的“質變”
以傳統數據中心當中采用的GPU為例,Imagination人工智能產品營銷高級總監Andrew Grant認為:“對于從機器學習和AI到云游戲的眾多數據中心應用而言,使用GPU是因為其可提供大規模的并行算力。然而,傳統的數據中心GPU最大的缺點之一是其產生的熱量和能耗。這將引發兩方面的問題,首先,它們的供電和冷卻成本會非常高。其次,也是更重要的,這意味著它們無法在現有的機架中高密度部署,進一步意味著數據中心每平方米的單位計算密度更低。”
為此,Imagination開發了非常適合數據中心的GPU方案,但這種方法并不是把高耗能的桌面級GPU組件精簡后直接用于數據中心,而是利用了Imagination在嵌入式和汽車領域的長期研究成果來降低能耗。
Andrew Grant指出:“這意味著像IMG B系列GPU這樣的產品可以在非常低的功耗限制和散熱配置下提供令人難以置信的高性能。雖然每個單獨的GPU可能不像某些同類產品那么強大,但是我們能夠以無限擴展和高密度機架部署的方式來提高數據中心單位面積的計算密度。對AI工作負載而言,IMG Series4 NNA專用集成電路(ASIC)專為多核集群而設計,是減少數據中心面積的理想選擇,并且作為ASIC,它運行神經網絡任務時的速度比其它組件要快幾個數量級。”
為了進一步挖掘芯片微架構的潛能,AI高性能計算市場也逐漸興起一陣“異構計算”的狂潮,Andrew Grant補充到:“我們注意到人們對異構計算的興趣與日俱增。在異構計算中,特性不同的運算單元被組合在一起,用于處理與其各自設計相適應的任務,例如GPGPU用于浮點運算,加速器用于推理等特定的工作負載。”而加速器可以是FPGA、GPU抑或是ASIC,通過多種模塊的互補組合與搭配,從而找到能夠在功耗、算力以及成本等多個層面上的最優解方案。
當然,圍繞超高性能嵌入式系統級芯片(SoC)去設計下一代數據中心也是一種可行路徑,這些SoC可以使用通用的工具,處理互補的工作負載,并提供出色的性能、功耗和面積(PPA)。因此,對數據中心而言,它可以降低功耗和熱量,同時提高面積效率并最小化硅成本——從而使超大規模數據中心能夠提供更具競爭力的解決方案。
硬件Or軟件:“智算”時代究竟誰更重要?
即便是“智算”時代,軟件的壁壘比硬件要更高,可這二者之間仍然是齊頭并進、相互依存、共謀發展的關系。畢竟,AI芯片成功的關鍵在于硬件/軟件的協同設計,AI芯片本身只起到加速的作用, 除了少量定制化AI芯片具備一定功能外,大多數AI芯片本身并不具備功能,它們的功能必須結合相關軟件來實現,這里的軟件包含芯片底層的驅動、開發工具鏈、各類計算庫、IR中間件、深度學習框架以及人機交互的界面等等。
Imagination也認為硬件和軟件應該是高度相互依賴的,沒有正確的硬件,世界上最好的軟件也是無用的,反之亦然,Andrew Grant指出:“相比從硬件轉向軟件,將會更多地出現從使用GPU這樣更通用的元件轉向關注ASIC。尤其在AI領域,擁有專為與GPU協同工作及增強GPU批量計算能力而設計的電路,就可以持續支撐AI任務中不斷增加的數據量和復雜性。NNA就是這樣一種ASIC,它將持續開拓數據中心的AI和機器學習功能。當與GPU的通用計算協同實現,并與高效、豐富的數據集和算法集成在一起時,跟上AI的發展步伐將變得更加可控。AI是一個令人興奮的領域,AI框架的開發在不斷演進。我們在自己的軟件工具中已經考慮了這一點,從而可以支持客戶在現有設計上運行最新的網絡,延長了我們設計的使用壽命和實用性,同時有助于向客戶確保我們在設計產品時有效地考慮了未來發展。”
但這并不能改變軟件構成芯片企業核心競爭力的事實,鄒挺告訴記者:“生態和開源軟件是Arm長久以來努力工作的方向。一直以來,Arm都在跟生態中的主要公司保持密切合作,包括軟件生態中的各個環節,從固件、操作系統、虛擬化軟件,到編程語言,到應用程序。近年來Arm軟件生態有了長足的進步,各種主流開源軟件都能直接運行于Arm的硬件,基于Arm的軟件開發越來越容易。比競爭壁壘更重要的是可重用性、標準化和合作。Arm去年發布了Cassini項目,它的目標是讓硬件廠商、開發者、和最終用戶有了一套共同的操作框架,遵循這個框架會容易地開發和部署應用程序。這些標準化工作避免了分歧,使能了創新和合作。”而這,也將成為Arm公司接下來持續引領全球芯片IP市場的關鍵。
總之,歷經充實“量變”之后的服務器芯片市場,已經開始從多個角度醞釀著“質變”。而對于各路沉浮這一領域多年的“老江湖”們來說,這既是一個拼“家底兒”的時刻,又是“更上一層樓”的契機。顯然,在這條競爭已經白熱化的賽道上,從硬件的角度能夠挖掘的“差異化”價值會越來越少,更多的發力軟件生態或許會是各路玩家構建核心競爭力之路上比較明朗且真正能夠有回報的路徑。
