亚洲国产综合精品一区,综合伊人久久在,久久高清内射无套,天堂√在线中文官网在线,亚洲—本道中文字幕东京热,亚洲高清专区日韩精品,超碰免费公开,国内免费久久久久久久久
歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

生成式AI浪潮只有GPU受益?打開格局,這些芯片能讓AIGC更大眾化

2023-10-18 來源:賢集網
1337

關鍵詞: 人工智能 英特爾 芯片

近日,Intel舉辦了一場年度技術創新大會,AI自然是關鍵詞中的關鍵詞,“AI Everywhere”不僅體現在整個大會上,也體現在Intel的全線產品和解決方案中,當然,作為軟硬件實力都在這個星球上屬于頂級行列的Intel,自然也是最有資格談論AI的巨頭之一。

AI無處不在,從產品到技術再到應用都有截然不同的豐富場景,普通用戶能夠最直接感受到的當屬AIGC,包括文生文、文生圖、圖生圖、文生視頻、圖生視頻等等。而要想實現足夠實用的AIGC,從算力強大的硬件到參數豐富的大模型,從精確合理的算法到高效便捷的應用,缺一不可。

我們知道,在過去,AIGC更多在云側服務器上,雖然性能、模型、算法都不是問題,但一則需要大量的資金投入,二則存在延遲、隱私等方面的不足。因此,AIGC正越來越多地下沉到終端側,讓普通的PC電腦、智能手機也能跑AIGC,甚至可以離線執行。



人人都能享受到AIGC

Intel中國技術部總經理高宇先生在接受采訪時就表示,關于終端側運行AIGC的研究已經取得了豐碩的成果,比如最新的13代酷睿電腦,經國有化已經可以流暢運行70億到180億參數的大模型,尤其是70億到130億參數的運行效果相當好。

當然這些現在還處于起步階段,目前的優化主要針對CPU處理器,下一步會充分發揮GPU核顯的性能潛力,而代號Meteor Lake的下一代酷睿Ultra除了有更強的CPU、GPU算力,還會首次集成NPU單元,一個專用的AI加速器,峰值算力超過11TOPS,三者結合可以達到更好的效果。

對于PC端側運行AIGC應用的具體落地實現,高宇舉了個例子,Intel正在打造的一個開源框架BigDL-LLM,專門針對Intel硬件的低比特量化設計,支持INT3、INT4、INT5、INT8等各種低比特數據精度,性能更好,內存占用更少。

基于這個框架,使用i9-12900K處理器,只開啟4個核心來運行ChatGLM2 60億參數模型,生成效果就是相當迅速的,而打開全部8個P核、8個E核,效果更是堪稱飛快,輸出性能達到了每個Token 47毫秒左右,已經不弱于很多云側計算。

之所以對比兩種情況,因為有時候需要將全部算力投入AI模型的運算,而有時候可能還得兼顧其他任務。

可以看出,無論哪種情況,Intel PC側都已經可以很好地完成相應的AI工作,提供令人滿意的算力和效率。

此外,在LLaMA2 130億參數大語言模型、StarCoder 155億參數代碼大模型上,Intel酷睿處理器也都能獲得良好的運行速度。

換到Arc GPU顯卡上,Intel硬件跑端側AI同樣神速,甚至更快,無論是ChatGLM2 60億參數,還是LLaMA2 130億參數、StarCoder 155億參數,都是如此,ChatGLM2模型中甚至可以縮短到20毫秒以下。

當然,以上說的大模型可能距離普通人還有些遠,而任何一項技術要想大范圍普及,關鍵還是顛覆用戶的切身工作、生活、娛樂體驗,AI當然也不例外。

在高宇看來,基于以上大模型,AI在端側的典型應用還是相當豐富的,而且會越來越多,有時候效果會更勝于運行在云側。



AIGC的底層基石:算力

AI的發展,一方面依賴于模型和算法,另一方面則依賴于芯片的算力。在電腦上,CPU擅長數值計算,能夠推理出復雜的邏輯,缺點是計算速度較慢,不能并行處理任務。如果把CPU比作一個人的大腦 ,那么GPU和FPGA就相當于四肢,可以幫助它執行任務。

在訓練單位方面,以ChatGPT為代表的人工智能大模型訓練和推理需要強大的計算支持。ChatGPT單次訓練所需算力約27.5PFlop/s-day,單顆NVIDIA V100芯片深度學習算力為125TFlops,則ChatGPT模型的訓練至少需要1顆V100芯片計算220天(27.5*1000/125=220)才能完成。

在訓練成本方面。GPT-3的數據訓練需要45TB。訓練該模型所需的算力是3640PF,總成本高達1200萬美元。2021年,全球計算設備算力總規模達到615EFlop/s,而到2023年,全球大模型訓練所需全部算力相當于超過200萬張A100顯卡。預計到2030年,全球算力規模將達到56ZFlps,年均增長率約為65%。我國計算設備算力總規模達到202EFlops,占全球約33%。

算力硬件層是構成AIGC產業的核心底座,AIGC需要大量的計算和數據處理,隨著AIGC產品持續升級對芯片算力提出更高要求,AI芯片算力和需求旺盛增長。據Gartner數據,全球AI芯片市場規模有望在2021年達343億美元,2025年將逾700億美元,CAGR約為20%。


四類芯片獲得發展動力

AIGC算力硬件層,主要包括AI芯片、AI服務器和數據中心,其中AI芯片主要應用于模型訓練(training)和推斷(inference)兩個步驟,并主要可劃分為CPU、GPU、FPGA和ASIC四類。

具體來看,CPU(Central Processing Unit)中央處理器是計算機的運算和控制核心(Control Unit),是信息處理、程序運行的最終執行單元,主要功能是完成計算機的數據運算以及系統控制功能。

報告指出,在數據中心和新一代信息技術升級帶動下,中國服務器市場規模2027年將達143.7億美元,根據服務器成本結構構成,CPU為核心芯片,服務器市場的增長將帶動服務器CPU需求上升。根據IDC數據,2022年全球服務器出貨量突破1516萬臺,同比增長12%,產值達1215.8億美金。

市場格局上,在2022年全球數據中心CPU市場中,英特爾以70.77%的市場份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠商僅占據9.39%的市場份額,整體上處于壟斷局面。集微咨詢測算2022年全球CPU市場規模約為777億美元,其中全球服務器CPU市場約為233億美元。

目前國內CPU廠商主有海光、海思、飛騰、龍芯、申威等。通過產品對比發現,國產服務器CPU性能已接近Intel中端產品水平,但整體上國內CPU廠商仍在工藝制程、運算速度(主頻)、多任務處理(核心與線程數)方面落后于國際先進水平。

GPU(圖形處理器),最初是為了解決CPU在圖形處理領域性能不足的問題而誕生。GPU架構內主要為計算單元,采用極簡的流水線進行設計,適合處理高度線程化、相對簡單的并行計算,在圖像渲染等涉及大量重復運算的領域擁有更強運算能力,并演進出GPGPU,即通用計算圖形處理器(general-purpose GPU)以更好支持通用計算,GPGPU減弱了GPU圖形顯示部分的能力,將其余部分全部投入到通用計算中,同時增加了專用向量、張量、矩陣運算指令,提升了浮點運算的精度和性能,以實現人工智能、專業計算等加速應用。

GPU因其強大的并行計算能力而廣泛應用于人工智能、圖像渲染、科學計算等領域。AI、自動駕駛與游戲市場是GPU需求增長的主要場景,其中AI領域大語言模型的持續推出以及參數量的不斷增長有望驅動模型訓練端、推理GPU需求快速增長,2021年全球GPU市場規模為334.7億美元,預計2030年將達到4773.7億美元,CAGR(2021-2030)為34.35%。

從國內市場來看,2020年中國大陸的獨立GPU市場規模為47.39億元,預計2027年市場規模將達345.57億元,CAGR(2020-2027)為32.8%。

全球GPU芯片市場主要由海外廠商占據壟斷地位,國產廠商加速布局。全球GPU市場被英偉達、英特爾和AMD三強壟斷,英偉達憑借其自身CUDA生態在AI及高性能計算占據絕對主導地位,英偉達高端GPU占據較大份額(超過70%);國內市場中,景嘉微、天數智芯、壁仞科技、登臨科技等企業基本處于起步階段。

FPGA,是一種硬件可重構的集成電路芯片,通過在硅片上預先設計實現具有可編程特性,可通過軟件重新配置芯片內部的資源來實現不同功能,廣泛應用于數據中心、航空航天工程、人工智能、工業、物聯網以及汽車等領域。在5G通信、人工智能等迭代升級周期頻繁、技術不確定性較大的領域,FPGA是較為理想的解決方案。

報告預測,2020-2026年全球FPGA出貨量有望從5.11億顆增至8.25顆,CAGR為8.3%,FPGA市場規模從55.85億美元增至96.9億美元,CAGR為9.6%。

中國FPGA市場2020年的市場規模約150.3億元,預計2025年中國FPGA市場規模將達到332.2億元,復合增速為17.2%。FPGA需要由FPGA芯片、EDA軟件及IP方案組成的軟硬件生態系統共同支撐實現功能,邏輯容量、制程、SerDes速率等關鍵指標體現FPGA硬件技術水平,FPGA EDA軟件工具非常復雜,FPGA軟硬件生態系統建立了極高的行業壁壘。

全球FPGA市場主要被賽靈思(AMD)和Altera(英特爾)占據,目前市占率分別為52%和35%;中國FPGA廠商中紫光國微、復旦微電和安路科技在2021年中國的本土市場的市占率超過15%。受益于國產化加速推進,中國FPGA廠商將擁有巨大成長空間。



ASIC芯片,是為特定用途而定制的集成電路,具有高性能、低能耗的特點,專用化程度最高,其特點同時適合AI訓練和推理階段的使用。

目前全球ASIC市場并未形成明顯的頭部廠商,國產廠商快速發展;國外谷歌、英特爾等公司在ASIC布局較早,已經有較為成型的產品。目前國產廠商海思、遂原科技和寒武紀的產品在整體性能上也與谷歌比肩。未來國產廠商有望在ASIC領域繼續保持技術優勢,突破國外廠商在AI芯片的壟斷格局。

AIGC熱潮帶動AI服務器需求飆升,也使部分高端存儲芯片受益。

本期報告指出,隨著AIGC的逐漸成熟,為存儲器帶來對應顯存量的提升。其中包括單臺服務器加速卡數量的增長、單張AI加速卡中顯存容量的增長;AI服務器中將會有更高的內存滿插率及后續CPU新平臺有望支持更多的內存模組通道;相比于普通服務器固態硬盤占比有望大幅提升。

在AI服務器中應用的存儲芯片主要包括:高帶寬存儲器(HBM)、DRAM和SSD,針對AI服務器的工作場景需要提供更大的容量、更高的性能、更低的延遲和更高的響應速度。

分品類看,HBM(High Bandwidth Memory,高帶寬存儲器)是可以實現高帶寬的高附加值DRAM產品。HBM將多個DDR芯片3D堆疊在一起后和主芯片封裝在一起,有高帶寬、低功耗等特點。

以HBM為代表的超高帶寬內存技術有力支撐了AIGC開發,而生成式模型也會加速HBM內存進一步增大容量和增大帶寬,AIGC發展將帶動第三代HBM量價齊升,預計2023-2025年HBM市場CAGR有望成長至40-45%以上,至2025年市場規模有望達25億美元,市場需求快速提升。

隨著中國智能化、數字化、信息化技術的深入發展,各大領域對于高性能儲存器產品的需求將持續增長,加之HBM應用領域向智能駕駛、通信設備等領域拓展,HBM需求量將保持較高的增速。

而對于服務器核心存儲器,與消費級SSD相比,企業級SSD產品需要具備更快傳輸速度、更大單盤容量、更高使用壽命以及更高的可靠性要求。

企業級SSD下游客戶主要來自云計算,占總市場規模的份額達到67%,企業級SSD將充分受益云基礎設施增量。根據Yole數據,全球SSD市場規模在2022年為290億美元,總出貨量為3.52億塊,其中大約5500萬塊是企業SSD,其余為消費級SSD。預計2028年市場規模會達到670億美元,出貨量為4.72億塊,復合年增長率為15%。

本期報告,集微咨詢詳細梳理了AI芯片領域國內企業發展情況,指出AI發展的海量數據對數據處理提出極高要求,AI芯片需求快速增長,盡管全球AI芯片市場被英偉達壟斷,然而國產AI算力芯片賽道正燃起星星之火。目前,國內已涌現出了如寒武紀、海光信息等優質AI算力芯片上市公司,非上市AI算力芯片公司如沐曦、天數智芯、壁仞科技等亦在產品端有持續突破。

從不同細分市場看,經過多年發展,國產CPU初步形成六大廠商齊頭并進格局。“十五”期間,國家啟動發展國產CPU的泰山計劃,863計劃也提出自主研發CPU。2006年核高基專項啟動,國產CPU領域迎來了新一輪的國家支持。鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優質國產CPU企業再度啟航。



主站蜘蛛池模板: 精品97国产免费人成视频| 在线看免费无码av天堂| 好男人中文资源在线观看| 久久精品国产曰本波多野结衣 | 国产乱人伦中文无无码视频试看| 人妻少妇乱孑伦无码专区蜜柚| 激情综合色五月丁香六月亚洲| 国产精品麻豆va在线播放| 国内精品自产拍在线观看| 精品一区二区三区波多野结衣| 18禁免费观看网站| 欧美乱妇高清无乱码| 久久无码中文字幕免费影院| 人人妻人人澡人人爽超污| 国产成人综合美国十次| 亚洲欧美日本韩国| 日本最新高清一区二区三| 国偷自产一区二区免费视频 | 国产精品拍国产拍拍偷| 亚洲精品久久国产高清| 精品国产综合区久久久久久| 亚洲精品久久国产高清| 精久国产一区二区三区四区| 亚洲成a v人片在线观看| 无码午夜成人1000部免费视频 | 中文有码vs无码人妻| 十八18禁国产精品www| 黑人猛挺进小莹的体内视频| 67pao国产成视频永久免费| 日日噜噜夜夜狠狠视频无码日韩| 日日噜噜夜夜狠狠视频无码日韩| 亚洲成av人影院| 天天狠天天透天干天天| 国产精品无码制服丝袜| 久久精品国产曰本波多野结衣| 国产私拍福利精品视频| 国产精品好好热av在线观看| 国产亚洲精品久久久久秋| 东北女人毛多水多牲交视频| 国产乱子伦一区二区三区= | 亚洲 自拍 欧美 小说 综合|