亚洲国产综合精品一区,综合伊人久久在,久久高清内射无套,天堂√在线中文官网在线,亚洲—本道中文字幕东京热,亚洲高清专区日韩精品,超碰免费公开,国内免费久久久久久久久
歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

談到AI算力,不僅僅只有GPU,這些芯片也是重要角色

2024-04-10 來源:賢集網
3404

關鍵詞: 人工智能 GPU 英偉達

與任何人談論云中的生成式人工智能,話題很快就會轉到 GPU(圖形處理單元)。但這可能是一個錯誤的目標。GPU 并不像人們想象的那么重要,幾年后,話題可能會轉向對于云中生成式 AI 系統的開發和部署更為重要。

目前的假設是 GPU 對于促進生成 AI 模型所需的復雜計算是不可或缺的。雖然 GPU 在推進人工智能方面發揮著關鍵作用,但過分強調它們可能會妨礙探索和利用同樣有效且可能更可持續的替代方案。事實上,GPU 可能會像人工智能系統所需的其他資源(例如存儲和處理空間)一樣迅速成為單純的一個商品。重點應該放在設計和部署這些系統上,而不僅僅是它們運行的硬件上。



GPU淘金熱

GPU 的重要性在英偉達身上得到了很好的體現。在最近一個季度,英偉達公布了創紀錄的數據中心收入 145 億美元,比上一季度增長 41%,比去年同期增長 279%。它的 GPU 現在是人工智能處理的標準,甚至比游戲更重要。

GPU 最初是為了在 20 世紀 90 年代加速游戲中的 3D 圖形而設計的,早期的 GPU 架構高度專門用于圖形計算,主要用于渲染圖像和處理與 3D 渲染相關的密集并行處理任務。這使得它們非常適合人工智能,因為它們擅長需要同時計算的任務。


GPU 真的很重要嗎?

GPU 需要CPU來協調操作。盡管這簡化了現代 GPU 架構的復雜性和功能,但其效率也低于應有的水平。GPU 與 CPU結合運行,將特定任務卸載給 GPU。此外,這些CPU還管理軟件程序的整體操作。

除了效率問題之外,還需要完成不同部件的通信;拆卸模型、對模型進行部分處理,然后重新組裝輸出以進行綜合分析或推理的挑戰;以及使用 GPU 進行深度學習和人工智能所固有的復雜性。這種分割和重新集成過程是分配計算任務以優化性能的一部分,但它也有其自身的效率問題。

需要設計用于抽象和管理這些操作的軟件庫和框架。英偉達的 CUDA(統一計算設備架構)等技術提供了開發可利用 GPU 加速功能的軟件所需的編程模型和工具包。

人們對英偉達高度感興趣的一個核心原因是它提供了一個軟件生態系統,使 GPU 能夠更有效地與應用程序一起工作,包括游戲、深度學習和生成式人工智能。如果沒有這些生態系統,CUDA 和其他生態系統就不會具有相同的潛力。因此,焦點集中在英偉達身上,它目前擁有處理器和生態系統。



ASIC——GPU面臨最強競爭

去年12月,谷歌官宣了多模態大模型Gemini,包含了三個版本,其中Gemini Ultra版本甚至在大部分測試中完全擊敗了OpenAI的GPT-4。同時還丟出另一個重磅炸彈——TPU v5p,號稱是現在最強大的AI自研芯片。

TPU,全稱Tensor Processing Unit,即張量處理單元。所謂“張量(tensor)”,是一個包含多個數字(多維數組)的數學實體。目前,幾乎所有的機器學習系統,都使用張量作為基本數據結構。所以,張量處理單元,我們可以簡單理解為“AI處理單元”。

谷歌TPU就是基于ASIC專用芯片開發,為了某種特定的需求而專門定制的芯片。ASIC芯片的計算能力和計算效率都可以根據算法需要進行定制,所以ASIC與通用芯片相比,具有以下幾個方面的優越性:體積小、功耗低、計算性能高、計算效率高、芯片出貨量越大成本越低。但ASIC芯片的算法是固定的,一旦算法變化就可能無法使用。

隨著人工智能算法不斷涌現,ASIC專用芯片如何做到適應各種算法是最個大問題,如果像GPU那樣,通過架構來適應各種算法,那ASIC專用芯片就變成了同CPU、GPU一樣的通用芯片,在性能和功耗上就沒有優勢了。這意味著玩AISC芯片需要強大實力,包括雄厚的資金,強大的技術實力和豐富的應用場景。

這里請注意,谷歌去年發布TPU v5p的時候,一同發布了多模態大模型Gemini,該模型在圖像、音頻、視頻和文本領域擁有強大的功能。與英偉達開放GPU購買策略不同,谷歌高端TPU主要供自家產品和服務運用,這才是關鍵。換句話說,谷歌高端TPU是基于自家多模態大模型Gemini開發的專用AI芯片,在自家的產品和服務上做到最優,性能表現絲毫不輸GPU。

公開的信息顯示,TPU v5p每個模塊有8960顆芯片,較之上代v4的4096有所提升,且每塊架構內的總浮點運算次數(FLOPs)增加至原來的四倍,吞吐能力達到驚人的4800Gbps。新型架構在內存及帶寬方面更為出色,高達95GB的高帶寬內存(HBM)遠超TPU v4的32GB。

根據官方數據顯示,谷歌的TPU v5p在訓練大規模語言模型上性能表現,達到了A100 GPU四倍,比起英偉達的頂配H100顯卡性能也絲毫不落下風。當然這只是谷歌基于自身的Gemini模型做的測試,肯定在研發階段就做了優化和匹配。但足見TPU v5p性能之強,同時也可以說明,ASIC芯片在AI大模型應用方面有著絲毫不輸GPU的優勢。

截至目前,谷歌、英特爾、英偉達都相繼發布TPU、DPU等ASIC芯片,國內ICG、寒武紀、比特大陸、地平線、阿里巴巴等也都推出了深度神經網絡加速的ASIC芯片。目前GPU應用范圍廣,市場非常成熟,但并不意味著其他的芯片就沒有機會,ASIC的發展勢頭依然很猛,正在成為GPU最強大的挑戰者。


DPU:數據中心算力基座

隨著信息技術的持續發展,數據中心網絡帶寬從100G邁入400G,甚至將提升至800G或1.6T。然而,作為提供算力的物理載體,受限于通用CPU的結構的馮諾依曼瓶頸、摩爾定律逐漸失效等因素的影響,以CPU為網絡核心的數據處理能力難以支持大規模新型數據中心的網絡和數據的算力需求。



由此,DPU已經成為繼CPU、GPU之后未來數據中心的第三顆主力芯片。DPU提供的高吞吐、低時延、基礎設施卸載能力,幫助數據中心完美的規避了“信息孤島”問題。未來的技術發展趨勢將會是高度集成化的片上數據中心的模式(Data Center Infrastructure on a chip),即一個GPU、CPU、DPU共存的時代。

聯通研究院曹暢博士曾在2023中國計算機大會上表示,DPU是銜接計算和網絡兩大領域的重要樞紐,云、網、算協同,通過資源的深度感知與一體化編排,可以實現算力發現和跨域互通,打通數據與計算節點的通路。DPU作為網絡和計算的銜接點,可解決數據傳輸的“最后一米”問題。通過DPU可以實現虛擬化層的全卸載和定制化的業務加速能力,具有更強的可編程能力。



主站蜘蛛池模板: 国产日产欧洲无码视频无遮挡| 中文文字幕文字幕亚洲色| 国产做国产爱免费视频| 国产精品无卡毛片视频| aaa欧美色吧激情视频| 牛牛在线视频| 久久天天躁狠狠躁夜夜爽| 精品亚洲成a人在线看片| 国产精品h片在线播放| 妺妺窝人体色www在线小说| 92电影网午夜福利| 国产成人av无码永久免费一线天| 在线天堂资源www在线中文| 一区二区三区高清av专区| 国产乱子伦一区二区三区=| 神马影院午夜dy888| 男人j进入女人j内部免费网站| 妺妺窝人体色www在线小说| 国产成人精品亚洲777人妖| 亚洲精品字幕| 精品一区二区三区波多野结衣| 狠狠色噜噜狠狠狠狠777米奇| 国产亚洲精品久久久久秋 | 国产精品麻豆va在线播放| 国产成人精品亚洲777人妖| 久久久喷潮一区二区三区| 五月天国产成人av免费观看| 国产超碰人人爽人人做av| 日本少妇高潮喷水视频 | 国偷自产一区二区免费视频| 欧美精品日韩精品一卡| 亚洲高清成人aⅴ片777| 日本少妇高潮喷水视频| 无线日本视频精品| 日日噜噜夜夜狠狠视频无码日韩 | 黑人猛挺进小莹的体内视频| 亚洲欧美闷骚少妇影院| yyyy11111少妇无码影院| 欧美熟妇另类久久久久久不卡| 国产精品一区二区含羞草| 日本熟妇厨房bbw|