亚洲国产综合精品一区,综合伊人久久在,久久高清内射无套,天堂√在线中文官网在线,亚洲—本道中文字幕东京热,亚洲高清专区日韩精品,超碰免费公开,国内免费久久久久久久久
歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

CPU、GPU、NPU,究竟誰才是[AI PC]的主角?

2024-03-22 來源:Ai芯天下
4927

關鍵詞: 人工智能 英特爾 ARM

[CPU+NPU+GPU]將成為AI PC的算力基座


不同類型的處理器擅長的工作領域各異,這正是異構計算的核心原理——讓專業的人做專業的事。


CPU擅長順序控制,適用于需要低延時的場景,同時也能夠處理較小的傳統模型,如卷積神經網絡(CNN)或特定的大語言模型(LLM)。


而GPU更擅長處理高精度格式的并行任務,例如對畫質要求極高的視頻和游戲。


CPU和GPU作為通用處理器,設計靈活,易于編程,主要負責操作系統、游戲和其他應用。


然而,對于處理大規模的神經網絡計算,CPU的效率相對較低。


NPU則采用數據驅動并行計算的架構,模擬人類神經元和突觸,特別擅長處理視頻、圖像等海量多媒體數據。


與遵循馮諾依曼架構的CPU和GPU不同,NPU通過突觸權重實現存儲計算一體化,運行效率更高,尤其擅長推理。


鑒于終端的功耗和散熱限制,通用CPU和GPU難以滿足生成式AI應用嚴苛且多樣化的計算需求。


這些應用不斷演進和多樣化,單一硬件部署并不合理。


因此,NPU和異構計算成為硬件廠商應對終端側生成式AI挑戰的關鍵。


值得注意的是,盡管GPU在并行計算能力上具有優勢,但仍需與CPU協同工作。


神經網絡模型的構建和數據流傳遞主要在CPU上完成。


然而,GPU存在功耗高、體積大、價格昂貴等缺陷。


性能越高的GPU功耗越高,體積越大,價格也越高昂,這使得一些小型設備和移動設備無法使用。


undefined


NPU將在AI PC落地生花


網絡處理單元(NPU)能夠基于網絡運算的特性,借助軟件或硬件編程,實現多樣化的網絡功能。


相較于傳統的中央處理器(CPU)和圖形處理器(GPU),NPU在執行神經網絡任務時展現出更高的效率和更低的功耗。


與現場可編程門陣列(FPGA)相比,NPU在成本方面更具優勢。


雖然FPGA在靈活性和可編程性方面同樣出色,但主流的FPGA芯片制程節點通常在14納米至45納米之間;


而NPU的制程節點往往低于10納米,因此更適合應用于小型、低功耗的消費級設備,如個人電腦和手機等。


在軟件層面,NPU具備與主流軟件的高度兼容性。通過標準化的接口,如OpenCL、CUDA、OpenVX等,NPU能夠輕松與各種人工智能框架進行交互,并順利集成到不同的軟件環境中。


這使得開發者在模型開發和部署方面更加便捷,同時支持多種編程語言和框架,進一步降低了開發門檻。


綜上所述,NPU的高效能、低功耗、易于編程以及廣泛的軟件兼容性,使其成為人工智能應用中不可或缺的關鍵組件。


undefined


趨勢看好,各大廠紛紛推出相關產品


英特爾近期發布了第14代酷睿Ultra移動處理器,該處理器內置了神經網絡處理單元(NPU)。


據英特爾官方透露,預計至2024年,將有超過230款機型搭載這款酷睿Ultra處理器。


另一方面,蘋果計劃在2024年發布搭載M3處理器的MacBook。


據該公司透露,M3處理器的NPU性能相較于前代產品M1提升了60%。


此外,AMD亦將在2024年初正式推出其首款內置獨立NPU的銳龍8040處理器。


AMD表示,該處理器的加入使得大語言模型性能提升了40%。


值得一提的是,AMD于2023年12月率先發布了銳龍8040系列處理器。這一系列處理器的核心變化之一便是新增了AI計算單元。


隨后,英特爾亦發布了其新一代酷睿Ultra移動處理器。


這款處理器是英特爾40年來的首款內置NPU的產品,旨在在PC上提供高效能的AI加速和本地推理體驗。


此舉被業界視為英特爾客戶端處理器路線圖的重大轉折點。


英特爾將NPU、CPU和GPU共同視為AI PC的三個核心算力引擎。


據公司預測,至2024年,將有超過230款機型搭載酷睿Ultra處理器。


此外,微軟計劃在Windows 12中為AI PC設定最低門檻,要求至少具備40TOPS的算力和16GB的內存。


因此,PC芯片算力達到40TOPS門檻將成為行業的主要目標。


undefined


[算力融合]只是美好的理想


在GPU領域,英偉達RTX系列、AMD RX7000系列以及英特爾ARC系列獨立顯卡均內置獨立的AI計算單元。


然而,英偉達并不生產消費級PC CPU,因此其顯卡AI功能更新主要圍繞顯卡本身,如AI視頻超分、AI色彩強化、AI音頻降噪及AI語音聊天等,似乎主張[AI PC僅需顯卡算力]。


英特爾ARC獨顯雖有XMX矩陣計算單元,但新一代集成于CPU的ARC核顯已取消此設計,使其MTL架構CPU僅依賴內置NPU作為獨立AI計算單元。


即便搭配ARC獨顯,亦無法實現核顯與獨顯AI算力的[疊加]。


AMD在CPU中采用源自其企業級計算卡的XDNA成熟架構作為NPU單元,理論上具有軟件適配優勢。


然而,在RDNA 3獨顯架構中,AMD似乎采用了不同的AI單元設計,導致尚未實現基于AI代碼的游戲畫面超分功能。


此前許多顯卡AI用例主要依賴GPU本身的浮點算力,相較于僅使用顯卡內置AI單元的處理方式,功耗更高。


理論上,CPU、GPU和NPU均可參與AI運算,并根據代碼類型和任務負載實現自動分配的[異構協同]設計,如高通即將上市的驍龍X Elite系列所示。


然而,這種協同運算的實現受到當前硬件方案[各自為戰]的產品構成限制。


英特爾和AMD未來可能通過架構修正解決[算力不統一]問題,而英偉達雖無消費級x86 CPU產品線,但仍有可能通過ARM CPU進入Windows on ARM生態。


undefined



結尾:


根據現有證據,NPU因其對神經網絡計算的獨特優化,在端側和邊緣側處理復雜神經網絡算法時展現出卓越的效率與節能特性。


這一現象正推動AI手機、AI PC及端側AI市場的快速發展,預示著NPU的大規模商用時代即將到來。



主站蜘蛛池模板: 亚洲中文字幕永久在线全国| 97无码免费人妻超级碰碰夜夜| 男男车车的车车网站w98免费 | 蜜桃视频一区二区三区在线观看| 久久久综合香蕉尹人综合网| 亚洲美免无码中文字幕在线| 久久久噜噜噜久久熟女aa片| 高潮毛片无遮挡高清视频播放| 一本久道中文无码字幕av| 欧美熟妇另类久久久久久不卡| 欧美白丰满老太aaa片| 一本久道中文无码字幕av| 国产乱子伦一区二区三区=| 精品国产乱码久久久久久浪潮小说| 亚洲色无码播放亚洲成av| 日本最新高清一区二区三| 神马影院午夜dy888| 双腿张开被9个男人调教| 国产成av人片在线观看无码| 国产精品a国产精品a手机版| 免费人成网站视频在线观看国内| 妺妺窝人体色www在线小说| 麻豆精品偷拍人妻在线网址| 精品人妻系列无码专区久久| 国产区图片区小说区亚洲区| 少妇的肉体在线观看| 国产女精品视频网站免费蜜芽| 色情无码www视频无码区小黄鸭 | 日本最新高清一区二区三| 欧美又大粗又爽又黄大片视频| 国产黑色丝袜在线观看片不卡顿| 国产成人综合日韩精品无码不卡| 欧美国产日韩在线三区| 鲁鲁网亚洲站内射污| 国产亚洲日韩网曝欧美台湾| 国产精品久久久久久亚洲影视| 亚洲另类激情综合偷自拍图片| 国产精品青草久久久久福利99| 国产乱子伦精品无码码专区| 98国产精品综合一区二区三区| 国产精品人成视频免费vod|