亚洲国产综合精品一区,综合伊人久久在,久久高清内射无套,天堂√在线中文官网在线,亚洲—本道中文字幕东京热,亚洲高清专区日韩精品,超碰免费公开,国内免费久久久久久久久
歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

高性能CPU缺乏,異構多核架構崛起

2024-04-19 來源:賢集網
2765

關鍵詞: CPU 芯片 AMD

全球領先的超大規模云數據中心公司——亞馬遜、谷歌、Meta、微軟、甲骨文和Akamai——正在推出專門針對云的異構多核架構,整個芯片的高性能 CPU 開發正在感受到這種影響。

這些芯片不太可能進行商業銷售。它們針對特定數據類型和工作負載進行了優化,具有巨大的設計預算,可以通過提高性能和降低功耗來節省成本,從而實現合理化。目標是以更低的冷卻成本將更多的計算能力集成到更小的區域,而實現這一目標的最佳方法是通過定制架構,以及緊密集成的微架構和精心設計的數據流。

這一趨勢始于近十年前,當時 AMD 采用異構架構和加速處理單元,取代了同質多核 CPU 的舊模式,但起步緩慢。從那時起,它就開始騰飛,追隨為移動消費設備創建的各種設計的腳步,這些設備需要滿足非常緊湊的占地面積以及嚴格的功率和散熱要求。



Quadric營銷副總裁 Steve Roddy 表示:“英特爾等行業巨頭的單片芯片幾乎在每個產品代碼中都配備了 AI NPU。” “當然,人工智能先驅 NVIDIA 長期以來在其非常成功的數據中心產品中混合使用 CPU、著色器 (CUDA) 核心和 Tensor 核心。未來幾年向小芯片的轉變將徹底鞏固這一轉變,因為指定小芯片組合的系統買家可以選擇專門針對相關設計插槽定制的計算和互連類型。”


如何設計高性能CPU?

每次談到高性能設計,經常會面臨幾個名詞:IO多路復用、零拷貝、線程池、冗余等等,關于這部分的文章非常的多,其實本質上是一個系統性的問題,可以從計算機體系結構的底層原來去思考,系統優化離不開計算性能(CPU)和存儲性能(IO)兩個維度,總結如下方法:

如何設計高性能計算(CPU)?

減少計算成本:代碼優化計算的時間復雜度O(N^2)->O(N),合理使用同步/異步、限流減少請求次數等;

讓更多的核參與計算:多線程代替單線程、集群代替單機等等;

如何提升系統IO?

加快IO速度:順序讀寫代替隨機讀寫、硬件上SSD提升等;

減少IO次數:索引/分布式計算代替全表掃描、零拷貝減少IO復制次數、DB批量讀寫、分庫分表增加連接數等;

減少IO存儲:數據過期策略、合理使用內存、緩存、DB等中間件,做好消息壓縮等;


多核不僅是多個CPU的內核

為了充分發揮CPU功效和減少用戶支出,現在越來越多CPU集成GPU功能,比如Intel就在Sandy Bridge把GPU核心整合進了CPU當中,其GPU核心的圖形核心性能大幅度地提升。

多核化是無奈之舉:以前,半導體工藝的發展可以帶來“一舉三得”的效果,包括提高晶體管速度、降低功耗和縮小芯片面積。但是,當制造工藝發展到90nm或65nm時,泄漏電流的問題凸顯,沿用以往的內部架構來提高頻率的方法難以奏效。為了在不提高工作頻率的條件下實現性能的提升,只能增加CPU內核的數量。

在有許多客戶要求進行并行處理的服務器中,多核架構容易獲得比較好的效果。但是,問題發生在根據用戶的要求運行應用軟件的客戶機里。由于可能同時運行的軟件數量有限,即使可以將各個軟件分割以后并行執行,但軟件中必須串行執行的部分仍然會妨礙處理性能的提升。許多相關人士認為,在目前這種架構的PC中,4~8個內核可能是多核處理器能夠獲得較好性能提升效果的極限。



集成多個不同類型的內核:另一方面,提供新體驗的高級用戶接口、動態及靜態圖像分析等新的應用軟件的不斷出現,對處理器的處理性能提出了更高的要求。如果處理器僅在目前以CPU內核為主的架構上繼續發展,這些新應用可能將無法實現。

2007年9月,英特爾公司董事會名譽主席Gordon Moore在英特爾秋季技術峰會上表示:“眾所周知,摩爾定律在物理上是有極限的。大約10年或15年以后,摩爾定律將會遇到根本性障礙,而退出歷史舞臺。”反過來說,Moore認為,半導體工藝的發展很可能還會像以前那樣再延續10年左右。在把工藝發展當作技術推動力的同時,為了越過橫亙在多核架構前面的壁壘,處理器應該采用什么樣的內部架構呢?

業界想到的方案是采用異構處理器架構,即將不同類型的內核集成在一起。在這種架構中,CPU內核所不擅長的浮點運算及信號處理工作,將由集成在同一塊芯片上的其它可編程內核執行。相關人士認為,集成多個不同類型內核的異構多核架構將成為今后處理器的主流架構。

從同構到異構通用處理器將實現SoC化:Nvidia公司的總裁兼CEO指出:“目前,圖形芯片具有的浮點運算性能已經大大超越了處理器。如果能夠靈活運用,隨著圖形芯片的發展,將會涌現出各種各樣新的應用。”在占據PC及服務器主流地位的x86處理器中,圍繞GPU(圖形處理單元)展開的相關研發工作突然活躍起來。

GPU的集成和通用化取得進展:圍繞GPU的研發方向主要有兩個。首先,是將GPU內核集成到處理器芯片上。AMD公司在2006年7月收購了加拿大的GPU生產商ATI科技公司,并提出了將ATI公司的GPU內核集成到處理器上的Fusion處理器方案。另外,英特爾公司在2007年4月明確表示,正在開發矢量處理器Larrabee(開發代號),其中集成了許多專用于浮點運算的CPU內核。

另一個研發方向是,利用GPU擅長對浮點運算進行并行處理的特點,將其用作矢量處理器。這就是面向通用計算領域的GPGPU(General Purpose Computing on GPU),NVIDIA公司從2006年下半年已陸續推出相關的硬件產品及軟件開發工具。


多芯片不可避免

芯片行業清楚地意識到,對于許多計算密集型應用來說,單芯片解決方案變得不切實際。過去十年的一個大問題是向多芯片解決方案的轉變何時會變得更加主流。

Synopsys 研發總監 Sutirtha Kabir 表示:“整個行業正處于一個拐點,你無法再避免這種情況。”“我們在后臺談論摩爾定律和‘SysMoore’,但設計人員必須在 CPU 和 GPU 中添加更多功能,但由于光罩尺寸限制、良率限制以及所有這些限制,他們根本無法做到這一點芯片。

多芯片芯片在這里是不可避免的,這帶來了一些有趣的考慮“第一,拿一張紙并將其折疊。這基本上就是多芯片的一個例子。你拿一個芯片,把它折疊起來,如果你能巧妙地設計它,你可以認為你實際上可以大大縮短時序,而不是有很長的時序路徑。如果你從頂部芯片到底部芯片,你所經歷的可能只是芯片中的少量布線,但它們大多是凸塊到凸塊或鍵合到凸塊。”

多芯片設計挑戰包括弄清楚有多少路徑需要同步、時序是否應該放在兩個芯片之間或單獨關閉、L1 應該放在頂部芯片還是底部芯片上,以及是否可以添加 L4。

“從 3D 角度來看,平面現在變得非常有趣,”Kabir 解釋道。“你要把一棟單層的房子改造成三層或四層。但還有其他設計挑戰。您不能再忽視熱量了。散熱曾經是 PCB 的問題,而系統設計人員現在認為這些芯片非常熱。

Jensen Huang 最近在 SNUG 上表示,你將室溫的水從一端送入,然后從另一端流出按摩浴缸的溫度。他是在開玩笑,但事實是,從溫度的角度來看,這些都是熱芯片,如果你在布局規劃時不考慮到這一點,你就會燒毀你的處理器。這意味著您必須更早地開始這樣做。就 3D 布局規劃而言,當涉及到工作負載時,您如何知道您已經分析了多芯片的不同工作負載,并確保考慮了 IR、熱量和時序等關鍵影響,即使您沒有考慮到這些影響甚至有一個網表?我們稱之為零網表階段。

這些考慮因素都變得非常有趣,而且因為你無法再避免使用多芯片,所以從代工廠的角度來看,從 EDA 的角度來看,這些都是生態系統的前沿和中心,而設計師則處于中間。”



與數據中心芯片的熱問題相關的是低功耗設計方面。

“這些數據中心使用大量電力,”Ansys 產品營銷總監 Marc Swinnen說。“我當時在舊金山的 ISSCC,我們在 NVIDIA 旁邊的一個展位里,那里正在展示它的一個 AI 訓練盒——一個大膽的大盒子,里面有八個芯片,還有大量的風扇和散熱器。我們詢問它使用了多少功率,他們說,“哦,最高 10,000 瓦,但平均 6,000 瓦。”功耗真的變得瘋狂了。”

Arm 的 Jeff 同意,應對數據中心芯片新挑戰的最佳方法是采用完整的系統方法,涵蓋指令集架構、軟件生態系統和特定優化、CPU 微架構、結構、系統內存管理和中斷控制,以及封裝內和片外 I/O。“完整的系統方法使我們能夠與合作伙伴合作,根據現代工作負載和工藝節點定制 SoC 設計,同時利用基于小芯片的設計方法。”

這種定制芯片設計方法使數據中心運營商能夠優化其電力成本和計算效率。“我們的 Neoverse N 系列的高效率可實現每個插槽 128c 至 192c 及以上的非常高的核心數量,”Jeff 說。“這些相同的 N 系列產品可以縮小到占用空間更小的 DPU 和 6g L2 設計以及邊緣服務器。我們的 V 系列產品線面向云,具有更高的每線程性能和更高的矢量性能(適用于 AI 推理和視頻轉碼等工作負載),同時仍然提供高效率。一系列加速器附加選項使我們的合作伙伴能夠將自定義處理和云原生計算正確組合到一個針對其工作負載量身定制的 SoC 中。”


結論

考慮到高性能計算的演進本質,特別是考慮到如何優化數據中心存在不同的方面,所有這一切最終的結果幾乎是無法預測的。西門子的 Hand 表示:“隨著網絡事物的爆發,人們開始在數據中心內進行南北向和東西向路由,這改變了所有網絡交換架構,因為這是最大的瓶頸。” 。“這導致人們重新思考數據中心的樣子。類似的事情也發生在內存方面,當你開始集成光學和一些更智能的內存時,看到它會如何改變它將會非常有趣。”

Hand指出,幾年前的英特爾開發者大會上,該公司解釋了如何使用硅光子學中的表面發射光學器件將內存與數據中心機架中的存儲分開。“他們有一個統一的內存結構,可以在服務器之間共享,并可以從不同的服務器分配內存,”他說。

“所以數據中心的拓撲開始看起來非常有趣。即使在機架中,你也會看到NVIDIA 的 AI 系統結構看起來不像傳統服務器機架。最大的轉變是人們可以看到它,如果有市場,你就可以建立它。我們總是考慮架構的核心是否快。我們的出發點是“核心速度快嗎?” '我有足夠的核心嗎?'但它的意義遠不止于此。一旦你開始打破馮諾依曼架構并開始使用不同的內存流并開始研究內存計算,它就會變得非常酷。



主站蜘蛛池模板: 成 人色 网 站 欧美大片在线观看| 久久丫免费无码一区二区| 亚洲精品美女久久久久久久| 无线日本视频精品| 午夜福利yw在线观看2020| 少妇被爽到高潮动态图| 绝顶高潮合集videos| 亚洲精品字幕| 中文字幕无码肉感爆乳在线| 亚洲精品字幕| 欧美白丰满老太aaa片| 人妻少妇乱孑伦无码专区蜜柚| 国产精品h片在线播放| 亚洲女同一区二区| 国产成人综合美国十次| 青青草99久久精品国产综合| 精品一区二区不卡无码av| 国产精品久久久久久亚洲影视| 中文字幕人妻无码一夲道| 国产性夜夜春夜夜爽| 日韩人妻中文无码一区二区三区| 牛牛在线视频| 精品亚洲成a人在线看片| 少妇被粗大的猛进69视频| 久久精品国产亚洲欧美| 欧美又大粗又爽又黄大片视频| 久久久中日ab精品综合| 久久精品女人天堂av麻 | 亚洲妇女无套内射精| 国内精品久久久久久久影院| 亚洲国产精品久久青草无码| 九九视频免费精品视频| 久久无码中文字幕免费影院| 丰满人妻一区二区三区无码av| 97碰成人国产免费公开视频| 久久久久久曰本av免费免费| 天天狠天天透天干天天| 国产精品亚洲专区无码牛牛| 人人妻人人做人人爽精品| 国产亚洲精品久久久久久国| 久久婷婷五月综合色高清|