數據爆炸式增長將芯片要求推至高點,如何設計出更符合需求的半導體?
過去,大多數芯片都包含一到兩項前沿技術,主要是為了跟上每隔幾年每個新工藝節點的光刻技術的預期改進。這些改進是基于行業路線圖,該路線圖要求隨著時間的推移取得可預測但不顯著的收益。現在,隨著大型語言模型和更多傳感器推動的數據爆炸式增長,以及設計自己芯片的系統公司之間的競爭加劇,以及涉及人工智能的國際競爭日益激烈,芯片設計前沿的規則正在發生相當大的變化。
現在,漸進式改進與處理性能的巨大飛躍相結合,雖然這些改進使計算能力和分析達到了一個全新的水平,但它們也需要一套全新的權衡。
這些轉變的核心是高度定制的芯片架構,其中一些涉及在最先進的工藝節點開發的小芯片。并行處理幾乎是必然的,針對特定數據類型和操作的加速器也是如此。在某些情況下,這些微型系統不會進行商業銷售,因為它們為數據中心提供了競爭優勢。但它們也可能包括其他商用技術,例如處理核心或加速器或用于減少延遲的內存內或近內存計算技術,以及不同的緩存方案、共同封裝的光學器件和更快的互連。其中許多進展多年來一直處于研究或擱置狀態,現在正在全面部署。
谷歌研究院工程研究員兼機器學習系統副總裁 Amin Vahdat 在最近的 Hot Chips 2023 會議上的演講中指出,今天的芯片可以解決十年前無法想象的問題,而機器學習將承擔計算周期“越來越多的任務”。
我們在過去 50 或 60 年間開發的傳統計算智慧已被拋棄。
芯片設計發生了變化
傳統芯片公司、汽車原始設備制造商、無晶圓廠和非無晶圓廠IDM以及大型系統公司,現在在為特定應用尋求最佳解決方案時,不僅面臨著不同的工藝節點,而且面臨著更多的選擇和更獨特的挑戰。他們都對EDA生態系統提出了更高的要求,EDA生態系統正在競相跟上這些變化,包括各種類型的先進封裝,小芯片以及對集成和定制硬件和軟件的需求。
Cadence
Cadence 研發總裁Saugat Sen 說:“雖然在這個時代存在許多架構和設計挑戰,但解決熱問題已成為重中之重。一段時間以來,設計和實施的效率與多物理場分析的閉環集成有著錯綜復雜的聯系。”定義系統處理器的功率和能量要求也變得越來越困難。
IBM
IBM 研究員兼 IBM Z系統架構和設計首席技術官 Christian Jacobi 表示,計算的功耗和總能源使用是一個巨大的問題,并且由于地緣政治的發展、能源成本的上升和環境問題,目前它變得越來越大的系統問題。“與此同時,由于摩爾定律基本上已經結束,作為架構師,我們希望不斷為每個芯片添加特性、功能、性能和更多內核,而不會增加能源足跡。因此,我們必須更明智地管理芯片中的能源,從如何在任何時間點優化功耗與性能,如何利用并非所有計算資源都被充分利用的活動較少的時段,到減少芯片組件的功耗。”
IBM 針對其 Z Systems 的解決方案是將 AI 集成到處理器芯片中。“我們可以訪問它已經存在的數據,”Jacobi 說。如果數據在處理器芯片中,并且在處理器芯片的緩存中——因為這是任何其他業務流程對這些數據進行計算的地方,例如銀行交易或信用卡交易——我不需要采取該數據并將其移動到其他地方,移動到不同的設備或通過網絡或通過 PCI 接口移動到連接 I/O 的適配器。相反,我們有本地化的 AI 引擎,我可以在那里訪問這些數據。我不必將它轉到不同的設備。這顯然大大減少了執行 AI 的能源足跡。實際的計算本身,加法和乘法,它們仍然消耗功率。
是德科技
這對生態系統的其他部分意味著會變得更加復雜,因為并非每個芯片或封裝都會以相同的方式做事。是德科技新市場高級經理兼數字孿生項目經理 Chris Mueth 表示:“為了支持生態系統和產品復雜性,仍然需要做出許多改變。產品復雜性是主要驅動力,因為每個人都想要更多的小型化。每個人都希望他們擁有的產品具有更多功能。所以需要更多的集成。雖然看起來我們正在接近漸近條件,但我認為我們還有解決辦法。”
事實上,摩爾定律路線圖上至少還有幾個工藝節點,所有這三個領先的代工廠——三星、臺積電和英特爾——都有延伸到 1.x 納米范圍的路線圖。“這非常重要,因為我們必須使晶體管更小,原因有兩個,”Mueth 說。“一個是速度,另一個是熱量。當您在芯片上為無數晶體管計時,您會產生大量熱量。解決這個問題的方法是縮小所有內容,但在某個時候我們會達到一個漸近峰值。”
Rambus
Rambus 的杰出發明家 Steven Woo 對此表示贊同。“現在 Dennard 縮放已經基本停止,你真的無法再可靠地降低功率了,”他說。“因此,如果你想繼續獲得性能,并且想繼續增加計算密度,你將不得不想辦法吸走熱量。”
例如,在電動汽車中,這意味著 ECU 必須在整個電氣系統中電源非常有限的情況下進行設計。傳統上,硬件設計人員通過添加多種模式來解決此類問題,這些模式可以被關閉和監控,以衡量系統正在做什么,例如放慢速度。
“我們在人工智能中看到的更多可能會在所有領域發揮作用的是,軟件工程師真正了解系統性能和系統精度之間的權衡,”Woo 說。“如果他們在帶寬、能量或其他方面受到某種限制,他們就會把它變成一個軟件問題。如果他們需要更多帶寬,他們可以降低數字的精度,并且專門針對降低精度或稀疏性進行訓練。在人工智能領域,系統的軟件端和硬件端之間有一個整體的集成視圖。在過去的 20 年中,以同樣的方式,考慮到緩存大小和處理器架構,程序員被迫變得更加了解架構。未來,程序員必須更加了解系統中的功率限制等問題,并嘗試使用工具和 API,讓他們以性能換取功耗。”
在汽車領域尤其如此,芯片需要隨著時間的推移可靠運行,并且需要隨著算法和通信協議的變化而更新。
Fraunhofer
“我們看到的一大趨勢是對健康狀況的監測,”Fraunhofer IIS 自適應系統部工程設計方法負責人 Roland Jancke 說。“如果您在設計時不再能夠控制芯片,那么您需要在運行期間進行監控并切換到備件或其他一些備份。對于汽車電子,您需要考慮操作過程中可能發生的一切。但如果你說,'讓我們根據零件故障的可能性來開發這個,'然后你投入了一些備件,那么你將超出你的貨幣預算。”
Jancke 說,關鍵是能夠在緊急情況下故障轉移到另一個系統,但這可能是一個非常復雜的過程。與芯片設計中正在進行的許多變化一樣,它需要打破一些傳統的孤島,在這些孤島中,系統、半導體、封裝和軟件工程師在異構架構上協同工作。
Movellus
“異構架構并不是一個新概念,”Movellus 產品、營銷和規劃高級副總裁 Vik Karvat 說。“它在許多垂直領域得到了發展和擴展,包括移動、汽車和人工智能。現在的不同之處在于異構計算元素更大、更強大。英偉達的 Hopper + Grace 解決方案、英特爾的 Sapphire Rapids 和 Falcon Shore 平臺就是例證。然而,隨著這些元素變得越來越大,并且數據中心計算需求和密度目標繼續保持其幾何級增長曲線,異構單片機將過渡到異構小芯片方法以繼續擴展。這需要系統、半成品和包裝公司齊心協力。”
中科院利用AI技術開發出芯片設計技術,開發出全球首款無需人工干預,完全由AI人工智能設計的芯片,由此將繞開美國控制的EDA工具,在芯片設計方面將不再受美國的限制。
為了確保芯片自主權,芯片采用了RISC-V架構,以純國產的65納米工藝生產,而性能方面已與Intel的486相當,雖然性能與當下的差距較大,但是勝在這款芯片從芯片架構、芯片設計到芯片制造都實現了全國產化。
人工智能引入芯片行業已成風潮
據了解中科院發布的用AI人工智能設計的芯片可以大幅提升芯片設計速度,芯片設計時間只有現有EDA工具開發時間的千分之一,這將為國產芯片的設計提供許多可能性,中科院將人工智能引入芯片設計可謂開辟了芯片技術研發的先河,這套技術預計未來將可以應用于14納米乃至7納米、5納米芯片,而完全舍棄美國的EDA工具。
將人工智能技術引入芯片行業其實已在業內風行,最先將AI技術引入芯片行業的是臺積電,臺積電與NVIDIA合作,由NVIDIA為臺積電開發了人工智能技術cuLitho,如此可以大幅提升芯片光刻的效率,同時大幅降低了光刻的錯誤,這還為臺積電節省了大量電力,降低了成本。
芯片行業引入人工智能輔助,在于如今的芯片異常復雜,以人工設計或制造芯片的難度越來越大,畢竟一枚芯片動輒就是數百億顆晶體管,而引入人工智能可以更快地處理芯片內部的結構,同時通過計算機模擬可以從中發現問題,而不是如之前那樣只能等到流片之后再找出問題,那樣不僅浪費時間,還會造成巨額的成本。
如今中科院在芯片設計環節引入人工智能技術,臺積電則在芯片制造環節引入人工智能,如此在芯片設計和生產整條鏈條中就形成了以人工智能處理芯片的閉環,加快芯片量產進程,對于芯片行業無疑是巨大的利好。
