殺入光刻領域,押注生成式AI,英偉達要放大招了
據外媒報道,英偉達公司日前在GTC大會上宣布,將與與ASML、Synopsys和臺積電合作,推廣使用其“cuLitho”軟件庫進行計算光刻,表示該庫將使其合作伙伴能夠以更高的效率設計和制造下一代芯片。
英偉達方面認為,通過在GPU而不是通用CPU上運行,復雜IC光刻圖案背后的計算效率可以提高40倍。cuLitho軟件用于將工作負載轉換為可以利用GPU并行性的格式。這使500個 NVIDIA DGX H100 系統能夠完成40000個CPU系統執行的工作。
使用cuLitho的晶圓廠每天可以使用九分之一的功率生產三到五倍的光掩模。該公司還表示,需要兩周才能生產的光掩模可以使用cuLitho和GPU在一夜之間進行處理。從長遠來看,cuLitho將實現更好的設計規則、更高的密度、更高的產量,并且是通向AI驅動的光刻技術的途徑。
黃仁勛還透漏,Hopper架構GPU將使用cuLitho庫進行設計和制造。臺積電方面也回應稱,“這一發展為臺積電在芯片制造中更廣泛地部署逆光刻技術和深度學習等光刻解決方案開辟了新的可能性,為半導體規模的持續發展做出了重要貢獻”。
這次被黃仁勛稱為“迄今為止最重要的一次GTC”有超過25萬人參加。他在演講中多次提到,AI的“iPhone”時刻已經到來,而英偉達將在生成式AI領域進行軟硬件全面布局。同時,他還公布了英偉達在加速計算、量子計算、元宇宙等領域的技術和應用情況。
AI進入“iPhone”時刻,推出專用云服務
黃仁勛在演講中數次提到生成式AI,稱“ChatGPT是震驚世界的AI”。他認為,這意味著嶄新的計算平臺的誕生,AI的“iPhone”時刻已經到來,加速計算和AI技術已經走進現實。
在黃仁勛看來,ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具喚醒了世界對生成式AI的認知,尤其是ChatGPT作為迄今歷史上用戶數量增長最快的應用,生成的文本令人贊嘆。
黃仁勛認為,生成式AI是一種新型計算機,一種可以用人類語言進行編程的計算機,每個人都可以命令計算機來解決問題,而這之前是只有程序員才能接觸的領域,現在每個人都可以是程序員。
他同時還稱,生成式AI是一種新型計算平臺,與PC、互聯網、移動設備和云類似。正如此前的互聯網一樣,生成式AI也將重塑每個行業。
不過,黃仁勛提到,一些專業領域的公司需要使用專有數據來定制模型,他們需要制定使用規范,并優化模型,契合公司安全、隱私和安保要求。“這個行業需要一個類似臺積電的代工廠,來構建自定義的大型語言模型。”
為此英偉達宣布推出AI Foundations,黃仁勛將其稱為云服務和代工廠,其可以讓企業使用專有數據進行訓練、處理特定領域的任務,構建自定義的語言模型和生成式AI。
英偉達AI Foundations包括語言、視覺和生物學模型三個方面服務,其中Nemo用于構建定制的語言文本生成模型,通過Nemo可以快速生成文本,最快捷的方法是從英偉達的某項先進的預訓練基礎模型入手,輕松自定義一個模型,并進行參數調優,如匯總財務文檔、創建特定品牌內容、個性化寫作風格撰寫郵件等,將模型鏈接到專有數據庫,可確保響應是準確和最新的,并可以通過指定區域放防止模型出現意外。
Picasso是一項視覺語言模型制作服務,可以用于生成式AI賦能的圖像、視頻和3D應用,企業可以使用自己的數據來部署和訓練自己的模型,并可將生成的素材導入編輯工具或Omniverse,以構建逼真的虛擬世界、元宇宙應用和數字孿生仿真。Getty Images、Shutterstock和Adobe等企業已經開始使用該項服務。
黃仁勛還表示,英偉達將和Adobe共同構建一系列新一代AI功能,打造創意領域的未來,將生成式AI融入營銷和創意專業人士的日常工作中,新的生成式AI模型將對圖像、視頻、3D和動畫制作進行優化。同時,為保護藝術家的權利,Adobe正在開發以商業可行性和正確內容歸屬為重點的方案,由Adobe的“內容真實性倡議”提供支持。
第三個是面向的生物學的BioNeMo,其可幫助研究人員使用專有數據創建、微調和提供自定義模型,讓研發人員輕松加速藥物研發工作流,可以進行蛋白質預測、分子生成、分析連接等,節省藥物研發時間和資金成本。
在應用方面,英偉達與三菱聯合發布了將用于加速藥物研發的日本第一臺生成式AI超級計算機Tokyo-1。Tokyo-1通過使用BioNeMo軟件,研究人員能運行高達數十億參數的先進AI模型,可用于蛋白質結構預測、小分子生成、姿態估計等。
計算光刻技術提速40倍
黃仁勛帶來的另一項革命性技術,也關乎英偉達自身的產品研發,是一項聚焦先進芯片設計制造的技術——NVIDIA cuLitho的計算光刻庫。
NVIDIA cuLitho計算光刻庫可以通過計算技術大幅優化芯片制造流程,利用GPU技術實現計算光刻,可以使傳統光刻技術提速40倍以上,為2nm及更先進芯片的生產提供助力。
事實上,英偉達的計算光刻庫在研發過程中,已經與3家全球頂尖的芯片制造廠商開展了長達4年的合作。包括晶圓制造巨頭臺積電、光刻機制造商阿斯麥,以及EDA巨頭新思科技,目前3家廠商均已開始將該技術引入芯片設計和制造流程。
“計算光刻是芯片設計和制造領域中最大的計算工作負載,每年消耗數百億CPU小時。”黃仁勛介紹說,大型數據中心24x7全天候運行,以便創建用于光刻系統的掩膜板。這些數據中心是芯片制造商每年投資近2000億美元的資本支出的一部分。
NVIDIA H100需要89塊掩膜板,在CPU上運算時,處理單個掩膜板,當前需要2周時間。如果在GPU上運行cuLitho則只需8小時即可處理完一個掩膜板。黃仁勛說:“臺積電可以通過在500個DGX H100系統上使用cuLitho加速,將功率從35MW降至5MW,替代用于計算光刻的40000臺CPU服務器。”
GPU&量子計算
除了AI和芯片以外,英偉達還在研究另一項前沿科技——量子計算。
本次GTC上宣布的第一個全新產品就是與Quantum Machines合作的NVIDIA DGX Quantum。該產品結合了通用量子控制系統Quantum Machines OPX+和NVIDIA Grace Hopper超級芯片,這個平臺可以為高性能和低延遲量子經典計算的研究人員提供了一種革命性的新架構。
據黃仁勛介紹,NVIDIA DGX Quantum是全球首個GPU加速的量子計算系統,可以實現GPU和量子處理單元(QPU)之間的亞微秒級延遲。這種組合使研究人員能夠建立強大的應用,實現校準、控制、量子糾錯和混合算法,將量子計算與最先進的經典計算相結合。
DGX Quantum還為開發人員配備了統一軟件棧,混合GPU-Quantum編程模型NVIDIA CUDA Quantum,能夠在同一系統中整合和編程 QPU、GPU 和 CPU,是一個混合型量子經典計算平臺。目前,CUDA Quantum 已經開放了源代碼,為開發者提供了更多的支持。
在英偉達這次GTC大會上,下手ASML、TSMC 和 Synopsys突破計算光刻,助力行業跨越物理極限是另一個值得關注的亮點。
NVIDIA 表示,將加速計算帶入計算光刻領域,使 ASML、臺積電和 Synopsys 等半導體領導者能夠加速下一代芯片的設計和制造,正如當前的生產流程已接近物理學的極限一樣使成為可能。
英偉達在新聞稿中指出,用于計算光刻的全新 NVIDIA cuLitho 軟件庫被世界領先的晶圓代工廠臺積電和電子設計自動化領導者Synopsys集成到其最新一代 NVIDIA Hopper? 架構 GPU 的軟件、制造流程和系統中。設備制造商 ASML 在 GPU 和 cuLitho 方面與 NVIDIA 密切合作,并計劃將對 GPU 的支持集成到其所有計算光刻軟件產品中。
這一進步將使芯片具有比現在更細的晶體管和電線,同時加快上市時間并提高 24/7 全天候運行以驅動制造過程的大型數據中心的能源效率。
“芯片行業是世界上幾乎所有其他行業的基礎,”NVIDIA 創始人兼首席執行官黃仁勛表示。“隨著光刻技術達到物理極限,NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作,使晶圓廠能夠提高產量、減少碳足跡并為 2nm 及更高工藝奠定
在 GPU 上運行,cuLitho 比當前光刻技術(在硅晶圓上創建圖案的過程)提供高達 40 倍的性能飛躍,加速目前每年消耗數百億 CPU 小時的大量計算工作負載。
它使 500 個 NVIDIA DGX H100 系統能夠完成 40,000 個 CPU 系統的工作,并行運行計算光刻過程的所有部分,有助于減少電力需求和潛在的環境影響。
在短期內,使用 cuLitho 的晶圓廠可以幫助每天多生產 3-5 倍的光掩模——芯片設計的模板——使用比當前配置低 9 倍的功率。需要兩周才能完成的光掩模現在可以在一夜之間完成。
從長遠來看,cuLitho 將實現更好的設計規則、更高的密度、更高的產量和 AI 驅動的光刻。
“cuLitho 團隊通過將昂貴的操作轉移到 GPU,在加速計算光刻方面取得了令人欽佩的進展,”臺積電首席執行官 CC Wei 博士說。“這一發展為臺積電在芯片制造中更廣泛地部署逆光刻技術和深度學習等光刻解決方案開辟了新的可能性,為半導體規模的持續發展做出了重要貢獻。”
“我們計劃將對 GPU 的支持集成到我們所有的計算光刻軟件產品中,”ASML 首席執行官 Peter Wennink 說。“我們與 NVIDIA 在 GPU 和 cuLitho 方面的合作應該會給計算光刻帶來巨大好處,從而給半導體微縮帶來好處。在High NA 極紫外光刻時代尤其如此。”
Synopsys 董事長兼首席執行官 Aart de Geus 表示:“計算光刻,特別是光學鄰近校正 (OPC),正在突破最先進芯片的計算工作負載界限。“通過與我們的合作伙伴 NVIDIA 合作,在 cuLitho 平臺上運行 Synopsys OPC 軟件,我們將性能從數周大幅提升至數天!我們兩家領先公司的合作將繼續推動該行業取得驚人的進步。”
英偉達表示,近年來,由于較新節點中的晶體管數量更多以及更嚴格的精度要求,半導體制造中最大工作負載所需的計算時間成本已超過摩爾定律。未來的節點需要更詳細的計算,并非所有這些都可以適用于當前平臺提供的可用計算帶寬,從而減緩了半導體創新的步伐。
晶圓廠流程變更通常需要 OPC 修訂,從而造成瓶頸。cuLitho 有助于消除這些瓶頸,并使新穎的解決方案和創新技術成為可能,例如曲線掩模、High NA EUV 光刻和新技術節點所需的亞原子光刻膠建模。
總結
在昨天開幕的GTC上,英偉達還帶來了多樣化的產品,例如用于特定推理的的英偉達 L4 GPU。據報道,這款 GPU 可以提供比 CPU 高 120 倍的人工智能視頻性能。它提供增強的視頻解碼和轉碼功能、視頻流、增強現實和生成 AI 視頻。
此外,英偉達還聯合客戶打造由 16 個 DGX H100 系統組成,每個系統配備八個 H100 GPU的生成式AI超級計算機Tokyo-1。根據 Nvidia 的 AI 觸發器數學計算,這相當于大約一半的 exaflop AI 能力;由于每個 H100(一開始將有 128 個)提供 30 teraflops 的峰值 FP64 功率,因此它應該達到大約 3.84 petaflops 的峰值。
由此可見,黃仁勛正在帶領英偉達走向一個新階段。
