【新智元導讀】中科院計算所等機構推出了全國首個完全由AI設計的CPU芯片,不僅比目前GPT-4所能設計的電路規模大了4000倍,而且性能也達到了與Intel486萬分的水平。
中科院計算所的處置器芯片全國重點實驗室及其合作單位,用AI技術造型出了世界上首個無人工干預、全自動生成的CPU芯片——啟蒙1號。
這顆完全由AI設計的32位RISC-V CPU,相比GPT-4當今所能設計的電路規模大4000倍,并可運行Linux操作系統,且性能堪比Intel486。
而這項商酌,更是有望推翻傳統的芯片造型過程!
論文地址:https://arxiv.org/pdf/2306.12456
世界首個AI全自動生成的CPU芯片
眾所周知,CPU造型是一項極端挑戰且耗費人力和資源的工作。
這平時需要由工程師團隊編寫代碼(如Verilog、Chisel或C/C++等),然后在電子造型自動化(EDA)工具(如邏輯綜合或高層次綜合工具)的輔助下生成電路邏輯。
除此之外,工程師團隊針對人工編寫的代碼,還需反復使用測評用例對其進行迭代的功能驗證和性能/功耗優化。
然而,該過程極其復雜瑣碎,一般需要上百人團隊迭代數月或數年才能達成。以典型Intel CPU為例,超過500位工程師花了兩年時間才兌現整個設計工序[1]。
為了減少人力和資源擴張,研究人員采用AI技術干脆從測試用例的輸入-輸出(IO)自動生成CPU造型,無需工程師提供任何代碼或自然語言描述。
該方法在5小時內生成了超過4,000,000個邏輯門的32位RISC-V CPU——啟蒙1號(見圖1),比日前GPT-4所能造型的電路規模大4000倍。
圖1啟蒙1號芯片版圖及實物圖,其中CPU核部分完全由算法自動生成,芯片于2023年12月采用65nm工藝流片,運行頻率300MHz
該CPU于2023年12月流片,回片后成功運行了Linux操作系統和SPEC CPU2000程序,其性能與Intel486CPU十分(見圖2)。
啟蒙1號是地球上首個無人工干預、全自動生成的CPU芯片。該方法甚至自主地出現了包含控制器和運算器等在內的馮諾依曼架構,為后續映現人類未知的體系結構優化知識供給了抄襲。
圖2啟蒙1號芯片可以成功運行Linux操作系統及性能對比(CPU-AI為啟蒙1號)
全自動CPU造型:設計工序及挑戰
與傳統CPU造型工序中需要大量人工參與不同,思索人員探索使用「輸入-輸出(IO)」當成輸入,源于IO可以從大批現成的測試用例中直奔獲取或自動生成。
因此,允許將CPU自動造型問題形式化為「滿足輸入-輸出規范的電路邏輯生成問題」。
這也使得傳統的CPU設計工序發生了壯偉變化:只需嘗試用例即允許干脆生成滿足功能需求的電路邏輯,摒棄了傳統設計流程中極端耗時的、依靠人工的邏輯造型與驗證環節(見圖3)。
圖3(a)傳統的CPU設計過程涵蓋耗時的邏輯設計與驗證;(b)所提出的全自動CPU設計工序直行從IO生成保證功能準確的電路邏輯
然而,從IO生成滿足規范的電路邏輯面臨兩大挑戰:
(1)規模挑戰:在沒有任何專家給出的形式化或非形式化電路描述時,造型空間大小等同于全部也許存在的電路造型。對于以IO描述的電路來說,一個典型RISC-V CPU的設計空間約為
;在如此浩大空間中找到功能切實的CPU超出了當前自動化設計方法的能力;
(2)精度挑戰:生成的目標電路邏輯必須要足夠確切(譬如功能驗證精準率>99.99999999999%),否則任何微小錯誤都將造成浩瀚損失,這遠遠超過了傳統AI算法和應用對精度的要求。
符號主義的重生:基于BSD的電路自動造型方法
針對前面所提到的挑戰,不同于傳統基于連接主義的深度學習方法,商討人員所提出的方法是基于對二元決策圖(Binary Decision Diagram,BDD)進行增加的二元預測圖(Binary Speculation Diagram, BSD)。
與傳統的BDD構建依靠于形式化的描述不同,BSD使用常數0/1對BDD中的子圖進行功能預測。
在造型工序中,首先使用僅有1個節點的BSD算作對未知黑盒函數的初始預計,然后利用動態規劃方法一步步加入BSD中的節點個數,從而充足電路細節(見圖4)。該工作理論上說明了隨著BSD節點個數的加入,其電路切實率會進一步提升。
圖4具體的電路生成工序:從1個節點的BSD出發,進一步增進BSD中的節點個數以充沛電路細節
自主表現人類知識:蘊含馮諾依曼架構的CPU
此外,從IO自動生成的RISC-V CPU并不是雜亂無章的黑盒邏輯,而是蘊含了馮諾依曼架構的人類知識:由BSD表態的CPU造型包含了控制單元和運算單元(見圖5)。
其中控制單元是由BSD的頂層生成,用于整個CPU的全局控制,而運算單元則兌現算術和邏輯運算。
同時上述單元可以逐漸分解為更細粒度的子模塊,如譯碼器和ALU等,直到其最底層由基本的邏輯門構成。
圖5自主發現馮諾依曼結構:啟蒙1號中囊括了控制單元和運算單元,同時允許逐步分解為更細粒度的子模塊
對比與展望:不同人工智能路徑的交叉思索
自動的電路邏輯設計長期以來都是計算機科學的核心問題之一[2]。
近年來隨著人工智能技術的發展,也浮現了一批基于行為主義和連接主義(如深度強化學習和GPT-4大語言模型等)的自動邏輯設計工作(見表1)。
表1自動邏輯造型的代表工作對比情況
可以看出,相關工作嚴重聚焦于生成單個模塊或小規模CPU,其規模與實際CPU芯片還有多個數量級的差距。
中科院計算所團隊及其互助單位(包羅中科院軟件所、中科大、寒武紀企業等)所提出的方法生成了超過4,000,000個邏輯門的完整RISC-V CPU,相比現時GPT-4所能造型的電路規模大4000倍。
同時,該工作在符號主義的框架下從理論上保證了功能準確性,傾覆了傳統過程中的邏輯設計和功能驗證環節。
未來,通過符號主義、行為主義及連接主義等不同人工智能路徑的交叉探求,自動生成的CPU有望在5年或10年內達到甚至超越人類專家所設計的CPU,徹底推翻現有的芯片設計過程。
團隊介紹
自2008年起,中科院計算所便開始長期從事芯片設計和人工智能的交叉思慮。其中一項為人熟知的產出就是人工智能芯片寒武紀。
而在面向芯片造型的人工智能方法上,中科院計算所也已有十多年的積累,并且從未阻撓商討應該用人工智能方法使得芯片設計完全自動化。
依托我國科學院計算技術切磋所建立的處理器芯片世界重點實驗室,是中國科學院批準鄭重啟動建設的首批重點實驗室之一,并被科技部遴選為首批20個標桿地球重點實驗室,2023年5月開始建設。
其中,實驗室學術委員會主任為孫凝暉院士,實驗室主任為陳云霽探究員。
實驗室近年來獲得了處置器芯片領域首個國家自然科學獎等6項國家級科技獎勵;在處理器芯片領域國際頂級會議發表論文的數量長期列居國內第一;在國際上成功開創了深度學習處理器等熱門探討方向;孵化了總市值數千億元的國產處理器產業頭部企業。
模彷資料:
[1] Bentley, B. Validating a modern microprocessor. In Proceedings of International Conference on Computer Aided Verification (CAV),2–4(2005).
[2] Church, A. Applications of recursive arithmetic to the problem of circuit synthesis. Summaries of the Summer Institute of Symbolic Logic1,3-50(1957)
[3] Roy, R. et al. Prefixrl: Optimization of parallel prefix circuits using deep reinforcement learning. In Proceedings of Design Automation Conference,853–858(2023).
[4] Chen, P. et al. Circuit learning for logic regression on high dimensional Boolean space. In Proceedings of Design Automation Conference,151–6(2023)
[5] Rai, S. et al. Logic synthesis meets machine learning: Trading exactness for generalization. In Proceedings of Design, Automation & Test in Europe Conference & Exhibition,1026–1031(2023).
[6] Blocklove, J et al. Chip-Chat: Challenges and Opportunities in Conversational Hardware Design. In arxiv, https://arxiv.org/abs/2305.13243(2023)
(舉報)