智能科技已經(jīng)無縫融入到每個人的生活中。使用智能音箱查詢天氣、播放歌曲、甚至進行會議提醒確實很方便,但如果黑客能夠訪問你所有的數(shù)據(jù)和交易信息,那會不會是一場災(zāi)難呢?在萬物智能(Pervasive Intelligence)時代,人工智能(AI)和安全已經(jīng)成為超越傳統(tǒng)芯片設(shè)計界限的關(guān)鍵因素。
半導(dǎo)體行業(yè)的迅猛增長主要是由AI(人工智能)、ML(機器學(xué)習(xí))和DL(深度學(xué)習(xí))等技術(shù)的廣泛應(yīng)用所驅(qū)動的,這些技術(shù)對計算要求極高,需要專用芯片和高效的設(shè)計來支持智能功能。從語音和文本識別到高性能計算(HPC)、數(shù)據(jù)中心、搭載AI的個人電腦及自動駕駛汽車等,這些計算密集型任務(wù)依賴于先進的架構(gòu)。這些架構(gòu)不僅能夠提供強大的計算能力,還能隨著時間的推移優(yōu)化,不斷提升決策能力。尤其是在科學(xué)和醫(yī)學(xué)研究、氣象預(yù)報、金融、石油與天然氣勘探等細分領(lǐng)域,需要更強大的算例資源,以有效進行數(shù)據(jù)分析和數(shù)字計算。
人工智能的發(fā)展勢頭正在加速。隨著越來越多的智能設(shè)備接入云端,人工智能的潛力呈指數(shù)級增長,從而創(chuàng)造了龐大的市場機遇。為了讓設(shè)備根據(jù)現(xiàn)實條件快速做出決策,AI相關(guān)計算的關(guān)鍵部分必須在硬件中完成。專用的“AI芯片”對于經(jīng)濟高效地實現(xiàn)規(guī)模化AI應(yīng)用至關(guān)重要,它們?yōu)樘囟☉?yīng)用帶來了創(chuàng)新且顛覆性的解決方案。
當(dāng)前用于AI/ML/DL應(yīng)用的芯片含有定制的處理器架構(gòu)和復(fù)雜的數(shù)據(jù)路徑,能夠準確執(zhí)行所需的算術(shù)分析。行業(yè)對數(shù)據(jù)處理能力的需求日益增長,對功能自動化的期望不斷提高,智能技術(shù)在各類應(yīng)用中的廣泛集成,芯片開發(fā)者和驗證團隊也亟需采用現(xiàn)代化的驗證技術(shù),推動人工智能技術(shù)進一步發(fā)展。
在本文中我們將共同探討以下幾個問題:AI芯片對硅工程的影響,以及開發(fā)者面臨的關(guān)鍵功耗、性能和面積(PPA)有哪些挑戰(zhàn)?將AI芯片普及到各應(yīng)用領(lǐng)域的潛在機遇有哪些?對高級驗證有哪些需求?為何硬件安全在未來將變得至關(guān)重要?
不是只有半導(dǎo)體公司才能設(shè)計芯片
隨著摩爾定律逐漸接近極限,從通用處理器獲得期望的性能增益變得越來越困難。因此,許多非傳統(tǒng)半導(dǎo)體領(lǐng)域的公司開始自行設(shè)計芯片,以適應(yīng)特定應(yīng)用的需求。
像英偉達、英特爾、AMD、高通、Meta、亞馬遜、阿里巴巴、微軟和谷歌這樣的公司,目前都在積極投資開發(fā)自己的定制ASIC(應(yīng)用特定集成電路)芯片,旨在支持他們的AI軟件并滿足具體應(yīng)用的需求。十年前,幾乎沒有行業(yè)專家能預(yù)見到像Meta這樣的社交媒體公司會涉足這一領(lǐng)域。
此外,汽車、HPC和云計算等市場的系統(tǒng)和軟件公司也開始自主構(gòu)建專用硬件架構(gòu)。越來越多企業(yè)開始涉足芯片開發(fā)領(lǐng)域,這樣的市場增長孕育了海量全新機遇,為當(dāng)今要求苛刻的芯片設(shè)計環(huán)境帶來了一系列新的設(shè)計工具和解決方案。
在AI設(shè)計中采用RISC-V處理器架構(gòu)
RISC-V起初主要用于嵌入式應(yīng)用和微控制器領(lǐng)域。經(jīng)過多年的發(fā)展,這個開源標準在汽車、數(shù)據(jù)中心和高性能計算等諸多應(yīng)用領(lǐng)域持續(xù)受到關(guān)注,也越來越多地應(yīng)用到各式各樣的AI工作負載中。以下為廣泛采用RISC-V架構(gòu)的主要領(lǐng)域:
人工智能:AI芯片往往采用異構(gòu)設(shè)計,開發(fā)者會盡可能選擇RISC-V等現(xiàn)成的處理器,著力于開發(fā)高性能、高能效的AI加速器,用于完成諸如神經(jīng)網(wǎng)絡(luò)處理和自然語言處理等任務(wù)。
汽車:對于汽車SoC,RISC-V處理器可以滿足信息娛樂、高級駕駛輔助和通信等系統(tǒng)對性能、功耗、成本和安全性的要求。
高性能計算(HPC)和數(shù)據(jù)中心:RISC-V內(nèi)核非常適合使用定制ISA來處理復(fù)雜的計算任務(wù),而RISC-V擴展可以支持開發(fā)簡單、安全和靈活的內(nèi)核,從而滿足這些應(yīng)用的能效要求。
是什么讓AI芯片設(shè)計與眾不同?
從AI初創(chuàng)公司到全球主要的云服務(wù)提供商,各方紛紛加大研發(fā)力度,相繼推出了GroqChip、Nvidia H100 GPU、Ambarella CV52S、Atlazo AZ-N1、AWS Trainium和Google TPU v4等備受矚目的AI芯片。這些創(chuàng)新激發(fā)了一波又一波的芯片開發(fā)浪潮,推動了業(yè)界在開發(fā)更加快速和高效的AI芯片方面的競爭。
如今,以數(shù)據(jù)為中心的計算正在改變PC格局。而基于人工智能的PC正蓄勢待發(fā),有望為大眾帶來強大的智能功能。英特爾的目標是到2025年為1億臺支持人工智能的PC提供內(nèi)核處理器。這家芯片制造巨頭正在與微軟攜手定義人工智能PC,最終的成果預(yù)計將配備用于AI工作負載的神經(jīng)處理單元和微軟的Copilot AI聊天機器人。?
在當(dāng)前對AI片上系統(tǒng)(SoC)的新投資中,主要目的之一是讓系統(tǒng)能夠通過分布式操作執(zhí)行多重計算任務(wù),這一點超越了傳統(tǒng)CPU所提供的有限并行處理能力。AI/ML硬件設(shè)計包括多個數(shù)據(jù)密集型模塊,如控制路徑和計算模塊。控制路徑通過狀態(tài)機根據(jù)特定輸入處理輸出;計算模塊則包含加法器、減法器、乘法器和除法器等算術(shù)邏輯單元,負責(zé)執(zhí)行各類數(shù)據(jù)運算。這些功能極大地提高了AI算法處理大量重復(fù)、可預(yù)測和獨立計算任務(wù)的速度。
雖然計算模塊對于大多數(shù)設(shè)計團隊來說可能難度不大,但隨著算術(shù)模塊和位數(shù)的增加,其實施復(fù)雜程度也將急劇攀升,從而給驗證團隊帶來額外的壓力。
我們以一個簡單的4位乘法器為例。為了驗證它的完整功能,開發(fā)者需要為24=16種輸入組合編寫測試向量。那么挑戰(zhàn)在哪里呢?在驗證當(dāng)今AI芯片的實際場景時,由于數(shù)據(jù)處理量巨大,團隊需要驗證具有64位輸入的加法器。也就是說需要驗證264個狀態(tài),如果依靠傳統(tǒng)方法,則需要花費數(shù)年時間才能完成。
而這只是在設(shè)計中包含單一乘法器或除法器的情況。隨著AI芯片的應(yīng)用領(lǐng)域快速擴展,數(shù)據(jù)量的增長也在持續(xù)爆炸,這一趨勢使得整個情況變得更加復(fù)雜。為了應(yīng)對硬件驗證中的各種挑戰(zhàn)和耗時任務(wù),開發(fā)者迫切需要一種安全且靈活的現(xiàn)代化驗證解決方案。
芯片驗證所面臨的主要挑戰(zhàn)
在團隊設(shè)計AI芯片時,通常會選擇運行速度較快且用途較廣的C/C++來編寫設(shè)計算法。編寫完功能代碼后,需要使用RTL(寄存器傳輸語言)將信息轉(zhuǎn)換為更適用于硬件的表示形式,以便實現(xiàn)設(shè)計。為此,團隊要么為所有可能的組合開發(fā)測試向量,要么驗證RTL是否與原始的C/C++架構(gòu)模型保持一致,這兩項任務(wù)相當(dāng)艱巨,無論作何選擇,都需要投入大量的時間和精力。
當(dāng)需要全面驗證而連續(xù)迭代方法顯得不現(xiàn)實時,可以采用形式化驗證等技術(shù)。形式化驗證通過數(shù)學(xué)分析,允許一次性全面考慮整個硬件設(shè)計,從而無需為每種輸入組合編寫測試向量。相反,可以使用模型檢測器,根據(jù)一系列預(yù)定義的行為斷言來驗證設(shè)計。
十年前,形式化驗證需要使用高級斷言,被視為一項僅限專家操作的技術(shù)。但現(xiàn)在情況已大為不同。如今,任何RTL開發(fā)者或驗證開發(fā)者都能迅速掌握相關(guān)技能并將其應(yīng)用于設(shè)計中,這要求當(dāng)前的驗證工具必須簡單易用。此外,改善工具的調(diào)試功能也極為關(guān)鍵,它有助于開發(fā)者理解復(fù)雜且不熟悉的設(shè)計行為,以及統(tǒng)一多樣化且復(fù)雜的設(shè)計環(huán)境。
然而,鑒于當(dāng)前AI芯片的巨大尺寸、規(guī)模和復(fù)雜性,通過模型檢測實現(xiàn)完整的驗證已不再可行。從長遠來看,使用傳統(tǒng)方法來驗證這些數(shù)學(xué)功能不僅效率低下、耗時,也是不現(xiàn)實的。對于靈活且可定制的RISC-V架構(gòu)來說,每當(dāng)添加新的自定義指令時,確保所有配置都經(jīng)過徹底驗證是另一個挑戰(zhàn)。
AI和ML應(yīng)用亟需高級數(shù)據(jù)路徑驗證
驗證開發(fā)者可以通過等效性檢查等其他形式化驗證來高效驗證復(fù)雜的AI數(shù)據(jù)路徑。這種方法可以比較同一設(shè)計的兩種表示形式,由此能夠證明這兩種形式是否等效,識別出它們之間的具體差異。借助強大的形式化驗證引擎,這兩種表示形式可以處在截然不同的抽象層次上,甚至可以用不同的編程語言編寫,這無疑是巨大的優(yōu)勢。這種方法通常用于根據(jù)邏輯綜合所生成的門級網(wǎng)表來檢查RTL輸入。
例如,可以將芯片設(shè)計的詳細RTL實現(xiàn)與高級C/C++架構(gòu)模型進行比較。這種比較可以確認對于這兩種表示形式,同一組輸入會生成相同的輸出。這個有效的方法適合很多AI項目,因為大多數(shù)項目已擁有C/C++模型,可用于仿真中的結(jié)果檢測,或作為虛擬平臺的一部分來支持早期軟件開發(fā)和測試。
要根據(jù)經(jīng)驗證的參考模型對設(shè)計數(shù)據(jù)路徑進行詳盡驗證,形式化等效性檢查仍然是目前少數(shù)可行的技術(shù)。為了推動AI應(yīng)用不斷發(fā)展,并驗證今后熱門AI應(yīng)用中的復(fù)雜功能單元,驗證工具和解決方案需要簡單易用,可擴展到更大的設(shè)計規(guī)模,并擁有能快速檢測錯誤的高級調(diào)試功能。
在實現(xiàn)層面,要達到所需的PPA通常會遇到一些挑戰(zhàn)。對此,新型全環(huán)繞柵極(GAA)技術(shù)節(jié)點和Multi-Die設(shè)計架構(gòu)可以提供幫助。Synopsys.ai全棧式AI驅(qū)動型EDA整體解決方案可處理重復(fù)性任務(wù),例如設(shè)計空間探索、驗證覆蓋和回歸分析,從而更快完成PPA的優(yōu)化。
從當(dāng)前的AI加速器到日后的認知系統(tǒng)
硬件設(shè)計已成為AI創(chuàng)新的核心推動力。當(dāng)前計算工作負載的加速發(fā)展,對于縮短設(shè)計和驗證周期的迫切需求仍將保持增長。如今,新思科技提供多款成熟可靠的驗證解決方案,助力開發(fā)者在眾多應(yīng)用領(lǐng)域中驗證復(fù)雜的AI架構(gòu)。
新思科技VC Formal等新一代形式化驗證解決方案為開發(fā)團隊帶來所需的速度、容量和靈活性,助其驗證復(fù)雜的SoC設(shè)計。該解決方案包含全面的分析和調(diào)試技術(shù),可幫助團隊通過新思科技Verdi調(diào)試平臺快速識別根本原因。
VC Formal解決方案提供了一套廣泛的形式化驗證應(yīng)用,其中包括集成了HECTOR技術(shù)的VC Formal數(shù)據(jù)路徑驗證(DPV)應(yīng)用。其中,HECTOR技術(shù)已成功部署于許多要求苛刻的AI芯片項目。借助定制優(yōu)化和用于數(shù)據(jù)路徑驗證的引擎(ALU、FPU、DSP等),VC Formal解決方案可報告RTL和C/C++模型結(jié)果中的所有差異,以便在Verdi SoC調(diào)試平臺中進行診斷,并驗證二者是否已消除所有差異且達到等效目標。VC Formal解決方案已幫助多家創(chuàng)新芯片開發(fā)商和新興AI/ML芯片公司收獲累累碩果。
此外,我們的解決方案還利用了并行處理的優(yōu)點,允許同時在多個內(nèi)核上運行仿真,享受云端的優(yōu)勢。這意味著,即使是那些有臨時性、高強度計算需求的企業(yè),也可以使用我們的工具來設(shè)計AI硬件。AI市場日新月異、蓬勃發(fā)展,我們很高興能夠通過前沿的驗證解決方案為AI行業(yè)提供支持,助力開創(chuàng)AI芯片和軟件的新時代。
不久的將來:AI芯片將實現(xiàn)同態(tài)加密
AI行業(yè)將持續(xù)處理數(shù)萬億字節(jié)的數(shù)據(jù),并且需要高性能芯片來維持這種計算范式,因此數(shù)據(jù)位數(shù)的增加無可避免。全球眾多大學(xué)和研究機構(gòu)正積極探索處理大規(guī)模位數(shù)輸入數(shù)據(jù)(如4096位)的可行性,并致力于構(gòu)建相應(yīng)的解決方案,以設(shè)計支持此類龐大數(shù)據(jù)輸入量的芯片。而這正是VC Formal數(shù)據(jù)路徑驗證和形式化安全驗證(FSV)應(yīng)用的理想應(yīng)用場景。
海量數(shù)據(jù)正如潮水般涌入,對硬件安全防護的需求也隨之加劇。比如,最近發(fā)生了一起價值6億美元的加密貨幣盜竊案,這是去中心化金融領(lǐng)域有史以來金額最龐大的盜竊案,暴露出了一些可能被網(wǎng)絡(luò)犯罪分子所利用的緊急威脅和漏洞,凸顯了端到端安全的重要性。同態(tài)加密將成為AI/ML芯片發(fā)展不可或缺的一部分。簡單地說,借助同態(tài)加密,您可以加密數(shù)據(jù)并在不解密的情況下執(zhí)行AI系統(tǒng)所需的相同算術(shù)計算,從而降低數(shù)據(jù)泄露的風(fēng)險。同態(tài)加密是前景可期的發(fā)展方向,有望提升AI芯片設(shè)計的效率和結(jié)果質(zhì)量。為了推動同態(tài)加密的廣泛采用,我們亟需開發(fā)下一代工具來助力其快速增長。
總結(jié)
人工智能日漸普及各方面計算應(yīng)用,無論在哪個細分市場,AI芯片要想取得成功,都需要對設(shè)計進行充分驗證。沒有人希望自己的自動駕駛汽車撞上那些被圖像識別分析所忽略的障礙物。新的邊緣AI設(shè)備將推動實時海量數(shù)據(jù)計算爆炸式增長,并改變芯片開發(fā)者的半導(dǎo)體設(shè)計方式,由此會提高生產(chǎn)力、縮短周轉(zhuǎn)時間并帶來更出色的驗證解決方案。
一個以人工智能為核心的新時代即將來臨。如今,我們還需要引導(dǎo)才能回答問題的虛擬助手,未來是否能發(fā)展成像鋼鐵俠中的J.A.R.V.I.S那樣的智能助理呢?一切答案,時間將會揭曉。
評論