數(shù)字信號(hào)處理技術(shù)無(wú)處不在。如今的設(shè)備常常配備數(shù)十個(gè)傳感器,這些傳感器采集的數(shù)據(jù)要經(jīng)過(guò)篩選與聚合處理后,才能為人工智能(AI)模型所用。隨著人工智能工作負(fù)載在各行各業(yè)中日益普及,嵌入式系統(tǒng)對(duì)強(qiáng)大且高效的信號(hào)處理能力的需求也與日俱增。這些計(jì)算密集型人工智能算法通常控制代碼量有限,主要在數(shù)據(jù)流上運(yùn)行,并且要求具備硬實(shí)時(shí)性能,同時(shí)滿足低延遲的嚴(yán)格限制。
因此,數(shù)字信號(hào)處理器(DSP)成為了解決方案中不可或缺的關(guān)鍵部分。與通用處理器不同,DSP能夠并行執(zhí)行矢量化計(jì)算,從而最大限度地減少計(jì)算周期數(shù)和延遲。然而,增加矢量大小會(huì)占用更多的芯片面積,因此需要在性能與效率之間找到恰當(dāng)?shù)钠胶狻?/p>
這正是行業(yè)需要更多選擇的原因所在。開(kāi)發(fā)者在挑選DSP時(shí),不僅要確保其能滿足特定應(yīng)用的性能要求,還要使其符合給定的芯片面積和功耗預(yù)算限制。幸運(yùn)的是,新思科技的ARC VPX產(chǎn)品系列最近進(jìn)行了擴(kuò)展,正好滿足了這一需求。
新型ARC VPX6處理器為該產(chǎn)品系列引入了1024位矢量處理功能,進(jìn)一步豐富了現(xiàn)有的VPX系列,該系列還包括VPX5(512位)、VPX3(256位)和VPX2(128位)等不同版本。VPX6在將峰值性能提升至原來(lái)兩倍的同時(shí),還能與VPX系列的其他成員保持完全的軟件兼容性。開(kāi)發(fā)者只需對(duì)硬件進(jìn)行升級(jí),而無(wú)需重新編寫代碼,就能從一開(kāi)始便實(shí)現(xiàn)性能的顯著提升。
ARC VPX DSP系列
ARC VPX DSP系列是專為低功耗、高吞吐量計(jì)算而設(shè)計(jì)的高性能矢量DSP。這些處理器廣泛應(yīng)用于汽車傳感、人工智能視覺(jué)系統(tǒng)、雷達(dá)/激光雷達(dá)和工業(yè)自動(dòng)化領(lǐng)域,在這些領(lǐng)域,對(duì)海量數(shù)據(jù)流進(jìn)行實(shí)時(shí)處理至關(guān)重要。
早期的VPX處理器支持128位、256位和512位的矢量長(zhǎng)度,這使得開(kāi)發(fā)者能夠根據(jù)工作負(fù)載選擇最高效的處理配置。這些處理器具有魯棒的多核可擴(kuò)展性,但隨著更高分辨率攝像頭、更密集傳感器陣列以及更復(fù)雜人工智能模型的出現(xiàn)導(dǎo)致數(shù)據(jù)量持續(xù)增長(zhǎng),許多應(yīng)用對(duì)并行處理效率提出了更高的要求。
新型ARC VPX6通過(guò)引入1024位矢量處理功能,進(jìn)一步擴(kuò)充了VPX系列,其數(shù)據(jù)吞吐量相較于VPX5提升了一倍。VPX6在與之前VPX處理器保持向后兼容性的基礎(chǔ)上,提供了一種可擴(kuò)展的高效解決方案,以滿足新一代人工智能和嵌入式系統(tǒng)的需求。
VPX6的突出優(yōu)勢(shì)
ARC VPX6的核心改進(jìn)在于其引入了1024位矢量單指令多數(shù)據(jù)(SIMD)處理技術(shù),該技術(shù)顯著提高了計(jì)算效率。借助SIMD架構(gòu),VPX6能夠同時(shí)對(duì)多個(gè)數(shù)據(jù)點(diǎn)執(zhí)行單一操作,從而減少了所需的計(jì)算周期。與VPX5的512位處理能力(每周期可執(zhí)行64次單精度浮點(diǎn)運(yùn)算)相比,VPX6的運(yùn)算能力達(dá)到了其兩倍,每周期可執(zhí)行128次運(yùn)算。這使得VPX6在圖像濾波、雷達(dá)批量快速傅里葉變換(FFT)、人工智能預(yù)處理以及傳感器融合等工作負(fù)載中表現(xiàn)出色,性能得到了顯著增強(qiáng)。
除了強(qiáng)大的原始計(jì)算能力外,ARC VPX6還配備了先進(jìn)的直接內(nèi)存訪問(wèn)(DMA)引擎,該引擎能夠確保數(shù)據(jù)持續(xù)不斷地流向處理器,避免出現(xiàn)空閑周期,從而最大限度地提高數(shù)據(jù)吞吐量。VPX6支持雙緩沖技術(shù),能夠有效地隱藏內(nèi)存延遲,從而最大限度地提高了計(jì)算效率。
值得注意的是,矢量處理受阿姆達(dá)爾定律的約束。那么,并行化的程度能夠達(dá)到多高,以及在哪個(gè)階段將任務(wù)分配給多個(gè)并行工作的內(nèi)核更為合適呢?這些問(wèn)題的答案取決于具體的應(yīng)用工作負(fù)載。而VPX6的出現(xiàn)為開(kāi)發(fā)者提供了更多的選擇。
▲新思科技 ARC VPX 數(shù)字信號(hào)處理器 IP
可擴(kuò)展性、可配置性與易用性
ARC VPX6完全向后兼容VPX2、VPX3和VPX5,能輕松集成到新設(shè)計(jì)或現(xiàn)有設(shè)計(jì)中。例如,新思科技提供了與矢量長(zhǎng)度無(wú)關(guān)的庫(kù),確保之前為VPX處理器編寫的遺留軟件無(wú)需修改,就能在VPX6上運(yùn)行。這種兼容性縮短了開(kāi)發(fā)周期,開(kāi)發(fā)者不用修改現(xiàn)有代碼庫(kù),就能輕松升級(jí)解決方案。與矢量長(zhǎng)度無(wú)關(guān)的設(shè)計(jì)方法,使得基于相同的軟件基礎(chǔ)架構(gòu),能夠開(kāi)發(fā)出滿足不同性能需求(從低端到高端)的完整產(chǎn)品系列。
與VPX系列的其他成員一樣,VPX6具有高度可配置性。例如,開(kāi)發(fā)者可以輕松定義寄存器數(shù)量、L1和L2內(nèi)存大小等參數(shù),或者決定是否在架構(gòu)中集成數(shù)學(xué)和FFT加速器。這種靈活性使工程師能夠根據(jù)具體的應(yīng)用需求定制架構(gòu),有效地避免了芯片面積和功耗的不必要開(kāi)銷。
為了進(jìn)一步提高可擴(kuò)展性,VPX6提供了多種配置選項(xiàng):?jiǎn)魏耍╒PX6)、雙核(VPX6x2)和四核(VPX6x4)。這些完全集成的多核解決方案配備了共享的DMA引擎、內(nèi)存一致性機(jī)制、同步支持以及運(yùn)行時(shí)庫(kù)。這使得開(kāi)發(fā)者能夠根據(jù)特定的工作負(fù)載需求,對(duì)性能和能效進(jìn)行優(yōu)化。
VPX系列的所有成員均采用ARC處理器擴(kuò)展(APEX)專利技術(shù),允許開(kāi)發(fā)者創(chuàng)建用戶自定義的標(biāo)量和矢量指令。同時(shí),它還支持集成定制的硬件加速器,在提升特定應(yīng)用性能的同時(shí),降低了功耗和內(nèi)存需求。VPX處理器還有豐富的預(yù)優(yōu)化庫(kù),涵蓋DSP、線性代數(shù)和視覺(jué)處理領(lǐng)域,其中包括專為OpenCV風(fēng)格操作定制的視覺(jué)內(nèi)核。這些庫(kù)提供了現(xiàn)成的軟件功能,如顏色轉(zhuǎn)換、解算器、邊緣檢測(cè)、物體跟蹤、矩陣變換和FFT等。
為VPX6設(shè)計(jì)的新功能,包括能夠處理長(zhǎng)內(nèi)存延遲的增強(qiáng)型DMA,以及對(duì)人工智能應(yīng)用緊湊型數(shù)據(jù)存儲(chǔ)新行業(yè)標(biāo)準(zhǔn)OCP-MX的支持,也將推廣到整個(gè)VPX系列。
VPX6具有重大影響力的應(yīng)用領(lǐng)域
ARC VPX6為開(kāi)發(fā)者帶來(lái)了諸多優(yōu)勢(shì),非常適合用于眾多實(shí)時(shí)、高性能信號(hào)處理應(yīng)用:
汽車傳感器處理:VPX6為高級(jí)駕駛輔助系統(tǒng)(ADAS)提供了有力支持。其高吞吐量的矢量化計(jì)算和優(yōu)化的SIMD處理功能,能夠高效地處理來(lái)自多個(gè)傳感器的攝像頭數(shù)據(jù),實(shí)時(shí)識(shí)別物體、車道標(biāo)線和行人。同樣,在自動(dòng)駕駛汽車的雷達(dá)和激光雷達(dá)數(shù)據(jù)處理方面,VPX6能夠加速物體檢測(cè)和距離估算,從而提升基于人工智能的決策能力。
工業(yè)和智能攝像頭:VPX6能夠?qū)崿F(xiàn)高速圖像濾波、降噪和特征增強(qiáng)。這些功能為先進(jìn)的視覺(jué)處理提供了有力支持,減少甚至消除了對(duì)專用外部處理器的依賴。
人工智能和機(jī)器學(xué)習(xí)工作負(fù)載:VPX6可作為高速預(yù)處理器,在將數(shù)據(jù)傳遞給神經(jīng)處理單元(NPU)(如新思科技ARC NPX)之前對(duì)數(shù)據(jù)進(jìn)行優(yōu)化處理。通過(guò)處理計(jì)算密集型濾波和特征提取任務(wù),VPX6能夠顯著提高推理效率,減少人工智能工作負(fù)載中的瓶頸問(wèn)題。借助集成SDK(內(nèi)含基于ONNX的神經(jīng)網(wǎng)絡(luò)編譯器),人工智能任務(wù)能在VPX和NPX之間自動(dòng)分配。由VPX和NPX組成的人工智能子系統(tǒng),結(jié)合了人工智能加速器的強(qiáng)勁性能以及強(qiáng)大DSP的前瞻性和靈活性。
安全實(shí)現(xiàn):上述許多應(yīng)用都對(duì)信息安全和軟件安全有著嚴(yán)格的認(rèn)證要求。因此,VPX系列的所有成員都提供了功能安全(FS)版本,該版本不僅通過(guò)了ISO 26262 ASIL信息安全認(rèn)證,還符合ISO/SAE 21434網(wǎng)絡(luò)安全標(biāo)準(zhǔn)。經(jīng)過(guò)安全認(rèn)證的硬件,搭配經(jīng)過(guò)安全認(rèn)證的編譯器、運(yùn)行時(shí)環(huán)境和計(jì)算庫(kù),確保了系統(tǒng)安全穩(wěn)定。
將數(shù)字信號(hào)處理提升到新高度
新思科技的ARC VPX6將數(shù)字信號(hào)處理技術(shù)提升至全新的水平。它在將VPX5的性能提升一倍的同時(shí),減少了計(jì)算周期和功耗并且保持了軟件的完全兼容性,便于開(kāi)發(fā)者采用。VPX6具有更高的可擴(kuò)展性和效率,為開(kāi)發(fā)者提供了更大的靈活性,使他們能夠根據(jù)特定的工作負(fù)載優(yōu)化功耗、性能和面積(PPA)。
展望未來(lái),新思科技將繼續(xù)推進(jìn)ARC VPX處理器系列的發(fā)展,以滿足人工智能和嵌入式系統(tǒng)不斷變化的需求。通過(guò)提供行業(yè)領(lǐng)先的工具、優(yōu)化的庫(kù)以及便捷的集成選項(xiàng),新思科技將助力開(kāi)發(fā)者突破高性能信號(hào)處理的界限,實(shí)現(xiàn)更多的創(chuàng)新。
-
處理器
+關(guān)注
關(guān)注
68文章
19852瀏覽量
234196 -
數(shù)字信號(hào)
+關(guān)注
關(guān)注
2文章
996瀏覽量
48243 -
新思科技
+關(guān)注
關(guān)注
5文章
863瀏覽量
51374
原文標(biāo)題:實(shí)時(shí)響應(yīng)“快人一步”,高效低耗“省出境界”: 新思科技ARC VPX6 1024位矢量處理器登場(chǎng)
文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
新思科技攜手上海大學(xué)助力嵌入式人才培養(yǎng)
HXS320F28027數(shù)字信號(hào)處理器(32位RISC-V DSP)
Cadence推出Tensilica NeuroEdge 130 AI協(xié)處理器
新思科技推出基于Arm服務(wù)器原生運(yùn)行的Virtualizer虛擬仿真技術(shù)
英特爾至強(qiáng)6處理器助力數(shù)據(jù)中心整合升級(jí)
聆思科技獲得Ceva-Waves Wi-Fi 6 IP授權(quán)
Andes晶心科技推出D45-SE RISC-V處理器
刀片計(jì)算機(jī)設(shè)計(jì)原理圖:194-6U VPX(I7-6代,2路存儲(chǔ)2路萬(wàn)兆)刀片計(jì)算機(jī)(M7)

基于DSP TMS320C6678+FPGA XC7V690T的6U VPX信號(hào)處理卡

L-com諾通推出新型6類/超6類Keystone IDC插座
高通驍龍6 Gen 3處理器發(fā)布

意法半導(dǎo)體推出工業(yè)級(jí)64位微處理器STM32MP2系列
LM98519 10位65 MSPS 6通道成像信號(hào)處理器數(shù)據(jù)表

評(píng)論