2108年10月16日,賽靈思開發者大會在北京召開,本次大會有近千人參加,為廣大軟硬件、嵌入式開發者提供了一個面對面交流、學習、分享經驗的機會。賽靈思的專家團隊以及華為、阿里巴巴、浪潮等數十家國內外領先企業的專家匯聚一堂,與廣大開發者共同探討行業趨勢,分享設計經驗,展示先進案例。
在本次大會上賽靈思產品與技術市場營銷高級總監Kirk Saban與賽靈思軟件和IP產品部執行副總裁Salil Raje分別進行精彩主題演講。
一、顛覆性的創新
Kirk Saban在大會上說道:“現在的世界是一個互聯的世界,發展與創新的速度都是非常快的。我們每天都在面對海量的數據,單一的計算架構已經不能應對如此大規模的數據,需要各種各樣的計算架構彼此配合。”
如今的開發者結構發生了變化,不單單有硬件開發者,也涌現了很多軟件開發者。但是并不是所有的軟件開發者都熟悉硬件開發,他們需要有可以使其可以快速上手的平臺與工具,也需要相應的能力來優化產品性能并用在不同的工作負載中。
那么如何來解決這個問題呢?過去有三個解決方案:CPU、固定功能的加速器(像ASSP和GPU)與FPGA。但是就如今的技術發展程度來說,這三種解決方案或多或少的都存在不足,不能很好的應對各種各樣的問題。
為此,Kirk Saban向大家介紹了ACAP平臺與其首款產品Versal。ACAP是可擴展性非常高的、軟硬件都可編程的、高度集成的多核異構計算平臺。
因為ACAP的出現,未來的計算拉開了序幕,首款ACAP產品Versal應運而生。Versal具有異構處理能力,有多個不同類型的處理引擎,可以應對市場上多樣的工作負載。Versal有哪些特點呢?
1、標量處理引擎。Versal有雙ARM Cortex-A72應用處理器。嵌入式處理來自于ARM,擁有高性能的同時又支持非常廣泛的應用。雙ARM Cortex-R5實時處理器,適用于對安全性要求非常高的應用,而且有一些步驟鎖定功能可以進行平臺管理。
2、靈活應變的硬件引擎。靈活應變的硬件進行重新架構提高計算密度,能夠支持客戶內存層次結構,比如要求不同的內存層次結構高級機器學習和AI推斷部署和實施。
3、智能引擎。
●DSP引擎,DSP的引擎在Versal架構當中能夠實現高精度浮點和低時延,主要面向定制化數據路徑的粒度控制。
●AI引擎,能夠大大提高應用的AI推斷能力,專為AI推斷和高級信號處理工作負載而優化。
4、集成主機接口。PCIe Gen4x16,集成AXI-DMA。還有實現服務器級CPU,提供無縫加速CCIX。
5、集成各種協議引擎。包括100G多速率以太網,600G以太網和Interlaken,以及600G加密引擎(AES/IPSEC/MACSEC)
6、集成RF信號鏈。下一代GSPS直接射頻采樣ADC/DAC,集成DDC/DUC。面向5G和DOCSIS的SD-FEC。
7、可編程的I/O界面。支持傳感器的MIPI D-PHY大于3Gb/s;支持NAND和存儲級存儲器;包括LVDS和通用的I/O。
8、片上網絡(NOC)。本質上軟件可編程,簡單易用;高帶寬、低時延;與軟實現相比功率效率提升8倍,跨異構引擎仲裁。
在賽靈思開發者大會上,主要兩個Versal Prime基礎系列與AI Core核心系列。
二、AI加速
在賽靈思開發者大會上,Salil Raje先生進行了主題為“AI加速”的精彩演講,激情描繪賽靈思靈活應變的新型器件將如何加速當今AI時代各種創新的整體應用,擁抱所有的開發者。
賽靈思軟件和IP產品部執行副總裁Salil Raje
Salil Raje談到AI人工智能有兩個階段,訓練和推斷。
在訓練的階段要將海量的數據放到模型當中,然后微調模型減少誤差。海量的數據在這個階段是至關重要的,相對而言延遲和功耗在訓練階段不是重要。而在推斷過程中,用到數據量比較少,在此階段延遲是極其關鍵的,甚至會成為一種制約。這是因為很多推斷引擎都是實時響應的,響應速度至關重要,這樣一來,功耗在這個階段也就顯得非常重要了。在過去幾年全球的關注點都集中在訓練上,但是今后AI模型必須應用在云端和邊緣的模型上,所以未來的模式更多的將是推斷。而賽靈思關注的就是推斷。
那么推斷這個模式將帶來哪些挑戰呢?第一是AI創新的速度。第二,低時延、高通量和高性能的要求。第三,低功耗。最后同樣是實現整體的應用加速。
那么賽靈思是怎么應對這些挑戰的呢?Salil Raje認為只有靈活應變的硬件才能應對推斷所面臨的挑戰,比如賽靈思的FPGA和ACAP。靈活應變的硬件的優勢在于:
1、自定義數據流。針對最先進的當前的網絡與最先進的技術變化,可以重新實施而不需要重新更換芯片;
2、自定義內存的層次結構。可以用更多的片上內存而不是DDR;
3、改善功耗和時延;
4、自定義精度。可以選擇網絡最合適的精度。
賽靈思開始創造的一個特定領域架構是DSA,這些DSA在FPGA或者ACAP器件上進行實施和部署,能夠在自定義的數據流、自定義的內存層次結構和自定義精度三個維度上進行優化。一旦在ACAP實施就可以將現有的網絡轉到DSA來實現AI模型。
而賽靈思收購了在DSA方面的領先企業——深鑒科技,深鑒科技有非常獨特的技術,可以自定義數據流來適用大家所需要的網絡。此外,深鑒科技還有量化的技術,即可以自定義精度也可以重新訓練,然后重新獲得精度。如Deephi LSTM與XDNN。
人工智能的革命已經開始了,在AI推斷面前有很多的機會和挑戰。賽靈思的器件包括FPGA、ACAP等能夠提供同步AI創新的速度、低時延的最佳性能、最佳功耗效果以及加速整體應用。無論是AI專家還是AI新人,賽靈思都非常期待和大家共同合作,攜手并進。
-
FPGA
+關注
關注
1643文章
21956瀏覽量
614024 -
賽靈思
+關注
關注
33文章
1795瀏覽量
132116 -
gpu
+關注
關注
28文章
4909瀏覽量
130648
原文標題:賽靈思:致力打造靈活應變、萬物智能的世界
文章出處:【微信號:FPGAer_Club,微信公眾號:FPGAer俱樂部】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
2025開源鴻蒙開發者大會圓滿落幕
格靈深瞳亮相Create2025百度AI開發者大會
IAR亮相矽力杰2025開發者大會
格靈深瞳受邀參加RWKV社區開發者大會
中科曙光亮相2025全球開發者先鋒大會
DFRobot參加2024開放原子開發者大會及開放原子開放硬件許可證發布儀式

2024開放原子開發者大會暨首屆開源技術學術大會成功舉辦
普華基礎軟件亮相BlackBerry QNX 2024年度開發者大會
光庭信息亮相BlackBerry QNX 2024年度開發者大會
AI行業大咖云集 2024邊緣智能開發者生態大會圓滿落幕

AI驅動智慧未來,2024 TUYA全球開發者大會(中東)圓滿落幕

2024 TUYA全球開發者大會(蘇州)啟幕,涂鴉攜手開發者共繪AI與能源領域新藍圖

2024 TUYA全球開發者大會(歐洲)盛大啟幕,涂鴉攜手開發者共筑綠色低碳未來

評論