云計算和邊緣計算這兩個詞是近幾年被電子行業提及頻次最高的詞,伴隨相關應用逐步融入社會各個領域,數據處理便成為了行業首當其沖的領域。
此前,騰訊宣布TARS微服務開發框架已成功移植至Arm CPU架構;百度在其數據中心采用了基于Arm架構的智能計算;亞馬遜AWS云在自己的云服務器上做了一個基于Arm架構的自研項目……
事實上,Arm架構服務器由于其高性能以及自身具備的低功耗素質,已成為數據中心基礎設施建設的焦點。
9月23日,Arm宣布Neoverse新增Arm Neoverse V1平臺以及第二代的N系列平臺Neoverse N2,兩款新品使得Neoverse再度進階,而新產品直指的目標則是超級計算機和數據中心。受邀參加此次新品發布的在線研討會,揭秘Neoverse處理器IP背后的發展。
01
翻倍,性能沖刺之路
首先,Arm新發布的這兩款Neoverse平臺究竟有多強?直接上數據。通過Arm給出的數據,相比去年推出的Neoverse N1,代號為“Zeus”的Neoverse V1比N1單線程性能提升50%,代號為“Perseus”的Neoverse N2在相同水平的功率和面積之下比N1單線程性能提升40%。
另外,會議上,Neoverse平臺的最新路線圖也一并被披露,圖示顯示Neoverse目前處于制程節點7/5nm上,支持PCle Gen5、DDR5、HBM2e和CCIX 1.1;至2021年將全面進入5nm制程節點,支持HBM3、CCIX 2.0、CXL 2.0;至2022年將進入5/3nm制程節點,支持CCIX next和CXL next。
值得一提的是,會議上,Arm承諾后續的Neoverse產品在2022年以后,每年也都會有30%的性能提升。Arm基礎設施事業部高級副總裁兼總經理Chris Bergey表示,這與Arm工程團隊的努力和投入是分不開的,另一方面,能夠保持穩定的性能提升與Arm自身軟件生態的逐漸成熟有很大關系,例如很多云原生的軟件現在可以比較無縫運行在Arm架構上面。
圖1:Arm Neoverse最新技術發展路線圖
在核心和線程上,以云工作負載為例,可以看出Neoverse V1在96核96線程下擁有極佳的處理能力,可以在核心數更少的情況下發揮更好的性能;Neoverse N2則可以多達128核128線程的設計,擁有極強的擴展性,并在同樣的擴展能力下擁有比N1更強的性能。
圖2:云工作負載使用內核數量
文行至此,可能大家并沒有感受到本次發布的Neoverse V1和N2的強大?那么從Neoverse從初版發布到現如今推出產品的歷史來看起。
Neoverse處理器IP首次亮相于2018年10月18日,同為Arm指令集的IP產品,不同于Cortex系列,Neoverse面向的是高性能計算市場。當時Neoverse平臺產品中代號“Cosmos”的產品是基于16nm工藝,A72、A75核心的產品。當時公布的路線圖中,Arm提出了每年每代產品的30%的單線程性能提升,每一代提升30%也是Arm的“老傳統”。
圖3:2018年Arm公布的Neoverse發展路線圖
但時間推移到下一代產品發布時間2019年2月21日,Neoverse N1和E1平臺被公布出來后,一切預測都被推翻了。屬于7nm工藝時代的Neoverse N1相比A72的“Cosmos”單線程性能提升了60%,超出預計整整一倍,關鍵云端負載性能則提升了高達2.5倍。Neoverse E1作為低功耗和低面積的代表,也擁有不俗的實力,與Arm前幾代方案相比,吞吐量性能提升超過2.7倍,吞吐效率提升超2.4倍,計算性能提升超2倍。
圖4:2019年Arm公布的Neoverse發展路線圖
上文有提到,V1比N1單線程性能提升50%,N2比N1單線程性能提升40%,而這一切的基礎都是在N1超出前一代60%的基礎上完成的。換言之,也就是說V1比“Cosmos”單線程性能出140%,N2比“Cosmos”單線程性能高出124%,超額兩倍完成了2018的初版路線規劃。
02
定位,面向不同市場
Neoverse平臺系列幾經周折,現如今形成了三個定位,這種定位也與現今數據中心市場相符合。另一方面,也與Arm的Cortex的最新定位相呼應,即無視面積和功耗、純粹注重高性能的Cortex-X1、PPA(功率、性能、面積)最大化的Cortex-A78。
1、V系列:追求終極性能的系列產品,性能優先于面積和功耗。擁有最高的帶寬和性能表現,以及最大的Buffers(緩沖區)、Caches(緩存)、Windows(窗口)和Queues(隊列),隨之而來的是最大的面積和功耗。
2、N系列:滿足橫向擴展性能需求的系列產品,最大化PPA,即在性能、功耗和面積上保持平衡。擁有更強的擴展性,更加平衡的性能,同樣面積或TDP下更多的核心數。因為支持更多的線程,因此在橫跨云、智能網卡(SmartNICs)、企業網絡、邊緣設備上都擁有非常廣闊的應用的場景。
3、E系列:低功耗小面積系列產品,面積和功耗優先于性能。擁有更好的效率、吞吐量和線程數,當然最重要的是在面積和功耗上擁有最好的優化。另外,E1還支持同步多線程(SMT)技術,能夠提供網絡效果優化。
圖5:三個系列不同的定位
市場方面,Chris Bergey告訴記者,V系列、N系列、E系列會根據合作伙伴和客戶對于功耗、性能和面積上不同需求進行配置,假若客戶更看重線程,N系列便是首先,假若客戶需要高性能計算工作負載,V系列就能提供更大的價值。
值得一提的是,Neoverse V1和N2均支持可伸縮矢量擴展(Scalable Vector Extensions, SVE),而SVE則可基于未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。另外,SVE還可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執行。
利用SVE,半導體廠商可以對SVE電壓和頻率過渡實施控制,開發者可以在窄矢量和寬矢量之間隨意混合代碼。
SiPearl公司營銷副總裁Craig Prunty表示:“Neoverse路線圖上的SVE為HPC和ML帶來了巨大的潛力,我們非常看好這項技術對未來Arm生態系統的發展。”
03
生態,軟硬件鑰匙
在硬件生態方面,支持重要的兩個技術便是CCIX(針對加速器的緩存一致性互聯)和CXL(開放互聯技術)。CCIX主要用于跨芯片間互連,用于打造異構封裝系統,支持完整緩存一致性;CXL則是基于PCle 5.0的規范,可讓CPU與GPU、FPGA等加速器更好地連接,帶來更好地帶寬和內存一致性,簡化硬件設計難度,降低系統成本。
當然,異構計算已逐漸成為現在數據發展的重要“根據地”,事實上,這也是生態中的一環。數據中心無論是存儲還是數據加速,整體趨勢是分布式的,這便對性能和功耗提出嚴苛的要求。Chris Bergey表示,Arm已看到很多異構計算的產品與方案目前都開始基于Arm的架構,例如存儲控制器、智能網卡中用到的計算CPU。
在異構計算方面,對于Arm來說,如何提供緊耦合或是定制化的能力,甚至是通過多核封裝或多芯片組裝技術,將來自生態系統、IP技術與云廠商的需求與技術整合在一起,是很大的機遇。不論是基于FPGA、GPU、TPU單元的加速器,數據的移動是必不可少的,Arm架構的可擴展性便是優異的解決方案。
圖6:CCIX和CXL領導智能未來
在軟件生態方面,Chris Bergey為記者介紹,Arm將軟件分為兩種類型,一是云原生的軟件,二是傳統的企業級軟件。云原生軟件是Arm一直以來重視的領域,在這個領域Arm現在是擁有最大的持續集成/持續交付(CI / CD)平臺的一等公民,并在大多數編程語言的生態環境中,Arm都扮演著核心角色,同時Arm也看到云原生技術在邊緣計算領域變得越來越重要,在這一領域我們推出了Project Cassini項目。
此外,隨著V-RAN、O-RAN等項目的崛起,云原生軟件也將成為5G未來發展的一個重要組成部分。 另一方面,傳統企業軟件領域出現了“軟件即服務”(SaaS)的發展趨勢。面對這一趨勢,由于在Arm架構之上能夠創造非常有利的軟件即服務產品,因此很多獨立軟件開發商(ISV)都對Arm表現出濃厚的興趣,紛紛投入Arm陣營,在中國市場這一趨勢尤其顯著。
圖7:Arm支持的軟件生態
“Arm認為軟件生態系統,特別在基礎設施這個市場上,是非常重要的。” 根據Chris Bergey的介紹,現如今,Arm處理器核在性能方面的優勢,不僅獲得了美國的大型互聯網公司的認可,在中國的大型互聯網公司以及廣大的軟件生態系統層面,也獲得了很多的進展。另外,Arm也很樂于與國內外廠商攜手,利用Neoverse N1和V1來幫助客戶交付相關項目。
責任編輯:gt
-
ARM
+關注
關注
134文章
9349瀏覽量
377390 -
服務器
+關注
關注
13文章
9791瀏覽量
87929 -
數據中心
+關注
關注
16文章
5226瀏覽量
73499
發布評論請先 登錄
愛普生SG2520HHN晶振數據中心服務器的理想解決方案

評論