在Arm虎視眈眈,RISC-V新秀崛起的處境下,x86處理器內(nèi)部的競(jìng)爭(zhēng)也進(jìn)入了白熱化階段。AMD繼推出Zen CPU架構(gòu)以來(lái),總市場(chǎng)份額上正在一步步迎頭趕上,雖說(shuō)桌面和移動(dòng)CPU上英特爾與AMD打得有來(lái)有回,但服務(wù)器處理器市場(chǎng)份額上,AMD保持著穩(wěn)步增長(zhǎng)的態(tài)勢(shì),越來(lái)越多的云服務(wù)商和數(shù)據(jù)中心轉(zhuǎn)投了“AMD Yes”的陣營(yíng),更是在今年第三季度打破了市占率記錄,達(dá)到了16%。盡管英特爾依然占據(jù)著70%以上的市場(chǎng),面臨多方壓力下,這種優(yōu)勢(shì)似乎難以繼續(xù)維持了。
在今年上半年推出了第三代至強(qiáng)可擴(kuò)展處理器之后,英特爾于近期透露了下一代服務(wù)器處理器“Sapphire Rapids”的更多情報(bào)。鑒于我們已經(jīng)在消費(fèi)級(jí)桌面處理器12代酷睿上看到了Intel 7制程帶來(lái)的驚艷改進(jìn),那么同用這一制程的下一代Xeon處理器,是否也能在明年發(fā)布之際一鳴驚人呢?
新的I/O與內(nèi)存
考慮到Sapphire Rapids定于明年發(fā)售,AMD的新一代EPYC處理器又發(fā)售在即,英特爾并沒(méi)有公布太多通用計(jì)算性能上的情報(bào)。但從英特爾在Innovation 2021和Linley Fall Processor兩場(chǎng)大會(huì)上公布的模組化芯片設(shè)計(jì),也能看出Sapphire Rapids并非什么泛泛之輩。
與剛發(fā)布的12代酷睿一樣,Sapphire Rapids 同樣引入了對(duì)PCIe 5.0的支持,也在此之上進(jìn)一步提升了處理器的DDIO和QoS能力。除此之外,CXL 1.1和全新的UPI 2.0也在支持之列。在UPI 2.0的互聯(lián)技術(shù)支持下,
Sapphire Rapids IP布局 / Intel
在服務(wù)器和數(shù)據(jù)中心應(yīng)用上,內(nèi)存也是最容易出現(xiàn)瓶頸的一大組成要素。我們可以從芯片原理圖中可以看出Sapphire Rapids集成了4個(gè)內(nèi)存控制器,以此最高支持8通道DDR5內(nèi)存。針對(duì)計(jì)算或額外開(kāi)銷特別大的場(chǎng)景,英特爾也提供了旗下傲騰持久內(nèi)存Optane 300系列的支持,作為內(nèi)存支持的同時(shí)也可以作為存儲(chǔ)使用。英特爾還將推出支持HBM的版本,提供遠(yuǎn)高于8通道DDR5的內(nèi)存帶寬。該版本將提供兩種HBM模式,一種是HBM Flat模式,支持HBM+DDR5混用或是僅用HBM的模式。另一種是HBM緩存模式,將HBM作為DRAM的備用緩存,類似于一個(gè)L4緩存。
通用計(jì)算中的AI加速
隨著AI逐漸在服務(wù)器工作流中提高占比,AI計(jì)算能力成了每個(gè)服務(wù)器處理器都躲不開(kāi)的參數(shù),這也成了英特爾在宣傳Sapphire Rapids時(shí)不離口的話題。第三代至強(qiáng)可擴(kuò)展處理器中,英特爾在其中內(nèi)置了深度學(xué)習(xí)加速器和AVX-512向量擴(kuò)展,為int8和bfloat16數(shù)據(jù)的推理和訓(xùn)練提供了支持。而在Sapphire Rapids中,英特爾又加入了兩大全新加速引擎AMX(先進(jìn)矩陣擴(kuò)展)和DSA(數(shù)據(jù)流加速器)。
AMX架構(gòu) / Intel
AMX乃是一種全新的切片式指令集擴(kuò)展,支持以切片運(yùn)作的加速器,也是英特爾專為張量運(yùn)算準(zhǔn)備的指令集擴(kuò)展。該擴(kuò)展由兩部分組成,切片和加速器。切片由8個(gè)2D寄存器堆組成,支持加載、清除和設(shè)為常量等基礎(chǔ)數(shù)據(jù)運(yùn)算符。每個(gè)寄存器堆大小可達(dá)1KB,但設(shè)計(jì)者也可以根據(jù)自己的算法來(lái)減小其規(guī)模。除此之外,英特爾也已經(jīng)確認(rèn)Linux 5.16版本將正式加入對(duì)于AMX的支持。
英特爾目前僅發(fā)布了TMUL加速器(切片矩陣乘法單元),但AMX是一個(gè)可以繼續(xù)擴(kuò)展下去的架構(gòu),未來(lái)還可以加入新的加速器,也可以改進(jìn)現(xiàn)有的TMUL加速器實(shí)現(xiàn)更高的性能,從而在單個(gè)指令和單個(gè)微操作下表達(dá)更多的工作,節(jié)省fetch、decode以及OOO的功耗。在測(cè)試中,同一個(gè)Sapphire Rapids處理器分別使用AMX指令和AVX-512 VNNI,AMX的運(yùn)算速度是后者的7.8倍。
過(guò)去AVX-512的使用中,經(jīng)常會(huì)出現(xiàn)功率上去后頻率也隨之降低的情況,不少人也擔(dān)心全新的AMX是否會(huì)有類似的情況。英特爾確認(rèn)在快速自動(dòng)的得當(dāng)電源控制下,AMX不會(huì)出現(xiàn)AVX的頻率抖動(dòng)現(xiàn)象。
有無(wú)DSA的CPU占用對(duì)比 / Intel
在高性能存儲(chǔ)、連接和密集處理的應(yīng)用中,人們總是想找到解放處理器核心來(lái)提升整體性能的方式。英特爾在這個(gè)需求上推出了DSA數(shù)據(jù)流加速器,DSA可以轉(zhuǎn)移CPU緩存、DDR內(nèi)存以及其他I/O附加設(shè)備的數(shù)據(jù),它的目標(biāo)是為數(shù)據(jù)轉(zhuǎn)移和轉(zhuǎn)換運(yùn)算提供更高的總體系統(tǒng)性能,讓CPU周期解放出來(lái)完成其他更高級(jí)的功能。根據(jù)英特爾給出的數(shù)據(jù),在OpenvSwitch的虛擬交換機(jī)應(yīng)用中,加入DSA分擔(dān)工作流后,CPU占用率降低了39%,數(shù)據(jù)轉(zhuǎn)移性能提高了2.5倍。
至強(qiáng)可以替代GPU嗎?
我們都知道如今的服務(wù)器市場(chǎng)已經(jīng)不是CPU一家獨(dú)大的天下了,無(wú)論是語(yǔ)音識(shí)別還是圖像處理,GPU帶來(lái)的AI計(jì)算能力滲透進(jìn)了每一個(gè)場(chǎng)景,任意深度學(xué)習(xí)“煉丹師”最先考慮的硬件設(shè)備也是GPU。在英特爾對(duì)Sapphire Rapids的描述中,稱其AI性能相較于上一代Ice Lake芯片有了30倍的提升,如此大幅度的提升能夠替代GPU嗎?
英特爾為Sapphire Rapids給出的對(duì)比對(duì)象為英偉達(dá)的A30 GPU,在ResNet-50 v1.5的圖像分類推理中,單個(gè)A30的輸出速度為15411張每秒,而兩個(gè)Sapphire Rapids的成績(jī)達(dá)到了24000張每秒以上。這一數(shù)字對(duì)比看起來(lái)似乎優(yōu)勢(shì)巨大,甚至接近于29855張每秒的A100 GPU,但測(cè)試中用到的乃是高端Sapphire Rapids型號(hào)(40核以上),無(wú)論是功耗和價(jià)格都要遠(yuǎn)超A30。
因而現(xiàn)階段下,仍在使用大量AI負(fù)載的服務(wù)器并不會(huì)從現(xiàn)有的GPU或ASIC架構(gòu)遷移。不過(guò)Sapphire Rapids本身也并非僅針對(duì)AI的特化產(chǎn)品,之所以x86 CPU要費(fèi)心費(fèi)力地去提高AI性能,也是面向通用計(jì)算與AI結(jié)合這樣越來(lái)越普遍的輕度AI場(chǎng)景。
小結(jié)
要想把AMD奪去的市場(chǎng)份額奪回來(lái)并不容易,英特爾面臨的已經(jīng)不是本世紀(jì)初的雙雄爭(zhēng)霸局面了。Sapphire Rapids可以說(shuō)是換帥、換制程和換架構(gòu)后的首個(gè)服務(wù)器產(chǎn)品,如果不能一鳴驚人的話,不少客戶可能都會(huì)被AMD未來(lái)更注重成本效能的Zen 4D與Zen 5奪走。而面對(duì)Arm、RISC-V、GPU、ASIC等多方入局AI的挑戰(zhàn),如果英特爾仍想保持x86的霸主地位,也必須加速開(kāi)發(fā)自身的Xe服務(wù)器GPU,同時(shí)繼續(xù)擴(kuò)展x86下的AI加速器生態(tài)。
在今年上半年推出了第三代至強(qiáng)可擴(kuò)展處理器之后,英特爾于近期透露了下一代服務(wù)器處理器“Sapphire Rapids”的更多情報(bào)。鑒于我們已經(jīng)在消費(fèi)級(jí)桌面處理器12代酷睿上看到了Intel 7制程帶來(lái)的驚艷改進(jìn),那么同用這一制程的下一代Xeon處理器,是否也能在明年發(fā)布之際一鳴驚人呢?
新的I/O與內(nèi)存
考慮到Sapphire Rapids定于明年發(fā)售,AMD的新一代EPYC處理器又發(fā)售在即,英特爾并沒(méi)有公布太多通用計(jì)算性能上的情報(bào)。但從英特爾在Innovation 2021和Linley Fall Processor兩場(chǎng)大會(huì)上公布的模組化芯片設(shè)計(jì),也能看出Sapphire Rapids并非什么泛泛之輩。
與剛發(fā)布的12代酷睿一樣,Sapphire Rapids 同樣引入了對(duì)PCIe 5.0的支持,也在此之上進(jìn)一步提升了處理器的DDIO和QoS能力。除此之外,CXL 1.1和全新的UPI 2.0也在支持之列。在UPI 2.0的互聯(lián)技術(shù)支持下,
Sapphire Rapids IP布局 / Intel
在服務(wù)器和數(shù)據(jù)中心應(yīng)用上,內(nèi)存也是最容易出現(xiàn)瓶頸的一大組成要素。我們可以從芯片原理圖中可以看出Sapphire Rapids集成了4個(gè)內(nèi)存控制器,以此最高支持8通道DDR5內(nèi)存。針對(duì)計(jì)算或額外開(kāi)銷特別大的場(chǎng)景,英特爾也提供了旗下傲騰持久內(nèi)存Optane 300系列的支持,作為內(nèi)存支持的同時(shí)也可以作為存儲(chǔ)使用。英特爾還將推出支持HBM的版本,提供遠(yuǎn)高于8通道DDR5的內(nèi)存帶寬。該版本將提供兩種HBM模式,一種是HBM Flat模式,支持HBM+DDR5混用或是僅用HBM的模式。另一種是HBM緩存模式,將HBM作為DRAM的備用緩存,類似于一個(gè)L4緩存。
通用計(jì)算中的AI加速
隨著AI逐漸在服務(wù)器工作流中提高占比,AI計(jì)算能力成了每個(gè)服務(wù)器處理器都躲不開(kāi)的參數(shù),這也成了英特爾在宣傳Sapphire Rapids時(shí)不離口的話題。第三代至強(qiáng)可擴(kuò)展處理器中,英特爾在其中內(nèi)置了深度學(xué)習(xí)加速器和AVX-512向量擴(kuò)展,為int8和bfloat16數(shù)據(jù)的推理和訓(xùn)練提供了支持。而在Sapphire Rapids中,英特爾又加入了兩大全新加速引擎AMX(先進(jìn)矩陣擴(kuò)展)和DSA(數(shù)據(jù)流加速器)。
AMX架構(gòu) / Intel
AMX乃是一種全新的切片式指令集擴(kuò)展,支持以切片運(yùn)作的加速器,也是英特爾專為張量運(yùn)算準(zhǔn)備的指令集擴(kuò)展。該擴(kuò)展由兩部分組成,切片和加速器。切片由8個(gè)2D寄存器堆組成,支持加載、清除和設(shè)為常量等基礎(chǔ)數(shù)據(jù)運(yùn)算符。每個(gè)寄存器堆大小可達(dá)1KB,但設(shè)計(jì)者也可以根據(jù)自己的算法來(lái)減小其規(guī)模。除此之外,英特爾也已經(jīng)確認(rèn)Linux 5.16版本將正式加入對(duì)于AMX的支持。
英特爾目前僅發(fā)布了TMUL加速器(切片矩陣乘法單元),但AMX是一個(gè)可以繼續(xù)擴(kuò)展下去的架構(gòu),未來(lái)還可以加入新的加速器,也可以改進(jìn)現(xiàn)有的TMUL加速器實(shí)現(xiàn)更高的性能,從而在單個(gè)指令和單個(gè)微操作下表達(dá)更多的工作,節(jié)省fetch、decode以及OOO的功耗。在測(cè)試中,同一個(gè)Sapphire Rapids處理器分別使用AMX指令和AVX-512 VNNI,AMX的運(yùn)算速度是后者的7.8倍。
過(guò)去AVX-512的使用中,經(jīng)常會(huì)出現(xiàn)功率上去后頻率也隨之降低的情況,不少人也擔(dān)心全新的AMX是否會(huì)有類似的情況。英特爾確認(rèn)在快速自動(dòng)的得當(dāng)電源控制下,AMX不會(huì)出現(xiàn)AVX的頻率抖動(dòng)現(xiàn)象。
有無(wú)DSA的CPU占用對(duì)比 / Intel
在高性能存儲(chǔ)、連接和密集處理的應(yīng)用中,人們總是想找到解放處理器核心來(lái)提升整體性能的方式。英特爾在這個(gè)需求上推出了DSA數(shù)據(jù)流加速器,DSA可以轉(zhuǎn)移CPU緩存、DDR內(nèi)存以及其他I/O附加設(shè)備的數(shù)據(jù),它的目標(biāo)是為數(shù)據(jù)轉(zhuǎn)移和轉(zhuǎn)換運(yùn)算提供更高的總體系統(tǒng)性能,讓CPU周期解放出來(lái)完成其他更高級(jí)的功能。根據(jù)英特爾給出的數(shù)據(jù),在OpenvSwitch的虛擬交換機(jī)應(yīng)用中,加入DSA分擔(dān)工作流后,CPU占用率降低了39%,數(shù)據(jù)轉(zhuǎn)移性能提高了2.5倍。
至強(qiáng)可以替代GPU嗎?
我們都知道如今的服務(wù)器市場(chǎng)已經(jīng)不是CPU一家獨(dú)大的天下了,無(wú)論是語(yǔ)音識(shí)別還是圖像處理,GPU帶來(lái)的AI計(jì)算能力滲透進(jìn)了每一個(gè)場(chǎng)景,任意深度學(xué)習(xí)“煉丹師”最先考慮的硬件設(shè)備也是GPU。在英特爾對(duì)Sapphire Rapids的描述中,稱其AI性能相較于上一代Ice Lake芯片有了30倍的提升,如此大幅度的提升能夠替代GPU嗎?
英特爾為Sapphire Rapids給出的對(duì)比對(duì)象為英偉達(dá)的A30 GPU,在ResNet-50 v1.5的圖像分類推理中,單個(gè)A30的輸出速度為15411張每秒,而兩個(gè)Sapphire Rapids的成績(jī)達(dá)到了24000張每秒以上。這一數(shù)字對(duì)比看起來(lái)似乎優(yōu)勢(shì)巨大,甚至接近于29855張每秒的A100 GPU,但測(cè)試中用到的乃是高端Sapphire Rapids型號(hào)(40核以上),無(wú)論是功耗和價(jià)格都要遠(yuǎn)超A30。
因而現(xiàn)階段下,仍在使用大量AI負(fù)載的服務(wù)器并不會(huì)從現(xiàn)有的GPU或ASIC架構(gòu)遷移。不過(guò)Sapphire Rapids本身也并非僅針對(duì)AI的特化產(chǎn)品,之所以x86 CPU要費(fèi)心費(fèi)力地去提高AI性能,也是面向通用計(jì)算與AI結(jié)合這樣越來(lái)越普遍的輕度AI場(chǎng)景。
小結(jié)
要想把AMD奪去的市場(chǎng)份額奪回來(lái)并不容易,英特爾面臨的已經(jīng)不是本世紀(jì)初的雙雄爭(zhēng)霸局面了。Sapphire Rapids可以說(shuō)是換帥、換制程和換架構(gòu)后的首個(gè)服務(wù)器產(chǎn)品,如果不能一鳴驚人的話,不少客戶可能都會(huì)被AMD未來(lái)更注重成本效能的Zen 4D與Zen 5奪走。而面對(duì)Arm、RISC-V、GPU、ASIC等多方入局AI的挑戰(zhàn),如果英特爾仍想保持x86的霸主地位,也必須加速開(kāi)發(fā)自身的Xe服務(wù)器GPU,同時(shí)繼續(xù)擴(kuò)展x86下的AI加速器生態(tài)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
處理器
+關(guān)注
關(guān)注
68文章
19802瀏覽量
233521 -
amd
+關(guān)注
關(guān)注
25文章
5561瀏覽量
135867 -
英特爾
+關(guān)注
關(guān)注
61文章
10166瀏覽量
173924 -
cpu
+關(guān)注
關(guān)注
68文章
11033瀏覽量
215978 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
9683瀏覽量
87274
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
HPE攜手英特爾至強(qiáng)6,打造新一代服務(wù)器性能巔峰
近日,慧與科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服務(wù)器,標(biāo)志著新一代企業(yè)級(jí)服務(wù)器領(lǐng)域的新標(biāo)桿正式誕生。這一系列
今日看點(diǎn)丨龍芯中科:下一代桌面芯片3B6600預(yù)計(jì)明年上半年交付流片;消息稱英偉達(dá) Thor 芯片量產(chǎn)大幅推遲
方面,龍芯中科下一代服務(wù)器芯片3C6000目前處于樣片階段,預(yù)計(jì)2025年Q2完成產(chǎn)品化并正式發(fā)布。根據(jù)內(nèi)部自測(cè)的結(jié)果,公司16核32線程的3C6000/S性能可對(duì)標(biāo)至強(qiáng)4314,雙硅片封裝的32核
發(fā)表于 12-17 11:17
?1157次閱讀
聯(lián)想發(fā)布基于第五代AMD EPYC處理器的服務(wù)器產(chǎn)品
近日,聯(lián)想攜手AMD共同舉辦“異構(gòu)智算,穩(wěn)定高效——聯(lián)想算力基礎(chǔ)設(shè)施新品發(fā)布會(huì)”。本次發(fā)布會(huì)上,聯(lián)想重磅發(fā)布8款基于第五代AMD EPYC處理器的服
意法半導(dǎo)體下一代汽車微控制器的戰(zhàn)略部署
汽車的開(kāi)發(fā)。下面就讓意法半導(dǎo)體微控制器、數(shù)字IC和射頻產(chǎn)品部(MDRF)總裁Remi EL-OUAZZANE揭秘ST下一代汽車微控制器的戰(zhàn)略部署。
控制當(dāng)前和下一代功率控制器的輸入功率
電子發(fā)燒友網(wǎng)站提供《控制當(dāng)前和下一代功率控制器的輸入功率.pdf》資料免費(fèi)下載
發(fā)表于 09-18 11:31
?0次下載

第五代AMD EPYC處理器預(yù)計(jì)下半年發(fā)布
近日,在Computex 2024上,AMD董事會(huì)主席及首席執(zhí)行官Lisa Su博士向大家預(yù)覽了具有超強(qiáng)性能的下一代 EPYC 處理器——第五代 A
通過(guò)電壓轉(zhuǎn)換啟用下一代ADAS域控制器應(yīng)用說(shuō)明
電子發(fā)燒友網(wǎng)站提供《通過(guò)電壓轉(zhuǎn)換啟用下一代ADAS域控制器應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
發(fā)表于 09-11 11:32
?0次下載

實(shí)現(xiàn)下一代具有電壓電平轉(zhuǎn)換功能的處理器、FPGA 和ASSP
電子發(fā)燒友網(wǎng)站提供《實(shí)現(xiàn)下一代具有電壓電平轉(zhuǎn)換功能的處理器、FPGA 和ASSP.pdf》資料免費(fèi)下載
發(fā)表于 09-09 09:46
?0次下載

Intel預(yù)告下一代至強(qiáng)處理器:Diamond Rapids攜LGA9324接口震撼登場(chǎng)
據(jù)8月23日最新消息,Intel 已在緊鑼密鼓地準(zhǔn)備其下一代至強(qiáng)處理器的安裝測(cè)試工具,這款代號(hào)“Diamond Rapids”的處理器預(yù)示著又一
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)
大規(guī)模生產(chǎn)環(huán)境落地應(yīng)用的條件。某種程度上,IoD 技術(shù)已成為下一代高性能算力底座的核心技術(shù)與最佳實(shí)踐。
白皮書(shū)下載:*附件:IaaS+on+DPU(IoD)+下一代高性能算力底座+技術(shù)白皮書(shū)(1).pdf
發(fā)表于 07-24 15:32
英偉達(dá)新業(yè)務(wù)動(dòng)向:AI服務(wù)器市場(chǎng)的新變局
在全球AI技術(shù)迅猛發(fā)展的浪潮中,英偉達(dá)正積極布局,尋求新的業(yè)務(wù)增長(zhǎng)點(diǎn)。據(jù)最新報(bào)道,英偉達(dá)計(jì)劃為其即將推出的GB200旗艦人工智能芯片設(shè)計(jì)服務(wù)器機(jī)架,此舉無(wú)疑將對(duì)該領(lǐng)域的傳統(tǒng)廠商如戴爾、HPE和AMD等構(gòu)成一定壓力,甚至可能引發(fā)A
24芯M16插頭在下一代技術(shù)中的潛力
德索工程師說(shuō)道隨著科技的飛速發(fā)展,下一代技術(shù)正逐漸展現(xiàn)出其獨(dú)特的魅力和潛力。在這一背景下,24芯M16插頭作為一種高性能、多功能的連接器,將在下

金山云發(fā)布第九代高效型云服務(wù)器SE9
近日,金山云正式發(fā)布了基于英特爾?至強(qiáng)?6能效核處理器的第九代云服務(wù)器高效型SE9。這款新型云服務(wù)器在計(jì)算性能和性價(jià)比上均實(shí)現(xiàn)了顯著提升,為
浪潮信息元腦?服務(wù)器率先支持英特爾?至強(qiáng)?6處理器
北京2024年6月7日?/美通社/ -- 6月6日,英特爾在全球范圍內(nèi)發(fā)布了英特爾?至強(qiáng)?6處理器,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥受邀參會(huì)并發(fā)表演講。會(huì)上,浪潮信息多款元腦服務(wù)器創(chuàng)新升

AMD重磅發(fā)布新一代AI PC芯片
AMD CEO蘇姿豐于近日在臺(tái)北國(guó)際電腦展(COMPUTEX)上亮相,首次發(fā)布了AMD Zen 5系列的下一代高效能運(yùn)算CPU——“Ryzen 9 9950X”。這款處理器不僅挑戰(zhàn)了全
評(píng)論