作為智能世界的新型基礎設施,AI、5G、智能邊緣和云計算等行業轉折性技術將加速數字經濟騰飛,為新業務的增長帶來巨大發展機遇。如今,AI及數據分析為金融、健康醫療、工業、通信及交通等多行業客戶開啟了全新的機遇。據IDC預測,到2021年,75%的商業企業的各類應用將應用人工智能;到2025年,所有數據中將有約四分之一是實時產生的,而在這一龐大的增量中有95%的數據將通過各種物聯網(IoT)設備產生。
人工智能和數據分析是未來10年的關鍵工作負載,快速部署AI和數據分析對當今各類企業至關重要。英特爾一直致力于不斷強化處理器的內置AI加速能力和軟件優化優勢,以更好地為全球的數據中心和邊緣解決方案提供動能,并通過打造無與倫比的芯片基石,助力釋放數據中的無限洞察。
近日,英特爾宣布推出最新的數據平臺產品組合,包括集成AI加速的英特爾第三代至強可擴展處理器、英特爾首個人工智能優化FPGA Stratix 10 NX、第二代英特爾傲騰持久內存、最新英特爾3D NAND SSD及相關軟件解決方案,以在數據中心、云和智能邊緣領域支持客戶進一步加快人工智能和數據分析等工作負載的開發和部署,助力智能新基建建設,駕馭數字經濟新浪潮。
英特爾市場營銷集團副總裁、中國區數據中心銷售總經理陳葆立表示,數據中心市場蓬勃發展,英特爾CPU是是業界唯一集成AI加速的處理器。同時,英特爾擁有全面的產品組合,實現數據中心領域的全面覆蓋。
英特爾為AI與數據分析打造了無與倫比的廣泛產品組合和生態系統支持。經過全面優化的全新數據平臺與基于英特爾AI技術不斷蓬勃發展的合作伙伴生態一道,正在幫助各類企業積極部署智能的AI和數據分析服務,從而將數據轉變為企業的重要資產。
細數第三代至強可擴展處理器的黑科技
說起數據中心市場,不得不提到目前站在C位的英特爾至強處理器平臺。目前,英特爾至強可擴展性處理器已出貨超過3000萬個,是全球部署最廣泛的數據中心平臺,仍然擁有95%的市場份額。
縱觀英特爾至強處理器產品的路線圖,就會知道至強處理器已經有二十多年的歷史了。從2017年開始推出第一代至強可擴展處理器,2018年推出了代號為Cascade Lake的第二代至強可擴展處理器。今年,英特爾第三代至強可擴展處理器即將問世,該產品有兩個產品系列,代號分別是Cooper Lake和Ice Lake,Copper Lake的定位是一個系統支持4-8個處理器插槽,即多路處理器,而Ice Lake的定位則是一個系統當中支持1-2個處理器插槽。英特爾預計在明年下半年會推出下一代的至強可擴展處理器,代號為Sapphire Rapids。
第三代至強可擴展處理器專為當今內置人工智能的數據密集型服務而設計。人工智能和數據密集型服務是最近這幾年業界的普遍需求,也是技術發展的方向。對于人工智能的支持,在第三代至強可擴展處理器當中,英特爾進一步升級了DL Boost深度學習加速技術,同時在深度學習加速架構下的VNNI神經網絡指令可以支持創新的bfloat16數據格式。
結合DL Boost以及bfloat16,英特爾第三代至強可擴展處理器平臺相比上一代平臺Cascade Lake最頂級的CPU 8280,在進行圖像分類處理的時候,計算性能可以提高1.93倍,這是一個非常顯著的提高。對于計算密集型的應用,英特爾在新的平臺里可以支持更多的CPU內核和更高的CPU主頻,提供更多的內存通道數、更快的內存速度、更高的內存容量。第三代至強可擴展處理器具備更強的計算能力、更大的數據存儲能力,對于計算密集型的應用,相比于以往4路平臺,其計算性能提高了92%,并支持第二代傲騰持久內存。
同時,針對如今云計算應用、企業應用的多樣性,第三代至強可擴展處理器搭載了第二代的Speed Select技術(簡稱SST),可以讓用戶有更多的靈活性配置系統,更好地滿足業務需求。SST是為了解決諸多企業客戶或者互聯網客戶遇到的痛點。多樣性的業務越來越復雜,對硬件有不同的需求,有的業務希望單線程的性能盡可能高,但它并不需要有很多的線程進行并行計算;另外有一些業務希望擁有很多的線程進行并發處理,但是對單線程要求并不高。以往應對這些不同需求的做法是量身定制,對第一類應用適配對應的CPU以及硬件配置。對于另外一類就需要再選一款CPU搭配新的機器使用。這種方式雖然可以解決問題,但是如果業務發生變化,配置就顯得非常不靈活。
此外還有一種情況,隨著計算密度越來越高,CPU核心數越來越多,內存越來越大,存儲容量越來越高,網絡帶寬越來越大。用戶在一臺機器會部署多個業務,多個業務的優先級不一樣,用戶往往希望多個業務能運行在同一臺機器上面,可以對不同業務設置不同的優先級,保證高優先級的業務擁有更好的性能。而在以往傳統的平臺上,一個CPU當中所有的核心優先級都是一樣的,可以使用的資源、頻率都是相同的。
基于此,英特爾推出SST技術。早在第二代至強可擴展處理器中,已有SST技術的早期雛形,在第三代至強可擴展處理器當中進一步拓展了SST。SST是一個功能集合,它提供了四種功能模式,包括SST-PP、SST-CP、SST-BF、SST-TF,解決前面說到問題。
與此同時,英特爾技術專家告訴記者,第三代至強可擴展處理器在架構層面進行諸多創新,比如UPI總線的端口數量增加到6個(即每個插槽有6個接口),兩兩之間就有兩個UPI總線。多一個UPI帶來的好處就是有更高的帶寬,這樣有利于支持更多的CPU內核,支持更大的內存,支持更高的計算速度,相當于有更寬的高速公路,可以讓數據在不同的插槽之間傳輸,實現同步。在多路處理器當中,這是非常至關重要的架構創新。
在內存支持方面,第三代至強可擴展處理器每個插槽支持6個內存通道數,每個通道是可以支持到最高3200MT/s的速度。如果組建一個4路平臺,即可擁有24個通道,如果是8路就是48個通道。在內存容量上,第三代至強可擴展處理器可以支持16GB顆粒的內存技術,單條內存條如果采用普通RDIMM可以支持64GB,如用LRDIMM則可以支持256G,若再搭配傲騰持久內存,每一個插槽可以支持的最大容量為4.5T。如果搭建一個4路且有4個插槽的平臺,總共支持的最大的內存可以達到18T,8路則可以達到36T。如此大的數據容量、高的內存訪問帶寬,可以很好地支持數據密集型應用。在I/O方面,第三代至強可擴展處理器每個插槽可以支持48個PCIe 3.0通道。在多路處理器中,每個插槽支持眾多通道,可以保障確保I/O的可連接性、速度以及帶寬對于大多數的應用。
此外,多路處理器非常關注平臺的RAS,即可靠性、可用性以及可維護性。第三代至強可擴展處理器提供了非常豐富的RAS支持,可以很好地處理可能出現的內存錯誤、PCIe設備上的錯誤,或CPU內核本身出現的錯誤,并實現錯誤隔離、故障診斷。
在人工智能技術的支持上面,第一代至強可擴展處理器Sky Lake提供了AVX-512指令集,AVX-512指令集可以用FP32的數據格式進行深度學習計算。2019年發布的第二代至強可擴展處理器Cascade Lake提供了DL Boost技術,DL Boost包含VNNI矢量神經網絡指令集,VNNI支持Int8數據格式,加速深度學習的推理應用。今年,第三代至強可擴展處理器的DL Boost深度學習加速技術進一步升級,VNNI指令集可以支持bfloat16的數據格式,這樣在人工智能的訓練和推理上面,都可以得到更好的性能提升。
bfloat16是一個精簡的數據格式,與如今的32位浮點數(FP32)相比,bfloat16只通過一半的比特數且僅需對軟件做出很小程度的修改,就可達到與FP32同等水平的模型精度。新增的bfloat16支持同時為CPU的AI訓練和推理性能提供加速。在英特爾的工具集當中,像TensorFlow、Pytorch、MXNet都已經可以完美來支持bfloat16的AI訓練。
簡而言之,在云計算、數據分析及關鍵任務工作負載上,第三代至強可擴展處理器可以提供更多內核、更高頻率,并支持更大內存。對于數據分析的應用,相對于上一代的平臺性能可以提高98%。對于人工智能應用,借助升級后的DL Boost技術,搭配bfloat16的數據格式,在人工智能的訓練性能上相比上一代可以提高93%,人工智能推理方面的性能可以提高90%。針對云計算的虛擬機密度場景下,第三代至強可擴展處理器支持的內核數可以最高到28個核,如果搭配一個8路平臺,可以輕松支持224個物理核,實現非常高的密度,幫助用戶優化TCO。
除了CPU,英特爾還提供了GPU、FPGA、專用AI芯片等豐富的硬件產品,并與業界生態伙伴一起開發軟件解決方案,給客戶一個非常完整的從芯片到方案的產品組合,滿足他們對于人工智能和分析這些當今最熱的應用和未來計算方向的需求。
英特爾傲騰持久內存進一步加速AI與數據分析
面對大數據浪潮,數據價值的實現要經歷數據生產、收集、提取和計算的過程。未來存儲的發展將由工作負載的需求驅動,現代存儲系統需要靈活多變,存儲技術也正在不斷演進以滿足多樣化需求。這也意味著我們需要讓存儲的性能變得更高,從而拉近更多數據與處理器之間的距離。
為此,英特爾推出傲騰持久內存全新技術,通過讓更多的數據保留在內存中(作為內存的拓展或部分替換),從而更加靠近CPU,實現了更高的效率;同時,其以類似于雙列直插式存儲模塊(DIMM)的形式,提供接近DRAM(動態隨機存取存儲器)的內存計算速度,且每GB價格低于DRAM,也大大減少了企業的成本開支,最終幫助企業在效率和成本之間實現了完美的平衡。
相較于在內存容量限制下不得不使用多臺服務器Scale Out(橫向擴展,靠添加設備提升服務能力),Scale Up(縱向擴展,提升單臺設備的性能和服務能力)可以減少服務器的數量,減少關鍵部件的采購,以及更多服務器集群的管理開銷,英特爾傲騰持久內存從CAPEX(前期購置成本)和OPEX(運營成本)兩個方面降低總體擁有成本。
傲騰持久內存可以支持更大的數據庫、更高可靠性和更快地系統恢復,為處理器性能過剩、內存容量不足的場景提供足夠的內存,從而減少設備數量、軟件授權費用、機柜數量和能源消耗等。通過持久內存來擴展現有內存容量,可以極大降低客戶業務的總成本TCO(Total Cost of Ownership)。
英特爾傲騰持久內存不但具有大內存、低延遲、持久化、高性價比的特點,同時使用模式也比較多樣化,提供了App Direct Mode(AD)和Memory Mode(MM)兩大類模式,由此也可以支撐更多的環境和場景化應用。
英特爾技術專家表示,英特爾把傲騰技術引入到持久內存為內存的層級帶來了很大的技術革新。英特爾傲騰持久內存在內存和SSD之間新增了一個存儲層級,具備像內存一樣的超低訪問延遲,超高壽命與可靠性,同時還具備持久化存儲和按字節訪問的能力。在AD模式下,特定的應用程序可直接訪問由英特爾傲騰持久內存帶來的獨立持久內存資源。
英特爾傲騰持久內存不僅可以改善系統的TCO,還可以消除I/O瓶頸,提升性能,進而驅動產生新的內存和存儲的融合類應用,如超融合基礎架構、數據庫、人工智能或者大數據分析。這些都是英特爾傲騰持久內存能夠展現技術優勢的地方。
作為第三代至強可擴展平臺的一部分,英特爾同時發布了英特爾傲騰持久內存200系列,為客戶提供每路最高達4.5TB的容量,以進行內存數據庫、密集虛擬化、分析及高性能計算等數據密集型工作負載的管理。傲騰持久內存200系列提供的CPU對持久性數據的訪問速度比主流NAND SSD讀取數據快200倍以上。與第一代產品相比,英特爾傲騰持久內存200系列的平均內存帶寬增加了25%。
上一代傲騰持久內存配合第二代至強可擴展處理器,單路最高能放6條512GB持久內存,最大3TB持久內存。200系列能在單路第三代至強可擴展處理器上提供最高4.5TB內存,包括3TB的傲騰持久內存和普通的DRAM內存,單條可用容量沒變,有128GB,256GB和512GB三個型號,支持與普通DRAM公用內存插槽,支持兩種內存的混插。
集成AI加速推動產業智能化變革
從通用型CPU到GPU,從可編程加速產品FPGA到ASIC專用芯片,英特爾“以數據為中心”的產品組合不斷擴展,支持客戶從云、網絡、邊緣到端的智能部署,奠定云計算、人工智能、5G網絡轉型和智能邊緣等多領域創新的數字基石。
在整個計算平臺當中,特別是在數據中心的計算平臺當中,英特爾至強平臺的通用性和可擴展性是最好的,支持著豐富多彩的各種各樣的AI任務。
在支持整個AI數據處理的管道上面,英特爾至強平臺能夠提供最完整、最充分的支持平臺。客戶AI的創新已經在英特爾至強平臺上得到了非常好的支持。
前面已經說過,針對當前留下的人工智能工作負載,第三代至強可擴展處理器進行了性能和架構的優化改進。而且現在AI不光對數據計算有著更高的要求,也對數據的承載提出了越來越高的要求。
今天在AI處理過程當中,我們通常是跟大數據結合在一起的。要讓AI的性能充分發揮,英特爾傲騰持久內存的內存技術可以扮演非常重要的角色。
第三代至強可擴展處理器結合英特爾傲騰持久內存,在AI應用中能夠充分發揮英特爾的存儲性能,在AI計算和存儲結合過程當中,使得計算性能越來越好,同時TCO也能夠實現大幅優化。
英特爾至強平臺對AI性能的支持是持之以恒的,而且英特爾與生態合作伙伴進行緊密配合,基于第三代至強可擴展處理器開展更多創新應用實踐。比如英特爾與螞蟻金服基于3D-CNN I3D Video的深度學習模型進行AI應用開發部署。
同時,英特爾還與東軟、衛寧、盈谷、匯醫慧影等行業伙伴一起落地醫療AI,在影像醫療診斷、病理切片分析、藥物研發等應用場景中引入AI技術,加速醫療健康和人工智能融合的過程。
在短視頻市場,快手如今邁入了Top級大型互聯網公司的行列。AI在其業務中扮演了重要的角色。快手通過開展基于英特爾傲騰持久內存、英特爾至強可擴展處理器及英特爾FPGA在快手AI應用中的實踐,雙方共同建立起強大的IT系統,推動業務不斷發展。
綜上所述,第三代至強可擴展處理器針對AI進行了非常充分的優化,可以非常完美地勝任AI計算任務。同時,依靠平臺化優勢以及生態鏈當中豐富的軟件支持,越來越多地行業用戶在英特爾架構平臺上進行AI應用創新,這個創新現在不僅在云端發生,也在邊緣端發生。
結語
20多年來,英特爾持續推動數據中心領域的創新。憑借軟硬結合的優勢、規模化的能力以及與客戶的深厚合作,英特爾靈活創新的產品和解決方案經過了客戶的實戰考驗,并在廣泛的應用中被成功驗證。
隨著以數據為中心的轉型不斷深化,英特爾將以集成AI加速的至強可擴展平臺為基石,提供全面的XPU芯片平臺,攜手產業生態,賦能“智者更強”,以改變世界的技術造福個人、企業和社會。
? ? ? ?責任編輯:pj
評論