狂歡背后的技術棧網上輕松購物體驗實際上是背后復雜的技術組成的,這是一個簡化的通用電商系統架構,由很多產品和業務組件組成。
圖2 簡化電商系統架構
這些業務組件核心系統今年100%上云,底層承載的技術就是阿里云的計算,存儲,網絡,數據庫等等一系列產品和解決方案。 因為處理量非常巨大,這些業務產品、組件和模塊之間會采用分布式部署方式,產品與產品、組件與組件、模塊和模塊之間會存在海量的通信要求,承載這個通信要求的技術平臺就是阿里云網絡的飛天洛神平臺。
什么是飛天洛神阿里云的技術平臺叫飛天操作體系,其目標是將一個數據中心,乃至遍布全球的多個數據中心變成一臺計算機,對內管理數據中心的服務器和各種物理資源和設施,對外統一的提供公共服務和對應的編程接口。
圖3 阿里云飛天操作系統
飛天操作系統的內核提供最基礎的系統服務,是對基礎資源的虛擬化,核心是計算、存儲和網絡資源的虛擬化,其中虛擬網絡服務(如虛擬專有網絡VPC,SDN控制器,負載均衡網元等)是由洛神平臺提供,總結一句話,洛神是阿里云飛天操系統內核的核心組件,提供了云計算網絡的全部功能。
飛天洛神特點洛神伴隨著阿里云飛天系統誕生,到目前已經有10年的歷史,支撐了阿里云20個region,數百萬級別虛擬機之間的如絲般順滑的訪問體驗,這些與洛神10年來的技術沉淀息息相關。
全自研 目前阿里云網絡有業界最豐富的產品,從使用場景角度分為云上網絡、跨地域網絡、混合云網絡和智能網絡。
圖4 阿里云業界最豐富的云網絡產品
這些豐富產品基于洛神平臺開發,核心業務代碼全自研,到目前為止,已經達到數百萬行,不管是底層的軟件系統,還是硬件設備形態,其技術方案、業務邏輯完全自主設計和開發,所以阿里云的虛擬交換機也稱為AVS(Ali Virtual Switch),從轉發表項設計,至報文處理,都不同于業界開源的OVS(Open Virtual Switch)。
軟件定義網絡
從洛神誕生的第一天起,阿里云的網絡架構遵循軟件定義網絡的理念,管控和轉發分離,網元只負責數據轉發,管理配置以及表項由SDN網絡控制器生成和下發。
圖5 阿里云軟件定位網絡架構
轉發網元不管是軟件方式,還是硬件方式,都支持可編程,所有業務邏輯都是通過軟件代碼實現,兼容SDN控制器之間自定義通道通信協議,軟硬件一體化,兼容可擴展性。
海量規模 阿里云目前有數百萬的公有云租戶,還有阿里集團這種超大規模的用戶,通過海量的虛擬機協同完成豐富的業務。量變引起質變,洛神平臺要支持這些海量租戶,海量虛擬機之間的網絡通信,網元的管理,表項下發性能,數據轉發性能不是小規模網絡可以相比擬的。目前實際運行環境,洛神已經支持單租戶超過10W+虛擬機實例、單租戶100G+公網帶寬、單租戶20T+混合云帶寬。
飛天洛神如何支撐雙11“不是任何一朵云都能撐得住雙11”,阿里集團核心系統首次100%運行在公共云上,54.4萬筆/秒的訂單峰值,970PB的單日數據處理量是承載在虛擬化的分布式系統上的,分布式節點之間的通信,依賴的就是底層的云網絡基礎設施,就是洛神平臺提供的能力。 雙11對云網絡,對云網絡的技術平臺洛神有哪些具體的挑戰,洛神如何支撐的呢,讓我們一一揭秘。
超大規模 阿里集團核心業務全面上云,隨之而來的最大的挑戰超大規模。2018年雙11云上單個VPC的規模已經接近10w,今年還需要成倍增加,達到單VPC 30w的規模,業界有如此規模的用戶屈指可數,基本集中在個別超大規模互聯網公司,但不管是否自身就是公有云提供商,都沒有將自己的核心業務部署在公有云上,所以單個VPC支撐如此規模的虛擬化實例,沒有先例。同時在轉發帶寬的要求上,去年整個云上公網和跨域出口流量5Tbps左右,今年這個流量增長到了數十Tbps。
網絡設備邏輯上包括管控和數據轉發兩個組成部分,首先在管控層面,集中式的SDN控制器使用傳統方式,轉發表項的下發性能會很低,結果會導致虛擬實例的上線速度很慢,影響業務開通效率,包括業務切換效率。洛神的管控系統采用集群和分層架構,集中能力提升的同時,將大量虛擬實例上線的處理下層,大大提升管控配置和表項的處理性能。
圖6 洛神分層管控架構
數據轉發層面,洛神提供了軟硬件一體化的技術架構,虛擬交換機在傳統DPDK架構基礎上進行了升級,支持可編程硬件實現的快速轉發。
圖7 基于可編程硬件的洛神虛擬交換機
基于可編程硬件的虛擬交換機相對于傳統軟件虛擬交換機,轉發性能提升達到10倍左右,時延降低1倍以上。公網和跨域帶寬的快速增加,也對DPDK虛擬網關的性能提出了極大挑戰,一方面是設備規模的增加,導致管理復雜度,供應成本的增加,另外CPU單核能力的約束,無法支撐某些突發和大帶寬單流的場景,影響其它正常流量的通信。
圖8 阿里云洛神軟硬件一體網關
在虛擬網關上,通過技術架構的升級,支持軟硬件一體化的硬件網關,業務邏輯通過可編程的P4語言實現,對外接口兼容軟件虛擬化網關,實現統一的擴展性。可編程硬件網關相對于傳統X86軟件架構,轉發性能提升數十倍,同時有效避免了大帶寬單流對單個CPU core的沖擊,整個雙11期間的流量洪峰在整個洛神軟硬件一體化架構下,呈現出來的是“涓涓細流”。
穩、穩、穩 阿里集團核心業務100%運行在公有云上,穩定性是第一要素,容不得半點差錯,不僅僅單個節點的穩定性要做到極致,整個網絡架構,解決方案層面也要保證絕對的穩定,做到多重防護,萬無一失。洛神平臺,架構層面保證網絡通信的穩定性,業務按AZ(Available Zone)部署,公網和跨域訪問的網關在可用區內集群部署,避免單點故障的影響,同時在可用區之間互為備份,避免可用區的故障。
圖9 洛神網關類設備可靠性部署架構
復雜流量模型 整個阿里巴巴經濟體的業務系統非常復雜,不僅僅包括電商購物系統,還包括螞蟻支付系統,還有大數據分析系統,菜鳥物流體系等等,不同的系統對網絡通信需求的要求也不相同,業務流量的優先級也不一樣,有些對延時敏感,有些對帶寬要求高,有些對丟包敏感,這些紛繁復雜的業務如何在統一的底層云網絡中承載,對云網絡的技術平臺洛神提出了區別普通公有云租戶的不同挑戰。以阿里集團在線業務和離線業務為例,離線業務主要就、是大數據,熟悉的人可能都比較清楚,大數據的出名的流量大戶,經常會有一些突發的流量將物理網絡的帶寬占滿,導致丟包,而在線業務一般流量不大,但對時延和丟包敏感。這就要求云網絡支持流量等級區分,擁塞是優先丟棄低優先級的流量,保證離線和在線業務的和諧共處。
圖10 業務對網絡的差異需求
云網絡洛神平臺支持不同業務的QoS,對于大帶寬、丟包非敏感業務,設置通信報文低優先級,突發流量不會導致高優先級報文被丟棄,復雜的流量模型也能“和平共處”。
高效運維 物理規律決定了沒有100%可靠的網絡,一方面阿里云網絡追求最高的可靠性,一方面遵循沒有永遠不失效的單點邏輯這個規律,故障一定會發生,無法避免,但需要有故障發生時快速恢復,快速定位的能力,在雙11之前的各種壓測和故障演練之中,洛神平臺不斷的錘煉網絡運維能力,做到故障快速監控,快速恢復,快速定位。阿里云網絡洛神平臺的運維,運營平臺,內部叫齊天系統,這是一個分布式,大數據智能化運維系統,通過大數據,AI分析能力,集合阿里云海量數據,實現故障的快速定位和逃逸。
圖11 阿里云齊天智能網絡系統架構
通過底層網絡網絡和虛擬網絡數據流,日志,設備狀態等等數據信息,通過以blink為底座的大數據分析平臺,在業務方感知故障之前,快速判斷網絡的監控狀態,以及快速識別故障的根因,實現故障的自動逃逸。同時每種典型故障,都錄入到日常故障演練中,做到網絡運維的真正高效,隨時可用。智能的網絡,也是阿里云洛神平臺保障雙11業務的一個利器,為雙11的平穩保駕護航。
洛神還在不停的進步,從最初的洛神1.0 DPDK網元演進洛神2.0軟硬件一體化網元,網絡能力有了質的提升,支撐了阿里集團核心業務的100%上云,未來在彈性、開放能力上會更進一步,提供給用戶更加美好的體驗。
評論