3 數據中心HA測試案例
3.1 IRF典型組網HA測試
圖4 數據中心IRF典型組網
如圖4所示,這是典型的數據中心網絡(接入5120+核心12500)兩層拓撲結構,核心層兩臺 S12500采用IRF模式,可以簡化網絡邏輯結構,提高設備利用效率并簡化網絡管理。接入層采用5120EI交換機做二層雙上行接入,接入層鏈路為跨機筐鏈路聚合。出口設備采用SR6600路由器與12500交換機運行OSPF或BGP路由協議,12500與SR6600之間都為雙上行三層等價鏈路。其中,SR6600模擬了廣域網出口設備,但在真實場景中使用高端交換機較多。5120EI和SR6600分別連接兩個應用層測試儀(構造具有狀態特征的 UDP和TCP流量)端口。通過對設備故障和鏈路故障的模擬,可以直觀得到組網中應用層業務的收斂時間、IRF和LACP的HA切換時間等。
需要精確統計時,可以用測試儀以標準報文大小模擬跨S5120EI和SR6600的南北向普通三層數據流,并以Full Mesh方式進行測試。記錄異常情況下全局系統的丟包數量從而計算HA中斷切換時間,重復測試3次記錄平均數據,如表2所示。這些數據對于評估網絡整體的 HA能力,優化應用層業務部署都有重要意義。
普通流量丟包情況(帶寬500Mbps,128字節,422297 FPS)
表2 常見的IRF故障模擬和測試數據
通過測試數據可以很直觀的了解到整個網絡架構中各種應用在不同類型的故障情況下HA收斂的好壞指標。比如表2所示,鏈路中斷的HA收斂時間好于設備重啟的,設備重啟與交換機主控故障的HA時間相近,交換矩陣故障中斷時間最長等等。在了解到這些異常情況對網絡的影響程度后,便可以有針對性的通過網絡設計和優化配置加以改進,從而增加整個網絡架構的HA能力。
3.2 路由典型組網HA測試
圖5 數據中心路由性能HA測試組網
圖5的測試組網也模擬了典型的數據中心網絡。接入層交換機使用兩臺真實設備,在大規格測試項中會使用測試儀模擬更多的接入交換機。核心設備之間采用普通的三層路由結構,機房或站點間的出口設備“MAN Core”采用一臺高端交換機模擬,MAN Core通過多條等價三層鏈路與內部核心Core1和Core2連接。
初始情況下,測試儀端口1(與Access1相連)發向端口2(與Access2相連)的東西向流量是不通的。在測試儀端口2上發布路由后,等待各設備都學習到路由后才會收到報文。記錄測試儀從發布路由到測試儀收到流量的時間差,這個差值就是全網路由學習時間。由于采用傳統的測量流量圖記錄時間的方法誤差較大,可以采用TestCenter3.7版本中的高精度采樣功能來計算學習時間。如圖6所示。
圖6 TestCenter高精度采樣
為了測試的方便與準確,采用了TestCenter軟件中的command sequence功能執行流量、路由及采樣觸發的操作:
撤銷路由-》停止流量發送等待10s-》清除所有計數-》等待5s-》開始發送流量-》等待5s-》開始高精度采樣-》等待5s-》發布ospf路由-》觸發高精度采樣。
command sequence執行完成后,等待高精度采樣進行10s,然后點擊端口高精度采樣視圖下的show chart:
紅線為開始出發發布路由的時間,藍色線為流量曲線,測量兩個時間的時間差便可得到路由在網絡中的學習時間。
Access2相連的測試儀上發布、撤銷一條路由,在Access1設備上學習到的時間,我們分別使用OSPF和BGP兩種路由協議測試10次的結果如下:
BGP :
撤銷平均值:8.06ms;發布平均值:1.57s
OSPF:
撤銷平均值:7.88s;發布平均值:1.29s
測試結果表明BGP路由的撤消收斂時間明顯優于OSPF.為了降低網絡故障對業務的影響,提高數據中心內部的HA性能,采用什么樣的路由協議一直被很多用戶所關注。對于路由協議的運用,有一些傳統的使用模式,比如在數據中心內部OSPF是被大家廣泛認可、使用較多的路由協議。而BGP是廣域網上幾乎絕對的域間路由協議,但它只用于廣域鏈路的觀念正在慢慢地被改變。基于上述的測試結果,越來越多的用戶也會逐漸認可并開始實踐采用BGP作為站點內部路由協議的解決方案。
4 結束語
通過全局的組網HA測試,我們可以模擬數據中心真實的應用場景和業務類型,直觀和精確的了解不同類型的故障下HA的收斂情況。也可以了解不同技術和協議在特定組網中的HA性能對比情況,根據其特點和優劣勢來做出選擇,從而更好的設計和優化用戶的真實環境。
?
評論