在人工智能驅動的數字時代,海量數據的高效存儲與快速調用成為AI應用的核心支柱。從智能推薦系統的實時數據處理,到深度學習模型的參數訓練,固態硬盤(SSD)以其卓越的讀寫速度與穩定性,正成為AI基礎設施的關鍵組件。然而,鮮為人知的是,在微觀世界中,中子輻射引發的比特翻轉問題,正悄然威脅著AI的數據安全與系統穩定性。
測試背景與環境
測試背景
中子,作為一種不帶電的亞原子粒子,廣泛存在于宇宙射線、高海拔地區、核電站周邊等環境中。當這些微小的粒子穿透SSD的存儲單元時,可能會導致存儲芯片中的比特值發生意外翻轉,使得原本存儲的“0”變成“1”,“1”變成“0”。這種看似微不足道的變化,在AI應用的海量數據處理場景下,可能引發數據錯誤、模型訓練偏差,甚至系統崩潰,嚴重影響AI應用的可靠性與效率。
憶聯作為國內唯一高分通過中子輻照測試的SSD廠商,聯合國內知名機構中國散裂中子源在遠超地表中子輻射量的模擬環境下,實測PCIe Gen5 ESSD UH812a的高可靠性,以期為AI時代提供更安全高效的存儲解決方案。
驗證平臺
中國散裂中子源是國際前沿的高科技多學科應用的大型研究平臺,依托中國散裂中子源建成的大氣中子輻照譜儀是國內首臺、國際先進的大氣中子地面模擬加速測試平臺,可為航空、電力電子、智能駕駛、高性能存儲與計算等領域的高可靠性的電子元器件及系統提供大氣中子單粒子效應風險評估和測試服務。
測試產品
本次試驗選取憶聯PCIe Gen5 ESSD UH812a及國際友商A、國內友商B的同代際產品進行測試,所有SSD均在相同的中子注量率下持續輻照,直至盤片全部失效。
測試環境
本次測試使用的中子注量率為9.6*104n/ (cm2·s) (En≥1MeV)。在國內地面條件下,阿里地區作為中子量最多的地區之一,其中子注量率僅為5.09*102n (cm2·h) (En≥1MeV)。由此可見,在模擬宇宙射線峰值環境(中子注量率達阿里地面條件的68萬倍)的極限測試中,憶聯UH812a SSD仍能保持優秀的穩定性和可靠性,可護航千卡GPU集群完成百億參數大模型訓練,開創存儲設備抗輻射性能新高度。
圖1:中子試驗環境實拍
測試關鍵結果
在嚴苛模擬工作負載環境下,憶聯UH812a SSD正常運行時長遠超友商
圖2:憶聯與友商同類產品實測對比
基準值232s是在高中子環境下SSD的使用壽命,等于在常規環境下SSD的5年使用壽命。在高中子環境下,SSD實際運行時間(實測值)比基準值越長,則說明其可靠性及數據保護能力越強。在本次測試中,憶聯UH812a實際運行時間為416秒,比國內友商B的同類產品運行時間長約60%,比國際友商A的同類產品運行時間長約400%。在模擬環境的中子注量率下,為達到5年使用壽命,SSD正常運行時間需達到232秒,而憶聯UH812a平均運行時長高出5年使用壽命等效時長79%,可明顯滿足用戶在高中子環境下對SSD耐用性和可靠性的使用需求。
在高中子注量環境下,憶聯UH812a SSD平均每小時故障率遠低于上一代產品
平均每小時故障率指SSD在單位時間(每小時)內發生故障的概率,反映了SSD在運行過程中出現故障的頻率,該指標越低則說明SSD的可靠性越高。
圖3:UH812a與上一代產品及友商平均每小時故障率對比
在高中子注量率的測試環境下,通過實測UH812a與上一代產品的故障率,可明顯發現UH812a的故障率不僅低于上一代產品,同時也遠低于友商同代際產品。UH812a的單個硬盤平均每小時故障率為3.22E-06,上一代際產品單個硬盤平均每小時故障率為4.18E-06,而友商Gen5代際產品平均每小時故障概率為6.95E-06。這說明在正常使用情況下,不管是跟友商對比,還是跟上一代產品對比,UH812a出現故障的可能性更小,更能夠為用戶提供更穩定、持久的存儲服務,有效保障數據的安全和業務的連續性。
憶聯UH812a SSD采用多重數據保護技術,為AI應用的數據安全保駕護航
憶聯UH812a除具備優秀的硬件配置外,還采用了增強的LDPC糾錯算法、智能錯誤檢測與糾正(ECC)模式及不可糾正錯誤(UNC)保護模式,為用戶牢筑AI數據安全防線。
LDPC糾錯算法:可提供比Flash顆粒要求更高的糾錯能力,能夠精準識別并修正數據傳輸與存儲過程中出現的各類錯誤,實現小于1E-18的UBER(不可修復錯誤比特率)。
ECC模式:能夠實時監測存儲數據狀態,快速定位并糾正因中子輻射引發的比特翻轉錯誤,有效保障數據讀寫的準確性。
UNC保護模式:憑借智能錯誤識別與快速隔離技術,在面對不可糾正錯誤時,通過隔離錯誤區域防止數據進一步損壞和丟失,全方位保障系統穩定運行與業務連續性。
圖4:憶聯UH812a亮點介紹
UH812a作為憶聯強勢推出的重量級PCIe Gen5 ESSD之一,其采用的多重數據保護技術,在面對中子輻射的威脅時,可最大限度降低數據丟失風險,以全場景、全周期的數據防護策略,為大模型訓練、智能決策等AI業務構筑堅不可摧的存儲安全屏障。
中子輻射環境下的數據保障方案,筑牢安全與效率雙保險,有效降低用戶TCO
受政策、自然環境等因素的影響,數據中心紛紛落戶高海拔地區。數據中心作為AI發展的基礎支撐,不僅可以提供海量存儲空間,也為AI模型訓練和推理提供強大計算力,加速模型訓練過程。在高海拔環境下,數據中心及AI應用極有可能受到中子影響,導致數據錯誤,引發模型訓練偏差、分析結果失真等,造成人力、物力與時間成本的浪費,增加運營成本。
對于用戶而言,在高海拔的數據中心采用通過大氣中子測試的ESSD意味著為數據安全與業務效率雙重賦能。憶聯UH812a憑借出色的數據保護能力,能夠有效降低SSD失效率,確保企業的智能決策系統、智能客服等AI應用穩定運行,保障數據的真實性與完整性,減少運維成本及人力,有效降低用戶TCO。
在AI驅動的智能時代,選擇經過嚴苛大氣中子測試的憶聯UH8系列SSD,就是選擇更穩定的系統運行、更精準的數據分析、更高效的業務推進與更低的運維成本,為企業數字化轉型與技術創新筑牢可靠根基。
未來,憶聯將繼續深耕AI存儲技術領域,持續創新,不斷優化產品性能,為AI時代的數據存儲需求提供更安全、更高效、更可靠的解決方案,與客戶攜手共筑智能時代的數據基石。
注:本文的所有測試數據均基于中國散裂中子源大氣中子輻照譜儀輻射環境下的實測數據,測試對象包含憶聯SSD及主要國內外友商的同代際產品,相關數據僅供參考。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4499瀏覽量
87046 -
SSD
+關注
關注
21文章
2947瀏覽量
119075 -
PCIe
+關注
關注
16文章
1320瀏覽量
84634 -
人工智能
+關注
關注
1804文章
48660瀏覽量
246184 -
固態存儲
+關注
關注
1文章
56瀏覽量
13031
發布評論請先 登錄
重新定義MCU存儲,意法半導體Stellar系列賦能SDV新未來

存儲趨勢前瞻:憶聯如何以產品創新重塑AI時代存儲價值版圖

憶聯如何以技術創新推動存儲產業變革

ICY DOCK PCIe可拆卸式擴展插槽硬盤抽取盒或轉接器,革新存儲解決方案

憶聯UH812a獲英特爾BKC與PCIe鏈路雙認證,賦能企業級存儲解決方案

紫光閃存推出兩款PCIe 5.0固態硬盤
洛微科技推出3D立體安全防護解決方案
憶聯PCIe 5.0 SSD支撐大模型全流程訓練

銀翼新境 致態TiPro9000引領個人存儲PCIe 5.0新時代
憶聯AM541在極端輻射環境下為客戶提供更高保障
電裝D-mobico智能移動制冷機重新定義恒溫運輸
Solidigm發布高性能PCIe 5.0 SSD,引領數據中心存儲新紀元
美光推出9550系列數據中心PCIe 5.0 SSD
憶聯SSD存儲解決方案亮相2024中國國際金融展

評論