隨著數字化進程的加快,各企業、組織對大規模計算服務集群的需求與日俱增,運維難度也隨之加大。浪潮作為全球領先的算力基礎設施供應商,推出了ISPIM平臺,可同時實現對數萬臺不同品牌服務器、存儲、網絡設備等設施的統一監控、運維和告警管理,保障客戶大規模數據中心安全、穩定、可靠運行。

截至目前,中國高校信息化進程已經走過二十余載,從最初的校園信息化建設到如今的智慧校園,數字化轉型下的高校教學、科研、管理和服務對算力的需求也在不斷攀升。以中南大學算平臺為例,基于傳統運維模式已無法對計算服務器集群的算力進行管理、調度和科學合理分配計算資源,算力應用處于黑箱模式,類似于盲人摸象,不清楚、不清晰,無法實現對計算集群快速而精準的有效運維,也造成了運維人力資源的沉重負擔。
為了解決傳統人力運維管理面臨的窘境,中南大學選擇與浪潮信息合作。通過實地考察、調研并與中南大學HPC平臺管理和技術人員進行多次反復的交流、溝通和分析、研究,浪潮信息研發工程師最終決定以“1+1+N高可用模式”,在5臺服務器上部署ISPIM系統,主動采集頻率為45min,監控指標可達150W+,覆蓋智算平臺內的所有設備。
浪潮信息ISPIM系統基于AI算法,對采集到的所有設備的能耗、溫度、氣流、CUPS以及機房環境數據進行實時智能分析,推送能耗管理與優化建議,通過可視化拓撲呈現,3D建模展示數據中心內機柜位置、位置、功耗、溫度狀態信息,實現對整個數據中心的細粒度管理。
一方面,中南大學智算平臺通過部署浪潮信息ISPIM系統,實現了集中自動化管理,大大減輕了運維負擔,通過對算力數據的精準獲取、調度,使得算力的管控集中化、智能化,另一方面,運維人員通過ISPIM平臺可隨時隨地監控整個平臺的運行狀態,故障報警能夠以秒級的速度精準定位,保障中南大學的智算平臺高效有序運轉,節約了人力資源,運維效率大幅提升。
在未來,浪潮信息將持續關注大規模計算服務集群的需求,基于ISPIM平臺,提供優質的自動化運維解決方案,為千行百業賦能。
-
數據
+關注
關注
8文章
7256瀏覽量
91920
發布評論請先 登錄
飛利信與浪潮信息達成戰略合作
適用于數據中心和AI時代的800G網絡
千億規模AI數據中心,電感如何提高電源效率?
韓國將建全球最大AI數據中心
浪潮信息存儲SATA SSD:技術創新引領數據存儲新時代
浪潮信息存儲SATA SSD:以技術創新,開啟數據存儲新篇章
浪潮信息首提機柜級和數據中心級兩大存儲底座
浪潮信息升級數據中心服務器故障智能診斷AIOps技術
浪潮信息與智源研究院攜手共建大模型多元算力生態
浪潮信息AI存儲性能測試的領先之道

浪潮信息:元腦企智EPAI助力金融大模型快速落地

浪潮信息趙帥:開放計算創新 應對Scaling Law挑戰

33家元腦區域伙伴與浪潮信息簽署戰略合作協議
33家區域ISP伙伴與浪潮信息簽署戰略合作協議

金融數據中心最大規模!浪潮信息InManage助力大行10萬+IT設備統一管理

評論