當前,AI大模型的迅猛發(fā)展帶來了大量的智算需求。然而,大模型的復雜架構與海量參數(shù)對算力要求極高,在實際應用場景中,即便組建超大規(guī)模智算集群,如何優(yōu)化算力使用和提升集群計算效率,依然是一項極具挑戰(zhàn)性的任務;其次,大模型部署的組件兼容性差、協(xié)同工作難度大,在不同環(huán)境下遷移與優(yōu)化的門檻很高;另外,大模型與各行各業(yè)的結合日益成熟,大模型在微調(diào)和推理部署任務需求日益增加。為解決以上問題,玄武智算云平臺應運而生。該平臺依托昇騰系列硬件,適配多種主流大模型,實現(xiàn)了大模型的微調(diào)、推理、優(yōu)化部署等任務的端到端落地,極大提升集群的AI支持能力;同時,玄武平臺具備強大的算力加速和算力池化能力,可精準調(diào)配資源,實現(xiàn)高效的算力集群管理,完美攻克算力“用不了,不好用”的難題,為智能計算保駕護航。
01平臺概述
玄武智算云平臺是基于昇騰原生打造的智算平臺,它支持昇騰全系列硬件的納管、調(diào)度和AI模型支持,可實現(xiàn)高效、精細的算力集群運營管理,旨在打破模型部署困境,解決集群利用率低、硬件適配性差、運營效率低等核心痛點問題,為用戶提供高效、經(jīng)濟、便捷的智能計算服務。
02核心功能
適配、加速、算力池化
在適配方面,平臺能夠針對不同架構類型的計算模型實現(xiàn)高精度匹配,這為后續(xù)推理、訓練框架優(yōu)化加速功能的有效發(fā)揮,提供了堅實的前提條件。在加速方面,平臺的推理、訓練框架優(yōu)化功能協(xié)同發(fā)力,能夠大幅縮短推理決策時長,快速輸出精準結果,顯著加快模型迭代,全方位提升工作效率。在算力池化方面,平臺依托統(tǒng)一通信、精細任務切分與多級混合策略,遇復雜任務時能有條不紊地調(diào)配資源,實現(xiàn)多任務并行高效推進,保障用戶的使用體驗。
算力集群管理
在對算力集群的管理方面,玄武智算云平臺具備高度專業(yè)性與系統(tǒng)性。
首先,在硬件納管與監(jiān)測方面,平臺硬件納管功能能夠精準把控硬件,確保集群運行有條不紊。硬件監(jiān)測功能能夠緊盯硬件狀態(tài),精準、實時探測潛在隱患,為保障平臺能夠平穩(wěn)、順暢的運轉(zhuǎn),筑牢堅實的根基;
其次,在資源調(diào)配方面,平臺能夠深入剖析任務特性的差異,以科學、精細的方式分配算力,避免出現(xiàn)算力冗余閑置的狀況,確保算力資源得到最優(yōu)化的配置;
最后,在資源提效方面,平臺采網(wǎng)絡虛擬化、存儲虛擬化等協(xié)同技術,匯聚算力,優(yōu)化傳輸與存儲,降低成本,為平臺性能提供支撐,確保用戶可享受到穩(wěn)定、高效、可靠的服務。
運營管理
計費模式創(chuàng)新實用。平臺采用token式計費與按量計費相結合的模式,為用戶開辟靈活自主的資源成本管控路徑,用戶可依業(yè)務需求選計費模式,確保資源投入契合業(yè)務發(fā)展節(jié)奏,避免浪費。
安全防護堅實可靠。平臺的服務鑒權功能能夠全方位監(jiān)測和攔截未經(jīng)授權的訪問及操作企圖,精準識別并拒外部惡意入侵和內(nèi)部違規(guī)操作于門外,保障信息安全與用戶隱私。
運營流程優(yōu)化升級。平臺的SLO管理與產(chǎn)品管理模塊緊密協(xié)同,以及精細化管理產(chǎn)品全生命周期,優(yōu)化運營環(huán)節(jié),確保服務質(zhì)量與產(chǎn)品功能迭代。
數(shù)據(jù)回溯助力運維。平臺服務的日志功能可以完整記錄用戶操作軌跡,為用戶回溯操作記錄提供便利,也為運維團隊排查故障、分析數(shù)據(jù)提供支撐,助力平臺自我優(yōu)化升級。
03優(yōu)勢亮點
支持海量主流模型適配
玄武智算云平臺能夠支持海量廣泛、不同規(guī)模范圍的大模型。它支持Deepseek、Baichuan、Llama、Qwen、ChatGLM等多種模型,能夠滿足不同行業(yè)對各種模型的需求,并確保模型在平臺上高效運行。
支持混合推理
玄武智算云平臺具備卓越的靈活性,能夠支持多種型號的昇騰硬件,實現(xiàn)統(tǒng)一推理任務的高效處理。此外,平臺具備多級分布式算力組合功能,結合模型任務的自適應切分,使得各類算力資源都得以高效整合與利用。這種智能化的算力調(diào)配不僅提升了推理的精準度和效率,還確保了平臺能夠靈活應對多樣化的業(yè)務需求,為用戶提供了強大的技術支持。
支持大模型訓練微調(diào)、推理部署一站式服務
玄武智算云平臺的核心優(yōu)勢在體現(xiàn)在對大模型訓練微調(diào)和推理部署的全面支持。在訓練微調(diào)方面,平臺支持的微調(diào)方法涵蓋了業(yè)界領先的SFT技術,能夠為用戶提供靈活多樣的模型優(yōu)化選項,確保模型能夠精確適應特定任務需求。在推理部署方面,平臺支持文本生成、對話系統(tǒng)和文本分類等多樣化的推理任務。致力于提供高效穩(wěn)定的推理服務,確保用戶在處理大規(guī)模語言模型時,能夠獲得快速響應和高性能輸出。
支持即時部署,立享澎湃算力
玄武智算云平臺通過用戶友好的操作界面和簡易的流程設計,為用戶帶來了前所未有的便捷體驗。用戶無需進行繁瑣的配置和調(diào)試,即可迅速接入并使用平臺提供的算力資源。這種設計不僅節(jié)省了用戶的寶貴時間,也降低了使用高性能計算資源的技術門檻。
支持昇騰生態(tài),聯(lián)合實現(xiàn)共贏
玄武智算云平臺通過對Atlas 300I Pro、Atlas 300I Duo、Atlas 900 PoD、Atlas 800T A2等昇騰全系列硬件的高效整合,能夠根據(jù)不同任務需求精準調(diào)配硬件資源,大幅提升計算效能。在此基礎上,玄武智算云平臺與昇騰硬件的結合,能夠帶來以下顯著的業(yè)務優(yōu)勢:
全面覆蓋需求:平臺能夠精準滿足90%以上的RAG需求,提供全面的模型服務和算力調(diào)度,并確保模型運行的高效率和穩(wěn)定性。
性能提升:平臺接入了適配昇騰系列硬件的MLGuider-Ascend大模型訓練和推理引擎,支持多種AI加速技術,顯著提高處理效率,能夠輕松應對海量并發(fā)請求。
算子優(yōu)化:平臺基于昇騰常用算子進行了優(yōu)化,在Atlas 900 PoD集群上能夠釋放出卓越的性能,使計算過程更加高效和迅速。
自主創(chuàng)新:“昇騰+玄武智算云”聯(lián)合方案實現(xiàn)了軟硬件的自主創(chuàng)新,能夠?qū)崿F(xiàn)技術主權和保障數(shù)據(jù)安全,并以其高性價比的解決方案,為各行業(yè)的數(shù)字化轉(zhuǎn)型提供堅實的支持,推動了數(shù)智化的發(fā)展。
展望未來,昇騰與清昴的合作將邁向新的發(fā)展高度。雙方將進一步整合資源,攜手攻克技術難題,將先進的智能計算技術應用于更多行業(yè)領域,努力為客戶創(chuàng)造更大的價值,為推動數(shù)智化發(fā)展做出更大的貢獻!
-
華為
+關注
關注
216文章
35207瀏覽量
255842 -
AI
+關注
關注
88文章
35093瀏覽量
279495 -
云平臺
+關注
關注
1文章
1435瀏覽量
40328
原文標題:昇騰原生丨玄武智算云平臺正式發(fā)布,領航智能計算新時代
文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數(shù)字中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
車規(guī)級二三極管、MOS管、LDO選型應用 為車燈保駕護航

eUPS0505斷電續(xù)航模塊,為嵌入式系統(tǒng)保駕護航

充電樁“耐力大考驗”:老化負載研究,為持久續(xù)航保駕護航
安科瑞蓄電池在線監(jiān)控系統(tǒng)為鐵塔基站的穩(wěn)定運行保駕護航

無人機電力巡檢系統(tǒng)為電網(wǎng)安全保駕護航
5KP26A 二極管:26V 精準穩(wěn)壓,為電路安全 “保駕護航”
無人機光伏巡檢系統(tǒng)為光伏發(fā)電保駕護航
低溫自動加熱型激光雪深傳感器:為交通出行保駕護航
工業(yè)專用直流濾波器:為工業(yè)生產(chǎn)保駕護航
無人機智能巡檢系統(tǒng)為光伏電站保駕護航

瑞隆源產(chǎn)品符合性檢驗中心PCIC--為浪涌產(chǎn)品質(zhì)量保駕護航

如何理解云計算?
防爆智能手機如何助力電氣行業(yè)保駕護航?

評論