女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

潤和軟件發布StackRUNS異構分布式推理框架

潤和軟件 ? 來源:潤和軟件 ? 2025-06-13 09:10 ? 次閱讀

當下,AI模型規模持續膨脹、多模態應用場景日益復雜,企業正面臨異構算力資源碎片化帶來的嚴峻挑戰。為應對行業痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發布自主研發的StackRUNS異構分布式推理框架,高效融合異構算力,精細化配置算力資源,釋放算力效能。

潤和軟件發布StackRUNS異構分布式推理框架

StackRUNS是基于“異構算力建模+動態調度優化+統一通信接口+模型分層加載”核心技術打造的輕量級分布式推理框架,可實現多類型AI設備的資源整合與大模型的協同高效推理,廣泛適用于對推理能力有高要求但資源異構、預算受限的實際應用場景,如多節點異構硬件的老舊部署環境、突發性大模型任務需求、高校或科研機構低成本模型實驗場景。目前,StackRUNS已在教育、安防、能源等行業落地,通過智能調度算力、分鐘級快速部署、分布式協同等能力,加快大模型落地進程。

功能架構

5cf32eba-45df-11f0-b715-92fbcf53809c.png

StackRUNS功能架構圖

1. 框架適配層:統一接入主流推理框架

通過統一的框架適配能力,StackRUNS可有效屏蔽上層差異,提升系統的靈活性與兼容性,支持主流框架與模型組件的即插即用,大幅縮短模型部署與遷移周期。

支持PyTorch、TensorFlow、MindSpore等主流AI框架;

無縫集成llama.cpp、vLLM等主流推理引擎;

插件化架構,支持多模型統一推理入口,便于快速上層接入與復用。

2.調度層:智能調度與自動并行優化

通過異構設備資源的智能感知與動態調度,StackRUNS可最大化利用系統整體算力,并通過推理場景的深度優化,顯著提升大模型多設備協同推理的效率與可控性。

異構資源感知與建模,實現不同設備算力精準識別;

自動并行策略生成與模型切分,支持切片并行、專家路由等;

涵蓋精度控制與任務生命周期管理,保障精度性能雙優;

通信圖優化與算子融合,提升跨設備數據流通效率。

3. 通信適配層:統一通信接口與性能反饋機制

StackRUNS具備統一通信能力適配的異構平臺,可有效消除設備間通信瓶頸,為分布式推理提供高效、穩定的通信支撐,提升跨設備協同性能。

提供統一通信算子接口,適配 HCCL、NCCL、RCCL等多種通信協議;

支持通信運行時、拓撲管理與性能建模,為調度策略提供反饋依據;

深度學習框架通信插件化集成,增強生態兼容性。

4. 硬件支持層:兼容多種AI算力平臺

StackRUNS全面兼容主流AI硬件平臺,涵蓋Ascend、NVIDIA、AMDARMIntel、Mac等,實現算力資源的靈活組合與無縫協同,推動AI應用從“專用單機”邁向“異構集群”,釋放硬件潛能。

核心技術

5d09125c-45df-11f0-b715-92fbcf53809c.png

StackRUNS架構圖

1. 異構算力識別與建模

通過自動識別和建模不同類型的計算資源,StackRUNS建立了統一的資源抽象層,確保在異構環境下的資源統一管理和高效利用。

資源抽象與建模:對各類計算設備的性能、內存、帶寬等關鍵參數進行建模,形成統一的資源描述;

動態資源感知:實時監控資源的使用情況,支持動態調整和優化。

2. 調度層

調度層根據任務需求和資源狀況,可根據計算任務智能分配算力資源,實現資源的高效利用和任務執行效率。

任務劃分與分配:將大模型分解為多個子任務,合理分配到不同的計算節點;

負載均衡:根據資源使用情況,動態調整任務分配,避免資源瓶頸;

容錯與恢復:在節點故障時,能夠快速重新調度任務,確保系統穩定性。

3. 通信適配層

通信適配層提供統一的通信接口,支持多種通信協議,實現高效的數據傳輸,確保在分布式環境下的統一、可靠通信。

協議適配:支持如NCCL、HCCL、RCCL等多種通信協議,確保在不同硬件平臺上的兼容性;

通信優化:通過通信圖優化、算子融合等技術,減少通信開銷,提高數據傳輸效率。

4. 大模型分層加載通訊

針對超大規模模型,StackRUNS采用分層加載和通信策略,優化模型的加載和推理過程,保持模型性能的同時,顯著降低通信成本,提升整體推理效率。

分層加載:通過結構感知的模型切分,需考慮各層之間的依賴關系和數據傳輸量;

通信與計算重疊執行:采用流水線并行策略,在模型推理過程中,采用異步通信策略,提高并行度和效率;

通信內容優化:采用混合精度傳輸策略,在不影響模精度的前提下,減少通信數據量是降低通信成本的直接方式;

拓撲感知的通信策略:根據硬件拓撲結構,優化通信路徑和方式,提升通信效率。

核心優勢

1. 異構兼容與靈活部署:適用于多種硬件架構,結合底層統一通信適配器,可在混合平臺中實現透明部署與調用;

2. 輕量級推理服務端:將推理能力解耦為服務端組件,便于調度層動態調配計算任務,按需分發至合適節點運行,實現推理資源的彈性擴展與動態負載均衡;

3. 通信優化與統一適配:通過“統一通信算子接口”與“深度學習框架插件”,支持異構資源統一調度、模型分布式執行與通信圖優化;

4. 分布式與邊云協同支持:結合通信適配層實現跨節點協同推理,亦支持邊緣側模型分片部署,打造邊云協同的智能推理能力;

5. 混合精度與策略支持:結合調度層的混合精度策略支持,充分利用不同設備的計算與內存資源,在資源受限環境下依然保障推理效率與響應速度。

適用場景

1. 多節點異構硬件的老舊部署環境:支持不同類型設備按性能分配模型層或批次任務,實現“以最小代價釋放最大算力”;

2. 臨時性、突發性大模型任務需求:臨時調用空閑設備組成協同集群,按需啟用、任務后回收,資源零浪費;

3. 多精度模型混合部署場景:在內存、算力受限環境下使用INT4、INT8等低精度模型提升吞吐與響應;

4. 邊緣設備能力有限邊云協同:模型分層部署、分片推理、流水線式協同處理,保障復雜分析任務順利完成;

5. 資源彈性調度與負載均衡場景:多節點集群中按需調度模型推理任務,提升整體資源利用率;

6. 高校、科研機構低成本模型實驗場景:利用分布式異構環境拼接起完整的推理通路,推動教學與研究實際落地。

用戶價值

1. 智能調度算力,整體成本最高可降低60%成本

通過智能調度異構資源,打破設備之間的“算力孤島”,實現資源池化管理;

無需新增昂貴硬件投入,充分利用現有 GPU、NPU、CPU 組合,即可完成大模型部署;

原有設備基礎上部署大模型后,設備成本可節省約60%。

2. 分鐘級快速部署,推理任務響應能力提升超5倍

彈性部署機制支持模型“即需即調、即跑即收”,無需長時間準備資源環境;

針對高峰期或突發任務,可在5分鐘內完成大模型分布式加載與推理啟動;

部署周期相比傳統方案縮短70%+,顯著提升AI應用上線效率。

3.跨設備協同,讓原本“跑不動”的大模型輕松可落地

支持在多設備之間按層或專家模塊切分模型,實現“拼接式協同計算”;

即使單設備顯存不足,亦可通過分布式推理完整運行數百億/千億參數模型;

32B多模態模型部署在兩臺低配設備上推理延遲可控制在1s以內。

4.不中斷原有業務,系統兼容性與可控性雙優

推理任務調度與原有業務計算負載物理隔離,不影響日常業務穩定運行,推理任務可靈活穿插執行;

支持Linux、Windows、MacOS等多操作系統與NVIDIA、Ascend、AMD等主流硬件平臺。

5.邊云協同優化推理鏈路,體驗更優、響應更快

推理過程中自動判斷本地與遠程計算資源的最優分配路徑,降低核心推理延遲;

智能事件響應任務整體時延下降30%-50%,有效提升邊緣智能體驗。

6.促進AI普惠,加速智能化落地

高校與科研機構可在現有設備上部署百億級模型,用于課程教學與實驗研究;

中小企業可按業務需求靈活部署模型任務,降低模型接入門檻;

在未采購新設備條件下,超大模型教學實訓場景部署成功率超95%。

江蘇潤和軟件股份有限公司(簡稱“潤和軟件”)成立于2006年,2012年在深圳證券交易所創業板上市(證券代碼:300339),是國家重點規劃布局內的大型軟件企業。公司總部位于南京,在北京、上海、深圳、香港等22個國內主要城市設有研發中心或分子公司,在日本、美國、新加坡等國設有海外分支機構,全球員工約13000人,擁有全球化的技術整合、客戶響應與服務到達能力。

秉承“做民族軟件脊梁,擔世界進步責任”的使命,潤和軟件致力成為“中國數智技術與服務創新的引領者”,通過國產化、數字化、智能化創新技術,軟硬件一體化解決方案能力及全生命周期軟件服務體系,激活行業新動能、發展新質生產力,助力廣大客戶數字化轉型和智能化升級。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34421

    瀏覽量

    275751
  • 算力
    +關注

    關注

    2

    文章

    1155

    瀏覽量

    15479
  • 潤和軟件
    +關注

    關注

    1

    文章

    320

    瀏覽量

    1154

原文標題:潤和軟件發布StackRUNS異構分布式推理框架,釋放算力效能

文章出處:【微信號:hoperun300339,微信公眾號:潤和軟件】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    軟件StackRUNS異構分布式推理框架的應用案例

    江蘇軟件股份有限公司(以下簡稱“軟件”)自主研發的StackRUNS異構
    的頭像 發表于 06-13 09:11 ?202次閱讀
    <b class='flag-5'>潤</b>和<b class='flag-5'>軟件</b><b class='flag-5'>StackRUNS</b><b class='flag-5'>異構</b><b class='flag-5'>分布式</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b>的應用案例

    曙光存儲領跑中國分布式存儲市場

    近日,賽迪顧問發布《中國分布式存儲市場研究報告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式存儲,規模達 198.2 億元,增速 43.7%。
    的頭像 發表于 05-19 16:50 ?358次閱讀

    分布式光伏發運維系統實際應用案例分享

    和可持續發展的重要推動力量。國家能源局于2025年1月發布了《分布式光伏發電開發建設管理辦法》,對分布式光伏的分類、上網模式、備案管理、電網接入等進行了詳細規定,未來分布式光伏將進一步
    的頭像 發表于 04-09 14:46 ?251次閱讀
    <b class='flag-5'>分布式</b>光伏發運維系統實際應用案例分享

    淺談工商企業用電管理的分布式儲能設計

    文章設計了一種新的用于工商業用電管理的分布式儲能系統。由于儲能系統硬件置換成本高,選擇在傳統儲能系統的硬件框架基礎上,對控制軟件進行優化設計,建立分布式儲能系統模型,分析發電量、儲電量
    的頭像 發表于 03-24 15:43 ?2604次閱讀
    淺談工商企業用電管理的<b class='flag-5'>分布式</b>儲能設計

    在采用異構模式推理時,如何檢查每層使用的設備是什么?

    異構模式推理時,無法檢查每層使用的設備是什么
    發表于 03-06 06:49

    分布式云化數據庫有哪些類型

    分布式云化數據庫有哪些類型?分布式云化數據庫主要類型包括:關系型分布式數據庫、非關系型分布式數據庫、新SQL分布式數據庫、以列方式存儲數據、
    的頭像 發表于 01-15 09:43 ?417次閱讀

    基于ptp的分布式系統設計

    在現代分布式系統中,精確的時間同步對于確保數據一致性、系統穩定性和性能至關重要。PTP(Precision Time Protocol)是一種網絡協議,用于在分布式系統中實現高精度的時間同步
    的頭像 發表于 12-29 10:09 ?480次閱讀

    HarmonyOS Next 應用元服務開發-分布式數據對象遷移數據權限與基礎數據

    使用分布式數據對象遷移數據,當需要遷移的數據較大(100KB以上)或需要遷移文件時,可以使用分布式數據對象。原理與接口說明詳見分布式數據對象跨設備數據同步。 說明:自API 12起,由于直接使用跨
    發表于 12-24 09:40

    分布式通信的原理和實現高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經超出了單個 GPU 的范圍。所以就需要實現跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進入了一個引人入勝且不斷演進的技術領域,下面我們將簡單介紹
    的頭像 發表于 11-18 09:39 ?1168次閱讀
    <b class='flag-5'>分布式</b>通信的原理和實現高效<b class='flag-5'>分布式</b>通信背后的技術NVLink的演進

    分布式光纖測溫解決方案

    分布式光纖測溫解決方案
    的頭像 發表于 11-12 01:02 ?505次閱讀
    <b class='flag-5'>分布式</b>光纖測溫解決方案

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目
    的頭像 發表于 11-11 09:59 ?466次閱讀
    WDS<b class='flag-5'>分布式</b>存儲系統<b class='flag-5'>軟件</b>助力電信工程海量數據存儲項目

    分布式光纖測溫是什么?應用領域是?

    分布式光纖測溫是一種先進的溫度測量技術,它利用光纖的拉曼散射原理進行溫度監測。以下是對分布式光纖測溫的詳細介紹: 一、基本原理 分布式光纖測溫的原理基于光纖的拉曼散射效應。當光纖某處的溫度發生變化
    的頭像 發表于 10-24 15:30 ?1138次閱讀
    <b class='flag-5'>分布式</b>光纖測溫是什么?應用領域是?

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討,內容將涵蓋模型壓縮、解碼方法優化、底層優化、分布式并行
    的頭像 發表于 07-24 11:38 ?1668次閱讀

    安科瑞分布式光伏系統在某重工企業18MW分布式光伏中應用

    2024年7月16日,江蘇省發改委發布《關于高質量做好全省分布式光伏接網消納的通知(征求意見稿)》,計劃大力支持分布式光伏的發展! 1、未來分布式光伏規模規劃 根據規劃,2024、20
    的頭像 發表于 07-19 11:30 ?794次閱讀
    安科瑞<b class='flag-5'>分布式</b>光伏系統在某重工企業18MW<b class='flag-5'>分布式</b>光伏中應用

    openEuler 24.03 LTS Meetup:聚焦AI、嵌入分布式創新

    ,openEuler社區攜手江蘇軟件股份有限公司(以下簡稱“軟件”)在南京成功舉辦了一場以AI、嵌入
    的頭像 發表于 06-24 10:08 ?669次閱讀