女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

潤和軟件StackRUNS異構分布式推理框架的應用案例

潤和軟件 ? 來源:潤和軟件 ? 2025-06-13 09:11 ? 次閱讀

江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)自主研發的StackRUNS異構分布式推理框架已在實際場景中取得顯著成效,成功應用于大型園區多模態模型演練及高校滿血版DeepSeek-MoE 671B的運行,有效推動了大模型技術的快速落地。

案例一:大型園區多模態模型演練

案例背景:

由于建設分期不同及承建單位多樣,該智慧園區的AI基礎設施呈現出高度異構特征,包括NVIDIA T4、NVIDIA 3090、Atlas 300I DUO等多種AI加速設備,并在不同場景下協同運行。這些設備承擔著包括人流密度監測、人臉識別、車牌抓拍等計算機視覺任務,系統負載、資源調度與運維策略已形成穩定運行機制。

近期,該園區在安防升級過程中面臨一項臨時但復雜的智能分析挑戰:在突發事件響應、演練預警或夜間非業務時段,需臨時部署并運行多模態大模型,實現圖文聯合理解、行為鏈條分析、場景異常檢測等復雜推理任務。該需求需在不增加硬件投入、不影響現有業務運行的前提下完成。

應對方案:

為應對這一挑戰,潤和軟件自研的StackRUNS異構分布式推理框架成為關鍵解決方案。該框架具備以下核心能力:

1. 異構算力識別與建模:自動識別各設備的計算能力、顯存規格與精度支持能力,為模型切片和任務分配提供實時依據;

2. 模型智能切分與并行執行:支持基于專家路由與自動切分策略,將超大模型按需劃分為多個計算子任務,分布式調度到可用節點;

3. 輕量級調度與動態推理通路編排:在不干擾現有CV業務的前提下,構建獨立推理通路,臨時占用空閑資源執行推理任務,任務完成后自動回收;

4. 混合精度與量化模型支持:支持INT8、INT4等低精度模型快速加載,提升內存利用率與執行效率;

5. 統一通信與高效協同機制:通過通信適配層封裝多協議通信接口,實現多設備間高效數據傳輸與協同執行。

60eaf6f6-45df-11f0-b715-92fbcf53809c.png

StackRUNS多模態模型場景圖

應用效果:

StackRUNS幫助超大模型在資源受限、基礎設施異構的環境中,實現“即需即調、彈性運行、無感部署”的能力,顯著提升園區對突發安防場景的智能響應水平,為大模型在城市級AI基礎設施中的靈活應用提供了可復制范式。

案例二:高校運行滿血版DeepSeek-MoE 671B

案例背景:

某高校在人工智能教學與科研實踐中,面臨運行超大規模模型的現實挑戰。一方面,教學樓、實驗樓與計算中心分布著多種異構計算資源,包括GPU、NPU設備及部分高性能CPU節點;另一方面,受限于經費與硬件條件,難以通過集中式部署滿足超大模型推理需求。

為此,該高校引入潤和軟件自研的StackRUNS異構分布式推理框架,成功在現有資源基礎上部署并運行了DeepSeek-MoE 671B級別的多模態大模型。

攻克難點:

1. 通信開銷高,跨設備、節點推理效率受限:傳統通信架構難以適配異構環境,頻繁阻塞;

2. 模型規模大、結構復雜度高:單個子模型或路由后激活路徑仍需百GB級顯存支撐,傳統GPU、NPU單卡難以支撐模型加載與中間態存儲;

3. 切片并行策略自動生成難:模型需劃分為跨卡跨節點子圖,兼顧通信代價、算子依賴與硬件負載能力,自動化策略生成復雜;

4. 模型運行狀態監控與可視化困難:推理過程中需監控路由結果、設備負載、通信代價、緩存命中率等。

6105b7de-45df-11f0-b715-92fbcf53809c.png

通過StackRUNS部署滿血版DeepSeek示例圖

最終效果:

借助StackRUNS,高校成功打通了異構設備之間的算力協同壁壘,實現了超大模型的低門檻部署與高效推理,廣泛應用于圖文語義理解、跨模態知識挖掘、學生AI實驗等場景。該方案不僅顯著提升了設備利用率與推理任務執行效率,也加速了人工智能專業課程與科研課題向真實算力環境的落地驗證,真正實現了“在資源有限條件下,用分布式智能拼出超級算力”,為高校人工智能教學與科研提供了強有力的技術支撐。

江蘇潤和軟件股份有限公司(簡稱“潤和軟件”)成立于2006年,2012年在深圳證券交易所創業板上市(證券代碼:300339),是國家重點規劃布局內的大型軟件企業。公司總部位于南京,在北京、上海、深圳、香港等22個國內主要城市設有研發中心或分子公司,在日本、美國、新加坡等國設有海外分支機構,全球員工約13000人,擁有全球化的技術整合、客戶響應與服務到達能力。

秉承“做民族軟件脊梁,擔世界進步責任”的使命,潤和軟件致力成為“中國數智技術與服務創新的引領者”,通過國產化、數字化、智能化創新技術,軟硬件一體化解決方案能力及全生命周期軟件服務體系,激活行業新動能、發展新質生產力,助力廣大客戶數字化轉型和智能化升級。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34421

    瀏覽量

    275782
  • 潤和軟件
    +關注

    關注

    1

    文章

    320

    瀏覽量

    1154
  • 大模型
    +關注

    關注

    2

    文章

    3046

    瀏覽量

    3866

原文標題:潤和軟件StackRUNS異構分布式推理框架行業應用案例

文章出處:【微信號:hoperun300339,微信公眾號:潤和軟件】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    軟件發布StackRUNS異構分布式推理框架

    當下,AI模型規模持續膨脹、多模態應用場景日益復雜,企業正面臨異構算力資源碎片化帶來的嚴峻挑戰。為應對行業痛點,江蘇軟件股份有限公司(以下簡稱“
    的頭像 發表于 06-13 09:10 ?223次閱讀
    <b class='flag-5'>潤</b>和<b class='flag-5'>軟件</b>發布<b class='flag-5'>StackRUNS</b><b class='flag-5'>異構</b><b class='flag-5'>分布式</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b>

    曙光存儲領跑中國分布式存儲市場

    近日,賽迪顧問發布《中國分布式存儲市場研究報告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式存儲,規模達 198.2 億元,增速 43.7%。
    的頭像 發表于 05-19 16:50 ?360次閱讀

    淺談工商企業用電管理的分布式儲能設計

    文章設計了一種新的用于工商業用電管理的分布式儲能系統。由于儲能系統硬件置換成本高,選擇在傳統儲能系統的硬件框架基礎上,對控制軟件進行優化設計,建立分布式儲能系統模型,分析發電量、儲電量
    的頭像 發表于 03-24 15:43 ?2616次閱讀
    淺談工商企業用電管理的<b class='flag-5'>分布式</b>儲能設計

    在采用異構模式推理時,如何檢查每層使用的設備是什么?

    異構模式推理時,無法檢查每層使用的設備是什么
    發表于 03-06 06:49

    分布式云化數據庫有哪些類型

    分布式云化數據庫有哪些類型?分布式云化數據庫主要類型包括:關系型分布式數據庫、非關系型分布式數據庫、新SQL分布式數據庫、以列方式存儲數據、
    的頭像 發表于 01-15 09:43 ?418次閱讀

    基于ptp的分布式系統設計

    在現代分布式系統中,精確的時間同步對于確保數據一致性、系統穩定性和性能至關重要。PTP(Precision Time Protocol)是一種網絡協議,用于在分布式系統中實現高精度的時間同步
    的頭像 發表于 12-29 10:09 ?482次閱讀

    HarmonyOS Next 應用元服務開發-分布式數據對象遷移數據權限與基礎數據

    使用分布式數據對象遷移數據,當需要遷移的數據較大(100KB以上)或需要遷移文件時,可以使用分布式數據對象。原理與接口說明詳見分布式數據對象跨設備數據同步。 說明:自API 12起,由于直接使用跨
    發表于 12-24 09:40

    分布式通信的原理和實現高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經超出了單個 GPU 的范圍。所以就需要實現跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進入了一個引人入勝且不斷演進的技術領域,下面我們將簡單介紹
    的頭像 發表于 11-18 09:39 ?1169次閱讀
    <b class='flag-5'>分布式</b>通信的原理和實現高效<b class='flag-5'>分布式</b>通信背后的技術NVLink的演進

    分布式光纖測溫解決方案

    分布式光纖測溫解決方案
    的頭像 發表于 11-12 01:02 ?506次閱讀
    <b class='flag-5'>分布式</b>光纖測溫解決方案

    淺談屋頂分布式光伏發電技術的設計與應用

    【摘要】為了緩解城市用電緊張袁降低人們的用電成本,可以在工業園區、辦公樓屋頂等場所應用屋頂分布式光伏發電技術進行就近轉換、并網發電袁充分利用建筑物屋頂的太陽資源。概述屋頂分布式光伏發電技術,分析屋頂
    的頭像 發表于 11-11 15:10 ?1734次閱讀
    淺談屋頂<b class='flag-5'>分布式</b>光伏發電技術的設計與應用

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目
    的頭像 發表于 11-11 09:59 ?467次閱讀
    WDS<b class='flag-5'>分布式</b>存儲系統<b class='flag-5'>軟件</b>助力電信工程海量數據存儲項目

    分布式光纖測溫是什么?應用領域是?

    分布式光纖測溫是一種先進的溫度測量技術,它利用光纖的拉曼散射原理進行溫度監測。以下是對分布式光纖測溫的詳細介紹: 一、基本原理 分布式光纖測溫的原理基于光纖的拉曼散射效應。當光纖某處的溫度發生變化
    的頭像 發表于 10-24 15:30 ?1140次閱讀
    <b class='flag-5'>分布式</b>光纖測溫是什么?應用領域是?

    分布式輸電線路故障定位中的分布式是指什么

    所謂分布式指的是產品的部署方式,是相對于集中式而言的。 一、部署方式 分散安裝:分布式輸電線路故障定位系統中的采集裝置需要安裝在輸電線路的多個位置,通常是每隔一定距離設置一個監測點,以確保對整條線路
    的頭像 發表于 10-16 11:39 ?636次閱讀
    <b class='flag-5'>分布式</b>輸電線路故障定位中的<b class='flag-5'>分布式</b>是指什么

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討,內容將涵蓋模型壓縮、解碼方法優化、底層優化、分布式并行
    的頭像 發表于 07-24 11:38 ?1669次閱讀

    openEuler 24.03 LTS Meetup:聚焦AI、嵌入分布式創新

    ,openEuler社區攜手江蘇軟件股份有限公司(以下簡稱“軟件”)在南京成功舉辦了一場以AI、嵌入
    的頭像 發表于 06-24 10:08 ?674次閱讀