女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

海光DCU率先展開文心系列模型的深度技術合作 FLOPs利用率(MFU)達47%

A面面觀 ? 2025-07-01 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

海光DCU實現文心4.5模型高效適配; FLOPs利用率突破47%。

2025年6月30日,在百度文心4.5系列大模型正式開源當日,海光信息技術股份有限公司宣布其深度計算單元(DCU)率先完成對該系列模型的深度技術適配,預訓練模型FLOPs利用率(MFU)達到47%,在多個文本與多模態基準測試中取得SOTA水平。此次合作標志著國產算力基礎設施與大模型技術的協同創新進入新階段。

技術突破:異構計算架構賦能MoE模型高效訓練

海光DCU基于GPGPU通用架構,通過飛槳深度學習框架對文心4.5系列模型實現全流程優化,涵蓋47B/3B混合專家(MoE)模型及0.3B稠密參數模型的高效訓練、推理與部署。其創新性體現在:

  • 多模態異構計算:針對MoE架構設計動態負載均衡策略,顯存帶寬利用率提升30%

  • 混合精度優化:采用FP8技術降低顯存占用,使424B總參數量模型的訓練效率接近國際一線水平

  • 生態兼容性:依托DTK軟件棧實現與文心模型的無縫對接,適配周期縮短50%

行業價值:自主可控技術體系加速AI落地

此次合作驗證了國產DCU在高性能計算領域的三大優勢:

  1. 效能領先:47%的MFU利用率較行業平均水平提升15%以上

  2. 多模態支持:文心4.5的跨模態理解能力在DCU平臺上實現無損遷移

  3. 產業鏈安全:從芯片、框架到模型的完整技術自主權,為金融、制造等行業提供可靠算力選擇

海光DCU與文心模型的深度適配,證明了國產算力支撐前沿AI創新的能力。未來將持續優化千億級參數模型的訓練效率,推動中國智能算力生態建設。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DCU
    DCU
    +關注

    關注

    0

    文章

    15

    瀏覽量

    2876
  • 海光信息
    +關注

    關注

    0

    文章

    25

    瀏覽量

    2325
  • 文心一言
    +關注

    關注

    0

    文章

    133

    瀏覽量

    1862
  • 大模型
    +關注

    關注

    2

    文章

    3141

    瀏覽量

    4067
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    寧暢與與百度心大模型展開深度技術合作

    與部署。 憑借覆蓋訓練、推理、微調全流程的AI?服務器產品矩陣,寧暢幫助企業在大模型時代一鍵打通算力與應用“任督二脈”,顯著縮短模型落地周期。 在已啟動的深度技術合作中,雙方將基于
    的頭像 發表于 07-07 16:26 ?209次閱讀

    黑芝麻智能與心大模型技術合作升級

    近日,心大模型正式開源,黑芝麻智能即日起快速啟動與心大模型技術合作
    的頭像 發表于 07-04 17:24 ?393次閱讀
    黑芝麻智能與<b class='flag-5'>文</b>心大<b class='flag-5'>模型</b><b class='flag-5'>技術合作</b>升級

    龍芯中科與心系列模型開展深度技術合作

    ”解決方案。 強強聯合!自主架構賦能大模型訓練 心大模型 心4.5系列模型均使用飛槳
    的頭像 發表于 07-02 16:53 ?687次閱讀

    兆芯率先展開心系列模型深度技術合作

    6月30日,百度正式開源心大模型4.5系列等10款模型,并實現預訓練權重和推理代碼的完全開源,兆芯率先
    的頭像 發表于 07-01 10:49 ?377次閱讀

    拼版怎么拼好,板廠經常說利用率太低,多收費用?

    做板的時候,板廠經常說我拼版利用率太低,要多收取費用,哪位大神知道怎么算利用率
    發表于 05-14 13:42

    mes工廠管理系統:如何讓設備利用率提升50%?

    在制造業競爭日益激烈的今天,設備利用率直接決定了企業的盈利能力。許多工廠管理者都在思考同一個問題:如何在不增加設備投資的情況下,讓現有產能發揮出最大價值?MES工廠管理系統正是解決這一難題的金鑰匙
    的頭像 發表于 05-09 15:55 ?203次閱讀
    mes工廠管理系統:如何讓設備<b class='flag-5'>利用率</b>提升50%?

    DeepSeek MoE架構下的網絡負載如何優化?解鎖90%網絡利用率的關鍵策略

    、All-to-All等),網絡面臨高并發、低延遲、無損傳輸的嚴苛需求。然而,傳統以太網的網絡利用率長期徘徊在35%~40%,成為制約AI算力釋放的關鍵瓶頸。
    的頭像 發表于 04-28 12:04 ?384次閱讀
    DeepSeek MoE架構下的網絡負載如何優化?解鎖90%網絡<b class='flag-5'>利用率</b>的關鍵策略

    百度下一代心大模型正式開源

    隨著心大模型的迭代升級和成本不斷下降,心一言將于4月1日0時起全面免費,所有PC端和APP端用戶均可體驗心系列最新
    的頭像 發表于 02-17 13:44 ?517次閱讀

    信息技術團隊成功適配DeepSeek大模型

    方面取得了重要進展。 DeepSeek-Janus-Pro是團隊近期完成適配優化的第三款DeepSeek大模型。此次適配工作的順利完成,充分展示了
    的頭像 發表于 02-08 14:10 ?671次閱讀

    信息技術團隊完成模型DCU國產化適配

    近期,中科曙光國家先進計算產業創新中心有限公司對外發布了一則重要消息。據悉,該公司的信息技術團隊已經成功完成了DeepSeek V3和R1模型
    的頭像 發表于 02-06 11:37 ?934次閱讀

    電子發燒友榮獲電子工業出版社博視點 “2024 年度卓越合作伙伴”

    近日,憑借過去一年在書籍測評活動等方面的深度合作與卓越表現,電子發燒友榮膺電子工業出版社博視點 “2024 年度卓越合作伙伴” 的殊榮,表彰電子發燒友在過去一年中與博
    發表于 01-20 15:46

    靈云AICP平臺成功通過海CPU與DCU生態兼容性認證

    近日,國內領先的智能技術提供商捷通華聲宣布,其自主研發的靈云AICP(全智能能力平臺)已成功完成了與信息技術股份有限公司(簡稱“
    的頭像 發表于 01-18 14:11 ?1411次閱讀

    中科創與Dirac達成戰略合作

    汽車音頻等領域展開深度技術合作,將充分整合各自的優勢資源,助力全球汽車廠商打造更具前沿的車載音頻體驗,為用戶帶來全新的智能出行感受。
    的頭像 發表于 11-14 11:39 ?719次閱讀

    交換機內存利用率過高會是什么問題

    以解決,可能會引發一系列問題,影響整個網絡的性能和穩定性。 1. 內存利用率過高的原因 交換機內存利用率過高的原因多種多樣,以下是一些常見的因素: 1.1 大量的數據包轉發 隨著網絡中設備數量的增加,交換機需要處理的數據包數
    的頭像 發表于 10-18 09:53 ?2163次閱讀

    異構混訓整合不同架構芯片資源,提高算力利用率

    的解決方案。通過混合使用多種異構芯片,可以充分利用不同芯片的優勢,提高算力利用率,降低算力成本,并推動AI技術的廣泛應用。 ? 異構混訓能夠整合不同架構芯片資源 ? 在2024年世界人工智能大會AI基礎設施論壇上,無問芯穹聯合創
    的頭像 發表于 07-18 00:11 ?4244次閱讀