女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦GPU跑通DeepSeek開源代碼庫(kù)FlashMLA

沐曦MetaX ? 來(lái)源:沐曦MetaX ? 2025-02-25 16:25 ? 次閱讀

DeepSeek 開源周

今日,DeepSeek正式啟動(dòng)"開源周"計(jì)劃,首發(fā)代碼庫(kù)FlashMLA一經(jīng)開源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項(xiàng)目已在GitHub斬獲超7.2K Star!

沐曦技術(shù)團(tuán)隊(duì)在FlashMLA開源后迅速響應(yīng),僅用2小時(shí)即完成與沐曦GPU的適配工作,并于當(dāng)日將代碼提交至開源社區(qū)。本次適配成功后,MXMACA平臺(tái)也可完美運(yùn)行FlashMLA,這充分驗(yàn)證了沐曦GPGPU架構(gòu)與MXMACA軟件平臺(tái)在生態(tài)兼容性方面的先天優(yōu)勢(shì)!

FlashMLA通過(guò)MLA解碼優(yōu)化與分頁(yè)KV緩存技術(shù)等顯著提升硬件利用率,可加速大語(yǔ)言模型解碼過(guò)程,有效提升響應(yīng)速度與吞吐量,尤其適用于聊天機(jī)器人等實(shí)時(shí)生成場(chǎng)景。沐曦在適配中應(yīng)用矩陣吸收算法將低秩投影融入Flash Attention 2核函數(shù),在保證計(jì)算效率的同時(shí)顯著降低顯存占用。同步構(gòu)建了MXMACA自動(dòng)化測(cè)試體系覆蓋常規(guī)及邊界場(chǎng)景,確保功能準(zhǔn)確性與數(shù)值穩(wěn)定性,為長(zhǎng)文本生成等顯存敏感場(chǎng)景提供顯著性能增益。沐曦本次提交的代碼不僅突破了官方實(shí)現(xiàn)中對(duì)Hopper架構(gòu)的依賴,還新增支持64以外的多樣化page size配置,大幅提升框架適用性,為開源社區(qū)帶來(lái)實(shí)質(zhì)性技術(shù)貢獻(xiàn)。

明天,DeepSeek開源計(jì)劃第二彈即將揭曉,敬請(qǐng)期待后續(xù)動(dòng)態(tài)!

關(guān)于沐曦

沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出曦思N系列GPU用于智算推理,曦云C系列GPU用于通用計(jì)算,以及曦彩G系列GPU用于圖形渲染,滿足“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)字經(jīng)濟(jì)建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4912

    瀏覽量

    130681
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3616

    瀏覽量

    43499
  • 沐曦
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    1378
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    777

    瀏覽量

    1363

原文標(biāo)題:2小時(shí)極速適配!沐曦GPU率先跑通DeepSeek開源代碼庫(kù)FlashMLA!

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PaddleScience完成與AI芯片適配

    當(dāng)前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計(jì)算、科學(xué)建模等多個(gè)方向。這一趨勢(shì)正加速形成面向"Al for Science"的國(guó)產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?349次閱讀

    云C500通用計(jì)算GPU與百度飛槳完成Ⅱ級(jí)兼容性測(cè)試

    近日,云C500通用計(jì)算GPU與百度飛槳已完成Ⅱ級(jí)兼容性測(cè)試。測(cè)試結(jié)果顯示,雙方兼容性表現(xiàn)良好,整體運(yùn)行穩(wěn)定。這是
    的頭像 發(fā)表于 03-31 14:22 ?640次閱讀

    加速DeepSeek滿血版單卡C500異構(gòu)推理

    近日,基于開源KTransformers架構(gòu)的 CPU/GPU 異構(gòu)推理能力,云C500單卡GP
    的頭像 發(fā)表于 03-20 15:52 ?914次閱讀

    壁仞科技支持DeepSeek-V3滿血版訓(xùn)練推理

    DeepSeek開源開源了部分關(guān)鍵模塊的代碼及推理系統(tǒng)參考架構(gòu),再次引發(fā)行業(yè)震動(dòng),但目前尚未開源De
    的頭像 發(fā)表于 03-04 14:01 ?811次閱讀

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時(shí)間內(nèi),成功實(shí)現(xiàn)對(duì)DeepSeek各個(gè)
    的頭像 發(fā)表于 03-04 10:06 ?420次閱讀

    摩爾線程支持DeepSeek開源通信庫(kù)DeepEP和并行算法DualPipe

    DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信庫(kù)DeepEP和并行算法DualPipe,并發(fā)布相關(guān)
    的頭像 發(fā)表于 02-28 15:58 ?432次閱讀

    摩爾線程完成DeepSeek開源庫(kù)FlashMLA和DeepGEMM適配

    DeepSeek啟動(dòng)“開源周”以來(lái),已陸續(xù)開源三個(gè)代碼庫(kù)。摩爾線程基于全新MUSA Compute Capability 3.1計(jì)算架構(gòu),
    的頭像 發(fā)表于 02-27 14:40 ?496次閱讀

    云天勵(lì)飛DeepEdge10適配DeepSeek開源周“首個(gè)大招”:FlashMLA

    2 月 24 日,DeepSeek"開源周"正式啟動(dòng),并發(fā)布首個(gè)代碼庫(kù)FlashMLA……
    的頭像 發(fā)表于 02-27 11:06 ?321次閱讀
    云天勵(lì)飛DeepEdge10適配<b class='flag-5'>DeepSeek</b><b class='flag-5'>開源</b>周“首個(gè)大招”:<b class='flag-5'>FlashMLA</b>

    DeepSeek宣布開源DeepGEMM

    DeepGEMM 是一個(gè)專為簡(jiǎn)潔高效的 FP8 通用矩陣乘法(GEMM)設(shè)計(jì)的庫(kù),具有細(xì)粒度縮放功能,在Deepseek開源周的第三天Deepseek正式宣布
    的頭像 發(fā)表于 02-26 15:33 ?855次閱讀

    DeepSeek扔的第二枚開源王炸是什么,跟第一枚有何不同?強(qiáng)烈引發(fā)外媒熱議

    與DeepEP。這兩大開源項(xiàng)目的發(fā)布,不僅引發(fā)了國(guó)內(nèi)外媒體的廣泛關(guān)注與熱議,更在AI社區(qū)內(nèi)掀起了軒然大波。 2025年2月25日,DeepSeek開源周的第二天,正式發(fā)布了名為DeepEP的
    的頭像 發(fā)表于 02-26 11:10 ?713次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開源</b>王炸是什么,跟第一枚有何不同?強(qiáng)烈引發(fā)外媒熱議

    DeepSeek扔的第二枚開源王炸是什么

    DeepSeek在其開源周活動(dòng)中連續(xù)扔出了兩枚震撼業(yè)界的“開源王炸”--FlashMLA與DeepEP。 ? 在25日,也就是DeepSeek
    的頭像 發(fā)表于 02-26 11:05 ?719次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開源</b>王炸是什么

    Gitee AI 聯(lián)合首發(fā)全套 DeepSeek R1 千問(wèn)蒸餾模型,全免費(fèi)體驗(yàn)!

    -R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個(gè)較小尺寸的 DeepSeek 模型。值得關(guān)注的是, 本次上線的四個(gè)模型
    的頭像 發(fā)表于 02-10 09:56 ?599次閱讀
    Gitee AI 聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發(fā)全套 <b class='flag-5'>DeepSeek</b> R1 千問(wèn)蒸餾模型,全免費(fèi)體驗(yàn)!

    深度解析deepseek開源是什么意思

    Deepseek開源是指Deepseek項(xiàng)目的源代碼被公開,允許任何人免費(fèi)查看、使用、修改和分發(fā)。
    的頭像 發(fā)表于 02-06 09:29 ?3363次閱讀

    澎峰科技與完成聯(lián)合測(cè)試,實(shí)現(xiàn)全面兼容

    近日,澎峰科技與科技宣布,雙方已完成對(duì)PerfXLM推理引擎、PerfXCloud大模型服務(wù)平臺(tái)與云系列通用計(jì)算
    的頭像 發(fā)表于 01-21 15:20 ?574次閱讀

    澎峰科技計(jì)算軟件棧與GPU完成適配和互認(rèn)證

    ?近期,澎峰科技與完成了對(duì)PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺(tái))與云系列通用計(jì)算
    的頭像 發(fā)表于 01-21 09:51 ?546次閱讀