女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云天勵飛DeepEdge10適配DeepSeek開源周“首個大招”:FlashMLA

AI機械姬 ? 來源:AI機械姬 ? 作者:AI機械姬 ? 2025-02-27 11:06 ? 次閱讀

2 月 24 日,DeepSeek"開源周"正式啟動,并發布首個代碼庫FlashMLA,引發全球關注。

FlashMLA是針對英偉達Hopper GPU優化的高效MLA解碼內核,專為可變長度序列優化設計,是DeepSeek高效使用算力的核心程序模塊。FlashMLA通過MLA解碼優化與分頁KV緩存技術,顯著提升硬件利用率,加速大語言模型解碼過程,有效提高響應速度與吞吐量,適用于各種實時對話生成場景。

云天勵飛芯片團隊在FlashMLA開源后,迅速完成了DeepEdge10 平臺與FlashMLA的適配工作。在適配過程中,云天勵飛采用了Op fusion tiling、Online softmax、Double buffer、細粒度存算并行等先進技術,并基于自研的Triton-like編程語言快速開發驗證了高效的FlashMLA算子。通過一系列優化,不僅顯著提升了計算效率,還大幅降低了顯存占用,充分展現了DeepEdge10 平臺“算力積木”芯片架構的卓越優勢,以及其與DeepSeek生態的高度契合性。

今日,云天勵飛已將相關代碼提交至開源平臺Gitee,為開源AI貢獻了重要的技術力量。

算子的源碼地址為:

https://gitee.com/Intellifusion_2025/tyllm/blob/master/python/tylang/flash_mla.py

DeepEdge10 系列芯片是專門針對大模型時代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各類不同架構的主流模型;基于自主可控的先進國產工藝打造,采用獨特的“算力積木”架構,可靈活滿足智慧城市、智慧交通、智能制造、智慧倉儲、機器人、邊緣智算中心等不同場景對算力的需求,為大模型推理提供強大動力。

wKgZPGe_1piAUBg0AAd-aDFnMzU838.png

目前,DeepEdge10 芯片平臺已成功適配DeepSeek R1 系列模型及國產鴻蒙操作系統。未來,云天勵飛將持續加大研發力度,推動芯片在國產化領域取得更大突破,為國產AI生態建設貢獻更多力量。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云天勵飛
    +關注

    關注

    0

    文章

    147

    瀏覽量

    12017
  • DeepSeek
    +關注

    關注

    1

    文章

    773

    瀏覽量

    1337
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    摩爾線程全面支持DeepSeek開源成果

    DeepSeek開源周正式收官,作為國內率先原生支持FP8計算精度的國產GPU企業,摩爾線程迅速響應,并在短時間內,成功實現對DeepSeek各個開源項目的全面支持,涵蓋
    的頭像 發表于 03-04 10:06 ?413次閱讀

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    DeepSeek啟動“開源”以來,已陸續開源三個代碼庫。摩爾線程基于全新MUSA Compute Capability 3.1計算架構,可提供原生FP8計算能力,同時升級了高性能線
    的頭像 發表于 02-27 14:40 ?490次閱讀

    DeepSeek扔的第二枚開源王炸是什么

    DeepSeek在其開源活動中連續扔出了兩枚震撼業界的“開源王炸”--FlashMLA與DeepEP。 ? 在25日,也就是
    的頭像 發表于 02-26 11:05 ?708次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開源</b>王炸是什么

    沐曦GPU跑通DeepSeek開源代碼庫FlashMLA

    今日,DeepSeek正式啟動"開源"計劃,首發代碼庫FlashMLA一經開源即引發全網關注。截至發稿,該項目已在GitHub斬獲超7.2
    的頭像 發表于 02-25 16:25 ?729次閱讀

    云天DeepEdge200芯片和智能拍攝AI眼鏡 亮相國家博物館“網絡發展新圖景成就展”

    篇章,通過實物展品、影像資料及場景還原,呈現網絡技術賦能千行百業的生動實踐。 云天作為國內邊緣AI領軍企業參與了此次成就展。在“融合賦能”展區,云天
    的頭像 發表于 02-24 18:35 ?1554次閱讀

    云天AI技術為智慧教育注入新動能

    2月20日-21日,云天受邀參加“科學教育?社會協同”資源對接交流活動。在會上,云天全面
    的頭像 發表于 02-21 14:13 ?514次閱讀

    云天天書大模型訓推一體機成功適配DeepSeek

    近日,云天天書大模型訓推一體機成功適配DeepSeek。該一體機由云天與華為聯合推出,可以部
    的頭像 發表于 02-14 11:02 ?749次閱讀

    云天飛上線DeepSeek R1系列模型

    春節期間,云天芯片團隊完成 DeepEdge10 “算力積木”芯片平臺與DeepSeek-R1-Distill-Qwen-1.5B、
    的頭像 發表于 02-06 10:39 ?576次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵</b>飛上線<b class='flag-5'>DeepSeek</b> R1系列模型

    DeepEdge10芯片成功適配國產鴻蒙操作系統

    日前,DeepEdge10芯片已成功完成與國產鴻蒙操作系統的適配工作,標志著該芯片在邊緣場景應用領域實現了供應鏈及操作系統層面的全面國產化安全。 為實現這一適配,技術團隊已構建起針對鴻蒙操作系統
    的頭像 發表于 01-24 15:31 ?815次閱讀

    云天DeepEdge10芯片與國產鴻蒙操作系統完成適配

    日前,DeepEdge10芯片已完成國產鴻蒙操作系統的適配。目前已構建適配鴻蒙的芯片編譯平臺框架,完成圖形等子系統的適配。基于DeepEdge10
    的頭像 發表于 01-24 10:14 ?969次閱讀

    云天收到深空探測實驗室感謝信

    殷殷之誼,飲水思源。深空探測事業與深空探測實驗室的高質量發展離不開云天的鼎力支持和指導幫助。云天
    的頭像 發表于 01-14 16:09 ?613次閱讀

    云天聯合發布AI智能眼鏡

    近日,云天飛在互動平臺上宣布,公司與閃極科技、LOHO眼鏡品牌攜手合作,共同推出了全新的AI智能眼鏡。這款眼鏡不僅集成了云天自研的大模
    的頭像 發表于 12-26 11:05 ?1048次閱讀

    云天首款AI眼鏡正式發布

    近日,云天與閃極科技、LOHO聯合打造的AI智能眼鏡正式發布。該產品搭載云天自研大模型“
    的頭像 發表于 12-20 16:37 ?615次閱讀

    云天榮獲全國首個低空經濟獎項

    近日,首屆中國低空經濟產業博覽會暨高峰論壇在深圳舉行。大會頒發了首個全國低空獎,云天榮獲低空創新突破獎。該獎項頒發給在低空經濟領域實現了創新突破和創新成果,推動低空經濟在技術裝備、
    的頭像 發表于 11-17 16:20 ?982次閱讀

    清華姚班師生訪問云天,展望中國AI發展未來藍圖

    日前,清華大學姚班師生到云天參觀交流。云天董事長兼CEO陳寧博士攜
    的頭像 發表于 08-06 09:28 ?998次閱讀
    清華姚班師生訪問<b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>,展望中國AI發展未來藍圖