女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中科馭數(shù)高性能網(wǎng)卡產(chǎn)品 成就DeepSeek推理模型網(wǎng)絡(luò)底座

中科馭數(shù) ? 來源:中科馭數(shù) ? 作者:中科馭數(shù) ? 2025-03-31 11:56 ? 次閱讀

2025年初,DeepSeek-V3與DeepSeek-R1推理模型的開源引爆了AI社區(qū),這兩款產(chǎn)品作為通用千億級模型與專用推理優(yōu)化模型,為全球AI技術(shù)生態(tài)帶來重大變革,不僅展示了中國AGI技術(shù)的突破性進展,而且開源模型發(fā)展帶來部署成本的極速下降,為定制化AGI服務(wù),推理本地化部署,帶來發(fā)展機遇,也掀起了新的一輪智算基礎(chǔ)設(shè)施建設(shè)浪潮。

與按Token生成數(shù)量計費的AI云服務(wù)模式不同,出于數(shù)據(jù)安全的考慮,很多用戶選擇采用本地化部署推理集群的方式將AI能力集成到當前業(yè)務(wù)流中。由于整個推理應(yīng)用的業(yè)務(wù)鏈條非常長,本地化部署需要綜合考慮如下各個方面與需求的匹配度:

硬件與基礎(chǔ)設(shè)施規(guī)劃:包括GPU與專用芯片選型、網(wǎng)絡(luò)架構(gòu)優(yōu)化與隔離、存儲方案評估

模型優(yōu)化與部署策略:包括量化壓縮等推理加速技術(shù)選型、資源動態(tài)調(diào)度技術(shù)等

安全與合規(guī)性:需要綜合考慮數(shù)據(jù)使用的便捷性與合規(guī)要求

高可用與容災(zāi)設(shè)計:包括故障自愈方案、數(shù)據(jù)備份等

成本控制:根據(jù)業(yè)務(wù)使用模式合理制定需求規(guī)格,嚴控成本

為了更好地服務(wù)客戶完成本地化推理集群的選型與部署工作,近期中科馭數(shù)作為國內(nèi)AI網(wǎng)絡(luò)的頭部DPU芯片產(chǎn)品供應(yīng)商,從網(wǎng)絡(luò)選型對推理集群性能影響的角度出發(fā),設(shè)計與執(zhí)行了一系列實驗并收集了翔實的一手材料數(shù)據(jù)。

本實驗環(huán)境共采用了DeepSeek-R1-Distill-Qwen-32B未量化版本作為基礎(chǔ)模型,基于vLLM搭建了推理集群,并采用evalscope對推理效果完成了評估。本次時延共使用了兩臺雙GPU服務(wù)器,服務(wù)器基本配置如下:

wKgZPGfqEmyAYGdXAABBxTO92jo515.png

首先,我們關(guān)注采用TCP方式作為底層推理網(wǎng)絡(luò)基礎(chǔ)時,進行了如下測試:

當采用2TP+2PP的模型切割方式時,獲得了如下基礎(chǔ)數(shù)據(jù):

wKgZO2fqEm2AfHMkAACuI4a0wyQ954.png

隨后切換到4TP+1PP模型切割模式,加大了不同節(jié)點間的矩陣數(shù)據(jù)交換需求,得到如下數(shù)據(jù):

wKgZPGfqEm2ATKkCAACg0byqwjM265.png

為了更好的體現(xiàn)測試數(shù)據(jù)的公平性,本測試隨后選擇行業(yè)領(lǐng)導(dǎo)企業(yè)的成熟網(wǎng)卡產(chǎn)品進行了實驗,得出了基本一致的數(shù)據(jù)測試結(jié)果。并且在TCP模式下,中科馭數(shù)FlexFlow-2200T設(shè)備基本達到了與國際一線廠商相同的能力水平。

wKgZO2fqEm2AWR7HAAESY-R7iYQ492.png

隨后,本實驗將底層基礎(chǔ)網(wǎng)絡(luò)技術(shù)切換為RDMA網(wǎng)絡(luò),進行了測試驗證并收集到如下數(shù)據(jù):

wKgZPGfqEm6ASuZiAAE2xuyU9TE948.png

通過對比可以得知在模型進行良好切分設(shè)計的情況下,RDMA網(wǎng)絡(luò)并未能提升整體推理性能,但是在節(jié)點間需要傳遞張量數(shù)據(jù)的情況下,RDMA網(wǎng)絡(luò)可大幅提升模型推理性能,同時在大并發(fā)規(guī)模時,能夠更好的保持推理集群的服務(wù)穩(wěn)定性。

wKgZO2fqEm6ANiufAAAtfole5AE22.webpwKgZPGfqEm6ABPWOAAAytATWCfA30.webp

通過一系列的實驗結(jié)果,我們可以得出如下結(jié)論:

一、良好的模型切分設(shè)計可以大幅提升模型性能,此時無需引入復(fù)雜的RDMA網(wǎng)絡(luò)運維,即可獲得最佳的推理性能體驗,從而獲得最高的投入產(chǎn)出比。

二、在單臺服務(wù)器GPU算力受限,不得不在節(jié)點間進行張量切分時,可以使用RDMA網(wǎng)絡(luò)保證推理模型的服務(wù)性能與穩(wěn)定性。但是引入RDMA帶來性能提升的同時,成本的提升比例也是一致的。大家可以按照實際應(yīng)用場景,考慮多方因素后綜合選擇。

wKgZO2fqEm-ACDe5AAAeYNUAnHM46.webp

中科馭數(shù)的作為國內(nèi)全品種網(wǎng)卡的研發(fā)企業(yè),基于全自研、國產(chǎn)芯片K2-Pro打造的FlexFlow-2200T網(wǎng)卡,可以承擔智算大模型的網(wǎng)絡(luò)底座,為您的智算模型增加一顆“中國芯”。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)卡
    +關(guān)注

    關(guān)注

    4

    文章

    323

    瀏覽量

    27846
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    390

    瀏覽量

    24688
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    772

    瀏覽量

    1326
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進展,特別是自DeepSeekR1發(fā)布后興起的推理時間計算擴展相關(guān)內(nèi)容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發(fā)表于 04-03 12:09 ?304次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    如何使用OpenVINO運行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理
    的頭像 發(fā)表于 03-12 13:45 ?1217次閱讀
    如何使用OpenVINO運行<b class='flag-5'>DeepSeek</b>-R1蒸餾<b class='flag-5'>模型</b>

    合肥市科技局蒞臨中科數(shù)調(diào)研

    近日,合肥市科技局副局長呂波一行來訪中科數(shù)考察調(diào)研。
    的頭像 發(fā)表于 02-27 14:27 ?556次閱讀

    中科數(shù)K2-Pro芯片助力智算中心創(chuàng)新

    以其卓越的網(wǎng)絡(luò)處理能力,成為支撐國產(chǎn)化推理集群應(yīng)用需求的關(guān)鍵。該芯片不僅能夠滿足高性能計算、大數(shù)據(jù)分析等復(fù)雜任務(wù)對網(wǎng)絡(luò)帶寬和延遲的嚴苛要求,還在中科
    的頭像 發(fā)表于 02-19 15:00 ?461次閱讀

    OpenAI O3與DeepSeek R1:推理模型性能深度分析

    OpenAI剛推出的O3和DeepSeek的R1代表了推理模型領(lǐng)域的重大進步。這兩種模型都因在各種基準測試中的出色表現(xiàn)而備受關(guān)注,引發(fā)了人們對人工智能的未來及其對各個行業(yè)的潛在影響的討論。據(jù)我們所知
    的頭像 發(fā)表于 02-18 11:07 ?800次閱讀

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    在 AI 技術(shù)日新月異的當下,新的模型與突破不斷涌現(xiàn)。近期,DeepSeek(深度求索)模型以其卓越性能和親民成本,迅速在全球開發(fā)者圈子里引發(fā)熱議。作為一款強大的語言
    發(fā)表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇

    功能對比: 1. 核心定位差異 維度 DeepSeek-V3 DeepSeek-R1 目標場景 通用型任務(wù)(文本生成、多輪對話等) 復(fù)雜推理與數(shù)學(xué)能力優(yōu)先(如STEM領(lǐng)域) 優(yōu)化方向 平衡性能
    發(fā)表于 02-14 02:08

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    。 據(jù)悉,DeepSeek開源模型在多語言理解與復(fù)雜推理任務(wù)中一直表現(xiàn)出卓越的性能,其V3、R1等系列模型更是備受業(yè)界關(guān)注。而此次摩爾線程所
    的頭像 發(fā)表于 02-06 13:49 ?714次閱讀

    科大訊飛發(fā)布星火深度推理模型X1

    今天,科大訊飛正式發(fā)布星火深度推理模型X1,星火4.0 Turbo底座全面升級,首發(fā)星火語音同傳大模型。
    的頭像 發(fā)表于 01-15 15:54 ?624次閱讀

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學(xué)習技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個專注于增強AI推理
    的頭像 發(fā)表于 01-03 10:42 ?433次閱讀

    中科數(shù)受邀出席華泰證券金融科技峰會

    近日中科數(shù)作為創(chuàng)新生態(tài)伙伴,受邀參與華泰證券在香港舉辦的2024年度金融科技峰會。中科數(shù)創(chuàng)始
    的頭像 發(fā)表于 12-13 15:19 ?554次閱讀

    澎峰科技高性能模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應(yīng)用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領(lǐng)先的智能計算服務(wù)提供商,在2023年11月25日發(fā)
    的頭像 發(fā)表于 09-29 10:14 ?1226次閱讀
    澎峰科技<b class='flag-5'>高性能</b>大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    中科數(shù)云”解決方案入選2024中國云生態(tài)典型應(yīng)用案例

    2024年7月4日,在全球數(shù)字經(jīng)濟大會以“中國云生態(tài)”為主題的云融技術(shù)創(chuàng)新引領(lǐng)論壇上,中科數(shù)憑借其卓越的創(chuàng)新能力和深厚的技術(shù)積累,其“云”高性能
    的頭像 發(fā)表于 08-02 11:30 ?1043次閱讀
    <b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數(shù)</b>“<b class='flag-5'>馭</b>云”解決方案入選2024中國云生態(tài)典型應(yīng)用案例

    中科數(shù):DPU是構(gòu)建高效智算中心基礎(chǔ)設(shè)施的必選項

    日前,在江蘇省未來網(wǎng)絡(luò)創(chuàng)新研究院、網(wǎng)絡(luò)通信與安全紫金山實驗室舉辦的“2024智算網(wǎng)絡(luò)技術(shù)與應(yīng)用創(chuàng)新峰會”上,中科
    的頭像 發(fā)表于 07-08 10:51 ?939次閱讀

    中科數(shù)發(fā)布高性能DPU芯片K2-Pro

    在信息技術(shù)領(lǐng)域,每一次芯片技術(shù)的突破都代表著行業(yè)的一次飛躍。近日,DPU領(lǐng)域的領(lǐng)軍企業(yè)中科數(shù)宣布,成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布,標志著中科
    的頭像 發(fā)表于 06-21 11:41 ?1286次閱讀