繼 DeepSeek 全套蒸餾模型以及 V3 版本上線后,經(jīng)過 Gitee AI 和沐曦團(tuán)隊(duì)兩天緊鑼密鼓的適配和機(jī)器籌備,DeepSeek-R1全尺寸版本現(xiàn)在已上線 Gitee AI 供開發(fā)者們使用。
截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千問蒸餾模型均實(shí)現(xiàn)了在國產(chǎn)沐曦訓(xùn)推一體 GPU 上成功運(yùn)行,且均已上線 Gitee AI 開放使用體驗(yàn),國內(nèi) AI 全鏈路自主技術(shù)閉環(huán)踏出了巨大且關(guān)鍵的一步。在此特別感謝沐曦團(tuán)隊(duì)的技術(shù)支持以及來自上海加佳的算力支撐。
三大「殺手锏」成就國產(chǎn)模型新高度
DeepSeek-R1的性能相信大家已經(jīng)充分領(lǐng)教了,其「殺手锏」之一就是開放了思維鏈輸出過程,用戶可以看到模型進(jìn)行推理時(shí)的每一步邏輯,告別了傳統(tǒng)大模型的「黑盒」問題。
DeepSeek-R1另一個(gè)「殺手锏」則是在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI-o1 正式版。
DeepSeek-R1的第三個(gè)「殺手锏」無疑是開放的許可證和用戶協(xié)議,模型開源 License 統(tǒng)一使用 MIT,完全開源,不限制商用,無需申請。
同時(shí),產(chǎn)品協(xié)議明確可「模型蒸餾」,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
這三大「殺手锏」使得DeepSeek-R1不但擁有極高的透明度和易用性,也為開發(fā)者提供了更靈活的訓(xùn)練和應(yīng)用方式,極大地加速了模型的落地與普及,迅速讓國產(chǎn)模型在世界 AI 競爭格局中登上了新的制高點(diǎn)。
沐曦 GPU+曦源一號萬卡集群=國產(chǎn)算力新標(biāo)桿
當(dāng)然,想要實(shí)現(xiàn)技術(shù)自主與獨(dú)立,僅有模型的領(lǐng)先還不夠,關(guān)鍵在于 AI 模型對國產(chǎn) GPU 的深度適配與高效運(yùn)行。
唯有 DeepSeek-R1 能夠在國產(chǎn) GPU 上穩(wěn)定運(yùn)行,中國 AI 技術(shù)體系才能真正實(shí)現(xiàn)自主可控的完整閉環(huán)。
本次DeepSeek-R1部署采用了沐曦訓(xùn)推一體 GPU,使用完全自主研發(fā)的 GPU IP,擁有完整的知識產(chǎn)權(quán),并具備強(qiáng)大的多精度混合計(jì)算能力及高帶寬顯存支持。同時(shí),沐曦產(chǎn)品搭載先進(jìn)的時(shí)空互聯(lián)技術(shù)和全球兼容的 MXMACA 軟件棧,可廣泛應(yīng)用于智能、通用計(jì)算和數(shù)據(jù)處理等場景。
此外,由上海加佳智云數(shù)字科技有限公司運(yùn)營的曦源一號國產(chǎn)替代萬卡集群正以其卓越的性能為本次部署以及各類 AI 平臺、AI 模型及 AI 應(yīng)用提供強(qiáng)大的算力支持。
曦源一號國產(chǎn)替代算力集群是基于沐曦高性能 GPU 加速卡所構(gòu)建的一個(gè)開放、標(biāo)準(zhǔn)、高效的計(jì)算架構(gòu),有效促進(jìn)了計(jì)算資源、數(shù)據(jù)資源與智能服務(wù)的全面整合。這種創(chuàng)新不僅提升了整體性能,也在 AI 實(shí)時(shí)推理、大規(guī)模模型訓(xùn)練等眾多領(lǐng)域展現(xiàn)出巨大的潛力,從而滿足了目前急需高效、穩(wěn)定計(jì)算能力的國內(nèi)市場。
Gitee AI——模型 API 新選擇
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應(yīng)用為核心功能與服務(wù),致力于讓開發(fā)者輕松構(gòu)建和部署 AI 應(yīng)用,為企業(yè)客戶提供更加智能、高效的 AI 應(yīng)用解決方案。
Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識別、語音生成、向量與重排模型、代碼生成等 9 種類型共 54 個(gè)大模型的 API 使用。通過購買模型資源包,即可通過極低的價(jià)格即可盡享眾多主流模型。
點(diǎn)擊文末閱讀原文訪問 Gitee AI,體驗(yàn)基于基于沐曦曦云 GPU 及曦源一號國產(chǎn)替代算力集群的DeepSeek-R1,使用 100% 國產(chǎn) AI 開發(fā)應(yīng)用吧!
-
gpu
+關(guān)注
關(guān)注
28文章
4938瀏覽量
131193 -
AI
+關(guān)注
關(guān)注
88文章
35065瀏覽量
279333 -
模型
+關(guān)注
關(guān)注
1文章
3517瀏覽量
50383 -
DeepSeek
+關(guān)注
關(guān)注
1文章
797瀏覽量
1717
原文標(biāo)題:繼V3之后,沐曦GPU再完成DeepSeek-R1全尺寸適配,已上線Gitee AI
文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南
Infinix AI接入DeepSeek-R1滿血版
聯(lián)想moto AI手機(jī)接入DeepSeek-R1
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
廣和通支持DeepSeek-R1蒸餾模型
Gitee AI 聯(lián)合沐曦首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費(fèi)體驗(yàn)!

AIBOX 全系產(chǎn)品已適配 DeepSeek-R1

DeepSeek-R1本地部署指南,開啟你的AI探索之旅

軟通動力天璇MaaS融合DeepSeek-R1,引領(lǐng)企業(yè)智能化轉(zhuǎn)型
deepin UOS AI接入DeepSeek-R1模型
芯動力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!

原生鴻蒙版小藝App上架DeepSeek-R1, AI智慧體驗(yàn)更豐富
中軟國際JointPilot平臺上線DeepSeek-R1模型
對標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

評論