女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談DeepSeek核心技術(shù)與應用場景

訊飛開放平臺 ? 來源:訊飛開放平臺 ? 2025-02-18 09:08 ? 次閱讀

DeepSeek的橫空出圈,仿佛重現(xiàn)了兩年前ChatGPT風靡全球的盛況。其開源策略和低成本的模式,正推動人工智能迎來一波新的發(fā)展浪潮。卓越模型能力的背后,DeepSeek在技術(shù)上有哪些創(chuàng)新?它又將如何改變我們的生活和產(chǎn)業(yè)?

2月15日,訊飛開放平臺攜手Datawhale、城西大走廊高聯(lián)會在位于杭州的浙江大學校友企業(yè)總部經(jīng)濟園舉辦了2025年開發(fā)者TALK首站活動。來自訊飛開放平臺以及行業(yè)、研究機構(gòu)的技術(shù)專家們,揭秘DeepSeek核心技術(shù)、分享DeepSeek精調(diào)方法和應用構(gòu)建,為線上線下4000+開發(fā)者帶來了一場干貨滿滿的分享。

全方位模型服務,助力開發(fā)者應用創(chuàng)新

自2022年大模型發(fā)布以來,大模型應用呈現(xiàn)爆發(fā)式增長,逐步邁入“深水區(qū)”,與場景的結(jié)合也愈發(fā)緊密,行業(yè)內(nèi)逐步形成共識:通用模型+專有云模型才能更好地解決場景問題。

目前,大模型應用主要是模型能力+數(shù)據(jù),能力有通用能力與定制能力,數(shù)據(jù)有通用數(shù)據(jù)與個性化數(shù)據(jù)。例如,AI+代碼是典型的“通用能力+通用數(shù)據(jù)能力”簡單組合;AI+會議是“通用能力+個性化數(shù)據(jù)”簡單組合。未來大模型更好地進入企業(yè)一定是定制能力+個性化數(shù)據(jù)的多能力復雜組合。而未來大模型開發(fā)的機會在:模型能力定制化、產(chǎn)品能力復雜化、數(shù)據(jù)能力個性化。訊飛星辰MaaS平臺總監(jiān)張林芳在《訊飛星辰MaaS平臺模型定制到智能體構(gòu)建》主題分享中表示。

應對模型能力定制化需求,訊飛發(fā)布的星辰MaaS平臺,提供包含數(shù)據(jù)構(gòu)建、模型選型、精調(diào)訓練、效果評估、大模型云+端托管以及數(shù)據(jù)回流的成熟精調(diào)流水線,助力開發(fā)者高效完成效果定制,構(gòu)建數(shù)據(jù)飛輪,持續(xù)推進大模型迭代。其中,在模型選型上,星辰MaaS平臺秉承開放理念,支持星火+主流開源的36個模型精調(diào),開放人設(shè)、醫(yī)療等場景模型精調(diào)。近期,已經(jīng)業(yè)界首發(fā)了DeepSeek全系模型精調(diào),推理API限時免費,支持獨享部署,即銷即用。

應對產(chǎn)品能力組合復雜化需要,訊飛發(fā)布了星辰智能體應用開發(fā)平臺。星辰智能體應用開發(fā)平臺以MoM混合應用架構(gòu)為核心,提供從應用開發(fā)到測試、優(yōu)化一整套大模型應用開發(fā)工具鏈。支持訊飛1+N模型,開源優(yōu)質(zhì)DeepSeek模型,和所有微調(diào)模型組合構(gòu)建應用。面對硬件產(chǎn)品接入大模型遇到的業(yè)務需求、開發(fā)技術(shù)棧、軟硬環(huán)境等問題,星辰智能體應用開放平臺提供了專門的SDK開發(fā)框架,讓開發(fā)者專注于硬件產(chǎn)品創(chuàng)新,用最短路徑實現(xiàn)產(chǎn)品成功。

應對數(shù)據(jù)能力個性化需求,訊飛則首發(fā)了混域搜索技術(shù),支持個人私域知識,企業(yè)知識庫以及IT系統(tǒng)私域知識,和互聯(lián)網(wǎng)信息進行統(tǒng)一的搜集分析,形成大模型外掛知識。通過這套技術(shù),知識召回準確率提升30%,長文本知識融合準確率提升40%,句子級知識溯源準確率達90%。

從R1-Zero到R1,揭秘DeepSeek核心技術(shù)

DeepSeek展現(xiàn)出的強大推理能力,讓人震驚的同時,也讓許多開發(fā)者對其背后的技術(shù)細節(jié)充滿興趣。它在技術(shù)上有哪些突破?哪些是站在前人的肩膀上優(yōu)化的?哪些是自己的原創(chuàng)創(chuàng)新?在現(xiàn)場,Datawhale Hugging LLM開源項目負責人長琴深度剖析了DeepSeek的核心技術(shù)點,期望能為開發(fā)者研究大模型帶來啟發(fā)。

首先是基于純規(guī)則強化學習的DeepSeek-R1-Zero,不僅在訓練過程中展現(xiàn)出的思考和自我反思能力,使語言模型更接近人類的思維方式,而且效果還不錯。當然,瑕疵是語言混合和可讀性不友好。緊跟著就是兩個問題:少量高質(zhì)量數(shù)據(jù)SFT后能否讓后續(xù)的RL效果進一步變好?模型能否同時兼容推理和通用模式?R1通過先用少量高質(zhì)量數(shù)據(jù)SFT模型作為R1-Zero的起點(冷啟動),然后使用R1-Zero的RL方法(增加了語言一致性,讓結(jié)果更可讀)訓練得到的模型來生成高質(zhì)量數(shù)據(jù),然后再做SFT和對齊,使得模型不僅在推理任務上表現(xiàn)出色,在非推理的常規(guī)任務上也取得了優(yōu)異的效果。

DeepSeek-R1的相關(guān)技術(shù)研究也給開發(fā)者帶來諸多啟示。比如Oat-Zero的相關(guān)研究發(fā)現(xiàn)強化學習(RL)能將Base的表面自我反思轉(zhuǎn)化為有效自我反思,但是長度并不一定增加,而且Base模型也會Aha Moment;再比如DeepScaleR的相關(guān)研究中發(fā)現(xiàn)強化學習(RL) 縮放也可以表現(xiàn)在小模型 (1.5B) 中,高質(zhì)量的SFT+RL結(jié)合能達到更好效果;再比如LIMO、s1等相關(guān)研究中發(fā)現(xiàn) 少量SFT(1000條)同樣可以激活推理能力;以及模型越大越新越好、無論Instruct還是Base模型都可以驗證R1-Zero等。長琴在分享中提到。

AI驅(qū)動科研范式變革,開啟新的大航海時代

從藥物研發(fā)到農(nóng)業(yè)育種,從氣象預測到海洋智能預報,AI正在改變?nèi)祟愡M行科學研究的方式。2024年的諾貝爾物理學獎、化學獎都頒給AI領(lǐng)域,再次將AI推到了科學舞臺的中央,標志著AI在科學研究中的重要地位得到了認可。

AI For Science的典型案例就是蛋白質(zhì)折疊模型AlphaFold。傳統(tǒng)方法每年只能解析少量蛋白質(zhì)結(jié)構(gòu),Alphafold已經(jīng)預測了超過2億種蛋白質(zhì)結(jié)構(gòu),推動了生命科學的巨大進步,已擁有來自190個國家的200多萬用戶。以此模型為基礎(chǔ),對于科研設(shè)備、科學人員、科學數(shù)據(jù)和科學流程都有很大的幫助。之江實驗室助理研究員張驥在分享中舉例說。

AI正在開啟人類科學發(fā)展新的大航海時代。張驥認為,在AI驅(qū)動科學范式變革方面,模型、數(shù)據(jù)、算力是關(guān)鍵因素。

在科研領(lǐng)域,中國科學院文獻情報中心與科大訊飛股份有限公司共同研發(fā)的基于科技文獻大模型的智能知識服務平臺——星火科研助手,幫助研究人員對文獻進行深度解讀、提煉,提升科研效率。累計服務科研用戶9.3萬人,功能調(diào)用次數(shù)240萬次+,用戶覆蓋全國1300多所高校。用戶可在訊飛星火APP/網(wǎng)頁端搜索“星火科研助手”體驗。

融合行業(yè)場景,生成式AI驅(qū)動機器人行業(yè)變革

陸地、隧道、天上、水里,各類形態(tài)的智能機器人正在不同行業(yè)應用,尤其是在工業(yè)領(lǐng)域,機器人不僅能保障人員安全,還可大大提高工作的效率和準確性。生成式AI技術(shù)的出現(xiàn)也為機器人行業(yè)帶來了根本性變化。

從ANI(狹義人工智能)和AGI(通用人工智能)的區(qū)別出發(fā),申昊科技算法工程師鄭程睿介紹了公司在故障檢測、數(shù)字孿生、醫(yī)院查房機器人和人形機器人四款應用上,進行的大模型技術(shù)探索。以檢測輸電塔是否有鳥巢為例,因為物理場景數(shù)據(jù)很稀少,運用無人機逐個進行拍照成本過高,而利用少量圖片訓練Stable Diffusion和LoRA模型生成多樣化的圖像,則可以做到降本增效。

對于具身智能未來的發(fā)展,鄭程睿認為,當前具身智能的發(fā)展仍處于初級階段,未來具身智能應該是兩種大模型:視覺語言動作模型和視覺語言導航模型,也可以與深度思考推理模型結(jié)合。

除了精彩的演講之外,本次活動還設(shè)置了AI面對面交流環(huán)節(jié)。與會開發(fā)者以分組的形式圍繞“DeepSeek的應用創(chuàng)新、大模型未來發(fā)展趨勢”等問題,與分享嘉賓進行了討論。

DeepSeek的爆火不僅從技術(shù)到產(chǎn)業(yè)帶來了一場前所未有的技術(shù)變革,也為開發(fā)者帶來了前所未有的機遇。現(xiàn)在,進入訊飛星辰MaaS平臺官網(wǎng),通過DeepSeek精調(diào)服務,開發(fā)者即可在極短時間內(nèi)(最快15分鐘)以超低成本(最低僅需數(shù)元)打造專屬定制模型,創(chuàng)建新的AI應用。

致力于通過前沿技術(shù)分享、優(yōu)秀項目分享推介、面對面討論,為來自企業(yè)、高校、科研院所的開發(fā)者提供沉浸式學習與交流平臺。自2023年11月22日開啟第一站以來,開發(fā)者TALK在深圳、武漢、南京、成都等地留下足跡,鏈接了上千名開發(fā)者,幫助他們將想法變成了更多的創(chuàng)意和落地案例,推動人工智能產(chǎn)業(yè)繁榮。

AI技術(shù)的發(fā)展日新月異,2025年,開發(fā)者TALK將繼續(xù)舉辦多形式活動,聆聽開發(fā)者需求,幫助開發(fā)者便捷地將大模型技術(shù)應用在實際業(yè)務中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 訊飛開放平臺
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    11668
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3030

    瀏覽量

    3832
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    777

    瀏覽量

    1358

原文標題:揭秘DeepSeek核心技術(shù)與應用構(gòu)建 | 開發(fā)者TALK開年首站落地杭州

文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    科通技術(shù)推出DeepSeek+AI芯片全場景方案

    2025年,隨著DeepSeek新版本的開源,AI技術(shù)掀起了全球普及的浪潮。在這股浪潮中,AI芯片作為關(guān)鍵算力支撐,其應用場景不斷拓展,從云端到本地,再到終端設(shè)備,AI芯片無處不在。深圳市科通
    的頭像 發(fā)表于 03-24 10:33 ?568次閱讀

    取樣示波器的技術(shù)原理和應用場景

    取樣示波器,也稱為采樣示波器,是一種重要的電子測量儀器,其技術(shù)原理和應用場景可以歸納如下:技術(shù)原理取樣示波器的根本原理是利用等效取樣技術(shù),將周期性高頻(或高速)信號變換為與原來信號波形
    發(fā)表于 03-12 14:34

    DeepSeek的100個應用場景

    的訓練成本實現(xiàn)了數(shù)學、編程等核心領(lǐng)域比肩GPT-o1的卓越性能。短短幾天內(nèi),DeepSeek迅速登頂中美兩區(qū)蘋果應用市場免費榜榜單,亞馬遜、微軟、阿里云、百度智能云、三大電信運營商等公司先后宣布接入。 據(jù)
    的頭像 發(fā)表于 03-05 11:28 ?879次閱讀

    敏捷合成器的技術(shù)原理和應用場景

    敏捷合成器,作為一種高性能的信號發(fā)生器,其技術(shù)原理和應用場景值得深入探討。技術(shù)原理敏捷合成器的技術(shù)原理主要基于先進的頻率合成技術(shù)和數(shù)字信號處
    發(fā)表于 02-20 15:25

    直接數(shù)字式頻譜分析儀的技術(shù)原理和應用場景

    直接數(shù)字式頻譜分析儀的技術(shù)原理和應用場景如下:一、技術(shù)原理直接數(shù)字式頻譜分析儀采用數(shù)字信號處理技術(shù),其核心技術(shù)在于對輸入信號進行離散傅里葉變
    發(fā)表于 02-17 15:00

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個不同定位的大模型,其核心差異主要體現(xiàn)在目標場景
    發(fā)表于 02-14 02:08

    時域反射計的技術(shù)原理和應用場景

    時域反射計(TDR,Time Domain Reflectometer)的技術(shù)原理和應用場景可以歸納如下:技術(shù)原理時域反射計的基本原理是利用反射波來測量電路或傳輸線中的阻抗變化。其核心
    發(fā)表于 02-11 14:39

    深入探討DeepSeek大模型的核心技術(shù)

    導讀 本文深入探討了DeepSeek大模型的核心技術(shù),從公司背景、模型能力、訓推成本到核心技術(shù)細節(jié)進行了全面分析。 ? 一、關(guān)于DeepSeek公司及其大模型 1.1 公司概況
    的頭像 發(fā)表于 02-10 10:49 ?1229次閱讀
    深入探討<b class='flag-5'>DeepSeek</b>大模型的<b class='flag-5'>核心技術(shù)</b>

    倍頻器的技術(shù)原理和應用場景

    倍頻器是一種用于將輸入信號的頻率倍增的電子設(shè)備,以下是關(guān)于倍頻器的技術(shù)原理和應用場景的詳細解釋:技術(shù)原理倍頻器的技術(shù)原理主要基于非線性元件(如二極管、晶體管等)的特性和頻率變換
    發(fā)表于 11-29 14:49

    系統(tǒng)放大器的技術(shù)原理和應用場景

    系統(tǒng)放大器是一種重要的電子設(shè)備,其技術(shù)原理和應用場景都具有一定的專業(yè)性和廣泛性。以下是對系統(tǒng)放大器的技術(shù)原理和應用場景的詳細介紹:一、技術(shù)
    發(fā)表于 11-18 14:46

    實時示波器的技術(shù)原理和應用場景

    實時示波器是一種高性能的電子測量儀器,其技術(shù)原理和應用場景對于電子工程和通信技術(shù)領(lǐng)域具有重要意義。以下是對實時示波器的技術(shù)原理和應用場景的詳
    發(fā)表于 10-23 14:22

    源測量單元設(shè)備的技術(shù)原理和應用場景

    源測量單元(SMU)設(shè)備是一種集成了精密電源(PPS)和高性能數(shù)字萬用表(DMM)功能的測試設(shè)備。以下是對其技術(shù)原理和應用場景的詳細解析:一、技術(shù)原理 集成功能: SMU在單個儀器中集成了電源
    發(fā)表于 10-22 11:10

    超聲波測厚儀的技術(shù)原理和應用場景

    超聲波測厚儀的技術(shù)原理和應用場景詳細如下:技術(shù)原理超聲波測厚儀利用超聲波脈沖反射原理來測量材料的厚度。具體工作原理如下: 發(fā)射超聲波脈沖:測厚儀的探頭(也稱為換能器)向被測物體發(fā)射一束高頻超聲波脈沖
    發(fā)表于 09-27 15:06

    NFC協(xié)議分析儀的技術(shù)原理和應用場景

    NFC協(xié)議分析儀的技術(shù)原理和應用場景可以詳細闡述如下:技術(shù)原理NFC(Near Field Communication,近場通信)協(xié)議分析儀是一種用于分析NFC通信協(xié)議和性能的專業(yè)設(shè)備。其技術(shù)
    發(fā)表于 09-25 14:45

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應用場景

    關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應用場景淺談如下: 優(yōu)勢 異構(gòu)計算能力 : 異構(gòu)雙核設(shè)計結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性,能夠針對特定
    發(fā)表于 08-31 08:32