女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

何必把DeepSeek推上神壇?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-02-10 19:54 ? 次閱讀
wKgZPGep6NWASWffAAmo07fSF90130.jpg

過年期間沉迷休息,心懷愧疚地無視了讀者催我們寫DeepSeek的要求。后來我發現,這催更不僅適用于科技博主,比如在一個跟AI毫無關系的搞笑博主評論區里,我看見有網友說,“你怎么還不講DeepSeek?他血洗美國股市,干碎了美國人的幻想。那些歐美科技公司全都坐不住了”。

接下來這種“熱情”愈演愈烈。什么“科技巨頭全報廢了”“AGI馬上實現”“普通人再不學DeepSeek就晚了”,種種言論層出不窮。甚至還有DeepSeek受到境外大規模網絡攻擊,各大科技公司頂尖高手聯手隱跡江湖的中國紅客出手相救的爽文劇情。

wKgZO2ep6NaAApeuAABFKed6NRE207.jpg

輿論場到這里愈發離譜了起來。談到DeepSeek,我們好像會自動陷入某種彌散性的狂熱情緒。其中當然有DeepSeek足夠出色的原因,有近幾年AI大熱的加持,但很難否認的是,其中也有地緣因素的推動。很多人迫切需要一個“歪果仁怕了、服了”的故事,在科技領域尤其如此。

為了迎合這種情緒,媒體與公眾人物傾向于推波助瀾。比如將對DeepSeek的討論,推到哲學、國運、歷史走向的高度。而這些討論又會在流量的折射與層層斷章取義之下被無盡放大,很快讓一款AI模型承受了它本不該承受的地位、責任與期待。這就是所謂的“推上神壇”。

但神壇之上風景并不好。因為以往經驗提醒我們,往往下一步就是“傷仲永”“泡沫破裂”等輿論反噬。對于初露鋒芒的DeepSeek與研發團隊來說,這種走向應該是弊大于利的。

因此我們想要討論一下,目前階段可以基于哪些共識來客觀討論DeepSeek?;蛘哒f,不妨試著拆掉輿論神壇,還原一個更真實也更樸素的DeepSeek。

wKgZPGep6NaAYrqkAAIsj228rh8111.jpg

不妨先釋放一個“爆論”。那就是跟社交媒體發散的觀點截然不同,DeepSeek其實并沒有完成從0到1的核心技術突破。

DeepSeek大火之后,其研發團隊與科技產業相關人士都在討論中國AI不能只是跟隨,必須完成從0到1。這個觀點絕對正確,但目前的DeepSeek可能還不能成為這個觀點的作證。

所謂核心技術突破,應該是主要技術路徑的變化,或者達成效果的巨大升級。而DeepSeek目前最讓人經驗的技術能力,一個是R1模型帶火的思維鏈推理過程,另一個是其聯網檢索的RAG效果表現出色。

wKgZO2ep6NaAaZTcAABroKnRXeg674.jpg

但這兩條技術路徑都不是DeepSeek開創的。思維鏈的興起一般認為是OpenAI發布的o1模型。去年9月o1模型公布后,全球主流大模型紛紛跟進了思維鏈、推理大模型等能力。各家名稱不同,但整體技術路線是非常一致的。DeepSeek確實把思維鏈的過程更完整、詳細展示了出來,但其實也很容易看到其中大模型幻覺還很嚴重。

而在聯網檢索方面,其他廠商也早有布局,也就是所謂的RAG檢索-增強-生成機制。這項技術最開始是為了解決大模型不具備實時信息的問題,并且幫助矯正大模型幻覺。早在2023年,百度發布文心一言時,RAG就已經是其核心能力的組成部分。

但要注意的是,沒有從0到1的創新,不等于沒有創新。DeepSeek在模型能力的優化上做了大量開拓性工作,比如通過GRPO算法讓模型更加高效?;蛟S可以說,DeepSeek集成了業界主流的,被驗證過的技術路線。在其基礎上完成了模型優化、能力加強與用戶體驗升級。

我們總是渴望從0到1,總是期待石破天驚。但客觀來看,第一步和第一萬步,邁出的距離是一樣的。

wKgZPGep6NaACac5AAHyAff_JTM092.jpg

那么,DeepSeek真正引發全球關注的價值在哪里?在短短一個春節的發酵之后,可能很多人都忘記了它最早出圈的原因是通過軟件和架構創新,用非常低的算力成本完成了DeepSeek-V3模型的訓練。

DeepSeek-V3是我們今天用到的R1模型的基礎模型。在研發團隊發表的論文中,可以看到其僅僅使用了550萬美元的算力訓練成本就完成了6710億參數大模型的訓練。即使這項統計僅僅局限于基礎模型訓練的算力成本這一項,沒有包含后續應用模型的強化學習、模型推理,以及人才成本、綜合成本等項目,但也是毫無疑問顛覆了大模型訓練的主流成本模型。

而最終DeepSeek實現的效果,也基本達到了o1為代表的主流大模型水平。雖然在模型效果上很難說有全面的超越,但其確實以軟件算法的革新實現了硬件成本的下降。讓低成本模型的效果不差于高成本,讓開源模型的效果追趕閉源模型。

而DeepSeek“降低AI算力成本”的突破,又恰好發生在全球主流AI玩家囤積高端GPU,以此筑造產業護城河,以及美國對中國禁售高端AI芯片,希望以此打壓中國AI的關鍵節點上。于是也就有了DeepSeek實現AI民主化,甚至助力打破地緣科技壟斷的意味,從而產生了一款中國AI大模型讓整個美國股市遭遇震蕩的戲劇性一幕。

DeepSeek實現的訓練效率提升與訓練成本下降,在特殊的產業環境與國際環境下造成了連鎖反應。但問題是很多平時不關注AI的朋友,可能并不知道AI大模型算力越大效果越好的Scaling Laws,也不知道算力壟斷和禁售的背景信息,只知道短視頻上說DeepSeek橫空出世,歪果仁都慌了、怕了。這種缺乏前因后果的聯想,給DeepSeek憑空造出了一座不應屬于它的神壇。

推而廣之,我們很多人都喜歡那些天才式的、戲劇化的創新。但在現實中,往往只有通過工程化能力,不斷調優,降本,提效,技術創新才有應用和普及的可能。

比如我們都知道愛迪生發明了電燈,但容易忽略大規模電網實現了電力成本的極大下降。如果每家都要自己發電,那世界將一片漆黑。

“我們把成本打下來了?!?/p>

這句有點荒誕、俗套,略帶反諷意味的話,其實才是中國產業化能力的縮影。

我們也不妨大大方方承認,包括DeepSeek在內的中國AI,在未來很長一段時間里最擅長的就是把成本給狠狠打下來。

wKgZO2ep6NeASpfQAAJVZY9KZJ4664.jpg

DeepSeek爆火之后,很多人都說這是技術的巨大勝利。預言AI的崛起會讓人文學科和人文工作喪失價值。甚至“DeepSeek來了,學文科還有意義嗎?”登上了熱搜。

但如果我們多使用DeepSeek,仔細分析它與其他模型的區別,會發現一個相反的觀點:DeepSeek恰好證明了文科與人文能力,在AI時代有多么的重要。

我們隨機問一些人,對DeepSeek的使用體驗是怎樣的。他們應該會說跟DeepSeek對話感覺更有人味。

但這種人味,在很大程度上并不是理解、推理等AI技術層面的“人味”,而是模型在對話過程中展露出來了大量的幽默感、網感,以及更加符合年輕群體的對話習慣。還有就是DeepSeek具有相對更精妙的修辭能力,優美的文筆,還有不錯的綜合人文素養。

wKgZPGep6NeAL7h3AAKEqmPnPlo806.jpg

這些能力,讓DeepSeek更貼近年輕用戶的對話習慣和審美需求,并且能夠給出更有話題度和傳播度的回答。但問題是,這些能力其實都與技術的關系不大,而是很大程度上與訓練語料的選取等人文能力緊密相關。

比如說,你讓DeepSeek寫首詩,它能夠寫出文藝青年熱愛的語調與修辭。但其他主流國內大模型,也能寫得平仄工整、辭藻華麗,但一眼看去就是酷似打油詩的“老干體”。

再比如,讓DeepSeek預測一些未來趨勢之類的問題,它的回答會特別類似網絡科幻小說。雖然經不起推敲,但就是能讓年輕人有種非常厲害,特別燃的感覺。

這些優點的來源不是技術,而是在于研發團隊的年輕化、高審美,并且重視模型訓練過程中的人文要素。反觀很多主流大模型,由于最終聽取匯報的領導層普遍是大于45歲,缺乏人文學科背景的中年男士,最終導致大模型對話也是班味十足,打起官腔來一套又一套。與其說年輕人在支持DeepSeek,不如說年輕人在支持自己的話語權和審美權。

順便一提,DeepSeek的另一個人文優勢,是它目前還有些“百無禁忌”。然而監管的鐵拳雖遲但到,大家不必對AI的犀利和大膽有任何幻想。

DeepSeek以一種很巧妙的方式,實現了用戶對話體驗更好,傳播效果更優秀。這些在技術層面之外,或許能夠引起AI公司對產品體驗的反思,以及對人文能力的重視。

如果我們狂吹DeepSeek的技術,導致對其人文體驗的忽略,那其實也挺可惜的。

wKgZO2ep6NiAX1tWAAG-h4aLzjk183.jpg

綜合以上這些側面,我們可以拼湊出一個比較完整,且不帶神圣光暈效果的DeepSeek:

它是一次綜合的突破。這種突破由技術創新,人文素養、開源和低成本策略等要素所構成,并且在特殊的產業周期與國際環境背景下被發酵。

DeepSeek不是石破天驚的技術革命,但它足夠成熟,足夠有新意。這也在某種程度上解釋了,為什么歐美的AI大佬與專家,對其比較一致的觀點是“令人印象深刻”。

DeepSeek沒有一步登天,我們也不必幻想一步登天。

它就是前進了一大步,而我們也足可為邁出了這一步而自信和驕傲。

我也十分反對中國只有DeepSeek的言論。事實上,中國有清晰的AI產業格局,有堅實的自主化AI軟硬件體系,有數十萬AI開發者,有非常積極的AI政策導向。這些都是更多DeepSeek的土壤。有這些因素在,我十分篤定地認為會有更多DeepSeek出現在這里。直到AI工業革命的開啟,直到AGI的曙光。

何不把DeepSeek帶下神壇?理性從容地看待它,用好它,用好中國AI事業的一切造物,才是AI在中國真正成熟的表現。

王陽明說,山高萬仞,只登一步。DeepSeek這一步有它的意義,邁出這一步后,也不妨停下來聽聽山風,淺斟低唱一番。但也要清醒地知道,我們還在山間。

休息好了,高興夠了,也只有一件事要做。那就是邁出下一步。

wKgZO2ep6NiAOeAPAAHwPOoTG_w023.jpg
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34155

    瀏覽量

    275326
  • Agi
    Agi
    +關注

    關注

    0

    文章

    91

    瀏覽量

    10424
  • 大模型
    +關注

    關注

    2

    文章

    3021

    瀏覽量

    3815
  • DeepSeek
    +關注

    關注

    1

    文章

    772

    瀏覽量

    1322
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    DeepSeek + MCP打造高效研報生成神器

    DeepSeek
    jf_23871869
    發布于 :2025年04月07日 17:09:41

    必學!使用DeepSeek-V3-0324版快速生成概念演示動畫

    DeepSeek
    jf_23871869
    發布于 :2025年03月31日 11:03:25

    【幸狐Omni3576邊緣計算套件試用體驗】使用rkllm運行DeepSeek的服務模式體驗

    一、前言: 繼之前rkllm方式的大模型案例:【幸狐Omni3576邊緣計算套件試用體驗】開發板基礎體驗:大模型和推流測試 跑起來之后,一直想著搞一搞server模式,然后翻閱文檔中發現官方已經
    發表于 03-24 09:22

    【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試

    【幸狐 Omni3576 邊緣計算套件測評】DeepSeek 部署及測試 本文介紹了幸狐 Omni3576 邊緣計算套件實現 DeepSeek 部署及測試的相關流程,包括模型介紹、部署方案
    發表于 03-21 19:31

    DevEco Studio 聯合小藝接入 DeepSeek,步驟更簡單開發鴻蒙更專業

    隨著小藝接入了 DeepSeek,智能體的問答變得更加絲滑流暢,讓人不禁想到鴻蒙原生應用開發如果接入這個智能體會產生什么樣的效果?確實,當我們負責開發原生鴻蒙應用的 DevEco Studio
    發表于 03-13 15:11

    何必舍近求遠 計算工廠幫你一鍵部署DeepSeek云主機

    DeepSeek作為人工智能領域的新星,正以其驚人的性能和廣泛的應用場景迅速走紅。其火爆的現狀得益于多項關鍵技術的突破,如強化學習框架的采用、高效的顯存占用優化以及極低的訓練成本。這些技術優勢使得
    的頭像 發表于 03-10 14:58 ?195次閱讀
    <b class='flag-5'>何必</b>舍近求遠 計算工廠幫你一鍵部署<b class='flag-5'>DeepSeek</b>云主機

    HarmonyOS NEXT開發實戰:DevEco Studio中DeepSeek的使用

    隨著HarmonyOS Next的持續發布,鴻蒙系統對AI能力的支持顯著增強。本文將深入探討如何在鴻蒙應用中集成AI模型,結合接入DeepSeek,一起來探索開發鴻蒙原生應用的更多可能吧! 第一步
    發表于 03-07 14:56

    聆思CSK6大模型語音開發板接入DeepSeek資料匯總(包含深度求索/火山引擎/硅基流動華為昇騰滿血版)

    本帖最后由 jf_40317719 于 2025-3-6 21:20 編輯 近期也有不少開發者想把自己的智能硬件接入DeepSeek大模型,本篇就以聆思CSK6大模型開發板接入DeepSeek
    發表于 03-06 17:02

    北京大學兩部 DeepSeek 秘籍新出爐?。ǜ饺螺d)

    直接“ AI 當人看”:* 我要(做)XX,要給 XX 用,希望達到 XX 效果,但擔心 XX 問題 此外,我們還可以學會 “反向 PUA” DeepSeek ,讓它通過自己的思考邏輯,輸出更好
    發表于 02-27 17:57

    RK3588開發板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國產AI大數據模型的代表,憑借其卓越的推理能力和高效的文本生成技術,在全球人工智能領域引發廣泛關注。DeepSeek-R1作為該系列最新迭代版本,實現了長文本處理效能躍遷、多模態
    發表于 02-27 16:45

    鴻蒙原生應用開發也可以使用DeepSeek

    近期DeepSeek火爆全球,那一樣很火的開發鴻蒙原生應用的DevEco Studio如果它接入,會發生什么“化學反應”呢?下面我們將詳細分享如何在DevEco Studio中利用CodeGPT
    發表于 02-20 18:06

    DeepSeek助力!深圳首批“AI公務員”上崗

    DeepSeek
    jf_15747056
    發布于 :2025年02月18日 17:37:43

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個不同定位的大模型,其核心差異主要體現在目標場景、能力側重和技術優化方向上。以下是二者的實質性
    發表于 02-14 02:08

    【實測】用全志A733平板搭建一個端側Deepseek算力平臺

    ? 隨著DeepSeek 的蒸餾技術的橫空出世,端側 SoC 芯片上運行大模型成為可能。那么端側芯片跑大模型的效果如何呢?本文將在全志 A733 芯片平臺上部署一個 DeepSeek-R1:1.5B
    發表于 02-13 10:19

    deepseek國產芯片加速 DeepSeek的國產AI芯片天團

    遙想兩年前,ChatGPT給了世界一記AI沖擊,而DeepSeek無疑是第二記沖擊。我們不僅對DeepSeek強勁的性能所震撼,也讓遠在大洋彼岸的OpenAI、谷歌、META等一眾玩家感受到莫大壓力
    的頭像 發表于 02-10 15:07 ?3295次閱讀
    <b class='flag-5'>deepseek</b>國產芯片加速 <b class='flag-5'>DeepSeek</b>的國產AI芯片天團