韩国感人电影推荐,在线看男女AV免费观看,天堂A∨欧美AV亚洲AV在

過年期間沉迷休息，心懷愧疚地無視了讀者催我們寫DeepSeek的要求。后來我發現，這催更不僅適用于科技博主，比如在一個跟AI毫無關系的搞笑博主評論區里，我看見有網友說，“你怎么還不講DeepSeek？他血洗美國股市，干碎了美國人的幻想。那些歐美科技公司全都坐不住了”。

接下來這種“熱情”愈演愈烈。什么“科技巨頭全報廢了”“AGI馬上實現”“普通人再不學DeepSeek就晚了”，種種言論層出不窮。甚至還有DeepSeek受到境外大規模網絡攻擊，各大科技公司頂尖高手聯手隱跡江湖的中國紅客出手相救的爽文劇情。

輿論場到這里愈發離譜了起來。談到DeepSeek，我們好像會自動陷入某種彌散性的狂熱情緒。其中當然有DeepSeek足夠出色的原因，有近幾年AI大熱的加持，但很難否認的是，其中也有地緣因素的推動。很多人迫切需要一個“歪果仁怕了、服了”的故事，在科技領域尤其如此。

為了迎合這種情緒，媒體與公眾人物傾向于推波助瀾。比如將對DeepSeek的討論，推到哲學、國運、歷史走向的高度。而這些討論又會在流量的折射與層層斷章取義之下被無盡放大，很快讓一款AI模型承受了它本不該承受的地位、責任與期待。這就是所謂的“推上神壇”。

但神壇之上風景并不好。因為以往經驗提醒我們，往往下一步就是“傷仲永”“泡沫破裂”等輿論反噬。對于初露鋒芒的DeepSeek與研發團隊來說，這種走向應該是弊大于利的。

因此我們想要討論一下，目前階段可以基于哪些共識來客觀討論DeepSeek?；蛘哒f，不妨試著拆掉輿論神壇，還原一個更真實也更樸素的DeepSeek。

不妨先釋放一個“爆論”。那就是跟社交媒體發散的觀點截然不同，DeepSeek其實并沒有完成從0到1的核心技術突破。

DeepSeek大火之后，其研發團隊與科技產業相關人士都在討論中國AI不能只是跟隨，必須完成從0到1。這個觀點絕對正確，但目前的DeepSeek可能還不能成為這個觀點的作證。

所謂核心技術突破，應該是主要技術路徑的變化，或者達成效果的巨大升級。而DeepSeek目前最讓人經驗的技術能力，一個是R1模型帶火的思維鏈推理過程，另一個是其聯網檢索的RAG效果表現出色。

但這兩條技術路徑都不是DeepSeek開創的。思維鏈的興起一般認為是OpenAI發布的o1模型。去年9月o1模型公布后，全球主流大模型紛紛跟進了思維鏈、推理大模型等能力。各家名稱不同，但整體技術路線是非常一致的。DeepSeek確實把思維鏈的過程更完整、詳細展示了出來，但其實也很容易看到其中大模型幻覺還很嚴重。

而在聯網檢索方面，其他廠商也早有布局，也就是所謂的RAG檢索－增強－生成機制。這項技術最開始是為了解決大模型不具備實時信息的問題，并且幫助矯正大模型幻覺。早在2023年，百度發布文心一言時，RAG就已經是其核心能力的組成部分。

但要注意的是，沒有從0到1的創新，不等于沒有創新。DeepSeek在模型能力的優化上做了大量開拓性工作，比如通過GRPO算法讓模型更加高效?；蛟S可以說，DeepSeek集成了業界主流的，被驗證過的技術路線。在其基礎上完成了模型優化、能力加強與用戶體驗升級。

我們總是渴望從0到1，總是期待石破天驚。但客觀來看，第一步和第一萬步，邁出的距離是一樣的。

那么，DeepSeek真正引發全球關注的價值在哪里？在短短一個春節的發酵之后，可能很多人都忘記了它最早出圈的原因是通過軟件和架構創新，用非常低的算力成本完成了DeepSeek-V3模型的訓練。

DeepSeek-V3是我們今天用到的R1模型的基礎模型。在研發團隊發表的論文中，可以看到其僅僅使用了550萬美元的算力訓練成本就完成了6710億參數大模型的訓練。即使這項統計僅僅局限于基礎模型訓練的算力成本這一項，沒有包含后續應用模型的強化學習、模型推理，以及人才成本、綜合成本等項目，但也是毫無疑問顛覆了大模型訓練的主流成本模型。

而最終DeepSeek實現的效果，也基本達到了o1為代表的主流大模型水平。雖然在模型效果上很難說有全面的超越，但其確實以軟件算法的革新實現了硬件成本的下降。讓低成本模型的效果不差于高成本，讓開源模型的效果追趕閉源模型。

而DeepSeek“降低AI算力成本”的突破，又恰好發生在全球主流AI玩家囤積高端GPU，以此筑造產業護城河，以及美國對中國禁售高端AI芯片，希望以此打壓中國AI的關鍵節點上。于是也就有了DeepSeek實現AI民主化，甚至助力打破地緣科技壟斷的意味，從而產生了一款中國AI大模型讓整個美國股市遭遇震蕩的戲劇性一幕。

DeepSeek實現的訓練效率提升與訓練成本下降，在特殊的產業環境與國際環境下造成了連鎖反應。但問題是很多平時不關注AI的朋友，可能并不知道AI大模型算力越大效果越好的Scaling Laws，也不知道算力壟斷和禁售的背景信息，只知道短視頻上說DeepSeek橫空出世，歪果仁都慌了、怕了。這種缺乏前因后果的聯想，給DeepSeek憑空造出了一座不應屬于它的神壇。

推而廣之，我們很多人都喜歡那些天才式的、戲劇化的創新。但在現實中，往往只有通過工程化能力，不斷調優，降本，提效，技術創新才有應用和普及的可能。

比如我們都知道愛迪生發明了電燈，但容易忽略大規模電網實現了電力成本的極大下降。如果每家都要自己發電，那世界將一片漆黑。

“我們把成本打下來了?！?/p>

這句有點荒誕、俗套，略帶反諷意味的話，其實才是中國產業化能力的縮影。

我們也不妨大大方方承認，包括DeepSeek在內的中國AI，在未來很長一段時間里最擅長的就是把成本給狠狠打下來。

DeepSeek爆火之后，很多人都說這是技術的巨大勝利。預言AI的崛起會讓人文學科和人文工作喪失價值。甚至“DeepSeek來了，學文科還有意義嗎？”登上了熱搜。

但如果我們多使用DeepSeek，仔細分析它與其他模型的區別，會發現一個相反的觀點：DeepSeek恰好證明了文科與人文能力，在AI時代有多么的重要。

我們隨機問一些人，對DeepSeek的使用體驗是怎樣的。他們應該會說跟DeepSeek對話感覺更有人味。

但這種人味，在很大程度上并不是理解、推理等AI技術層面的“人味”，而是模型在對話過程中展露出來了大量的幽默感、網感，以及更加符合年輕群體的對話習慣。還有就是DeepSeek具有相對更精妙的修辭能力，優美的文筆，還有不錯的綜合人文素養。

這些能力，讓DeepSeek更貼近年輕用戶的對話習慣和審美需求，并且能夠給出更有話題度和傳播度的回答。但問題是，這些能力其實都與技術的關系不大，而是很大程度上與訓練語料的選取等人文能力緊密相關。

比如說，你讓DeepSeek寫首詩，它能夠寫出文藝青年熱愛的語調與修辭。但其他主流國內大模型，也能寫得平仄工整、辭藻華麗，但一眼看去就是酷似打油詩的“老干體”。

再比如，讓DeepSeek預測一些未來趨勢之類的問題，它的回答會特別類似網絡科幻小說。雖然經不起推敲，但就是能讓年輕人有種非常厲害，特別燃的感覺。

這些優點的來源不是技術，而是在于研發團隊的年輕化、高審美，并且重視模型訓練過程中的人文要素。反觀很多主流大模型，由于最終聽取匯報的領導層普遍是大于45歲，缺乏人文學科背景的中年男士，最終導致大模型對話也是班味十足，打起官腔來一套又一套。與其說年輕人在支持DeepSeek，不如說年輕人在支持自己的話語權和審美權。

順便一提，DeepSeek的另一個人文優勢，是它目前還有些“百無禁忌”。然而監管的鐵拳雖遲但到，大家不必對AI的犀利和大膽有任何幻想。

DeepSeek以一種很巧妙的方式，實現了用戶對話體驗更好，傳播效果更優秀。這些在技術層面之外，或許能夠引起AI公司對產品體驗的反思，以及對人文能力的重視。

如果我們狂吹DeepSeek的技術，導致對其人文體驗的忽略，那其實也挺可惜的。