據消息,OpenAI近日發布了一項重要研究報告。報告指出,DeepSeek和Kimi兩家機構通過獨立研究,成功利用思維鏈學習方法,在數學解題與編程挑戰中顯著提升了模型的綜合表現。
Kimi的研究員Flood Sung在隨后的發文中詳細闡述了這一發現。他提到,長思維鏈的有效性在內部實驗中已經得到了驗證。在實際訓練過程中,研究人員發現模型的表現會隨著訓練的深入而不斷提升,并且token數也在不斷增加。這一現象表明,在強化訓練的過程中,模型能夠自我涌現,進一步提升其解題能力。
值得注意的是,就在1月20日,DeepSeek和Kimi在同一天發布了各自的推理模型R1和k1.5。這兩款模型的發布,無疑是對其研究成果的進一步驗證和展示。
此次DeepSeek與Kimi的研究不僅揭示了o1的秘密,更為人工智能領域的發展帶來了新的啟示。思維鏈學習方法的成功應用,為提升AI模型的解題能力和編程能力提供了新的思路和方法。
-
人工智能
+關注
關注
1804文章
48677瀏覽量
246341 -
模型
+關注
關注
1文章
3483瀏覽量
49968 -
Kimi
+關注
關注
0文章
12瀏覽量
118 -
DeepSeek
+關注
關注
1文章
772瀏覽量
1317
發布評論請先 登錄
OpenAI發布o1大模型,數理化水平比肩人類博士,國產云端推理芯片的新藍海?

雷軍:小米玄戒O1已開始大規模量產
小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯想加速“造芯”
雷軍官宣小米造芯 雷軍宣布小米芯片進展 手機SoC芯片玄戒O1于5月下旬發布
用對軟件,DeepSeek + Kimi,PPT一鍵生成秘籍!

OpenAI:DeepSeek與Kimi揭秘o1,長思維鏈提升模型表現
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
PerfXCloud上線DeepSeek系列模型
芯動力神速適配DeepSeek-R1大模型,AI芯片設計邁入“快車道”!

對標OpenAI o1,DeepSeek-R1發布

評論