近日,據(jù)月之暗面報(bào)道,OpenAI發(fā)布了一項(xiàng)令人矚目的研究報(bào)告。報(bào)告指出,DeepSeek和Kimi兩個(gè)研究團(tuán)隊(duì)通過獨(dú)立研究,成功利用思維鏈學(xué)習(xí)方法,在數(shù)學(xué)解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。
Kimi團(tuán)隊(duì)的研究員Flood Sung在社交媒體上發(fā)文,分享了團(tuán)隊(duì)的研究心得。他提到,長思維鏈的有效性在團(tuán)隊(duì)內(nèi)部已經(jīng)得到了驗(yàn)證。在實(shí)際訓(xùn)練過程中,研究人員發(fā)現(xiàn)模型的表現(xiàn)會(huì)隨著訓(xùn)練的深入而不斷提升,并且token數(shù)也在不斷增加。這一發(fā)現(xiàn)證明了在強(qiáng)化訓(xùn)練過程中,模型具備自我涌現(xiàn)的能力,能夠不斷挖掘和發(fā)揮自身的潛力。
值得一提的是,就在1月20日,DeepSeek和Kimi兩個(gè)團(tuán)隊(duì)在同一天發(fā)布了各自的推理模型R1和k1.5。這一巧合不僅展示了兩個(gè)團(tuán)隊(duì)在研究領(lǐng)域的默契,也進(jìn)一步凸顯了思維鏈學(xué)習(xí)方法在提升模型性能方面的巨大潛力。
OpenAI的這一研究報(bào)告,不僅揭示了DeepSeek和Kimi兩個(gè)團(tuán)隊(duì)在思維鏈學(xué)習(xí)方法上的突破,也為人工智能領(lǐng)域的研究提供了新的思路和啟示。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48705瀏覽量
246472 -
模型
+關(guān)注
關(guān)注
1文章
3486瀏覽量
49990 -
OpenAI
+關(guān)注
關(guān)注
9文章
1201瀏覽量
8636 -
DeepSeek
+關(guān)注
關(guān)注
1文章
773瀏覽量
1337
發(fā)布評(píng)論請(qǐng)先 登錄
OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍(lán)海?

DeepSeek與Kimi揭示o1秘密,思維鏈學(xué)習(xí)方法顯成效
OpenAI O3與DeepSeek R1:推理模型性能深度分析
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
AI模型思維鏈功能升級(jí),提升透明度與可信度
OpenAI o3-mini模型思維鏈遭質(zhì)疑
芯動(dòng)力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!

對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

評(píng)論