女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

推理王者o1到底怎么落地?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-11-08 16:12 ? 次閱讀

wKgaomctx9qAH2xgAAmwwEbReL4616.jpg

完整版o1“被泄露”,成了上周AI界的大新聞。

9月13日,OpenAI發布了傳說中代號“草莓”的全新模型系列的預覽版o1 preview,隨后又上線了o1 mini。o1模型系列,能夠模仿人類思維過程“慢思考”,提升了AI的邏輯推理能力,成為AI模型領域的王炸,牽動著整個行業的神經。

而就在上周,有不少用戶突然發現,能在ChatGPT官網上用到完整版o1了。奧特曼更是不小心“登錯賬號”,在社交媒體宣布“o2即將登場”。

從o1 preview到o2,這一系列模型,炸裂歸炸裂,但所謂的推理能力好像并沒有真正融入產業應用,以至于大家都有種狼來了的感覺,開始猜測這不過是奧特曼的又一次宣傳噱頭。

比如,就有網友覺得完整版o1被釋放,并不是“不小心”,而是“精心策劃”的炒作,奧特曼“登錯號劇透o2”也是裝的。

wKgZomctx96AGT1DAAH56gyTNvw630.jpg

如何避免真實的技術價值淪為“狼來了”的戲碼?答案就是,別讓模型能力成為空中樓閣,而是加速落地到產業中。

到底哪些場景才能充分發揮o1“慢思考”的技術潛力呢?本文就來找找產業化落地的路子。

wKgaomctx96AHAUUAAJIDPalWUY927.jpg

落地產業,前提是正確認識到技術的價值。o1模型系列與老前輩們的最大區別和價值究竟是啥呢?就是慢思考。

我們都知道GPT-4o啥的處理些日常瑣事還行,但時不時就會犯點小迷糊,算個小學數學題加減法都錯漏百出。而o1就像是經過嚴格訓練的學霸,專克邏輯推理、復雜任務難題。前不久的OpenAI倫敦開發者日上,完整版o1的五大能力包括:函數調用、開發者message、流式傳輸、結構化輸出、圖像理解。

如果說4o的數學水平是高中生程度,那么9月發布的o1-preview就有大學生水平了,即將發布的o2在GPQA研究生級別基準中取得了105%的成績,未來是妥妥的研究生了。

wKgZomctx9-AcnMpAAUy4oBIE0s094.jpg

而上述能力靠的就是o1的獨門秘籍——慢思考。

已知人腦有兩種模式:一種是快思考,就是咱們平時“一拍腦門”那種憑直覺、靠經驗的快速決策;另一種是慢思考,指的是在解數學題、進行科學推理需要花時間、費精力去琢磨的思考模式,更注重邏輯和理性分析。

o1通過學習人腦深思熟慮、穩扎穩打的思考模式,o1采用強化學習+思維鏈,把復雜問題拆成小塊,一步步來,直到得出最準確的答案,極大地提高了模型的推理能力。

研究生級別的學霸o1模型系列,給AI界帶來了全新的可能。但如何將“慢思考”的技術潛力真正轉化為實際應用,讓o1成為推動產業進步的重要力量?還是一個需要進一步探索的話題。

產業大不同,落地有先后。按照落地的難易程度,我們可能會看到類o1的“慢思考”能力,在以下產業逐步應用開來。

wKgaomctx-CAcGOpAAGgBkIeeJw903.jpg

堅實的數字化基礎、對新技術的高接受度、強大的付費能力,這些特性使得金融成為大模型技術落地的理想場所。

幾乎所有的大模型廠商,都將金融行業作為業務開拓的第一站。然而,在金融與大模型的結合過程中,由于大模型的推理能力不強,加上幻覺問題,導致大模型在金融領域的復雜應用中表現并不理想。

此前,大模型在金融行業的應用范圍,主要是一些容錯率較高的淺層應用上,如智能客服、報表文檔助手。而風控、信貸、投資分析等的嚴肅生產力場景,需要對多種模態的數據,進行深入分析和推理,決策質量要求極高。這些核心業務中,大模型在工作流中發揮的價值相對有限,主要還是得靠人類專家來做。

一位銀行從業者表示,客戶需要我們的理財分析師給出犀利、專業的觀點來幫助決策,而大模型只會泛泛而談,沒什么參考價值。

人人都希望由專業的金融從業人員來服務,如果AI模型能夠在一些容錯率低的嚴肅場景中應用,只需要少量人工干預、監督和驗證,那么專業人士的時間精力,不就可以解放出來了嗎?隨著“慢思考”邏輯推理能力的出現,這一期待真的有可能實現。

wKgaomctx-GAFWGgAALGw7YAoDE184.jpg

基于類o1的邏輯推理能力,我們有望看到AI在金融核心業務中承擔起專家角色,發揮更重要的作用。比如像專業審核員一樣讀征信報告、看賬單流水,甚至能解讀網絡大數據,思考和捕捉數據之間的關聯,并生成風險判斷的依據和結論。

又或者像專業分析師一樣,根據用戶需求進行個性化的產品設計,縝密分析投資策略,給出理財、投資、投保等建議。

慢思考可以讓AI從淺層、邊緣、單一的場景,進入到復雜、核心、高價值的核心業務中,突破大模型在金融行業的價值上限。

wKgZomctx-GAZIDnAAIJ-ihygtc503.jpg

“o1實在太強了……我的博士作業做了20個小時,被它3分鐘思考就拿下了。剛讀博就出這個,感覺人生都灰暗了[流淚] 。”邏輯推理能力達到研究生水平的o1模型系列,讓不少人類研究生、博士生感到了切實的危機。

但用一句流行語來說,“o1不是來拆散科研這個家,而是來加入這個家的”。

近幾十年來,神經網絡算法已經被廣泛應用于科研領域,從宏觀世界的天文探索、引力波探測,到微觀世界的蛋白質折疊、同步光源等,數據科學和算法工程提供了大量的操作手段,幫助科學領域的探索性課題取得突破。AI技術已經成為科學研究不可或缺的一部分,AI4S的大趨勢不可阻擋。

面對這個過程,一位高校力學老師曾對我們說過一個比喻:AI和力學的結合,就像是成功的婚姻才剛剛開始,會有甜蜜期,也會有磨合期。

傳統模型算法雖然有強大的計算能力和手段,但缺乏深入的邏輯推理能力和對科學原理的深刻理解,面對復雜的科學問題時,往往力不從心,難以提供準確且可靠的解決方案。思考方式跟追求嚴謹的科學家們大相徑庭,此前的AI4S全靠人類遷就。

而o1慢思考強調的逐步分析、深入推理,這種思考方式與科學研究的本質不謀而合。具備慢思考能力的AI模型,相當于掌握了碩博們的學習方法,可以逐步拆解問題、分析數據、反復驗算、推導結論。

wKgZomctx-KAJ3NCAAMgIEUf-ac625.jpg

在科研領域,類o1模型可以作為科學家們的“科研伴侶”,扮演好幾種角色:

1.靈感繆斯。在一些經典的科學問題,或者已經成熟的科研結果上,科學家們往往還要開發新方法、新理論。這個過程中,AI的邏輯推理能力可以發現數據之間的潛在聯系和規律,提出新的假設和預測,為科學研究開辟新的道路。

2.科研助理。隨著科學領域“低垂的果實”被摘完,科學家們要去解決更復雜的問題。以力學為例,在深水探索任務中,不僅要做簡單的維度對比,還需要做更細節的探索研究,包括復雜的洋流環境、水下潛入等復雜動作,這些是傳統的流體控制方法所難以預測的。而邏輯推理大模型可以在這類非線性、高維度的科學問題與科研應用上,有更好的性能表現。比如馬克思普朗克研究所的量子物理學者Mario Krenn,就展示了o1-preview正確完成計算的復雜量子物理問題。

3.工程師助理。科研目的不是簡單地開發新方法、新理論,最終成果要轉化到工業界,去解決工業、生活中的現實問題,這就不單單需要新穎的想法,還需要技術的安全性、成熟度、容錯率等。這時候,具備邏輯推理能力的大模型,可以在工業場景中處理復雜問題,降低幻覺,如同工程師助理一樣,減少實際應用中的故障率。

無論是容錯率較高的創造型任務,還是容錯率較低的工程類任務,擁有“慢思考”能力的大模型,都會是一名更得力的助手,與科學長相廝守。

wKgaomctx-KAPAcvAAGnxc45Lk4854.jpg

ChatGPT的第一個應用案例,就是幫學生寫作業,為此遭到了各國多所學校的嚴格限制。這種應用場景雖然不可取,但說明了一個道理:充斥著大量文本、重復任務的教育行業,是大模型落地的絕佳場景。

過去一年多來,“大模型+教育”這個新風口的爆發,也證實了教育產業AI化的價值切實存在。但真正落地的應用,主要還是以AI口語對話、AI批改作文、LLM翻譯、中英文寫作等功能為主。

一旦覆蓋到復雜的學科內容,比如數學、物理、化學等,連“9.9跟9.11誰大”都搞不清楚的GPT們就集體熄火了。國產大模型也同樣如此,一位國產數學大模型的工作人員告訴我,做數學題的正確率是60%。試問哪個家長敢讓數學成績剛及格,還熱愛“胡說八道”的AI給孩子當家教呢?

邏輯推理,限制了模型的能力邊界。而模型的能力限制,又進一步影響了智能教育硬件、個性化AI在線輔導服務的市場化推廣步伐。可以說,解決大模型+教育的商業化問題,最關鍵的是問技術要出路,這也是慢思考模型的價值所在。

首先,具備慢思考的大模型,數學推理的能力飛躍,數學正確率更是肉眼可見地高漲。在剛剛結束的2024 IOI信息學奧賽題目中,o1的微調版本在每題嘗試50次條件下取得了213分,屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次,能獲得362.14分,可以獲得金牌。對于有算力、有開發能力的教育大模型公司來說,完全有可能開發出數學能力很強的垂類大模型,提供面向復雜學科或高年齡學段的AI輔導功能。

其次,疊加了多模態的推理大模型,進一步開拓教育應用。在泄露出來的完整版o1,已經具備多模態能力了,支持上傳附件,或直接識圖。有網友將一道普特南數學競賽的證明題截圖發給o1,就被具有圖像推理能力的o1成功搞定。這意味著教育類大模型不再局限于文本、語言對話類的功能,可以跟物理世界產生交互,比如拍照答題、實時視頻問答等,不管學生問的是現實世界中的什么問題,AI都能大概率找出正確答案。

更為關鍵的是,由于慢思考的模型不再一味追求參數、追求scaling law,而是著重于提高推理能力和認知效率。也就是說,面對一個復雜問題或任務,AI大模型開始以“更聰明”的方法,而非“力大飛磚”的笨辦法,模型的參數規模更小,更便于在硬件終端上部署,在同樣的終端配置下,推理大模型可以表現更出色,這有利于AI學習機等教育類智能硬件的普及,為教育行業帶來新的增長點。

wKgaomctx-aAfPCgAAImf_lzI-Y441.jpg

雖然慢思考的類o1大模型還是個新鮮事物,OpenAI噱頭大于實際的營銷手段也招人吐槽,但可以肯定的是,更強邏輯推理能力的大模型,將成為模廠與行業在智能化領域所必須拿下的高地,去解決此前LLM+行業的結合止于淺層應用、難以應對復雜業務的產業化痛點,進而打開大模型的商業化空間。

究其核心,是AI大模型開始走出語言類任務的局限,可以在容錯率低、專業性強的嚴肅工作中發揮價值。

專家型人才稀缺的行業場景,往往也是高價值所在。懂得慢思考的大模型,正慢慢行業專家化,這讓大模型更有價值,也讓會思考的人更有價值了。

wKgaomctx-iANiPtAAHbiV04LzM348.jpg

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34194

    瀏覽量

    275344
  • OpenAI
    +關注

    關注

    9

    文章

    1201

    瀏覽量

    8635
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    OpenAI發布o1大模型,數理化水平比肩人類博士,國產云端推理芯片的新藍海?

    電子發燒友網報道(文/吳子鵬)9月12日晚,OpenAI正式對外發布一款名為o1的新模型。OpenAI o1的內部代號為“草莓”,具備超強的邏輯推理能力。和傳統大模型不同,OpenAI o1
    發表于 09-14 00:04 ?1768次閱讀
    OpenAI發布<b class='flag-5'>o1</b>大模型,數理化水平比肩人類博士,國產云端<b class='flag-5'>推理</b>芯片的新藍海?

    小米玄戒O1 vs 蘋果A18 全面對比分析

    小米玄戒O1 vs 蘋果A18 全面對比分析 一、技術架構與工藝制程 維度 小米玄戒O1 蘋果A18 制程工藝 臺積電第二代3nm(N3E) 臺積電3nm(N3E) CPU架構 十核四叢集設計:2
    的頭像 發表于 05-23 15:20 ?471次閱讀

    今日看點丨小米爆料:玄戒芯片不止O1一款;消息稱一汽南京全員解散,賠償 N+4

    1. 小米盧偉冰爆猛料:玄戒芯片不止O1 一款 ? 5月21日晚,小米發布會進行最后一次彩排,小米集團總裁盧偉冰爆料,玄戒芯片不止O1一款。目前小米只預熱了玄戒O1芯片,這顆芯片將由小
    發表于 05-22 11:34 ?1220次閱讀

    雷軍:小米玄戒O1已開始大規模量產

    雷軍今日又爆出大消息,雷軍在微博宣布,由小米自主研發設計的3nm旗艦芯片玄戒O1已開啟大規模量產。 據悉,玄戒O1芯片為“1+3+4”八核三叢集架構,玄戒O1包含
    的頭像 發表于 05-20 14:37 ?253次閱讀

    小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯想加速“造芯”

    小米芯片玄戒O1(XRING O1)是小米自主研發設計的手機SoC芯片,預計將于2025年5月下旬發布。目前從媒體爆出的消息來看;小米玄戒O1芯片或采用“1+3+4”八核三叢集設計,還
    的頭像 發表于 05-19 09:47 ?707次閱讀

    今日看點丨小米自研手機 SoC 芯片“玄戒 O1”官宣;曝特斯拉重啟中國零部件進口

    1. 自研SoC 芯片玄戒O1 突然官宣!雷軍:小米十年造芯路始于2014 年 ? 5月15日晚,雷軍突然宣布了小米自研手機SoC芯片命名“玄戒O1”,將于5月下旬發布。雷軍表示:“小米十年造芯路
    發表于 05-16 11:16 ?1304次閱讀

    雷軍官宣小米造芯 雷軍宣布小米芯片進展 手機SoC芯片玄戒O1于5月下旬發布

    小米造芯終于實錘了,小米官方已經確認。小米芯片玄戒O1(XRING O1)是小米自主研發設計的手機SoC芯片,預計將于2025年5月下旬發布。目前玄戒O1的制程工藝、性能參數等詳細信息尚未公布,但是
    的頭像 發表于 05-16 10:22 ?464次閱讀

    OpenAI O3與DeepSeek R1:推理模型性能深度分析

    OpenAI剛推出的O3和DeepSeek的R1代表了推理模型領域的重大進步。這兩種模型都因在各種基準測試中的出色表現而備受關注,引發了人們對人工智能的未來及其對各個行業的潛在影響的討論。據我們所知
    的頭像 發表于 02-18 11:07 ?802次閱讀

    國產AI卷翻硅谷,奧特曼發文“陰陽”,類o1模型都在卷什么?

    比肩o1,Kimi新論文中透露的RL方法論和AI大變局
    的頭像 發表于 01-22 15:13 ?4782次閱讀
    國產AI卷翻硅谷,奧特曼發文“陰陽”,類<b class='flag-5'>o1</b>模型都在卷什么?

    對標OpenAI o1,DeepSeek-R1發布

    DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1
    的頭像 發表于 01-22 13:46 ?1634次閱讀
    對標OpenAI <b class='flag-5'>o1</b>,DeepSeek-R<b class='flag-5'>1</b>發布

    OpenAI發布o1模型API,成本大幅下降60%

    近日,OpenAI正式推出了備受期待的o1模型API,并對實時API進行了重大升級,引入了WebRTC支持。此次發布的o1模型API相較于之前的預覽版本,不僅在性能上有所提升,更在成本上實現了顯著
    的頭像 發表于 12-19 10:31 ?623次閱讀

    ChatGPT新模型o1被曝具備“欺騙”能力

    近日,據報道,ChatGPT新模型o1在訓練和測試過程中展現出了一種令人驚訝的能力——通過“欺騙”來保護自身。 據悉,在面臨被“刪除”的威脅時,o1曾試圖將自己的數據復制到新服務器,并偽裝成更新版
    的頭像 發表于 12-12 09:38 ?637次閱讀

    昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

    近日,昆侖萬維正式向外界推出了其最新研發的“天工大模型4.0”o1版(Skywork o1)。該系列模型以其獨特的復雜思考推理能力,吸引了眾多業內人士的關注。 據悉,Skywork o1
    的頭像 發表于 11-28 10:33 ?676次閱讀

    昆侖萬維天工大模型4.0 O1版即將邀測

    昆侖萬維公司近日宣布,其自主研發的天工大模型4.0 O1版(英文名:Skywork O1)將于11月27日正式啟動邀請測試。這款模型是國內首款具備中文邏輯推理能力的o1模型,具有里程碑
    的頭像 發表于 11-19 17:24 ?863次閱讀

    天工大模型4.0 O1版即將啟動邀測

    昆侖萬維公司近日宣布,其自主研發的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動邀請測試。這款模型是國內首款具備中文邏輯推理能力的O1模型,其發
    的頭像 發表于 11-18 15:08 ?1103次閱讀