女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind論文登上Nature:困擾數學家幾十年的難題,大模型發現全新解

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-12-18 15:55 ? 次閱讀

除了模仿人類說話、寫作、寫代碼,大模型還能用來發現新知識。

作為今年 AI 圈的頂流,大型語言模型(LLM)擅長的是組合概念,并且可以通過閱讀、理解、寫作和編碼來幫助人們解決問題。但它們能發現全新的知識嗎?

由于 LLM 已被證明存在「幻覺」問題,即生成與事實不符的信息,因此利用 LLM 來做可驗證的正確發現是一項挑戰。

現在,來自 Google DeepMind 的研究團隊提出了一種為數學和計算機科學問題搜索解決方案的新方法 ——FunSearch。FunSearch 的工作原理是將預訓練的 LLM(以計算機代碼的形式提供創造性解決方案)與自動「評估器」配對,以防止產生幻覺和錯誤思路。通過在這兩個組件之間來回迭代,最初的解決方案演變成了「新的知識」。相關論文發表在《自然》雜志上。


論文地址:https://www.nature.com/articles/s41586-023-06924-6

這項工作是首次利用 LLM 在科學或數學的挑戰性開放問題方面取得新發現。

FunSearch 發現了 cap set 問題的全新解決方案,這是數學中一個長期存在的開放問題。此外,為了展示 FunSearch 的實際用途,DeepMind 還用它來發現更有效的算法來解決「裝箱」問題,該問題應用廣泛,比如可以用于提高數據中心的效率。

研究團隊認為 FunSearch 將成為一個特別強大的科學工具,因為它輸出的程序揭示了其解決方案是如何構建的,而不僅僅是解決方案是什么。這將會激發科學家的進一步見解,從而形成科學改進與發現的良性循環。

通過語言模型的進化推動發現

FunSearch 采用由 LLM 支持的進化方法,鼓勵并推動得分最高的思路想法。這些想法被表達成計算機程序,以便它們可以自動運行和評估。

首先,用戶需要以代碼的形式編寫問題的描述。該描述包括評估程序的過程和用于初始化程序池的種子程序。

FunSearch 是一個迭代過程,在每次迭代中,系統都會從當前的程序池中選擇一些程序,并將其饋送到 LLM。LLM 創造性地在此基礎上進行構建,生成新的程序,并自動進行評估。最好的程序將被添加回現有程序庫中,從而創建一個自我改進的循環。FunSearch 使用 Google 的 PaLM 2,但對其他接受過代碼訓練的方法兼容。

LLM 會從程序數據庫中檢索出生成的最佳程序,并被要求生成一個更好的程序。

眾所周知,在不同領域發現新的數學知識和算法是一項艱巨的任務,很大程度上超出了當前最先進人工智能系統的能力。為了讓 FunSearch 做到這一點,該研究引入了多個關鍵組件。FunSearch 不是從頭開始,而是從關于問題的常識開始一個進化過程,讓 FunSearch 專注于尋找最關鍵的想法以獲得新的發現。

此外,FunSearch 的進化過程使用一種策略來提高想法的多樣性,以避免出現停滯情況。最后,為了提高系統效率,進化過程是并行運行的。

在數學領域開辟新天地

DeepMind 表示,他們首先要解決的是 Cap set 問題,這是一個開放性難題,幾十年來一直困擾著多個研究領域的數學家。知名數學家陶哲軒曾把它描述為自己最喜歡的開放性問題。DeepMind 選擇與威斯康星大學麥迪遜分校的數學教授 Jordan Ellenberg 合作,他是 Cap set 問題的重要突破者。

這個問題包括在一個高維網格中找到最大的點集(稱為 cap set),其中沒有三個點位于一條直線上。這個問題之所以重要,是因為它可以作為極值組合學中其他問題的模型。極值組合學研究的是數字、圖或其他對象的集合可能有多大或多小。暴力破解方法無法解決這個問題 —— 要考慮的可能性數量很快就會超過宇宙中原子的數量。

FunSearch 以程序形式生成的解決方案在某些情況下發現了有史以來最大的 cap set。這代表了過去 20 年中 cap set 規模的最大增長。此外,FunSearch 的性能超過了最先進的計算求解器,因為這個問題的規模遠遠超出了它們目前的能力。

交互式圖表顯示了從種子程序(上)到新的高分函數(下)的演變。每個圓圈都代表一個程序,其大小與分配給它的分數成正比。圖中僅顯示底部程序的上級。FunSearch 為每個節點生成的相應函數如右側所示。

這些結果表明,FunSearch 技術可以讓人類超越困難組合問題的既定結果,而在這些問題上很難建立直覺。DeepMind 期望這種方法能夠在組合學中類似理論問題的新發現中發揮作用,并在未來為通信理論等領域帶來新的可能性。

FunSearch 偏好簡潔、可由人類理解的程序

盡管發現新的數學知識本身意義重大,但與傳統的計算機搜索技術相比,FunSearch 方法還展現出了其他的優勢。這是因為,FunSearch 并不是一個只會生成問題解決方案的黑箱。相反,它生成的程序會描述出這些解決方案是如何得出的。這種「show-your-working」通常是科學家的工作方式,他們通過闡述產生新發現或新現象的過程來解釋這些發現或現象。

FunSearch 更傾向于尋找高度緊湊的程序所代表的解決方案,即具有較低 Kolmogorov 復雜度的解決方案(Kolmogorov 復雜度是輸出解的最短計算機程序的長度)。簡短的程序可以描述非常大的對象,從而使 FunSearch 能夠擴展到非常復雜的問題。此外,這也讓研究人員更容易理解 FunSearch 的程序輸出。Ellenberg 說:「FunSearch 為制定攻擊策略提供了一種全新的機制。FunSearch 生成的解決方案在概念上要比單純的數字列表豐富得多。當我研究它們時,我學到了一些東西。」

更重要的是,FunSearch 程序的這種可解釋性可以為研究人員提供可操作的見解。例如,DeepMind 在使用 FunSearch 的過程中注意到,它的一些高分輸出的代碼中存在耐人尋味的對稱性。這讓 DeepMind 對問題有了新的認識,他們利用這種認識改進了引入 FunSearch 的問題,從而找到了更好的解決方案。DeepMind 認為,這是人類與 FunSearch 在數學領域的許多問題上進行合作的典范。

左圖:通過檢查 FunSearch 生成的代碼,DeepMind 獲得了更多可操作的見解(高亮部分)。右圖:使用(更短的)左圖程序構造的原始「可接受」集合。

解決一個眾所周知的計算難題

在理論 cap set 問題取得成功的鼓舞下,DeepMind 決定將 FunSearch 應用于計算機科學中一個重要的實際挑戰 —— 裝箱問題(bin packing),以探索它的靈活性。裝箱問題關注的是如何將不同尺寸的物品打包到最少數量的箱子中。它是許多現實世界問題的核心,從裝載物品的集裝箱到數據中心的計算工作分配,這些場景都需要最大限度地降低成本。

在線裝箱問題通常使用基于人類經驗的算法規則(啟發式)來解決。但是,要為每種特定情況(大小、時間或容量各不相同)找到一套規則是非常具有挑戰性的。盡管與 cap set 問題非常不同,但為這個問題設置 FunSearch 很容易。FunSearch 提供了一個自動定制的程序(適應數據的具體情況),優于現有的啟發式方法 —— 可以使用更少的箱子來打包相同數量的物品。

使用現有啟發式 ——Best-fit 啟發式(左)和 FunSearch 發現的啟發式(右)進行裝箱的示例。

像在線裝箱這樣的復雜組合問題可以使用其他人工智能方法來解決,比如神經網絡和強化學習。這些方法也被證明是有效的,但也可能需要大量的資源來部署。另一方面,FunSearch 輸出的代碼易于檢查和部署,這意味著它的解決方案有可能被應用到各種現實工業系統中,從而迅速帶來效益。

DeepMind:用大模型應對科學挑戰將成普遍做法

FunSearch 證明,如果能防止 LLM 產生幻覺,那么這些模型的力量不僅可以用來產生新的數學發現,還可以用來揭示重要現實問題的潛在解決方案。

DeepMind 認為,對于科學和工業領域的許多問題 —— 無論是長期存在的問題還是新問題 —— 使用 LLM 驅動的方法生成有效和量身定制的算法將成為普遍做法。

其實,這僅僅是一個開始。隨著 LLM 不斷取得進展,FunSearch 也將不斷完善。DeepMind 表示,他們還將努力擴展其功能,以應對社會上各種緊迫的科學和工程挑戰。

參考鏈接:https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/


原文標題:DeepMind論文登上Nature:困擾數學家幾十年的難題,大模型發現全新解

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2927

    文章

    45856

    瀏覽量

    387871

原文標題:DeepMind論文登上Nature:困擾數學家幾十年的難題,大模型發現全新解

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    后摩智能四篇論文入選三大國際頂會

    2025 上半年,繼年初被 AAAI、ICLR、DAC 三大國際頂會收錄 5 篇論文后,后摩智能近期又有 4 篇論文入選CVPR、ICML、ACL三大國際頂會,面向大模型的編碼、量化
    的頭像 發表于 05-29 15:37 ?148次閱讀

    曦智科技時隔八再登《Nature》,光電混合計算架構首次公開

    英國倫敦時間4月9日,全球頂級學術期刊《自然》(Nature)刊載了曦智科技的光電混合計算成果:《超低延遲大規模集成光子加速器》(An integrated large-scale photonic
    發表于 04-10 09:50 ?275次閱讀
     曦智科技時隔八<b class='flag-5'>年</b>再登《<b class='flag-5'>Nature</b>》,光電混合計算架構首次公開

    十年守護不松懈:振弦式應變計如何為基礎設施安全保駕護航?

    在城市快速發展的今天,橋梁、大壩、隧道等大型基礎設施如同城市的"生命線"。如何實現長達十年的連續安全監測?振弦式應變計這項"黑科技"給出了創新解決方案。一、振
    的頭像 發表于 04-09 13:49 ?156次閱讀
    <b class='flag-5'>十年</b>守護不松懈:振弦式應變計如何為基礎設施安全保駕護航?

    十年磨一劍,我的新書上市了!

    大家好,我是皮哥Peter,十年磨一劍,我的新書《打通Linux操作系統和芯片開發》上市了!今天,新書開啟了5折優惠,滿滿的干貨,高顏值,雙色印刷,手感厚實,新書原價139元,限時半價,只要69.5
    的頭像 發表于 04-01 07:33 ?247次閱讀
    <b class='flag-5'>十年</b>磨一劍,我的新書上市了!

    如何使用MATLAB構建Transformer模型

    Transformer 模型在 2017 由 Vaswani 等人在論文《Attentionis All You Need》中首次提出。其設計初衷是為了解決自然語言處理(Nature
    的頭像 發表于 02-06 10:21 ?3353次閱讀
    如何使用MATLAB構建Transformer<b class='flag-5'>模型</b>

    兩大AI模型性能提升 登上國際榜單

    近日,由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型
    的頭像 發表于 01-16 12:01 ?770次閱讀
    兩大AI<b class='flag-5'>模型</b>性能提升 <b class='flag-5'>登上</b>國際榜單

    睿創微納五&amp;十年功勛員工頒獎大會圓滿舉行

    12月11日,睿創微納五&十年功勛員工頒獎大會在煙臺園區圓滿舉行,公司董事長帶領核心管理團隊為5、10功勛員工頒發紀念銀幣和金幣。?? 百余名員工獲頒紀念銀幣,以表彰他們五
    的頭像 發表于 12-12 10:35 ?710次閱讀

    觸覺傳感重磅《Nature》!無線、低功耗、多刺激模式觸覺電子皮膚(附原論文

    中有廣泛的應用。在觸覺傳感方面,已有眾多Nature、Science子刊發表,但是Nature正刊卻仍分稀少。 ? ? ????? 近日,美國西北大學John A. Rogers/黃永剛大連理工大學解兆謙聯合團隊提出了一個微型
    的頭像 發表于 11-14 18:13 ?1688次閱讀
    觸覺傳感重磅《<b class='flag-5'>Nature</b>》!無線、低功耗、多刺激模式觸覺電子皮膚(附原<b class='flag-5'>論文</b>)

    樣樣超Pro,新十年旗艦大作一加13售價 4499 元起

    202410月31日,一加正式發布年度旗艦一加13。作為一加品牌新十年旗艦大作,一加13首發多項獨家性能黑科技及行業領先技術,打破行業常規,是一款在設計、性能、屏幕、影像及續航等方面“樣樣超Pro
    的頭像 發表于 11-01 15:24 ?2566次閱讀
    樣樣超Pro,新<b class='flag-5'>十年</b>旗艦大作一加13售價 4499 元起

    納微十年,氮化鎵GaNSlim上新,持續引領集成之勢

    輝煌的十年。 ? 如今,納微在氮化鎵產品線上不斷拓展,最近重磅發布全新一代高度集成的氮化鎵功率芯片產品——GaNSlim,其憑借最高級別的集成度和散熱性能,可為手機和筆記本電腦充電器、電視電源、固態照明電源等領域,進一步
    的頭像 發表于 10-23 09:43 ?1649次閱讀
    納微<b class='flag-5'>十年</b>,氮化鎵GaNSlim上新,持續引領集成之勢

    沃達豐與谷歌深化十年戰略合作

    沃達豐近日宣布,其與全球科技巨頭谷歌的戰略合作伙伴關系得到了進一步深化。這一為期十年的協議,總價值超過10億美元,旨在將谷歌最新推出的生成式人工智能支持的設備引入歐洲和非洲市場,為沃達豐的廣大客戶提供更為先進和智能的服務體驗。
    的頭像 發表于 10-09 16:22 ?459次閱讀

    顛覆認知:大模型不可靠最新研究登上 Nature

    行業芯事行業資訊
    電子發燒友網官方
    發布于 :2024年09月27日 11:40:10

    十年預言:Chiplet的使命

    未來十年內芯片算力提升的核心動力。 議題一: 算力困局如何突圍? 韓銀和研究員: 現有的高性能計算架構正遭遇算力瓶頸。目前全球頂級的高性能計算系統,由美國橡樹嶺國家實驗室基于HPE Cray EX235a架構研發的超級計算機Frontier,其算
    的頭像 發表于 08-27 11:09 ?708次閱讀
    <b class='flag-5'>十年</b>預言:Chiplet的使命

    BOE京東方與聯合國教科文組織UNESCO簽訂合作協議 成為首個支持聯合國“科學十年”的中國科技企業

    法國時間7月25日,BOE(京東方)與聯合國教科文組織(UNESCO)在法國巴黎總部基于《2024—2033科學促進可持續發展國際十年》決議(簡稱“科學十年”)簽訂為期三的合作伙伴
    的頭像 發表于 07-26 13:04 ?536次閱讀
    BOE京東方與聯合國教科文組織UNESCO簽訂合作協議 成為首個支持聯合國“科學<b class='flag-5'>十年</b>”的中國科技企業

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一前就掛在arXiv上的一項研究。開源的那種。
    的頭像 發表于 07-16 18:29 ?809次閱讀
    谷歌<b class='flag-5'>DeepMind</b>被曝抄襲開源成果,<b class='flag-5'>論文</b>還中了頂流會議