女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人大發表迄今為止最大最全的大模型綜述

深度學習自然語言處理 ? 來源:RUC AI Box ? 2023-07-06 16:36 ? 次閱讀

今年3月末,我們在arXiv網站發布了大語言模型綜述文章《A Survey of Large Language Models》的第一個版本V1,該綜述文章系統性地梳理了大語言模型的研究進展與核心技術,討論了大量的相關工作。自大語言模型綜述的預印本上線以來,受到了廣泛關注,收到了不少讀者的寶貴意見。

f9db4c26-1bd4-11ee-962d-dac502259ad0.png在發布V1版本后的3個月時間內,為了提升該綜述的質量,我們在持續更新相關的內容,連續進行了多版的內容修訂(版本號目前迭代到V11),論文篇幅從V1版本的51頁、416篇參考文獻擴增到了V11版本的85頁、610篇參考文獻。V11版本是我們自五月中下旬開始策劃進行大修的版本,詳細更新日志請見文章結尾,已于6月末再次發布于arXiv網站。相較于V1版本,V11版本的大語言模型綜述有以下新亮點:
  1. 新增了對LLaMA模型及其衍生模型組成的LLaMA家族介紹;
  2. 新增了具體實驗分析,包括指令微調數據集組合方式實驗以及部分模型綜合能力評測
  3. 新增了大語言模型提示設計提示指南以及相關實驗,總結了提示設計的原則、經驗;
  4. 新增了參數高效適配空間高效適配章節,總結了大語言模型相關的輕量化技術;
  5. 增加了對于規劃(planning)的相關工作介紹;
  6. 增補了許多脈絡梳理內容,以及大量最新工作介紹;
此外,我們綜述的中文翻譯版本也在持續更新(針對v1版本進行了翻譯,并持續更新)f9fdd64c-1bd4-11ee-962d-dac502259ad0.png
  • 論文鏈接:https://arxiv.org/abs/2303.18223
  • GitHub項目鏈接:https://github.com/RUCAIBox/LLMSurvey
  • 中文翻譯版本鏈接:https://github.com/RUCAIBox/LLMSurvey/blob/main/assets/LLM_Survey__Chinese_V1.pdf

1. 引言

大語言模型目前已經成為學界研究的熱點。我們統計了arXiv論文庫中自2018年6月以來包含關鍵詞"語言模型"以及自2019年10月以來包含關鍵詞"大語言模型"的論文數量趨勢圖。結果表明,在ChatGPT發布之后,相關論文的數量呈現出爆發式增長,這充分證明大語言模型在學術界的影響力日益凸顯,吸引了越來越多的研究者投入到這一領域。fa2b6f4e-1bd4-11ee-962d-dac502259ad0.png

2. 總覽

相較于小模型,大模型擴展了模型大小、訓練數據大小和總計算量,顯著提升了語言模型的能力。在總覽章節中,我們新增了擴展法則(scaling law)的討論,其中重點介紹了KM擴展法則和Chinchilla擴展法則,這兩個法則對于理解大語言模型的性能提升提供了重要參考。
  • KM 擴展法則
fa60f754-1bd4-11ee-962d-dac502259ad0.png
  • Chinchilla擴展法則

fa7ecba8-1bd4-11ee-962d-dac502259ad0.png此外,我們新增了一部分關于OpenAI GPT系列語言模型的技術演進階段的介紹(并附圖)。這一部分將幫助讀者了解GPT系列模型如何從最初的GPT開始,逐步演變成例如ChatGPT和GPT-4等更先進的大語言模型。fa9af45e-1bd4-11ee-962d-dac502259ad0.png針對GPT系列的核心“預測下一個詞”,還進一步加入了一些Ilya Sutskever的采訪記錄:fac181d2-1bd4-11ee-962d-dac502259ad0.png

3. 大語言模型相關資源

我們對于最新符合條件的模型進行了補充,持續更新了現有的10B+的模型圖:fb16eb7c-1bd4-11ee-962d-dac502259ad0.png2023年2月,Meta發布了LLaMA大語言模型。受益于其強大的基座能力,LLaMA的發布引起了開源社區的對其進行擴展的熱潮,大量的研究人員基于LLaMA進行指令微調或者繼續預訓練,從而催生了大量高質量的開源大語言模型。為了幫助讀者了解LLaMA家族模型的發展脈絡,我們增加了LLaMA家族模型的發展介紹,并繪制了一個簡要的LLaMA家族演化圖來展示LLaMA家族模型的發展歷程,以及各個衍生模型之間的關聯。fb3aa4f4-1bd4-11ee-962d-dac502259ad0.png

4. 大語言模型預訓練技術

在預訓練技術章節,我們大幅補充了大模型預訓練各方面的技術細節。在模型架構部分,我們補充了三種主流模型架構的對比圖,包括因果編碼器、前綴解碼器和編碼器-解碼器架構,從而直觀的展示這三種架構的差異和聯系。fb684fd0-1bd4-11ee-962d-dac502259ad0.png此外,我們詳細補充了模型架構的各組件細節,包括分詞、歸一化方法、歸一化位置、位置編碼、注意力與偏置等等,并提供了Transformer架構多種配置的詳細公式表。在最后的討論章節,我們針對研究者廣泛關注的長文本編碼與生成挑戰進行了討論。fb8af224-1bd4-11ee-962d-dac502259ad0.png針對預訓練數據的詞元化問題(tokenization),我們補充介紹了BPE、WordPiece和Unigram三種常用算法fbd23972-1bd4-11ee-962d-dac502259ad0.png

5. 大語言模型適配技術

在適配技術章節,我們擴充了指令微調的技術細節,包括指令收集方法、指令微調的作用、指令微調的結果和對應分析。首先,我們按照任務指令、聊天指令、合成指令三類分別介紹了指令數據的收集方法,并收集了的指令集合。

fc0d89f0-1bd4-11ee-962d-dac502259ad0.png

并且更新了指令集合的創建方式示意圖:

fc36e912-1bd4-11ee-962d-dac502259ad0.png其次,為了探究不同指令數據對模型性能的影響,我們給出了不同數據混合策略下指令微調模型的實驗結果供讀者參考。為了讓讀者更好地上手指令微調,還給出了指令微調大模型的資源參考表,并給出了指令微調的實用建議fc6fe762-1bd4-11ee-962d-dac502259ad0.png隨著大語言模型的關注度日漸上升,如何更輕量地微調和使用大語言模型也成為了業界關注的熱點,為此,我們新增參數高效適配章節和空間高效適配章節。在參數高效適配章節,我們介紹了常見的參數高效適配技術,包括Adapter Tuning、Prefix Tuning、Prompt Tuning、LoRA等等,并列舉了近期結合這些技術在大模型上的具體實踐。fc87d08e-1bd4-11ee-962d-dac502259ad0.png同時由于大語言模型參數量巨大,在推理時需要占用大量的內存(顯存),導致它們在實際應用中部署成本較高。為此,我們介紹了空間高效適配技術,討論了如何通過模型壓縮方法(模型量化)來減少大語言模型的內存占用,從而使其可以在資源有限的情況下使用。下面總結了我們討論的一些核心結論:fca730dc-1bd4-11ee-962d-dac502259ad0.png

6. 大語言模型使用技術

我們將大語言模型在推理階段如何執行上下文學習的機制分析劃分為兩類,即任務識別任務學習。在任務識別部分,介紹了大語言模型如何從示例中識別任務并使用預訓練階段習得的知識加以解決;在任務學習部分,介紹了大語言模型如何從示例中學習解決新任務。除了上下文學習和思維鏈提示,我們還介紹了另一類使用大語言模型的重要范式,即基于提示對復雜任務進行規劃。根據相關工作,我們總結出了基于規劃的提示的總體框架。這類范式通常包含三個組件:任務規劃者、規劃執行者和環境。隨后,我們從規劃生成,反饋獲取和規劃完善三個方面介紹了這一范式的基本做法。fce5da58-1bd4-11ee-962d-dac502259ad0.png

7. 大語言模型能力評估

考慮到大語言模型的條件語言生成能力日益增長,我們介紹了已有工作對大語言模型時代語言生成自動評測可靠性問題的討論。對于大語言模型的高級能力,我們增補了最新的相關工作,并總結了大語言模型高級能力評測的常用數據集供讀者參考。此外,隨著大語言模型通用能力的提升,一系列工作提出了更具挑戰性的基于面向人類測試的綜合評測基準來評測大語言模型,我們增加了這些代表性評測基準的介紹。fd02de96-1bd4-11ee-962d-dac502259ad0.png在大語言模型時代,開源和閉源的大語言模型不斷涌現,我們對部分熱門開源模型和閉源模型進行了細粒度的能力評測,涵蓋了評測章節總結的8大基礎和高級能力對應的27個代表性任務。進一步,我們對開源模型和閉源模型的評測結果進行了細致的分析。為了更好地說明大模型的現有問題,我們對于關鍵問題都進行了note形式的總結:fd2ecbd2-1bd4-11ee-962d-dac502259ad0.png

8. 大語言模型提示設計使用指南

在大語言模型時代,提示成為了人與機器交互的重要形式。然而,如何編寫好的提示是一門對技巧和經驗要求很高的手藝。為了讓讀者能夠快速上手大語言模型的提示設計,我們給出了一個實用的提示設計指南。我們詳細介紹了提示的關鍵組件,并討論了一些關鍵的提示設計原則。一個完整的提示通常包含四個關鍵組成因素,即任務描述、輸入數據、上下文信息和提示風格。為了更好的展示這些組成因素,我們給出了直觀的提示樣例表fd8b058c-1bd4-11ee-962d-dac502259ad0.png

增加了相關提示的示意圖:

fddbeaba-1bd4-11ee-962d-dac502259ad0.png除此之外,我們還總結了一些關鍵的提示設計原則,包括清晰表述任務目標、將復雜任務進行分解以及使用模型友好的格式。進一步我們基于這些設計原則,展示了一系列有用的提示設計小貼士最后,我們結合多種常見任務,基于ChatGPT具體實驗了不同提示對模型性能的影響,供讀者在使用提示執行具體任務時參考。fe69b9d0-1bd4-11ee-962d-dac502259ad0.png

9. 大語言模型領域應用

隨著大語言模型關注度的逐漸提升,研究者和工業界從業人員也嘗試將大語言模型應用到各種專業領域中。為了系統地介紹這些應用實踐,我們將綜述中大語言模型的領域應用部分獨立成了專門的章節。具體而言,我們擴充介紹了原有將大語言模型應用到醫療、教育、法律領域的相關研究,并新增了金融和科學研究領域的相關工作介紹。

10. 尋求建議與算力

一篇高質量的長篇綜述文章需要大量的時間投入,所參與的老師和學生為此付出了很多的時間。盡管我們已經盡力去完善這篇綜述文章,但由于能力所限,難免存在不足和錯誤之處,仍有很大的改進空間。我們的最終目標是使這篇綜述文章成為一個“know-how”的大模型技術指南手冊,讓大模型的秘密不再神秘、讓技術細節不再被隱藏。盡管我們深知目前這篇綜述離這個目標的距離還比較遠,我們愿意在之后的版本中竭盡全力去改進。特別地,對于預訓練、指令微調、提示工程的內在原理以及實戰經驗等方面,我們非常歡迎讀者為我們貢獻想法與建議,可以通過GitHub提交PR或者郵件聯系我們的作者。對于所有被采納的技術細節,我們都將在論文的致謝部分中“實名+實際貢獻”進行致謝。同時,我們自己也在圍繞大模型綜述的部分內容開展相關的實驗探索(如能力評測、指令微調等),以保證綜述中的討論能夠有據可循。由于算力所限,目前能開展的實驗局限于小尺寸模型和少量比較方法。在此,我們也向社會尋求算力支持,我們將承諾所獲得的算力資源將完全用于該綜述文章的編寫,所有使用外部算力所獲得的技術經驗,將完全在綜述文章中對外發布。我們將在綜述的致謝部分和GitHub項目主頁對于算力提供商進行致謝。針對本綜述文章的算力資源支持事宜,煩請致信 [email protected] 聯系我們。我們的綜述文章自發布以來,收到了廣泛網友的大量修改意見,在此一并表示感謝。也希望大家一如既往支持與關注我們的大模型綜述文章,您們的點贊與反饋將是我們前行最大的動力。

11. 本次修訂的參與學生名單

學生作者:周昆(添加了指令微調實驗的任務設置與結果分析,具體安排了實驗細節,添加了能力評測實驗的實驗設置與結果分析,協助整理code,添加了提示指南部分的實驗設置與結果分析,添加了表13)、李軍毅(添加了指令微調實驗的數據集、改進策略和實驗設置和實驗表8,添加了能力評測實驗的模型、任務和數據集,以及實驗表11,添加了提示指南的設計原則和表12表14)、唐天一(添加第五章文字細節,添加圖1、3、10,表6、7)、王曉磊(添加第六章6.1文字細節,新增6.3)、侯宇蓬(添加第四章文字細節)、閔映乾(添加第三章少數模型,LLaMA相關討論,圖4)、張北辰(添加第七章、第九章文字細節,添加表10)、董梓燦(添加圖7表、4和第四章文字細節)、陳昱碩(表7實驗)、陳志朋(添加第七章、第九章文字細節,表11實驗)、蔣錦昊(更新圖8)學生志愿者:成曉雪(表11實驗)、王禹淏(表11實驗)、鄭博文(表11實驗)、胡譯文(中文校對)、侯新銘(中文校對)、尹彥彬(中文校對)、曹展碩(中文校對)

附件:更新日志

版本 時間 主要更新內容
V1 2023年3月31日 初始版本
V2 2023年4月9日 添加了機構信息。修訂了圖表 1 和表格 1,并澄清了大語言模型的相應選擇標準。改進了寫作。糾正了一些小錯誤。
V3 2023年4月11日 修正了關于庫資源的錯誤
V4 2023年4月12日 修訂了圖1 和表格 1,并澄清了一些大語言模型的發布日期
V5 2023年4月16日 添加了關于 GPT 系列模型技術發展的章節
V6 2023年4月24日 在表格 1 和圖表 1 中添加了一些新模型。添加了關于擴展法則的討論。為涌現能力的模型尺寸添加了一些解釋(第 2.1 節)。在圖 4 中添加了用于不同架構的注意力模式的插圖。在表格 4 中添加了詳細的公式。
V7 2023年4月25日 修正了圖表和表格中的一些拷貝錯誤
V8 2023年4月27日 在第 5.3 節中添加了參數高效適配章節
V9 2023年4月28日 修訂了第 5.3 節
V10 2023年5 月7 日 修訂了表格 1、表格 2 和一些細節
V11 2023年6月29日 第一章:添加了圖1,在arXiv上發布的大語言論文趨勢圖;第二章:添加圖3以展示GPT的演變及相應的討論;第三章:添加圖4以展示LLaMA家族及相應的討論;第五章:在5.1.1節中添加有關指令調整合成數據方式的最新討論, 在5.1.4節中添加有關指令調整的經驗分析, 在5.3節中添加有關參數高效適配的討論, 在5.4節中添加有關空間高效適配的討論;第六章:在6.1.3節中添加有關ICL的底層機制的最新討論,在6.3節中添加有關復雜任務解決規劃的討論;第七章:在7.2節中添加用于評估LLM高級能力的代表性數據集的表格10,在7.3.2節中添加大語言模型綜合能力pint測;第八章:添加提示設計;第九章:添加關于大語言模型在金融和科學研究領域應用的討論。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    558

    瀏覽量

    10670
  • 大模型
    +關注

    關注

    2

    文章

    3025

    瀏覽量

    3825

原文標題:人大發表迄今為止最大最全的大模型綜述

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    35億美元!諾基亞獲迄今為止數額最大5G合同

    手下的高額訂單。據外媒最新公布的消息,來自芬蘭的諾基亞公司日前獲得了迄今為止數額最大的5G合同,價值高達35億美元。
    的頭像 發表于 08-01 09:16 ?3809次閱讀

    努比亞Z18S將于10月31日發布 官方稱迄今為止最全面的全面屏

    近日,努比亞手機總經理倪飛在微博宣布了一個重磅消息,努比亞將于10月31日舉辦新品發布會,并表示:“6周年誠意之作,迄今為止最全面的全面屏!”而倪飛的微博小尾巴變成了“努比亞X 護眼雙屏”可見屆時將發布新手機努比亞X,該機搭載兩個屏幕,它就是此前曝光的努比亞Z18S。
    的頭像 發表于 10-10 08:08 ?7955次閱讀

    小米宣布將于12月8日在紐約舉辦迄今為止最大的聚會

    近日,據外媒Phonearena報道,經過Reddit確認,小米宣布將于當地時間12月8日在紐約舉辦活動,活動的具體時間和地址尚未確定,不過這家中國廠商聲稱,這將是它“迄今為止最大的聚會”。小米還表示將在活動中展示它最新和最偉大的產品,與會者能夠見到美國團隊、特別嘉賓,甚
    的頭像 發表于 11-08 09:26 ?3009次閱讀

    為什么iPhone4是蘋果迄今為止最為人稱道的產品

    它是蘋果在智能手機上的一次跨越,也是喬布斯最后一款作品,它是3G時代的重要推動者,也加速了移動互聯網時代到來。本期極客博物館,我們就來聊聊蘋果迄今為止最為人稱道的產品——iPhone 4。
    的頭像 發表于 09-02 10:39 ?3721次閱讀

    驍龍865沒有集成卻是迄今為止最先進的5G移動平臺

    高通表示,驍龍865沒有集成并不影響其性能,反而驍龍865是迄今為止最先進的5G移動平臺,單以集成與否來衡量芯片強弱是沒道理的。
    發表于 12-05 09:19 ?1424次閱讀

    Intel全力打磨的獨立顯卡 將是迄今為止印度打造的最大硅片

    Intel正全力打磨“三進宮”的獨立顯卡產品,首席架構師Raja Koduri本周發推文確認,Xe HP(高性能Xe核心)由印度團隊設計,已達成里程碑,預計將是迄今為止印度打造的最大硅片,甚至是世界最大的硅片,堪稱“爸爸級”。
    的頭像 發表于 12-06 15:58 ?4714次閱讀

    比亞迪拿下荷蘭巨額訂單 是迄今為止歐洲最大的純電動大巴訂單

    據國內媒體報道,12月6日,比亞迪中標荷蘭259臺純電動大巴訂單,與歐洲公交運營商凱奧雷斯(Keolis)荷蘭分公司簽署協議。據比亞迪介紹,此次訂單涉及比亞迪巴士家族多款車型,并且這也是迄今為止歐洲最大的純電動大巴訂單。
    發表于 12-09 13:35 ?1562次閱讀

    5G將是迄今為止最安全的無線傳輸技術

    來自Light Reading的報道稱,無線行業人士認為,5G將是迄今為止最安全的無線傳輸技術。但是不斷有研究報告稱,研究人員持續在5G標準中發現漏洞。
    發表于 12-09 14:43 ?1397次閱讀

    Facebook發布概念眼鏡_迄今為止最薄的VR顯示器

    據外媒報道,Facebook近日發布了一項新產品消息——一款基于折疊全息光學技術的概念眼鏡,事實證明它或許是“迄今為止最薄的VR顯示器”。Facebook的AR/VR研發部門展示了這款全新VR顯示器的兩個亮點功能:基于偏振的光學“折疊”和全息鏡頭。
    發表于 08-31 17:36 ?1089次閱讀

    MIT打造出號稱迄今為止最精確的原子鐘

    據外媒報道,日前,美國麻省理工學院(MIT)的研究者們打造出號稱是迄今為止最精確的原子鐘。
    的頭像 發表于 12-18 11:52 ?2730次閱讀

    三星電子開始量產迄今為止最先進的數據中心SSD

    三星電子宣布,已經開始量產該公司迄今為止最為先進的數據中心SSD,型號為“PM9A3”。
    的頭像 發表于 02-25 09:54 ?1963次閱讀

    三星開始量產迄今為止最強的數據中心SSD

    三星電子宣布,已經開始量產該公司迄今為止最為先進的數據中心SSD,型號為“PM9A3”。
    的頭像 發表于 02-25 10:25 ?2146次閱讀

    iPhone13缺芯減產?供應商辟謠 今年迄今為止沒有削減訂單

    蘋果組件供應商聲稱今年迄今為止沒有削減訂單,但是由于芯片短缺問題,蘋果產品的生產的確會面臨挑戰。
    發表于 10-14 10:56 ?2153次閱讀

    研究人員發現了迄今為止最快的半導體

    科學家們發現了他們所說的迄今為止最快、最高效的半導體。盡管這種新材料是用地球上最稀有的元素之一制成,但研究人員表示,有可能會發現由更豐富的材料制成的替代物,其運行速度相當快。
    的頭像 發表于 11-08 16:28 ?841次閱讀

    Stability AI推出迄今為止更小、更高效的1.6B語言模型

    Stability AI 宣布推出迄今為止最強大的小語言模型之一 Stable LM 2 1.6B。
    的頭像 發表于 01-23 10:11 ?1138次閱讀
    Stability AI推出<b class='flag-5'>迄今為止</b>更小、更高效的1.6B語言<b class='flag-5'>模型</b>