女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型的未來在哪?究竟什么是好的大模型?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2021-10-27 08:46 ? 次閱讀

自2018年谷歌發布BERT以來,預訓練大模型經過三年的發展,以強大的算法效果,席卷了NLP為代表的各大AI榜單與測試數據集。2020年OpenAI發布的NLP大模型GPT-3,實現了千億級數據參數。GPT-3除了具備傳統的NLP能力之外,還可以算術、編程、寫小說、寫論文摘要,一時之間成為科技圈中的爆點。到2021年,我們可以看到各大學術機構、科技企業都在打造自己的大模型,并且對其能力邊界、技術路徑進行了極大拓展。

身在科技圈中會有明顯的感受,今年大模型的會議與討論越來越多,預訓練大模型本身的優勢我們在很多新聞中都感受到了。打造大模型并不是一件輕松容易的事情,需要耗費大量的數據、算力資源等,大模型的意義是為了讓算法模型集中化,但是市場中有條件的企業和機構都開始耗費大量資源自研大模型。大模型算法模型的集中化優勢,經過這些機構對集中資源的分化,又有種煙囪式的割裂。

其實現實可能只需要一個發展到極致化的大模型就足夠大家使用了,沒有必要人手一個。而且預訓練大模型的發展在這樣的模式下也會受到一些影響,而在這個態勢下也有一些趨勢與變化值得討論與關注。

大模型發展模式的卡點

BERT、GPT 等大規模預訓練模型(PTM)近年來取得了巨大成功,成為AI領域的里程碑。因為預訓練大模型的顯著優勢,現在AI社區的共識是采用它作為下游任務的開始,而不是從頭開始訓練數據、建立模型。

隨著產學研各界的深入研究,大模型在AI各界的地位得到不斷加強。一些機構和產業界對大模型的參與到角逐,使得其呈現出一種宣傳炫技般的畫面感受。這樣的發展模式很可能會給行業帶來一些不好的影響:

1.大模型成為一些機構和企業秀肌肉的軍備競賽,大家開始比拼各自參數集數量級。你百億級,我就千億級。數據集本身就有限,標榜自己的數據集越大,也意味著水分比較多,而在真實落地使用的情況方面,也并不不一定理想。算力資源和訓練時間消耗過大,并且也只限于部分行業的部分問題,普適性差。

2.國內預訓練模型的玩家們可用的中文數據集有限,就是我們知道的幾種主流常用數據來源。在有限的數據集里,大家使用的數據未免重復,而因此研究出來的大模型能力就比較接近。走相同的路徑做類似的事情,有點浪費資源與算力。

3.大模型是否優秀,不僅依賴數據的精度與網絡結構,也是對其與行業結合軟硬件協同能力的比拼。單純只強調低頭研發高參數集、強算力模型等的方向,輕視一些與行業的協同二次調試等問題,就會陷入閉門造車的局面,限制了落地的路,走不遠。

4.一些預訓練大模型經過極致化(數據、模型、算力)的發展后,也有可能面臨小眾、泛用性差的情形,比如一些高校研發的預訓練大模型只能在小眾的學術圈子里使用,無法工程化使用,最終淪為一次性的模型,浪費大量的資源。

雖然我們看到各種大模型在集中式爆發發展,但其實目前大模型行業還處于初始階段,面臨一些問題與卡點無可避免。行業內人士應該會更加敏感地體察到這些現象,誰也不會想要讓這些荊棘以常態的模式橫亙在發展前路上。大家花費精力激蕩腦力,想要發展的共識是打造出行業內唯一的模型。那么,對于行業來說,究竟什么樣的大模型才是最好的呢?

究竟什么是好的大模型?

在這場battle里,大模型向著規模極致化的方向發展。那么如何衡量大模型的能力,是一個繞不開的話題。衡量大模型能力的關鍵要素是,參數的規模和與細分行業結合對接的軟硬件協同能力。我們在各種新聞中經常可以看到,機構或者是企業用數據集或者是參數規模,以及跑分來彰顯自己的模型水平。

參數的規模決定了預訓練模型有多大。參數越大一般來說意味著大模型具備更多的能力,泛化性、通用性也更加強。成功的大模型背后,還需要大規模分布式訓練、并行計算、軟硬件協同優化等能力。

腦極體曾在GPT-3最火的時候,參與過一次試驗:用GPT-3寫個文章出來。我們給第三方提供了一些寫作的思路,想要看一下機器寫出來的效果怎么樣(其實是想看看自己離失業還有多久)。結果得到的反饋是GPT-3在理解能力方面很牛很強,但是讓它去生產一篇稿件,對于它來說還是比較復雜而且困難的一件事情。

另外,排隊等待使用的企業過多,間次使用等待的時間過長,,并且稿件本身也需要好幾天才能完成。看似一個簡單的寫稿需求,對無所不能的GPT-3來說應該是小case,結果無疾而終。存在類似小需求的企業應該還是有很多,而這些需求都需要排隊等待調用大量的算力,并且磨幾天才能產出,而花時間花錢結果還存疑。當時行業里最好的大模型落地都如此艱難,大模型的落地還是有點不理想。

好的大模型不僅僅需要模型、算力等本身性能方面強勁,關鍵也需要看與某垂直行業結合時產品化落地的能力是否實用。落地的大模型需要解決一些行業具體的問題,與行業結合時二次開發、對接的成本盡可能地小,否則它強勢的性能也只是空中樓閣,中看不中用。大模型需要工程落地的能力,從而打開更多的邊界,讓更多領域和企業來使用。

大模型的未來趨勢

從產業價值的角度來看,預訓練大模型帶來了一系列可能性,讓產學研各界看到了由弱人工智能走向強人工智能,走向工業化、集成化智能化的路徑。在這樣的驅動背景下,大模型也會有一些可預見的趨勢與發展。

1.我們知道事物的發展規律是優勝劣汏,在競爭的角逐中,一些標榜獨特性的小眾模型的泛化能力差,越獨特可能也就意味著越小眾,使用的范圍十分有限,可能會逐漸走向消亡。

2.崛起的大模型不僅僅是泛化性、落地能力強,創新性強、訓練數據規模大,也需要具備不斷生長革新的能力,也就是自我進化、智能化的能力。大模型的未來需要創新,也需要自我生長,向可持續、可進化的方向發展,架構上的革新會讓模型更加高效。

3.大模型能力的端側化,“芯片化”。將模型的一些運算存儲等能力像芯片一樣固化在一些端側硬件設備中,在使用的過程中不用在重裝的模型中耗時調用算力與數據,可以實現隨時調用隨時使用。現下的模型多是重裝大模型,使用的話需要調用龐大的算力和運行時間,未來的大模型會逐漸改變這種模式。

4.大模型的標準化與模塊化發展。大模型的評估未來會有標準化成熟的體系來衡量,這個體系也會是行業內公認的標準,用這個標準來衡量大模型的優劣而不是現下自賣自夸式的標榜。

目前我們在各大榜單上看到的分數來自于大型的數據集和算力模型,讓開發更加容易,調試與訓練的周期越來越短。但我們也知道大量的數據喂養出來的模型回報并不是百分百地正確。喂養的數據知識的極大擴展也無法保證結果的確定性,這也是大模型最大的弱點,而這也意味著對于大模型的探索需要持續的迭代發展。

預訓練大模型是面向通用智能最高階的探索,也是AI持續變革的核心發展方向與動力,隨著AI不斷深入產業與各學科領域的過程中,大模型在軍備battle和百家爭鳴,算力、數據、規模都會朝著極致化的方向發展。未來新的預訓練大模型將會與那些計算量巨大的科學領域,比如制藥、腦科學、醫療、生物計算等領域相互結合,帶來巨大的價值。

我們的那些懸而未解的難題,在未來都會有答案,無論最終這個結論正確與否,都能夠為前沿的發展、探索帶來很多靈感與角度,世界的多面體將會被打開。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34274

    瀏覽量

    275455
  • 數據集
    +關注

    關注

    4

    文章

    1223

    瀏覽量

    25280
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22488
  • 訓練模型
    +關注

    關注

    1

    文章

    37

    瀏覽量

    3935
  • 算力
    +關注

    關注

    2

    文章

    1147

    瀏覽量

    15459
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    FA模型卡片和Stage模型卡片切換

    卡片切換 卡片切換主要包含如下三部分: 卡片頁面布局:FA模型卡片和Stage模型卡片的布局都采用類web范式開發可以直接復用。 卡片配置文件:FA模型的卡片配置在config.json中
    發表于 06-06 08:10

    FA模型和Stage模型API切換概述

    API切換概述 FA模型和Stage模型由于線程模型和進程模型的差異,部分接口僅在FA模型下才能使用,針對這部分接口在SDK的接口中有FA
    發表于 06-06 06:29

    從FA模型切換到Stage模型時:module的切換說明

    module的切換 從FA模型切換到Stage模型時,開發者需要將config.json文件module標簽下的配置遷移到module.json5配置文件module標簽下,具體差異
    發表于 06-05 08:16

    FA模型訪問Stage模型DataShareExtensionAbility說明

    FA模型訪問Stage模型DataShareExtensionAbility 概述 無論FA模型還是Stage模型,數據讀寫功能都包含客戶端和服務端兩部分。 FA
    發表于 06-04 07:53

    KaihongOS操作系統FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統中,FA模型(Feature Ability)和Stage模型是兩種不同的應用模型
    發表于 04-24 07:27

    DLP650LNIR芯片安裝部分的三維機械模型在哪兒下載?

    請問,想設計DLP650LNIR部分的板卡,DLP650LNIR芯片安裝部分有一些結構件,在哪能下載到這些三維機械模型
    發表于 02-24 07:25

    【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙

    渴望通過閱讀這本書,能夠揭開大模型神秘的面紗,深入探究其內在的奧秘,看看它究竟是如何改變我們的生活,又將引領我們走向怎樣的未來。 作者在書的開頭,將大模型發展歷程做了回顧,介紹了Ope
    發表于 12-24 13:10

    【「大模型啟示錄」閱讀體驗】營銷領域大模型的應用

    解目標市場,從而制定更有效的營銷策略。 大模型擅長分析,可以非常的提煉IP,為決策者提供輔助參考。 基于消費者的歷史數據和行為模式,大模型能夠提供個性化的產品或服務推薦。這種個性化的推薦方式能夠顯著提高
    發表于 12-24 12:48

    【「大模型啟示錄」閱讀體驗】對大模型更深入的認知

    能在教育、設計、游戲、廣告等領域發揮如此重要的作用。這些內容讓我對大模型的潛力充滿了期待,也讓我對AI技術的未來充滿了好奇。 書中還提到了大模型與DevOps的結合,以及它們如何提高軟件的可觀測性。這
    發表于 12-20 15:46

    【「大模型啟示錄」閱讀體驗】如何在客服領域應用大模型

    的功能和性能。因此,選擇具有良好可擴展性的模型可以適應未來業務的發展需求。在客服領域,處理客戶數據時可能涉及敏感信息。因此,在選擇模型時需要考慮其安全措施和隱私保護能力。確保數據傳輸和存儲過程中的安全
    發表于 12-17 16:53

    【「大模型啟示錄」閱讀體驗】對本書的初印象

    總是從目錄開始,這有助于我快速了解書籍的結構和主要內容。《大模型啟示錄》的目錄內容豐富,覆蓋了大模型的多個方面,從基礎概念到實際應用,再到對未來的展望。每一章都充滿了深刻的見解和實用的信息,我相信通過
    發表于 12-16 14:05

    什么是大模型、大模型是怎么訓練出來的及大模型作用

    本文通俗簡單地介紹了什么是大模型、大模型是怎么訓練出來的和大模型的作用。 ? 什么是大模型模型,英文名叫Large Model,大型
    的頭像 發表于 11-25 09:29 ?1.3w次閱讀
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么訓練出來的及大<b class='flag-5'>模型</b>作用

    未來AI大模型的發展趨勢

    未來AI大模型的發展趨勢將呈現多元化和深入化的特點,以下是對其發展趨勢的分析: 一、技術驅動與創新 算法與架構優化 : 隨著Transformer架構的廣泛應用,AI大模型在特征提取和并行計算效率
    的頭像 發表于 10-23 15:06 ?1750次閱讀

    ai大模型和傳統ai的區別在哪

    AI大模型和傳統AI的區別主要體現在以下幾個方面: 數據量和訓練規模 AI大模型通常需要大量的數據進行訓練,以獲得更好的性能。相比之下,傳統AI模型往往使用較小的數據集進行訓練。例如,Google
    的頭像 發表于 07-16 10:06 ?2450次閱讀

    MATLAB預測模型哪個

    在MATLAB中,預測模型的選擇取決于數據類型、問題復雜度和預測目標。以下是一些常見的預測模型及其適用場景的介紹: 線性回歸(Linear Regression): 線性回歸是最基本的預測模型之一
    的頭像 發表于 07-11 14:31 ?656次閱讀