女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開發出一個新的語言模型,包含了超過1.6萬億個參數

ss ? 來源:陳述根本 ? 作者:陳根 ? 2021-01-19 15:29 ? 次閱讀

開發人工智能的語言模型,一直是人工智能的重要細分領域。人工智能語言模型應用包括搜索引擎、文字生成、個性化的對話工具以及軟件生成等。

2020年5月,OpenAI的一組研究人員發布了具有里程碑意義的AI模型GPT-3。GPT-3就是在570 GB的文本數據上訓練的語言模型,因此,就訓練數據和生成能力而言,GPT-3截至2020年都是最龐大的公開發布的語言模型。

此外,OpenAI的GPT-3一反之前死守基礎研究的思路,將 GPT-3 做成了一個服務,提供可以調用的 OpenAI API,并且向開放了少量體驗資格,使得拿到體驗資格的業界人士或學者等,開發出了一眾驚人的演示。

包括答題、翻譯、寫文章,甚至是數學計算和編寫代碼。而由GPT-3所寫的文章幾乎達到了以假亂真的地步,在 OpenAI 的測試中,人類評估人員也很難判斷出這篇新聞的真假,檢測準確率僅為 12%。

但現在,谷歌研究人員開發出一個新的語言模型,它包含了超過 1.6 萬億個參數,遠超 Open AI 開發的 GTP-3 的規模(1750 億個參數),成為迄今為止最大規模的人工智能語言模型,比之前谷歌開發過最大的語言模型 T5-XXL 的效率提高了 4 倍。

該語言模型使用 Switch Transformer 方法進行大規模訓練,這是一種“稀疏激活”技術,它只使用模型權重的子集或在模型中轉換輸入數據的參數,以有效降低計算密集度。

盡管在部分實驗中,該模型相比規模更小的模型得到了較低分數。但在相同的計算資源下,預訓練速度提高了7倍。這些改進擴展到多語言設置中,我們在所有101種語言中測量mT5基本版本的增益。最后,我們通過在“巨大的干凈的爬蟲語料庫”上預先訓練多達萬億個參數的模型,提高了語言模型的當前規模,并實現了比T5-XXL模型4倍的加速。

研究人員認為,稀疏性可以在未來賦予該模型在一系列不同媒體下多模態的優勢。這也為人工智能語言模型的深入研究提供了更多方向的參考。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34173

    瀏覽量

    275339
  • 人工智能
    +關注

    關注

    1804

    文章

    48691

    瀏覽量

    246426
  • 語言模型
    +關注

    關注

    0

    文章

    558

    瀏覽量

    10668
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    小白學大模型:從零實現 LLM語言模型

    在當今人工智能領域,大型語言模型(LLM)的開發已經成為熱門話題。這些模型通過學習大量的文本
    的頭像 發表于 04-30 18:34 ?311次閱讀
    小白學大<b class='flag-5'>模型</b>:從零實現 LLM<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    小白學大模型:訓練大語言模型的深度指南

    在當今人工智能飛速發展的時代,大型語言模型(LLMs)正以其強大的語言理解和生成能力,改變著我們的生活和工作方式。在最近的項研究中,科學家們為了深入了解如何高效地訓練大型
    的頭像 發表于 03-03 11:51 ?605次閱讀
    小白學大<b class='flag-5'>模型</b>:訓練大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的深度指南

    AI大語言模型開發步驟

    開發高效、準確的大語言模型復雜且多階段的過
    的頭像 發表于 12-19 11:29 ?718次閱讀

    語言模型開發框架是什么

    語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言
    的頭像 發表于 12-06 10:28 ?455次閱讀

    語言模型開發語言是什么

    在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大
    的頭像 發表于 12-04 11:44 ?589次閱讀

    云端語言模型開發方法

    云端語言模型開發復雜而系統的過程,涉及數據準備、模型選擇、訓練優化、部署應用等多個環節。
    的頭像 發表于 12-02 10:48 ?599次閱讀

    從零開始訓練語言模型需要投資多少錢?

    ,前言 ? 在AI領域,訓練大型語言模型(LLM)是
    的頭像 發表于 11-08 14:15 ?700次閱讀
    從零開始訓練<b class='flag-5'>一</b><b class='flag-5'>個</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>需要投資多少錢?

    語言模型如何開發

    語言模型開發復雜且細致的過程,涵蓋了數據準備、模型架構設計、訓練、微調和部署等多個階段
    的頭像 發表于 11-04 10:14 ?522次閱讀

    聯發科新代天璣旗艦芯片針對谷歌語言模型Gemini Nano優化

    近日,聯發科宣布了重要的技術進展——新代天璣旗艦芯片已經針對谷歌的大語言模型Gemini
    的頭像 發表于 10-09 16:44 ?734次閱讀

    TINA-TI里的運放SPICE模型包含有運放的差分、共模輸入電容參數嗎?

    (2.2pF+6.5pF+13pF)?我不知道這個內置的SPICE模型是否包含了差分輸入電容6.5pF和共模輸入電容13pF這兩參數?
    發表于 08-12 08:13

    Hugging Face科技公司推出SmolLM系列語言模型

    7月22日最新資訊,Hugging Face科技公司在語言模型領域再創新高,正式推出了SmolLM系列——款專為適應多樣計算資源而設計的緊湊型語言
    的頭像 發表于 07-23 16:35 ?602次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    上周收到《大語言模型應用指南》書,非常高興,但工作項目繁忙,今天才品鑒體驗,感謝作者編寫了部內容豐富、理論應用相結合、印刷精美的著作,也感謝電子發燒友論壇提供了
    發表于 07-21 13:35

    谷歌Gemma 2大語言模型升級發布,性能與安全性雙重飛躍

    近日,谷歌面向全球科研界與開發者群體隆重推出了全新升級的Gemma 2大語言模型,標志著人工智能技術在語言處理領域的又
    的頭像 發表于 07-02 10:20 ?683次閱讀

    谷歌發布新型大語言模型Gemma 2

    在人工智能領域,大語言模型直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發人員,正式發布了其最新研發的大
    的頭像 發表于 06-29 09:48 ?668次閱讀

    espidf自定義組件明明已經包含了應該包含的內容,為什么編譯直提示未包含?

    早上好,這是自定義組件,明明已經包含了應該包含的內容,為什么編譯直提示未包含,而且可以ct
    發表于 06-18 07:20