女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI推出了一種自然語言處理模型

電子工程師 ? 來源:lq ? 2019-04-29 18:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

幾個月前,OpenAI推出了一種自然語言處理模型,能夠從維基百科以及亞馬遜的產品評價中生產連貫的文本段落。

最近,其開放的OpenAI Five 人工智能系統在全網公開賽中放出了驕人戰績——擊敗了99.4%的玩家。在和3萬多名人類玩家的對壘中,只輸了42場。

OpenAI的大招還不止如此。今日凌晨,OpenAI發博文表示,在這些和其他研究的基礎上,他們開發了一種深度神經網絡稀疏 Transformer(Sparse Transformer),可以實現生成式模型,在文本、圖像、聲音等序列預測上都創造了新紀錄。并且可預測的序列長度比之前可能的長度長了30倍。

“人工智能研究的一個現有挑戰是如何對復雜數據中遠距離,且較精細的相互依賴性進行建模,”OpenAI技術人員Rewon Child和軟件工程師Scott Gray在博客文章中寫道。“過去,在這些數據上使用的模型往往只是針對一個域專門設計的,或者是很難擴展到超過幾千個元素的序列。相比之下,我們的模型可以使用上百層對有上萬元素的序列進行建模,并且在多個域中實現最先進的性能。

這次稀疏 Transformer 研究的基礎源于17年Google Brain設計的一種新型的網絡結構,即《Attention Is All You Need》中提出的Transformer。不使用 RNN、CNN 模型,只使用 attention 機制構成的解碼編碼結構就達到了很好的效果。為谷歌團隊于前年 6 月所提出的 NLP 經典之作,同時被 2017 NIPS 接收(2017 錄取率約 20 %),引用次數已達1566次,并還在持續增加中。

與所有深度神經網絡一樣, Transformer包含排列在互連層中的神經元(本質用數學函數模擬生物神經元),這些層從輸入數據傳入“信號”,并緩慢調整每個連接的權重。這是模型如何提取特征并學習以及如何進行預測的關鍵點。在 Transformer 中,每個輸出元素與每個輸入元素都相連,它們之間的權重是動態計算出來的,而過程稱為注意力。

上圖:用稀疏 Tansformer 重計算(recomputaing)注意力矩陣前后的內存使用情況。

注意力機制通常需要為每個層和每個所謂的注意頭創建一個注意力矩陣,從計算的角度來看這不是特別有效。例如,包含24,000個樣本的2秒音頻片段或64低分辨率圖像的語料庫可能分別占用590GB和154GB內存,而這遠遠高于用于訓練AI模型的GPU的負載。

OpenAI的方法通過重新計算矩陣來最小化內存使用量,上面描述的590GB的內存需求在重新計算后僅需9.2GB;154GB可壓縮到2.4GB。于是,實際上最大的內存開銷就變得與層數無關了,因此就允許所述模型進行“非常深”的深度來進行訓練。

由于單個注意力矩陣對于龐大的數據量輸入并不是特別實用,因此本文提出的深度神經網絡實現了稀疏注意力模式,其中每個輸出僅從輸入子集計算權重,對于跨越較大子集的神經元層,通過矩陣因子分解來轉換矩陣,他們認為這是保持神經網絡層學習數據模式能力所必需的一步。

上圖:使用稀疏Transformer生成圖像

通常,實現稀疏注意力需要將查詢和關鍵矩陣進行“切片”,因此為了簡化實驗,OpenAI 實現了一組塊稀疏核,這些核在 GPU 上高效地執行這些操作。另外,OpenAI開源了這些內核,并在Github上提供示例稀疏注意函數。

https://github.com/openai/sparse_attention

根據OpenAI的博客介紹到,即使經過改進,自回歸序列生成對于非常高分辨率的圖像或視頻來說仍然是不切實際的。不過,提出的優化注意力操作可能是一次有益的探索,可以和其他(如多尺度方法)方法相結合來對高維數據進行建模。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 建模
    +關注

    關注

    1

    文章

    317

    瀏覽量

    61588
  • 人工智能
    +關注

    關注

    1806

    文章

    49012

    瀏覽量

    249384
  • 自然語言處理

    關注

    1

    文章

    628

    瀏覽量

    14156

原文標題:OpenAI提出稀疏Transformer模型:文本、圖像、聲音一網打盡,將可預測序列長度提高30倍

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何優化自然語言處理模型的性能

    優化自然語言處理(NLP)模型的性能是個多方面的任務,涉及數據預處理、特征工程、模型選擇、
    的頭像 發表于 12-05 15:30 ?1697次閱讀

    如何使用自然語言處理分析文本數據

    使用自然語言處理(NLP)分析文本數據是個復雜但系統的過程,涉及多個步驟和技術。以下是個基本的流程,幫助你理解如何使用NLP來分析文本數據: 1. 數據收集 收集文本數據 :從各種
    的頭像 發表于 12-05 15:27 ?1574次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的個核心領域,它使計算機能夠從數據中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為機器學習提供了一種強大的工具,用于從大
    的頭像 發表于 12-05 15:21 ?1981次閱讀

    語音識別與自然語言處理的關系

    在人工智能的快速發展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓機器能夠理解、解釋和生成人類
    的頭像 發表于 11-26 09:21 ?1497次閱讀

    什么是LLM?LLM在自然語言處理中的應用

    隨著人工智能技術的飛速發展,自然語言處理(NLP)領域迎來了革命性的進步。其中,大型語言模型(LLM)的出現,標志著我們對語言理解能力的
    的頭像 發表于 11-19 15:32 ?3644次閱讀

    ASR與自然語言處理的結合

    。以下是對ASR與自然語言處理結合的分析: 、ASR與NLP的基本概念 ASR(自動語音識別) : 專注于將人類的語音轉換為文字。 涉及從聲音信號中提取特征,并將這些特征映射到文本。 NLP(
    的頭像 發表于 11-18 15:19 ?1025次閱讀

    卷積神經網絡在自然語言處理中的應用

    自然語言處理是人工智能領域的個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,卷積神經網絡(CNNs)作為一種
    的頭像 發表于 11-15 14:58 ?803次閱讀

    循環神經網絡在自然語言處理中的應用

    自然語言處理(NLP)是人工智能領域的個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,循環神經網絡(RNN)因其在
    的頭像 發表于 11-15 09:41 ?813次閱讀

    使用LSTM神經網絡處理自然語言處理任務

    自然語言處理(NLP)是人工智能領域的個重要分支,它旨在使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,特別是循環神經網絡(RNN)及其變體——長短期記憶(LSTM)網
    的頭像 發表于 11-13 09:56 ?1159次閱讀

    自然語言處理與機器學習的區別

    在人工智能的快速發展中,自然語言處理(NLP)和機器學習(ML)成為了兩個核心的研究領域。它們都致力于解決復雜的問題,但側重點和應用場景有所不同。 1. 自然語言處理(NLP) 定義:
    的頭像 發表于 11-11 10:35 ?1545次閱讀

    使用LLM進行自然語言處理的優缺點

    自然語言處理(NLP)是人工智能和語言學領域的個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型
    的頭像 發表于 11-08 09:27 ?2443次閱讀

    Llama 3 在自然語言處理中的優勢

    自然語言處理(NLP)的快速發展中,我們見證了從基于規則的系統到基于機器學習的模型的轉變。隨著深度學習技術的興起,NLP領域迎來了新的突破。Llama 3,作為個假設的先進NLP
    的頭像 發表于 10-27 14:22 ?729次閱讀

    AI大模型自然語言處理中的應用

    AI大模型自然語言處理(NLP)中的應用廣泛且深入,其強大的語義理解和生成能力為NLP任務帶來了顯著的性能提升。以下是對AI大模型在NLP中應用的介紹:
    的頭像 發表于 10-23 14:38 ?1540次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    的表達方式和生成能力。通過預測文本中缺失的部分或下個詞,模型逐漸掌握語言的規律和特征。 常用的模型結構 Transformer架構:大語言
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    。首先結合ChatGPT的4次迭代升級介紹了什么是大語言模型,大語言模型的特點:參數多、通用性強;之后用較大的篇幅詳細講解了自然語言
    發表于 07-25 14:33