讓AI模仿人類的學習方式,結果會怎樣?
8月26日,阿里達摩院語言技術實驗室取得一系列突破,斬獲自然語言處理(NLP)領域6大權威技術榜單冠軍。據介紹,參與競賽的6項自研AI技術均采用模仿人類的學習模式,全方位提升了機器的語言理解能力,部分能力甚至已超越人類。目前,這些技術均已大規模應用于閱讀理解、機器翻譯、人機交互等場景。
據悉,過去幾年,AI在圖像識別、語音識別等方面已逐步超越人類水平,但在復雜文本語義的理解上,AI與人類尚有差距,其主要原因就是傳統AI學習文本知識效率較低。
為此,業界提出了一種模仿人類的學習思路,即先讓AI在大規模的網頁和書籍文字中進行訓練,學習基本的詞法、語法和語義知識,然后再在固定領域內的文本上進行訓練,學習領域專有知識。
這一思想就是預訓練語言模型的核心創新。自Google提出模仿人類注意力機制的BERT模型以來,預訓練語言模型已成為NLP領域的熱點研究方向。
達摩院早在2018年就開始布局通用的預訓練語言模型,并逐漸將該思路拓展到了多語言、多模態、結構化和篇章文本理解和文本生成領域,如今已建立一套系統化的深度語言模型體系,其自研通用語言模型StructBERT、多語言模型VECO、多模態語言模型StructVBERT、生成式語言模型PALM等6大自研模型分別刷新了世界紀錄。
達摩院自研模型位居GLUE榜單第一名
其中,StructBERT能讓機器更好地掌握人類語法,使機器在面對語序錯亂或不符合語法習慣的詞句時,仍能準確理解并給出正確的表達和回應,大大提高機器對詞語、句子以及語言整體的理解力。該模型以平均分90.6分在自然語言處理領域權威數據集GLUE Benchmark中位居第一,顯著超越人類水平(87.1分)。
達摩院語言技術實驗室團隊表示:“實驗室的目標是讓AI掌握人類知識的基礎技術,預訓練語言模型的誕生使得AI像人一樣學習新知識成為可能,未來達摩院會全面對外開放這些技術,讓特定領域的AI變得更加智能。”
過去兩年,阿里獲得了30多項NLP領域頂級賽事世界冠軍,有100多篇相關頂會論文; 阿里自然語言技術已在金融、新零售、通訊、互聯網、醫療、電力、客服等領域服務超十億用戶和數萬企業客戶。
-
人機交互
+關注
關注
12文章
1236瀏覽量
56207 -
AI
+關注
關注
87文章
34196瀏覽量
275345 -
阿里達摩院
+關注
關注
0文章
30瀏覽量
3426
發布評論請先 登錄
長城汽車環塔車隊斬獲2025環塔拉力賽多項冠軍
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內榜首,一個全球第一

【「零基礎開發AI Agent」閱讀體驗】+關于AI Agent開發入門的第一印象與相關官方文檔和社區資料的內容補充
普華基礎軟件蒞臨阿里巴巴達摩院調研交流
深演智能斬獲三項國家級權威認證
巨人網絡與阿里云深化AI合作
馬斯克預言:AI將全面超越人類智力
格陸博科技榮登兩大權威機構榜單
華為云云原生中間件 DCS?&?DMS?通過中國信通院與全球 IPv6 測試中心雙重能力檢測

RISC-V,即將進入應用的爆發期
榮耀MagicOS 9.0成功獲得信通院權威行業認證
三大權威機構:高端智能鎖品牌德施曼拿下全球銷量第一

評論