2021年人工智能指數(The 2021 AI Index)提供了就業、出版物、多樣性等方面的見解。
2021年人工智能指數報告長達222頁,如果你還沒來得及閱讀,別擔心,我們已經幫你劃重點啦。這份由斯坦福人類中心人工智能研究所(Stanford Institute for Human-Centered Artificial Intelligence)編制的海量文件中,充斥著大量的數據和圖表,我們挑選出了15份,提供了人工智能當前狀態的快照。
感興趣的讀者可以深入到報告中了解更多信息;它包含關于研發、技術性能、經濟、人工智能教育、人工智能應用的道德挑戰、人工智能的多樣性、人工智能政策和國家戰略的章節。
1. We’re Living in an AI Summer
人工智能研究正在蓬勃發展:2019年發表了超過12萬篇經同行評審的人工智能論文。報告還指出,2000年至2019年間,人工智能論文在所有同行評議論文中的比例從0.8%上升到2019年的3.8%。
2. China Takes Top Citation Honors
中國研究人員發表了最具同行評議的人工智能論文 -- 在2017年率先做到了這一點。今年的消息是,截至2020年,中國研究人員在AI期刊上發表的論文獲得的引用比例最大。人工智能指數指導委員會聯合主任Jack Clark告訴IEEE Spectrum,“這些數據似乎是中國學術成功的指標,也是不同國家不同人工智能生態系統的反映。”
3. Faster Training = Better AI
這些數據來自MLPerf,這是一種客觀地對機器學習系統的性能進行排序的方法。來自不同公司的圖像分類器系統在標準ImageNet數據庫上進行培訓,并根據培訓所需的時間進行排名。2018年,用6.2分鐘訓練出最佳系統;在2020年,只花了47秒。這一非凡的進步是通過采用專門為機器學習設計的加速器芯片實現的。
報告指出了這種加速的影響:“想象一下等待幾秒鐘系統訓練和等待幾個小時之間的區別,以及這種區別對研究人員探索的想法的類型和數量意味著什么,以及它們可能有多大的風險。”
4. AI Doesn’t Understand Coffee Drinking
在過去的幾年里,人工智能已經非常非常擅長靜態圖像識別;計算機視覺的下一個前沿是視頻。研究人員正在構建一個系統,可以從視頻片段中識別各種活動,因為這種類型的識別如果移植到現實世界中(想想自動駕駛汽車、監控攝像頭等)可能會非常有用。性能的一個基準是ActivityNet數據集,它包含總共20000個視頻的近650個小時的片段。在其中顯示的200項日常生活活動中,人工智能系統在2019年和2020年最難識別咖啡飲用活動。不管怎樣,這是未來幾年需要關注的領域。
5. Language AI Is So Good, It Needs Harder Tests
自然語言處理(natural language processing,NLP)的迅速崛起似乎正跟隨計算機視覺的發展軌跡,在過去的十年中,計算機視覺從一個學術子專業發展到廣泛的商業應用。如今的NLP也以深度學習為動力,AI Index的Clark說,“它繼承了計算機視覺工作的策略,比如對大型數據庫進行培訓,并針對特定應用進行微調。我們看到這些創新很快就進入了人工智能的另一個領域,”他說。
衡量NLP系統的性能已經變得很棘手:“學者們提出了他們認為沒有人能擊敗的指標,然后一個系統在六個月內出現并擊敗了它,”Clark說。這張圖表顯示了兩個版本的閱讀理解測試的表現,在這個測試中,人工智能語言模型必須根據一段文字回答多項選擇題。版本2.0通過包含無法回答的問題使任務變得更加困難,模型必須確定這些問題和回避回答的情況。在第一個版本中,一個模型用了25個月的時間超越了人類的表現,但在更艱巨的任務中,一個模型只用了10個月就擊敗了人類。
6. A Huge Caveat
是的,用于語音識別和文本生成等任務的語言模型總體上已經非常好了。但它們有一些特定的缺陷,如果不加以解決,可能會影響其商業用途。許多人都存在著這樣一種問題 -- 帶有偏見,比如在一部分人身上表現不佳,或者產生反映歷史偏見的文本。這里的例子顯示了業內領先公司的語音識別程序的錯誤率。
這里有一個更大的偏見問題困擾著所有形式的人工智能,包括計算機視覺和決策支持工具。研究人員測試他們的系統的性能,但很少有人測試他們的系統的有害偏見。
7. The AI Job Market Is Global
LinkedIn的數據顯示,巴西、印度、加拿大、新加坡和南非的人工智能招聘在2016年至2020年間增長最快。這并不意味著這些國家絕對擁有最多的就業機會(美國和中國繼續占據那里的榜首位置),但看看這些國家在大力推動人工智能方面會出現什么,將是一件有趣的事情。LinkedIn發現,COVID-19并沒有影響2020年人工智能領域的招聘。
值得注意的是,在印度和中國,只有一小部分員工在LinkedIn上有個人資料,因此這些國家的數據可能并不完全具有代表性。
8. Corporate Investment Can’t Stop, Won’t Stop
資金繼續涌入。2020年,全球企業對人工智能的投資飆升至近680億美元,比上年增長40%。
9. The Startup Frenzy Is Over
上一張圖表顯示,私人投資仍在逐年增加,但速度較慢。這張圖表顯示,這些資金正被引導到更少的人工智能初創公司。雖然COVID-19可能對創業活動產生了影響,但創業公司數量的下降是從2018年開始的明顯趨勢。這似乎是一個產業成熟的信號。
10. The COVID Effect
雖然人工智能的許多趨勢基本上沒有受到COVID-19的影響,但這張圖表顯示,2020年的私人投資傾向于在世界應對COVID-19中發揮重要作用的某些行業。制藥相關公司的投資熱潮最為明顯,但edtech和游戲資金的增加似乎也有可能與學生和成年人去年在電腦前花了很多時間有關。
11. Risks? There are Risks?
在電信、金融服務和汽車等行業,企業正在穩步增加對人工智能工具的采用。然而,大多數公司似乎不知道或不關心這項新技術帶來的風險。在麥肯錫的一項調查中,當被問及他們認為哪些風險相關時,只有網絡安全問題在半數以上的受訪者中得到了登記。與人工智能相關的倫理問題,如隱私和公平,是當今人工智能研究中最熱門的話題之一,但顯然商業界還沒有收到備忘錄。
12. PhDs Hear the Siren Call of Industry
公平地說,學術工作只有這么多。雖然大學在本科和研究生階段都增加了人工智能相關課程的數量,終身教職員工的數量也相應增加,但學術界仍然無法吸收每年向世界釋放的越來越多的新的人工智能博士。這張僅代表北美博士畢業生的圖表顯示,這些畢業生中的絕大多數正在獲得行業工作。
13. Ethics Matter
企業可能還不那么關心人工智能倫理,但研究人員越來越關心。許多小組正在研究人工智能系統的不透明決策(稱為可解釋性問題)、嵌入式偏見和歧視以及隱私入侵等問題。下表顯示了在人工智能會議上與倫理相關的論文的增加,人工智能指數的Clark認為這是一個令人鼓舞的跡象。他指出,由于參加會議的學生很多,“再過幾年,就會有一大批人在這種環境下進入這個行業。” 報告強調,人工智能系統中偏差的定量測試才剛剛開始出現。創建這些評估“感覺像是人工智能科學領域的一個新的部分,” Clark說。
14. The Diversity Problem, Part 1
解決人工智能系統中嵌入的偏見和歧視的一種方法是確保構建這些系統的群體的多樣性。這并不是一個激進的概念。然而,在學術界和工業界,人工智能勞動力“仍然以男性為主,缺乏多樣性,”報告指出。通過這張圖表,加上計算機研究協會年度調查的數據,顯示在北美與人工智能相關的博士研究生中,女性只占20%左右。
15. The Diversity Problem, Part 2
來自同一項調查的數據講述了一個關于種族/民族認同的類似故事。考慮到這個問題在即將畢業的博士們看來非常明顯,對其進行進一步研究可能是有意義的。有許多優秀的STEM項目,重點關注女孩和代表性不足的少數民族。
原文標題:2021年這15張圖表 帶你理解人工智能
文章出處:【微信公眾號:IEEE電氣電子工程師學會】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
責任編輯:haq
-
AI
+關注
關注
87文章
34296瀏覽量
275487 -
人工智能
+關注
關注
1804文章
48742瀏覽量
246681
原文標題:2021年這15張圖表 帶你理解人工智能
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
普強信息入選2025人工智能感知層創新榜單
2025年人工智能會發生哪些變化
中國信通院魏亮:2024人工智能產業十大關鍵詞解讀

評論