香港浸會大學(HKBU)的研究人員與來自騰訊機器學習的團隊合作,創造了一種新技術,可在保持準確性的同時以前所未有的速度訓練人工智能(AI)機器。
在實驗期間,研究小組分別在短短4分鐘和6.6分鐘內訓練了兩個流行的深度神經網絡,分別稱為AlexNet和ResNet-50。以前,最快的培訓時間是AlexNet 11分鐘,ResNet-50 15分鐘。
AlexNet和ResNet-50是基于ImageNet建立的深度神經網絡,ImageNet是用于視覺識別的大規模數據集。經過訓練后,系統便能夠識別并標記給定照片中的物體。結果比以前的記錄快得多,并且勝過所有其他現有系統。
機器學習是一組數學方法,可使計算機從數據中學習,而無需人工進行編程。然后,可以將所得的算法應用于AI中使用的各種數據和視覺識別任務。
浸大的團隊由朱小文教授和博士組成。來自計算機科學系的學生Shi Shaohuai。儲教授說:“我們提出了一種新的優化訓練方法,可以在不損失準確性的情況下顯著提高最佳輸出。在AI訓練中,研究人員力求更快地訓練其網絡,但這會導致準確性下降。結果,訓練在保持精度和精度的同時,高速進行機器學習的模型是科學家們的重要目標。”
朱教授說,訓練AI 機器所需的時間受計算時間和通信時間的影響。研究團隊在這兩個方面均取得了突破,創造了這一破紀錄的成就。
這包括采用一種稱為FP16的更簡單的計算方法來替代更傳統的FP32,從而使計算速度更快而又不損失準確性。由于通信時間受數據塊大小的影響,因此該團隊提出了一種名為“張量融合”的通信技術,該技術將較小的數據片段合并為較大的數據片段,優化了傳輸模式,從而提高了AI訓練期間的通信效率。
這項新技術可以用于大規模圖像分類,還可以應用于其他AI應用程序,包括機器翻譯;自然語言處理(NLP),以增強人類語言與計算機之間的交互;醫學影像分析;和在線多人戰斗游戲。
-
神經網絡
+關注
關注
42文章
4814瀏覽量
103568 -
人工智能
+關注
關注
1806文章
49008瀏覽量
249322 -
機器學習
+關注
關注
66文章
8501瀏覽量
134583
發布評論請先 登錄
無刷直流電機雙閉環串級控制系統仿真研究
研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾
NanoEdge AI Studio 面向STM32開發人員機器學習(ML)技術

哈佛新技術為先進機器視覺鋪平道路

騰訊AI助手“元寶”團隊調整至CSIG
【「具身智能機器人系統」閱讀體驗】+初品的體驗
研究人員利用激光束開創量子計算新局面

Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機器學習框架
名單公布!【書籍評測活動NO.51】具身智能機器人系統 | 了解AI的下一個浪潮!
高通與騰訊混元達成戰略合作
騰訊與Visa攜手,刷掌技術出海首站新加坡
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
AMD贊助多支FIRST機器人競賽團隊
人員定位技術有哪些?10種人員定位技術原理及應用場景介紹

評論