在日前舉辦的英偉達 GTC China 2019大會上,“教主”黃仁勛發布了一系列新品,其中TensorRT 的最新版本TensorRT 7令人矚目,相比去年發布的TensorRT 5,TensorRT 7 可支持各種類型的 RNN、transformer、CNN,能夠融合水平與垂直方向的運算,支持 1000 多種不同的計算變換和優化。黃仁勛舉例,有了 TensorRT 7 的支持,在 GPU 上編譯會話模型只需要0.3秒。
TensorRT 7的典型應用,是支持交互式會話AI,為實現更加智能的AI人機交互打開了新大門。在大會期間,英偉達加速計算產品管理總監Paresh Kharya等人接受采訪,對TensorRT 7新平臺、兼容ARM等熱門話題進行了解讀。
支撐會話式AI全流程
Paresh Kharya介紹,AI技術正在取得長足進展,最新的應用包括會話式AI和推薦系統。其中,會話式AI是一個非常復雜的任務,需要AI理解語音、文本、語言,整個過程分為三個部分:識別你所說的,將你所說的話轉化為文字,理解這些文字并轉化成語言再說出來。隨著英偉達不斷發布新版本,TensorRT 7可以完成三個流程計算,從語音識別到語義理解再到語音輸出。
“要想把會話式AI做得有用,需要符合兩個條件,要在300毫秒內將整個三部分完成,而且要完成的非常智能。在這個過程當中,有非常多的復雜模型需要計算,Tensor RT也在不斷完善。” Paresh Kharya表示。
“推薦系統也是至關重要的一環,甚至已成為了互聯網最重要的引擎。” Paresh Kharya強調,用戶面臨的選擇越來越多,網絡的信息量呈現爆炸式增長,包括商品、視頻,以及各類選擇的參數的數量都在爆炸式增長。“商品達到數十億級別,網絡視頻百萬量級增長,新聞每天都在產生海量數據。阿里巴巴、百度,都使用了英偉達的平臺支持他們的推薦系統。”
這些信息在實時、動態的變化過程中,只有不斷對模型進行訓練,才可以有效地推薦。訓練模型需要大量算力,英偉達提供了不斷更新的各類工具和軟件,比如最新的軟件Tensor RT 7,支持各類模型在各種情景下的部署,支持上百萬的用戶在每秒內做數十億次的搜索。
例如,阿里的邊緣系統如果在英偉達的GPU上跑,每秒可以做780次查詢;但是如果用CPU,每秒只能做3次查詢。
與ARM合作,給客戶更多選擇
本次大會上,英偉達還宣布ARM處理器可以使用其GPU加速技術、NVIDIA Magnum IO套件,以及在Microsoft Azure上使用的新型云加速GPU超級計算機等。換句話說,英偉達將全方位擴展高性能計算領域。
Paresh Kharya指出,ARM是被業界廣泛使用的架構,服務全球1500億臺設備。其成功的一個重要原因是開放平臺,各家公司都能夠在ARM架構上進行創新,ARM也能夠提供互聯、內存、CPU內核、計算能力等各種功能。英偉達將通過CUDA平臺和ARM架構進行兼容,在高性能計算領域,給客戶更多選擇。
“加速計算和過去以CPU為基礎的計算很不一樣,性能提升是20、30甚至是100倍的。原因不僅是在架構上進行了設計,更重要的是通過軟件優化和支撐。比如我們有各種各樣的平臺,像應用在醫療領域的Clara平臺,應用在自動駕駛領域的Drive以及Isaac,做到了硬件和軟件的結合。” Paresh Kharya表示。
當前,對于GPU,業界既用于圖像處理,也有一些特別的客戶會剝離圖像處理能力,專注于加速技術應用。Paresh Kharya認為,英偉達豐富的產品線,能夠滿足客戶的差異化需求,例如應用于數據中心的GPU就沒有圖像處理部分,通過Tensor Core做AI加速計算。一些新品如RTX6000、RTX8000,則圖像處理和AI加速功能兼具。“我們的優勢是統一的架構應用于各種工作負載當中實現加速計算,這意味著在各個行業中、各種各樣的商業機會。”
業界人士云集GTC China 2019
責任編輯:gt
-
處理器
+關注
關注
68文章
19805瀏覽量
233530 -
ARM
+關注
關注
134文章
9306瀏覽量
375003 -
英偉達
+關注
關注
22文章
3921瀏覽量
93109
發布評論請先 登錄
評論