人工智能技術(shù)的蓬勃發(fā)展和智能應(yīng)用的不斷落地,正在深刻地影響和改變著我們的生活。GPU、NPU、FPGA等各類AI芯片為人工智能的發(fā)展提供了算力支撐,其中又以GPU應(yīng)用最為廣泛。接下來讓我們一起了解一下沐曦的首款GPU產(chǎn)品:曦思N100。
曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產(chǎn)品,針對產(chǎn)品性能,沐曦的架構(gòu)師們進行了兩大方向的優(yōu)化:
01要讓“計算算的快”
大家都知道GPU通用性好,適應(yīng)性強,但反向來說面向特定場景它可能并不是最優(yōu)解。針對AI應(yīng)用場景的特點,曦思N100采用了GPGPU+DLA的異構(gòu)架構(gòu),GPGPU可保持GPU的通用可編程性,而DLA(Deep Learning Accelerator)則可加速深度學(xué)習(xí)任務(wù)從而達到更高的計算性能,通過量身打造的推理軟件棧MacaRT可實現(xiàn)內(nèi)部計算資源的自動調(diào)度和優(yōu)化。
02要讓“數(shù)據(jù)跑的快”
曦思N100采用高帶寬低延遲的設(shè)計理念,高速片上網(wǎng)絡(luò)(High Speed Fabric)的應(yīng)用使各計算單元間的數(shù)據(jù)傳輸更加通暢,HBM2E高帶寬顯存則為存算交互提供了高速的數(shù)據(jù)通道,同時曦思N100還加持了目前最先進的PCIe5.0接口,不管是對內(nèi)還是對外的數(shù)據(jù)通路都是無比暢通的大道!
除了對計算性能的需求之外,很多人工智能的場景還涉及到大量的視頻圖像處理任務(wù),如果都用CPU來做,整體效率低下而且需要消耗很多CPU資源。針對這種情況,曦思N100在片內(nèi)集成了強大的視頻處理內(nèi)核,可支持視頻編解碼、圖像編解碼、圖像處理等功能。高達96路的視頻解碼功能,可在視頻智能分析等場景大幅降低單路分析成本。高達128路的視頻編碼功能則使其能夠在短視頻、視頻云等需要做高并發(fā)編碼、轉(zhuǎn)碼和AI處理的場景大幅提高處理密度并降低單路成本。所以,可以說曦思N100是一款A(yù)I全流程處理GPU,不止功能全面還能有效地降低系統(tǒng)整體成本(TCO)。
除了硬件性能強大、功能完備之外,一款好的產(chǎn)品必須要讓用戶覺得好用、易用!對此沐曦團隊打造了MXMACA1.0軟件棧,其中包括簡單易用的MacaRT推理引擎、開箱即用的Model Zoo和應(yīng)用實例,同時也對主流軟件生態(tài)如FFMPEG、OpenCV等進行了兼容支持,最大限度的遵循用戶使用習(xí)慣,幫助開發(fā)者降低學(xué)習(xí)和開發(fā)成本。
曦思N100人工智能推理GPU非常適合應(yīng)用于基于視覺的AI處理場景。沐曦已聯(lián)合合作伙伴打造了多種基于曦思N100的解決方案,如高密度視頻結(jié)構(gòu)化分析解決方案、高并發(fā)智能轉(zhuǎn)碼解決方案、光電混合異構(gòu)計算解決方案等,這些方案可廣泛應(yīng)用于城市安防、智慧交通、工業(yè)視覺、短視頻、云計算和智算中心等多個領(lǐng)域。
目前曦思N100已經(jīng)正式推向市場,并進入批量量產(chǎn)階段。沐曦將攜曦思以及未來更多的GPU產(chǎn)品持續(xù)為中國的社會發(fā)展和科技進步提供強大算力!
審核編輯:湯梓紅
-
cpu
+關(guān)注
關(guān)注
68文章
11029瀏覽量
215860 -
gpu
+關(guān)注
關(guān)注
28文章
4906瀏覽量
130602 -
AI
+關(guān)注
關(guān)注
87文章
34071瀏覽量
275192 -
人工智能
+關(guān)注
關(guān)注
1804文章
48637瀏覽量
246111 -
沐曦
+關(guān)注
關(guān)注
0文章
32瀏覽量
1363
原文標(biāo)題:智算小課堂(第七課)——曦思N100:功能強大的AI全流程處理GPU
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
GPU國產(chǎn)化率不足1%!沐曦GPU芯片曦思N100和曦云C500火爆登場

評論