前言背景
近期,經(jīng)過(guò)龍芯中科與NCNN社區(qū)的共同努力,在NCNN中使用龍架構(gòu)(LoongArch)向量?jī)?yōu)化實(shí)現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實(shí)現(xiàn),優(yōu)化后NCNN在平臺(tái)上各項(xiàng)性能測(cè)試比通用實(shí)現(xiàn)普遍提升一倍以上。
基于龍架構(gòu)向量?jī)?yōu)化開(kāi)啟前后的NCNN各項(xiàng)性能對(duì)比
(豎軸為耗時(shí)高度,越高耗時(shí)越久,性能越低)
NCNN作為業(yè)界首個(gè)為移動(dòng)端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架,在2017年首次開(kāi)源,是騰訊優(yōu)圖實(shí)驗(yàn)室第一次對(duì)外公開(kāi)深度學(xué)習(xí)的研究成果。目前多應(yīng)用在圖像方面,例如人像自動(dòng)美顏,照片風(fēng)格化,超分辨率,物體識(shí)別等等。NCNN計(jì)算框架,因其高性能、無(wú)第三方依賴、跨平臺(tái)支持大部分常見(jiàn)CNN網(wǎng)絡(luò)的特點(diǎn),是許多開(kāi)發(fā)者在移動(dòng)端、嵌入式設(shè)備上部署深度學(xué)習(xí)算法的首選框架。
龍架構(gòu)向量?jī)?yōu)化加入NCNN生態(tài)社區(qū)
本次優(yōu)化共產(chǎn)出3萬(wàn)多行代碼,成果將應(yīng)用于龍芯AI邊緣計(jì)算場(chǎng)景,完成基于龍架構(gòu)平臺(tái)的特征識(shí)別、圖像處理、人臉識(shí)別等模型的部署和推理,如門禁系統(tǒng)、手勢(shì)識(shí)別、口罩檢測(cè)等等。依托于NCNN計(jì)算框架優(yōu)秀的低耦結(jié)構(gòu),開(kāi)發(fā)者只需關(guān)注算子在龍架構(gòu)平臺(tái)上的高效實(shí)現(xiàn),無(wú)需考慮整個(gè)系統(tǒng)結(jié)構(gòu)問(wèn)題,實(shí)現(xiàn)更高效的開(kāi)發(fā)與部署工作。前期,NCNN與龍芯CPU進(jìn)行了較為全面的適配和性能優(yōu)化,共同打通了AI應(yīng)用和國(guó)產(chǎn)CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計(jì)算場(chǎng)景
龍芯中科將與NCNN社區(qū)保持密切合作,繼續(xù)根據(jù)龍架構(gòu)平臺(tái)向量特點(diǎn)不斷優(yōu)化算子,推進(jìn)龍架構(gòu)生態(tài)成果落地更多場(chǎng)景、服務(wù)更多領(lǐng)域、歡迎社區(qū)廣大開(kāi)發(fā)者與龍芯中科一道共建自主開(kāi)放的龍架構(gòu)生態(tài)體系。
審核編輯:湯梓紅
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103543 -
AI
+關(guān)注
關(guān)注
88文章
35065瀏覽量
279385 -
龍芯中科
+關(guān)注
關(guān)注
0文章
316瀏覽量
8049
原文標(biāo)題:龍架構(gòu)向量創(chuàng)新賦能AI圖像識(shí)別計(jì)算,促進(jìn)NCNN神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架性能翻倍
文章出處:【微信號(hào):gh_53fadbdbd4d4,微信公眾號(hào):龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【嘉楠堪智K230開(kāi)發(fā)板試用體驗(yàn)】01 Studio K230開(kāi)發(fā)板Test2——手掌,手勢(shì)檢測(cè),字符檢測(cè)
基于RV1126開(kāi)發(fā)板移植NCNN部署庫(kù)方法

BP神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

評(píng)論