地平線在深圳召開了主題為“釋放·芯效能”的新產品發布會,正式推出了全新一代的AIoT邊緣AI芯片平臺——地平線旭日3。
Auto+AIoT雙飛輪戰略
“自2015年成立至今,地平線已經在AI領域探索了5年,‘賦能萬物’這是地平線成立的初心。”地平線創始人兼CEO余凱闡釋地平線開放賦能戰略,“未來世界會有很多智能機器,服務于每個人的生活,讓每個人的生活更安全,更美好。賦能萬物究竟如何戰略落地?今天我們有了更加清晰的答案——這就是地平線的‘雙飛輪戰略’:Auto+AIoT。”
而地平線的“Auto+AIoT”戰略落地到產品,則是針對汽車領域的征程系列和針對AIoT領域的旭日系列。目前地平線征程系列已經成功在汽車市場打開了局面,其中征程2已經成功進入了前裝市場,僅長安一款車型,半年時間就已經出貨了幾十萬片。
“地平線是中國唯一實現前裝量產的車規級AI芯片。”余凱非常自豪的說到。余凱還透露,明年汽車前裝市場將會有20多款基于地平線征程芯片的車型上市。
相對于的征程系列芯片的成功,旭日系列芯片的成果則顯得不是那么的耀眼,當然這也與AIoT市場本身的碎片化有關,需要持續的投入和市場培育。
旭日3系列發布:AI算力最高5TOPS,擁有極致效能
地平線此次發布的旭日3系列AIoT芯片,采用臺積電16nm HPC+工藝,擁有旭日3M和旭日3E兩個型號,分別應對客戶對于不同AI算力的需求。
其中,旭日3M基于四核Arm Cortex-A53高能效處理器,主頻1.2GHz,集成了兩個地平線新一代BPU核心,在2.5W的典型功耗下,能夠達到等效5TOPS的標準算力,同時提供了豐富的接口,內存帶寬可達3200Mbps,編解碼能力和ISP效果也很優秀,可支持1200萬像素攝像頭,滿足客戶不同產品類型的開發需要。
而旭日3E則相當于旭日3M的簡配版,CPU核心改為了雙核的Arm Cortex-A53,主頻保持1.2GHz不變,同樣也是集成了兩個地平線第二代BPU核心,不過算力降至了3TOPS,內存帶寬可達2666Mbps,支持500萬像素攝像頭。
得益于第二代更強大的BPU核心,以及對于DRR大帶寬的支持和編譯器對于算法的高效優化,旭日3系列的算力利用率高達95%,達到了業界領先地位。
地平線聯合創始人兼技術副總裁黃暢表示:“一個加速器在SoC系統里面,往往面臨處理器效率不高的問題。而處理效率不高有很多原因,有架構本身原因,也有DDR瓶頸的問題。我們地平線的編譯器團隊,通過將先進算法高效部署在處理器里面進行加速和計算,實現了高達95%的算力利用率。”
“如果用常規的方法去編譯,一個高效模型處理一幀高清圖片可能需要消耗140MB的帶寬,計算延遲達到40多毫秒,這個時候利用率只有57%,57%在整個行業里面在AI處理器利用率已經是相對不錯的成績了。但是我們通過對編譯器的優化,使得同樣高效算法,同樣一個芯片,我們將整個計算進行細致拆解重組,充分發揮片上存儲的能力,充分發揮上面每一個計算的單位,處理一張大圖,同樣的算法帶寬只需要34MB,極大的壓縮了對于帶寬的需求,利用率高達95%。”黃暢進一步舉例解釋到。
此外,旭日3系列還擁有強大的視頻流處理器能力。旭日3系列能夠接入4到8路攝像頭,攝像頭分辨率可支持最高1200萬像素,硬件支持多攝像頭之間的精確同步,也可支持對于攝像頭進行校正,內置的高性能ISP,可以進行高效能的圖像處理,得到清晰、高質量畫質,再加上高性能低帶寬的特性,旭日3系列能夠支持智能NVR、DVR在車載里面的環視,以及各種常見的視覺應用。
黃暢表示:“旭日3的AI性能極其出色,特別是在最新的邊緣側深度網絡下有非常好的優化效果,使得客戶可以充分利用芯片算力。在SoC處理器的基礎能力之上,旭日3系列匹配強大的CPU、Codec、ISP能力,并且提供兩種規格,以滿足不同的市場需要,在行業內具有很強的競爭力。”
隨著用戶對于信息安全的越來越重視,芯片廠商也在不斷加強芯片安全保護機制。地平線旭日3系列在硬件層面上將BOOT寫到芯片里面,可以確保非法軟件無法運行在旭日3系列上。而且在BOOT階段,是直接被加載到BPU運行空間,內存隔離機制為BPU創造了絕對安全的運行空間,這是一個完全隔離的獨立環境,使得黑客即使入侵到應用側,也無法接觸到BPU所使用模型參數和數據。此外,地平線還提供了一個非常完善的授權管理服務,通過遠端進行ONLINE的授權和離線授權,支持授權版本自定義,授權碼的發放,方面客戶應用。
豐富的開發工具鏈,讓旭日3系列極簡易用
有了好的AI芯片,也需要有相應的開發工具,幫助開發者和客戶更快、更省、更高效的的完成場景應用落地。對此,地平線很早就推出了“天工開物”AI開發平臺,包括大量的高精度模型庫(業界流行的模型、自研模型、最佳實踐模型),可以使得算法研發成本節省70%,訓練成本節省90%;還擁有支持訓練和預測的AI芯片全棧工具鏈,算法研發成本可減少50%;AI應用開發中間件,可使得工程研發成本降低50%。
具體來說,基于天工開物平臺,地平線提供大量高精度的模型,開發者拿到這個模型,可以直接拿去用,或者加入一點點數據在細致調一個,可以得到非常好的模型,并可以高效部署在芯片上,從而免除算法和芯片適配的問題,使得整個訓練成本和研發成本會大大的節省。
地平線提供的易用且精度損失低的轉換工具和高性能高精度的量化訓練工具,支持浮點轉定點的模式,可以把模型轉化所損失的精度再轉化出來,這個對于極度追求精度的客戶是非常重要的。
地平線還提出參考算法的新理念。以往,開發者要么選擇自己從頭開研發算法,要么是采用第三方的商用算法,而這個商用算法多數是“黑盒子”,只能拿來用,難以持續去提高。而地平線提供的參考算法則是基于開源數據集或地平線自有數據集訓練得到的高精度算法,是免費提供給客戶的。
黃暢表示:“客戶拿到參考算法后,可以結合在相應場景當中搜集到的數據,加入到預訓練上的算法,簡單迭代之后就可以產生一個有差異化,屬于客戶自己的算法。這個就是使用這一套流程去開發整個算法,研發成本能夠極大降低的最大原因。因為我們提供性能非常好的預訓練的參考算法,這樣參考算法在工具鏈里面提升之后,我們客戶可以為產品構建自己的算法,從而建立自己的算法,使得整個產品上市時間能夠縮短一半,我們持續在芯片上,不僅僅在芯片設計本身,不僅僅在我們芯片工具鏈本身,在這上面承載了各種各樣標準化的模型,我們會持續去打造。”
此外,地平線還提供了加速嵌入式研發的開源應用中間件(AI Express),集合了很多人體結構化(比如人形、骨骼、手勢、關鍵點)、場景化和常用的AI應用參考代碼,開發者可以輕松完成應用的開發,并且運行效率也可以保證非常高。
“地平線基于芯片、算法和工具鏈組成的底層計算平臺,將行業領先的算法能力和芯片產品開放給客戶、合作伙伴、開發者,并提供全面開放的賦能支持,降低AI開發難度和落地門檻,加速AI在各行各業的應用。”黃暢說到。
未來3年出貨將超千萬
根據此前的信息顯示,地平線旭日1和旭日2已經累計出貨將近百萬。而隨著功能更加強大的旭日3的推出,以及AIoT市場的持續爆發,地平線也對于未來有著較高的預期。
余凱表示,“今年發布會來了一百多家客戶,大多都有采用我們的旭日芯片,目前有一家客戶現在3年訂單已有幾百萬,我覺得未來三年突破千萬級是合理預估。但是這個只是預估,現在還并不是現實。”
此外,在此次發布上,地平線還透露2021年將會跳過旭日4,直接推出旭日5。而根據Roadmap顯示,旭日5將會采用Arm 2/4 x A55 CPU內核,集成雙核的第三代BPU內核,支持H.264/H.265 4K/8K。
“面向AI落地需求,地平線未來會持續增強自研AI芯片的算力密度,提供矩陣式的芯片規格,同時擴展通用性算法需求,滿足不同客戶采用多樣化網絡模型的需求。”黃暢表示,2021年地平線將發布更強勁的旭日5系列芯片,向行業釋放更加靈活而極致的AI效能。
力推AI真實性能評價標準:MAPS
目前在AI芯片領域,評價AI芯片性能的關鍵指標是TOPS,即每秒10億次計算的峰值算力能力,但是各家AI芯片廠商公布的這個算力指標都是基于半導體硅片的理論峰值性能,而這個是依賴于半導體工藝制程的,并不是將算法部署到芯片上之后的實際算力的體現。此外,也有業內知名的基準測試組織MLPerf,但是其采用的模型少且更新速度滯后于算法演進的速度,無法及時反映算法效率的提升以及各種精度下芯片能夠達到的計算速度,因而無法描述芯片AI性能的全貌。
對此,地平線首創提出了全新的AI真實效能評價標準——MAPS(Mean Accuracy-guaranteed Processing Speed,在精度有保障范圍內的平均處理速度),在應用場景中最常見的精度保障范圍內,考察每顆芯片的平均處理速度。可以說,MAPS更加關注的是任務的最終效果與性能,包容任務執行時可采用的所有網絡選擇,能夠幫助客戶找到最為適宜的整體AI落地方案。
具體來說,MAPS代表著最真實的AI效能指標,它等于舊摩爾定律下的理論峰值計算效能×實際的有效利用率×新摩爾定律(AI算法效率),并且是在精度有保障范圍內的平均表現。
以谷歌TPU為例,可以看到下圖中,縱軸是標準的圖像分類任務ImageNet TOP·1的準確率,體現的是算法的精度,可以在上面去運行各種各樣不同的算法模型去完成圖像分類,橫軸是每秒鐘處理的幀率,體現的是處理速度。如果把每一個算法模型運行在TOU上,就可以得到對應的速度和精度,而將這些算法得到的結果都作為一個坐標點標記到圖上,然后根據實際應用需求選擇一個最有價值精度區間,比如75%到85.5%的精度范圍,根據那些坐標點去尋找一個最大的多邊形,再把多邊形的面積計算出來去除以精度范圍,從而得到一個平均的處理速度,從而最終得到MAPS的指標。
值得一提的是,此次地平線推出的旭日3系列芯片,正是以MAPS作為關鍵指標來進行設計和優化的,從下圖當中我們可以看到,旭日3在圖像分類任務上可以有效適配Google提出的EfficientNet系列網絡,其AI真實性能表現,遠超其他同類的4TOPS算力的AI芯片,即便是相比11.4TOPS算力的AI芯片,在追求更高的處理速度的曲線內也是遙遙領先,最高可達416FPS。
“MAPS是我們推出的一個關于AI真實算力更合理的評估方式,是在精度有保障范圍內的平均處理速度,是應用需求精度范圍內看平均處理速度能有多快,這個是更加接近真實應用場景的AI性能評估方式。我們希望MAPS能夠指導業界去研究框架和算法,研究所有方方面面能夠影響到真實AI性能的技術,提出一個共同的目標,讓大家形成一個合力,都朝著真正關注AI算法到底能夠做到多準確,能夠多快,圍著同樣一個MAPS目標去前進,這是我們提出評估方面最重要的初衷。”黃暢說到。
在會后專訪環節,地平線CEO余凱向芯智訊表示:“對于用戶來說,關注客觀真實AI算力才是更具價值的,而不是簡單的追逐TOPS指標。MAPS是我們提出的一個公開的、透明的、開放的指標,我們也希望能夠有更多的廠商參與進來。不過,我們最好讓開發者第三方去跑,然后給出分數,而不是廠家自己。對于開發者來說,MAPS這個標準是最終對他們的應用場景最相關、最直接的評價指標,因為TOPS太間接了,我們朝著公開、透明的方式,我們不求一步到位絕對的精確,但是我們一定要把這個行業往前推進。”
此外,為了推動MAPS標準,余凱還透露,地平線最近正在與某業內知名的AIoT終端大廠的研發機構合作,雙方將一起來共同推進這件事情。
當然,地平線本身作為一家AI芯片廠商,來希望將自己提出的這個MAPS標準推而廣之,成為行業標準,可能也會引發一些爭議。不過,余凱強調:“地平線做這件事情一定要以公心來推動整個行業發展,最后不同的意見肯定會有,但是我覺得我們先邁出這一步,讓大家把意見提出來,對整個行業是進步。如果沒有一個廠家往前邁一步,都停留在虛無縹緲的TOPS上,那永遠進步不了,不管怎么樣先做起來,啟發大家產生有建設性的爭論,都是好事,比虛假的一團和氣的好。而且中國現在正好在整個AI芯片這一塊領先全球的,我們自己要有原創心,不要懈怠,讓自己觀點拋出來,讓大家來爭論,整個行業才更具活力,如果死氣沉沉,怎樣往前發展?表面一團和氣還不如來一個關于行業發展方向的一個爭議討論。”
開放賦能,打造“方案商生態”+“開發者生態”
伴隨著此次旭日3系列的發布,地平線還攜手合作伙伴針對相關應用領域推出了相應的軟硬結合的參考方案,比如IPC參考方案、USB CAM參考方案、同行面板方案、車載后裝參考方案、邊緣計算盒參考方案,可應用于智能會議、智能家居、交互機器人、車載后裝、通行考勤等諸多應用場景。
那么,這是否意味著地平線會自己來推芯片方案,甚至是自己來做集成?
余凱告訴芯智訊:“我們自己不會做主板方案,更不會去做整機,因為那些都是由我們賦能的伙伴來做的,我們定位就是底層賦能,不會去跟我們的合作伙伴去搶生意。我們在所有行業里面都不會做硬件方案,包括整體解決方案,都是讓我們的合作伙伴去做。因為我們覺得整個人工智能場景還是非常碎片化的,一家廠商做不了那么多事情,我們要做的是把大家的開發門檻降低,讓更多廠商跟合作伙伴可以基于我們的芯片能夠去開發各種各樣的應用。所以我們要致力于打造開放、繁榮、活躍的方案商生態和開發者生態。”
具體來說,基于邊緣AI芯片,地平線正打造一個多層次、多維度、多樣性的開放生態體系。在方案商生態方面,無論是硬件方案商,還是垂直領域的解決方案商,還是軟硬一體的整體解決方案商,地平線都將依托于底層技術能力,賦能方案商合作伙伴,幫助他們把對于場景的理解注入到產品中去,打造各種解決方案,賦能各行各業。
在開發者生態方面,地平線也將積淀多年并經過應用落地驗證的技術組件‘白盒’開放出來,其中包括中間件,參考算法,應用參考設計,算法訓練平臺等,幫助開發者進一步加速AI落地。同時,地平線還通過開發者生態計劃,依托開放易用的“天工開物”AI開發平臺,一站式AI開發者社區和AI加速營開發者扶持計劃,向開發者提供加速AIoT應用孵化的全鏈條支持,助力AI應用探索創新。
此外,地平線后續還將每年舉辦技術生態大會,介紹最新的芯片以及軟件成果,包括地平線提供所有的素材、教程以及激勵計劃,去繁榮這兩個生態。
地平線AIoT產品線總經理王叢也表示:“地平線并不僅僅是芯片提供商,而是AI芯片應用落地的生態賦能者。地平線的理念就是開放賦能,一路成就客戶。客戶選擇地平線也不僅是選擇一顆芯片,而是選擇 AI 時代的長期伙伴。”
責任編輯:pj
-
芯片
+關注
關注
459文章
52481瀏覽量
440556 -
加速器
+關注
關注
2文章
827瀏覽量
39106 -
AI
+關注
關注
88文章
35093瀏覽量
279474
發布評論請先 登錄
創龍 瑞芯微 RK3562 國產 2GHz 四核A53 工業開發板—IRIG-B碼對時案例

創龍瑞芯微 RK3562 國產 2GHz 四核A53 工業開發板—調試工具安裝

全國產!瑞芯微 RK3576 ARM 八核 2.2GHz 工業開發板—Linux應用開發手冊

全國產!瑞芯微 RK3576 ARM 八核 2.2GHz 工業開發板—Linux開發環境搭建

全國產!瑞芯微 RK3576 ARM 八核 2.2GHz 工業開發板—Linux系統使用手冊

全國產!瑞芯微 RK3576 ARM 八核 2.2GHz 工業開發板—LVGL應用開發案例

AM62L系列 帶顯示屏的低功耗 Arm? Cortex-A53? SoC,適用于 IOT、HMI 和通用應用技術手冊

瑞芯微RK3576,8核2.2GHz+6T算力NPU工業核心板說明書

瑞芯微RK3506(3核ARM+Cortex-A7 + ARM Cortex-M0)工業核心板選型資料

評論