女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

車載芯片的發(fā)展趨勢是什么?GPU和ASIC的發(fā)展方向與應用的概述

cMdW_icsmart ? 來源:未知 ? 作者:易水寒 ? 2018-07-29 11:49 ? 次閱讀

行業(yè)觀點:

汽車電子發(fā)展初期以分布式 ECU 架構(gòu)為主流,芯片與傳感器一一對應,隨著汽車電子化程度提升,傳感器增多、線路復雜度增大,中心化架構(gòu) DCU、MDC 逐步成為了發(fā)展趨勢;

隨著汽車輔助駕駛功能滲透率越來越高,傳統(tǒng) CPU 算力不足,難以滿足處理視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的需求,而 GPU 同時處理大量簡單計算任務的特性在自動駕駛領(lǐng)域取代 CPU 成為了主流方案;

ADAS向自動駕駛進化的過程中,激光雷達點云數(shù)據(jù)以及大量傳感器加入到系統(tǒng)中,需要接受、分析、處理的信號大量且復雜,定制化的ASIC 芯片可在相對低水平的能耗下,將車載信息的數(shù)據(jù)處理速度提升更快,并且性能、能耗和大規(guī)模量產(chǎn)成本均顯著優(yōu)于 GPU 和 FPGA,隨著自動駕駛的定制化需求提升,ASIC 專用芯片將成為主流。

目前出貨量最大的駕駛輔助芯片廠商 Mobileye、Nvidia 形成“雙雄爭霸”局面,Xilinx 則在 FPGA 的路線上進軍,Google、地平線、寒武紀在向?qū)S妙I(lǐng)域 AI 芯片發(fā)力,國內(nèi)四維圖新、全志科技等也在自動駕駛芯片領(lǐng)域積極布局。

Mobileye 的核心優(yōu)勢是EyeQ 系列芯片,可以處理攝像頭、雷達等多種傳感器融合產(chǎn)生的大量數(shù)據(jù),在 L1-L3 自動駕駛領(lǐng)域具有極大的話語權(quán),目前出貨量超過了 2700 萬顆;

NVIDIA 在 GPU 領(lǐng)域具有絕對的領(lǐng)導地位,芯片算力強大且具備很強的靈活性,但功耗高、成本高,AI機器學習并不太適合 GPU的應用;

此外 Google、地平線、寒武紀、四維圖新等更聚焦在針對不同場景下的具體應用,芯片設(shè)計也開始增加硬件的深度學習設(shè)計,自動駕駛上 AI 的應用已經(jīng)成為未來的趨勢。

一、車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)

過去汽車電子芯片以與傳感器一一對應的電子控制單元(ECU)為主,主

要分布與發(fā)動機等核心部件上。隨著汽車智能化的發(fā)展,汽車傳感器越來

越多,傳統(tǒng)的分布式架構(gòu)逐漸落后,由中心化架構(gòu) DCU、MDC 逐步替代。

隨著人工智能發(fā)展,汽車智能化形成趨勢,目前輔助駕駛功能滲透率越來越高,這些功能的實現(xiàn)需借助于攝像頭、雷達等新增的傳感器數(shù)據(jù),其中視頻(多幀圖像)的處理需要大量并行計算,傳統(tǒng) CPU 算力不足,這方面性能強大的 GPU 替代了 CPU。再加上輔助駕駛算法需要的訓練過程, GPU+FPGA 成為目前主流的解決方案。

著眼未來,自動駕駛也將逐步完善,屆時又會加入激光雷達的點云(三維位置數(shù)據(jù))數(shù)據(jù)以及更多的攝像頭和雷達傳感器,GPU 也難以勝任, ASIC 性能、能耗和大規(guī)模量產(chǎn)成本均顯著優(yōu)于 GPU 和 FPGA,定制化的ASIC 芯片可在相對低水平的能耗下,將車載信息的數(shù)據(jù)處理速度提升更快,隨著自動駕駛的定制化需求提升,ASIC 專用芯片將成為主流。本文以如上順序梳理車載芯片發(fā)展歷程,探討未來發(fā)展方向。

二、車載芯片的過去—以 CPU 為核心的 ECU

2.1 ECU 的核心 CPU

ECU(Electronic Control Unit)是電子控制單元,也稱“行車電腦”,是汽車專用微機控制器。一般 ECU 由 CPU、存儲器(ROMRAM)、輸入/ 輸出接口(I/O)、模數(shù)轉(zhuǎn)換器(A/D)以及整形、驅(qū)動等大規(guī)模集成電路組成。

ECU 的工作過程就是 CPU 接收到各個傳感器的信號后轉(zhuǎn)化為數(shù)據(jù),并由 Program區(qū)域的程序?qū)?Data 區(qū)域的數(shù)據(jù)圖表調(diào)用來進行數(shù)據(jù)處理,從而得出具體驅(qū)動數(shù)據(jù),并通過 CPU針腳傳送到相關(guān)驅(qū)動芯片,驅(qū)動芯片再通過相應的周邊電路產(chǎn)生驅(qū)動信號,用來驅(qū)動驅(qū)動器。即傳感器信號——傳感器數(shù)據(jù)——驅(qū)動數(shù)據(jù)——驅(qū)動信號這樣一個完整工作流程。

2.2 分布式架構(gòu)向多域控制器發(fā)展

汽車電子發(fā)展的初期階段,ECU 主要是用于控制發(fā)動機工作,只有汽車發(fā)動機的排氣管(氧傳感器)、氣缸(爆震傳感器)、水溫傳感器等核心部件才會放置傳感器,由于傳感器數(shù)量較少,為保證傳感器-ECU-控制器回路的穩(wěn)定性,ECU 與傳感器一一對應的分布式架構(gòu)是汽車電子的典型模式。

后來隨著車輛的電子化程度逐漸提高,ECU 占領(lǐng)了整個汽車,從防抱死制動系統(tǒng)、4 輪驅(qū)動系統(tǒng)、電控自動變速器、主動懸架系統(tǒng)、安全氣囊系統(tǒng),到現(xiàn)在逐漸延伸到了車身各類安全、網(wǎng)絡(luò)、娛樂、傳感控制系統(tǒng)等。

隨著汽車電子化的發(fā)展,車載傳感器數(shù)量越來越多,傳感器與 ECU 一一對應使得車輛整體性下降,線路復雜性也急劇增加,此時 DCU(域控制器)和MDC(多域控制器)等更強大的中心化架構(gòu)逐步替代了分布式架構(gòu)。

域控制器(Domain Control Unit)的概念最早是由以博世,大陸,德爾福為首的 Tier1 提出,是為了解決信息安全,以及 ECU 瓶頸的問題。根據(jù)汽車電子部件功能將整車劃分為動力總成,車輛安全,車身電子,智能座艙和智能駕駛等幾個域,利用處理能力更強的多核 CPU/GPU芯片相對集中的去控制每個域,以取代目前分布式汽車電子電氣架構(gòu)。

而進入自動駕駛時代,控制器需要接受、分析、處理的信號大量且復雜,原有的一個功能對應一個 ECU 的分布式計算架構(gòu)或者單一分模塊的域控制器已經(jīng)無法適應需求,比如攝像頭、毫米波雷達、激光雷達乃至 GPS 和輪速傳感器的數(shù)據(jù)都要在一個計算中心內(nèi)進行處理以保證輸出結(jié)果的對整車自動駕駛最優(yōu)。

因此,自動駕駛車輛的各種數(shù)據(jù)聚集、融合處理,從而為自動駕駛的路徑規(guī)劃和駕駛決策提供支持的多域控制器將會是發(fā)展的趨勢,奧迪與德爾福共同開發(fā)的 zFAS,即是通過一塊 ECU,能夠接入不同傳感器的信號并進行對信號進行分析和處理,最終發(fā)出控制命令。

三、車載芯片的現(xiàn)在—以 GPU 為核心的智能輔助駕駛芯片

人工智能的發(fā)展也帶動了汽車智能化發(fā)展,過去的以 CPU 為核心的處理器越來越難以滿足處理視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的需求,同時處理器也需要整合雷達、視頻等多路數(shù)據(jù),這些都對車載處理器的并行計算效率提出更高要求,而 GPU 同時處理大量簡單計算任務的特性在自動駕駛領(lǐng)域取代CPU成為了主流方案。

3.1 GPU Vs. CPU

CPU 的核心數(shù)量只有幾個(不超過兩位數(shù)),每個核都有足夠大的緩存和足夠多的數(shù)字和邏輯運算單元,并輔助很多復雜的計算分支。而GPU 的運算核心數(shù)量則可以多達上百個(流處理器),每個核擁有的緩存大小相對小,數(shù)字邏輯運算單元也少而簡單。

CPU和 GPU 最大的區(qū)別是設(shè)計結(jié)構(gòu)及不同結(jié)構(gòu)形成的不同功能。CPU的邏輯控制功能強,可以進行復雜的邏輯運算,并且延時低,可以高效處理復雜的運算任務。而 GPU邏輯控制和緩存較少,使得每單個運算單元執(zhí)行的邏輯運算復雜程度有限,但并列大量的計算單元,可以同時進行大量較簡單的運算任務。

3.2 GPU 占據(jù)現(xiàn)階段自動駕駛芯片主導地位

相比于消費電子產(chǎn)品的芯片,車載的智能駕駛芯片對性能和壽命要求都比較高,主要體現(xiàn)在以下幾方面:

1、耗電每瓦提供的性能;

2、生態(tài)系統(tǒng)的構(gòu)建,如用戶群、易用性等;

3、滿足車規(guī)級壽命要求,至少 1 萬小時穩(wěn)定使用。

目前無論是尚未商業(yè)化生產(chǎn)的自動駕駛 AI 芯片還是已經(jīng)可以量產(chǎn)使用的輔助駕駛芯片,由于自動駕駛算法還在快速更新迭代,對云端“訓練”部分提出很高要求,既需要大規(guī)模的并行計算,又需要大數(shù)據(jù)的多線程計算,因此以GPU+FPGA 解決方案為核心;在終端的“推理”部分,核心需求是大量并行計算,從而以 GPU為核心。

3.3 相關(guān)公司

3.3.1 NVIDIA

NVIDIA 在自動駕駛領(lǐng)域的成就正是得益于他們在GPU 領(lǐng)域內(nèi)的深耕,NVIDIA GPU 專為并行計算而設(shè)計,適合深度學習任務,并且能夠處理在深度學習中普遍存在的向量和矩陣操作。相對于 Mobileye 專注于視覺處理,NVIDIA 的方案重點在于融合不同傳感器。

2016 年,英偉達在 Drive PX 2 平臺上推出了三款產(chǎn)品,分別是配備單 GPU 和單攝像頭及雷達輸入端口的 Drive PX2 Autocruise(自動巡航)芯片(下圖左上)、配備雙 GPU 及多個攝像頭及雷達輸入端口的 Drive PX2 AutoChauffeur(自動私人司機)芯片(右上)、配備多個 GPU 及多個攝像頭及雷達輸入端口的 Drive PX2 Fully Autonomous Driving(全自動駕駛)

芯片(下方)。

以目前的銷售情況,Drive PX 2 搭載上一代Pascal 架構(gòu)GPU 已經(jīng)實現(xiàn)量產(chǎn),并且已經(jīng)搭載在Tesla 的量產(chǎn)車型Model S 以及Model X 上。目前PX 2 仍然是NVIDIA 自動駕駛平臺出貨的主力,Tesla,Audi 和ZF 等對外公布Drive PX 2 應用在量產(chǎn)車上。

Xavier 是Drive PX 2 的進化版本,搭配了最新一代的Volta 架構(gòu)GPU, 相較于 Drive PX 2 性能將提升近一倍,2017 年年底量產(chǎn)。由于多家主機廠 L3 級別以上自動駕駛量產(chǎn)車的計劃在2020 年左右,而 Xavier 的量產(chǎn)計劃將能和自動駕駛車的研發(fā)周期相互配合(一般3 年左右),因此 Xavier 的合作都是有量產(chǎn)車落地計劃的。

而對于較早與 NVIDIA 達成合作的車廠來說,他們在小批量測試、量產(chǎn)的優(yōu)先級別以及可定制化空間等方面都能獲得一定的優(yōu)勢。

圖表13:NVIDIA DRIVE Pegasus AI計算平臺

目前,L4 及以上的市場基本上被 NVIDIA 壟斷,CEO 黃仁勛稱全球有 300 余家自動駕駛研發(fā)機構(gòu)使用 Drive PX2。Drive PX 2 單價為 1.6 萬美金,功耗達 425 瓦,但目前沒有達到車規(guī),按功耗和成本看,只能小規(guī)模測試階段使用。

3.3.2 四維圖新

國內(nèi)地圖行業(yè)龍頭,向 ADAS 和自動駕駛進軍。公司成立于 2002 年,是國內(nèi)首家獲導航地圖制作資質(zhì)的企業(yè)(目前僅 13 家),為領(lǐng)先的數(shù)字地圖內(nèi)容、車聯(lián)網(wǎng)與動態(tài)交通信息服務、基于位置的大數(shù)據(jù)垂直應用服務的提供商之一。其拳頭業(yè)務——地圖業(yè)務,以國內(nèi) 60%的份額穩(wěn)居壟斷地位。 2017 年以來,公司收購杰發(fā)科技、入股中寰衛(wèi)星與禾多科技,“高精度地圖+芯片+算法+軟件”的自動駕駛產(chǎn)業(yè)鏈全方位布局雛形已現(xiàn)。

高精度地圖:代表國內(nèi)最高水平。公司以地圖起家,目前國內(nèi)高精度地圖僅兩家玩家(另一家為高德),公司深度綁定獲得寶馬、大眾、奔馳、通用、沃爾沃、福特、上汽、豐田、日產(chǎn)、現(xiàn)代、標致等主流車企發(fā)展,占絕對優(yōu)勢。2017 年公司實現(xiàn)支持 L3 級別(至少 20 個城市)的高精度地圖,計劃于 2019 年覆蓋所有城市,并為 L4 的推出做準備。公司地圖編譯能力亮眼,全球首位提供 NDS 地圖從生產(chǎn)到編譯環(huán)節(jié)。此外,公司在荷蘭、美國硅谷、新加坡等地設(shè)立研發(fā)中心和分支機構(gòu),合作伙伴涵蓋國際主流車廠、新一代整車企業(yè)以及騰訊、滴滴、搜狗、華為等國內(nèi)知名企業(yè)。

芯片:收購杰發(fā)科技布局汽車芯片。杰發(fā)科技(2017 年 3 月完成收購)脫胎于聯(lián)發(fā)科,主攻車載信息娛樂系統(tǒng)芯片。現(xiàn)階段在國內(nèi)后裝市場市占率超 70%,前裝超 30%(主要為吉利、豐田等車企),其車規(guī)級IVI 芯片被多家國際主流零部件廠商采用,并計劃推出 AMP、MCU 及 TPMS(胎壓監(jiān)測)芯片等新一代產(chǎn)品。公司通過收購杰發(fā)科技,具備了為車廠提供高性能汽車電子芯片的能力,打通從軟件到硬件的關(guān)鍵性關(guān)卡,并與蔚來、威馬、愛馳億維等造車新勢力公司達成了合作。

該芯片采用 64 位 A53四核架構(gòu),內(nèi)置硬件圖像加速引擎,支持雙路高清視頻輸出,和四路高清視頻輸入,能同時支持高級車載影音娛樂系統(tǒng)全部功能和豐富的 ADAS 功能。功能包括:360°全景泊車系統(tǒng)、車道偏移警示系統(tǒng) LDW、前方碰撞警示系統(tǒng) FCW、行人碰撞警示系統(tǒng) PCW、交通標志識別系統(tǒng) TSR、車輛盲區(qū)偵測系統(tǒng) BSD、駕駛員疲勞探測系統(tǒng) DFM 和后方碰撞預警系統(tǒng) RCW 等。

3.3.3 全志科技

在今年 5 月的 CES Asia,全志科技發(fā)布首款車規(guī)級處理器 T7,同時發(fā)布基于 T7 的多種智能座艙產(chǎn)品形態(tài)。T7 是數(shù)字座艙車規(guī)(AEC-Q100)平臺型處理器,支持 AndroidLinux、QNX系統(tǒng),集成多路高清影像輸入和輸出,完美支持高清多媒體處理,內(nèi)置的 EVE 視覺處理單元可提升輔助駕駛運算效率。

該款芯片雖然是首款通過車規(guī)的國產(chǎn)中控主機芯片,但還處于起步階段,根據(jù)正常汽車電子芯片的生命周期,要規(guī)模應用至少需要兩年時間,而等到形成較多的用戶和良好的生態(tài)還需很多資源投入以及時間的積累。因此國產(chǎn)車載芯片不論在自動駕駛領(lǐng)域還是中控或輔助駕駛領(lǐng)域,想要真正形成量產(chǎn)與國外老牌巨頭競爭,都還需要大量人力、資本和時間。

四、車載芯片的未來—以 ASIC 為核心的自動駕駛芯片

4.1 ASIC vs GPU+FPGA

GPU適用于單一指令的并行計算,而 FPGA 與之相反,適用于多指令,單數(shù)據(jù)流,常用于云端的“訓練”階段。此外與 GPU對比,F(xiàn)PGA沒有存取功能,因此速度更快,功耗低,但同時運算量不大。結(jié)合兩者優(yōu)勢,形成GPU+FPGA 的解決方案。

FPGA 和 ASIC 的區(qū)別主要在是否可以編程。FPGA 客戶可根據(jù)需求編程,改變用途,但量產(chǎn)成本較高,適用于應用場景較多的企業(yè)、軍事等用戶;而 ASIC 已經(jīng)制作完成并且只搭載一種算法和形成一種用途,首次“開模”成本高,但量產(chǎn)成本低,適用于場景單一的消費電子、“挖礦”等客戶。目前自動駕駛算法仍在快速更迭和進化,因此大多自動駕駛芯片使用GPU+FPGA 的解決方案。未來算法穩(wěn)定后,ASIC 將成為主流。

計算能耗比,ASIC > FPGA > GPU > CPU,究其原因,ASIC 和 FPGA 更接近底層 IO,同時FPGA有冗余晶體管和連線用于編程,而 ASIC 是固定算法最優(yōu)化設(shè)計,因此 ASIC 能耗比最高。相比前兩者,GPU 和 CPU 屏蔽底層 IO,降低了數(shù)據(jù)的遷移和運算效率,能耗比較高。同時 GPU 的邏輯和緩存功能簡單,以并行計算為主,因此 GPU能耗比又高于 CPU。

4.2 ASIC 是未來自動駕駛芯片的核心和趨勢

結(jié)合 ASIC 的優(yōu)勢,我們認為長遠看自動駕駛的 AI 芯片會以 ASIC 為解決方案,主要有以下幾個原因:

1、由于處理的傳感器信息需要大量冗余,自動駕駛對終端算力要求極高,并且車速越快,對計算能力要求越高;

2、自動駕駛對終端計算的實時性要求極高。任何超出一定范圍的延遲,都有可能造成事故,因此終端會負責自動駕駛的核心計算和決策功能;

3、對能效要求高,否則降低車輛續(xù)航,影響駕駛體驗。高能耗同時帶來的熱量也會降低系統(tǒng)穩(wěn)定性。例如下一代支持 L4 的 NVIDIA Drive Pegasus 功耗為 500 瓦,只能應用于小規(guī)模的測試車;

4、高可靠性。真正滿足車規(guī)的自動駕駛芯片需要在嚴寒酷暑、刮風下雨或長時間運行等惡劣條件下,都有穩(wěn)定的計算表現(xiàn)。

綜上 ASIC 專用芯片幾乎是自動駕駛量產(chǎn)芯片唯一的解決方案。由于這種芯片僅支持單一算法,對芯片設(shè)計者在算法、IC 設(shè)計上都提出很高要求。

以上并非下定論目前 ASIC 為核心的芯片一定比 GPU+FPGA 的芯片強,由于目前自動駕駛算法還在快速迭代和升級過程中,過早以固有算法生產(chǎn)ASIC 芯片長期來看不一定是最優(yōu)選擇。

4.3 相關(guān)公司

4.3.1 Mobileye

Intel 在ADAS 處理器上的布局已經(jīng)完善,包括Mobileye 的ADAS 視覺處理,利用Altera 的FPGA 處理,以及英特爾自身的至強等型號的處理器,可以形成自動駕駛整個硬件超級中央控制的解決方案。

Mobileye 具有自主研發(fā)設(shè)計的芯片 EyeQ 系列,由意法半導體公司生產(chǎn)供應。現(xiàn)在已經(jīng)量產(chǎn)的芯片型號有 EyeQ1 至 EyeQ4,EyeQ5 正在開發(fā)進行中,計劃 2020 年面世,對標英偉達 Drive PX Xavier,并透露 EyeQ5 的計算性能達到了 24 TOPS,功耗為 10 瓦,芯片節(jié)能效率是 Drive Xavier 的2.4 倍。

英特爾自動駕駛系統(tǒng)將采用攝像頭為先的方法設(shè)計,搭載兩塊EyeQ5 系統(tǒng)芯片、一個英特爾凌動 C3xx4 處理器以及 Mobileye 軟件,大規(guī)模應用于可擴展的 L4/L5 自動駕駛汽車。該系列已被奧迪、寶馬、菲亞特、福特、通用等多家汽車制造商使用。

從硬件架構(gòu)來看,該芯片包括了一組工業(yè)級四核MIPS 處理器,以支持多線程技術(shù)能更好的進行數(shù)據(jù)的控制和管理(下圖左上)。多個專用的向量微碼處理器(VMP),用來應對ADAS 相關(guān)的圖像處理任務(如:縮放和預處理、翹曲、跟蹤、車道標記檢測、道路幾何檢測、濾波和直方圖等,下圖右上)。一顆軍工級MIPS Warrior CPU 位于次級傳輸管理中心,用于處理片內(nèi)片外的通用數(shù)據(jù)(下圖左中)。

此外通過行業(yè)訪談調(diào)研等途徑了解到,Mobileye 在 L1-L3 智能駕駛領(lǐng)域具有極大的話語權(quán),對 Tire1 和 OEM 非常強勢,其算法和芯片綁定,不允許更改。

4.3.2 寒武紀

5 月3 日,寒武紀科技在 2018 產(chǎn)品發(fā)布會上發(fā)布了多個 IP 產(chǎn)品——采用

7nm 工藝的終端芯片Cambricon 1M、云端智能芯片MLU100 等。

其中寒武紀 1M芯片是公司第三代 IP產(chǎn)品,在 TSMC7nm工藝下 8 位運算的效能比達 5Tops/w(每瓦 5 萬億次運算),同時提供 2Tops、4Tops、 8Tops 三種尺寸的處理器內(nèi)核,以滿足不同需求。1M 還將支持 CNN、 RNN、SVM、k-NN 等多種深度學習模型與機器學習算法的加速,能夠完成視覺、語音、自然語言處理等任務。通過靈活配置 1M 處理器,可以實現(xiàn)多線和復雜自動駕駛?cè)蝿盏馁Y源最大化利用。它還支持終端的訓練,以此避免敏感數(shù)據(jù)的傳輸和實現(xiàn)更快的響應。

寒武紀首款云端智能芯片 Cambricon MLU100 同期發(fā)布,同時公布了在 R-CNN算法下 MLU100 與英偉達 Tesla V100(2017)和英偉達 Tesla P4

(2016)的對比,從參數(shù)上看,主要對標 Tesla P4。

最后說明芯片從設(shè)計到落地應用面臨的潛在風險:

4.3.3 地平線

2017 年地平線發(fā)布了新一代自動駕駛芯片“征程”和配套軟件平臺方案 “雨果”,同時還發(fā)布了應用于智能攝像頭的“旭日”處理器。“征程”是一款專用 AI 芯片,采用地平線的第一代 BPU 架構(gòu),可實時處理 1080p@30 視頻,每幀中可同時對 200 個目標進行檢測、跟蹤、識別,典型功耗 1.5W,每幀延時小于 30ms。據(jù)地平線CEO 余凱介紹,地平線的芯片更聚焦在針對不同場景下的具體應用,相比于英偉達的方案,在功耗上低一個數(shù)量級,價格也會有更大的競爭力。

2018 年亞洲 CES,地平線宣布推出從 L2 到 L4 級別全系列的自動駕駛計算平臺。

地平線星云,基于征程 1.0 芯片,能夠以車規(guī)級標準滿足 L1 和 L2 級別的自動駕駛的需求,能同時對行人、機動車、非機動車、車道線、交通標志牌、紅綠燈等多類目標進行精準的實時監(jiān)測與識別;并可滿足車載設(shè)備嚴苛的環(huán)境要求,以及復雜環(huán)境下的視覺感知需求,支持L2 級別 ADAS 功能。

地平線 Matrix 1.0,內(nèi)置地平線征程 2.0 處理器架構(gòu),最大化嵌入式 AI 計算性能,是面向 L3/L4 的自動駕駛解決方案,可滿足自動駕駛場景下高性能和低功耗的需求。依托地平線公司自主研發(fā)的工具鏈,開發(fā)者和研究人員可以基于 Matrix 平臺部署神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)開發(fā)、驗證、優(yōu)化和部署。

4.3.4 百度“昆侖”

7 月 4 日百度 AI 開發(fā)者大會上,李彥宏發(fā)布了由百度自主研發(fā)的中國首款云端全功能 AI 芯片——“昆侖”。“昆侖”基于百度 8 年的 AI 加速器經(jīng)驗的研發(fā),預計將于明年流片。

“昆侖”采用 14nm 三星工藝,是業(yè)內(nèi)設(shè)計算力最高的 AI 芯片(100+瓦功耗下提供 260Tops 性能);512GB/s 內(nèi)存帶寬,由幾萬個小核心構(gòu)成。

“昆侖”可高效地同時滿足訓練和推斷的需求,除了常用深度學習算法等云端需求,還能適配諸如自然語言處理,大規(guī)模語音識別,自動駕駛,大規(guī)模推薦等具體終端場景的計算需求。此外可以支持 paddle 等多個深度學習框架,編程靈活度高。

同時也有媒體對該產(chǎn)品提出疑義,主要有以下兩點:

1、算力一般采用的是基于浮點計算的 TFLOPS,性能從倍精度、單精度到半精度,例如寒武紀公布算力跨度從16 TFLOPS 到166 TFLOPS。昆侖僅提供單一精度數(shù)據(jù),且只公開最大整數(shù)計算能力(TOPS),與其他芯片的可比性較低;

2、昆侖芯片的TOPS 參數(shù)比 NVIDIA 的V100 高,但并未公布芯片的規(guī)模,只說明了整合了數(shù)萬個小核心,數(shù)據(jù)可比性也不高。

4.3.5 Google TPU

Google TPU于 2016 年在 Google I / O 上宣布,當時該公司表示 TPU已在其數(shù)據(jù)中心內(nèi)使用了一年以上。該芯片專為 Google 的 Tensor Flow(一個符號數(shù)學庫,用于神經(jīng)網(wǎng)絡(luò)等機器學習應用)框架而設(shè)計。

Google TPU 是專用的,并不面向市場,谷歌僅表示“將允許其他公司通過其云計算服務購買這些芯片。”今年 2 月,谷歌在其云平臺博客上宣布的TPU 服務開放價格大約為每 cloud TPU (180TFLOPS 和 64 GB 內(nèi)存)每小時6.50 美元。Google 使用 TPU開發(fā)圍棋系統(tǒng) AlphaGo 和 Alpha Zero 以及進行 Google 街景視頻文字處理等,能夠在不到五天的時間內(nèi)找到街景數(shù)據(jù)庫中的所有文字,此外 TPU也用于提供 Google 搜索結(jié)果的排序。

TPU與同期的 CPU和 GPU相比,可以提供 15-30 倍的性能提升,以及 30-80 倍的效率(性能/瓦特)提升。

4.3.6 Xilinx & 深鑒科技

Xilinx(賽靈思)是 FPGA 的先行者和領(lǐng)導者,1984 年,賽靈思發(fā)明了現(xiàn)場可編程門陣列 FPGA,作為半定制化的 ASIC,順應了計算機需求更專業(yè)的趨勢。FPGA 的好處是可編程以及帶來的靈活配置,同時還可以提高整體系統(tǒng)性能,比單獨開發(fā)芯片整個開發(fā)周期大為縮短,但缺點是價格、尺寸等因素。

在汽車 ADAS 和自動駕駛解決方案上,賽靈思的 FPGA 和 SOC 產(chǎn)品家族衍生出三個模塊:

自動駕駛中央控制器 Zynq UltraScale+ MPSoC

前置攝像頭 Zynq-7000 / Zynq UltraScale+ MPSoC

多傳感器融合系統(tǒng) Zynq UltraScale+ MPSoC

▲賽靈思Zynq芯片

Zynq 采用單一芯片即可完成ADAS 解決方案的開發(fā),SOC 平臺大幅提升了性能,便于各種捆綁式應用,能實現(xiàn)不同產(chǎn)品系列間的可擴展性,可幫助系統(tǒng)廠商加快在環(huán)繞視覺、3D 環(huán)繞視覺、后視攝像頭、動態(tài)校準、行人檢測、后視車道偏離警告和盲區(qū)檢測等ADAS 應用的開發(fā)時間。并且可以讓 OEM和 Tier1 在平臺上添加自己的IP 以及賽靈思自己的擴展。

▲賽靈思多傳感器融合系統(tǒng)

深鑒科技成立于2016 年,其創(chuàng)始團隊有著深厚的清華背景,專注于神經(jīng)網(wǎng)絡(luò)剪枝、深度壓縮技術(shù)及系統(tǒng)級優(yōu)化。2018 年 7 月 17 日,賽靈思宣布收購深鑒科技。自成立以來,深鑒科技就一直基于賽靈思的技術(shù)平臺開發(fā)機器學習解決方案,推出的兩個用于深度學習處理器的底層架構(gòu)—亞里士多德架構(gòu)和笛卡爾架構(gòu)的DPU 產(chǎn)品,都是基于賽靈思FPGA 器件。

▲亞里士多德架構(gòu)

▲笛卡爾架構(gòu)

對于賽靈思來說,看好深鑒科技基于機器學習的軟件、算法,以及面向云側(cè)和端側(cè)硬件架構(gòu)的優(yōu)勢;對于深鑒科技,后期發(fā)展高昂的研發(fā)費用、高成本的芯片設(shè)計、流片、試制、認證、投片量產(chǎn),投靠賽靈思能夠降低隨之而來的風險,進入芯片戰(zhàn)爭的持久戰(zhàn)。

2018 年 6 月,深鑒科技宣布進軍自動駕駛領(lǐng)域,自主研發(fā)的 ADAS輔助駕駛系統(tǒng)——DPhiAuto,目前已獲得日本與歐洲一線車企廠商和 Tier 1 的訂單,即將實現(xiàn)量產(chǎn)。

DPhiAuto,基于 FPGA,是面向高級輔助駕駛和自動駕駛的嵌入式 AI計算平臺,可提供車輛檢測、行人檢測、車道線檢測、語義分割、交通標志識別、可行駛區(qū)域檢測等深度學習算法功能,是一套針對計算機視覺環(huán)境感知的軟硬件協(xié)同產(chǎn)品。功耗方面,可以在 10-20W 的功耗范圍內(nèi),實現(xiàn)等效性能,能效比指標高于目前主流的 CPU、GPU方案。

▲DPhiAuto性能

▲DPhiAuto樣品

五、風險提示

自動駕駛及車聯(lián)網(wǎng)行業(yè)發(fā)展不及預期。可能出現(xiàn)自動駕駛及車聯(lián)網(wǎng)行業(yè)技術(shù)發(fā)展較慢,或出現(xiàn)相關(guān)事故使發(fā)展停滯情況。

自動駕駛裝車滲透不及預期。整車廠裝車計劃延遲。、

產(chǎn)品開發(fā)不及預期。控制器、芯片、傳感器、CID 等開發(fā)進度延遲;技術(shù)角度來說,自動駕駛越到開發(fā)測試的后期技術(shù)的提升越困難,提升的幅度越小。需要持續(xù)不斷的投入、測試,反復驗證更新解決方案。

產(chǎn)品成本下降不達預期。目前大多數(shù)系統(tǒng)及零部件的出貨量還很小,涉足的公司前期投入非常大,如果出貨量不達預期,成本下降有限。

使用場景限制。復雜路況需要的系統(tǒng)魯棒性極高,對于自動駕駛解決方案也是很大挑戰(zhàn)。

法律法規(guī)限制自動駕駛發(fā)展。道路測試、運行安全、駕駛規(guī)則、信息安全、責任劃分等等都需要法律法規(guī)的支持。要想推動智能汽車行業(yè)發(fā)展,完善立法是核心要素之一。

自動駕駛事故影響發(fā)展。自動駕駛遭遇嚴重事故案例,類似事故會造成輿論和政策方面的不利影響,延緩自動駕駛進展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1242

    瀏覽量

    121987
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4910

    瀏覽量

    130660
  • 車載芯片
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    15014

原文標題:自動駕駛芯片行業(yè)深度解析:GPU的現(xiàn)在和ASIC的未來!

文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    TPMS技術(shù)與發(fā)展趨勢

    TPMS技術(shù)與發(fā)展趨勢TPMS發(fā)射器由五個部分組成(1)具有壓力、溫度、加速度、電壓檢測和后信號處理ASIC 芯片組合的智能傳感器SoC;(2)4-8位單片機(MCU);(3)RF射頻發(fā)射芯片
    發(fā)表于 10-06 15:12

    stm8的發(fā)展趨勢

    大家來討論一下stm8的發(fā)展趨勢,聽說最近挺火哦!
    發(fā)表于 11-04 15:27

    開關(guān)電源的發(fā)展趨勢方向

    、體積輕、效率高等。開關(guān)電源以小型、輕量和高效率的特點被廣泛應用幾乎所有的電子設(shè)備,是當今電子信息產(chǎn)業(yè)飛速發(fā)展不可缺少的一種電源方式。開關(guān)電源發(fā)展方向  開關(guān)電源高頻化是其發(fā)展方向
    發(fā)表于 12-25 18:02

    PLC的未來發(fā)展趨勢的三個方向

    PLC的未來發(fā)展趨勢主要有以下的三個方向:1、功能向增強化和專業(yè)化地方向發(fā)展,針對不同行業(yè)的應用特點,開發(fā)出專業(yè)化的PLC產(chǎn)品,以此來提高產(chǎn)品的性能和降低產(chǎn)品的成本,提高產(chǎn)品的易用性和
    發(fā)表于 01-14 18:32

    開關(guān)電源發(fā)展趨勢發(fā)展前景

    趨勢,利潤點也比普通的恒壓,恒功率開關(guān)電源利潤點高。2、未來相當長的時間內(nèi),電子業(yè)發(fā)展會保持迅猛勢頭,有電子產(chǎn)品就要有電源。3、電子設(shè)備大發(fā)展方向是輕型、簡單,而電源要做到輕量化,非開關(guān)電源莫屬。4
    發(fā)表于 03-20 14:15

    光伏并網(wǎng)逆變器的發(fā)展趨勢

    `光伏并網(wǎng)逆變器的發(fā)展趨勢對于光伏并網(wǎng)逆變器來講,提高電源的轉(zhuǎn)換效率是一個永恒的課題,但是當系統(tǒng)的效率越來越高,進一步的效率改善會伴隨著性價比的低下,因此,如何保持一個很高的效率,又能維持很好
    發(fā)表于 09-29 16:40

    先進封裝技術(shù)的發(fā)展趨勢

    連接方式的發(fā)展趨勢半導體封裝內(nèi)部芯片和外部管腳以及芯片之間的連接起著確立芯片和外部的電氣連接、確保芯片和外界之問的輸入/輸出暢通的重要作用,
    發(fā)表于 11-23 17:03

    未來觸控產(chǎn)品發(fā)展趨勢1

    `未來觸控產(chǎn)品發(fā)展趨勢之一:高度集成性帶來低成本顯示驅(qū)動器IC與觸控功能加以集成、整合的解決方案將是未來的發(fā)展方向。由于智能手機向中低端市場延伸,從市場形態(tài)看,觸控產(chǎn)業(yè)也展現(xiàn)出低成本化的特征
    發(fā)表于 01-07 16:49

    單片機的發(fā)展趨勢

    [td]目前,單片機正朝著高性能和多品種方向發(fā)展趨勢將是進一步向著CMOS化、低功耗、體積小、容量大、性能高、價格低和外圍電路內(nèi)裝化等幾個方向發(fā)展,如今世界上各大
    發(fā)表于 01-29 07:02

    電源模塊的未來發(fā)展趨勢如何

    電源模塊的未來發(fā)展趨勢如何
    發(fā)表于 03-11 06:32

    電池供電的未來發(fā)展趨勢如何

    電池供電的未來發(fā)展趨勢如何
    發(fā)表于 03-11 07:07

    汽車電子技術(shù)的發(fā)展趨勢是什么?

    汽車電子技術(shù)的發(fā)展趨勢是什么?
    發(fā)表于 05-17 06:33

    CMOS射頻電路的發(fā)展趨勢如何?

    CMOS射頻電路的發(fā)展趨勢如何?
    發(fā)表于 05-31 06:05

    ai芯片gpu的區(qū)別

    ai芯片gpu的區(qū)別▌車載芯片發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子
    發(fā)表于 07-27 07:29

    車載芯片發(fā)展趨勢(CPU-GPU-FPGA-ASIC)

    ASIC芯片可在相對低水平的能耗下,將車載信息的數(shù)據(jù)處理速度提升更快,隨著自動駕駛的定制化需求提升,ASIC專用芯片將成為主流。本文以如上
    的頭像 發(fā)表于 08-09 11:11 ?2.4w次閱讀