女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>電子元器件>傳感器>

蘋果自動駕駛原型車上搭配大量傳感器

2021年01月01日 09:17 與非網 作者:與非網 用戶評論(0

近期車用芯片供貨緊張導致大眾部分停產,再次突顯了芯片對汽車的重要性,也顯示出握有上游資源的重要性,對傳統車廠來說這是一次警告,對蘋果來說,則是一則喜訊。蘋果在芯片領域耕耘多年,擁有豐富的資源。蘋果可以用手機巨大的出貨量攤薄汽車芯片高昂的研發成本,以高性價比超越英偉達和 Mobileye,當然也可以輕松碾壓特斯拉。同時亦可借助芯片提升造車的成功機率。

汽車進入智能化時代后,幾顆關鍵的主芯片,包括汽車座艙、智能駕駛和 V2X 芯片,都與手機 SoC 芯片高度重合,手機領域芯片稍作修改就可用于車載領域。這也使得高通、華為、聯發科三星手機芯片巨頭紛紛進入車載領域。

蘋果自動駕駛原型車上搭配的大量傳感器

2020 年 11 月 11 日,蘋果自研芯片 M1 正式亮相,這顆 M1 芯片是蘋果從手機領域向手機以外領域擴展的標志,這顆芯片稍作修改就可以用于汽車座艙和無人駕駛。蘋果收購了英特爾的基帶團隊,將來也能推出 5G V2X 芯片。

實際蘋果 M1 只是試水性質。蘋果的 A14 眾所周知,是兩個 Firestorm 大核加四個 Icestrom 小核,晶體管數量是 118 億個,晶體管密度是 1.34 億 / 平方毫米,L2 Cache 是 8MB。M1 沿用了 A14 的設計,晶體管密度完全一樣,只是增加了兩個大核,增加了 L2 Cache,增加一兩個專用硬核,除此之外并沒有新東西。甚至只是簡單的添加,連優化都沒有做,L2 Cache 多出來的 4MB 是外掛的,叫 L2.5 或許更合適。

蘋果這么做,復用了 A14 的設計,攤薄了成本,后續蘋果會推出一系列優化過后的芯片,性能將更強。GPU 算力上,M1 已經是英偉達 Xavier 的兩倍,英偉達的 Xavier 的 GPU 算力是 1.3FLTOPS(FP32),深度學習上,Xavier 比較高,有 30TOPS(INT8)。但 M1 要想做到 Orin 的 200TOPS(INT8)也易如反掌。

英偉達最新的 A100 GPU 是采用臺積電 7 納米工藝制造的,總共有 542 億晶體管,裸晶面積有 826 平方毫米,晶體管密度僅為 0.656 億 / 平方毫米。跟蘋果 M1 的密度差異巨大,要知道 A100 是純 GPU,電路比較單一,互連較少,很容易做高密度,如果是 Orin 這種 SoC,密度會下降很多,估計只有 0.55 億 / 平方毫米。不過這也算不錯。

英偉達的 GA104 采用三星的 8 納米工藝,晶體管數量只有 174 億個,裸晶面積高達 392 平方毫米,晶體管密度只有 0.444 億 / 平方毫米,臺積電的 7 納米工藝輕松秒殺三星的 8 納米工藝。如果 Orin 用三星的 8 納米工藝,裸晶面積會高達 500 平方毫米,面積大一倍,硬件成本也幾乎增加 50%以上。因為 GPU 的眾核架構,內部連線多,晶體管密度很難提高,但 GPU 擅長并行計算,NPU 只能做 MAC 運算,NPU 替代不了 GPU ,GPU 還得留著。

?

分辨率是 1180*1125,16 核 NPU 所占面積大約 1/15,也就是 7.93 平方毫米,有 11TOPS 的算力,如果蘋果 M1 也將裸晶面積擴展到 309 平方毫米,并且把多出來的都用 NPU,那么就多出來 263.56TOPS 的算力,加上原本的 11TOPS,有 274TOPS,扣除掉一些連線和其他元件,密度自然不會這么高,但 200TOPS 還是沒有任何問題的。

再來看 CPU 部分,做自動駕駛 SoC,CPU 的算力需求一樣很高,傳統智能駕駛的定位、傳感器融合、規劃、決策、通訊性能都取決于 CPU,人工智能的 NPU 算力只負責感知中的深度學習卷積運算,面非常窄,80%的性能還是由 CPU 決定,按照 ARM 的觀點,L4 級自動駕駛芯片的 CPU 算力要大于 250K DMIPS,同時功耗要低于 30 瓦。

?

英偉達的 Orin 是 ARM 的 Hercules,也就是 Cortex-A78。可以看出 M1 的 L1/L2 容量、解碼寬度、ROB 規模都非常大,往往是其它 CPU 的兩三倍(其中 12 MiB 的 L2 容量是四個大核共享,平均 3 MiB/ 核心,但運行單線程應用的時候,理論上可以全部由單個核心使用),前端、調度單元、緩存的龐大規模,保證了執行單元能最高效率發揮性能。因此單線程成績異常優秀,足以碾壓英特爾桌面級 CPU,也足以超越 Orin,更不要說遠不如 Orin 的特斯拉 FSD

?

為什么 M1 的單核性能幾乎是目前全球最高的?關鍵在于其 IPC(執行指令每周期)也就是圖中的解碼器是 8 個,簡單地說就是一個周期能執行 8 條指令,而英特爾是 5 個,英偉達是 4 個。特斯拉的 A72 只有 3 個。因此同樣頻率下 M1 單核性能是英偉達的一倍,比英特爾多 60%。在亂序執行性能方面,M1 要遠比英特爾和英偉達強。為什么 M1 可以有 8 個,英特爾和英偉達不能增加嗎?這主要是 ARM 架構(RISC,精簡指令集)和 CISC(X86 架構用的復雜指令集)導致的。

CISC 指令的長度不固定,即 1-15 比特。RISC 則是固定的。因此長度固定,可以分割為 8 個并行指令進入 8 個解碼器,但 CISC 就不能,它不知道指令的長度,因此需要預測指令的長度,也就是分支預測 Branch predictor,在分支指令執行結束之前猜測哪一路分支將會被運行,以提高處理器的指令流水線的性能。分支預測器猜測條件表達式兩路分支中哪一路最可能發生,然后推測執行這一路的指令,來避免流水線停頓造成的時間浪費。如果后來發現分支預測錯誤,那么流水線中推測執行的那些中間結果全部放棄,重新獲取正確的分支路線上的指令開始執行,這招致了程序執行的延遲。這就好像火車過岔路口,不知道哪一個正確,走過去一看,錯了,只能倒回來走另外一條。

現代微處理器趨向采用非常長的流水線,因此分支預測失敗可能會損失 10-20 個時鐘周期。越長的流水線就需要越好的分支預測。分支預測器異常復雜,這就使得解碼器很難增加,英特爾通過 CPU 內部的微操作,經歷長時間研發,增加到 5 個(1 個復雜解碼器+4 個簡單解碼器)。不過遇到有些長指令,CISC 可以一次完成,RISC 因為長度固定,就像公交車站,一定要在某個站停留一下,肯定不如 CISC 快。也就是說,RISC 一定要跟指令集,操作系統做優化,RISC 是以軟件為核心,針對某些特定軟件做的硬件,而 CISC 相反,他以硬件為核心,針對所有類型的軟件開發的。

英偉達照搬 Cortex-A78,其解碼器只有 4 個,很難增加,那樣等于重新自研架構了,可英偉達已經放棄自研架構了,M1 的指令重新排序緩沖區 ROB 也具備壓倒性優勢,這就是自研架構的優越之處。

再說特斯拉芯片設計能力遠遜于英偉達,英偉達都選用 ARM 公版架構,特斯拉自然不可能自研架構,特斯拉下一代采用臺積電工藝的二代 FSD 芯片,其 CPU 估計會選用 ARM Cortex-A76,因為第一代 FSD 是 2019 年 4 月推出的,采用的是 ARM 在 2015 年推出的 A72 架構,第二代 FSD 預計 2021 年或 2022 年推出,最有可能選用的 CPU 架構是 ARM 在 2018 年推出的 A76 架構。

現代手機芯片一般都是大小核設計來控制功耗,蘋果、高通都是功耗控制頂尖高手。特斯拉顯然沒有這個能力,直接堆疊了 12 個 A72,第一代 FSD 功耗高達 36 瓦,峰值可能達 72 瓦,這個肯定無法通過 ASIL 車規的。Orin 的 8 核,應該也是大小核設計。第二代 FSD 估計只會增加比較容易做的 NPU,為降低功耗,CPU 方面不會增加多少性能,估計仍然是 125-150K 左右。

蘋果認為多核是無意義的,CPU 通用計算能力在某些特定場合是要下降很多的,因此蘋果提倡多個專核或者叫硬核。M1 的專核包括圖像處理、視頻編解碼、音頻處理、加密解密、神經網絡加速。用在座艙或自動駕駛領域,可以把音頻處理、加密解密、視頻編解碼換成雙目視差、光流、ISP。

M1 幾乎和 A14 一樣,研發成本可以忽略。而 A14 的成本大約為 75-80 美元,M1 可以再低一點點,大約 70 美元,即使 M1 將 FPU 提高到 200TOPS(單純增加 FPU 幾乎不增加研發成本,堆疊更多 MAC 而已),其價格也會遠低于英偉達 Orin 的價格,大約只是英偉達的 1/2-1/3。不過蘋果不會正面與英偉達競爭,蘋果不會賣芯片,蘋果還是會打造自己的生態體系。這一次是電動車生態體系。

除了蘋果,高通 Ride 的性能也足以抗衡英偉達 Orin,高通有著每年至少 6 億片的出貨量,也可以分攤很多成本,包括研發成本和硬件成本。

要看到 A14 幾十億美元的研發經費,還有上億片的訂單數量,世界上沒有第二家企業能做到單一芯片上如此大的出貨量和如此大的研發投入(高通能達到這個出貨量,但單一芯片的研發投入肯定無法和一年只做一個芯片的蘋果比)。如果只有幾十萬片的訂單,最終攤在芯片上的成本可能要上萬美元,再有就是目前高性能計算芯片晶圓代工被臺積電壟斷(三星的 8 納米 LP 那可憐的晶體管密度連臺積電的 12 納米都不如,英偉達遲早也得轉移到臺積電代工,否則等著被英特爾或 AMD 碾壓),產能非常緊張,一些幾百萬片的訂單被臺積電推后超過 1 年。而蘋果是臺積電第一大客戶,自然不會擔心供應鏈的問題。中國急需發展的是晶圓代工而不是短平快且缺乏技術含量的的 AI 芯片設計,即使設計出來,也沒沒有對應的代工產能,只能是紙上芯片。

汽車進入電動化和智能化時代后,出現兩大變化,一是造車門檻大大降低,二是芯片重要性大大提升。燃油車和非智能化時代,蘋果無法在汽車領域復制其手機領域的成功,但電動化和智能化時代,蘋果可以復制其在手機領域的成功。
? ? ? ?責任編輯:pj

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

( 發表人:彭菁 )

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?