一輛蔚來ET7有33個感知硬件,在輔助駕駛狀態下,這些硬件每秒鐘捕捉到的數據總和大概是8GB,每個小時會產生大約28TB數據。
假設一個ET7車主每周只使用輔助駕駛功能一個小時,每年單車產生的數據量就是1456TB,達到了PB級。
截止9月份,蔚來ET7已經累計交付了15439輛,就目前這些車,一年產生的數據大約2247萬TB。
那么,儲存這些數據需要多少錢?
如果把這些數據存儲在移動硬盤里:
一個20TB移動硬盤,售價至少3000元,儲存2247萬TB數據,要用 112萬個20T移動硬盤,購買成本超過33億。
以上只是個非常保守的估算。隨著輔助駕駛功能進化,采集的數據會越來越多,可使用時長也會增加,以及汽車保有量本身都在不斷地增加,數據會很快暴漲至ZB(約等于10億TB)級別。
對于自動駕駛賽道上的每一個玩家來說,動輒幾十億的投入都是毛毛雨。因為這些數據是決勝未來的至關重要的寶藏。
但如此龐大、未來還會更加龐大的數據庫,如何有效地存儲,如何更好地利用?“云”,就被放到了前所未有的重要位置。
廣汽集團董事長曾慶洪曾說:“只有掌握數據才能有機生長。自動駕駛云數據中心,是實現算法場景演化疊加的有力保障,也是廣汽著手布局的關鍵賽道。”
有需求就會有生意。
騰訊、華為、百度、阿里等在云計算領域深耕多年的互聯網巨頭們望風而起,在新的土地上短兵相接。
而車企,作為原住民,許多能力建設需要假手于人,但也不希望看到外來者喧賓奪主……
博弈和取舍,一個跑馬圈地的故事,正在云端上演。
NO.1 [上云,沒得選]
“一個成型的數據中心,硬件耗資至少上億美元,這還不算運營維護費用,沒有一定規模的企業,無法承受這個成本。”某汽車集團旗下智能科技公司運維總監說道。
對研發自動駕駛的企業來說,前期研發階段測試車輛雖然在高強度運轉,但整體數據規模沒有十分龐大,通過自建數據中心等方式就可以支撐存儲和算力需求。
甚至在一些體量較小 Robotaxi 公司,僅用最原始的硬盤拷貝方式,就可以回傳全量數據,然后再進行數據挖掘。
但當自動駕駛從0-1的技術驗證階段進入1-N的商業化落地階段,如前所述,數據將會有的幾何級爆炸式增長。
如果想繼續通過硬盤拷貝、自建機房等方式來存儲數據將帶來難以承受的成本。
除了貴,更致命的缺陷是傳統的數據中心缺少可擴展性,很難滿足超出本地算力以外的突發性需求, 臨時采購或擴容服務器,會拖累研發進度,事后又容易造成資源閑置。
因此,“上云”就成為了自動駕駛從研發到商用的必由之路。
具象地說,“云”是通過互聯網訪問的服務器,以及在這些服務器上運行的軟件和數據庫。
云服務器分布在全球各地的數據中心中,通過使用云計算,用戶不必自己管理物理服務器或在自己的機器上運行軟件應用程序。
云服務通常有三個層次:軟件即服務(SaaS)、平臺即服務(PaaS)和基礎設施即服務(IaaS)
騰訊就宣稱,其自動駕駛云平臺提供的數據儲存方案,相比傳統的存儲方式可降低至少50%的存儲成本。
當然,把數據存起來只完成了數據驅動流程的第一步,也就是Iaas服務級別。
云服務商,可以提供數倍于本地的算力,并且擁有云端訓練復雜神經網絡模型的經驗,結合深度學習,實現自動標注能力提升,優化標注算法效率與精度,降低數據處理成本。
安永(中國)企業咨詢有限公司與華為合作撰寫的《智能汽車云服務白皮書》中指出。
依托更高算力和更多的經驗積累,汽車云服務數據綜合處理效率可以提升10倍以上,成本較人工降低50%。
另外,云服務商除了提供增量數據標注服務外,往往還為客戶提供海量、持續迭代的已標注對象,方便客戶利用既有數據,快速展開業務。
通過數據的采集和標注,得到了有價值的數據。而把這些數據用起來,則要依靠仿真模型訓練和測試。
很大程度上,仿真的效率決定了算法的迭代速度,也影響著完全自動駕駛的落地進程。
騰訊自動駕駛仿真業務總監孫馳天表示,“當前,自動駕駛算法已經能夠處理絕大部分的交通場景。完全自動駕駛落地,真正的挑戰在于少量corner case。”
而對于解決corner case, 行業中有個廣泛流傳的觀點:一套自動駕駛系統,需要至少100億英里的測試,其安全性能才能達到量產應用的條件。
這個距離相當于在地球和太陽之間往返50多次。從成本和時間上來說,沒有任何一個企業可以依靠道路測試跑完這個測試里程。
但仿真系統,可以以真實世界的數據、物理規律為基礎,構建出一個供自動駕駛汽車訓練的平行世界,大大降低測試成本。
不過,運行在本地的仿真,場景構建完全依靠自采數據,覆蓋度往往不足。另外,無法實現高并發的并行仿真測試,場景運轉效率難以滿足漫長的測試里程需求。
賽目科技總經理何豐就表示:“一種算法或一套傳感器方案可能需要幾十萬甚至上千萬個測試場景進行驗證。如果在單機里面進行測試,需要跑好幾月,這是不能滿足自動駕駛快速迭代開發需求的。”
而通過云+仿真的方式,可以在強大算力的支持下,并行運轉數千個仿真場景,實現高并發測試,快速地得到測試結果,將算法迭代的效率提升數倍。
NO.2 [車企謹慎“開掛”]
“相較于堆硬件、拼算法,云端‘內卷’更有可能成為勝負手。小鵬的扶搖未來很有可能成為一張‘大貓’。“一位供職于新勢力的軟件工程師這樣描述云對于自動駕駛的重要性。
一般來說,自動駕駛軟件開發的數據驅動流程是:數據采集-數據存儲-數據預處理-數據挖掘- 仿真模型訓練&測試-部署發布。
離開了云,理論上講這一套流程也能跑通。
但正如Panosim執行總裁李祥明所言:“所有的業務和物理世界本身就存在,而云就像一個‘外掛’,為自動駕駛的落地開了快車道。”
某種程度上,小鵬近期率先落地城市NGP,有扶搖這個“外掛”的一份功勞。
今年8月,阿里云也與小鵬汽車合建的智算中心“扶搖”,基于算力可達600PFLOPS(每秒浮點運算60億億次),規劃將小鵬汽車的自動駕駛訓練的速度提升近170倍。
其實說到自動駕駛云,最先應該提的是特斯拉。
特斯拉自研的超級計算機Dojo經過至少5年的準備,于2021年正式發布,總算力達到了1.8EFLOPS(每秒1.8百億億次浮點運算),能夠利用海量的視頻數據,進行無人監管的自動駕駛標注和訓練。
另外,特斯拉還建立了一個擁有60億個標注物的庫,和將近2000萬公里的虛擬道路,用于算法訓練。
Dojo的推出,讓馬斯克在感知硬件上有了進一步化繁為簡的底氣。今年10月,伴隨著取消Model 3與Model Y上超聲波雷達的消息,特斯拉也成為了徹底的純視覺派。
今后特斯拉還計劃通過“exapod”集群部署Dojo,每個集群由10臺機柜組成。
面向特斯拉自動駕駛汽車的AI模型進行換算之后,其處理能力將逼近每秒8百億億次浮點運算,是當前算力的四倍以上。
按照馬斯克的計劃,第一臺Dojo exapod將在2023年第一季度完成部署。
借助16萬參與FSDbeta測試用戶所產生的數據,Dojo exapod將讓FSD的成長速度更進一步。
當然,特斯拉本質上是一家軟件公司,Dojo也不光為了自動駕駛服務,擎天柱機器人、星鏈衛星等也需要云的支持。
馬斯克甚至認為,Dojo可以和亞馬遜的AWS相提并論。后者是全球最全面、應用最廣泛的云平臺。
歪個樓,馬斯克和杰夫·貝索斯(亞馬遜集團董事會執行主席)向來是不對付的,兩人吵了十幾年,經常在采訪和社交媒體中互相挖苦。
自建私有云的優勢在于,車企可以掌握核心數據以及全流程算法技術能力,更容易實現產品的差異化。
不過像特斯拉這么硬氣的并不多,因為云是一個入門門檻很高,高到一點不亞于造車的領域,自建私有云需要漫長的時間周期和巨大的建設成本。
經濟實力比較強的車企通常選擇自建私有云+采購公有云的混合云架構。
作為推動國內自動駕駛普及的先鋒企業,小鵬選擇和阿里云合作自建云計算中心,但還是會外采部分針對圖形數據的云計算和云存儲服務。
繼小鵬之后,今年10月上汽集團云計算數據中心項目落戶鄭州。根據規劃,上汽的云計算數據中心將按照兩萬臺服務器規模、互聯網開源技術架構一次規劃建設,為其智能出行、智能制造、智能駕駛發展賦能。
總體上講,相比自建云計算中心,以采購云服務商提供的公有云服務為主的方式其實更具性價比,也是多數自動駕駛開發者的選擇。
“開發者的核心能力在算法研發和定義產品上,云作為一種算法訓練工具應該盡量SaaS化。比如,直接在云端準備好豐富的標注數據、場景,甚至是訓練模型,最好做到開箱即用。”上述軟件工程師說道。
一方面要夠專業、方便使用,另一方面又要能做到底層解耦、自主可控,車企對于購買云服務也是要多方面權衡考量的。
因為云計算涉及到了企業競爭最關鍵的數據歸屬問題。
很多人應該還記得,在上汽榮威第一代互聯網車型火爆過后,阿里系與上汽系對車聯網數據及技術資源的爭奪,直接導致了車聯網先行者斑馬網絡的內亂。
“以工具鏈的使用來說,單獨一家供應商提供數據采集、標注、仿真等全棧工具鏈一定是效率最高的。但出于安全自主的考量,車企又希望在不同的環節選擇不同的供應商,甚至想通過自研工具鏈,提升自己在生態中的話語權。”某自動駕駛公司 IT 總監的話道出了車企的糾結。
NO.3 [ BATH跑馬圈地,讓子彈飛一會]
微軟、亞馬遜、谷歌等國際巨頭正加速在國內汽車云市場上的布局。
比如8月,微軟就在國內首次發布了面向汽車和移動出行,并以微軟智能云與智能邊緣技術為基礎的整體解決方案。
不過整體上,國內的汽車云市場還是BATH(百度、阿里、騰訊、華為)在唱主角。
面對著車企的需求與糾結,他們也在試圖尋找合作的平衡。
以騰訊為例,自2016年進入自動駕駛賽道以來,其發展方向幾經調整。
2018年,騰訊相繼拿到了北京和深圳兩地的自動駕駛測試牌照。時任騰訊自動駕駛實驗室負責人的蘇奎峰表示,要重點推進L3產品落地。
顯然,這個目標至今未實現,騰訊也早早放棄了做全套解決方案的念頭,將定位調整為,自動駕駛研發的軟件和服務提供商。
起初重點發力仿真業務。2019年推出自動駕駛虛擬仿真平臺TAD Sim并在一年后將其迭代到2.0版本。
騰訊的虛擬仿真業務,在長沙、襄陽、深圳等地的智能網聯汽車測試場或示范區中拿到了一些訂單,但在車企方面,建樹不多。
2021年,騰訊再次調整方向,推出了自動駕駛云平臺,虛擬仿真成為了工具鏈中的一環。同時,在云平臺中集成了西門子工業軟件、云測數據等企業的工具和軟件。
最終目的,就是在自動駕駛研發數據驅動的每一個流程上,都能夠提供開箱即用的便捷工具和服務。
用官方的話說,就是讓研發人員“拎包入住”。
同樣云+SaaS化的業務發展思路,也展現在華為的自動駕駛云服務“八爪魚”中。
早在2019年發布八爪魚的時候,華為就提出了要協助車企“0”基礎構建自動駕駛開發能力的口號。
為此,華為宣稱其在八爪魚中內置了2000萬框標注數據集、20萬仿真場景庫、以及完整的工具鏈和標注算法,讓車企能夠快速聚焦自動駕駛業務的核心價值。
相比前兩者,百度和阿里高調發布各自的自動駕駛云業務的時間比較晚。
今年 9 月,百度智能云推出三朵汽車云:覆蓋研發、生產、服務環節的集團云,覆蓋自動駕駛、智能座艙的網聯云,以及覆蓋產業協同、物流調度的供應鏈協同云。
可以看到,百度把供應鏈與自動駕駛提到了更高的地位。
此外幫助小鵬建設“扶搖”的阿里,將會在11月舉辦的云棲大會上,正式宣布其汽車云業務。
阿里云智能全球銷售總裁蔡英華說:“自動駕駛將是未來阿里云的三大支柱之一。”
值得注意的是,盡管各家的云品牌叫法不同,但趨勢很相似:
在服務SaaS化的同時,為了消除車企關于數據歸屬的顧慮,云服務商也在嘗試將工具鏈解耦,分為數據、訓練、仿真多個模塊,不捆綁銷售,用戶可與隨時替換,以此來保證車企的主導權。
根據公開信息,騰訊已經先后和寶馬、奔馳兩家車企在自動駕駛云領域達成合作。
按照公開的合作協議,騰訊將助力寶馬建設一個用于自動駕駛的高性能數據中心;和奔馳則是共同成立一個自動駕駛實驗室,推動奔馳L3級自動駕駛系統的本土化落地。
形成對比的是,到目前為止,并沒有車企單獨采購華為自動駕駛云服務的消息流出。但在其和極狐、問界等企業的合作中,這部分服務多半被打包其中。
但即便強勢如華為,也需要考慮客戶的接受度。為此,八爪魚會給客戶提供多種合作方案。
第一種,全包。華為負責開發并提供完整量產解決方案;
第二種半包,華為負責開發,客戶可自由配置部分參數;
第三種采購,華為提供自動駕駛開發工具鏈,客戶自研,華為提供全套售后開發咨詢服務。”
阿里在與小鵬合建扶搖之前,就已經在為路特斯、上汽智己、毫末智行、贏徹科技等企業的自動駕駛模型訓練提供算力和技術支持。
總體來講,大家目前都處于市場開拓的初期階段,但自動駕駛云市場廣闊、前景光明。讓子彈再飛一會,才能真正看出格局。
-
自動駕駛
+關注
關注
788文章
14209瀏覽量
169602 -
蔚來
+關注
關注
1文章
527瀏覽量
14848
發布評論請先 登錄
百度最新消息:蘿卜快跑在港自動駕駛測試區再擴大 百度智能云持續領跑中國大模型

評論