據外媒報道,貼標(labeling)將助力機器學習的運行。單個標簽能向人工神經元網絡說明給定輸入信息的正確輸出值。
舉個例子,視頻中空閑車道的像素會被貼上「自由空間/可用空間」的標簽。與車輛、行人、人行道、交通錐標、障礙物等所對應的像素則不得被標記為「自由空間/可用空間」。鑒于有足量的標簽示例,神經元網絡非常善于學習與路面及障礙物相對應的像素圖形種類。
在展示的一段新視頻中,經訓練的神經元網絡可給出正確的輸出結果,使得自動駕駛車輛能夠了解哪些地方可實現自動駕駛車輛的安全行駛,哪些地方則無法做到這一點。以下視頻展示了特斯拉系統對「自由空間/可用空間」的理解,其采用綠色來表示:
默認的視頻貼標實現方式是聘用相關人員來對視頻像素內容進行人工貼標工作,然而,該方式代價太高昂了,因為手動貼標非常耗時,而所需標記數據的數量十分巨大。若我們有其他方式完成數據貼標,會怎樣做呢?
通用高管闡述自動貼標理念
事實證明,我們已經找到了替代性方案。通用旗下的自動駕駛汽車子公司——Cruise 的總裁兼首席技術官 Kyle Vogt 最近簡述了其基本理念:
我們如今所做的工作,更多的是自動貼標。我的意思是,基本上,要將人工貼標(human labeling)從工作回路中剔除掉。
真正讓我感到有意思的是,我們可以從車輛駕駛方式中推斷出很多內容。若車輛駕駛未曾出現過任何錯誤,那么就能從中推斷出車輛駕駛中所暗含的正確(操作)事項。當自動駕駛車輛能夠在大體上保持駕駛操作的正確性,車內的乘客就會說「你干得不錯啊!」對于我個人而言,這意味著車輛需要獲得非常豐富的信息源。
沃格特繼續說道:「若您是公司方,且您的業務模式仍依賴于數據的人工貼標,那么您公司將被某些競爭對手的公司碾壓,因為后者正在思考應如何采用新方式來重新梳理數據貼標,確保其不必為了這類數據標簽耗費太多精力或直接剔除工作回路中的人工貼標環節。」
那么,若采用人工駕駛習慣來完成對「自由空間/可用空間」的自動貼標呢?在 2018 年發布的一篇論文中,計算機視覺研究人員(含兩名印第安納大學的研究人員)作出了探索嘗試。
人類駕駛員很少會撞上障礙物,他(她)們幾乎始終在空閑車道行駛。因此,人工駕駛可被用作「自由空間/可用空間」的(自動)貼標途徑。研究人員將這類自動貼標與視線中可看到的「自由空間/可用空間」推定相結合。此外,該方法的自動貼標技術精度達到了手動貼標方式精度的 98%。
特斯拉在自動貼標領域的優勢
特斯拉自今年初開始公開強調自動貼標的重要性,埃隆馬斯克在今年 2 月份的采訪中表示:「我們開始使用自動貼標方式,效果確實比人工貼標要好。就我個人而言,當駕駛員將車輛駛向十字路口時,該操作行為在訓練 Autopilot,告知其在遇到十字路口時所需完成的操作。」
在今年 4 月的「自動駕駛日」(Autonomy Day)特斯拉人工智能部門的高級主管 Andrej Karpathy 反復探討特斯拉是如何使用自動貼標的。以下視頻為其中的一個示例:
我們不妨回顧下今年 2 月特斯拉 Autopilot 團隊發布的崗位說明,特斯拉當時在尋找應聘人員,要求后者能夠設計新方法,從而使用可輕松標記好(lightly labeled)的海量貼標數據。
這類對「自由空間/可用空間」的自動貼標似乎與特斯拉的慣用做法非常契合。相較于前文所提及的研究人員,特斯拉所能接觸到的數據量更加豐富。舉個例子,特斯拉能夠探查到急剎車及車輛碰撞的其他標志。從理論上講,該方法或許還能清除特斯拉車輛未進入「自由空間/可用空間」的那些示例。
特斯拉的數據不但豐富,還非常充裕。
截止至今年底,特斯拉將擁有近 70 萬輛配有環視攝像頭的特斯拉車輛在路面上行駛,其車輛搭載了第二代或第三代車載計算機。
這類車輛的月平均行駛里程數逾 1000 英里/輛(約合 1609.3 公里/輛),而這類的總行駛里程數逾 7 億英里/月(約合 11.27 億公里/月)。
相較之下,Waymo 車隊只有 600 輛自動駕駛車輛,這是全球最大的自動駕駛路測車隊。在美國,將所有公司的自動駕駛測試車輛匯總后,其總數才不過近 1400 輛。即便這 1400 輛自動駕駛測試車輛全天候無停歇地行駛,且平均車速保持在 70 英里/小時(約合 112.65 公里/小時),每月的測試里程總數也只有近 7000 萬英里(約合 1.127 億公里)。
懷疑論者恰巧指出,若特斯拉對其車隊所采集的視頻數據進行手動貼標,細化到「每英里」這一層級,從經濟角度看,手動貼標并不具有可行性。然而,自動貼標有望完成更高大數量的數據標貼工作。
百度的研究使得我們對神經元網絡精度等級與貼標訓練數據間的關聯性有了大致的了解。在對圖像內的多個目標物進行分類時,當各指令所對應的貼標訓練示例的數量呈倍數增長時,其精度大致能翻番。因此,當上述數據量翻十倍,精度翻兩倍。當數量翻百倍,精度翻四倍,當數據量翻千(10 的三次方)倍,精度翻八( 2 的三次方)倍,以此類推。(當數據量翻 10 的 X 次方倍,精度則翻 2 的 X 次方倍)。
而對「自由空間/可用空間」識別的增長速率可能更高。
對「自由空間/可用空間」的識別工作屬于二進制,一個像素,要么對應「自由空間/可用空間」,要么對應「非自由空間/非可用空間」。相較之下,百度更關注如何從上千種可能性中挑選出正確的目標物類別。這類測試的精度標準更顯寬容性,若能將其正確地歸入到五大猜測類型中,神經元網絡就會視其為正確的分類(貼標)。采用這類方法,訓練精度每翻四倍,精度則翻倍。例如,若數據量翻 4 倍,精度翻 2 倍。若數據量翻 16 倍,精度翻 4 倍。若數據量翻 64 倍,則精度翻 8 倍,以此類推。
除了識別「自由空間/可用空間」,特斯拉還可能將自動貼標用于其他計算機視覺任務。那么,將人工駕駛行為用于對交通燈的貼標輔助會怎樣呢?
當駕駛員驅車時,交通燈通常處于綠燈狀態。當駕駛員停車時,交通燈通常處于紅燈或黃燈狀態。當然,這類標簽也會存在一點「雜音」,畢竟駕駛員偶爾也會在紅燈時行駛,但研究人員表明,即便存在這類「雜音」標簽,該舉措也能大幅提升操作的精度。自動貼標并不需要排斥手動貼標,相反,自動貼標可被用作手動貼標的輔助手段。
顯然,手動貼標也是特斯拉機器學習流程的一個重要環節。Andrej Karpathy在「自動駕駛日」活動中對此作出了解釋。當談到對視頻或圖像進行手動分類貼標時,特斯拉車輛的規模性是一大恩賜(優勢)。
凱勒·沃格特表示:「我們需要海量的數據和駕駛(測試),原因在于試圖最大限度地獲取我們當前所持有數據組的熵值并確保其多樣性。從本質上講,熵值代表了數據的意外性、新穎性或不可預知性。」
一組研究人員設計了一種新方法,從原始的、未經貼標的視頻中發現新的目標物類別。該技術或類似技術有望幫助特斯拉從車隊里程數中提取大量罕見的邊界用例(rare edge cases)。即使對圖像或視頻均采用手動貼標,特斯拉數據組的熵值和多樣性也更高。
除了計算機視覺領域外,特斯拉還能將自動貼標應用到其他領域。當談到預測道路用戶的行為時,很容易想到自動貼標技術。未來將為過去貼上標簽。特斯拉可利用海量的行駛里程數來改進預測精度,且無需進行任何手動貼標。
當談到仿效上路行駛的人工駕駛操控時,也會產生數量充足的自動標簽。駕駛員憑借其駕駛操作,自動完成貼標操作(該類標簽能夠被車載計算機視覺系統所識別),這就是所熟知的仿效學習(imitation learning)。特斯拉利用車隊還學習人類駕駛員的駕駛方式。
由于特斯拉車隊的行駛里程數遠高于競爭者車隊行駛里程數的總和,特斯拉可以使用自動貼標技術來提升計算機視覺、行人預測及駕駛操作習慣(通常被稱為“規劃”)的性能表現。基于上述的百度研究成果,特斯拉在機器學習任務若采用自動貼標,或將提升數據的數量級及其精度,超越其他競爭對手。
我認為,完全自動駕駛車輛的前景還有些晦澀難明。
今年 6 月,Cruise 的一份內部報告被泄露給媒體了。該報告涵蓋了 Cruise 的預期:到 2019 年末,相較于人工駕駛的安全性,其自動駕駛車輛的安全性只能達到前者水平的 5%-11% 。從某個角度看,這一點令人頗感失望。從另一個角度看,這卻是個鼓舞人心的好消息。若 Cruise 能在今年末達到其預期目標,這意味著「只」需要進一步提升 10 倍或 20 倍的安全性水平就能達到人工駕駛的平均水平。
在本文中,像特斯拉這類公司是能夠利用自動貼標和大規模車隊學習的,這類舉措或將大幅提升與自動駕駛相關數據的數量級及機器學習任務的數量。
完全自動駕駛套件及 Cybertruck 為特斯拉帶來的機遇
完全自動駕駛車輛的金融機遇非常大。
在軟件成本方面(如:幾近于零的邊際成本),消費型車輛將轉型為盈利性無人駕駛出租車。麥肯錫的分析師預計,僅洛杉磯一地,無人駕駛出租車將產生 200 億美元(約合 1408 億元)的年收入。此外,麥肯錫還預測,若結合無人駕駛出租車及完全自動駕駛的私家車,中國市場的年收入或將高達 2 萬億美元(約合 14.08 萬億元)。
然而,一定程度的自動駕駛也不應被忽視。若將機器學習與人工監管、人為操作介入相結合,也能夠為用戶提供安全、愉悅的駕駛出行服務。如今,自動駕駛市場競爭激烈,人類與計算機有時需要攜手合作,類似于「在人類與機器人間展開的國際象棋賽(cyborg chess)」。在不遠的將來,我們可能會看到「半人半機器的駕駛(cyborg driving)」,這類人機結合的方式可同時利用人工神經元網絡和生物體(人類)各自的優勢。
從實用的財務角度考量,這意味著特斯拉完全駕駛功能(Full Self-Driving Capability)軟件選配件擁有較高的轉換率(盈利能力,take rate),這得益于該項選配件所帶來的收入,可能與其較高的定價及特斯拉車輛需求增長有關。總而言之,該選配件可為特斯拉帶來較高的收入和毛利率。
此外,特斯拉 Cybertruck 的未來主義設計風格也引發了熱議,口碑呈現兩極分化。
Cybertruck 和《銀翼殺手》(Blade Runner)的風格較像,預計首批 Cybertruck 的交付時間要等到 2021 年的年末后。到那時,我認為很可能還會推動先進城市駕駛功能的涌現,該類功能勢必也具有未來主義風格,就像其外觀一樣超前。Cybertruck 使得人機結合駕駛變得更有意義,但這要取決于 Cybertruck 的受歡迎程度。據我個人預計,未來特斯拉或將推出 Cybercar 和 CyberSUV。
在我們享受無人駕駛出租車服務或成為半人半機器(cyborg drivers)駕駛員前,特斯拉還有一堆人工的設計及研發工作需要完成,這需要花時間。在特斯拉的研發進程中,并非所有的進程都能實現自動化,這一點難以預計。
如今,我們能做的就是等待并觀察特斯拉向旗下車隊發布的軟件升級包及其新增功能。
評論