7月5日一早,李彥宏乘坐一輛基于Apollo 技術開發(fā)的自動駕駛汽車從百度大廈前往國家會議中心,本次百度AI 開發(fā)者大會的進程也隨之徐徐展開。路上,李彥宏還和現(xiàn)場的陸奇進行了連線互動:
百度AI開發(fā)者大會(Baidu Create 2017)是全球首個專注于AI開發(fā)者的盛會,現(xiàn)場有近5000名開發(fā)者和生態(tài)合作伙伴出席。在此次大會上,百度宣布開放Apollo和DuerOS 兩大平臺和60項核心AI能力。李彥宏、陸奇在現(xiàn)場發(fā)表了演講。
Baidu Create是百度、也是中國工業(yè)界第一次大規(guī)模的AI 開發(fā)者大會。和歷史上的機械化時代、電氣化時代、信息化時代一樣,AI對社會的影響深度和廣度都是空前的,AI將和前三次工業(yè)革命一樣,讓人類進入全新的時代。
百度17年的搜索業(yè)務和早期的戰(zhàn)略投入,讓我們積累了大量的人才、技術和數(shù)據(jù)資源。技術方面,百度擁有全球領先的大規(guī)模神經(jīng)網(wǎng)絡;人才方面,百度目前有超過2000個的AI研發(fā)人員,有一流的AI研發(fā)中心;數(shù)據(jù)方面,百度有超過百億級的定位數(shù)據(jù)和萬億級的搜索數(shù)據(jù)。這使百度成為最有能力、最有機會來推動AI的發(fā)展的一個公司。
AI的未來是屬于開發(fā)者,開發(fā)者是我們工業(yè)驅(qū)動力、主驅(qū)動力,百度的未來是建立在與開發(fā)者共贏基礎上。開發(fā)者的成功,才是百度真正的成功。這是我們承諾,這也是百度AI平臺的核心價值觀念。AI時代的機會非常多,但是壁壘還很高,百度要為每一位AI開發(fā)者解除障礙、創(chuàng)造機會,提供工具、數(shù)據(jù)、基礎設施,以及良好的開發(fā)環(huán)境。
“這是一個個人版的開發(fā)套件,這是輕量版的開發(fā)套件……”在百度AI開發(fā)者大會上,百度度秘事業(yè)部總經(jīng)理景鯤接連掏出了三款DuerOS開發(fā)套件和一款硬件參考設計。只要接一個電源,接一個麥克風,就能“喚醒萬物”。
在景鯤看來:“喚醒萬物”的核心三要素是要做好“聽清、聽懂、滿足”。
1.“聽清”方面:百度的語音識別準確率達到了97%以上,但這些在AI時代還不夠。在AI時代,我們希望把語音放到真正的場景里面,麥克風陣列、回聲消除、波束成型、語音喚醒、人像識別等,都是我們逐漸推進的世界先進技術,將被放到各種場景中實現(xiàn)用戶聽清的需求。
2.“聽懂”方面:數(shù)據(jù)多、技術深是打造對話系統(tǒng)的必然條件,具備這兩點才能做好一個真正可以對話的“聽懂”系統(tǒng)。百度是具備數(shù)據(jù)量最大的公司,我們有十億級的數(shù)據(jù)和百億級的知識。在AI時代,要做到聽懂用戶,實時圖譜數(shù)據(jù)的力量將是一個非常重要的支撐。
3.聽懂并滿足“聽一首XX的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復雜的需求,比如“我要聽‘我手一杯品嘗你的美’這首歌”,比如“想聽哥哥的歌”,只有把用戶在真實場景中表達的復雜請求做好,才能真正做出一個真正聽懂用戶需求的產(chǎn)品。
景鯤說:“我們的目標就是要做FreeStyle,讓用戶最自然地跟設備進行交互。”
他還現(xiàn)場演示了與DuerOS的多輪交互對話:
“找一下本地人氣最火爆的家常菜”
“雍和宮附近有嗎”
“第二家有什么推薦菜”
“有wifi嗎”
“好停車嗎”
……
KITT.AI 聯(lián)合創(chuàng)始人、CTO陳果果
景鯤在百度開發(fā)者大會現(xiàn)場宣布:百度將全資收購KITT.AI,把KITT.AI的技術融入道百度平臺中,全面、免費、正式地向百度的合作伙伴賦能開放。
KITT.AI專注語音喚醒和自然語音交互技術,是唯一一家獲得亞馬遜Alexa和微軟聯(lián)合創(chuàng)始人Paul Allen投資的公司,并入選了CB Insights人工智能創(chuàng)業(yè)100強。
DuerOS將為開發(fā)者提供最容易上手的軟硬件一體化方案,包括多樣化的開發(fā)套件和完全開放的參考設計:
1.搭載樹莓派。利用科勝訊技術的個人版。即可申請就可以搭載一個個人可以對話的語音設備。
2.輕量版。把一元錢大小的芯片放在任何一個設備里面,設備就可以對話。
3.標準版。兩麥、四麥、六麥、八麥的標準版都可以即可申請。
4.完整一體化的參考設計。如開放電路板設計、開放結(jié)構設計、開放麥克風陣列等等。
從4月19日百度宣布Apollo計劃之后,在短短兩個多月內(nèi)該計劃得到了工業(yè)界廣泛的正面反應。今天,陸奇正式公布了Apollo整體戰(zhàn)略和開放路線圖。
Apollo生態(tài)設計是基于一個強大理念和宗旨,即Apollo宣言。Apollo宣言有四個基本原則:
1.開放能力。今天的汽車工業(yè)正在走向自動駕駛的未來,但最大痛點是技術壁壘太高,任何一家企業(yè)都需要多年技術,人才和數(shù)據(jù)的累積。百度起步較早,有將近4年的相關積累,并且有強大的持續(xù)研發(fā)能力。百度將把這些能力開放給合作者,讓他們很快進入自動駕駛研發(fā)。
2.共享資源。任何一個Apollo的合作伙伴都可以使用Apollo技術,同時他們都有機會對Apollo生態(tài)做貢獻,尤其是貢獻有價值的數(shù)據(jù)資源。Apollo計劃的共享原則是:你從Apollo生態(tài)中獲得的,將遠遠多于你所貢獻的。貢獻的越多,獲得的更多。Apollo受益,合作伙伴更受益。
3.加速創(chuàng)新。這是Apollo的核心所在,因為AI的技術核心是數(shù)據(jù)+能力。數(shù)據(jù)的累積、能力的迭代、技術更新的速度是整個工業(yè)的關鍵。Apollo生態(tài)會將越來越多的數(shù)據(jù)資源匯總在一起,這樣Apollo每天開過的路就越多,測試的場景會越來越多,而且這個迭代、創(chuàng)新的速度將會不斷的加快。未來Apollo的創(chuàng)新速度和創(chuàng)新能力將超過任何一個封閉體系,Apollo自動駕駛能力一定會領先整個工業(yè)。
4.持續(xù)共贏。百度的商業(yè)模式將基于百度的算法、數(shù)據(jù)、大規(guī)模計算等核心能力,聚焦提供一系列高價值的商業(yè)化核心服務。百度所提供的能力,將是目前汽車工業(yè)所沒有、可互補的。每個合作伙伴都可以聚焦在自己的核心能力上,用Apollo來加速創(chuàng)新,獲取更多的商業(yè)價值。
Apollo的核心技術框架由四層組成:
一、中間是軟件平臺。Apollo開放了一系列重要模塊,重點是以下四大模塊。
1、自定位模塊:使用百度業(yè)內(nèi)領先的高精地圖,加上多種傳感器融合,讓每一輛車都可以低成本、全天候地精準定位。
2、感知模塊:感知是當前自動駕駛工業(yè)創(chuàng)新的重點,運用頂尖的人工智能技術能看清和看懂路況,包括每一個障礙物、行人、車輛。
3、車輛規(guī)劃控制:Apollo模型運用AI和大數(shù)據(jù),采取最安全的駕駛策略做到精確的車輛控制,也能適應不同國家的交通路況。
4、運行框架:它的核心是安全、可靠、實時控制,并能同時支持Intel和NVIDIA的芯片。
二、最上層是服務平臺。Apollo一系列重要的開放能力都匯聚于此。重點包括:
1、高精地圖服務,這是自動駕駛的千里眼。
2、仿真引擎。百度在快速累積海量的數(shù)據(jù),能讓開發(fā)者日行百萬公里
3、安全服務。百度將為開發(fā)者持續(xù)提供高度的安全服務。
另外,DuerOS服務將為每一輛車提供智能化的車內(nèi)用戶體驗。
三、參考硬件平臺和參考車輛平臺。
Apollo硬件平臺支持從CPU到GPU到FPGA各種計算硬件,也支持從GPS、IMU、攝像頭,到激光雷達等各種傳感器。同時,Apollo提供的黑盒子能夠記錄和保存所有的數(shù)據(jù)信號,使得合作伙伴可以更安全、有效地預防和處理車輛事故。
把所有的模塊加在一起,Apollo能讓每一個開發(fā)者從 0 到 1, 快速組裝一輛屬于自己的自動駕駛車。今天正式對外開放Apollo 1.0,它將有三種不同的開放形式:開放代碼、開放數(shù)據(jù)和開放能力。百度的合作伙伴AutonomouStuff的一位工程師,根據(jù)百度今天發(fā)布的軟件框架、結(jié)合推薦的硬件組合方案,只用了三天時間就改造完成了一輛自動駕駛汽車。
百度今天正式對外開放的是Apollo 1.0。百度開放了封閉場地循跡自動駕駛能力、自定位能力和端到端等非常有價值的數(shù)據(jù)。更為重要的是,Apollo會快速地開放越來越多的能力,每周都會更新,每兩個月左右都有新的版本和總體能力的提升。
點擊查看大圖
接下來百度的具體計劃是,到今年9月份,Apollo將會開放固定車道自動駕駛能力和開放部分的仿真引擎數(shù)據(jù);到今年年底,Apollo將開放一系列新的能力,使車輛能夠在簡單城市路況下,完成自動駕駛?cè)蝿眨瑫r會開放更多的數(shù)據(jù)及數(shù)據(jù)上傳的接口;2018、2019、2020年,Apollo會加強開發(fā)能力,加速開放速度,直到最后實現(xiàn)完全自動無人駕駛。
陸奇宣布Apollo生態(tài)正式誕生,初始合作伙伴超過50個,陣容豪華,包括:
1.13家優(yōu)秀的中國汽車制造商和兩家世界一流的汽車制造商——福特和戴姆勒。
2.世界一流的汽車零部件供應商和和芯片公司、傳感器公司、地圖公司、云服務公司、創(chuàng)業(yè)公司、研究機構。
3.中國眾多的城市合作伙伴。
陸奇說:今天的Apollo已經(jīng)是世界上最強大自動駕駛生態(tài)。
Apollo的主戰(zhàn)場在中國,它將給中國汽車工業(yè)提供最好的創(chuàng)新生態(tài)。“我們有信心也有能力,在未來的3-5年內(nèi)讓中國的自動駕駛站在世界前沿。”陸奇說。
Apollo也是世界的。百度今天宣布,已經(jīng)成立Apollo美國子公司和新加坡子公司。“我們將在美國、新加坡和當?shù)睾献骰锇橐黄鸢l(fā)展自動駕駛汽車業(yè)務。這將是中國近代史上,第一次用中國的技術來引領一個巨大工業(yè)的全球發(fā)展。
1.最完整:百度AI平臺是由百度大腦和百度智能云組成,這是中國最完整、最全面的AI平臺。百度大腦是百度AI平臺的核心,智能云是百度AI平臺的基礎。
2.最開放:百度為開發(fā)者提供60種強大的、可組合的AI能力,這個數(shù)量遠遠超過其他平臺。包括語音識別,圖像識別,人臉識別,視頻理解,自然語言處理等,不管是質(zhì)量和數(shù)量都是業(yè)界領先的。百度語音識別API年增長 300%,圖像識別API月增長 200%。百度PaddlePaddle是國內(nèi)第一個開源的深度學習計算平臺。
3.最前沿:百度將會開放一系列新的AI能力。在百度大腦,將提供遠場語音識別、視頻理解、增強現(xiàn)實、機器人視覺、自然語言處理平臺等;在百度智能云,將提供新的更簡單易用的云開發(fā)平臺。同時,百度為企業(yè)客戶提供AI-Stack,這是一個具備AI特性的混合云方案。
4.最有活力、最具生命力:百度自己是最大的AI開發(fā)者,也是百度AI平臺的最大使用者。百度絕大部分應用比如搜索、信息流等都在使用百度AI平臺;百度使用AI平臺與與合作伙伴開發(fā)了一系列的AI解決方案和智能云生態(tài),比如智能客服、智能銷售、金融大腦、醫(yī)療大腦、教育大腦、出行大腦等等。另外,百度AI平臺也在不斷的激發(fā)有創(chuàng)意的、有深遠社會意義的新的場景和應用。例如使用AI尋人,幫助老人找回失落多年的親人,使用人臉就在機場馬上登機等。
這一切應用都會持續(xù)推進百度AI平臺的發(fā)展。最重要的是,百度AI平臺的核心技術經(jīng)過了長期的積累,以及大量用戶實際應用的考驗,所以最有活力,最有生命力。
一、推出“AI Star計劃”。在3年內(nèi)幫助培養(yǎng)10萬名AI工程師人才,通過資金、培訓、市場、政策等配套措施,為AI 開發(fā)者提供全方位的扶持。
二、舉行第13屆“百度之星”大賽。“百度之星”在中國科技行業(yè)極具影響力,歷屆大賽參賽學生數(shù)累計已超過20萬。今年大賽將以 “Create for more (豈止創(chuàng)造)”為主題,在傳統(tǒng)的“程序設計大賽”上新增“開發(fā)者大賽”,讓更多開發(fā)者能有機會參與進來,用最強、最好的AI能力來做創(chuàng)新。
三、攜手長江產(chǎn)業(yè)基金助力開發(fā)者成功,成立Apollo基金和DuerOS基金,推動中國AI的發(fā)展。
1.NVIDIA方面:百度與之達成的合作領域包括四個方面:在Apollo上合作開發(fā)自動駕駛技術,NVIDIA將提供Apollo的參考計算硬件;在PaddlePaddle 深度學習平臺上,NVIDIA將專門投入研發(fā)團隊使PaddlePaddle將來成為中國最強的深度學習平臺;在DuerOS 和百度智能云上,NVIDIA做深度的合作為開發(fā)者提供更好的GPU支持。
2.英特爾方面:英特爾AI產(chǎn)品集團CTO Amir Khosrowsashi介紹,百度和英特爾已經(jīng)進行了十年的合作,主要有三個合作方面:百度大腦;百度智能云;DuerOS。雙方的合作將讓英特爾在中國有更大的發(fā)展空間,百度也將得到更好的結(jié)果。Amir表示,英特爾非常重視中國的開發(fā)者。今天大會的宗旨是為開發(fā)者創(chuàng)造,英特爾也是如此。
李彥宏今天乘坐了兩輛不同的無人車,從百度大廈到達國家會議中心會場。
第一輛是百度和博世共同打造的一輛SUV,這輛車能夠在高速封閉道路上實現(xiàn)自動駕駛。第二輛是在國家會議中心門口換乘的一輛黑色轎車,這輛車除了定位系統(tǒng),并沒有其他的雷達和傳感器,可以根據(jù)人工駕駛的軌跡,實現(xiàn)在封閉園區(qū)規(guī)定線路上的自動駕駛。
而這輛黑色轎車,就是Apollo計劃第一階段開放的自動駕駛能力,是Apollo計劃的起點,為合作伙伴提供最系統(tǒng)、成熟、門檻最低的方案。這輛車就是前面提到AutonomouStuff的工程師用百度開放的技術花了三天時間改造完成的。
PC互聯(lián)網(wǎng)時代,開發(fā)者都是從頭開始做,創(chuàng)造了一個偉大的互聯(lián)網(wǎng)傳奇。
移動互聯(lián)網(wǎng)時代,技術領域沒有太多的創(chuàng)新,對于開發(fā)者來說,施展空間并不是很大。
AI時代的到來,讓技術創(chuàng)新重新煥發(fā)了生機,PC互聯(lián)網(wǎng)時代的個人英雄主義行不通了。AI時代的創(chuàng)新需要算法和數(shù)據(jù)的雙輪驅(qū)動,優(yōu)秀的算法可以產(chǎn)生越來越多有價值的數(shù)據(jù),有價值的數(shù)據(jù)又會反過來推進算法的進一步提升和改進。這樣無限的循環(huán)使得過去幾年的AI技術不斷超越人們的想象。
在古代,人和人之間的溝通是非常低效的,相隔萬里的人無法共享成果。今天是一個完全不一樣的時代,我們沒有必要每個人再“重新發(fā)明一遍輪子”。AI大潮到來的時候,我們可以把所有的東西放進“聚寶盆”,只要你去共享、參與,你就能獲得更多。AI是通往未來的必由之路,開放會讓我們所有人獲得更多。
四個開發(fā)者的故事,告訴我們世界應該變的更智能
為什么坐飛機,要記著帶身份證還要過排隊過安檢,要各種各樣的等待,不能直接刷一下臉就過去呢?我們已經(jīng)在南陽實現(xiàn)了這一點。為什么機場都應該不能應該像家人一樣,認識你、歡迎你?每一次新的電器出現(xiàn)的時候,為什么要拿著長長的說明書研究?為什么家庭遙控器要有那么多的按鈕,難以記住它們的功能?這些用AI的力量都可以解決。因為AI,世界會變得更簡單。
這,是開發(fā)者的黃金歲月,我們堅信開放能創(chuàng)造最好的時代!
評論