2019 開工第一天,云知聲就拋出今年的小目標,要造三款 AI 芯片!
2019 年的第一個工作日,云知聲創始人、CEO 黃偉以一句“少有人走的路”,為其多模態 AI 芯片戰略拉開帷幕。
2014 年人工智能還遠未如此火熱,黃偉在面向 B 端市場的商業探索中,就意識到算力、算法結合在一起的重要性,于是確定了“云端芯”一體化的戰略,并于 2015 年啟動自研 AI 芯片。
在 AI 前夜的那個節點來看,作為一家剛成立 2 年的創業公司,云知聲當時的策略無疑飽受質疑。
然而隨著阿爾法狗(AlphaGo)戰勝世界頂級圍棋選手李世石后,AI 浪潮襲來,并逐漸落地走向應用。2018 年在場景驅動、中美貿易摩擦的背景下,AI 芯片走向時代前臺。
歷時 3 年,云知聲也終于 2018 年 5 月推出第一款語音 AI 芯片雨燕,交出造芯答卷。而2019 年,云知聲將在云端芯戰略的基礎上再邁進一步,并提出多模態 AI 芯片的構想。
先行業一步提出多模態 AI 芯片戰略,這背后是云知聲怎樣的思考,這一構想又能否引領云知聲下一階段的發展?
多模態 AI 芯片戰略浮出水面
過去 6 年來,云知聲大概走過了四個階段,2012~2014 年即剛成立的前兩年,布局算法平臺構建技術優勢;緊接著云知聲確立“云端芯”一體化的策略,并啟動自研 AI 芯片;到了 2017~2018 年云知聲加速 AI 的商業擴展和應用,并推出首款語音 AI 芯片雨燕。
站在 2019 年的起跑線上,黃偉稱,接下來就是依托云知聲的 AI 算法與 AI 芯片構建場景優勢。而構建場景優勢的關鍵就在于多模態 AI 芯片戰略。
之所以提出這一戰略,黃偉重點講述了他面向 5G 與 AIoT 的思考。他認為,5G 將推動行業產生質變,引發連接大爆炸、應用大爆炸,尤其是工業領域。
可以預見,隨著 5G 的到來,語音、圖像、視頻等多維數據將會海量增長,此時多維數據的處理能力成為剛需。
與此同時,IoT 場景下 AI 應用對于端云互動有著強需求,強大的云會讓端側能力更強,而強大的端則可提升數據處理的實時性和有效性,進而增強云的能力。
在多維數據處理能力與邊緣計算的需求下,具備更強算力的多模態 AI 芯片就成為了場景的關鍵競爭力之一。
黃偉指出,面向 5G 場景,只有更強的算力還不夠,還需要有深入場景提供服務的能力,并在此基礎上對傳統SOC(System On Chip,片上系統)做了進一步的解讀。他認為,S 應該代表不同的 AI 服務能力即 Skills,O 代表云端與邊緣側的互動 On/Off Cloud,C 代表具備智能處理能力的 AI 芯片。
從云端芯一體化,到多模態 AI 芯片戰略,再到對 SOC 全新的理解,云知聲對 AI 芯片的理解和布局都保持著行業領先性。
戰略背后是多模態 AI 技術的積淀
從 2018 年開始,多模態交互就成為業界研究的一個重點。簡單來說,模態可以理解為感官,多模態交互即是調用多種感官的交互方式,它跨過了自然語言,其方式也更加貼近人,也代表了AI 未來的一個發展方向。
云知聲在 2019 年開年提出多模態 AI 芯片戰略,無疑在多模態探索的道路上又邁出一步,但多模態不應該成為一句口號,而應該真正落實到技術研發中。
在語音技術主賽道外,云知聲在 2018 年也加緊布局圖像識別、機器翻譯等領域,進行多模態技術的儲備。去年,在國際權威人臉識別標準評測數據庫 LFW 和 MegaFace 上,云知聲團隊研發的人臉識別系統,在上述兩項標準評測中,性能分別達到 99.80%和 98.47%,得分位居業內前列。去年 5 月份的 WMT2018 國際機器翻譯大賽的中英翻譯比賽中,組建不足 1 年的云知聲機器翻譯團隊,也拿下英中第二、中英第四,綜合第三的優異成績。
本次發布會上,云知聲聯合創始人李霄寒進一步分享了云知聲在人臉識別、表情分析、標簽化、多目標唇動狀態追蹤等視覺 AI 方面的進展,進一步儲備多模態技術基礎。
另一方面,云知聲還發布了多模態人工智能核心 IP——DeepNet2.0,其AI處理能力也有 1.0 的語音進化到 2.0 的多模態,支持語音、圖像等處理能力。DeepNet2.0 可兼容 LSTM/CNN/RNN/TDNN 等多種推理網絡,支持可重構計算與 Winograd 處理,最高可配置算力達 4T。目前云知聲 DeepNet2.0 已在 FPGA 上得到驗證,將在 2019 年落地多模態 AI 芯片海豚(Dolphin)。
可見,在硬件層面與算法層面,云知聲都在儲備多模態技術,為其多模態 AI 芯片的落地打下地基。
造芯之路:從云端芯一體化到多模態 AI 芯片
2014 年,云知聲就確定了“云端芯”的發展戰略,2015 年推出 IVM(通用芯片方案),并落地格力、美的、海爾、長虹等一線家電廠商,從客戶需求切入,布局 AI 芯片更具場景優勢和時間窗口優勢。
在此基礎上,云知聲在 2015 年啟動 AI 芯片研發,歷時 3 年終于推出第一代語音 AI 芯片雨燕。基于此,云知聲又在去年 9 月推出 Turnkey 方案,加速雨燕芯片的落地。李霄寒透露,預計落地產品最快會在今年 Q1 面世。
針對面向物聯網時代的 AI 芯片,云知聲又在 2019 開年之分享了一些新的思考。李霄寒指出,當前物聯網產品線的 AI 芯片越來越明顯地體現出三個趨勢:
場景化。所謂場景化是芯片設計要堅持場景導向、需求導向,面向垂直領域的具體場景,通過芯片以及解決方案解決實際場景中的問題。
端云互動。在物聯網的不同應用場景下,海量終端設備要實現功能智能化必須端云配合,即形成邊緣算力和云端算力的動態平衡。這意味著從芯片設計開始,就要考慮端云互動能力。
數據多模態。在 5G 驅動的萬物智聯場景下,數據類型由原來的單一化走向多元化,芯片所需處理的數據也由單模態變成多模態。
以此來看,面向物聯網終端場景的 AI 芯片核心是解決垂直場景問題的能力,其呈現形式將不再是一個單一的硬件,而是承載著邊緣能力與云端能力的多模態 AI 軟硬一體解決方案。
在此基礎上,云知聲在多模態 AI 芯片戰略的引領下,拋出 2019 年的 AI 芯片布局藍圖,今年將推出 3 款芯片,搶灘 IoT 場景。
在去年 5 月份發布的雨燕芯片的基礎上,今年云知聲將面向智能語音場景,推出一款適用性更廣的輕量級 AI 芯片雨燕 Lite,比如可以應用在智能開關、智能燈泡等場景,實現設備的智能化,相比第一代其成本也將更低。
面向智慧城市場景,云知聲將推出支持語音和圖像等計算的多模態 AI 芯片海豚(Dolphin),預計將在今年 Q3 投產。
面向智慧出行場景,云知聲將與吉利集團旗下生態鏈企業億咖通科技共同打造車規級 AI 芯片雪豹(Leopard),預計將在 2019 年 Q3/Q4 投產。
相比行業其他公司造芯,云知聲的優勢在于自主設計,尤其是 DSP、深度神經網絡處理器都為云知聲自主研發,能夠真正面向場景,使AI芯片滿足真實場景中的需求。
而 AI 芯片戰略布局的領先性,雨燕芯片在行業的率先推出,給了云知聲更多的時間窗口優勢。把握這一優勢,從而率先導入客戶,搶占場景,則更有利于率先在行業中形成規模優勢。
今年云知聲再進一步,面向語音、視覺、車載等場景再推 3 款 AI 芯片,可見其對 AI 芯片的戰略積極且堅定,在芯片落地的節奏上領先行業。
結語:場景落地戰剛剛打響!
物聯網時代是一個場景導向的時代,很難形成 PC 時代或者移動互聯網時代在芯片領域形成一家獨大的局面,因此業內也有一種觀點,物聯網時代是應用定義算法,算法定義硬件(芯片)。
這一觀點也與云知聲強調的場景化、端云互動不謀而合。以云知聲為代表的 AI 技術公司,最早面向行業場景探索技術落地,能夠率先發現場景中客戶的真實需求,從而定制出更加滿足行業需求的 AI 芯片。這也是 AI 技術公司布局 AI 芯片的優勢所在。
從云知聲 2019 年布局的三款 AI 芯片可以看出,輕量版的雨燕 Lite 面向智能語音場景,成本更低,可以與第一代雨燕(算力更強)配合,滿足智慧家庭領域更廣闊的終端設備。車規級的雪豹 AI 芯片是面向智慧出行領域,多模態語音和圖像的海豚 AI 芯片則是面向智慧城市領域。
通過這三款 AI 芯片,云知聲正在搭建一整套滿足語音、多模態、車載等場景的 AI 芯片能力。
目前 AI 芯片正處于場景落地的初期,場景的真正需求尚不明確,哪些場景最終能夠成為有潛力的市場也尚需探索??梢钥闯鲈浦暤牟呗允?,從自身深耕的智能家居、車載、醫療、教育出發,快速搭建一整套覆蓋語音、視覺等能力的 AI 芯片,搭建好能力框架之后,就可以在市場中一面探索場景需求,一面快速基于能力框架量體裁衣,推出更加適合場景需求的 AI 芯片。
而雨燕 Lite 這款輕量級、低成本的語音 AI 芯片,很有可能就是這一打法下的產物。
無論是在多模態 AI 芯片戰略,還是 AI 芯片的推出、落地速度上,云知聲都走到了行業前列,但迎接它的是更加艱巨的 AI 芯片落地戰、卡位戰。
只有經受場景與市場的考驗,真正解決現實場景的實際痛點,才能真正被行業與市場認可,而這一戰役剛剛打響。
-
芯片
+關注
關注
459文章
52199瀏覽量
436287 -
人工智能
+關注
關注
1804文章
48725瀏覽量
246563
發布評論請先 登錄
評論