激蕩六十年,人工智能已經(jīng)起航。然而在未來面前,我們都還是孩子。究竟是“奇點臨近”?還是泡沫行將破滅?為了解惑,《AI名人堂》將匯聚領航者智慧,和你一起探索前行的方向。
2015 年,有投資人跟云知聲創(chuàng)始人/ CEO 黃偉說:“老黃啊,你要專注賽道,做好語音識別就夠了。”
不過,他并沒有聽。“人工智能必須實現(xiàn)云、端、芯的一體化”,這個念頭已經(jīng)在他的腦中縈繞了近兩年。
這一年,黃偉組建了芯片團隊。
不僅公司內(nèi)部,就連業(yè)內(nèi)同行多數(shù)投來了不理解的目光。“一個做軟件的,搞什么芯片?”
2018 年 5 月 16 日,云知聲發(fā)布了第一代 UniOne 物聯(lián)網(wǎng) AI 芯片“雨燕”及解決方案,并且有望在下月實現(xiàn)量產(chǎn)。在這 5 天前,他們剛剛拿到資本 1 億美元的 C 輪融資。
年初,中興事件的發(fā)酵,掀起了科技界的一股造“芯”熱。不少人幡然醒悟。半年間,不少創(chuàng)業(yè)公司,紛紛號稱要做自己的芯片。
AI 科技大本營統(tǒng)計發(fā)現(xiàn),綜合了國內(nèi)多家已發(fā)布的人工智能榜單數(shù)據(jù),截止到目前,國內(nèi)公開可查的 50 家主流 AI 創(chuàng)業(yè)公司中,宣布已經(jīng)“推出 AI 芯片或芯片模組”的至少有 8 家。
這批有著激進時間表的公司大多在當前各自領域占據(jù)了一定優(yōu)勢地位。有的很早就開始著手 AI 芯片的研發(fā),有的才剛剛推出芯片模組。
在近日創(chuàng)業(yè)黑馬的 AI 獨角獸評選活動上,與云知聲站同一登臺亮相的還有寒武紀、地平線、出門問問、思必馳……
他們不約而同盯上的,正是芯片。為何一定要造芯?
▌場景定義芯片
人工智能芯片這個賽道上,GPU 成為 AI 芯片代名詞,FPGA、ASIC 日受青睞。目前,老牌芯片巨頭英偉達、AMD、英特爾、高通等扮演著主要角色。
而云知聲做的則是針對 IoT 場景下的全棧式終端芯片,這也決定了其“云端芯”概念的定位。
“當時我們講的‘云端芯’,‘云’是云端服務資源的聚合;‘端’是不同設備終端的交互;‘芯’是一種泛芯片,不是一個獨立的芯片。所以,我們第一代產(chǎn)品也是通過若干個芯片來實現(xiàn)一個功能。而語音交互是一個非常復雜的鏈路過程,在過去,一個芯片只能實現(xiàn)一個功能。所以,為了實現(xiàn)語音交互這種能力,需要將若干芯片配湊在一起。”黃偉講到。
因此,彼時的云知聲選擇了諸如高通、全志等廠家的芯片,再將自己的算法融入進去,構(gòu)建 AI 芯片模組。
不過,“AI 不會只發(fā)生在云端,一定有邊緣智能,而且想要滲入到每個場景,對端一定會提出很多個性化的需求。”這個想法的推動下,以 2015 年成立芯片團隊后,云知聲走上了自研芯片的道路,并于今年 1 月成功流片。
黃偉認為:“無論是 CPU、GPU 還是 FPGA,現(xiàn)有的芯片架構(gòu)并非為 AI 專門設計,并不能滿足 IoT AI 算力的需求。”研發(fā)芯片是需要規(guī)模化地使用算力,衡量一個芯片最主要的標準,就是看它能不能大規(guī)模的出貨。
清華大學微電子所魏少軍教授表示:“做語音芯片一定要看應用場景,目前很多場景下并不需要用到人工智能技術(shù)或者專門的語音芯片。”
這個問題同樣也拷問著黃偉。
他認為:“未來 AI 可能會融入到每一個場景,只是說需要的能力不太一樣。關鍵是,AI 是一種能力,可能未來所有場景都需要 AI,只是說哪些先被 AI 賦能而已。”
那么,這個未來又有多遠呢?
▌是做眼前的生意,還是未來的機會
據(jù)最新資料顯示,云知聲已在智慧生活(家居、車載、機器人等)和智慧服務(醫(yī)療、教育、司法等)等場景有所布局,其合作伙伴數(shù)量超過 2 萬家,覆蓋用戶超過 2 億,云平臺日調(diào)用量 4 億次。
其實,不少創(chuàng)業(yè)公司在以上領域均有業(yè)務布局的交叉,且彼此均占有不小的市場份額,可以說市場競爭相當激烈。那么,“這就在于一個判斷,你是想做未來的機會,還是眼前的生意。首先,一定要選擇一個自己比較有競爭優(yōu)勢的行業(yè),比如,這個行業(yè)比較新,還未形成壟斷的壁壘。我們會選擇當下比較困難,但未來是有機會點的領域。”
談及未來,黃偉表示:沒有任何一個企業(yè)的創(chuàng)始人在創(chuàng)業(yè)早期就能確定一個很明確的商業(yè)模式,而且明確自己以后一定能夠成功。商業(yè)模式是不斷地試錯、修正的。很多上市公司,上市時的商業(yè)模式和它成立時的戰(zhàn)略是不一樣的。
所以,回到自己身上,“目前我們?nèi)蕴幵谙M紦?jù)更多的設備、服務更多的用戶,然后產(chǎn)生更多的數(shù)據(jù)這個階段。如果你有用戶和流量了,你未來一定是有價值的。”
對于盈利,黃偉頗為自信,他認為這個時間點將很快來臨。“以智能音箱為例,2017 年雙十一之后的季度出貨量基本在 100 萬臺,而 2018 年這個數(shù)字有望上升到 1000 萬臺。這個反映出:IoT 的市場和起步速度在增長。此外,企業(yè)對這個領域的研發(fā)投入正在增加。”
▌數(shù)據(jù)很重要,但不是最決定性的
對于在 2012 年 11 月就發(fā)布了的深度學習框架,黃偉是非常自信的。
網(wǎng)上流傳著這樣一個故事:
2006 年深度學習鼻祖 Hinton 提出深度學習之后,微軟在 2011 年間將它應用到語音識別領域,當時,黃偉的師兄俞棟(深度學習開源軟件 CNTK 的作者和主要發(fā)起人之一)還是微軟語音和對話組的研究員,他在意大利佛羅倫薩交流時曾告訴黃偉這是趨勢,這給了他一些啟發(fā)。
深度學習在于需要大量的數(shù)據(jù)進行訓練,很快,云知聲就發(fā)布了自己的“語音識別公有云”,短短不過一年,平臺上就已經(jīng)有 1000 名開發(fā)者加入。利用開發(fā)者以聯(lián)動各家 App,將收集的用戶的語音數(shù)據(jù)快速集中到平臺上,以加強自身模型的訓練。
目前,云知聲已形成了“金字塔”式的技術(shù)架構(gòu),底層是 DeepFlow 集群;中間層是 Atlas 超算平臺,將統(tǒng)計學習和深度學習里的通用算法抽樣出來;頂層是應用層技術(shù),如有 ASR、TTS、NLU、NMT 等應用層技術(shù)的輸出。
值得一提的是,數(shù)據(jù)積累到一定程度后,海量數(shù)據(jù)帶來的紅利會越來越少。如語音識別,數(shù)據(jù)量從 1 萬小時增長到 10 萬小時,準確率會提高 1%~2%,但這差別應該不是很大。如果此時還僅靠深度學習技術(shù)按照傳統(tǒng)的方式訓練數(shù)據(jù),基本很難樹立更高的技術(shù)壁壘。
黃偉表示贊同,但他認為,在 AI 的能力里面,數(shù)據(jù)很重要,但數(shù)據(jù)只是能力之一,不是最決定性的。“發(fā)布深度學習框架之前,我們的統(tǒng)計模型是基于統(tǒng)計學習的,就是用結(jié)構(gòu)化模型去描述復雜物理世界的一些問題。當時,對我們來說,幾百小時和幾千小時的差距不會特別大,甚至比科大訊飛的準確性還要高。”
▌現(xiàn)階段,以技術(shù)推動產(chǎn)品
人工智能領域,目前仍然具有較高的行業(yè)門檻,這也隨之拉大了企業(yè)之間的競爭激烈性,而 AI 專業(yè)人才尤其是有相關項目研發(fā)經(jīng)驗的人才更是屈指可數(shù)。除了從各大技術(shù)公司挖角外,創(chuàng)業(yè)公司也紛紛開始創(chuàng)辦自己的 AI 研究院,以擴充自身人才,加強技術(shù)壁壘。
2015 年底,云知聲成立了 Unisound AI Labs,匯集了從語音、語義、機器學習、超算等各個技術(shù)方向的人才。截止目前,團隊人數(shù)已近百人,博士生幾乎占到一半。
談到如何進行人才管理和設計總體的未來路線圖,黃偉表示:“AI Labs 是不需要管理的,技術(shù)人的自制力本身很強。難的是在于如何去建設、招攬人才。錢絕對不是第一位,他們看重的是能否在團隊里獲得成長。”
實際上,這個團隊是為產(chǎn)品服務的,并非純研究的團隊。目前云知聲也開始從產(chǎn)品驅(qū)動技術(shù)的階段向技術(shù)定義產(chǎn)品的階段過渡。也就是說,“研究院應該提供一些更具前瞻性的技術(shù)能力,一種產(chǎn)品原型,用原型去驅(qū)動市場。以技術(shù)推動產(chǎn)品,這才是一個真正有創(chuàng)新力的技術(shù)公司應該做的事情。”他最后提到。
▌定位決定了你的挑戰(zhàn)
據(jù)AI科技大本營了解,除了云知聲5月成功推出 AI 芯片 UniOne之外,云天勵飛、出門問問、Rokid、思必馳也暗暗籌謀自己的“芯片”。說起來,這幾家企業(yè)并非研發(fā)芯片出身。
為什么敢做芯片?黃偉這樣解釋:“在 IoT 這個場景里面,算法起的作用比較大,而且它也不追求芯片的制成。這種芯片是放置在冰箱、音箱中的,可以理解成:用人工智能最領先的算法和芯片行業(yè)一年前的能力相結(jié)合,就可以滿足這個行業(yè)產(chǎn)品的需要。所以,芯片設計本身不構(gòu)成我們今天最大的問題。”
但與寒武紀、地平線相比,“它們對標的是英偉達,這是高端芯片,這種比拼更像一種軍備賽。他們可能也會考慮商業(yè)層面的成本、價格功耗等問題,但最優(yōu)先級的一定是計算能力。”
放在自然語義理解這個領域,目前對于整個行業(yè)來說均未取得一個比較明顯的效果。在他看來,主要有以下三點因素:
首先,圖像識別和語音識別都是數(shù)據(jù)驅(qū)動的。自然語義理解在知識上就存在一個不確定性。
其次,自然語義理解,同樣一段話,不同的人讀都會得到不同的感受。在圖像、聲音、文本里面,最難的是如何理解文本。
此外,如今的自然語義理解發(fā)展差距不大。
對于云知聲來說,黃偉坦言:“在理論框架真正得到一個大幅度的改善之前,我認為唯一能做的就是在場景里把它做到最優(yōu)。能夠把產(chǎn)品的用戶需求摸透,把數(shù)據(jù)、用戶體驗和技術(shù)很好的匹配起來。”
-
芯片
+關注
關注
459文章
52282瀏覽量
437491 -
人工智能
+關注
關注
1804文章
48820瀏覽量
247271
原文標題:專訪云知聲黃偉:場景定義芯片,未來所有場景都需要AI | AI名人堂
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
嵌入式AI技術(shù)漫談 如何組建一個AI項目開發(fā)小組
傳統(tǒng)攝像頭為什么需要升級為AI盒子?多場景痛點解析
【「零基礎開發(fā)AI Agent」閱讀體驗】+初品Agent
移遠通信亮相慕尼黑上海電子展:以全棧AI產(chǎn)品賦能消費電子智能化新生態(tài)

首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應手
移遠通信攜手火山引擎:加速AI大模型技術(shù)應用,共繪AIoT智能未來新藍圖

Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
端側(cè)AI模組再進化!移遠通信和美格智能在MWC如何放大招?

FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
名單公布!【書籍評測活動NO.55】AI Agent應用與項目實戰(zhàn)
搭建一個 AI 問答機器人,需要幾步?

AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得
請問TLV320AIC3254配置內(nèi)部每一個寄存器時都需要先發(fā)送器件地址嗎?
AI智能眼鏡都需要什么芯片

評論