繼北京站之后,4 月 18 日,云知聲開(kāi)放日(Open Day)第 2 場(chǎng)來(lái)到深圳。本次云知聲開(kāi)放日聚焦 AI 技術(shù)、應(yīng)用和產(chǎn)業(yè),云知聲董事長(zhǎng)/CTO 梁家恩博士與多位云知聲技術(shù)專(zhuān)家向深圳的合作伙伴、行業(yè)人士全面的秀出了全棧 AI 硬核技術(shù),并與騰訊杰出科學(xué)家/騰訊 AI Lab 副主任俞棟、攜住科技聯(lián)合創(chuàng)始人葉明、同行者科技聯(lián)合創(chuàng)始人葉維、金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博、三諾聲智聯(lián)副總經(jīng)理喬嶠等多位嘉賓,剖析了 AI 技術(shù)在酒店、車(chē)載、教育等領(lǐng)域的應(yīng)用及落地。
全棧:技術(shù)能力全棧,產(chǎn)業(yè)服務(wù)全棧
梁家恩博士作為人工智能行業(yè)的資深從業(yè)者,在現(xiàn)場(chǎng)與我們復(fù)盤(pán)了發(fā)展歷程,他表示,在AI 大潮退去之后,技術(shù)的產(chǎn)業(yè)化能力成為了決勝的關(guān)鍵。技術(shù)如果不能解決產(chǎn)業(yè)問(wèn)題,那么技術(shù)將化為企業(yè)“炫技”的產(chǎn)物。基于此,梁家恩博士將云知聲的 AI 哲學(xué)概括為“全棧”和“硬核”。
云知聲董事長(zhǎng)/CTO梁家恩博士
“全棧”包含了全棧 AI 技術(shù)能力和全棧 AI 落地能力兩個(gè)維度。經(jīng)過(guò)多年的發(fā)展,目前,云知聲的 AI 能力已經(jīng)超了單一的語(yǔ)音技術(shù),覆蓋了 Atlas 機(jī)器學(xué)習(xí)超算平臺(tái),信號(hào)、語(yǔ)音、圖像、文本的感知和表達(dá)能力,知識(shí)、理解、分析、決策等認(rèn)知技術(shù),并朝著多模態(tài)人工智能系統(tǒng)方向發(fā)展。同時(shí),云知聲通過(guò)將能力封裝在自研 AI 芯片之上,打磨了“云端芯”一體化產(chǎn)品體系,推動(dòng) AI 技術(shù)在家居、車(chē)載、兒童、教育、醫(yī)療、金融、零售等多個(gè)領(lǐng)域?qū)崿F(xiàn)落地,實(shí)現(xiàn)了從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。
硬核:確實(shí)、有效地解決產(chǎn)業(yè)規(guī)模化痛點(diǎn)
“硬核”,指技術(shù)方案能夠確實(shí)、有效地解決產(chǎn)業(yè)規(guī)模化痛點(diǎn),為終端用戶提供相對(duì)成熟的用戶體驗(yàn)。
以當(dāng)時(shí)最熱門(mén)的智能語(yǔ)音為例,經(jīng)歷了兩年的市場(chǎng)教育,現(xiàn)如今,語(yǔ)音交互技術(shù)被廣泛應(yīng)用到各大場(chǎng)景中,成為了AI 技術(shù)落地最典型的應(yīng)用案例。然而,在實(shí)際使用中,AI 需要面對(duì)的情況比實(shí)驗(yàn)室中要復(fù)雜得多,一旦產(chǎn)品軟硬件的某一環(huán)處理不好,便容易出現(xiàn)“聽(tīng)不到、聽(tīng)不懂、答非所問(wèn)”等問(wèn)題。針對(duì)這類(lèi)行業(yè)痛點(diǎn),在本次云知聲開(kāi)放日深圳站現(xiàn)場(chǎng),云知聲的技術(shù)團(tuán)隊(duì)從語(yǔ)音交互技術(shù)的拾音、識(shí)別和交互等維度,深度剖析了技術(shù)難點(diǎn)和解決方案。
在 AIoT 場(chǎng)景下,設(shè)備首先要解決的便是遠(yuǎn)場(chǎng)拾音問(wèn)題。云知聲 AI Labs 技術(shù)專(zhuān)家關(guān)海欣表示,解決遠(yuǎn)程語(yǔ)音識(shí)別的關(guān)鍵在前端信號(hào)處理階段,解決回聲、混響和噪音 3 大核心問(wèn)題,以確保設(shè)備可以準(zhǔn)確識(shí)別到用戶指令。目前,云知聲在回聲消除、混響抑制、噪聲處理等方向均已有成熟的技術(shù)方案,相關(guān)技術(shù)指標(biāo)均達(dá)行業(yè)一流水準(zhǔn)。另外,未來(lái)遠(yuǎn)程語(yǔ)音識(shí)別還將呈現(xiàn) DSP+DL 結(jié)合、分布式拾音兩大趨勢(shì),對(duì)此,云知聲也已經(jīng)展開(kāi)了相應(yīng)的技術(shù)部署。
云知聲AI Labs技術(shù)專(zhuān)家關(guān)海欣
在語(yǔ)音識(shí)別階段,則需要在聲學(xué)和語(yǔ)言層面,賦予機(jī)器感知并語(yǔ)音指令的能力。云知聲 AI Labs 技術(shù)專(zhuān)家李軼杰表示,聲學(xué)方面,云知聲基于大數(shù)據(jù)、前沿聲學(xué)建模、自適應(yīng)學(xué)習(xí)搭建了聲學(xué)模型;在語(yǔ)言層面,云知聲創(chuàng)建了一個(gè)數(shù)據(jù)規(guī)模大、融合能力強(qiáng)、靈活和個(gè)性化的語(yǔ)言模型,以上模型在還將基于超算平臺(tái)不斷優(yōu)化迭代。此外,云知聲還將其語(yǔ)音識(shí)別能力延展到語(yǔ)音評(píng)測(cè)、聲紋識(shí)別、情緒識(shí)別等多個(gè)方向。
云知聲AI Labs技術(shù)專(zhuān)家李軼杰
在對(duì)話階段,圍繞更加自然的人機(jī)交互,云知聲打造了流式交互、語(yǔ)用計(jì)算與知性會(huì)話 3 大硬核能力。云知聲 AI Labs 技術(shù)專(zhuān)家單波介紹到,流式交互最大的特點(diǎn)是在多輪對(duì)話免喚醒,大大的提升了人機(jī)對(duì)話過(guò)程中的流暢程度;語(yǔ)用計(jì)算則是將人機(jī)對(duì)話內(nèi)容放置到對(duì)應(yīng)的語(yǔ)境中,讓設(shè)備準(zhǔn)確的理解人的意圖;最后,知性會(huì)話則是通過(guò)將知識(shí)圖譜應(yīng)用到人機(jī)對(duì)話過(guò)程中,讓設(shè)備準(zhǔn)確的響應(yīng)用戶的問(wèn)題。
云知聲AI Labs技術(shù)專(zhuān)家單波
基于上述技術(shù),2013 年,云知聲面向合作伙伴開(kāi)放對(duì)話技能開(kāi)放平臺(tái)(語(yǔ)義云),幫助合作伙伴打造更加自然的人機(jī)交互體驗(yàn),同時(shí)在實(shí)踐中不斷提升語(yǔ)義解析能力。目前這一平臺(tái)已經(jīng)支持 200 多個(gè)的對(duì)話內(nèi)容,覆蓋通訊、休閑娛樂(lè)、醫(yī)療健康、交通出行、設(shè)備控制等多個(gè)場(chǎng)景,語(yǔ)義解析準(zhǔn)確率高達(dá) 93%。
值得一提的是,語(yǔ)音感知與表達(dá)、語(yǔ)言與知識(shí)計(jì)算只是云知聲硬核 AI 技術(shù)的冰山一角,目前,云知聲硬核技術(shù)還包含了 AIoT 芯片、超算平臺(tái)與圖像、翻譯拓展等。
落地:覆蓋酒店、汽車(chē)、兒童、音箱等場(chǎng)景
在大數(shù)據(jù)、深度學(xué)習(xí)、超算平臺(tái)的加持下,人工智能底層技術(shù)將沖破閥值,帶來(lái)成熟的體驗(yàn),在技術(shù)和需求的雙重推動(dòng)下,人工智能將邁入發(fā)展的黃金階段,并掀起新一輪的 AIoT 產(chǎn)業(yè)變革。在下午的「智能+」分論壇中,云知聲副總裁康恒、云知聲 AIOS 架構(gòu)師郭洪光、與攜住科技、同行者科技、金鷹卡通、三諾聲智聯(lián)等多位合作伙伴,結(jié)合實(shí)際案例,深入探討了 AI 技術(shù)的在酒店、汽車(chē)、兒童和音箱等場(chǎng)景中的應(yīng)用。
云知聲副總裁康恒表示,在整個(gè)產(chǎn)業(yè)鏈中,AI 技術(shù)是個(gè)“基礎(chǔ)設(shè)施”,且這一基礎(chǔ)設(shè)置不可能在不加以定制的情況下適用全部場(chǎng)景。AI 在落地過(guò)程中,需要充分考慮使用場(chǎng)景和落地行業(yè)。基于對(duì)場(chǎng)景和產(chǎn)業(yè)的深度思考,2014 年,云知聲便開(kāi)始結(jié)合產(chǎn)業(yè)鏈,將云知聲的 AI 技術(shù)賦能到個(gè)行業(yè)中去。
云知聲副總裁康恒
面向行業(yè),云知聲推出了一站式人工智能平臺(tái) UniOS 。云知聲 AIOS 架構(gòu)師郭洪光表示,與同類(lèi)產(chǎn)品相比,UniOS 具備開(kāi)放、垂直兩大特性,其中,開(kāi)放指的是云知聲面向行業(yè)和合作伙伴開(kāi)放技能平臺(tái)和設(shè)備平臺(tái),并在此基礎(chǔ)上兼容第三方 AIOS;垂直則代表 UniOS 會(huì)針對(duì)特定的行業(yè)需求輸出解決方案,以此來(lái)幫助產(chǎn)業(yè)轉(zhuǎn)型。
云知聲AIOS架構(gòu)師郭洪光
攜住科技聯(lián)合創(chuàng)始人葉明跟我們介紹了 AI 技術(shù)在酒店場(chǎng)景中的應(yīng)用案例。葉明表示,針對(duì)酒店場(chǎng)景,攜住科技基于 AIoT 技術(shù),通過(guò)多種設(shè)備聯(lián)動(dòng)、場(chǎng)景定制,為酒店客戶帶來(lái)全新智能互聯(lián)的場(chǎng)景體驗(yàn);另一方面,通過(guò)信息整合和大數(shù)據(jù)分析,AI 還將提高酒店管理效率。
攜住科技聯(lián)合創(chuàng)始人葉明
同行者科技聯(lián)合創(chuàng)始人葉維分享了 AI 語(yǔ)音技術(shù)如何助力汽車(chē)產(chǎn)業(yè)升級(jí)。葉維表示,在車(chē)載場(chǎng)景下,語(yǔ)音即為服務(wù)——語(yǔ)音是用戶與設(shè)備、與互聯(lián)網(wǎng)連接的主要手段,承載了車(chē)聯(lián)網(wǎng)資源整合與用戶觸達(dá)的功能。因此,車(chē)載場(chǎng)景下的 AI 必須聚合豐富的內(nèi)容和服務(wù),并根據(jù)場(chǎng)景進(jìn)行智能匹配,打造千人千面的智能化體驗(yàn)。
同行者科技聯(lián)合創(chuàng)始人葉維
金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博分享了金鷹卡通對(duì)兒童產(chǎn)品智能化的思考。戴文博指出,兒童和家長(zhǎng)對(duì)智能產(chǎn)品的需求與普通場(chǎng)景十分不同,基于此,金鷹卡通圍繞兒童場(chǎng)景的特征,將 AI 技術(shù)與“麥咭”的形象做了深度整合,打造麥咭智能親子智能產(chǎn)品生態(tài)。
金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博
三諾聲智聯(lián)副總經(jīng)理喬嶠從產(chǎn)品角度出發(fā),與我們分享了人工智能產(chǎn)品設(shè)計(jì)思考。喬嶠指出,人工智能時(shí)代的設(shè)計(jì)方向是感知設(shè)計(jì),產(chǎn)品只有將形狀、外觀、聽(tīng)覺(jué)、觸感等諸多因素綜合成一個(gè)完整的信息,充分調(diào)動(dòng)人類(lèi)的本能,才有可能設(shè)計(jì)出更普遍更通用的產(chǎn)品。
三諾聲智聯(lián)副總經(jīng)理喬嶠
以帶屏音箱為例,屏幕為人機(jī)交互補(bǔ)充重要的視覺(jué)信息,更加接近用戶本能,“未來(lái) 5 年,單帶屏的智能音箱就會(huì)達(dá)到 3 億多臺(tái),超過(guò) PC 的規(guī)模。”
-
人工智能
+關(guān)注
關(guān)注
1807文章
49042瀏覽量
249874 -
智能汽車(chē)
+關(guān)注
關(guān)注
30文章
3094瀏覽量
108417
發(fā)布評(píng)論請(qǐng)先 登錄
教育部力推“AI進(jìn)課堂”!高交會(huì)3E亞洲消費(fèi)電子展解鎖新興市場(chǎng)AI教育密碼!

2025第二屆教育信息技術(shù)應(yīng)用創(chuàng)新大賽啟動(dòng),誠(chéng)邁科技邀您挑戰(zhàn)!

2025第二屆教育信息技術(shù)應(yīng)用創(chuàng)新大賽正式開(kāi)賽
RK3588核心板在邊緣AI計(jì)算中的顛覆性優(yōu)勢(shì)與場(chǎng)景落地
一場(chǎng)圓桌論壇揭曉AI落地智慧園區(qū)的發(fā)展趨勢(shì)
FF將于3月16日舉辦“FF Open AI Day”活動(dòng)
樂(lè)鑫ESP32與AI大模型:為教育領(lǐng)域帶來(lái)創(chuàng)新變革

《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺(tái)的應(yīng)用
Open AI 將在德國(guó)投資
豆神教育聚焦創(chuàng)新教育生態(tài),書(shū)寫(xiě)AI賦能教育的新范本

評(píng)論