在ICT行業眾多“風口”中,智能家居無疑是特別的一個。整個產業鏈,從運營商、設備商、終端制造商到家電家居廠商都認同智能家居是萬億級的大市場,互聯網公司也紛紛入局,意圖“降維打擊”。但十多年來,先驅大多已經熬成了先烈,市場還沒有真正起來,產業規模離萬億級差了一個數量級。
突破口是智能音箱,被互聯網公司做成了單品爆款,比較典型的有小愛同學、小度音箱等。據筆者了解,為了形容小愛同學的“智能”,小米公司近期還特地拍攝了一段有趣的短視頻。雷軍:“我是誰?” 小愛同學:“他是我的爸爸,我很愛他……”
讓智能家居“聽懂”人們說的話,學會“察言觀色”,這是更高層次的人工智能。可以判斷,不僅是智能音箱,AI數據賦能讓各類終端變得更加聰明,打開了智能家居爆發式發展的想象空間。
在日前舉辦的中國(杭州)國際智能產品博覽會暨全球人工智能大會上,云測數據公司總經理賈宇航發表演講提到,人工智能一共有三要素,算力、算法、數據。前兩者是基礎設施和能力,后者是讓AI學習的知識素材。只有高質量的標注數據,才能高效訓練算法,賦能各種類型的終端。云測數據宣布的“最高交付數據99.99%精準度”,正是AI數據服務受到產業重視,成為人工智能應用重要一環的標桿性成就。
小作坊到大生產
在人工智能三要素中,算力與算法已經取得令人醒目的進步,且仍處在高速發展中。從算法看,已批量誕生獨角獸公司,最典型的是人工智能“四小龍”商湯、曠視、云從、依圖。從算力看,今年發改委明確“新基建”范圍,定義了算力基礎設施,包括數據中心,智能計算中心等,算力發展迎來了政策層面的大利好。
在數據方面,業界也認識到其價值的重要性,“沒有好的數據,人工智能沒有未來”已成行業共識。隨著人工智能技術落地場景,不同場景提出了更高質量、更多元的數據需求。從數據服務的趨勢看,原有的小作坊式數據生產,逐漸向大規模專業第三方供應商遷移。
第三方定制化數據標注服務商,最具代表性的企業當屬云測數據。其中,在《互聯網周刊》聯合eNet研究院共同發布的《2020年數據標注公司排行》中,云測數據位列第一。有媒體總結,目前中國在 AI 領域有五家公司被稱為“人工智能五強”,算法層有商湯、曠視,AI數據領域有云測數據,硬件方面有涂鴉智能、地平線。這些公司專注于深耕AI細分領域并擁有讓行業認可的成果。其中,云測數據在今年首場國家級重大國際經貿活動服貿會上,首次發布了一項數據標注領域的重要成果:云測數據項目最高交付精準度達到了99.99%,刷新了數據標注領域可達到的最高服務標準,顯示出一向“低調”的數據服務領域,也和算力、算法一樣正在取得顯著進步。中國人工智能在底層基礎支撐、中間技術創新、頂層應用之間正在形成完整的生態鏈。
據了解,云測數據一方面自建了數據場景實驗室與數據標注基地來對相應AI數據進行生產。另一方面,在AI數據生產中,設計了從創建任務、分配任務、標注流轉、到質檢/抽檢環節和最后的驗收等更完善的管理流程,每個環節有相應專業人員來把控數據標注的質量和時間節點,從而提高了數據生產的質量和效率。
在筆者看來,云測數據“四個九”以及背后的數據生產方式,意味著數據標注產業“小作坊”式生產將越來越難以為繼。隨著人工智能場景化滲透帶來的高質量數據需求大幅提升,數據標注產業呈現馬太效應的趨勢,將逐漸向頭部公司聚集。
云測數據的“升維”打法
相比互聯網公司運用互聯網思維進軍智能家居家居市場,號稱降維打擊,云測數據在AI數據標注方面,采取了“升維”的打法。提升數據精準度是其中一方面;另一方面,在數據場景化標注方面,云測數據也做了大量工作。
其行業首創的數據場景實驗室,通過還原真實使用場景,深入研究人工智能長尾場景特點,完成在對應傳感器下的場景數據采集工作。這種專注和用心,彌補了很多原始數據的不足。基于數據場景實驗室,云測數據數據采集的維度,能夠全方位支持企業在文本、語音、圖像、視頻等各類AI數據的需求。
以智能家居為例,由于智能家居多以房屋、住宅、社區為載體,應用場景相對更具集中性和確定性,因此更重產品更重體驗。人工智能主要解決的是機器在看、聽、理解方面的問題,語音識別與自然語言處理能力已經成為兵家必爭之地。
云測數據標注數據的維度,在語音方面,支持ASR語音轉寫、聲紋識別標注、說話人識別、語音切割、情緒判定標注等;在自然語言處理方面,支持OCR轉寫、NLU語句泛化、文本信息抽取、實體標注、詞性標注、槽位填充等,支持全方位的標注類型。同時,具有自主知識產權的數據標注平臺擁有靈活、高效、智能的特點,數據標注過程更加高效高質,最終幫助智能家居產品落地。
“從深度學習、機器學習的發展趨勢和應用方向可以明顯看到,不管是鉆得更深或是在應用層面鋪得更廣,我們都會需要更多數據。我覺得這個趨勢至少還能保持十幾年。”據甲子光年之前報道,AI企業對高質量數據需求呈現“饑渴”狀態。這有助于云測數據等頭部玩家能夠迅速抓住行業轉型的時機,在市場落地過程中,形成AI數據服務新的游戲規則。
責任編輯:pj
-
數據中心
+關注
關注
16文章
5226瀏覽量
73499 -
AI
+關注
關注
88文章
35093瀏覽量
279490 -
人工智能
+關注
關注
1806文章
49007瀏覽量
249284
發布評論請先 登錄
明遠智睿SSD2351開發板:智能家居的智能核心
智能家居Mesh組網方案:實現智能化生活的無縫連接NRF52832
重大突破?這個系統,讓智能家居生態屏障土崩瓦解

智能家居物聯網:數字化生活模式
智能家居迎來AI場景化,AI芯片加速迭代
AI賦能,智能家居芯片面臨哪些機遇?

評論