女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI數據標注產業進入發展快車道,高精度成就數據標注的“差異化”

牽手一起夢 ? 來源:科技向令說 ? 作者:曾響鈴 ? 2020-09-18 14:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新基建驅動AI加速落地,也讓它背后的“糧草”——AI數據標注產業進入發展快車道。

不久前,今年首場國家級重大國際經貿活動服貿會的成果發布環節上,數據標注領域的頭部企業云測數據首次對外展示了一項成果,其數據項目的最高交付精準度竟然達到了99.99%。

這個決定AI產品落地水平的領域里,99.99%的精準度刷新了一個行業記錄,按照實際AI項目的需要,AI客戶可選擇的服務標準跨越到了一個新的時代。

事實上,在多元化的人工智能場景落地背景下,更高標準的AI數據質量已成為AI的剛需。這次服貿會上,數據標注的頭部企業所進行的99.99%的成果展示,其背后也隱含著行業高階進化的改變,最突出的就是“勞動密集”的標簽,可能要被徹底撕掉了。

高精度,成就數據標注的“差異化”?

AI數據標注產業是人工智能鏈條上最偏“人工”的部分,早期的低門檻使得市面上存在著大大小小的企業、工作室,泥沙俱下,良莠不齊。

但現如今,我們已經看到這一現狀正在發生變化,AI數據服務行業隨著AI產業需求進行著優勝劣汰。現在,當行業頭部企業將最高項目交付精準度提升到一個“頂尖”時,馬太效應突出,差異化趨勢愈發明顯。

1、表面同質化服務下,數據精度推動數據標注企業獲得“差異化認知”

在過去很長一段時間內,AI企業多根據自身項目需求為導向來選擇數據標注服務商,AI數據行業內并沒有太多嚴謹的規則。可以說,過去的數據標注,是一個有些缺乏“差異化認知”的行業,A企業和B企業到底怎么區分,沒有明確的標準。

當頭部企業從自身出發首次規范行業標準,將最高99.99%的數據標注精準度進行正式發布,實際上就等于給行業設定了一個可行的認知標準,這樣的AI數據才是高質量數據。

至此,不管是AI企業客戶還是業界人士,或都可以借助精準度對數據標注行業進行企業與企業的區分,而不是在認知上一鍋燴。

而這,當然也來源于99.99%這個精確度與其他諸如92%、95%、98%之類的數字存在著跨越時代級別的差異。

這某種程度上也表明數據標注產業在伴隨AI發展多年后,自身開始趨向成熟,頭部玩家強者恒強,產業內優勢資源和技術得到有效聚集,朝著無限接近100%進發,99.99%更像是一個里程碑,將加快人工智能時代的到來。

2、用高精度切中AI發展需求,數據標注企業更容易獲得“差異化競爭優勢”

跳出普通人“認知”方面的驅動力,高精度數據的另一重差異化價值是切中AI發展需求。

隨著AI的持續深度發展,場景落地已經代替技術研究成為主旋律,數據標注的服務方向從“AI產品訓練”走向“AI產品落地”,這意味著AI項目試錯空間相較于技術研究大幅下降,要求更高的精確度來滿足用戶體驗。

更進一步看,新基建中的重要版塊AI新基建,生來就帶有強烈的落地應用導向——要驅動各大產業升級,也必須更貼近落地。

在數據質量決定AI算法的精度、算法的精度又決定產品質量的關聯邏輯下,更注重落地的AI項目會更積極主動尋找那些數據質量(精確度)更高的供應商,數據標注行業將會形成過去沒有的梯度,發布最高99.99%精確度標準的頭部企業云測數據,還將藉此獲得“差異化競爭優勢”吸引更多產業客戶,如果沒有更多企業跟隨上來,則將一直保持唯一的“第一梯隊”。

PK高精度后,是時候放棄對數據標注“勞動密集”偏見了?

勞動密集是之前業界對AI數據標注的主要評價,或者說刻板印象,AI界的“富士康”之類的說法揭示出這個產業的外在尷尬形象。

但這一切,隨著更高精度的數據標注成果出現而開始改變。

一個普通的草臺班子數據標注團隊可能也能實現及格線上的AI數據精確度,這是機械式的人力操作天然具備的能力,畢竟數據標注確實主要靠的是人力的勞動。但再要提升精度,尤其是無限往100%靠近,就必須更多依賴各種技能的支撐,不斷進行高位再優化,榨取精度提升的空間。

數據標注的精準度越高,再次上升(并保證配套服務質量)能夠從“人力”中獲得的支持越少,從“技能”獲得的支持越多。

因此,當數據標注產業出現99.99%這類高精度成果時,也意味著技能的成分可能超越了人力的成分,行業已經走向了各類前沿技術支撐的“技能密集”階段。

這種支撐高精確度的“技能密集”,應當包括四個方面:

1、專業人才技能:需求專業化倒逼數據標注人才素養提升

專業、垂直類的數據標注,比泛化的數據標注更需要技能支撐,尤其在需要獲得高精準度的情況下,單純的體力勞動已經不可能完成。

一是特殊的數據標注類型,例如,云測數據的主要服務場景之一自動駕駛,常常會有激光雷達傳感器產生的數據需要標注。一般車載攝像頭的數據標注,比較“體力化”,框出指定的元素教會算法識別即可:

而激光雷達的數據則與人類現實世界差距甚遠:

這時候,云測數據不得不要求人工對雷達數據有豐富的知識技能和處理經驗,可能還牽扯很多物理學方面的知識,絕不再是簡單地體力勞動了。

二是,專業領域的數據標注。這方面較為典型的是垂直領域的語音、文本類數據標注,例如金融、家居領域,這些數據標注的需求不亞于這些領域一線的業務人員(需要深度理解業務,才能標注好包括專業詞匯、邏輯等數據),因此,像云測數據這類平臺培養了金融、家居等領域的“專才”,甚至于,在為一些金融機構服務時,還要按照需求提供達到素質要求的標注隊伍進行作業。

2、復雜工具技能:數據標注本身也在進行某種數字化升級

高精度的實現,除了數據標注人員由流水線工人轉化為有特定技能的專業人才之外,隨著業務量的擴大,還配套有滲透全流程的各種數字化工具來提高準確率、效率,這就如同一個制造業企業進行了數字化、智能化升級來應對嚴苛的市場競爭一樣。

從云測數據的案例看,99.99%的準確率背后是一大堆技術工具在支撐。

標準API接口的數據處理平臺支持各種主流格式,跟眾多AI企業可以做到短時間無縫銜接,省略線下做導入導出的繁瑣步驟。數據生產過程通過模板化的任務創建,數據采集,清洗到標注全部線上流轉,傳統線下流轉可能面臨的信息丟失、失真問題得到解決。

此外,云測數據引入了基于規則的機器篩查方式,在人工校驗流程前根據所標注內容要求引入相關查錯規則,這種數字化輔助直接提升了數據精度和效率。

事實上,強化工具能力一直是各數據標注平臺在做的事,甚至AI本身的發展也反過來支撐數據標注工作。云測數據這類扎根行業的企業這些年投入了大量資源在工具開發上,打個不恰當的比方,這就好比富士康不斷增加工廠智能化水平、引入大量智能機械一樣,朝著“高端制造”前進一樣。

3、綜合研發技能:“解決方案”輸出下的采集、標注一體化

隨著AI技術深入到各個細分領域,企業對AI在商業化落地中的表現要求越來越高。在很多領域,客戶企業對服務供應商會提出更多樣化的需求,這時候,“解決方案”式的合作方式不可能避免出現在數據標注產業中,在拿出99.99%精準度的同時,云測數據還對外發布了智慧城市、智能家居、智能駕駛、智慧金融這四個場景的“全鏈條的AI訓練數據服務方案”。

這些解決方案,簡單說,就是過去合作的拓寬、拓深,為了同樣保證超高精準度,這個過程必然伴隨大量專業技術性的工作。

在數據標注產業鏈上,采集與標注不分家,華東、華北、華南設有數據交付中心和數據場景實驗室的云測數據,在給出的四個場景解決方案中,都十分強調場景化的數據采集服務。

例如,智慧城市數據解決方案的一個重要亮點或者說價值,是為客戶企業提供“長尾場景數據”——如不同光線下人員檢測、危險動作檢測等長尾情形,都需要不斷充實長尾場景,來提升“智慧”的覆蓋能力(處理、統計一些城市管理任務)。

云測數據建立的“數據場景實驗室”,通過還原場景、研究長尾場景的特點完成對應傳感器下的場景數據采集工作,這種行為,本質上相當于數據標注企業為智慧城市AI項目完成特定規則下的知識圖譜搭建。

類似的,還有智能家居場景中,在各類復雜語音背景下采集語音數據,實驗室開發底噪、混響、方言、語種等特殊要求下的數據采集;此外,在智能駕駛場景中,云測數據為了更加貼近真實場景,甚至通過改造轎車、標定傳感器這種參照智能駕駛汽車行駛場景的方式來采集所需要的AI數據。

顯然,這些方式方法都遠遠超出了“勞動密集”的范疇。

4、安全技能:被忽視的數據標注“硬核”技術能力

AI越往深處走,數據資產的重要性就越高,尤其是AI數據更加立體和豐富、精準度到達一個新的高度后,AI數據的價值變得更高,數據安全就更加成為客戶企業的剛需。

從數據標注產業的演變來看,對安全的重視,導致不少數據標注企業至少在數據安全維護方面擁有可圈可點的技術耕耘,甚至不輸于其他被打上技術公司標簽的巨頭。

一個現實是,像云測數據這樣的頭部企業,即便擁有行業內最專業的全職團隊,能夠保證高質量數據也能夠實現高效的作業效率,甚至不斷引導行業的規范化發展,這些地位、價值或者優勢,也都是建立在數據隱私安全的原則之上。

數據精準度做得越高,云測數據這種企業就更看重數據隱私安全的保護。這些年,除了流程和工作方式的嚴格控制,云測數據內部還開發了數據隔離、質量保障等一系列數據安全方面的技術,這也使得數據標注企業的“技術”標簽更加濃厚。

Testin云測CMO張鵬飛也強調,“從目前看來,AI數據行業關于安全、隱私等方面并沒有統一的標準。但從我們長遠角度出發,一直在隱私和安全防護角度下大力氣服務行業、樹立數據質量標桿,只有以這種負責的態度來服務客戶,我們的行業才能‘良幣驅除劣幣’,真正讓人工智能成為新一輪技術革命,改變整個社會和人類進程”。

結語

99.99%的AI數據精準度雖然是云測數據技術實力和服務能力積累的產物,但它也是行業發展到一定程度向更高階段躍遷的標志。

更進一步看,企業將精準度推高到接近100%的動作,本質上也代表著數據標注產業正在走出“勞動密集”,轉入“技能密集”發展階段,這是與精準度一樣重要的行業發展里程碑。數據標注最終將撕掉舊有偏見下的標簽,走入與AI同行的強技術服務產業行列。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7256

    瀏覽量

    91931
  • AI
    AI
    +關注

    關注

    88

    文章

    35182

    瀏覽量

    280204
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是自動駕駛數據標注?如何好做數據標注

    [首發于智駕最前沿微信公眾號]在自動駕駛系統的開發過程中,數據標注是一項至關重要的工作。它不僅決定了模型訓練的質量,也直接影響了車輛感知、決策與控制的性能表現。隨著傳感器種類和數據量的劇增,有效
    的頭像 發表于 07-09 09:19 ?249次閱讀
    什么是自動駕駛<b class='flag-5'>數據</b><b class='flag-5'>標注</b>?如何好做<b class='flag-5'>數據</b><b class='flag-5'>標注</b>?

    ArkUI-X平臺差異化

    邏輯不同,或使用了不支持跨平臺的API,就需要根據平臺不同進行一定代碼差異化適配。當前僅支持在代碼運行態進行差異化,接下來詳細介紹場景及如何差異化適配。 使用場景 平臺差異化適用于以下
    發表于 06-10 23:08

    數據標注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發展的時代,大模型憑借其強大的學習與泛化能力,已成為眾多領域創新變革的核心驅動力。而數據標注作為大模型訓練的基石,為大模型性能提升注入關鍵動力,是模型不可或缺的“養料。大模型則憑借
    的頭像 發表于 06-04 17:15 ?713次閱讀
    <b class='flag-5'>數據</b><b class='flag-5'>標注</b>與大模型的雙向賦能:效率與性能的躍升

    東軟集團入選國家數據數據標注優秀案例

    近日,東軟飛標醫學影像標注平臺在國家數據局發布數據標注優秀案例集名單中排名第一(案例名稱“多模態醫學影像智能數據
    的頭像 發表于 05-09 14:37 ?483次閱讀

    標貝科技“4D-BEV上億點云標注系統”入選國家數據局首批數據標注優秀案例

    ”主題,探討數據標注產業發展和高質量數據集建設路徑。同時,現場發布了全國首批數據
    的頭像 發表于 04-30 14:38 ?253次閱讀
    標貝科技“4D-BEV上億點云<b class='flag-5'>標注</b>系統”入選國家<b class='flag-5'>數據</b>局首批<b class='flag-5'>數據</b><b class='flag-5'>標注</b>優秀案例

    數據標注服務—奠定大模型訓練的數據基石

    影響著模型能力的上限。隨著大模型技術的快速發展數據標注服務的重要性愈發凸顯,其面臨的挑戰也日益嚴峻。當前,就標貝科技看來,數據標注服務已從
    的頭像 發表于 03-21 10:30 ?829次閱讀

    標貝數據標注服務:奠定大模型訓練的數據基石

    影響著模型能力的上限。隨著大模型技術的快速發展數據標注服務的重要性愈發凸顯,其面臨的挑戰也日益嚴峻。當前,就標貝科技看來,數據標注服務已從
    的頭像 發表于 03-21 10:27 ?573次閱讀
    標貝<b class='flag-5'>數據</b><b class='flag-5'>標注</b>服務:奠定大模型訓練的<b class='flag-5'>數據</b>基石

    自動化標注技術推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI數據訓練帶來哪
    的頭像 發表于 03-14 16:46 ?692次閱讀

    標貝自動化數據標注平臺推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI數據訓練帶來哪
    的頭像 發表于 03-14 16:42 ?914次閱讀
    標貝自動化<b class='flag-5'>數據</b><b class='flag-5'>標注</b>平臺推動<b class='flag-5'>AI</b><b class='flag-5'>數據</b>訓練革新

    AI自動圖像標注工具SpeedDP將是數據標注行業發展的重要引擎

    AI大浪潮下,許多企業都在不斷借助AI來提升自己的行業競爭力,數據標注企業也不例外,傳統人工標注效率不足的弊端困擾了多年,如今新的“引擎”就
    的頭像 發表于 01-02 17:53 ?814次閱讀
    <b class='flag-5'>AI</b>自動圖像<b class='flag-5'>標注</b>工具SpeedDP將是<b class='flag-5'>數據</b><b class='flag-5'>標注</b>行業<b class='flag-5'>發展</b>的重要引擎

    標貝數據標注在智能駕駛訓練中的落地案例

    標貝科技深耕AI數據服務多年,在無人駕駛、自動駕駛等智能駕駛領域擁有豐富的合作案例。多次采用點云標注以及3D&2D融合等標注方式為智能駕駛領域客戶提供環境感知、決策策劃、
    的頭像 發表于 12-24 15:17 ?1597次閱讀
    標貝<b class='flag-5'>數據</b><b class='flag-5'>標注</b>在智能駕駛訓練中的落地案例

    軟通動力入選《人工智能數據標注產業圖譜》

    近日,由中國信息通信研究院、中國人工智能產業發展聯盟牽頭,聯合中國電信集團、沈陽市數據局、保定高新區等70多家單位編制完成并發布了《人工智能數據標注
    的頭像 發表于 12-03 10:18 ?474次閱讀

    標貝科技:自動駕駛中的數據標注類別分享

    的必要條件,數據采集、數據標注服務已成為支撐自動駕駛熱潮必不可少的一環。本文將以數據標注的視角,通過標貝科技自研平臺標貝
    的頭像 發表于 11-22 15:07 ?2030次閱讀
    標貝科技:自動駕駛中的<b class='flag-5'>數據</b><b class='flag-5'>標注</b>類別分享

    標貝科技:自動駕駛中的數據標注類別分享

    的必要條件,數據采集、數據標注服務已成為支撐自動駕駛熱潮必不可少的一環。本文將以數據標注的視角,通過標貝科技自研平臺標貝
    的頭像 發表于 11-22 14:58 ?3835次閱讀
    標貝科技:自動駕駛中的<b class='flag-5'>數據</b><b class='flag-5'>標注</b>類別分享

    2024年星閃進入規模商用快車道

    2023年是星閃商用元年,2024年星閃進入規模商用快車道,預計到年底星閃應用將超過100個品類。我們相信星閃一定會為千行百業的無數應用場景帶來全新的創新機遇。
    的頭像 發表于 11-20 14:04 ?1393次閱讀