女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何克服機(jī)器學(xué)習(xí)面臨的數(shù)據(jù)挑戰(zhàn)?

我快閉嘴 ? 來源:千家網(wǎng) ? 作者:千家網(wǎng) ? 2020-07-07 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,數(shù)據(jù)對(duì)于機(jī)器學(xué)習(xí)的重要性。了解數(shù)據(jù)訪問模式將幫助數(shù)據(jù)科學(xué)家確定適合其項(xiàng)目的正確存儲(chǔ)基礎(chǔ)架構(gòu)。數(shù)據(jù)基礎(chǔ)架構(gòu)使機(jī)器學(xué)習(xí)成為可能。然而,一旦開始使用,機(jī)器學(xué)習(xí)就面臨著關(guān)鍵的數(shù)據(jù)挑戰(zhàn),需要首先解決:

質(zhì)量

稀疏性

完整性

接下來,讓我們深入研究其中的每一個(gè),以便大家了解如何克服機(jī)器學(xué)習(xí)的這些挑戰(zhàn):

1. 質(zhì)量

許多數(shù)據(jù)科學(xué)家希望利用外部來源的數(shù)據(jù)。然而,通常沒有質(zhì)量控制或保證如何捕獲原始數(shù)據(jù)。

你相信外部數(shù)據(jù)的準(zhǔn)確性嗎?

這是一個(gè)很好的例子。漂浮在海洋中的浮標(biāo)上的傳感器收集有關(guān)海洋溫度的數(shù)據(jù)。但是,當(dāng)傳感器無法收集溫度時(shí),它將記錄為999。此外,在2000年之前,僅用兩個(gè)數(shù)字記錄了年份的數(shù)字。但是在2000年之后,記錄的數(shù)字變?yōu)榱怂膫€(gè)。

因此,我們需要了解數(shù)據(jù)的質(zhì)量以及如何準(zhǔn)備數(shù)據(jù)。在這種情況下,分析浮標(biāo)數(shù)據(jù)的科學(xué)家可以使用平均值、均值、最小值、最大值來可視化原始數(shù)據(jù),捕獲這些數(shù)據(jù)庫錯(cuò)誤并相應(yīng)地對(duì)其進(jìn)行清理。

2. 稀疏性

在這種情況下,稀疏適用于元數(shù)據(jù)。通常,元數(shù)據(jù)字段不完整,有些字段已填寫,有些字段留空。如果數(shù)據(jù)是從單一來源生成的,則可能是由于人類缺乏規(guī)范或知識(shí)所致。但是,如果數(shù)據(jù)來自各種來源,而沒有元數(shù)據(jù)的標(biāo)準(zhǔn)定義,則每個(gè)數(shù)據(jù)集可能具有完全不同的字段。因此,將它們組合在一起時(shí),完成的字段可能不對(duì)應(yīng)。

當(dāng)前,關(guān)于捕獲哪些元數(shù)據(jù)沒有行業(yè)標(biāo)準(zhǔn)。然而,元數(shù)據(jù)與數(shù)據(jù)本身一樣重要。當(dāng)您具有填充了不同元數(shù)據(jù)字段的相同類型的數(shù)據(jù)時(shí),如何關(guān)聯(lián)和過濾數(shù)據(jù)?

如果以浮標(biāo)為例,初始數(shù)據(jù)傳感器每十分鐘收集一次水溫,而較新的浮標(biāo)每三分鐘收集一次水溫。關(guān)聯(lián)數(shù)據(jù)的唯一方法是通過元數(shù)據(jù)在捕獲時(shí)公開。當(dāng)科學(xué)家進(jìn)行歷史分析時(shí),他們需要元數(shù)據(jù)以便能夠相應(yīng)地調(diào)整其模型。

3. 完整性

數(shù)據(jù)完整性是數(shù)據(jù)準(zhǔn)確性和一致性的保證。數(shù)據(jù)保管鏈對(duì)于證明數(shù)據(jù)在流水線和位置中移動(dòng)時(shí)不會(huì)受到損害至關(guān)重要。當(dāng)數(shù)據(jù)的捕獲和攝取受到控制時(shí),您可以相對(duì)輕松地驗(yàn)證其完整性。但是,與他人合作時(shí),很難進(jìn)行驗(yàn)證。生成數(shù)據(jù)時(shí),沒有用于外部數(shù)據(jù)的安全證書。您也不能確保數(shù)據(jù)記錄完全符合預(yù)期,也不能確保接收到的數(shù)據(jù)與原始記錄時(shí)完全相同。

關(guān)于物聯(lián)網(wǎng)數(shù)據(jù)和區(qū)塊鏈存在一些有趣的概念,但是,在廣泛采用這種概念之前,數(shù)據(jù)完整性取決于安全技術(shù)和策略的結(jié)合。例如,由于數(shù)據(jù)在靜態(tài)或傳輸過程中可能會(huì)受到威脅,因此通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)應(yīng)使用https,并且在靜態(tài)時(shí)應(yīng)進(jìn)行加密。另一方面,訪問控制應(yīng)受策略驅(qū)動(dòng),以避免人為錯(cuò)誤。

如何開始?

數(shù)據(jù)質(zhì)量、稀疏性和完整性直接影響最終模型的準(zhǔn)確性,并且是當(dāng)今機(jī)器學(xué)習(xí)面臨的一些比較大的挑戰(zhàn)。擁有清晰數(shù)據(jù)定義,政策并探索行業(yè)特定數(shù)據(jù)標(biāo)準(zhǔn)的組織將在短期和長(zhǎng)期項(xiàng)目中受益。

如果您還沒有,那么您的組織應(yīng)該首先定義自己的數(shù)據(jù)收集策略,元數(shù)據(jù)格式,然后應(yīng)用標(biāo)準(zhǔn)的安全技術(shù)。數(shù)據(jù)質(zhì)量和稀疏性齊頭并進(jìn)。下一步,設(shè)置元數(shù)據(jù)策略,并確??梢允褂貌东@的定性數(shù)據(jù)來驗(yàn)證數(shù)據(jù)的有效性。最后,為了確保數(shù)據(jù)完整性,可以在生成數(shù)據(jù)時(shí)應(yīng)用數(shù)字證書,應(yīng)該在傳輸過程中強(qiáng)制使用SSL,并且始終保持啟用加密狀態(tài)。

安全數(shù)據(jù)協(xié)作

如果您所在的行業(yè)需要與外部組織不斷交換數(shù)據(jù),那么最好開放您的數(shù)據(jù)和元格式的源代碼,因?yàn)檫@些標(biāo)準(zhǔn)比許多專有標(biāo)準(zhǔn)更廣泛。更好的是,您可以發(fā)起一個(gè)行業(yè)開放標(biāo)準(zhǔn)委員會(huì),讓其他人參與和貢獻(xiàn)。一個(gè)很好的例子是“開放目標(biāo)”,這是一種“公私合作伙伴關(guān)系,利用人類遺傳學(xué)和基因組學(xué)數(shù)據(jù)進(jìn)行系統(tǒng)的藥物靶點(diǎn)識(shí)別和優(yōu)先排序?!?/p>

尤其是研究數(shù)據(jù)生態(tài)系統(tǒng)已經(jīng)變得高度復(fù)雜,組織內(nèi)部和外部的合作者需要快速訪問數(shù)據(jù)以及簡(jiǎn)化數(shù)據(jù)管理的方法。機(jī)器學(xué)習(xí)的挑戰(zhàn)很多。第一步是使用正確的數(shù)據(jù)和基礎(chǔ)結(jié)構(gòu)啟動(dòng)項(xiàng)目。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2566

    文章

    53008

    瀏覽量

    767588
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2931

    文章

    46251

    瀏覽量

    392711
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134638
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn)
    的頭像 發(fā)表于 07-14 11:49 ?184次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    智慧路燈的推廣面臨哪些挑戰(zhàn)

    引言 在智慧城市建設(shè)的宏偉藍(lán)圖中,叁仟智慧路燈的推廣面臨哪些挑戰(zhàn)?叁仟智慧路燈作為重要的基礎(chǔ)設(shè)施,承載著提升城市照明智能化水平、實(shí)現(xiàn)多功能集成服務(wù)的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發(fā)表于 03-27 17:02 ?290次閱讀

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模化數(shù)據(jù)平臺(tái)

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)?;?b class='flag-5'>數(shù)據(jù)平臺(tái) 隨著人工智能在語言處理和計(jì)算機(jī)視覺領(lǐng)域取得突破,機(jī)器人技術(shù)仍面臨現(xiàn)實(shí)場(chǎng)景泛化能力的
    的頭像 發(fā)表于 03-12 11:42 ?1098次閱讀
    AgiBot World Colosseo:構(gòu)建通用<b class='flag-5'>機(jī)器</b>人智能的規(guī)模化<b class='flag-5'>數(shù)據(jù)</b>平臺(tái)

    智慧路燈在數(shù)據(jù)采集與分析方面面臨挑戰(zhàn)

    叁仟智慧路燈作為現(xiàn)代城市基礎(chǔ)設(shè)施的重要組成部分,通過集成多種傳感器、通信模塊和智能控制算法,實(shí)現(xiàn)了高效節(jié)能、多功能集成和智能化管理。然而,在數(shù)據(jù)采集與分析方面,智慧路燈仍面臨諸多挑戰(zhàn)。 一、技術(shù)
    的頭像 發(fā)表于 03-11 21:22 ?247次閱讀
    智慧路燈在<b class='flag-5'>數(shù)據(jù)</b>采集與分析方面<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    智能計(jì)算系統(tǒng)的軟件棧和硬件平臺(tái),以及目前面臨的問題,還提到了為什么相比于自能駕駛,具身智能為什么發(fā)展比較慢,因?yàn)榫呱碇悄芨訌?fù)雜,需要大算力,高實(shí)時(shí)性,高并發(fā)還需要低功耗,目前還面臨諸多的挑戰(zhàn)。相信借助
    發(fā)表于 01-04 19:22

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1194次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第一章學(xué)習(xí)

    講解如何構(gòu)造具身智能基礎(chǔ)模型的方法和步驟,包括數(shù)據(jù)采集、預(yù)處理、模型訓(xùn)練和評(píng)估等。 在第四部分,介紹了具身智能機(jī)器人的計(jì)算挑戰(zhàn),包括計(jì)算加速、算法安全性和系統(tǒng)可靠性等內(nèi)容。 最后,在第五部分介紹了一個(gè)
    發(fā)表于 12-27 14:50

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機(jī)器人需要毫米級(jí)的精確控制,書中有介紹基于視覺伺服的實(shí)時(shí)控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場(chǎng)景中,協(xié)作機(jī)器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智能通過在線
    發(fā)表于 12-24 15:03

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類機(jī)器人能夠在人類社會(huì)中有效地提供商品及服務(wù)。 數(shù)據(jù)是一種貨幣化工具
    發(fā)表于 12-24 00:33

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    深度學(xué)習(xí)中RNN的優(yōu)勢(shì)與挑戰(zhàn)

    循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是深度學(xué)習(xí)領(lǐng)域中處理序列數(shù)據(jù)的基石。它們通過在每個(gè)時(shí)間步長(zhǎng)上循環(huán)傳遞信息,使得網(wǎng)絡(luò)能夠捕捉時(shí)間序列數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系。然而,盡管RNN在某些任務(wù)上表現(xiàn)出色,它們也面臨
    的頭像 發(fā)表于 11-15 09:55 ?1332次閱讀

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?1229次閱讀

    機(jī)器視覺要面臨挑戰(zhàn)及其解決方法

    機(jī)器視覺是指使用計(jì)算機(jī)和圖像處理技術(shù)從圖像中提取信息,并將其轉(zhuǎn)換為機(jī)器可理解的格式。這種方法已經(jīng)被廣泛應(yīng)用于自動(dòng)化生產(chǎn)、質(zhì)量控制、測(cè)量和檢測(cè)等領(lǐng)域。然而,機(jī)器視覺仍然面臨著一些
    的頭像 發(fā)表于 11-11 01:03 ?1000次閱讀

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù),可以
    發(fā)表于 08-14 18:00