女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

100多萬個視頻短片數據集來啦!

電子工程師 ? 來源:lp ? 2019-03-15 09:52 ? 次閱讀

想象一下,如果我們必須向外星人解釋地球上發生的所有行為。我們可以為他們提供非小說類書籍或BBC紀錄片。我們可以嘗試口頭解釋什么是電臀舞。但是,實際上,沒有什么能比三秒鐘的視頻短片更好地傳達出這一行為的含義。

Falling Asleep(入睡,來自GIPHY網站)

感謝麻省理工學院和IBM的研究人員,我們現在有了一個做了清晰的標簽標記的數據集,其中包含有100多萬個視頻短片。這個數據集名為“Moments in Time”,已經收集了地球上發生的數百種常見行為,有鮮花綻放的美麗時刻,也有令人尷尬的被絆倒和嘴啃泥場景。

Tripping(絆倒,來自GIPHY網站)

然而,Moments in Time的創建并不是為了提供一系列GIF動畫,而是為人工智能系統識別和理解視頻中的行為和事件打下基礎。迄今為止,大量標記過的圖像數據集,如用于物體識別的ImageNet和用于場景識別的Places,在開發更準確的圖像分類和理解模型中發揮了重要作用。

“視頻理解尤其是視頻中的行為識別,與圖像理解的情況是不同的。”MIT-IBM沃森人工智能實驗室的首席研究員、創建Moments in Time的主管研究員Dan Gutfreund說。“雖然用標簽標記了行為的視頻數據集在Moments in Time之前就已經存在,但它們比圖像數據集要小好幾個數量級。此外,它們是以人為中心的,有時還是針對特定領域的(比如體育)。”

因此,Gutfreund及其同事們力圖開發一個分類系統,該系統可以涵蓋最常見的行為(不管這些行為是由人類、動物還是物體完成的,也不管它們是在什么環境下完成的)。他們首先列出了來自VerbNet的4500個最常用的動詞(VerbNet是由語言學家開發和使用的一個動詞知識庫)。

他們將動詞解析成語義相關的詞簇,然后從每個詞簇中選擇最常見的動詞。結果顯示英語是很冗余的一種語言。例如,洗浴、淋浴、沐浴、皂洗、洗發、修指甲、保濕和用牙線——這些都可以簡單地歸入“梳洗打扮”的范疇。在對動詞進行了細致的整合之后,研究團隊確定了339個用做Moments in Time基礎的關鍵動詞。

Grooming(梳洗打扮,來自GIPHY網站)

但是,當對視頻本身進行分類時,會遇到一系列獨特的挑戰。例如,描述某個東西正在“打開”(opening),那可能是一個人正在打開一扇門,也可能是一朵花正在綻放,甚至可能是一只卡通狗正在張開嘴。更重要的是,相同幀反向播放,實際上可以描述不同的行為(“關閉”,closing),這意味著捕捉視頻的時間線對于理解視頻和將其正確分類是至關重要的。

Opening(打開,來自GIPHY網站)

研究人員從網上挑選了與這339個動詞相關的視頻,將每個視頻的時長縮短到3秒。這些視頻短片被發送到眾包平臺Amazon Mechanical Turk上,該平臺上的用戶幫助對100多萬個視頻短片進行分類(他們只需點擊“是”或“否”來確認每個視頻短片中是否發生了指定的行為即可)。

每個標簽都經過幾個用戶的驗證。關于該數據集如何創建的詳細信息,發表在了2月25日的IEEE Transactions on Pattern Analysis and Machine Intelligence上,文章標題為“Moments in Time Dataset: one million videos for event understanding”。

麻省理工學院計算機科學與人工智能實驗室(CSAIL)的Mathew Monfort是該項目的首席研究員,他指出,一些分類,比如“Walking”(步行)或“Cooking”(烹飪),是很簡單的,而另一些則不然。“Playing Music”(演奏/播放音樂)可以是一個樂隊在舞臺上演奏,也可以是一個人在用收音機聽音樂。Monfort說:“具有這種視覺和聽覺多義性的類目的識別,對于當前的機器學習模型來說是非常具有挑戰性的。”

Playing Music(演奏/播放音樂,來自GIPHY網站)

在該數據集的下一版本中,該團隊計劃使用相同的視頻集合,并標記出每個視頻中發生的多個行為。“當我們考慮視頻的本質時,很明顯需要更多的信息來恰當地描述一個事件,而用一個行為標簽來訓練和評估模型是不完整的。”Monfort說。“將多個標簽納入數據集應該可以顯著改善模型訓練,同時也為不同行為之間的關系問題以及如何對它們進行推理打開了大門。”

很快,更復雜的視頻可以通過機器學習算法分類,輕松自如。

不久之后,機器學習算法可能可以毫不費力地對更復雜的視頻加以分類。

機器學習(Machine Learning,來自GIPHY網站)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48691

    瀏覽量

    246426
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12107
  • 數據集
    +關注

    關注

    4

    文章

    1222

    瀏覽量

    25275

原文標題:100多萬個視頻短片數據集來啦!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發板,讓您輕松入門!

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發板,讓您輕松入門! 一、視頻觀看 正點原子手把手教你學STM32MP257-第1期:https://www.bilibili.com/video/BV1UtEiz
    發表于 05-16 10:42

    小智AI語音助手調試成功,母親節祝福語演示來啦

    、OLED 屏幕、麥克風模塊、喇叭驅動模塊、小喇叭、以及電源連接線、面包板。 因為有面包板,所以搭建就非常的容易,不需要焊接電路板,就十分的方便,體驗感也是很不錯的。 整體體驗感很不錯的,這個套件也是非常的安逸,可以很容易的搭建小智AI助手,非常的有趣。 演示視頻來啦,讓
    發表于 05-12 22:02

    OpenHarmony應用開發精品課程第七期來啦

    OpenHarmony應用開發精品課程第七期來啦
    的頭像 發表于 04-15 14:15 ?144次閱讀
    OpenHarmony應用開發精品課程第七期<b class='flag-5'>來啦</b>

    正點原子ND1核輻射檢測儀支持檢測x,γ,β射線的輻射強度,高靈敏度J321蓋革-米勒計數管,支持約100輻射值記錄!

    ;高靈敏J321大蓋革管,準確可靠;ND1支持約100輻射值記錄,U盤數據導出,方便分析;支持手持感應功能,方便好用;報警方式與閾值可調,不錯過危險警告;支持倒計時功能,3D感應,
    發表于 04-15 11:09

    請問NanoEdge AI數據該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數據的問題,請問我該怎么構建數據?或者生成模型失敗還會有哪些原因?
    發表于 03-10 08:20

    【電子工具】DM40數字用表,60000計數(Max),精準且創新設計,快捷高效;用表,示波器及信號發生器功能于一體!

    DM40數字用表,60000計數(Max),精準且創新設計,快捷高效;用表,示波器及信號發生器功能于一體! DM40數字用表是正點原子全新推出的首款智能
    發表于 02-17 15:35

    安信可大功率LoRa模組來啦,傳輸距離可達6.7km

    安信可大功率LoRa模組來啦LoRa小伙伴們!安信可大功率LoRa模組來啦這次小安先帶來“Ra-01S-P/Ra-01SC-P”的介紹這次的新品最大發射功率+29dBm最新動態可關注安信可視頻
    的頭像 發表于 02-12 18:03 ?257次閱讀
    安信可大功率LoRa模組<b class='flag-5'>來啦</b>,傳輸距離可達6.7km

    ASL國產芯片|睿致遠代理商|ASL代理|音視頻轉換芯片

    睿致遠(廈門)科技有限公司(以下簡稱:睿致遠)自2019年成立以來便致力于高速接口與顯示系統芯片的設計與開發,目前在高速接口協議及音視頻數字處理算法領域擁有豐富的數字、模擬IP和量產經驗,同時
    發表于 02-10 11:42

    DAC8728通道輸出數據,不能保持上一個數據嗎?

    比如我給0通道寫數據的時候,此時其他通道是置零的嗎?不能保持上一個數據嗎? 現在通道輸出的正弦波都是這個樣子的,請問是不是我分析的這個原因呢?
    發表于 01-13 07:07

    AMS-VS100:引領LED視頻控制器新風尚

    走近AMS-VS100,這款高效、便捷、創新于一身的LED視頻控制器,感受它如何引領行業新風尚。 一、多樣輸入,無縫切換 AMS-VS100支持多達5種
    的頭像 發表于 11-29 11:29 ?622次閱讀
    AMS-VS<b class='flag-5'>100</b>:引領LED<b class='flag-5'>視頻</b>控制器新風尚

    兩款特國產MXM顯卡介紹來啦

    買國產顯卡,就選集特智能。特重磅推出新款MXM顯卡,快來圍觀吧~那么究竟什么是MXM顯卡,它和我們平常用到的PCIE顯卡有什么區別呢?MXM顯卡是一種小巧緊湊的顯卡,具有高性能和低功耗的特點,支持
    的頭像 發表于 11-22 01:04 ?1289次閱讀
    兩款<b class='flag-5'>集</b>特國產MXM顯卡介紹<b class='flag-5'>來啦</b>!

    華盛昌攜手我的培訓圓滿落幕

    2024年10月19日下午,一場別開生面的培訓與活動啟動儀式在我的(以下簡稱“”)總部召開。此次活動旨在通過線上線下相結合的方式,為我的
    的頭像 發表于 10-27 15:00 ?657次閱讀

    LMH1982速率視頻時鐘發生器數據

    電子發燒友網站提供《LMH1982速率視頻時鐘發生器數據表.pdf》資料免費下載
    發表于 08-22 10:34 ?0次下載
    LMH1982<b class='flag-5'>多</b>速率<b class='flag-5'>視頻</b>時鐘發生器<b class='flag-5'>數據</b>表

    PyTorch如何訓練自己的數據

    PyTorch是一廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數據
    的頭像 發表于 07-02 14:09 ?3299次閱讀