Google LLC今天推出了新版本的Open Images(其用于人工智能研究的照片數(shù)據(jù)集),其中添加了數(shù)百萬個其他數(shù)據(jù)點,并提供了一個被稱為“本地化敘事”的功能,旨在幫助學術項目。
Open Images于2016年首次發(fā)布,其中包含900萬張帶有描述性標簽的照片。此類數(shù)據(jù)集在AI生態(tài)系統(tǒng)中起著重要作用。研究人員使用它們來開發(fā)用于目標識別和自動駕駛等任務的新型機器學習模型。
除了提供可免費使用的照片外,Open Images還包含數(shù)百萬條對AI培訓有價值的注釋。未經(jīng)訓練的神經(jīng)網(wǎng)絡無法自行識別照片中的對象,因此需要諸如注釋之類的元數(shù)據(jù)來了解屏幕上的內(nèi)容。元數(shù)據(jù)越詳細,AI可以學習的越好。
今天發(fā)布的新版本的“開放圖像”增加了2350萬張“照片級”標簽,這些標簽已經(jīng)過人類驗證,可以對圖像中發(fā)生的事情提供一般描述。該數(shù)據(jù)庫現(xiàn)在總共有5990萬個這樣的標簽。Google還添加了更多情境注釋,包括250萬個用于描述照片中人物所執(zhí)行動作的標簽,以及另外391,000個用于描述對象之間關系的標簽。
但是,主要亮點是Google的本地化敘述。這些是搜索巨頭開發(fā)的一種新型注釋,它希望AI模型能夠比舊的注釋方法收集更多有關圖像的信息。
Google通過讓人類注釋者將鼠標懸停在照片中的每個對象上并使用自己的文字進行描述來生成本地化的敘事。然后將光標移動的記錄與自然語言描述配對,以便每個單詞都可以與其所應用的對象相關聯(lián)。谷歌說,這種方法將使AI模型在Open Images數(shù)據(jù)集上進行訓練時可以更有效地學習。
“為了了解這些本地化敘述所代表的更多數(shù)據(jù)量,鼠標軌跡的總長度約為6400公里,如果不停地大聲朗讀,所有敘述都將花費約1.5年的時間來聆聽,” Google研究科學家Jordi Pont-Tuset在博客文章中進行了詳細介紹。
到目前為止,Google已經(jīng)為約500,000個Open Images文件創(chuàng)建了本地化的敘述。Pont-Tuset寫道,此次更新代表著“在改善圖像分類,物體檢測,視覺關系檢測和實例分割的統(tǒng)一注釋方面,邁出了重要的定性和定量步驟。” “我們希望Open Images V6能夠進一步刺激人們對真實場景的理解。”
-
Google
+關注
關注
5文章
1789瀏覽量
59034 -
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4814瀏覽量
103616 -
生態(tài)系統(tǒng)
+關注
關注
0文章
707瀏覽量
21057
發(fā)布評論請先 登錄
戴爾數(shù)據(jù)保護軟件迎來全新版本
普華基礎軟件開源汽車操作系統(tǒng)新版本代碼上線
普華基礎軟件開源車用操作系統(tǒng)迎來全新版本
SOA架構開發(fā)小助手PAVELINK.SOA-Converter 2.1.2新版本發(fā)布

GUI Guider v1.9.0全新版本上線
高通推出Qualcomm Aware平臺最新版本
索尼發(fā)布空間現(xiàn)實顯示播放器新版本
特斯拉發(fā)布“完全自動駕駛”軟件最新版本FSDV13.2
英國比克新推出了PicoScope7軟件的穩(wěn)定新版本

經(jīng)緯恒潤INTEWORK-VBA新版本正式發(fā)布

達索系統(tǒng)SOLIDWORKS2025新版本即將來襲
經(jīng)緯恒潤INTEWORK-TPA 新版本正式發(fā)布

評論