人類的本質是復讀機,GANs的本質是復制粘貼
研究人員從Copy-Pasting(GANs)中得到啟發,設計了一種新的對象發現訓練程序。在這一新的訓練流程中,生成器不會像傳統的對象發現方法那樣直接生成對象。相反,它會識別并分割現有對象。該方法適用于各種不同的數據集,包括復雜背景下有外觀變換的大型對象。
研究表明,通過訓練Copy-Pasting GANs,防止生成模型走捷徑,可以實現無監督的對象發現。該方法可以處理來自真實圖像的雜亂背景,并且可以在不從頭開始的情況下,以更高效的數據方式預先訓練用于有監督的對象檢測模型。它還可以用作智能代理的視覺模塊。基本上,這項工作可以有效地為用戶驅動的圖像處理、對象檢測和分割等任務創建實際的可視化數據。
Google AI:變大的CNN,變小的模型
谷歌研究人員提出了一種新的方法,該方法實現了一個簡單但高效的復合系數來擴大CNN。傳統方法會隨意地縮放網絡規模(寬度、深度和分辨率),而這種新方法將每一個規模的維度都與固定系數進行了平衡。
通過將這一方法和最新的AutoML技術結合起來,研究人員開發了EfficientNets,它能夠在實現更小更快的模型的同時優化精度和效率(10倍),遠遠超過了傳統方法。
EfficientNets有望成為最先進的計算機視覺任務的基礎。為了機器學習社區的利益,研究人員還開發了開源的高效網絡算法。
基于深度學習的深度預測
谷歌人工智能的一組研究人員已經應用深度學習來解決從二維圖像數據重建幾何場景的挑戰。他們開發了一種新的模型,能夠在攝像機和拍攝對象都自由移動的情況下創建深度圖。通過對人體姿態和數據形狀的先驗學習,該算法能夠避免直接使用三維三角定位。
研究人員主要關注于人類,因為他們是增強現實和3D視頻效果的良好目標。令人驚訝的是,雖然有許多方法可以預測深度圖,但這一研究是第一項幫助設計和實現照相機和人體同時運動的工作。
生成的預測深度圖可用于創建各種3D感知視頻效果。它們可以幫助生成單目立體視頻,也可以將合成CG對象插入到場景中。此外,它們還提供了用視頻其他幀中的內容填充孔和不被遮擋區域的能力。
電話詐騙時代的落幕
即便是最先進的欺騙檢測系統,也嚴重依賴于關于欺騙的技術知識。本文通過探索傳統和自動編碼器的音頻特性來解決這一局限性,這些特性在不同類型的重播欺騙中都是可推廣的。
研究人員全面解釋了建立高級音頻特征檢測所需的所有步驟,包括預處理和后處理。他們還評估了強大的重放揚聲器檢測系統的性能,該系統將提取的和機器學習的音頻特征進行了不同的組合,并在嘈雜環境下于ASVSpoof 2017數據集上進行了測試。
與當前最先進的技術相比,這一程序提供了極具競爭力的結果,并重申了集成不同類型音頻特征以開發用于欺騙檢測的強大模型的重要性。
移動設備的自監督音頻表示學習
Google Research最近基于移動設備音頻剪輯中的時間環境提出了一種自我監督的學習方法。在這一研究中他們推薦了Audio2Vec,這是一個受Word2Vec啟發的自我監督學習過程,但應用于音頻頻譜圖。
他們同樣推薦了TemporalGap,這是另一種自我監督的學習過程,它可以估計隨機抽取的任意兩對音頻片段之間的時間距離。
基于可能部署在移動設備上的小型編碼器架構,研究人員證明,Audio2Vec和TAemporalGap能夠生成可重復用于各種下游任務(如語音、音樂檢測、揚聲器識別和語言識別等)的表示,而無需在訓練工程中使用有標記數據集。
研究表明,自監督模型能在一定程度上減小與完全監督模型的精度差距。
未來,研究人員計劃以分布式方法直接在設備上研究自我監督模型的訓練。有趣的是,他們還計劃合并從不同的自我監督模型中學習到的表示(比如在嵌入語音的情況下)以改進他們的發現。
-
谷歌
+關注
關注
27文章
6232瀏覽量
108301 -
AI
+關注
關注
88文章
35319瀏覽量
280783
原文標題:谷歌開發EfficientNets,擴大CNN并與AutoML結合,效率提升10倍|一周AI最火論文
文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
【高云GW5AT-LV60 開發套件試用體驗】基于開發板進行深度學習實踐,并盡量實現皮膚病理圖片的識別
谷歌地圖GPS定位
日月光擴大CoWoS先進封裝產能
谷歌公司被立案調查 谷歌股價暴跌 谷歌母公司Alphabet跌8%
泰國數據中心預計兩年內啟用,谷歌計劃在泰擴大生產規模
谷歌加速AI部門整合:AI Studio團隊并入DeepMind
芯馳科技與BlackBerry QNX擴大合作
ADS1299EEGFE-PDK得到的采集數據擴大了2倍,為什么?
SensiML開源了Analytics Studio AutoML引擎

ARM開發板與FPGA的結合應用
谷歌大量應用AI開發新產品,Q3財報亮眼
微軟GitHub與Anthropic和谷歌合作
Vision Pro開發實踐(結合24黑馬idea)

評論