女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

鏡像翻轉的圖像,能不變?

算法與數據結構 ? 來源:算法與數據結構 ? 2020-08-03 16:58 ? 次閱讀

在訓練神經網絡的時候,經常會出現「缺數據」的情況。

這時候,就需要「數據增強」來獲取更多數據。而近幾年,鏡像反轉成了最為常用的方法之一。

轉一次,獲得2倍數據,真香!

然而,事情卻沒有想像中的那么簡單——當翻轉了數據集里所有的圖片時,神經網絡所擬合的函數,還能代表原先的圖像分布么?

針對這一問題,來自康奈爾大學的研究員,首次挑戰了常規神經網絡訓練中,圖片「翻轉不變性」(flip-invariant) 的這一假設。

研究的題目叫做視覺手性(Visual Chirality),并在CVPR 2020中獲得了最佳論文提名。

注:手性的定義為「一個物體無法與其鏡像相重合」。「視覺手性」一詞啟發自手性,意指「計算機視覺領域中圖像分布與其鏡像分布的區別」。

而該研究的一作,是此屆CVPR大會上年紀最小的獲獎者,年僅21歲的華人科研新秀——林之秋。

這項研究在多種領域(人臉,互聯網圖片,數字處理圖像)上利用卷積神經網絡,發現了許多常人難以捕捉的「視覺手性」線索。

通過自監督訓練,在多項數據集上達到了60%,甚至到90%的精度。

鏡像翻轉的圖像,能不變?

為了理解這一鏡像翻轉話題,我們先來看下這樣的一個例子:

在上面這張圖中,你能判斷出哪些圖像被翻轉了嗎?答案如下:

圖一:鏡像翻轉(線索:文字)。我們可以很容易看出來文字被翻轉過了。

圖二:沒有翻轉(線索:紐扣)。男士襯衫的紐扣一般位于身體右側。

圖三:鏡像翻轉(線索:吉他)。吉他手的主手應當在吉他右側。

鏡像翻轉對于人類而言并沒有多少區別(如圖二和圖三),因而難以判斷。

然而,神經網絡卻可以通過自監督訓練的方法在這個任務上達到非常高的精度,并能指出圖片中哪些區域可以被用于識別鏡像翻轉。

手性代表著單個圖片的翻轉不對稱性,而視覺手性(Visual Chirality)則是針對圖像分布所定義的翻轉不對稱性。

當一個圖像分布具備視覺手性時,使用鏡像翻轉作為數據增強方法,將不可避免的改變一個數據集所代表的分布。

換句話說,只有當一個圖像分布不具備視覺手性的時候,才能在不改變原先圖像分布的前提下,使用鏡像翻轉來增強數據集。

然而,視覺手性是大部分視覺領域都擁有的屬性。正如此篇文章作者,谷歌AI科學家Noah Snavely教授所說:

在計算機視覺的研究中,我們常把這個世界視為”翻轉不變“的,鏡像翻轉因而是一個常規的數據增強方法。

然而,當你翻轉圖片后,文字將被顛倒,左手變為右手,而螺旋意大利面也將朝相反方向旋轉。

那么,這項研究又是如何挑戰了,人們先前在計算機視覺中,對于「翻轉不變性」假設的呢?

實驗過程

這項研究利用了自監督學習方法來訓練卷積神經網絡。

對于任何一個數據集,只需要將其原有的圖片標記為「無翻轉」,并將鏡像翻轉過的圖片標記為「有翻轉」,即可訓練神經網絡識別鏡像翻轉這個二分類任務(binary classification)。

同時,可以根據神經網絡在驗證集的表現,來評估這一圖像分布是否具備視覺手性:

如果驗證集上的精度要顯著大于50%,便有充足的證據來證明視覺手性的存在。

這項研究利用了ResNet-50作為基本的網絡結構,并使用SGD方法來訓練網絡。

為了了解神經網絡學到了哪些視覺手性線索,研究人員利用了類激活映射(CAM:Class Activation Map)方法,在原有圖片上對于視覺手性敏感的區域進行了高亮。

同時因為能造成視覺手性的現象有很多,研究人員還推出了一個簡單的基于類激活映射的聚類方法——手性特征聚類(Chiral Feature Clustering)。

在互聯網圖片集上,神經網絡在鏡像翻轉識別上取得了高達60%-80%的精度。

研究人員在Instagram圖片集上進行了手性特征聚類,并挑選了一系列與人們生活相關的典型視覺手性現象進行討論。

手機:對著鏡子自拍是人們最愛做的事。此類照片具有視覺手性,因為手機的攝像頭一般固定在手機背面的一側(因品牌而異),同時由于多數人是右撇子,一般都以右手持手機進行自拍。

吉他:幾乎大多數的吉他手都以右手撥弦,左手持把。

手表:手表一般都被帶在人們的右手側。

為了深入了解人臉的視覺手性現象,研究人員在人臉數據集上進行了孤立訓練。

在Flickr-Faces-HQ (FFHQ)人臉數據集上進行了訓練,并在測試集上取得了高達81%的精度,還利用手性特征聚類對人臉中的視覺手性現象進行了初步的探討:

劉海分界處:人們一般用右手來分理劉海,這會導致劉海的朝向向一側偏移,并出現視覺手性現象。

眼睛:人們在看向物體時傾向于用一只主視眼進行瞄準,這樣會導致人們的目光在進行拍攝時出現偏移。多數人的主視眼為右眼,而這一現象可能是導致視覺手性現象的成因。

胡子:與頭發一樣,可能與人們習慣于用右手理胡子有關。

文中對以上的視覺手性現象的討論均為初步的分析,而人臉中任有大量的視覺手性線索值得被發掘。

除此之外,研究人員還對數字圖像處理過程(例如去馬賽克和圖片壓縮)中產生的視覺手性現象進行了分析。

舉個例子,當研究人員首次利用神經網絡,在Instagram數據集上進行自監督訓練時,發現沒有使用隨機剪裁(random cropping)的神經網絡。

但在部分圖片上,類激活映射所得到的熱圖更著重關注圖片的邊緣部分,如下圖所示:

而在使用隨機剪裁之后,研究人員得到的新的熱圖,則更關注來自于圖片中物體本身的線索。

研究人員提出:當數字圖像處理過程和鏡像翻轉不具備「交換律」時,視覺手性將會憑空產生在一個圖像分布上。

作者通過概率論與群論(group theory),對此假設進行了嚴謹的數學論證,并通過神經網絡實驗驗證了這一現象在互聯網圖片中廣泛存在。

而此類的線索往往不能被肉眼可見,卻在圖片中存在固定的模式,因而為圖像識偽的應用創造了可能性。

98年華人科學新秀

這項研究的第一作者,是98年生的華人科學新秀——林之秋。

林之秋17歲便考入美國“常春藤”盟校——康奈爾大學,而這也是他「開掛人生」的開始。

林之秋僅用兩年時間就全部修完計算機和數學兩個專業的本科課程,并從大二開始選修博士課程,同時跟隨計算機系的教授從事科研工作。

他在多項專業課上,例如多元微積分、線性代數、高等抽象代數、人工智能、計算機操作系統等都取得過第一名。

由于成績極為優異,自大二起林之秋就接受計算機系里邀請,以助教身份給高年級同學講課,為康奈爾科技學院編寫碩士生的預修課程,甚至在高階機器學習課上給博士生的試卷打分。

而這篇「CVPR 2020最佳論文提名」的研究,是林之秋從大二就開始著手準備的項目,這也顯示了他「超級大學霸」的真實實力。

如今,本科畢業的林之秋,總成績在學院數千名學生中名列前三,并受院長邀請在畢業典禮上代表學院舉旗。之后,他即將前往卡內基梅隆機器人學院,攻讀計算機視覺博士學位。

在此,也預祝林之秋同學,能夠在科研的道路上,繼續乘風破浪!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4806

    瀏覽量

    102711
  • 函數
    +關注

    關注

    3

    文章

    4367

    瀏覽量

    64125
  • 計算機視覺
    +關注

    關注

    9

    文章

    1706

    瀏覽量

    46555

原文標題:21歲華人本科生,憑什么拿下CVPR 2020最佳論文提名?

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Allegro Skill布局功能之整體模塊鏡像介紹

    使用“整體鏡像”功能可以實現快速、批量、多元素的鏡像操作,此功能可以將整個模塊電路快速鏡像,包括電路中的走線、銅皮、字符等,有便捷方便的操作方式,例如下文演示。 1、在菜單欄中點擊“FanySkill-布局-整體
    的頭像 發表于 05-08 16:42 ?363次閱讀
    Allegro Skill布局功能之整體模塊<b class='flag-5'>鏡像</b>介紹

    rootfs鏡像制作其實沒那么難

    在嵌入式Linux開發中,文件系統的打包和鏡像制作是關鍵步驟。本文介紹了Linux核心板文件系統的打包與鏡像制作方法,適合嵌入式開發人員快速上手。前言致遠電子Linux核心板提供的系統固件里,除了
    的頭像 發表于 04-03 11:37 ?301次閱讀
    rootfs<b class='flag-5'>鏡像</b>制作其實沒那么難

    樹莓派鏡像的制作、燒錄及運行

    你是否想過自己動手打造一個專屬的操作系統鏡像?無論是為極客項目定制開發環境,還是讓老舊設備煥發新生,系統鏡像定制都是極客玩家的必備技能。
    的頭像 發表于 03-27 16:00 ?645次閱讀

    基于Docker鏡像逆向生成Dockerfile

    在本文中, 我們將通過理解Docker鏡像如何存儲數據, 以及如何使用工具查看鏡像方方面面的信息來逆向工程一個Docker鏡像; 以及如何使用Python的Docker API來構建一個類似Dedockify的工具來創建Dock
    的頭像 發表于 03-10 09:45 ?439次閱讀
    基于Docker<b class='flag-5'>鏡像</b>逆向生成Dockerfile

    docker-proxy鏡像加速倉庫

    自建多平臺容器鏡像代理服務,支持 Docker Hub, GitHub, Google, k8s, Quay, Microsoft 等鏡像倉庫。
    的頭像 發表于 03-06 16:06 ?357次閱讀
    docker-proxy<b class='flag-5'>鏡像</b>加速倉庫

    Commvault推出CIS強化鏡像

    混合云數據保護解決方案領先提供商Commvault(納斯達克代碼:CVLT)近日宣布可以使用CIS強化鏡像,從各大云應用市場輕松部署Commvault Cloud平臺。這些CIS強化鏡像預先配置了
    的頭像 發表于 02-21 16:36 ?336次閱讀

    vsp01m01是怎樣控制CCD圖像翻轉的?

    我想問一下vsp01m01這顆AD芯片,是怎樣控制CCD圖像翻轉的?期待您們的解答,謝謝!
    發表于 02-13 06:59

    Docker-鏡像的分層-busybox鏡像制作

    目錄 知識點1:鏡像的分層 示例:進入 docker hub查看Jenkins的Dockerfile 知識點2:base鏡像 知識點3:scratch鏡像 scratch 鏡像是什么?
    的頭像 發表于 01-15 10:44 ?513次閱讀
    Docker-<b class='flag-5'>鏡像</b>的分層-busybox<b class='flag-5'>鏡像</b>制作

    華為云 X 實例的鏡像管理詳解

    前言 隨著云計算的不斷普及,云服務器成為企業和開發者日常工作中的重要工具。為了提升工作效率和降低運維成本,云服務器鏡像的管理尤為重要。鏡像作為服務器或磁盤的模板,預裝了操作系統、軟件及配置,是快速
    的頭像 發表于 01-07 17:01 ?514次閱讀
    華為云 X 實例的<b class='flag-5'>鏡像</b>管理詳解

    Dockerfile鏡像制作與Docker-Compose容器編排

    Dockerfile鏡像制作 docker/podman中, 鏡像是容器的基礎,每次執行docker run的時候都會指定哪個基本鏡像作為容器運行的基礎。我們之前的docker的操作都是使用來
    的頭像 發表于 01-07 11:01 ?655次閱讀
    Dockerfile<b class='flag-5'>鏡像</b>制作與Docker-Compose容器編排

    OpenHarmony通過掛載鏡像來修改鏡像內容,RK3566鴻蒙開發板演示

    OpenHarmony通過掛載鏡像來修改鏡像內容的教程,提高修改鏡像內容效率!
    的頭像 發表于 01-03 14:21 ?460次閱讀
    OpenHarmony通過掛載<b class='flag-5'>鏡像</b>來修改<b class='flag-5'>鏡像</b>內容,RK3566鴻蒙開發板演示

    先進封裝中的翻轉芯片技術概述

    引言 翻轉芯片技術已成為半導體行業中不可或缺的封裝方法,在性能、尺寸減小和功能增加方面具有優勢。本文概述翻轉芯片技術,包括晶圓凸塊制作工藝、組裝方法和進展。 翻轉芯片技術簡介 翻轉芯片
    的頭像 發表于 11-27 10:58 ?1067次閱讀
    先進封裝中的<b class='flag-5'>翻轉</b>芯片技術概述

    手動構建Docker鏡像的方法

    不推薦使用docker commit命令,而應該使用更靈活、更強大的dockerfile來構建docker鏡像
    的頭像 發表于 08-05 15:30 ?797次閱讀
    手動構建Docker<b class='flag-5'>鏡像</b>的方法

    esp32能不能直接跑opencv?有沒有在板子上面做圖像處理的庫?

    esp32能不能直接跑opencv,有沒有在板子上面做圖像處理的庫
    發表于 06-13 06:59

    adxl367在進行參考活動檢測時,能不能讓參考值不變

    adxl367在進行參考活動檢測時,參考值是實時一直變化的,能不能讓參考值不變
    發表于 06-03 08:41