女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟亞研院提出用于語義分割的結構化知識蒸餾

電子工程師 ? 來源:lp ? 2019-03-18 10:15 ? 次閱讀

今天跟大家分享一篇關于語義分割的論文,剛剛上傳到arXiv的CVPR 2019接收論文《Structured Knowledge Distillation for Semantic Segmentation》,通訊作者單位為微軟亞洲研究院。

作者信息:

作者分別來自澳大利亞阿德萊德大學、微軟亞洲研究院、北航、Keep公司、三星中國研究院,該文為第一作者Yifan Liu在微軟亞洲研究院實習期間的工作。

該文研究了在語義分割模型的知識蒸餾中引入結構化信息的損失函數,在不改變模型計算量的情況下,使用該方法在Cityscapes數據集上mIoU精度取得了最高達15.17%的提升。

什么是知識蒸餾?

顧名思義,知識蒸餾是把知識濃縮到“小”網絡模型中。一般情況下,在相同的數據上訓練,模型參數量較大、計算量大的模型往往精度比較高,而用精度高、模型復雜度高的模型即Teacher網絡的輸出訓練Student網絡,以期達到使計算量小參數少的小網絡精度提升的方法,就是知識蒸餾。

知識蒸餾的好處是顯而易見的,使用知識蒸餾后的Student網絡能夠達到較高的精度,而且更有利于實際應用部署,尤其是在移動設備中。

下面兩幅圖中,作者展示了使用該文提出的結構化知識蒸餾的語義分割模型在計算量和參數量不變的情況下,精度獲得了大幅提升。

算法原理

知識蒸餾的目標是希望對于Teacher網絡和Student網絡給定相同的圖像,輸出結果盡量一樣。

所以,知識蒸餾的關鍵,是如何衡量Teacher網絡和Student網絡輸出結果的一致性,也就是訓練過程中的損失函數設計。

該文中作者將語義分割問題看為像素分類問題,所以很自然的可以使用衡量分類差異的逐像素(Pixel-wise)的損失函數Cross entropy loss,這是在最終的輸出結果Score map中計算的。

同時作者引入了圖像的結構化信息損失,如下圖所示。

如何理解圖像的結構化信息?一種很顯然的結構化信息即圖像中局部的一致性。在語義分割中,可以簡單理解為,預測結果中存在的自相似性,作者衡量這種結構化信息的方式是Teacher預測的兩像素結果和Student網絡預測的兩像素結果一致。衡量這種損失,作者稱之為Pair-wise loss(也許可以翻譯為“逐成對像素”損失)。

另一種更高層次的結構化信息是來自對圖像整體結構相似性的度量,作者引入了對抗網絡的思想,設計專門的網絡分支分類Teacher網絡和Student網絡預測的結果,網絡收斂的結果是該網絡不能再區分Teacher網絡和Student網絡的輸出。作者稱這塊損失函數為Holistic loss(整體損失)。

仔細想想,作者設計的損失函數的三部分,逐像素的損失(Pixel-wise loss,PI)、逐像素對的損失(Pair-wise loss,PA)、整體損失(Holistic loss,HO)都很有道理,是不是?

作者使用ResNet18網絡模型在Cityscapes數據集上研究了作者提出的損失函數各部分對結果的影響。(ImN代表用ImageNet預訓練模型初始化網絡)

結果如下圖。

可知,作者提出的損失函數的各個部分都能使得Student網絡獲得精度增益,最高達15.17%!CV君發現逐像素對的損失(Pair-wise loss,PA)獲得的增益最大。

實驗結果

作者使用多個輕量級網絡模型,在三個主流語義分割數據庫上進行了實驗。

下圖為在Cityscapes數據集上的結果,使用該文方法知識蒸餾后Student網絡精度獲得了大幅提升!

下圖為一些預測結果示例,視覺效果上改進明顯。

下圖為在CamVid數據集上的結果,同樣改進明顯。

CamVid數據集上的Student網絡預測示例,視覺上也好了很多。

下圖為在ADE20K數據集上的實驗結果,同樣所有網絡模型的精度都獲得了大幅提升!

目前還未發現該文作者公布代碼。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6673

    瀏覽量

    105366
  • 函數
    +關注

    關注

    3

    文章

    4369

    瀏覽量

    64189
  • 數據集
    +關注

    關注

    4

    文章

    1222

    瀏覽量

    25275

原文標題:微軟亞研院提出用于語義分割的結構化知識蒸餾 | CVPR 2019

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    從零到一:如何利用非結構化數據中臺快速部署AI解決方案

    在企業數字轉型的浪潮中,AI已從概念走向落地應用。然而,真正能高效、安全地部署AI解決方案的企業仍屬少數,瓶頸往往出在“數據”——尤其是非結構化數據的管理與應用上。文件、音頻、視頻、圖像、郵件
    的頭像 發表于 04-14 13:50 ?195次閱讀

    AI知識庫的搭建與應用:企業數字轉型的關鍵步驟

    和應用數據,從而為AI應用提供源源不斷的支持,幫助企業實現全面的數字轉型。 ? AI知識庫的定義與作用 ? AI知識庫是一個由結構化和非結構化
    的頭像 發表于 03-27 15:18 ?324次閱讀

    華KB Insight智能知識管理工具加速工業智能

    為應對新型工業進程中“經驗未數字”與“數據未業務”的雙重困局,華 IoTSuite 工業物聯網平臺 & AIoT 數智應用開發工具包全新發布又一利器—— KB Insight
    的頭像 發表于 03-10 10:18 ?470次閱讀

    DeepSeek賦能,華KB Insight引領工業知識管理革命

    在面對制造業占比超80%的非結構化數據情況下,華KB Insight知識管理平臺借助于DeepSeek多模態處理技術,搭建核心處理框架,將加速各類知識庫的建設與完善,為企業數字
    的頭像 發表于 03-07 14:29 ?308次閱讀

    結構化數據中臺:企業AI應用安全落地的核心引擎

    在數字轉型浪潮中,非結構化數據(如文檔、圖片、音視頻等)已成為企業核心資產,其價值挖掘能力直接影響AI應用的效能與安全性。然而,數據分散、多模態處理復雜、安全合規風險高等問題,嚴重制約了企業AI
    的頭像 發表于 02-27 17:06 ?395次閱讀

    ShiMetaOS | 怎樣免費調用人臉識別模塊以及視頻結構化分析軟件API

    ShiMetaOS內置視美泰自人臉識別模塊及視頻結構化分析軟件API,可在設備端免費實現本地智能安防服務:涵蓋精準人臉檢測跟蹤、高速人臉搜索比對、活體及人證精準比對、人臉屬性精細識別,能實時預警
    的頭像 發表于 02-05 17:09 ?446次閱讀
    ShiMetaOS  | 怎樣免費調用人臉識別模塊以及視頻<b class='flag-5'>結構化</b>分析軟件API

    大連理工提出基于Wasserstein距離(WD)的知識蒸餾方法

    的機制,應用于中間層蒸餾時存在問題,其無法處理不重疊的分布且無法感知底層流形的幾何結構。 為了解決這些問題,大連理工大學的研究人員提出了一種基于 Wasserstein 距離(WD)的
    的頭像 發表于 01-21 09:45 ?547次閱讀

    華科技入選信通智能體應用案例

    華“智慧工廠精益生產管理智能體”成功入選中國信通智能體應用案例,通過零代碼開發和多模態分析,助力企業突破傳統瓶頸,實現生產效率和品質管理的顯著提升,為制造業數字轉型樹立了新標桿。
    的頭像 發表于 01-17 10:06 ?574次閱讀

    結構化布線在AI數據中心的關鍵作用

    AI 正在不斷顛覆各行各業,推動從電影制作到金融行業等各個領域的創新。而在 AI 系統的背后,隱藏著這樣一位無名英雄:結構化布線。
    的頭像 發表于 11-21 16:51 ?816次閱讀

    語義分割25種損失函數綜述和展望

    本綜述提供了對25種用于圖像分割的損失函數的全面且統一的回顧。我們提供了一種新穎的分類法,并詳細審查了這些損失函數如何在圖像分割中被定制和利用,強調了它們的重要特征和應用,并進行了系統的分類。摘要
    的頭像 發表于 10-22 08:04 ?1474次閱讀
    <b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數綜述和展望

    基于分布式對象存儲WDS的信托非結構化數據整合平臺

    基于分布式對象存儲WDS的信托非結構化數據整合平臺
    的頭像 發表于 08-28 09:56 ?588次閱讀
    基于分布式對象存儲WDS的信托非<b class='flag-5'>結構化</b>數據整合平臺

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義
    的頭像 發表于 07-17 09:56 ?808次閱讀

    圖像分割語義分割的區別與聯系

    圖像分割語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區
    的頭像 發表于 07-17 09:55 ?1729次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心模型,在圖像
    的頭像 發表于 07-09 11:51 ?1758次閱讀

    定期維護結構化布線對于辦公室得重要性

    定期維護結構化布線對于辦公室的順利運行至關重要。結構化布線是指支持建筑物內各種數據、語音和視頻系統的標準基礎設施。它包括電纜、連接器、機架和其他構成網絡主干的組件。 通過正確維護結構化
    的頭像 發表于 06-14 10:44 ?432次閱讀