女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

梯度的獨特分布給量化訓練帶來了極大挑戰

lhl545545 ? 來源:商湯科技 ? 作者:商湯科技 ? 2020-06-15 14:32 ? 次閱讀

商湯科技CVPR 2020錄用論文在多個領域實現突破,包括:對抗式生成模型、三維點云理解與分析、訓練加速與模型量化、視頻理解與分析、網絡結構搜索等。以下為商湯及商湯聯合實驗室入選CVPR 2020的代表性論文。

▎研究方向:對抗式生成模型

代表性論文:《對人臉生成模型的隱空間可解釋性分析》鏈接:https://arxiv.org/abs/1907.10786

近年來,對抗生成網絡(GAN)的快速發展極大地增強了圖像生成的質量,也因此得到了越來越廣泛的應用。越來越多基于GAN的模型被提出來提高生成質量以及訓練穩定性,但是對于生成模型的可解釋性還鮮有研究。

本文以人臉生成模型為例,對GAN的隱空間進行了深入分析,目標在于理解GAN是如何將一個隨機噪聲轉化為一張高質量圖片的。本文提出了一種簡單而通用的技術InterFaceGAN,用于在潛在空間中進行語義人臉編輯,可控制姿勢以及其他面部屬性,例如性別、年齡、眼鏡等,還能夠糾正GAN造成的偽影。

代表性論文:《ACGPN:基于圖像的自適應生成保留虛擬換裝》鏈接:https://arxiv.org/abs/2003.05863

本文關注基于圖像的虛擬換裝任務。現有方法取得了很多突破但仍然存在很大問題:(1)人物的肢體仍然是模糊的;(2)對于下裝很難做到清楚的保留;(3)衣服的紋理容易產生過度形變。

為此本文利用一種語義敏感的方法,自適應的判斷哪部分圖像是應該保留的,解決了現有方法中無法對人物肢體與衣服有遮擋的情況的建模,極大程度地降低了生成結果中的偽影以及模糊細節;并通過引入仿射變換的共線性等性質,對變形衣服中的薄板樣條插值變換起到約束,使得Logo和花紋不易扭曲變形。 ▎研究方向:三維點云理解與分析 代表性論文:《PV-RCNN: 基于Point-Voxel點云特征深度融合的3D物體檢測算法》鏈接:https://arxiv.org/abs/1912.13192

本文關注基于點云數據的三維物體檢測任務。文章提出了一個高性能的3D物體檢測框架PV-RCNN,其通過構造Set Abstraction特征抽象操作將基于Point與Voxel的點云特征提取算法分別在Voxel-to-Keypoint階段和Keypoint-to-RoIGrid 階段深度融合,使其同時擁有可變感受野、精確的點云位置信息以及高召回率,從而有效提升3D物體檢測的性能。

梯度的獨特分布給量化訓練帶來了極大挑戰

實驗部分,PV-RCNN分別在競爭激烈的自動駕駛數據集KITTI以及更大規模的Waymo數據集上得到了驗證。在KITTI數據集的3D物體檢測榜Car類別上,PV-RCNN大幅領先其他所有算法,在三個難度上均取得了第一名。在更大規模的Waymo數據集上,PV-RCNN同樣在所有難度以及不同距離上超越了現有算法,最高mAP增幅達近7個點。

▎研究方向:訓練加速與模型量化

代表性論文:《用于加速卷積神經網絡訓練過程INT8訓練技術》鏈接//arxiv.org/abs/1912.12607

卷積神經網絡訓練過程需要耗費大量的計算資源和時間,而各種深度學習硬件都提供非常高效的INT8計算支持。當把INT8計算應用到訓練中同時加速網絡的前傳和反傳過程時,梯度的獨特分布給量化訓練帶來了極大挑戰。

為了解決梯度量化帶來的精度損失,論文進行了量化訓練收斂穩定性的理論分析并基于此提出了“誤差敏感的學習率調節”和“基于方向自適應的梯度截斷”方法,將兩個方法在圖像分類數據集ImageNet、CIFAR和目標檢測數據集PASCAL VOC、COCO上進行實驗,均取得了極少的精度損失。

梯度的獨特分布給量化訓練帶來了極大挑戰

實驗中也驗證了該方法對Inception、MobileNet等不同網絡結構的通用性。為了保證更高的加速比,論文還提出使用周期更新、量化卷積融合等技術來減少量化操作帶來的時間開銷。通過在GTX1080TI上實測,可以提升22%的訓練過程。

研究方向:視頻理解與分析 代表性論文:《TAPOS: 基于時序動作解析理解動作內部和不同動作間的語義》

動作理解是計算機視覺領域的核心問題之一,也是許多其他任務的基石,如智能視頻檢索,基于視覺的機器人學等。本文發現,人本身對于動作序列中子動作模式的轉換是比較敏感的。

在這篇工作中,本文提出了一種時域解析器,可以挖掘人體動作中的子動作模式,并根據挖掘出的子動作模式對較復雜的動作序列進行時域上的解析。這種時域解析器不但能對一個給定的動作序列進行子動作邊界劃分,還可以找尋大量不同動作序列中相同的子動作模式。本文發現,對較復雜動作序列良好的時域解析可以幫助提升一些較為高層的任務的準確率,如動作識別等。

梯度的獨特分布給量化訓練帶來了極大挑戰

▎研究方向:網絡結構搜索 代表性論文:《最高加速400倍,探索更好的網絡評價方法EcoNas》鏈接:https://arxiv.org/abs/2001.01233 許多網絡搜索算法需要耗費大量的算力,而這些算力絕大多數集中在候選網絡(Candidate)的評估上。同樣地,由于算力的限制,候選網絡的評估往往需要在代理環境(Proxy)下進行,如較短的訓練周期數。雖然每個NAS算法都要用到代理環境,但是代理環境對子網絡評估的影響仍然是未知的。 本文的工作首次系統研究了不同代理參數對網絡評估的影響。作者發現,使用更可靠的代理環境不僅可以極大壓縮計算量,也有助于搜到更好的模型。基于對代理環境的研究,作者提出了一個層次化的搜索方法,EcoNAS在將進化算法加速400倍的同時,得到了更好的網絡結構。

梯度的獨特分布給量化訓練帶來了極大挑戰

同樣地,作者發現可靠的代理環境也可以被用于其他搜索算法中,例如權重共享算法,在不影響精度的同時,使得搜索效率進一步提升。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2953

    瀏覽量

    109910
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2184

    瀏覽量

    76251
  • 商湯科技
    +關注

    關注

    8

    文章

    555

    瀏覽量

    36672
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    瑞芯微模型量化文件構建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現在想量化deepprivacy人臉匿名模型,他的輸入是四個輸入。該模型訓練時數據集只標注了人臉框和關鍵點,該模型的預處理是放到模型外的,不在模型
    發表于 06-13 09:07

    OCR識別訓練完成后的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數據集 請問
    發表于 05-28 06:46

    是否可以輸入隨機數據集來生成INT8訓練量化模型?

    無法確定是否可以輸入隨機數據集來生成 INT8 訓練量化模型。
    發表于 03-06 06:45

    分布式 IO:礦山砂石裝備高效控制的新引擎

    在砂石與礦山行業這片充滿挑戰與機遇的領域,裝備的高效運行和精準控制一直是企業追求的核心目標。隨著科技的飛速發展,明達技術推出的MR30分布式 IO 模塊作為一種先進的控制技術,正逐漸嶄露頭角,為砂石、礦山裝備的升級改造帶來了新的
    的頭像 發表于 02-12 17:08 ?294次閱讀

    基于梯度下降算法的三元鋰電池循環壽命預測

    不同比例、范圍的訓練集與測試集劃分。基于機器學習的梯度下降算法對訓練集進行模型訓練,以迭代后的權重值、偏置值進行結果預測并與試驗數據進行對比。結果表明:適宜參數下的
    的頭像 發表于 01-16 10:19 ?453次閱讀
    基于<b class='flag-5'>梯度</b>下降算法的三元鋰電池循環壽命預測

    大模型訓練框架(五)之Accelerate

    Hugging Face 的 Accelerate1是一個用于簡化和加速深度學習模型訓練的庫,它支持在多種硬件配置上進行分布訓練,包括 CPU、GPU、TPU 等。Accelerate 允許用戶
    的頭像 發表于 01-14 14:24 ?595次閱讀

    AI模型部署邊緣設備的奇妙之旅:如何實現手寫數字識別

    。 這種方法通常能保留更多的模型精度,因為模型已經在訓練中學會了應對量化帶來的變化。 優點: 顯著降低模型的存儲需求和計算復雜度。 在特定硬件(如GPU、NPU)上運行時,可以大幅提升推理速度。
    發表于 12-06 17:20

    協調控制器在分布式光伏領域如何發揮最優控制策略進行調節控制?

    電力系統的穩定運行帶來了挑戰。為了應對這些挑戰,協調控制器在分布式光伏領域的應用顯得尤為重要。本文將深入探討協調控制器在
    的頭像 發表于 11-22 14:33 ?724次閱讀
    協調控制器在<b class='flag-5'>分布</b>式光伏領域如何發揮最優控制策略進行調節控制?

    AI客戶服務帶來了哪些好處

    如今,各行各業的客戶服務部門都面臨著呼叫量增加、客服人員流失率高、人才短缺以及客戶期望不斷變化等挑戰
    的頭像 發表于 11-20 09:22 ?832次閱讀

    分布式通信的原理和實現高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經超出了單個 GPU 的范圍。所以就需要實現跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進
    的頭像 發表于 11-18 09:39 ?1165次閱讀
    <b class='flag-5'>分布</b>式通信的原理和實現高效<b class='flag-5'>分布</b>式通信背后的技術NVLink的演進

    訓練RNN時如何避免梯度消失

    有效的訓練。為了解決這個問題,可以采取以下幾種方法: 梯度裁剪(Gradient Clipping) 梯度裁剪是限制梯度大小的技術,通過設置梯度
    的頭像 發表于 11-15 10:01 ?930次閱讀

    激光打靶射擊訓練系統 DW-S602提供軍事訓練效率

    分析和反饋,幫助訓練者提高射擊技能和戰斗反應能力。 隨著現代科技的飛速發展,公安武警及新兵訓練領域也迎來了技術革新的浪潮。其中,模擬輕武器射擊訓練系統激光打靶設備以其
    的頭像 發表于 11-03 09:54 ?782次閱讀

    Meta發布Llama 3.2量化版模型

    近日,Meta在開源Llama 3.2的1B與3B模型后,再次為人工智能領域帶來了新進展。10月24日,Meta正式推出了這兩個模型的量化版本,旨在進一步優化模型性能,拓寬其應用場景。
    的頭像 發表于 10-29 11:05 ?791次閱讀

    WBG 器件柵極驅動器電源帶來挑戰

    碳化硅 (SiC) 和氮化鎵 (GaN) 器件的柵極驅動器電源必須滿足這些寬帶隙半導體的獨特偏置要求。本文將討論在 SiC 和 GaN 應用中設計柵極驅動器電源時需要考慮的關鍵因素。 圖 1
    發表于 09-27 15:05 ?1029次閱讀
    WBG 器件<b class='flag-5'>給</b>柵極驅動器電源<b class='flag-5'>帶來</b>的<b class='flag-5'>挑戰</b>

    AI普及嵌入式設計人員帶來挑戰

    探討了人工智能(AI)的普及嵌入式設計人員帶來的新挑戰。在創建“邊緣機器學習(ML)”應用時,設計人員必須確保其能有效運行,同時最大限度地降低處理器和存儲開銷,以及物聯網(IoT)設備的功耗
    發表于 08-22 14:20 ?851次閱讀
    AI普及<b class='flag-5'>給</b>嵌入式設計人員<b class='flag-5'>帶來</b>新<b class='flag-5'>挑戰</b>