女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PAKDD 2019 AutoML挑戰賽結果出爐:國內團隊DeepBlueAI斬獲第一名

DPVg_AI_era ? 來源:lp ? 2019-04-19 08:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,數據挖掘領域頂會PAKDD的AutoML挑戰賽結果出爐,DeepBlueAI、微軟&北航、清華大學等團隊斬獲前三名。本文帶來冠軍團隊解決方案的技術分享。

PAKDD 2019 AutoML挑戰賽結果出爐:國內團隊 DeepBlueAI 斬獲第一名,微軟亞洲研究院&北航組成的ML Intelligence團隊獲得第二名,清華大學Meta_Learners團隊獲得第三。

Feedback phase 排行榜

PAKDD 全稱亞太地區知識發現與數據挖掘國際會議(Pacific Asia Knowledge Discovery and Data Mining),是亞太地區數據挖掘領域的頂級國際會議。該會議在全球數據挖掘領域享有盛譽,一直受到業內各國科學家的高度重視和廣泛認可。

PAKDD 2019 第 4 屆自動機器學習挑戰賽(AutoML Challenge)的主題是“AutoML for Lifelong Machine Learning”,要求參賽選手創建一個自動預測模型(沒有任何人為干預),并在一個終身機器學習(Lifelong Machine Learning)設置中訓練和評估該模型。

AutoML,全稱為Automated Machine Learning,是機器學習領域的一個新興方向。旨在自動化整個機器學習的流程,降低數據預處理、特征工程、模型選擇、參數調節等環節中的人工成本。

隨著機器學習系統的日益復雜化,AutoML 得到了產學研各界的廣泛關注,已成為人工智能領域最熱門的研究方向之一。

據悉,本次競賽共有 127 個隊伍參加,共收到 550 多個方案,最終有 31 個隊伍進入決賽。

最終獲勝的隊伍為:

冠軍:DeepBlueAI,羅志鵬,黃堅強,陳明健

亞軍:ML Intelligence,包夢蛟,Hui Xue,Yihuan Mao,Yujing Wang

季軍:Meta_Learners,熊錚,蔣繼研,張文鵬

接下來,本文帶來冠軍團隊解決方案的分享。

冠軍方案關鍵技術:自動特征工程和自動快速特征選擇

如下圖所示,研究團隊實現了一個Lifelong AutoML 框架,包括自動特征工程和自動快速特征選擇、自動模型調參、自動模型融合等步驟,在類別不平衡的處理上我們使用了自適應采樣并在模型訓練上有一定的創新,對概念漂移問題我們結合DNN的預訓練和LightGBM的再訓練以及針對性地設計特征來緩解概念漂移,并且利用了多種策略對運行時間和運行內存進行了有效的控制,以確保解決方案能在限制時間和內存下完成整個流程。

自動特征工程與快速特征選擇:

與以往的AutoML框架所不同的是,我們的框架更加注重自動特征工程與特征選擇,我們構建的自動特征工程不僅是基于時間特征、分類特征、數值特征、多值分類特征做特征間的高階組合,同時我們自動提取跨時間、樣本的高階組合。

對于特征選擇,我們結合特征重要性及序列后向選擇算法實現了一個有效的快速特征選擇,在忽略重要性低的特征上結合序列后向特征選擇算法,對重要性極高的特征進行篩選,這能快速地篩選掉過擬合特征,從而大幅度提高模型性能。為了避免維度災難,我們迭代地進行特征工程和特征選擇,在低階特征生成后,利用特征選擇過濾大部分特征,在其基礎上進行更高階的特征組合,更有效地提取了高階特征并避免了維度災難。

緩解類別不平衡:

我們能夠自動針對數據情況(數據大小,數據類型,以及正負樣本比例),以及比賽時間的限制等各種因素的不同,自適應地對數據采取不同的采樣方式和比例,既保證了效率的同時又保證了效果。傳統的類別不平衡的數據訓練方式,是通過提前對數據進行采樣,緩解類別不平衡問題,然后將數據加入模型中訓練。但是這樣會損失大量的數據信息,所以我們在數據采樣的時候,仍然保留大量的高比例樣本,并且將其分批,在加入模型中訓練時,讓模型在梯度提升中輪流訓練分批數據,這樣能夠盡可能保留更多的原始數據的信息,同時緩解了類別不平衡問題。

抗概念漂移處理:

針對數據大小,數據復雜度,自適應選擇batch數目。同時,對于每個batch,加入了“不同batch間采樣率隨時間增加”機制。我們使用DNN模型對特征Embedding進行預訓練,遷移到新的數據批上進行再訓練,有效地緩解了概念漂移和增強了特征表達。

挑戰和改進

研究團隊表示,不同特征類型的處理是本次大賽最棘手的挑戰。

本次大賽數據由多種不同的數據類型組成,這些都是現實世界問題需要處理的真實數據。而現有的AutoML框架往往只支持數值類型,不能簡單將現有框架應用到這些現實數據中。研究人員通過以往的大量競賽及實際項目經驗,在特征工程處理上加入了大量的先驗知識,使得框架能支持不同特征類型的特征工程,以及能自動對這些不同類型特征做高階組合以及特征選擇。支持更多的數據類型而不僅僅是數值類型保證了AutoML能應用到更廣泛的現實問題中,大大增強了AutoML的實用性。

團隊表示,該解決方案有一些可以改進的方面:

首先,比賽所使用的數據僅來自于10個不同的任務,雖然我們在10個任務的數據集上都取得了很好的效果,但并不能保證我們的AutoML框架能應用到更廣泛的不同現實世界問題中。

其次,比賽所提供的都是單表數據,而現實中的問題往往是多表關聯的且關系復雜的,表間的關系往往包括多對多、一對多、多對一、一對一等多種關系。

為了更好地將AutoML應用到現實問題中,我們將設計并實現并實現支持多表聯結數據以及不同數據類型的AutoML框架,將該框架應用到更多現實世界問題的數據上進行測試。

終生自動化機器學習:AutoML對現實世界問題的意義

這次比賽將AutoML擴展到了多種不同的數據類型上,其目標是實現一個支持不同數據類型并能適應概念漂移的終生自動化機器學習。

首先,現實世界問題的數據往往是多種不同數據類型的,需要特定領域的專家對這些數據進行大量的預處理及特征工程,而現有的自動化機器學習框架又僅支持數值類型,對其他類型不能有很好的支持,很難應用到各種現實世界問題中。在這次比賽中,我們團隊設計的AutoML將自動化機器學習擴展到了多種數據類型,引入了不同類型的特征預處理以及不同類型特征的特征工程及特征組合,這樣能在不需要專家的干預下將AutoML應用到更多的現實世界問題中。

其次,許多現實世界問題數據是根據時間逐漸獲取的,數據間往往帶有概念漂移,并存在大量的類別不平衡問題,模型需要不停地重復訓練去適應概念漂移并需要專家去處理概念漂移及類別不平衡問題。我們團隊設計的框架通過融合不同時期的數據以及結合DNN和LightGBM的訓練來自適應概念漂移,引入了自適應采樣以及對梯度提升模型的采樣率進行改進來緩解類別不平衡,實現了終生機器學習。

我們設計的終生自動化機器學習框架可以應用到各種現實世界問題中,例如在推薦系統、異常檢測、在線廣告、欺詐檢測、運輸監控、計量經濟學、病人監控等諸多領域中,無需領域專家的干預,我們的框架可以訓練出一個性能高、時效性強、時間可行的模型,從而降低應用門檻,縮短項目開發周期,促進機器學習的大規模落地。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6685

    瀏覽量

    105734
  • 數據挖掘
    +關注

    關注

    1

    文章

    406

    瀏覽量

    24705
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134583

原文標題:PAKDD AutoML競賽結果出爐,冠軍方案關鍵技術解讀

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    潤和軟件穩居數字業務類解決方案市場第一名

    ”)憑借自身卓越的技術實力和創新能力,連續五年穩居數字業務類解決方案市場第一名;在細分領域:數字信貸系統解決方案子市場持續保持第一名,數字銀行解決方案子市場躍升至第一名。同時,其在開放銀行、交易銀行、智能營銷、智能風控、數據智能
    的頭像 發表于 07-14 17:36 ?376次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍,推動視頻畫質升級

    (NTIRE2025EfficientSuper-ResolutionChallenge)第一名,短視頻UGC圖像超分辨率挑戰賽(NTIRE2025Short-formUGCImageSuper-Reso
    的頭像 發表于 06-24 17:03 ?373次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰賽</b>冠亞軍,推動視頻畫質升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍

    Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰賽(NTIRE 2025 Short-form UGC Image Super-Resolution
    的頭像 發表于 06-24 16:08 ?856次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰賽</b>冠亞軍

    華為榮登GlobalData運營商基礎設施管理服務排名報告Leader象限第一名

    象限第一名。 報告對通信服務商從商業模式、解決方案、網絡設計與優化、網絡轉型能力、服務規模、和業務敏捷性六個維度進行了全面評估,華為綜合得分第一。這印證了華為在對全球運營商客戶提供領先服務解決方案、網絡極致性能和數智化轉型等方面做出了卓越
    的頭像 發表于 05-22 18:43 ?582次閱讀
    華為榮登GlobalData運營商基礎設施管理服務排名報告Leader象限<b class='flag-5'>第一名</b>

    芯華章持續助力EDA精英挑戰賽

    日前,2024中國研究生創“芯”大賽·EDA精英挑戰賽(以下簡稱EDA競賽)決賽在南京江北新區舉辦。今年EDA競賽首次升級為國,在全國超過500個參賽隊伍中,來自華南理工大學的"EDA240931參賽隊"從芯華章賽道脫穎而出,斬獲
    的頭像 發表于 12-17 15:47 ?869次閱讀

    達實再度榮獲十大出入口控制品牌第一名

    近日,被譽為智能建筑行業“奧斯卡”的中國智能建筑品牌獎頒獎典禮于廣州盛大舉行。達實智能子公司——深圳達實物聯網技術有限公司 連續14年 獲“十大出入口控制品牌第一名”榮譽,與此同時還攬獲“2024年優秀AIoT智控平臺品牌”等兩項大獎!
    的頭像 發表于 12-11 10:23 ?718次閱讀

    EDA精英挑戰賽果公布!思爾芯“戰隊”薪火相承斬獲“麒麟杯”

    2024中國研究生創芯大賽·EDA精英挑戰賽12月7-8日,2024中國研究生創芯大賽·EDA精英挑戰賽(原“集成電路EDA設計精英挑戰賽”)總決賽及頒獎典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發表于 12-11 01:03 ?937次閱讀
    EDA精英<b class='flag-5'>挑戰賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰隊”薪火相承<b class='flag-5'>斬獲</b>“麒麟杯”

    蔚來獲得CACSI車型滿意度和售后服務滿意度第一名

    近日,由中國質量協會發布的2024年中國新能源汽車用戶滿意度測評結果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務滿意度第一名。蔚來已連續兩年獲得
    的頭像 發表于 12-06 17:19 ?2008次閱讀

    理想L6和理想L8榮獲中國新能源汽車用戶滿意度測評第一名

    近日,中國質量協會發布2024年中國新能源汽車行業用戶滿意度測評(NEV-CACSI)結果,理想L6獲2024年市場關注新車(SUV) 第一名,理想L8也成為混動中大型SUV第一名。雙雙登頂,證明著
    的頭像 發表于 12-05 14:00 ?1078次閱讀

    2024年ICPC與華為挑戰賽冠軍杯圓滿落幕

    近日,2024年ICPC&華為挑戰賽冠軍杯在深圳圓滿落幕。該活動由華為和ICPC聯合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰性的工業界真實問題,并對未來技術發展趨勢及關鍵挑戰展開討論。今年的
    的頭像 發表于 10-27 16:00 ?1374次閱讀

    50萬獎金池!開放原子大賽——第二屆OpenHarmony創新應用挑戰賽正式啟動

    第二屆OpenHarmony創新應用挑戰賽作為開放原子大賽旗下的重要項,聚焦 OpenHarmony應用開發,致力提升開發者的動手實踐能力與開發創新應用的能力。 項要求開發者
    發表于 10-24 15:40

    思爾芯題正式發布,邀你共戰EDA精英挑戰賽

    題發布COMPETITIONRELEASE2024中國研究生創芯大賽·EDA精英挑戰賽(原“集成電路EDA設計精英挑戰賽”)現已正式拉開帷幕。作為核心出題企業之思爾芯(S2C),已
    的頭像 發表于 08-03 08:24 ?1109次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發布,邀你共戰EDA精英<b class='flag-5'>挑戰賽</b>!

    評測活動第一名李工:我用Jupiter畫了個原理圖,然后成了段子手…

    為昕邀請了這次參與Jupiter評測活動的第一名獲獎者李工@李工寫下評測感想,沒想到,是位工程師界的段子手——爆笑時刻到來→李工感想各位EDA界的老鐵們,聽我給你們吹個牛!最近我參加了為昕軟件試用
    的頭像 發表于 07-31 17:42 ?1110次閱讀
    評測活動<b class='flag-5'>第一名</b>李工:我用Jupiter畫了個原理圖,然后成了段子手…

    軟通動力榮獲2023年中國IT服務市場第一名

    近日,迪顧問最新發布《2023-2024年中國IT服務市場研究年度報告》。報告中,軟通動力憑借在數字化轉型浪潮中卓越的數字化能力和表現,持續領跑IT服務市場,位列2023年中國IT服務市場第一名
    的頭像 發表于 07-31 10:18 ?853次閱讀

    潤和軟件連續四年蟬聯數字業務類解決方案市場第一名

    ,連續四年蟬聯數字業務類解決方案市場第一名。在細分領域:數字信貸系統解決方案子市場持續保持第一名,數字銀行解決方案子市場穩居第二,開放銀行解決方案子市場上升至第三。 ? 數字業務類
    的頭像 發表于 07-31 10:10 ?1087次閱讀