女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

極鏈科技HPAIC人類蛋白質(zhì)圖譜分類挑戰(zhàn)賽金牌經(jīng)驗分享

張康康 ? 2019-07-29 18:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,由Kaggle主辦,Leica Microsystems和NVIDIA贊助的HPAIC(Human Protein Atlas Image Classification)競賽正式結(jié)束。比賽為期三個月,共有來自全球的2236個隊伍參加,極鏈AI研究院與工程院最終獲得挑戰(zhàn)賽金牌。

比賽介紹

蛋白質(zhì)是人體細(xì)胞中的“行動者”,執(zhí)行許多共同促進(jìn)生命的功能。蛋白質(zhì)的分類僅限于一種或幾種細(xì)胞類型中的單一模式,但是為了完全理解人類細(xì)胞的復(fù)雜性,模型必須在一系列不同的人類細(xì)胞中對混合模式進(jìn)行分類。

可視化細(xì)胞中蛋白質(zhì)的圖像通常用于生物醫(yī)學(xué)研究,這些細(xì)胞可以成為下一個醫(yī)學(xué)突破的關(guān)鍵。然而,由于高通量顯微鏡的進(jìn)步,這些圖像的生成速度遠(yuǎn)遠(yuǎn)超過人工評估的速度。因此,對于自動化生物醫(yī)學(xué)圖像分析以加速對人類細(xì)胞和疾病的理解,需要比以往更大的需求。

雖然這是生物學(xué)方面的競賽,但是其本質(zhì)是機器視覺方向的圖像多標(biāo)簽分類問題,參賽隊伍也包括許多機器視覺和機器學(xué)習(xí)領(lǐng)域的競賽專家。

數(shù)據(jù)分析

官方給我們提供了兩種類型的數(shù)據(jù)集,一部分是512x512的png圖像,一部分是2048x2048或3072x3072的TIFF圖像,數(shù)據(jù)集大概 268G, 其中訓(xùn)練集:31072 x 4張,測試集:11702 x 4張。

一個蛋白質(zhì)圖譜由4種染色方式組成(red,green,blue,yellow),圖像示例如下:


我們將4個通道合并成3通道(RYB)可視化的圖像如下所示:


在本次競賽中一共有28個類別,比如 Nucleoplasm、Nuclear membrane等,每個圖譜圖像都可以有一個或者多個標(biāo)簽。標(biāo)簽數(shù)量統(tǒng)計如下:

e0892ea8aa624602a2bf616a52be54bb


可以發(fā)現(xiàn)標(biāo)簽數(shù)量集中在1-3個,但是仍然會有圖像有5個標(biāo)簽,給比賽增加了一定的難度。

a700719ec2bf4704a9649d0bd424bed7


另一方面的難點是數(shù)據(jù)集中樣本數(shù)量很不均勻,圖像最多的類別有12885張,而圖像最少的類別只有11張圖像,這給競賽造成很大的困難,樣本數(shù)量分布情況可以在圖中看出。

在比賽過程中逐步有參賽者發(fā)現(xiàn)官方的額外數(shù)據(jù)集HPAv18,并得到官方授權(quán),這些數(shù)據(jù)集有105678張,很大程度的擴(kuò)大了樣本數(shù)量,同時給我們提供了很大的幫助。

環(huán)境資源

硬件方面我們使用了4塊NVIDIA TESLA P100顯卡,使用pytorch作為我們的模型訓(xùn)練框架。

圖像預(yù)處理

HPAv18 圖像與官方給出的圖像有一定的差別,雖然也是由4中染色方式組成,但是每個染色圖像是一個RGB圖像,而不是官方的單通道圖像,而且RGB三個通道的值差別較大,我們對這些圖像做了預(yù)處理,對每個RGB圖像只取一個通道(r_out=r,g_out=g,b_out=b,y_out=b),并將這些圖像縮放到512x512和1024x1024兩種尺度。

36a79fb3e91c487aacddb96586f6eb85


對于TIFF文件,我們用了一周的時間把這個數(shù)據(jù)集下載下來,然后將所有圖像縮放到1024x1024。

數(shù)據(jù)增廣

我們比賽中使用的增廣方式有Rotation, Flip 和 Shear三種;因為我們不知道一張圖像中的多個細(xì)胞之間是否有關(guān)聯(lián)關(guān)系,所以比賽中沒有使用隨機裁剪的增廣方式。

模型

我們最終使用的基礎(chǔ)模型有Inceptionv3,Inceptionv4以及Xception三種,比賽前期我們測試了VGG,ResNet,ResNext,SeNet,但是效果不是很好,因此比賽末期沒有再進(jìn)行進(jìn)一步測試。

我們使用了512,650和800三種尺度來增加網(wǎng)絡(luò)對圖像的理解,另外每個尺度進(jìn)行10折交叉驗證,保證驗證集的劃分對網(wǎng)絡(luò)整體的影響,以及用驗證集來評估模型預(yù)測的好壞和選擇模型及其對應(yīng)的參數(shù)。不同模型交叉驗證時使用不同的隨機種子劃分驗證集和訓(xùn)練集,以盡可能多的學(xué)到不同的樣本組合。

Inceptionv3和Inceptionv4的512的結(jié)果不好(0.55+ public leaderboard 閾值0.15),因此沒有做交叉驗證,只是用512尺度訓(xùn)練了基礎(chǔ)模型,并用在650和800的微調(diào)中。

模型修改:

1.第一層卷積的輸入通道數(shù)由3修改為4,保持其他卷積參數(shù)不變,從而使網(wǎng)絡(luò)應(yīng)對4通道輸入;

2.修改最后一的池化層為全局池化層,保證在多尺度時可以使用同一個網(wǎng)絡(luò);

3.全局池化后增加一層128的全連接,然后接一層28的全連接。

訓(xùn)練

訓(xùn)練過程的參數(shù)如下:

loss: MultiLabelSoftMarginLoss

lr: 0.05(512,imagenet 預(yù)訓(xùn)練),0.01(650和800,512預(yù)訓(xùn)練);

lrscheduler: steplr(gamma=0.1,step=6)

optimizer: SGD (adam,rms not well)

epochs: 25, 600和800一般在12-20直接提前結(jié)束,取loss最低的模型

10 folds CV

sampling weights:[1.0, 5.97, 2.89, 5.75, 4.64, 4.27, 5.46, 3.2, 14.48, 14.84, 15.14, 6.92, 6.86, 8.12, 6.32, 19.24, 8.48, 11.93, 7.32, 5.48, 11.99, 2.39, 6.3, 3.0, 12.06, 1.0, 10.39, 16.5]

scale:512,600,800

獨立閾值

為每一個類別找到一個合適的閾值是一件很困難的事,但是多閾值是提升分?jǐn)?shù)的關(guān)鍵,對我來說,大概可以提升0.005~0.008。 我們使用驗證集來找閾值,我們訓(xùn)練單模型xception 512 ,驗證集占13%。調(diào)整每一類的閾值使得f1 score達(dá)到最優(yōu),不過我們發(fā)現(xiàn)稀有類別的閾值普遍很高,public lb會變差,因此我們只調(diào)整了驗證集1000張以上的類別,稀有類別控制閾值為0.15 通過這種方法找到的閾值在其他模型或者集成的時候同樣有效。

測試

比賽結(jié)束以后我們將比賽中訓(xùn)練的模型重新提交查看private leaderboard成績,得到如下結(jié)果:

1e6631091f804c019babf0d6794da072


比賽過程中我們發(fā)現(xiàn)做了10 fold ensemble不一定比single fold好,因此我們在最終集成的時候部分模型只選擇了部分fold (根據(jù)loss選擇)。

檢索

我們使用檢索的方法(特征使用inceptionv4 800 的128維特征)查找test與hpa相似的圖片,使用余弦相似度進(jìn)行度量,我們發(fā)現(xiàn)了許多相似的甚至相同的圖片,直接使用相似度最高的300張圖片的結(jié)果進(jìn)行替換,分?jǐn)?shù)在public lb上提升0.01~0.015,不過在private LB中并沒有效果,官方在比賽過程中也說明部分test圖像由于與HPA中部分圖像重合,不再進(jìn)行分?jǐn)?shù)計算。

集成

我們將inceptionv3 inceptionv4以及xception 800的10fold 模型的特征進(jìn)行concat(先進(jìn)行l(wèi)2),得到3840維的新特征,并在此基礎(chǔ)上設(shè)計了2層的全連接網(wǎng)絡(luò)進(jìn)行訓(xùn)練, 并做10 fold CV,訓(xùn)練過程中使用不容參數(shù)訓(xùn)練過程如圖所示,我們?nèi)×薼oss最低的參數(shù)。結(jié)果融合后private lb:0.55150 public lb:0.62791。

8a9bab29851c4bebb78a2413694541f5


雖然上面方法在public lb上分?jǐn)?shù)較高,但是當(dāng)與其他模型結(jié)果融合時,public LB的分?jǐn)?shù)反而降了,因此我們降低了這個模型的權(quán)重。

最后的結(jié)果是通過加權(quán)融合的方式得到的,權(quán)重根據(jù)模型的public lb分?jǐn)?shù)設(shè)置, inceptionv4 800和inceptionv3 800的權(quán)重最高,xception 650 最低,同時也用到了inceptionv4、xception其他尺度的部分fold。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35137

    瀏覽量

    279797
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器挑戰(zhàn)賽

    安富利旗下社區(qū) e絡(luò)盟攜手 TDK 發(fā)起新的設(shè)計挑戰(zhàn)賽,誠邀工程師、創(chuàng)客及技術(shù)愛好者利用 TDK 防水超聲波測距傳感器開發(fā)創(chuàng)新項目,供實際應(yīng)用使用。
    的頭像 發(fā)表于 03-11 10:09 ?544次閱讀
    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器<b class='flag-5'>挑戰(zhàn)賽</b>

    華為依托昇騰AI打造蛋白結(jié)構(gòu)預(yù)測工具

    蛋白質(zhì)結(jié)構(gòu)預(yù)測一直是“21世紀(jì)的生物物理學(xué)”最重要的課題之一,北京昌平實驗室聯(lián)合伙伴基于全場景AI框架“昇思MINDSPORE”開發(fā)的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型在CAMEO競賽拿下第一并霸榜四周,填補了中國AI基礎(chǔ)軟硬件在蛋白質(zhì)結(jié)構(gòu)預(yù)測
    的頭像 發(fā)表于 03-03 13:52 ?485次閱讀

    平頭哥半導(dǎo)體亮相AICAS 2025挑戰(zhàn)賽技術(shù)研討會

    近日,歷時兩個多月,600余支參賽隊伍激烈角逐,AICAS 2025全球技術(shù)挑戰(zhàn)賽初賽階段賽程已順利結(jié)束,中技術(shù)研討于2月22日在杭州圓滿召開。本次研討會作為AICAS全球技術(shù)挑戰(zhàn)賽的重要環(huán)節(jié),在初賽和復(fù)賽之間架起橋梁,為參賽
    的頭像 發(fā)表于 02-25 11:23 ?709次閱讀

    微軟AI開發(fā)者挑戰(zhàn)賽即將開啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴一場聚焦 AI 技術(shù)的開發(fā)者挑戰(zhàn)賽!在這里,創(chuàng)意、技術(shù)和無限可能將碰撞出耀眼火花。無論你是開發(fā)新秀還是經(jīng)驗豐富的技術(shù)專家,這場由微軟 Azure 驅(qū)動的在線競賽,將為你打開一扇通往未來的大門。
    的頭像 發(fā)表于 02-12 16:18 ?444次閱讀

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA競賽)決賽在南京江北新區(qū)舉辦。今年EDA競賽首次升級為國,在全國超過500個參賽隊伍中,來自華南理工大學(xué)的"EDA240931參賽隊"從芯華章賽道脫穎而出,斬獲僅有2支隊伍能獲得的菁英杯大獎,祝賀!
    的頭像 發(fā)表于 12-17 15:47 ?870次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊”薪火相承斬獲“麒麟杯”

    2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計精英挑戰(zhàn)賽”)總決賽及頒獎典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發(fā)表于 12-11 01:03 ?943次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊”薪火相承斬獲“麒麟杯”

    e絡(luò)盟社區(qū)攜手恩智浦發(fā)起智能空間樓宇自動化挑戰(zhàn)賽

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟社區(qū)與恩智浦聯(lián)合發(fā)起圍繞智能空間樓宇自動化設(shè)計的全新挑戰(zhàn)賽。本次挑戰(zhàn)賽邀請工程師和技術(shù)愛好者利用恩智浦FRDM MCX A 系列(A15X)開發(fā)套件,開發(fā)創(chuàng)新的解決方案。
    的頭像 發(fā)表于 11-14 10:44 ?549次閱讀
    e絡(luò)盟社區(qū)攜手恩智浦發(fā)起智能空間樓宇自動化<b class='flag-5'>挑戰(zhàn)賽</b>

    2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿落幕

    近日,2024年ICPC&華為挑戰(zhàn)賽冠軍杯在深圳圓滿落幕。該活動由華為和ICPC聯(lián)合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰(zhàn)性的工業(yè)界真實問題,并對未來技術(shù)發(fā)展趨勢及關(guān)鍵挑戰(zhàn)展開討論。今年的
    的頭像 發(fā)表于 10-27 16:00 ?1381次閱讀

    PI助力aCentauri車隊在太陽能車挑戰(zhàn)賽中大放異彩

    在2023年10月,Power Integrations (PI) 為當(dāng)時舉行的普利司通世界太陽能車挑戰(zhàn)賽提供了先進(jìn)的技術(shù)和支持。
    的頭像 發(fā)表于 10-27 14:08 ?715次閱讀
    PI助力aCentauri車隊在太陽能車<b class='flag-5'>挑戰(zhàn)賽</b>中大放異彩

    50萬獎金池!開放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動

    第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽作為開放原子大賽旗下的重要項,聚焦 OpenHarmony應(yīng)用開發(fā),致力提升開發(fā)者的動手實踐能力與開發(fā)創(chuàng)新應(yīng)用的能力。 項要求開發(fā)者
    發(fā)表于 10-24 15:40

    差示掃描量熱儀測試蛋白質(zhì)的應(yīng)用案例

    過程中可能出現(xiàn)的吸熱或放熱峰,這些峰對應(yīng)于角蛋白分子的運動、微纖維的熔融、或蛋白質(zhì)的變性等現(xiàn)象。 ? ?通過對比受延展和熱處理前后的DSC曲線,研究人員可以了解這些處理對角蛋白復(fù)合物
    的頭像 發(fā)表于 10-09 15:45 ?592次閱讀
    差示掃描量熱儀測試<b class='flag-5'>蛋白質(zhì)</b>的應(yīng)用案例

    創(chuàng)客中國AIGC專題冠軍天鶩科技:AI蛋白質(zhì)設(shè)計引領(lǐng)者

    源自自然的蛋白質(zhì)與現(xiàn)代科技的創(chuàng)新精神相結(jié)合,打造蛋白質(zhì)設(shè)計與應(yīng)用的新范式。”在江西南昌舉辦的第九屆“創(chuàng)客中國”生成式人工智能(AIGC)中小企業(yè)創(chuàng)新創(chuàng)業(yè)大賽中,上海天鶩科技有限公司(下稱“天鶩科技”)分享了這一理念。 天鶩科技是
    的頭像 發(fā)表于 09-18 12:04 ?669次閱讀
    創(chuàng)客中國AIGC專題<b class='flag-5'>賽</b>冠軍天鶩科技:AI<b class='flag-5'>蛋白質(zhì)</b>設(shè)計引領(lǐng)者

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)集

    在一年一度的 AI 城市挑戰(zhàn)賽中,來自世界各地的數(shù)百支參賽隊伍在 NVIDIA Omniverse 生成的基于物理學(xué)的數(shù)據(jù)集上測試了他們的 AI 模型。
    的頭像 發(fā)表于 09-09 10:04 ?889次閱讀

    EvolutionaryScale推出基于NVIDIA GPU模型的新型蛋白質(zhì)研究方案

    EvolutionaryScale 于 6 月 25 日發(fā)布了第三代 ESM 模型 ESM3,該模型可同時對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理,為蛋白質(zhì)研發(fā)工程師提供了一個可編程的平臺。
    的頭像 發(fā)表于 08-23 16:45 ?1070次閱讀

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽

    題發(fā)布COMPETITIONRELEASE2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計精英挑戰(zhàn)賽”)現(xiàn)已正式拉開帷幕。作為核心出題企業(yè)之一思爾芯(S2C),已經(jīng)為你們準(zhǔn)備了
    的頭像 發(fā)表于 08-03 08:24 ?1112次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!