女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基因組學大型語言模型在多項任務中均展現(xiàn)出卓越的性能和應用擴展空間

NVIDIA英偉達 ? 來源:未知 ? 2023-01-17 01:05 ? 次閱讀

InstaDeep、慕尼黑工業(yè)大學(TUM)和 NVIDIA 之間的合作推動了面向基因組學的多超級計算規(guī)模的基礎模型開發(fā)進程。這些模型在大量預測任務(例如啟動子和增強子位點預測)中展示了最先進的性能。

f0209c2e-95bd-11ed-bfe3-dac502259ad0.jpg

這一聯(lián)合團隊的研究指出,經(jīng)過基因組學訓練的大型語言模型(LLM)可將應用擴展到大量基因組學任務。

該團隊使用 NVIDIA 的超級計算機 Cambridge-1 來訓練參數(shù)規(guī)模從 500M 到 2.5B 不等的各種大型語言模型(LLM)。這些模型在各種基因組數(shù)據(jù)集上進行了訓練,以探索模型規(guī)模和數(shù)據(jù)多樣性對下游任務性能的影響。

分類任務包括預測增強子和啟動子序列以及轉(zhuǎn)錄因子結(jié)合位點。這些任務有助于了解 DNA 如何轉(zhuǎn)錄生成 RNA 和蛋白質(zhì),從而開啟新的臨床應用。

研究中明確了 20 項任務。對于每一項任務,性能都隨著模型規(guī)模和數(shù)據(jù)集多樣性的增加而單調(diào)遞增。參照專門的最新模型基線,在多物種數(shù)據(jù)集上訓練的具有最大參數(shù)規(guī)模(2.5B 參數(shù))的大型語言模型在 19 項任務中的 15 項中取得了同等或更高的性能。

這些結(jié)果是通過利用參數(shù)輕量化微調(diào)實現(xiàn)的。然而,即使依靠從 Transformer 模型各層提取的預訓練嵌入以及簡單的淺層感知器(MLP)或邏輯回歸,也足以在 11 個任務中實現(xiàn)同等乃至更高的性能。

在每個模型檢查點和每個任務的所有層上應用這種探測策略,訓練出了 120 萬個 MLP 模型。該研究對大型語言模型的訓練和使用等各方面進行了詳細分析,例如不同層對下游任務性能的影響。

在固定模型規(guī)模下直接比較序列多樣性,顯示出具有重要意義的性能提升,增加模型規(guī)模也是如此。例如,對于一個 500M 參數(shù)模型,僅在人類參考基因組上訓練的性能不如在 1000 基因組數(shù)據(jù)集上訓練的性能。

同樣,在 1000 基因組數(shù)據(jù)集上訓練的 2.5B 參數(shù)模型的性能優(yōu)于任何 500M 參數(shù)模型。而對于相同的模型,性能會遜于在自定義多物種數(shù)據(jù)集上訓練的結(jié)果,即使下游性能是在僅涉及人類基因組的任務上測量的。

研究人員觀察到,并非所有嵌入都是平等創(chuàng)建的。雖然通常的做法建議使用大型語言模型的最后一層進行下游預測。但耐人尋味的是,中間層產(chǎn)生的表征在下游任務中顯示出明顯更高的性能。研究人員發(fā)現(xiàn),最佳層的選擇取決于任務,表明不同類型的 DNA 特征被不同層的模型所捕獲。

InstaDeep 首席執(zhí)行官 Karim Beguir 表示:“我們相信這些結(jié)果首次清楚地證明了基因組學基礎模型的可行性,這些模型能夠真正地推廣到多項任務中。這些結(jié)果從很多方面反映出了過去幾年內(nèi)適應性基礎模型在自然語言處理方面的發(fā)展進程。如今,其應用于藥物研發(fā)和人類健康等如此具有挑戰(zhàn)性的問題,著實令人難以置信的興奮。”

NVIDIA 的 Cambridge-1 對該項目的成功至關重要。該項目需要高性能計算基礎設施來訓練具有捕獲基因組中遠程相互作用所需感受域的大型模型。

研究人員嘗試了多種方法、數(shù)據(jù)集大小、模型規(guī)模和分詞器方案,最終使用在 16 個 NVIDIA DGX A100 節(jié)點(128 個 A100 80GB GPU)上訓練的 2.5B 參數(shù)稀疏注意力模型,在多任務上實現(xiàn)了迄今公開發(fā)表的最佳性能。

在未來的研究工作中,該團隊計劃通過直接微調(diào)模型,探索進一步的下游任務性能改進,并將繼續(xù)在應用于基因組學的大型語言模型的架構(gòu)創(chuàng)新方面展開合作。InstaDeep 是首批使用 Cambridge-1 的 NVIDIA 初創(chuàng)加速計劃成員之一。

掃描下方海報二維碼,即可免費注冊 GTC 23,切莫錯過這場 AI 和元宇宙時代的技術大會


原文標題:基因組學大型語言模型在多項任務中均展現(xiàn)出卓越的性能和應用擴展空間

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3920

    瀏覽量

    93090

原文標題:基因組學大型語言模型在多項任務中均展現(xiàn)出卓越的性能和應用擴展空間

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    小白模型:從零實現(xiàn) LLM語言模型

    在當今人工智能領域,大型語言模型(LLM)的開發(fā)已經(jīng)成為一個熱門話題。這些模型通過學習大量的文本數(shù)據(jù),能夠生成自然語言文本,完成各種復雜的
    的頭像 發(fā)表于 04-30 18:34 ?305次閱讀
    小白<b class='flag-5'>學</b>大<b class='flag-5'>模型</b>:從零實現(xiàn) LLM<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    小白模型:訓練大語言模型的深度指南

    在當今人工智能飛速發(fā)展的時代,大型語言模型(LLMs)正以其強大的語言理解和生成能力,改變著我們的生活和工作方式。最近的一項研究
    的頭像 發(fā)表于 03-03 11:51 ?594次閱讀
    小白<b class='flag-5'>學</b>大<b class='flag-5'>模型</b>:訓練大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的深度指南

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    的 AI 處理效率,成為部署各類 AI 模型的關鍵依托。 憑借這些卓越的硬件性能,RK3588 開發(fā)板保持低功耗的同時,展現(xiàn)出強大的運算能
    發(fā)表于 02-14 17:42

    【「基于大模型的RAG應用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調(diào)技術解讀

    。通過微調(diào),模型可以學習特定領域的專業(yè)知識和語言特征,從而在高度專業(yè)化的領域中展現(xiàn)出卓越的表現(xiàn)。微調(diào)過程主要有這幾項內(nèi)容:數(shù)據(jù)清洗:消除噪聲、提高數(shù)據(jù)質(zhì)量。包括處理缺失值(如用特殊符號
    發(fā)表于 01-14 16:51

    NVIDIA 攜手行業(yè)領先機構(gòu)推動基因組學、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    ——NVIDIA 今日宣布新的合作伙伴關系,旨在通過加速藥物發(fā)現(xiàn)、提升基因組研究,以及利用代理式和生成式 AI 開創(chuàng)先進醫(yī)療服務,推動規(guī)模達 10 萬億美元的醫(yī)療健康與生命科學產(chǎn)業(yè)的變革。 ? AI、加速計算與生物數(shù)據(jù)的融合,正將醫(yī)療健康產(chǎn)業(yè)轉(zhuǎn)變?yōu)榇笠?guī)模的技術產(chǎn)業(yè)。醫(yī)療健康領域的領先機構(gòu)
    發(fā)表于 01-14 13:39 ?235次閱讀
    NVIDIA 攜手行業(yè)領先機構(gòu)推動<b class='flag-5'>基因組學</b>、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    Kimi發(fā)布視覺思考模型k1,展現(xiàn)卓越基礎科學能力

    色,其能力還成功擴展到了物理、化學等基礎科學領域。這標志著Kimi視覺思考模型的技術研發(fā)上取得了重大突破,為用戶多個學科領域提供了強大的支持。
    的頭像 發(fā)表于 12-17 09:59 ?693次閱讀

    NaVILA:加州大學與英偉達聯(lián)合發(fā)布新型視覺語言模型

    日前,加州大學的研究人員攜手英偉達,共同推出了一款創(chuàng)新的視覺語言模型——NaVILA。該模型機器人導航領域展現(xiàn)出了獨特的應用潛力,為智能機
    的頭像 發(fā)表于 12-13 10:51 ?589次閱讀

    NVIDIA AI助力日本制藥公司推進藥物研發(fā)

    制藥公司、醫(yī)療技術公司和學術研究人員正在開發(fā)主權 AI 能力,以驅(qū)動藥物發(fā)現(xiàn)、加速基因組學和醫(yī)療設備。
    的頭像 發(fā)表于 11-19 15:40 ?720次閱讀

    騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

    性能,標志著騰訊自然語言處理領域邁出了重要的一步。 據(jù)了解,Hunyuan-Large的總參數(shù)量高達389B(即3890億),這一數(shù)字遠超當前許多主流的大語言
    的頭像 發(fā)表于 11-06 10:57 ?641次閱讀

    AI大模型自然語言處理的應用

    海量的文本數(shù)據(jù),能夠生成結(jié)構(gòu)化、連貫的文本段落。 新聞寫作、創(chuàng)意內(nèi)容生成等場景,AI大模型展現(xiàn)出卓越的效果。例如,GPT系列
    的頭像 發(fā)表于 10-23 14:38 ?1279次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    NVIDIA Parabricks 擴大了 NVIDIA 利用深度學習解決基因組學挑戰(zhàn)的范圍,持續(xù)推動基因組學儀器的發(fā)展。NVIDIA Parabricks v4.3.1 歐洲人類遺傳學
    的頭像 發(fā)表于 09-10 10:22 ?679次閱讀
    NVIDIA Parabricks v4.3.1版本的新功能

    通義千問發(fā)布第二代視覺語言模型Qwen2-VL

    。Qwen2-VL系列模型多模態(tài)處理領域取得了突破性進展,于多個權威測評嶄露頭角,刷新了多項最佳成績記錄,展現(xiàn)出強大的視覺理解與
    的頭像 發(fā)表于 09-03 16:31 ?790次閱讀

    Transformer語言模型簡介與實現(xiàn)過程

    自然語言處理(NLP)領域,Transformer模型以其卓越性能和廣泛的應用前景,成為了近年來最引人注目的技術之一。Transform
    的頭像 發(fā)表于 07-10 11:48 ?2808次閱讀

    中國科技巨頭紛紛展現(xiàn)出對NVIDIA H20芯片的采購意向

    最新來自摩根士丹利的報告指出,NVIDIA專為中國市場定制的H20系列人工智能芯片,正逐漸贏得中國科技巨頭如百度、阿里巴巴、騰訊及字節(jié)跳動等企業(yè)的青睞,這些企業(yè)紛紛展現(xiàn)出對H20系列的采購意向。
    的頭像 發(fā)表于 07-05 14:30 ?1058次閱讀

    神經(jīng)網(wǎng)絡自然語言處理的應用

    自然語言處理(NLP)是人工智能領域中的一個重要分支,它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術的飛速發(fā)展,神經(jīng)網(wǎng)絡自然語言處理
    的頭像 發(fā)表于 07-01 14:09 ?829次閱讀