女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)大規(guī)模多任務(wù)學(xué)習(xí)框架μ2Net

OpenCV學(xué)堂 ? 來源:新智元 ? 作者:新智元 ? 2022-07-21 10:19 ? 次閱讀

【導(dǎo)讀】谷歌大神Jeff Dean最近親自操刀發(fā)新作,提出了一個(gè)大規(guī)模多任務(wù)學(xué)習(xí)框架μ2Net,基本把各大數(shù)據(jù)集多任務(wù)學(xué)習(xí)的SOTA刷了個(gè)遍,但這次為何網(wǎng)友有點(diǎn)不買賬了?很簡單,差錢。

2021年10月,Jeff Dean親自撰文介紹了一個(gè)全新的機(jī)器學(xué)習(xí)架構(gòu)——Pathways。 目的很簡單,就是讓一個(gè)AI能夠跨越數(shù)以萬計(jì)的的任務(wù),理解不同類型的數(shù)據(jù),并同時(shí)以極高的效率實(shí)現(xiàn):

15b2e4ce-083d-11ed-ba43-dac502259ad0.gif

在大半年之后的2022年3月,Jeff Dean終于發(fā)布了Pathways的論文。

15e0d01e-083d-11ed-ba43-dac502259ad0.png

論文連接:https://arxiv.org/abs/2203.12533 其中,補(bǔ)充了不少技術(shù)上的細(xì)節(jié),比如最基本的系統(tǒng)架構(gòu)等等。

15ef2556-083d-11ed-ba43-dac502259ad0.png

2022年4月,谷歌用Pathways的PaLM語言模型橫空出世,接連打破多項(xiàng)自然語言處理任務(wù)的SOTA,這個(gè)擁有5400億參數(shù)的Transformer語言模型再次證明了「大力出奇跡」。 除了用到強(qiáng)大的Pathways系統(tǒng)外,論文中介紹PaLM的訓(xùn)練用到了6144個(gè)TPU v4,使用了7800億token的高質(zhì)量數(shù)據(jù)集,并且其中有一定比例的非英文多語種語料。

160c07e8-083d-11ed-ba43-dac502259ad0.png

論文地址:https://arxiv.org/abs/2204.02311 最近,Jeff Dean一篇新作又引發(fā)了大家對(duì)Pathways的猜測(cè)。

Pathways的拼圖又合上了一塊?

這篇論文的作者只有兩位:大名鼎鼎的Jeff Dean和來自意大利的工程師Andrea Gesmundo。 有趣的是,不僅Gesmundo很低調(diào),而且前兩天剛吹完自家Imagen的Jeff Dean也完全沒有在推特上提及此事。 而有網(wǎng)友拜讀之后推測(cè),這可能是下一代AI架構(gòu)Pathways的組成部分。

161a3020-083d-11ed-ba43-dac502259ad0.png

論文地址:https://arxiv.org/abs/2205.12755 本文的思路是這樣的: 通過動(dòng)態(tài)地將新任務(wù)納入一個(gè)大型運(yùn)行系統(tǒng),可以利用稀疏多任務(wù)機(jī)器學(xué)習(xí)模型的碎片,來實(shí)現(xiàn)新任務(wù)質(zhì)量的提升,并可以在相關(guān)任務(wù)之間自動(dòng)分享模型的碎片。 這種方法可以提高每個(gè)任務(wù)的質(zhì)量,并在收斂時(shí)間、訓(xùn)練實(shí)例數(shù)量、能源消耗等方面提高模型效率。本文提出的機(jī)器學(xué)習(xí)問題框架,可以視作標(biāo)準(zhǔn)多任務(wù)和持續(xù)學(xué)習(xí)形式化的概括和綜合。 在這個(gè)框架下,再大的任務(wù)集都可以被聯(lián)合解決。 而且,隨著時(shí)間的推移,任務(wù)集中可以加入連續(xù)的新任務(wù)流來實(shí)現(xiàn)擴(kuò)展。預(yù)訓(xùn)練任務(wù)和下游任務(wù)之間的區(qū)別也不存在了。 因?yàn)椋S著新任務(wù)的加入,系統(tǒng)會(huì)尋找如何將已有的知識(shí)和表征與新的模型能力相結(jié)合,以實(shí)現(xiàn)每個(gè)新任務(wù)的高質(zhì)量水平。在解決一個(gè)新任務(wù)時(shí)獲得的知識(shí)和學(xué)到的表征,也可用于任何未來的任務(wù),或繼續(xù)學(xué)習(xí)現(xiàn)有任務(wù)。 這個(gè)方法名為「突變多任務(wù)網(wǎng)絡(luò)」或μ2Net。(μ=Mutation)

1627a9bc-083d-11ed-ba43-dac502259ad0.png

用于大規(guī)模持續(xù)學(xué)習(xí)實(shí)驗(yàn)的兩類突變模型 簡單說,就是生成一個(gè)大規(guī)模的多任務(wù)網(wǎng)絡(luò),去聯(lián)合解決多個(gè)任務(wù)。不僅每個(gè)任務(wù)的質(zhì)量和效率都獲得了提升,還可以通過動(dòng)態(tài)增加新的任務(wù)來實(shí)現(xiàn)模型的擴(kuò)展。 通過對(duì)以前任務(wù)的學(xué)習(xí),嵌入到系統(tǒng)中的知識(shí)積累越多,后續(xù)任務(wù)的解決方案的質(zhì)量就越高。 此外,在減少每個(gè)任務(wù)新添加的參數(shù)方面,新任務(wù)的解決效率可以不斷提高。生成的多任務(wù)模型是稀疏激活的,模型集成了基于任務(wù)的路由機(jī)制,隨著模型的擴(kuò)展,保證每個(gè)任務(wù)的計(jì)算成本的上升是有界限的。

16330ffa-083d-11ed-ba43-dac502259ad0.png

每個(gè)任務(wù)激活的和增加的參數(shù)占多任務(wù)系統(tǒng)參數(shù)總數(shù)的百分比 從每個(gè)任務(wù)學(xué)到的知識(shí)被分割成可以被多個(gè)任務(wù)重用的部分。實(shí)驗(yàn)證明,這種分塊技術(shù)避免了多任務(wù)和持續(xù)學(xué)習(xí)模型的常見問題,如災(zāi)難性遺忘、梯度干擾和負(fù)遷移。 對(duì)任務(wù)路線空間的探索和對(duì)每個(gè)任務(wù)最相關(guān)的先驗(yàn)知識(shí)子集的識(shí)別是由一個(gè)進(jìn)化算法引導(dǎo)的,該算法旨在動(dòng)態(tài)地調(diào)整探索/利用的平衡,而不需要手動(dòng)調(diào)整元參數(shù)。同樣的進(jìn)化邏輯被用于動(dòng)態(tài)調(diào)整超參數(shù)多任務(wù)模型組件。

16461cd0-083d-11ed-ba43-dac502259ad0.gif

既然叫「突變網(wǎng)絡(luò)」,這個(gè)突變是怎么解釋的? 深度神經(jīng)網(wǎng)絡(luò)通常由架構(gòu)和超參數(shù)來定義。本文中的架構(gòu)是由一連串的神經(jīng)網(wǎng)絡(luò)層組成的。每個(gè)層將輸入向量映射到一個(gè)可變維度的輸出向量,網(wǎng)絡(luò)實(shí)例化的細(xì)節(jié),比如優(yōu)化器或數(shù)據(jù)預(yù)處理的配置,則由超參數(shù)確定。 所以這里講的突變也分為兩類,層克隆突變和超參數(shù)突變。 層克隆突變創(chuàng)建了一個(gè)可以被子模型訓(xùn)練的任何父模型圖層的副本。如果父模型的某層沒有被選中進(jìn)行克隆,會(huì)凍結(jié)當(dāng)前狀態(tài)并與子模型共享,以保證預(yù)先存在的模型的不變性。 超參數(shù)突變則用于修改子層從父層繼承的配置。每個(gè)超參數(shù)的新值可以從一組有效值中抽取。對(duì)于數(shù)字超參數(shù),有效值集被排序?yàn)橐粋€(gè)列表,采樣時(shí)僅限于相鄰值,以應(yīng)用一個(gè)增量變化約束。 來看看實(shí)際效果如何:

16645286-083d-11ed-ba43-dac502259ad0.png

在ImageNet 2012、cifar100、cifar10三個(gè)數(shù)據(jù)集上,μ2Net在5任務(wù)迭代、10任務(wù)迭代后的表現(xiàn)均超過了當(dāng)前最通用和性能最好的ViT預(yù)訓(xùn)練微調(diào)模型。 在任務(wù)擴(kuò)展方面,在加入VTAB-full和VDD持續(xù)學(xué)習(xí)任務(wù)后,μ2Net性能表現(xiàn)獲得進(jìn)一步提升,在cifar10數(shù)據(jù)集上的VDD持續(xù)學(xué)習(xí)任務(wù)表現(xiàn)達(dá)到了99.43%的最佳成績。

1686974c-083d-11ed-ba43-dac502259ad0.png

在多任務(wù)字符分類基準(zhǔn)任務(wù)上,在兩次任務(wù)迭代后,μ2Net在大部分?jǐn)?shù)據(jù)集上刷新了SOTA水平,數(shù)據(jù)集規(guī)模由2.5k到240k樣本容量不等。

16baac6c-083d-11ed-ba43-dac502259ad0.png

簡單來說,在這個(gè)架構(gòu)之下,模型學(xué)習(xí)的任務(wù)越多,系統(tǒng)學(xué)到的知識(shí)就越多,也就越容易解決新的任務(wù)。 比如,一個(gè)ViT-L架構(gòu)(3.07億個(gè)參數(shù))可以演變成一個(gè)具有1308.7億個(gè)參數(shù)的多任務(wù)系統(tǒng),并解決69個(gè)任務(wù)。 此外,隨著系統(tǒng)的增長,參數(shù)激活的稀疏性使每個(gè)任務(wù)的計(jì)算量和內(nèi)存用量保持不變。實(shí)驗(yàn)表面,每個(gè)任務(wù)平均增加的參數(shù)減少了38%,而多任務(wù)系統(tǒng)只激活了每個(gè)任務(wù)總參數(shù)的2.3%。 當(dāng)然,在這一點(diǎn)上,它只是一個(gè)架構(gòu)和初步實(shí)驗(yàn)。

網(wǎng)友:論文很好,但……

雖然論文很棒棒,但好像有人不買賬。 有些熱愛戳穿皇帝新衣的網(wǎng)友,在reddit上發(fā)帖,稱他再也不相信愛情……哦不,「頂級(jí)實(shí)驗(yàn)室/研究機(jī)構(gòu)」出品的AI論文了。 這位ID為「Acurite先生」的網(wǎng)友稱,他自然相信這些論文里的數(shù)據(jù)與模型運(yùn)行結(jié)果。 但,就拿Jeff Dean老師的這篇論文來說吧,18頁的論文說了特別復(fù)雜的進(jìn)化卷積與多任務(wù)學(xué)習(xí)算法,厲害,亮眼,好頂贊。 不過,有兩點(diǎn)不得不提出: 第一,Jeff Dean們?cè)谡撐闹刑岢龅淖C明自己勝過競品的跑分結(jié)果,是CIFAR-10基準(zhǔn)測(cè)試準(zhǔn)確度99.43,勝過了當(dāng)前SOTA的99.40…… 也不能說這是忽悠,但真的很讓人難以措辭形容。

16d7817a-083d-11ed-ba43-dac502259ad0.png

第二,論文末尾有用TPU跑算法得出最終結(jié)果的時(shí)間耗費(fèi)表,總計(jì)17810小時(shí)。 假設(shè)有人不在谷歌干、又想復(fù)現(xiàn)論文結(jié)果,按照每小時(shí)3.22美元的市價(jià)租TPU來再跑一次,那花費(fèi)就是57348美元。 有啥意思呢?連日常論文都要設(shè)置鈔能力門檻了嗎? 當(dāng)然,這種做派現(xiàn)在是業(yè)界風(fēng)氣,包括但不限于谷歌、OpenAI這些大玩家。大家都往模型里灌少少改進(jìn)現(xiàn)狀的創(chuàng)意、和多多的預(yù)處理數(shù)據(jù)與基準(zhǔn)。 然后,只要運(yùn)行結(jié)果在數(shù)值上比對(duì)家高出哪怕百分點(diǎn)后的小數(shù)點(diǎn)后二位,研究者也可以理直氣壯地在簡歷上新增一行論文題目啦! 這么搞,對(duì)學(xué)界和業(yè)界有啥真的推動(dòng)?普通研究生又花不起錢來驗(yàn)證你的結(jié)論,普通企業(yè)又沒法在項(xiàng)目里使用這么無聊的跑分。 還是那句話,有啥意思呢? 這難道就是AI界的可接受舒適區(qū)么?一小撥大企業(yè)、和偶爾的頂尖學(xué)校,天天炫耀我有錢可以為所欲為、你沒錢只好跟后面吃灰? 這么玩下去,干脆另開個(gè)計(jì)算機(jī)學(xué)期刊,專收那些結(jié)果可以在消費(fèi)級(jí)單機(jī)顯卡上八小時(shí)跑出復(fù)現(xiàn)的論文算了。 跟帖里,有論文任務(wù)的研究生們紛紛訴苦。 有位ID是「支持向量機(jī)」的網(wǎng)友說,自己是小型實(shí)驗(yàn)室里的從業(yè)者,因?yàn)檫@個(gè)勢(shì)頭,已經(jīng)快完全喪失繼續(xù)搞深度學(xué)習(xí)的動(dòng)力了。 因?yàn)榭孔约簩?shí)驗(yàn)室的預(yù)算,根本沒法和這些巨無霸比,出不了鈔能力打底的跑分結(jié)果。 即使你有個(gè)理論上的新點(diǎn)子,要寫成能過評(píng)議的論文也難。因?yàn)楝F(xiàn)在論文評(píng)議人里,被大廠的鈔能力養(yǎng)出了「美圖偏見」,論文里用來測(cè)試的圖像不好看,一切白搭。 不是說巨無霸大廠一無是處啊,GPT和DALL-E這些項(xiàng)目真的是開天辟地。但如果我自己的機(jī)器跑不動(dòng),我激動(dòng)個(gè)啥呢。 另有一個(gè)博士生網(wǎng)友現(xiàn)身說法,跟帖佐證「支持向量機(jī)」。 博士生前兩年遞交了一份關(guān)于流模型的論文,主要著重于發(fā)現(xiàn)可采樣的數(shù)據(jù)潛在空間,對(duì)模型的圖片生成質(zhì)量沒影響。 結(jié)果論文打分人給的批評(píng)意見是:「生成的圖像看起來不如用GAN生成的好」。 另一個(gè)ID叫「烏代」的研究生也說,2021年他提交的參加會(huì)議論文,打分人給的批評(píng)意見是:「數(shù)據(jù)不夠花哨。」

173f935a-083d-11ed-ba43-dac502259ad0.png

看來人力不敵鈔能力,真是東西心理攸同、中外道術(shù)未裂的世界性趨勢(shì)。 不過三十年河?xùn)|、三十年河西,說不定算法草根化、全民大寫碼,會(huì)帶來第二次車庫創(chuàng)業(yè)企業(yè)打敗IBM的奇跡呢。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    404

    瀏覽量

    17787
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8490

    瀏覽量

    134080
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1222

    瀏覽量

    25275

原文標(biāo)題:Jeff Dean大規(guī)模多任務(wù)學(xué)習(xí)SOTA遭吐槽,復(fù)現(xiàn)一遍要6萬美元!

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    快速入門——LuatOS:sys庫多任務(wù)管理實(shí)戰(zhàn)攻略!

    的開發(fā)者,這里將用最簡明的步驟,助你輕松實(shí)現(xiàn)多任務(wù)應(yīng)用開發(fā)! sys庫是LuatOS的核心系統(tǒng)調(diào)度庫,它基于Lua協(xié)程機(jī)制實(shí)現(xiàn)了實(shí)時(shí)多任務(wù)調(diào)度、定時(shí)器管理以及消息通信等功能。 在詳細(xì)介紹sys庫之前,我們先來補(bǔ)充些關(guān)于實(shí)時(shí)操作
    的頭像 發(fā)表于 05-29 14:36 ?86次閱讀
    快速入門——LuatOS:sys庫<b class='flag-5'>多任務(wù)</b>管理實(shí)戰(zhàn)攻略!

    薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊真值表,薄型、多頻段、
    發(fā)表于 05-15 18:32
    薄型、多頻段、<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)前端模塊 skyworksinc

    5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝真值表,5G
    發(fā)表于 04-11 15:21
    5G <b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    STM32如何移植Audio框架

    最近在學(xué)習(xí)音頻解碼,想用下Audio框架。 1、這個(gè)該如何移植到自己創(chuàng)建的BSP并對(duì)接到device框架中?看了官方移植文檔沒有對(duì)沒有對(duì)該部分的描述。
    發(fā)表于 04-01 08:08

    .NET開發(fā)者必看:JetBrains Rider Tasks(任務(wù))視圖功能解析與演示教程

    此前,JetBrains Rider推出了Tasks(任務(wù))視圖功能,為 .NET 開發(fā)者帶來強(qiáng)大的任務(wù)管理和調(diào)試工具。該功能已在JetBrains Rider 2024.2 EAP中上線。歡迎聯(lián)系JetBrains授權(quán)合作伙伴
    的頭像 發(fā)表于 02-27 17:22 ?374次閱讀
    .<b class='flag-5'>NET</b>開發(fā)者必看:JetBrains Rider Tasks(<b class='flag-5'>任務(wù)</b>)視圖功能解析與演示教程

    BEVFusion —面向自動(dòng)駕駛的多任務(wù)多傳感器高效融合框架技術(shù)詳解

    和高效融合機(jī)制,解決了多模態(tài)傳感器在幾何與語義任務(wù)中的權(quán)衡問題,成為自動(dòng)駕駛多任務(wù)感知的標(biāo)桿框架其設(shè)計(jì)范式為后續(xù)研究提供了重要啟發(fā) ?**“統(tǒng)表示+輕量優(yōu)化”是多模態(tài)融合的核心方向*
    的頭像 發(fā)表于 02-26 20:33 ?3667次閱讀
    BEVFusion —面向自動(dòng)駕駛的<b class='flag-5'>多任務(wù)</b>多傳感器高效融合<b class='flag-5'>框架</b>技術(shù)詳解

    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

    考慮各個(gè)序列之間的關(guān)系。因此,本文提出的方法更適合作為時(shí)空預(yù)測(cè)領(lǐng)域的預(yù)訓(xùn)練模型。下面為大家詳細(xì)介紹下這篇文章。 摘要 相關(guān)時(shí)間序列分析在許多現(xiàn)實(shí)行業(yè)中扮演著重要的角色。為進(jìn)步的下游任務(wù)學(xué)習(xí)
    的頭像 發(fā)表于 11-15 11:41 ?648次閱讀
    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>框架</b>

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理大規(guī)模
    的頭像 發(fā)表于 11-15 09:19 ?1073次閱讀

    淺談適用于大規(guī)模充電場站的深度強(qiáng)化學(xué)習(xí)有序充電策略

    隨著新能源汽車銷量的快速增長,大規(guī)模充電場站的建設(shè)需求日益凸顯。據(jù)乘聯(lián)會(huì)銷量數(shù)據(jù)顯示,2017年中國新能源乘用車銷量達(dá)到了57.6萬臺(tái),位列全球,且保持著較高的增長率。中國汽車工業(yè)協(xié)會(huì)預(yù)計(jì),2018年新能源汽車銷量將超過100萬輛。然而,大規(guī)模充電場站面臨著諸多挑戰(zhàn)。
    的頭像 發(fā)表于 11-13 10:55 ?592次閱讀
    淺談適用于<b class='flag-5'>大規(guī)模</b>充電場站的深度強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>有序充電策略

    使用EMBark進(jìn)行大規(guī)模推薦系統(tǒng)訓(xùn)練Embedding加速

    推薦系統(tǒng)是互聯(lián)網(wǎng)行業(yè)的核心系統(tǒng),如何高效訓(xùn)練推薦系統(tǒng)是各公司關(guān)注的核心問題。目前,推薦系統(tǒng)基本上都是基于深度學(xué)習(xí)大規(guī)模 ID 類模型,模型包含數(shù)十億甚至數(shù)百億級(jí)別的 ID 特征,典型結(jié)構(gòu)如圖 1 所示。
    的頭像 發(fā)表于 10-31 14:46 ?621次閱讀
    使用EMBark進(jìn)行<b class='flag-5'>大規(guī)模</b>推薦系統(tǒng)訓(xùn)練Embedding加速

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 第、二章學(xué)習(xí)感受

    每個(gè)核心在某時(shí)刻只能執(zhí)行個(gè)線程。CPU的設(shè)計(jì)注重的是低延遲,即快速響應(yīng)和處理單個(gè)任務(wù)。而GPU則不同,它擁有成百上千個(gè)更小、更專
    發(fā)表于 10-10 10:36

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動(dòng)駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?1018次閱讀

    AI大模型與AI框架的關(guān)系

    在探討AI大模型與AI框架的關(guān)系時(shí),我們首先需要明確兩者的基本概念及其在人工智能領(lǐng)域中的角色。AI大模型通常指的是具有極大規(guī)模、高度復(fù)雜性和強(qiáng)大能力的人工智能系統(tǒng),它們能夠處理復(fù)雜的任務(wù)和數(shù)據(jù),并在
    的頭像 發(fā)表于 07-15 11:42 ?1693次閱讀

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的個(gè)開源深度學(xué)習(xí)框架,它允許開發(fā)者方便地構(gòu)建、訓(xùn)練和部署各種復(fù)雜的機(jī)器學(xué)習(xí)模型。TensorFlo
    的頭像 發(fā)表于 07-12 16:38 ?1188次閱讀

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的個(gè)重要分支,在過去十年中取得了顯著的進(jìn)展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過程中,深度學(xué)習(xí)
    的頭像 發(fā)表于 07-02 14:04 ?1502次閱讀