大模型開(kāi)始滿天飛,動(dòng)不動(dòng)就是千億參數(shù)的大模型,對(duì)于大部分廠家來(lái)說(shuō)做大模型還是有點(diǎn)遙不可及(太消耗資源了o(╥﹏╥)o)。但也不要?dú)怵H,大模型的發(fā)展同樣面臨瓶頸,訓(xùn)練所需的硬件資源日益增加,比如英偉達(dá)的芯片、電力等(這也可能是ChatGPT5遲遲沒(méi)有出來(lái)的原因)。
業(yè)界有觀點(diǎn)認(rèn)為,在大多數(shù)情況下,并不需要全能的大模型,而是更適合專(zhuān)注于特定領(lǐng)域的中小型模型。這類(lèi)模型針對(duì)垂直領(lǐng)域,性價(jià)比更高,在特定場(chǎng)景下能以較低資源實(shí)現(xiàn)高準(zhǔn)確率的專(zhuān)項(xiàng)任務(wù)。例如在邊緣計(jì)算領(lǐng)域,模型推理所需資源遠(yuǎn)少于訓(xùn)練時(shí)。隨著芯片技術(shù)的進(jìn)步,越來(lái)越多的芯片集成了NPU,甚至有些研發(fā)了自己的可重構(gòu)NPU架構(gòu),把算力推升到10TOPS以上,最新的高端芯片甚至可到幾十TOPS(例如高通、HAILO的芯片),大幅降低了推理時(shí)間和功耗,也為邊緣端運(yùn)行更多強(qiáng)大功能的模型提供了基礎(chǔ)。
無(wú)論如何,中小型模型的開(kāi)發(fā)需求正隨著市場(chǎng)的需求不斷擴(kuò)大。下面盤(pán)點(diǎn)下訓(xùn)練小模型時(shí)常用的好工具,如果有其他更好的工具也可評(píng)論區(qū)推薦一下,不勝感激(#^.^#)。
訓(xùn)練模型需要有臺(tái)有一定高算力的電腦,但如果沒(méi)有真沒(méi)有辦法擁有一臺(tái)這樣的實(shí)體機(jī),科技的發(fā)展也不會(huì)辜負(fù)任何一個(gè)想學(xué)習(xí)的人的。
1. Colab:Google提供的免費(fèi)云GPU平臺(tái)。它用Jupyter notebook的方式,讓大家可以在線上調(diào)用他的GPU去訓(xùn)練。但是嘞,大陸用不了Google的服務(wù)。網(wǎng)上也有不少的教程,需要的自行解決。
2. Kaggle:一個(gè)有名的機(jī)器學(xué)習(xí)算法比賽平臺(tái),不僅提供了大量的訓(xùn)練數(shù)據(jù)集,還提供各種流行模型的介紹、模型文件、參考例子、社區(qū)分享代碼,甚至Jupyter notebook運(yùn)行平臺(tái)包含GPU和TPU加速。這么完整的一條龍服務(wù),哪個(gè)新手不喜歡。不過(guò)硬件加速有每周有時(shí)限,但50個(gè)小時(shí),都比我上班時(shí)間還長(zhǎng),實(shí)在是香。

3. Roboflow:一個(gè)集大成的模型開(kāi)發(fā)工具、方案提供平臺(tái)。提供模型訓(xùn)練過(guò)程中,幾乎所有想要的功能,甚至可以實(shí)現(xiàn)在不寫(xiě)代碼的情況下,在網(wǎng)頁(yè)端配置生成自定義任務(wù)的模型。當(dāng)然,高附加值的產(chǎn)品是需要索取額外的費(fèi)用的。
當(dāng)然有自己訓(xùn)練的機(jī)器是最好的,畢竟線上的運(yùn)行環(huán)境、網(wǎng)絡(luò)速度,數(shù)據(jù)安全等問(wèn)題有時(shí)是不能忽略的。至少裝一臺(tái)超級(jí)PC,一個(gè)team一起用也是可以的嘛(小編也是這種模式)。畢竟一個(gè)工程師不可能一直都在訓(xùn)練,訓(xùn)練完的模型拿去分析分析,寫(xiě)寫(xiě)部署代碼,在這段時(shí)間給另外一位工程師去訓(xùn)練,以達(dá)到訓(xùn)練機(jī)器最大化使用率(資本家思維(#^.^#),老板也喜歡),這時(shí)候就需要一些工具去隔離工作區(qū)。
1. SSH:這個(gè)就不用多解釋了,允許多個(gè)其他pc同時(shí)遠(yuǎn)程登錄超級(jí)pc去使用。
2. VScode:這個(gè)小而精的軟件越來(lái)越多人使用了,眾多功能通過(guò)插件方式去添加,可以滿足不同人群的需求。而它提供的ssh插件,可以讓本機(jī)電腦通過(guò)ssh訪問(wèn)超級(jí)PC時(shí),能像本地操作一樣,絲滑方便,可參考【宇宙最強(qiáng)編輯器VS Code】(十)使用VS Code + SSH進(jìn)行遠(yuǎn)程開(kāi)發(fā)_visual studio code ssh 打開(kāi)工作區(qū)-CSDN博客。
3. Anaconda:現(xiàn)在有很多訓(xùn)練框架,大部分框架都是用python來(lái)寫(xiě)的,而每個(gè)框架對(duì)python環(huán)境都有不一樣的要求,anaconda就是一個(gè)非常不錯(cuò)的python虛擬環(huán)境的管理軟件。
4. Docker:docker不單單是方便開(kāi)發(fā)者分享運(yùn)行環(huán)境的工具,也是個(gè)不錯(cuò)的沙盒工具。在一些交叉編譯的需求中,隔離原系統(tǒng),在docker的容器中自由修改各種變量,安裝各種軟件,弄好了還可以分享給別人用。一些框架或芯片廠商的開(kāi)發(fā)環(huán)境也會(huì)用這個(gè)軟件。
你可能想要知道的Q&A
Q1
Colab平臺(tái)如何解決大陸無(wú)法訪問(wèn)Google服務(wù)的問(wèn)題?
A1
可以通過(guò)VPN或者使用一些第三方提供的代理服務(wù)來(lái)訪問(wèn)Colab平臺(tái)。
Q2
Kaggle平臺(tái)的硬件加速是否對(duì)所有用戶都開(kāi)放?
A2
Kaggle平臺(tái)的硬件加速功能對(duì)所有注冊(cè)用戶開(kāi)放,但每周有使用時(shí)間限制。
Q3
如何選擇適合自己的模型訓(xùn)練工具?
A3
應(yīng)根據(jù)個(gè)人的訓(xùn)練需求、硬件條件以及對(duì)工具的熟悉程度來(lái)選擇,同時(shí)也可以參考社區(qū)中其他用戶的推薦和評(píng)價(jià)。
Q4
使用SSH遠(yuǎn)程登錄時(shí),如何保證數(shù)據(jù)的安全性?
A4
應(yīng)確保使用安全的密碼和密鑰認(rèn)證方式,定期更新密碼,以及限制可登錄的用戶和IP地址,以提高安全性。
Q5
Docker容器與虛擬機(jī)有什么區(qū)別?
A5
Docker容器是輕量級(jí)的,共享宿主機(jī)的操作系統(tǒng)內(nèi)核,啟動(dòng)快速,資源占用少;而虛擬機(jī)是重量級(jí)的,每個(gè)虛擬機(jī)都有自己的操作系統(tǒng),啟動(dòng)較慢,資源占用相對(duì)較多。
登錄大大通網(wǎng)站查看原文:
Biu懂AI:模型訓(xùn)練常用工具集合
https://www.wpgdadatong.com.cn/reurl/Z7riui
-
AI
+關(guān)注
關(guān)注
87文章
34146瀏覽量
275273 -
訓(xùn)練模型
+關(guān)注
關(guān)注
1文章
37瀏覽量
3931
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論