女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

完善資料讓更多小伙伴認(rèn)識(shí)你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

8x7B MoE與Flash Attention 2結(jié)合，不到10行代碼實(shí)現(xiàn)快速推理

前段時(shí)間，Mistral AI 公布的 Mixtral 8x7B 模型爆火整個(gè)開(kāi)源社區(qū)，其架構(gòu)與 GPT-4 非常相似，很多人將其形容為 GPT-4 的「縮小版」。

我們都知道，OpenAI 團(tuán)隊(duì)一直對(duì) GPT-4 的參數(shù)量和訓(xùn)練細(xì)節(jié)守口如瓶。Mistral 8x7B 的放出，無(wú)疑給廣大開(kāi)發(fā)者提供了一種「非常接近 GPT-4」的開(kāi)源選項(xiàng)。

在基準(zhǔn)測(cè)試中，Mistral 8x7B 的表現(xiàn)優(yōu)于 Llama 2 70B，在大多數(shù)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試上與 GPT-3.5 不相上下，甚至略勝一籌。

▲圖源 https://mistral.ai/news/mixtral-of-experts/

隨著這項(xiàng)研究的出現(xiàn)，很多人表示：「閉源大模型已經(jīng)走到了結(jié)局。」

短短幾周的時(shí)間，機(jī)器學(xué)習(xí)愛(ài)好者 Vaibhav (VB) Srivastav 表示：隨著 AutoAWQ（支持 Mixtral、LLaVa 等模型的量化）最新版本的發(fā)布，現(xiàn)在用戶(hù)可以將 Mixtral 8x7B Instruct 與 Flash Attention 2 結(jié)合使用，達(dá)到快速推理的目的，實(shí)現(xiàn)這一功能大約只需 24GB GPU VRAM、不到十行代碼。

▲圖源 https://twitter.com/reach_vb/status/1741175347821883502

AutoAWQ地址：

https://github.com/casper-hansen/AutoAWQ 操作過(guò)程是這樣的： 首先是安裝 AutoAWQ 以及 transformers：

pipinstallautoawqgit+https://github.com/huggingface/transformers.git

第二步是初始化 tokenizer 和模型：

?第三步是初始化 TextStreamer：

?第四步對(duì)輸入進(jìn)行 Token 化：

?第五步生成：

?當(dāng)你配置好項(xiàng)目后，就可以與 Mixtral 進(jìn)行對(duì)話(huà)，例如對(duì)于用戶(hù)要求「如何做出最好的美式咖啡？通過(guò)簡(jiǎn)單的步驟完成」，Mixtral 會(huì)按照 1、2、3 等步驟進(jìn)行回答。

項(xiàng)目中使用的代碼：

Srivastav 表示上述實(shí)現(xiàn)也意味著用戶(hù)可以使用 AWQ 運(yùn)行所有的 Mixtral 微調(diào)，并使用 Flash Attention 2 來(lái)提升它們。看到這項(xiàng)研究后，網(wǎng)友不禁表示：真的很酷。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

代碼

代碼

+關(guān)注

關(guān)注
30

文章
4897

瀏覽量
70579
GPT

GPT

+關(guān)注

關(guān)注
0

文章
368

瀏覽量
16056
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1206

瀏覽量
8842

原文標(biāo)題：8x7B MoE與Flash Attention 2結(jié)合，不到10行代碼實(shí)現(xiàn)快速推理

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

深度學(xué)習(xí)自然語(yǔ)言處理
專(zhuān)欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 一個(gè)給NLP領(lǐng)域帶來(lái)革新的預(yù)訓(xùn)練語(yǔ)言大模型Bert
Hot 推薦一些翻譯英文文獻(xiàn)比較準(zhǔn)確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學(xué)習(xí)和實(shí)踐經(jīng)驗(yàn)

精選推薦
更多

文章

資料

帖子

東芝雙路直流有刷電機(jī)驅(qū)動(dòng)IC的功能特性分析

東芝半導(dǎo)體
14小時(shí)前

395 閱讀

晶體管架構(gòu)的演變過(guò)程

中科院半導(dǎo)體所
14小時(shí)前

339 閱讀

瑞薩MCU方案：瑞薩RZ/G2L Bootloader單獨(dú)編譯方法詳解

瑞薩MCU小百科
16小時(shí)前

374 閱讀

先進(jìn)封裝中的TSV分類(lèi)及工藝流程

深圳市賽姆烯金科技有限公司
16小時(shí)前

377 閱讀

霍爾IC的原理和分類(lèi)

深圳市鈞敏科技有限公司
16小時(shí)前

355 閱讀

單片機(jī)仿真器

灑下墨色
691

10積分

129下載

38項(xiàng)專(zhuān)業(yè)教學(xué)大綱

949408817
1630

免費(fèi)

0下載

Archery開(kāi)源漏洞評(píng)估和管理工具

張明
9.48 MB

免費(fèi)

0下載

Django Simple Captcha Django驗(yàn)證組件

h1654155275.5669
0.16 MB

2積分

3下載

awsbox輕量級(jí)的PaaS

劉杰
0.15 MB

免費(fèi)

0下載

【嘉楠堪智K230開(kāi)發(fā)板試用體驗(yàn)】K230機(jī)器視覺(jué)相關(guān)功能體驗(yàn)

杯pp
1天前

142 閱讀

【匯思博SEEK100開(kāi)發(fā)板試用體驗(yàn)】03 簡(jiǎn)約風(fēng)天氣APP開(kāi)發(fā)--首頁(yè)UI布局及組件介紹

jf_83922529
1天前

349 閱讀

《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值第18期：2025.06.30--2025.07.4

電子人steve
5天前

933 閱讀

【Milk-V Duo S 開(kāi)發(fā)板免費(fèi)體驗(yàn)】2 - 安裝編譯環(huán)境并測(cè)試Hello world!

zealsoft
2天前

372 閱讀

每周推薦！硬件設(shè)計(jì)指南+無(wú)刷電機(jī)原理圖大全+工程師面試題庫(kù)匯總

ElecFans小喇叭
2天前

535 閱讀

推薦專(zhuān)欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

8x7B MoE與Flash Attention 2結(jié)合，不到10行代碼實(shí)現(xiàn)快速推理

評(píng)論