女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

最佳開源模型刷新多項SOTA，首次超越Mixtral Instruct！「開源版GPT-4」家族迎來大爆發

【導讀】Mixtral 8x7B模型開源后，AI社區再次迎來一大波微調實踐。來自Nous Research應用研究小組團隊微調出新一代大模型Nous-Hermes 2 Mixtral 8x7B，在主流基準測試中擊敗了Mixtral Instruct。

Mixtral 8x7B開源模型的誕生，正如Llama一樣，為開源社區了帶來曙光。

前段時間，Mixtral剛剛發布了8x7B模型的論文。在基準測試結果中，其性能達到或超過 Llama 2-70B和GPT-3.5。

甚至，Mixtral在數學、代碼生成和多語言理解任務方面表現亮眼。

最近，一個開源研究小組Nous Research推出了新一代旗艦大模型Nous-Hermes 2 Mixtral 8x7B。

這是首個通過RLHF訓練的模型，并在主流基準測試中超越Mixtral Instruct，成為最佳開源模型。

此外，Nous Research團隊發布的SFT和SFT+DPO模型，以及DPO適配器將為用戶提供更多選擇。

在所有的基準測試中，Nous-Hermes 2 Mixtral 8x7B模型也略不遜色。

目前，這些模型同樣在Hugging Face上開源上線。

最佳開源模型誕生

據介紹，最新模型是在Mixtral 8x7B MoeLLM微調訓練而來。

具體來說，Nous-Hermes 2 Mixtral 8x7B是在1,000,000個條目進行了訓練（主要是GPT-4生成的數據），以及整個AI領域開放數據集等其他高質量數據集。

研究人員同時還發布了SFT Only版本，以及SFT+DPO版本。

模型演示

那么，Nous Research團隊最新的模型能力有多強？

編寫可視化數據代碼完全是小菜一碟。

它還能寫賽博朋克的迷幻詩。

可以執行反向翻譯，從輸入文本中創建提示信息。

基準測試

與Mixtral基礎模型相比，Mixtral 8x7B上的Nous-Hermes 2在以下基準測試中取得了全面提升，也是MistralAI首次擊敗旗艦型號Mixtral Finetune。

在GPT4All中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了75.7分，位列榜單第三。

在AGIEval的排行中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了46.05的成績。

此外，在BigBench Reasoning Test中，Nous-Hermes 2 Mixtral 8x7B（SFT+DPO）霸榜第一。

背后團隊

成立于2023年，Nous Research是一個在大模型領域發布開源研究而聞名的私人應用研究小組。

去年12月，這個研究團隊成員曾發布了一款輕量的視覺語言模型——Nous Hermes 2 Vision。

這個模型以希臘神使赫爾墨斯的名字命名。它通過用戶上傳的圖像數據，通過自然語言提供詳細的答案。

就在前幾天，Nous Research宣布了一輪520萬美元的種子融資，涉及了多位天使投資人。

到目前為止，Nous Research已經發布了40多個開源模型，包括Hermes、YaRN、Capybara、Puffin和Obsidian系等系列。

Mixtral模型，會將成為開源版GPT-4

繼2023年年初Llama發布之后，一系列羊駝家族瞬間爆發。年底，Mixtral的開源MoE發布，更是為開源年做了一個完美的收尾。

有網友表示，Mixtral或將有實力將于今年接管GPT-4。

在Chatbot Arena排行榜上，Mixtral成為（繼GPT-4、Claude和Mistral Medium之后）唯一能打的開源模型，也是僅有7B參數的最小模型，甚至比谷歌的Gemini Pro還要好！

而且它是開源的！任何人可以獲取該模型，并將其部署到自己的設備，而且可以對其進行微調，可以隨心所欲地使用它。

現在，在Mixtral-7B上進行微調、部署的模型案例，也是非常的多。

比如，有網友用樹莓派在本地跑起了Phi-2、Mistral和LLaVA等模型。

還有人出了一款APP，名為Offline Chat：Private AI，能夠在iPhone上離線跑Mistral 7B模型。

這樣一來，模型生成的內容，可以保障安全和隱私。

還有人用直接偏好微調了Mistral-7B模型。

具體來說，研究人員將使用一種類似RLHF的技術：直接偏好優化(DPO)對OpenHermes-2.5進行微調，從而創建NeuralHermes-2.5。

為此，他們還引入了一個偏好數據集，描述DPO算法的工作原理，并將其應用到模型中。我們將看到它顯著提高了OpenLLM排行榜上基本模型的性能。

有網友進行的海底撈針實驗中， Mistral-7B-Instruct-v0.2在80000 token情況下，召回率下降。

相信未來，Mixtral模型會向羊駝家族一樣，迎來大爆發。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

開源

開源

+關注

關注
3

文章
3707

瀏覽量
43866
模型

模型

+關注

關注
1

文章
3524

瀏覽量
50468
數據集

數據集

+關注

關注
4

文章
1224

瀏覽量
25470
大模型

大模型

+關注

關注
2

文章
3152

瀏覽量
4100

原文標題：最佳開源模型刷新多項SOTA，首次超越Mixtral Instruct！「開源版GPT-4」家族迎來大爆發

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學堂】歡迎添加關注！文章轉載請注明出處。

評論

OpenCV學堂
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 灰度共生矩陣(GLCM)基本原理
Hot UNet和UNet++：醫學影像經典分割網絡對比

New 常見人體姿態評估顯示方式的兩種方式
New 手寫圖像模板匹配算法在OpenCV中的實現

精選推薦
更多

文章

資料

帖子

“開源+AI”賦能萬物智聯：RT-Thread睿賽德亮相“上海硅巷”暢談國產操作系統 | 新聞速遞

RT-Thread官方賬號
15小時前

61 閱讀

如何從PCB焊盤移除阻焊層和錫膏層

Altium
16小時前

449 閱讀

如何設計低EMI的PCB

Altium
16小時前

441 閱讀

AMD Versal自適應SoC上的級聯模式示例

XILINX開發者社區
17小時前

399 閱讀

預定破百萬！三星推出史上最輕薄折疊手機，破解市場放緩魔咒

章鷹觀察
1小時前

429 閱讀

TD-SCDMA基站子系統原理教材

159520
3.48 MB

免費

341下載

嵌入式Linux+Android系統學習路線圖

黃博
1055KB

免費

323下載

unit_perf基于OpenWrt的性能檢測工具

遠不及你
0.01 MB

2積分

3下載

labeled-RISC-V標簽化RISC-V項目

fdjslkjd
2.30 MB

2積分

2下載

Flameshot基于C++的屏幕截圖軟件

賈虎世
12.45 MB

2積分

1下載

【VisionFive 2單板計算機試用體驗】驅動LED點陣屏

yinwuqing
11小時前

89 閱讀

【RA-Eco-RA6M4開發板評測】1、開發環境搭建和串口打印信息

EPTmachine
1天前

105 閱讀

【VisionFive 2單板計算機試用體驗】VisionFive 2復古游戲機改造

jf_05916765
1天前

83 閱讀

【GM-3568JHF開發板免費體驗】GM-3568JHF的coremark跑分5007分

jf_43382582
1天前

323 閱讀

低壓大電流電流采樣

jf_57990096
1天前

521 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：[email protected]

內容合作

黃晶晶：[email protected]

內容合作（海外）

張迎輝：[email protected]

供應鏈服務 PCB/IC/PCBA

江良華：[email protected]

投資合作

曾海銀：[email protected]

社區合作

劉勇：[email protected]

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司

長沙市望城經濟技術開發區航空路6號手機智能終端產業園2號廠房3層（0731-88081133）
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
久久久久免费看黄a级毛片试看