Claude-3力壓GPT-4榮膺最佳大語言模型

近日，LMSYS Org發布最新的基準測試報告，顯示Cordulas公司的Claude-3在平臺大語言模型中的得分略勝OpenAI的GPT-4。

值得注意的是，LMSYS Org是由加州大學伯克利分校、加州大學圣地亞哥分校以及卡內基梅隆大學共同發起設立的研究組織。

日前，這家機構推出了一項名為Chatbot Arena的服務，這是針對大語言模型（LLM）進行評估的基準平臺，該平臺采用眾包形式對大型語言模型進行匿名隨機競爭打分，參考源于競技比賽領域中廣泛應用的Elo評分體系。

分數評價結果主要取決于用戶的投票意向，每次由系統隨機挑選兩個不同的大語言模型參與與用戶的對話，同時，為保障客觀性，匿名選擇哪個版本的大模型表現優秀至關重要。

自去年啟動以來，GPT-4一直占據評測榜單之首。然而，昨日，由Anthropos推出的Claude 3 Opus以微弱優勢戰勝了GPT-4，將OpenAI的LLM擠出了首位。

考慮到細微差距及誤差風險，委員會決定授予Claude 3與GPT-4并列第一的榮譽，GPT-4的另外一個預設版也被列入并列第一的行列。此外，更引人注目的是，Claude 3 Haiku成功躋身前十名。Haiku是Anthropos針對本地規模的新型模型，功能類似谷歌的GeminiNano。

相較Opus參數高達幾萬億，Haiku體型更為緊湊，運行速度更快。據LMSYS數據顯示，Haikn在評測成績中排名第七，與GPT-4表現不遑多讓。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6230

瀏覽量
107854
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10735
GPT

GPT

+關注

關注
0

文章
368

瀏覽量
16012

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

從驅動到應用：RT-Thread環境下的SDIO開發指南

RT-Thread官方賬號
1天前

252 閱讀

完整指南：如何使用樹莓派5、Hailo AI Hat、YOLO、Docker進行自定義數據集訓練？

上海晶珩電子科技有限公司
1天前

251 閱讀

新華財經：RT-Thread睿賽德加速布局RISC-V產業 | 媒體視角

RT-Thread官方賬號
2天前

241 閱讀

為無刷吸塵器驅動方案按下“靜音鍵”--【其利天下】

其利天下技術
2天前

191 閱讀

德州儀器方案|諧振轉換器同步整流器(SR)設計注意事項

德州儀器
1天前

442 閱讀

PowerPCB電路板設計規范

heyong0525
31

免費

0下載

LED光學參數的測量技術和國家光度標準

陳博
107

10積分

115下載

PLOGS項目任務日志管理系統

欲望都市
8.72 MB

免費

0下載

docker-cleanup Docker清理腳本

新疆切糕
0.01 MB

免費

0下載

磁通電容器開源項目

張昂笙
0.10 MB

2積分

1下載

這個電路板升壓IC不穩定，容易燒，是什么原因

jf_38390749
1天前

581 閱讀

【中科昊芯Core_DSC280025C開發板試用體驗】+1.開箱之浮點計算對比

川楠
1天前

233 閱讀

【HZ-RK3568開發板免費體驗】【HZ-RK3568開發板免費體驗】--開發板了解與初探

1653149838.791300
2天前

330 閱讀

【Milk-V Duo S 開發板免費體驗】麻雀雖小五臟俱全超高性價比開發板Milk-V Duo S

jf_1137202360
2天前

306 閱讀

【潤開鴻HH-SCDAYU800A開發板試用體驗】潤開鴻HH-SCDAYU800A開發板（一）

jf_29910226
2天前

339 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

Claude-3力壓GPT-4榮膺最佳大語言模型

評論