女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智源研究院揭曉大模型測評結果,豆包與百川智能大模型表現優異

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-05-20 09:26 ? 次閱讀

5月18日,北京智源研究院發布了關于國內外各類開/閉源語言及多模態大模型性能評估的最新研究成果。此項研究覆蓋了140余個語言模型的綜合實力對比,包括其對中文文本理解和多模態圖文問答等任務的處理能力。

研究發現,盡管國內頭部語言模型在中文環境中的整體表現已接近國際一流水平,但仍存在能力發展不平衡的問題。

在多模態理解圖文問答任務中,開源和閉源模型表現相當,而國產模型則表現出色。此外,在中文語境下的文生圖能力方面,國產多模態模型與國際一流水平的差距相對較小。

具體到語言模型的排名,在中文語境下,字節跳動的豆包Skylark2以及OpenAI的GPT-4分別名列第一和第二。值得注意的是,國產大模型在理解中國用戶需求方面具有明顯優勢。

在語言模型客觀評價中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同時,百度的文心一言4.0、智譜華章的GLM-4以及月之暗面的Kimi也躋身語言模型主客觀評價的前五名。

在多模態理解模型的客觀評價中,圖文問答方面,阿里巴巴的通義Qwen-vl-max和上海人工智能實驗室的InternVL-Chat-V1.5在某些指標上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能實驗室的Intern-XComposer2-VL-7B緊隨其后。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3575

    瀏覽量

    43426
  • 模型
    +關注

    關注

    1

    文章

    3480

    瀏覽量

    49946
  • 大模型
    +關注

    關注

    2

    文章

    3008

    瀏覽量

    3786
  • 百川智能
    +關注

    關注

    0

    文章

    17

    瀏覽量

    72
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    百川智能發布全場景深度思考模型Baichuan-M1-preview

    近日,百川智能正式發布了國內首個全場景深度思考模型——Baichuan-M1-preview。這一創新成果標志著我國在人工智能領域取得了重要突破,特別是在語言、視覺和搜索三大領域的推理
    的頭像 發表于 02-05 13:51 ?524次閱讀

    百川智能發布全場景深度思考模型Baichuan-M1-preview

    表現出色,可對標o1-preview。 尤為值得一提的是,該模型解鎖了醫療循證模式。百川智能自建了涵蓋億級條目的循證醫學知識庫,能以天為單位進行動態更新。面對復雜醫學問題,Baich
    的頭像 發表于 01-24 14:40 ?943次閱讀

    字節跳動豆包模型1.5 Pro發布

    近日,字節跳動旗下的豆包模型迎來了全新的升級——豆包模型1.5 Pro正式發布。這款全新模型在知識、代碼、推理、中文等多個
    的頭像 發表于 01-23 15:24 ?516次閱讀

    字節跳動發布豆包模型1.5 Pro

    字節跳動正式發布了豆包模型1.5 Pro。 全新的Doubao -1.5 - pro模型綜合能力顯著增強,在知識、代碼、推理、中文等多個測評基準上,綜合得分優于GPT - 4o、Cl
    的頭像 發表于 01-23 10:24 ?524次閱讀

    浪潮信息與智研究院攜手共建大模型多元算力生態

    近日,浪潮信息與北京智人工智能研究院正式簽署戰略合作協議,雙方將緊密合作,共同構建大模型多元算力開源創新生態。 此次合作旨在提升大模型創新
    的頭像 發表于 12-31 11:49 ?525次閱讀

    安謀科技與智研究院達成戰略合作,共建開源AI“芯”生態

    12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智人工智能研究院(以下簡稱“智研究院”)正式簽署戰略合作協議,雙方將
    發表于 12-26 17:06 ?371次閱讀
    安謀科技與智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>達成戰略合作,共建開源AI“芯”生態

    浪潮信息與智研究院達成戰略合作協議

    近日,浪潮信息與智研究院達成戰略合作協議,雙方將緊密協作共建大模型多元算力開源創新生態,提升大模型創新研發的算力效率,降低大模型應用開發的
    的頭像 發表于 12-26 10:25 ?472次閱讀

    百川智能發布Baichuan4-Finance金融大模型

    近日,百川智能正式推出了其全鏈路領域增強的金融大模型——Baichuan4-Finance。這一創新產品的發布,標志著百川智能在金融
    的頭像 發表于 12-25 10:11 ?507次閱讀

    百川智能發布一站式大模型商業化解決方案

    近日,百川智能正式推出了一站式大模型商業化解決方案,旨在為企業提供更加全面、高效的大模型應用服務。該解決方案以1+3產品矩陣為核心,包括全鏈路優質通用訓練數據、Baichuan4-Tu
    的頭像 發表于 11-01 18:01 ?1180次閱讀

    【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)

    輸出的結果進行語音合成實現端側播報。 目前已經接通文心一言、豆包、kimi、智譜glm、通義千問等國內主流大模型,詳細模板和操作步驟可以參考附件文檔。
    發表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智譜glm、通義千問示例)

    本帖最后由 jf_40317719 于 2024-8-21 19:17 編輯 多模態交互離不開硬件載體,近期有不少開發者在研究聆思CSK6大模型開發板除了使用出廠示例自帶的星火大模型,能不能
    發表于 08-21 19:13

    摩爾線程攜手智研究院完成基于Triton的大模型算子庫適配

    近日,摩爾線程與北京智人工智能研究院(簡稱:智研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾
    的頭像 發表于 08-02 11:06 ?1250次閱讀

    模型廠商“輸血”不斷,百川智能完成50億元A輪融資!

    有重磅消息曝出:知名大模型公司百川智能已經成功收獲了價值50億元的A輪融資。由此,我們不禁感嘆,大模型廠商們的“輸血”和“續命”之戰,還在激烈的上演著。
    的頭像 發表于 07-31 14:47 ?837次閱讀
    大<b class='flag-5'>模型</b>廠商“輸血”不斷,<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成50億元A輪融資!

    百川智能完成50億元A輪融資

    近日,國內領先的醫療AI大模型企業——百川智能,正式宣布完成了高達50億元人民幣的A輪融資,這一里程碑式的融資不僅彰顯了市場對其技術實力與未來發展潛力的高度認可,也為公司的后續發展奠定了堅實的資金基礎。
    的頭像 發表于 07-26 16:42 ?696次閱讀

    亞馬遜云科技接入百川智能和零一萬物基礎模型

    近日,亞馬遜云科技在中國峰會上宣布,兩大中文基礎模型——百川智能的Baichuan2-7B和零一萬物的Yi-1.5 6B/9B/34B,即將或已正式登陸中國區域的SageMaker JumpStart。這一舉措為中國企業提供了豐
    的頭像 發表于 06-04 11:53 ?740次閱讀