女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mistral中杯代碼能力完勝GPT-4,成本暴降2/3

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:新智元 ? 2023-12-18 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

小模型的風(fēng)潮,最近愈來(lái)愈盛,Mistral和微軟分別有所動(dòng)作。而網(wǎng)友實(shí)測(cè)發(fā)現(xiàn),Mistral-medium的代碼能力竟然完勝了GPT-4,而所花成本還不到三分之一。

最近,「小語(yǔ)言模型」忽然成為熱點(diǎn)。

本周一,剛剛完成4.15億美元融資的法國(guó)AI初創(chuàng)公司Mistral,發(fā)布了Mixtral 8x7B模型。

715336d2-9d7c-11ee-8b88-92fbcf53809c.png

這個(gè)開(kāi)源模型盡管尺寸不大,小到足以在一臺(tái)內(nèi)存100GB以上的電腦上運(yùn)行,然而在某些基準(zhǔn)測(cè)試中卻能和GPT-3.5打平,因此迅速在開(kāi)發(fā)者中贏得了一片稱贊。

之所以叫Mixtral 8x7B,是因?yàn)樗Y(jié)合了為處理特定任務(wù)而訓(xùn)練的各種較小模型,從而提高了運(yùn)行效率。

這種「稀疏專家混合」模型并不容易實(shí)現(xiàn),據(jù)說(shuō)OpenAI在今年早些時(shí)候因?yàn)闊o(wú)法讓MoE模型正常運(yùn)行,而不得不放棄了模型的開(kāi)發(fā)。

緊接著,就在第二天,微軟又發(fā)布了全新版本的Phi-2小模型。

跟Mistral的70億參數(shù)比,Phi-2小到可以在手機(jī)上跑,只有27億參數(shù)。相比之下,GPT-4的參數(shù)達(dá)到了一萬(wàn)億。

Phi-2在精心挑選的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,數(shù)據(jù)集的質(zhì)量足夠高,因此即使手機(jī)的計(jì)算能力有限,也能確保模型生成準(zhǔn)確的結(jié)果。

雖然還不清楚微軟或其他軟件制造商將如何使用小型模型,但最明顯的好處,就是降低了大規(guī)模運(yùn)行AI應(yīng)用的成本,并且極大地拓寬了生成式AI技術(shù)的應(yīng)用范圍。

這是一件大事。

Mistral-medium代碼生成完勝GPT-4

最近,Mistral-medium已經(jīng)開(kāi)放內(nèi)測(cè)。

有博主對(duì)比了開(kāi)源的Mistral-medium和GPT-4的代碼生成能力,結(jié)果顯示,Mistral-medium比GPT-4的代碼能力更強(qiáng),然而成本卻只需GPT-4的3成!

7163a274-9d7c-11ee-8b88-92fbcf53809c.png

總價(jià)來(lái)說(shuō)就是:

1)Mistral會(huì)始終完成工作,完成度很高;

2)不會(huì)在冗長(zhǎng)的解釋性輸出上浪費(fèi)token;

3)提供的建議非常具體。

第一題,「編寫(xiě)用于生成斐波那契素?cái)?shù)的PyTorch數(shù)據(jù)集的cuda優(yōu)化代碼」。

Mistral-Medium生成的代碼嚴(yán)肅、完整。

716dbc64-9d7c-11ee-8b88-92fbcf53809c.png

7178e45e-9d7c-11ee-8b88-92fbcf53809c.png

71847daa-9d7c-11ee-8b88-92fbcf53809c.png

而GPT-4生成的代碼,就差強(qiáng)人意了。

浪費(fèi)了很多token,卻沒(méi)有輸出有用的信息。

7189dd40-9d7c-11ee-8b88-92fbcf53809c.png

然后,GPT-4只給出了骨架代碼,并沒(méi)有具體的相關(guān)代碼。

719013d6-9d7c-11ee-8b88-92fbcf53809c.png

第二道題:「編寫(xiě)高效的Python代碼,將大約10億個(gè)大型Apache HTTP訪問(wèn)文件攝取到 SqlLite數(shù)據(jù)庫(kù)中,并使用它來(lái)生成對(duì)sales.html和product.html的訪問(wèn)直方圖」。

Mistral的輸出非常精彩,雖然log不是CSV格式的,但修改起來(lái)很容易。

719b463e-9d7c-11ee-8b88-92fbcf53809c.png

71a47db2-9d7c-11ee-8b88-92fbcf53809c.png

71af633a-9d7c-11ee-8b88-92fbcf53809c.png

GPT-4依舊拉跨。

71bb5f0a-9d7c-11ee-8b88-92fbcf53809c.png

71c60e28-9d7c-11ee-8b88-92fbcf53809c.png

71d27d48-9d7c-11ee-8b88-92fbcf53809c.png

此前,這位博主測(cè)試過(guò)多個(gè)代碼生成模型,GPT-4一直穩(wěn)居第一。

而現(xiàn)在,把它拉下寶座的強(qiáng)勁對(duì)手Mistral-medium終于出現(xiàn)了。

雖然只發(fā)布了兩個(gè)例子,但博主測(cè)試了多個(gè)問(wèn)題,結(jié)果都差不多。

他建議:鑒于Mistral-medium在代碼生成質(zhì)量上有更好的體驗(yàn),應(yīng)該把它整合到各地的代碼copilot中。

71d73d7e-9d7c-11ee-8b88-92fbcf53809c.png

有人按照每1000token算出了輸入和輸出的成本,發(fā)現(xiàn)Mistral-medium比起GPT-4直接降低了70%!

71e45662-9d7c-11ee-8b88-92fbcf53809c.png

的確,節(jié)省了70%的token費(fèi)用,可不是一件小事。甚至還可以通過(guò)不冗長(zhǎng)的輸出,來(lái)進(jìn)一步節(jié)省成本。

71efad0a-9d7c-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50430
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4900

    瀏覽量

    70751
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10792

原文標(biāo)題:Mistral攜微軟引爆「小語(yǔ)言模型」潮!Mistral中杯代碼能力完勝GPT-4,成本暴降2/3

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPT-5即將面市 性能遠(yuǎn)超GPT-4

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月04日 13:38:23

    【RA-Eco-RA4M2開(kāi)發(fā)板評(píng)測(cè)】RA-Eco-RA4M2 PWM輸出

    模塊的結(jié)構(gòu)框圖 RA4M2系列共有共 8 個(gè)GPT定時(shí)器(即8個(gè)通道), 其中包括 4 個(gè)32位GPT定時(shí)器(GPT32n (n=0~
    發(fā)表于 04-28 22:57

    馬斯克發(fā)布Grok 3大模型,超越GPT-4o

    多項(xiàng)benchmark測(cè)試,Grok 3取得了比DeepSeek-v3GPT-4o以及Gemini-2 pro更優(yōu)的效果。這一成績(jī)無(wú)疑彰
    的頭像 發(fā)表于 02-19 13:50 ?432次閱讀

    OpenAI宣布GPT 4o升智計(jì)劃

    透露,GPT 4o的智力水平將得到顯著提升,目標(biāo)直指o3 pro的水平。這一升級(jí)不僅意味著GPT 4o在理解和生成文本方面的
    的頭像 發(fā)表于 02-17 14:24 ?595次閱讀

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    GPT-4.5將在未來(lái)幾周內(nèi)率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術(shù)上進(jìn)行了諸多優(yōu)化和升級(jí),旨在為用戶提供更加精準(zhǔn)、高效的AI服務(wù)。 而在GPT-4.5發(fā)布后不久
    的頭像 發(fā)表于 02-13 13:43 ?644次閱讀

    如何在邊緣端獲得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    GPT4-V的能力:MiniCPM-V 2.6 。 MiniCPM-V 2.6是MiniCPM-V系列最新、性能最佳的模型,基于SigLip-400M和Qwen2-7B構(gòu)建,共8B參數(shù)。在最新版
    的頭像 發(fā)表于 01-20 13:40 ?626次閱讀
    如何在邊緣端獲得<b class='flag-5'>GPT4</b>-V的<b class='flag-5'>能力</b>:算力魔方+MiniCPM-V 2.6

    OpenAI GPT-5開(kāi)發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進(jìn)其備受期待的下一代旗艦?zāi)P?b class='flag-5'>GPT-5的開(kāi)發(fā)進(jìn)程上遇到了困難。由于計(jì)算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開(kāi)發(fā)已經(jīng)落后于原定計(jì)劃半年之久。 據(jù)悉,OpenAI
    的頭像 發(fā)表于 12-23 11:04 ?746次閱讀

    訊飛星火大模型技術(shù)進(jìn)展及落地

    訊飛星火4.0 Turbo重磅發(fā)布,七大核心能力全面超過(guò)GPT-4 Turbo,數(shù)學(xué)和代碼能力超越GPT-4o,國(guó)內(nèi)外中英文14項(xiàng)主流測(cè)試集
    的頭像 發(fā)表于 10-27 15:50 ?2315次閱讀

    訊飛星火大模型4.0 Turbo正式發(fā)布

    近日,2024科大訊飛全球1024開(kāi)發(fā)者節(jié)正式開(kāi)幕。在數(shù)千名行業(yè)領(lǐng)袖、專家學(xué)者與開(kāi)發(fā)者的共同見(jiàn)證下,訊飛星火大模型4.0 Turbo正式發(fā)布。七大核心能力全面超過(guò)GPT-4 Turbo,數(shù)學(xué)和代碼
    的頭像 發(fā)表于 10-27 15:47 ?1028次閱讀

    Llama 3GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見(jiàn)證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽,Llama 3GPT-4作為兩個(gè)備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1153次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力GPT-4 Turbo

    超過(guò)GPT-4 Turbo,數(shù)學(xué)能力代碼能力更是超過(guò)了Open AI最新一代GPT模型GPT-4
    的頭像 發(fā)表于 10-24 11:39 ?1083次閱讀

    訊飛星火內(nèi)容運(yùn)營(yíng)大師新增三大功能

    一個(gè)月前,GPT-4o一出,打破了人們對(duì)于大模型的響應(yīng)速度和多模態(tài)理解能力的想象邊界。6月27日,科大訊飛馬上也要發(fā)布全面對(duì)標(biāo)GPT-4 Turbo當(dāng)前能力水平的訊飛星火V4.0。
    的頭像 發(fā)表于 10-14 10:08 ?1203次閱讀

    真格基金宣布捐贈(zèng)開(kāi)源AI項(xiàng)目vLLM

    開(kāi)源技術(shù)處于 AI 革命的中心。Llama 3Mistral 等開(kāi)源大模型迅速追趕 GPT-4,TensorFlow、Pytorch 等開(kāi)源深度學(xué)習(xí)框架提供了豐富的庫(kù)和工具。GitHub 上有 6
    的頭像 發(fā)表于 09-24 16:13 ?796次閱讀

    Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

    Mistral Large 2Mistral Large的最新版本,Mistral AI表示其在多語(yǔ)言能力、數(shù)學(xué)、推理、
    的頭像 發(fā)表于 07-26 08:07 ?517次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來(lái)取代GPT-3.5.這是目前市場(chǎng)上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測(cè)試中表現(xiàn)優(yōu)于
    的頭像 發(fā)表于 07-21 10:20 ?1689次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜