女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)源LLEMMA發(fā)布:超越未公開(kāi)的頂尖模型,可直接應(yīng)用于工具和定理證明

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 2023-10-22 10:24 ? 次閱讀

今天向大家介紹一個(gè)新的開(kāi)源大語(yǔ)言模型——LLEMMA,這是一個(gè)專(zhuān)為數(shù)學(xué)研究而設(shè)計(jì)的前沿語(yǔ)言模型。

8bca483e-7004-11ee-939d-92fbcf53809c.png

LLEMMA解數(shù)學(xué)題的一個(gè)示例

LLEMMA的誕生源于在Proof-Pile-2數(shù)據(jù)集上對(duì)Code Llama模型的深度訓(xùn)練。這個(gè)數(shù)據(jù)集是一個(gè)科學(xué)論文、數(shù)學(xué)相關(guān)網(wǎng)頁(yè)和數(shù)學(xué)代碼的綜合體。

過(guò)去雖然有數(shù)學(xué)專(zhuān)用的模型,但許多模型都有各種限制。例如,有的模型是封閉訪問(wèn),這使得它們無(wú)法為更廣泛的研究所用。有的則技術(shù)上稍顯落后。

但LLEMMA的出現(xiàn)改變了這一局面。它不僅在MATH基準(zhǔn)測(cè)試上創(chuàng)下了新高,甚至超越了某些還未對(duì)外公開(kāi)的頂尖模型,如Minerva。更讓人欣喜的是,LLEMMA無(wú)需額外的調(diào)整,即可直接應(yīng)用于工具和定理證明。

讓我們一起了解下這個(gè)模型背后的技術(shù)吧!

8bdb2e4c-7004-11ee-939d-92fbcf53809c.png

Paper:Llemma: An Open Language Model For Mathematics
Link:https://arxiv.org/pdf/2310.10631.pdf
Code:https://github.com/EleutherAI/math-lm

->輔導(dǎo)界的小米帶你沖刺ACL2024

數(shù)據(jù)集

LLEMMA是專(zhuān)為數(shù)學(xué)設(shè)計(jì)的大型語(yǔ)言模型,具有70億和340億參數(shù)。這一模型的訓(xùn)練方法是在Proof-Pile-2.2.1數(shù)據(jù)集上繼續(xù)對(duì)Code Llama模型進(jìn)行預(yù)訓(xùn)練。以下是關(guān)于該數(shù)據(jù)集的簡(jiǎn)要說(shuō)明:

Proof-Pile-2:這是一個(gè)包含550億令牌的綜合數(shù)據(jù)集,融合了科學(xué)論文、數(shù)學(xué)相關(guān)的網(wǎng)絡(luò)內(nèi)容和數(shù)學(xué)代碼,其知識(shí)截止于2023年4月(不包括特定的Lean證明步驟子集)。

代碼:為了適應(yīng)數(shù)學(xué)家日益重視的計(jì)算工具,如數(shù)值模擬和計(jì)算代數(shù)系統(tǒng),研究團(tuán)隊(duì)創(chuàng)建了名為AlgebraicStack的源代碼數(shù)據(jù)集。這個(gè)數(shù)據(jù)集涉及17種編程語(yǔ)言,包括數(shù)值、符號(hào)和正式的數(shù)學(xué)內(nèi)容,共計(jì)110億令牌。

網(wǎng)絡(luò)數(shù)據(jù):研究團(tuán)隊(duì)利用了OpenWebMath數(shù)據(jù)集,這是一個(gè)精選的、與數(shù)學(xué)相關(guān)的高質(zhì)量網(wǎng)絡(luò)頁(yè)面集合,總計(jì)150億令牌。

科學(xué)論文:使用了名為RedPajama的ArXiv子集,其中包含290億令牌。

通用自然語(yǔ)言和代碼數(shù)據(jù):作為訓(xùn)練數(shù)據(jù)的補(bǔ)充,研究團(tuán)隊(duì)還融合了一些通用領(lǐng)域的數(shù)據(jù),并以Proof-Pile-2為主,還融合了Pile數(shù)據(jù)集和RedPajama的GitHub子集。

模型訓(xùn)練

模型初始化:所有模型都從Code Llama初始化,隨后在Proof-Pile-2上接受更多的訓(xùn)練。

訓(xùn)練量:

LLEMMA 7B:2000億令牌的訓(xùn)練。

LLEMMA 34B:500億令牌的訓(xùn)練。

8bee637c-7004-11ee-939d-92fbcf53809c.png

訓(xùn)練工具和硬件:使用GPT-NeoX庫(kù)在256個(gè)A100 40GB GPU上進(jìn)行訓(xùn)練。使用了各種先進(jìn)技術(shù)如Tensor并行、ZeRO Stage 1分片優(yōu)化器狀態(tài)、Flash Attention 2等以提高效率和減少內(nèi)存需求。

訓(xùn)練細(xì)節(jié):

LLEMMA 7B:經(jīng)過(guò)42,000步訓(xùn)練,每個(gè)全局批次有400萬(wàn)令牌,上下文長(zhǎng)度為4096令牌,占用A100大約23,000小時(shí)。學(xué)習(xí)率開(kāi)始從1 × 10^(-4)漸溫,然后逐漸減少。雖然計(jì)劃是48,000步訓(xùn)練,但在42,000步時(shí)由于NaN損失中斷了。

LLEMMA 34B:經(jīng)過(guò)12,000步訓(xùn)練,每個(gè)全局批次有400萬(wàn)令牌,上下文長(zhǎng)度為4096令牌,約占用47,000個(gè)A100小時(shí)。學(xué)習(xí)率從5 × 10^(-5)開(kāi)始逐漸增加,然后逐漸減少。

RoPE調(diào)整:在訓(xùn)練LLEMMA 7B前,RoPE的基本周期從θ = 1,000,000減少到θ = 10,000,目的是為了在LLEMMA 7B上進(jìn)行長(zhǎng)上下文微調(diào)。而LLEMMA 34B維持了θ = 1,000,000的原始設(shè)置。

實(shí)驗(yàn)設(shè)置與評(píng)估結(jié)果

作者通過(guò)少樣本評(píng)估對(duì)LLEMMA模型進(jìn)行比較,并專(zhuān)注于沒(méi)有進(jìn)行微調(diào)的最新模型。具體來(lái)說(shuō),他們使用了使用思維鏈推理和多數(shù)投票,在MATH和GSM8k等基準(zhǔn)上進(jìn)行了評(píng)估。

評(píng)估范圍:

數(shù)學(xué)問(wèn)題求解:測(cè)試模型在思維鏈推理和多數(shù)投票的數(shù)學(xué)問(wèn)題上的表現(xiàn)。

少樣本工具使用和正式定理證明:研究模型在這些方面的表現(xiàn)。

記憶和數(shù)據(jù)混合的影響:分析這些因素如何影響模型的表現(xiàn)。

使用CoT解決數(shù)學(xué)任務(wù)

評(píng)估數(shù)據(jù)集和任務(wù):

MATH:一個(gè)來(lái)自高中數(shù)學(xué)競(jìng)賽的問(wèn)題集,模型必須生成一個(gè)LATEX的解決方案,且其答案需要與參考答案匹配。

GSM8k:包含中學(xué)數(shù)學(xué)問(wèn)題的數(shù)據(jù)集。

OCWCourses:從MIT的開(kāi)放課程Ware提取的STEM問(wèn)題。

MMLU-STEM:MMLU基準(zhǔn)中的18個(gè)子集,涵蓋57個(gè)主題。

SAT:包含2023年5月的SAT考試中不包含圖形的數(shù)學(xué)問(wèn)題的數(shù)據(jù)集。

作者與以下模型進(jìn)行了比較:

Minerva:這個(gè)模型在技術(shù)內(nèi)容的數(shù)據(jù)集上繼續(xù)預(yù)訓(xùn)練了PaLM語(yǔ)言模型。

Code Llama:LLEMMA繼續(xù)預(yù)訓(xùn)練的初始化模型。

Llama 2:Code Llama在代碼上繼續(xù)預(yù)訓(xùn)練的初始化模型。

對(duì)于開(kāi)源的模型,作者使用他們的評(píng)估套件來(lái)報(bào)告分?jǐn)?shù),該套件是Language Model Evaluation Harness的一個(gè)分支。對(duì)于Minerva模型,作者報(bào)告了Lewkowycz等人在2022年文章中的基準(zhǔn)分?jǐn)?shù)。

LLEMMA在Proof-Pile-2上的繼續(xù)預(yù)訓(xùn)練提高了五個(gè)數(shù)學(xué)基準(zhǔn)測(cè)試的少樣本性能。LLEMMA 34B在GSM8k上比Code Llama提高了20個(gè)百分點(diǎn),在MATH上提高了13個(gè)百分點(diǎn);LLEMMA 7B的表現(xiàn)超過(guò)了專(zhuān)有的Minerva模型。到目前為止,LLEMMA在所有開(kāi)放權(quán)重語(yǔ)言模型上均表現(xiàn)最佳。因此,可以得出結(jié)論,Proof-Pile-2上的繼續(xù)預(yù)訓(xùn)練對(duì)于提高預(yù)訓(xùn)練模型的數(shù)學(xué)問(wèn)題解決能力是有效的。

8c04903e-7004-11ee-939d-92fbcf53809c.png

8c1decd2-7004-11ee-939d-92fbcf53809c.png

此外,LLEMMA是在與數(shù)學(xué)相關(guān)的多樣化數(shù)據(jù)上預(yù)訓(xùn)練的,而不是為特定任務(wù)進(jìn)行調(diào)優(yōu)。因此,預(yù)期LLEMMA可以通過(guò)任務(wù)特定的微調(diào)和少樣本提示適應(yīng)許多其他任務(wù)。

調(diào)用計(jì)算工具解決數(shù)學(xué)任務(wù)

這些任務(wù)涉及在有計(jì)算工具的情況下解決問(wèn)題,主要評(píng)估了以下內(nèi)容:

MATH+Python:模型被提示以自然語(yǔ)言交替描述解決方案的步驟,然后使用代碼執(zhí)行該步驟。最后的答案是一個(gè)可以執(zhí)行為數(shù)字類(lèi)型或SymPy對(duì)象的程序。我們的少樣本提示包括使用內(nèi)置數(shù)字操作、math模塊和SymPy的示例。

GSM8k+Python:通過(guò)編寫(xiě)一個(gè)執(zhí)行為整數(shù)答案的Python程序來(lái)解決GSM8k單詞問(wèn)題。我們使用了Gao等人(2023)的提示。

如下表所示,LLEMMA在兩個(gè)任務(wù)上都優(yōu)于Code Llama。它在MATH和GSM8k上使用工具的性能也高于它在沒(méi)有工具的這些數(shù)據(jù)集上的性能。

8c3da8e2-7004-11ee-939d-92fbcf53809c.png

形式化數(shù)學(xué)(數(shù)學(xué)證明)

交互式證明助手,例如Lean和Isabelle,使用特殊的編程語(yǔ)言來(lái)幫助驗(yàn)證數(shù)學(xué)證明。但是,與常見(jiàn)的編程語(yǔ)言相比,這些特殊語(yǔ)言的數(shù)據(jù)非常少。

LLEMMA模型經(jīng)過(guò)進(jìn)一步的預(yù)訓(xùn)練,以處理與這些證明相關(guān)的任務(wù)。在給定問(wèn)題、非正式證明和正式聲明后,LLEMMA可以生成Isabelle代碼的正式證明。此外,模型還可以根據(jù)證明助手給出的狀態(tài),生成證明的下一個(gè)步驟。

8c53de6e-7004-11ee-939d-92fbcf53809c.png

LLEMMA在Proof-Pile-2的預(yù)訓(xùn)練包括從Lean和Isabelle提取的正式數(shù)學(xué)數(shù)據(jù),總計(jì)超過(guò)15億個(gè)標(biāo)記。作者對(duì)LLEMMA在兩個(gè)任務(wù)上的少樣本性能進(jìn)行了評(píng)估:

非正式到正式的證明:根據(jù)非正式的說(shuō)明,為數(shù)學(xué)問(wèn)題生成正式的證明。

正式到正式的證明:在已知的證明步驟中,為下一個(gè)步驟生成代碼。

結(jié)果顯示,LLEMMA在Proof-Pile-2上的繼續(xù)預(yù)訓(xùn)練提高了兩個(gè)正式定理證明任務(wù)的少樣本性能。

8c6b536e-7004-11ee-939d-92fbcf53809c.png

數(shù)據(jù)混合

在訓(xùn)練語(yǔ)言模型時(shí),經(jīng)常會(huì)根據(jù)混合權(quán)重提高訓(xùn)練數(shù)據(jù)中高質(zhì)量子集的樣本頻率。作者通過(guò)在多個(gè)手動(dòng)選擇的混合權(quán)重上進(jìn)行短期訓(xùn)練,然后選擇在高質(zhì)量保留文本上(使用MATH訓(xùn)練集)最小化困惑度的權(quán)重。通過(guò)這種方法,確定了訓(xùn)練LLEMMA的最佳數(shù)據(jù)混合比例為21。

數(shù)據(jù)重疊和記憶

作者檢查了測(cè)試問(wèn)題或解決方案是否出現(xiàn)在語(yǔ)料庫(kù)中。通過(guò)查找與測(cè)試序列中任何30-gram相匹配的文檔確定匹配程度。作者發(fā)現(xiàn)大約7%的MATH測(cè)試問(wèn)題陳述和0.6%的解決方案在語(yǔ)料庫(kù)中有匹配。

在隨機(jī)抽取的100個(gè)匹配中,作者詳細(xì)檢查了測(cè)試問(wèn)題與OpenWebMath文檔之間的關(guān)系。其中,41個(gè)案例沒(méi)有解決方案,49個(gè)提供了與MATH基準(zhǔn)解決方案不同但答案相同的解決方案,9個(gè)答案錯(cuò)誤或缺失,而只有1個(gè)與基準(zhǔn)解決方案相同。

作者進(jìn)一步探索了語(yǔ)料庫(kù)中的問(wèn)題如何影響模型的性能。當(dāng)將LLEMMA-34b應(yīng)用于具有30-gram匹配的測(cè)試示例和沒(méi)有30-gram匹配的測(cè)試示例時(shí),模型在難題上的準(zhǔn)確率仍然較低,例如在具有匹配的Level 5問(wèn)題上的準(zhǔn)確率為6.08%,而在沒(méi)有匹配的問(wèn)題上的準(zhǔn)確率為6.39%。

8c7d175c-7004-11ee-939d-92fbcf53809c.png

作者發(fā)現(xiàn),30-gram匹配與各個(gè)難度級(jí)別的準(zhǔn)確性之間沒(méi)有明確的關(guān)系。這意味著測(cè)試示例和訓(xùn)練文檔之間的重要匹配,并不意味著模型生成了一個(gè)記憶中的正確答案。

此外,作者還檢查了LLEMMA在MATH生成中與OpenWebMath之間的30-gram匹配,發(fā)現(xiàn)了13個(gè)匹配,這些匹配發(fā)生在模型生成了一系列常見(jiàn)的數(shù)字序列時(shí),例如斐波那契數(shù)列,以及一次多項(xiàng)式因式分解的情況。這些觀察結(jié)果值得進(jìn)一步研究。

結(jié)語(yǔ)

在這篇研究中,研究團(tuán)隊(duì)成功地推出了LLEMMA和Proof-Pile-2,這是專(zhuān)為數(shù)學(xué)語(yǔ)言建模設(shè)計(jì)的大語(yǔ)言模型和語(yǔ)料庫(kù)。他們公開(kāi)了模型、數(shù)據(jù)集和相關(guān)代碼。

研究揭示,LLEMMA在開(kāi)放權(quán)重模型的數(shù)學(xué)問(wèn)題解決標(biāo)準(zhǔn)測(cè)試上的表現(xiàn)尤為出眾,它不僅能通過(guò)Python代碼嫻熟地調(diào)用外部工具,還在定理證明中展示了少樣本策略預(yù)測(cè)的高效實(shí)用性。此外,該團(tuán)隊(duì)深入探討了模型在解決數(shù)學(xué)問(wèn)題時(shí)的卓越性能。

LLEMMA的出現(xiàn),為我們展現(xiàn)了數(shù)學(xué)與人工智能融合的新前景。隨著LLEMMA和Proof-Pile-2的應(yīng)用,期望在未來(lái)更能深化對(duì)語(yǔ)言模型的泛化能力、數(shù)據(jù)集結(jié)構(gòu)的認(rèn)知,探索將語(yǔ)言模型作為數(shù)學(xué)助手的可能性,并不斷提升其處理數(shù)學(xué)問(wèn)題的能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3486

    瀏覽量

    49990
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    558

    瀏覽量

    10670
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4825

    瀏覽量

    86176

原文標(biāo)題:開(kāi)源LLEMMA發(fā)布:超越未公開(kāi)的頂尖模型,可直接應(yīng)用于工具和定理證明

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    應(yīng)用于聲音振動(dòng)的高級(jí)信號(hào)處理算法-超越FFT pdf

    應(yīng)用于聲音振動(dòng)的高級(jí)信號(hào)處理算法-超越FFT 議程高級(jí)信號(hào)處理算法時(shí)頻分析小波分析倒譜分析AR建模應(yīng)用實(shí)例軸承故障診斷, 儀表盤(pán)馬達(dá)質(zhì)量檢測(cè), 揚(yáng)聲器生產(chǎn)測(cè)試, … [/hide][此貼子已經(jīng)被作者于2009-10-30 9:01:19編輯過(guò)]
    發(fā)表于 10-30 08:54

    MSO9000的偏斜校準(zhǔn)可以直接應(yīng)用于AUX BNC輸出嗎

    MSO9000系列示波器上的AUX輸出位于設(shè)備背面,有時(shí)在執(zhí)行偏斜校準(zhǔn)時(shí)難以訪問(wèn)。我的問(wèn)題是:Q1)E2655偏移校正夾具直接應(yīng)用于AUX BNC輸出有多重要? Q2)校準(zhǔn)高速探頭時(shí),AUX輸出
    發(fā)表于 01-02 17:00

    開(kāi)源指南針發(fā)布在即:估量有尺,開(kāi)源有道

    難題,此次發(fā)布會(huì)將全面介紹 OSS Compass 背后的理論研究及實(shí)踐成果,同時(shí)還將公布 OSS Compass 開(kāi)源社區(qū)治理結(jié)構(gòu)、評(píng)估工具以及首份開(kāi)源項(xiàng)目評(píng)估白皮書(shū)。
    發(fā)表于 02-17 16:15

    費(fèi)馬大定理證明

    提出了一個(gè)R猜想和定理,運(yùn)用初等數(shù)論證明了此定理和R猜想。再利用R猜想成功地證明了費(fèi)馬大定理;而且反向利用費(fèi)馬大
    發(fā)表于 12-07 13:59 ?18次下載

    柔性射頻濾波器,可直接應(yīng)用于柔性電子無(wú)線射頻通訊

    12日從天津大學(xué)獲悉,該校精密測(cè)試技術(shù)及儀器國(guó)家重點(diǎn)實(shí)驗(yàn)室龐慰團(tuán)隊(duì)在柔性電子設(shè)備實(shí)現(xiàn)高速無(wú)線通訊能力方面取得突破性進(jìn)展,成功開(kāi)發(fā)出了柔性射頻濾波器,可直接應(yīng)用于柔性電子無(wú)線射頻通訊。未來(lái)有望讓
    發(fā)表于 06-20 08:04 ?1497次閱讀

    最大功率傳輸定理證明

    本文首先介紹了最大功率傳輸定理的概念,其次闡述了最大功率傳輸定理證明,最后陳述了最大功率傳輸定理內(nèi)容及使用范圍。
    的頭像 發(fā)表于 08-22 16:51 ?1.9w次閱讀

    到底該怎么將這些頂尖工具用到我的模型里呢?

    然而,讓小編翻開(kāi)他們的paper,發(fā)現(xiàn)每一個(gè)上面都寫(xiě)著四個(gè)大字:“弱者退散”,到底該怎么將這些頂尖工具用到我的模型里呢,Hugging Face 的大神們,緊跟前沿,將所有的預(yù)訓(xùn)練語(yǔ)言模型
    的頭像 發(fā)表于 02-24 10:43 ?2630次閱讀
    到底該怎么將這些<b class='flag-5'>頂尖</b><b class='flag-5'>工具</b>用到我的<b class='flag-5'>模型</b>里呢?

    基于定理證明的內(nèi)存安全驗(yàn)證工具算法綜述

    兩方面的問(wèn)題,是插樁程序的加入可能會(huì)改變?cè)闯绦虻男袨榧罢Z(yǔ)義,二是插樁程序并不能有效保證內(nèi)存安全。為了解決這些問(wèn)題,文中提出了一種使用Coq定理證明器來(lái)判定內(nèi)存安全驗(yàn)證工具算法是否正確的形式化方法,并使用該方法對(duì)
    發(fā)表于 04-20 14:42 ?5次下載
    基于<b class='flag-5'>定理</b><b class='flag-5'>證明</b>的內(nèi)存安全驗(yàn)證<b class='flag-5'>工具</b>算法綜述

    Nano BRK Arduino公開(kāi)發(fā)布開(kāi)源

    電子發(fā)燒友網(wǎng)站提供《Nano BRK Arduino公開(kāi)發(fā)布開(kāi)源.zip》資料免費(fèi)下載
    發(fā)表于 08-24 09:56 ?2次下載
    Nano BRK Arduino<b class='flag-5'>公開(kāi)發(fā)布</b>板<b class='flag-5'>開(kāi)源</b>

    線性電路的基本定理

      作為線性系統(tǒng)(包含線性電路)最基本的性質(zhì)—線性性質(zhì),它包含可加性與齊次性?xún)煞矫妗?疊加定理是可加性的反應(yīng),它是線性電路的一個(gè)重要定理。 可加性的概念可以說(shuō)是貫穿于電路分析之中,并在疊加定理中得到
    的頭像 發(fā)表于 03-09 11:50 ?8088次閱讀
    線性電路的基本<b class='flag-5'>定理</b>

    搭載ESP32芯片,體積小巧,接口方便,上手簡(jiǎn)單,可直接應(yīng)用于物聯(lián)網(wǎng)低功耗項(xiàng)目

    雙電源下自動(dòng)切換電源功能,并支持USB充電方式。體積小巧,接口方便,上手簡(jiǎn)單,可直接應(yīng)用于物聯(lián)網(wǎng)低功耗項(xiàng)目。 BPI-Leaf-S3開(kāi)發(fā)板在軟件方面支持ESP-IDF、Arduino
    的頭像 發(fā)表于 04-18 09:10 ?1994次閱讀

    【開(kāi)發(fā)實(shí)例】搭載ESP32芯片,體積小巧,接口方便,上手簡(jiǎn)單,可直接應(yīng)用于物聯(lián)網(wǎng)低功耗項(xiàng)目

    雙電源下自動(dòng)切換電源功能,并支持USB充電方式。 體積小巧,接口方便,上手簡(jiǎn)單,可直接應(yīng)用于物聯(lián)網(wǎng)低功耗項(xiàng)目。 BPI-Leaf-S3開(kāi)發(fā)板在軟件方面支持ESP-IDF、Arduino
    的頭像 發(fā)表于 04-20 09:40 ?3020次閱讀

    清華等開(kāi)源工具學(xué)習(xí)基準(zhǔn)」ToolBench,微調(diào)模型ToolLLaMA性能超越ChatGPT

    最近,清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室等支持的開(kāi)源社區(qū)OpenBMB (Open Lab for Big Model Base)發(fā)布了ToolBench項(xiàng)目,可以幫助開(kāi)發(fā)者構(gòu)建開(kāi)源、大規(guī)模、高質(zhì)量的指令調(diào)優(yōu)數(shù)據(jù),促進(jìn)構(gòu)建具有通用
    的頭像 發(fā)表于 06-08 11:39 ?821次閱讀
    清華等<b class='flag-5'>開(kāi)源</b>「<b class='flag-5'>工具</b>學(xué)習(xí)基準(zhǔn)」ToolBench,微調(diào)<b class='flag-5'>模型</b>ToolLLaMA性能<b class='flag-5'>超越</b>ChatGPT

    亥姆霍茲定理證明過(guò)程 亥姆霍茲方程的推導(dǎo)

    亥姆霍茲定理證明過(guò)程 亥姆霍茲方程的推導(dǎo) 亥姆霍茲定理(Helmholtz Theorem)是物理學(xué)中的一個(gè)基本定理,描述了向量場(chǎng)的分解和表示問(wèn)題,是研究電磁場(chǎng)、流體力學(xué)等現(xiàn)代物理學(xué)
    的頭像 發(fā)表于 08-29 17:09 ?1.3w次閱讀

    eBay驚現(xiàn)AMD未公開(kāi)發(fā)布的神秘新品:霄龍4004

    近期,ChipHell 論壇網(wǎng)友 zcyandrew 在eBay 發(fā)現(xiàn)了尚未發(fā)布的AMD EPYC 4004 系列處理器,其中包括大量未公開(kāi)的 5820x,以及一款未知型號(hào)的新品。
    的頭像 發(fā)表于 04-28 11:17 ?678次閱讀