女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

錯誤使用GPT-3:成本卻降低了40倍,速度提高了5倍

jf_WZTOguxH ? 來源:Buildt ? 2023-03-01 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Buildt 使用 OpenAI 基礎模型已經有一段時間了。這些模型非常強大,關于這一點,互聯網上已經有了大量的記錄,特別是隨著 ChatGPT 的出現,它的關注度超過了之前 GPT-3 的 100 倍。然而,在應用這些模型解決相應問題(代碼庫搜索、理解和增強)的過程中,我們發現了一個明顯的障礙:延遲和成本。比較大的模型(特別是 davinci 家族)無疑能產生最高質量的輸出,但運行起來也最慢、最昂貴。

要獲得良好的搜索體驗,顯然速度就得快。你看谷歌,100 毫秒就可以索引數百萬個網頁,代碼庫搜索也是如此。我們發現,在單個搜索中,其中一個最耗時的點就是生成輸出的 LLM 層(我們使用 LLM 來增強搜索,讓你可以搜索代碼是什么,而不是它做什么,例如“找出最慢的遞歸函數”)。Alex grave 是 Github Copilot 的創建者之一。據他說,每增加 10 毫秒的延遲,完成率就會下降 1%。這一邏輯也適用于搜索。所以,當務之急是從 davinci 這樣的大型模型轉向 ada 和 babbage 這樣的小型模型。

92440896-b1cb-11ed-bfe3-dac502259ad0.png

我們的解決方案很簡單,對于給定的任務,由 davinci 生成一個中等大小的語料庫,并精心優化像 babbage 這樣的模型來完成相同的任務。如果操作得當,你可以以低 40 倍的成本、低 4-5 倍的延遲獲得幾乎相同的完成率(或至少 90% 的相似性)。

如果你愿意花點時間,則還可以在循環中加一個人:我們最近就做了這樣的事情來優化 babbage 模型,以便能夠識別代碼的特征,所以我讓 ChatGPT 幫我創建了一個基本的 Web UI,讓我們可以輕松地審核和改進 davinci 所的識別結果;從根本上說,你永遠無法從一個更小的模型那里獲得類似的性能,所以讓完成率勝過你試圖模仿的模型,意味著你至少在訓練完成時就比較接近。

9264637a-b1cb-11ed-bfe3-dac502259ad0.jpg

關于這種技術,我想的最多的一個問題是:我需要多少樣本?答案恐怕是“視情況而定”。

根據經驗,如果你只是想標準化平淡無奇的輸出格式,那么你可以用幾百個樣本;如果你是在做邏輯推理,那么你至少需要 1000 個樣本;如果你在做 DSL 工作,那么你需要幾千個樣本。樣本大小通常會是一個障礙,但有了用更大的模型來生成合成數據集的方法,那突然變得比較容易處理了,特別是當這些模型變得越來越好時。

這種方法有很多應用場景;如果你有一個提示符,它可以重復做同樣的工作,那么你就可以使用這項技術來加快速度,降低成本。

有人問過我這種方法的維護問題,特別是如果想要更改輸出結構時會出現什么情況。我們內部構建了一個經過精心優化的管道來自動化整個過程,其底層是 davinci-003 提示符,然后我們用它來生成 n 個合成樣本,格式化后傳遞給 OpenAI 調優 API,它會吐出一個調優過的模型。這樣,如果你想更改提示符的輸出,只需一次單擊就可以更新一個調優過的模型。

我總是很樂意談論這個話題,歡迎在 Twitter 上關注我(@AlistairPullen),我上面描述的所有內容都可以在我們的代碼搜索工具 Buildt 中找到。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3516

    瀏覽量

    50362
  • OpenAI
    +關注

    關注

    9

    文章

    1206

    瀏覽量

    8875

原文標題:錯誤使用 GPT-3:成本卻降低了40 倍,速度提高了5 倍

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DeepSeek最新論文:訓練速度提升9,推理速度快11

    是上一代Grok2的15左右。在Benchmarks中,Grok3毫無懸念成功地領先Deepseek R1、o3 mini等對手。 ? 不過用如此大規模的算力集群,花費上一代15
    的頭像 發表于 02-20 11:25 ?2049次閱讀
    DeepSeek最新論文:訓練<b class='flag-5'>速度</b>提升9<b class='flag-5'>倍</b>,推理<b class='flag-5'>速度</b>快11<b class='flag-5'>倍</b>!

    EP磁致伸縮位移傳感器助力汽車輪轂制造突破生產瓶頸

    博爾森EP磁致伸縮位移傳感器是氣動門控制系統的核心組件,采用國產技術實現100%自主可控。通過優化氣動門開關速度降低了企業運營成本提高了生產效率。同時,通過提供高精度反饋,
    的頭像 發表于 03-09 11:56 ?345次閱讀
    EP磁致伸縮位移傳感器助力汽車輪轂制造突破生產瓶頸

    Profinet 轉 Modbus TCP 借網關達成西門子 PLC 與福伺服傳感器連接

    了每個零部件的裝配質量,產品的一致性和可靠性,減少了因裝配誤差導致的產品缺陷和召回風險,提升了整車的質量和安全性。同時,提高了裝配效率,縮短了生產周期,降低了生產成本
    的頭像 發表于 02-27 14:49 ?368次閱讀
    Profinet 轉 Modbus TCP 借網關達成西門子 PLC 與<b class='flag-5'>倍</b>福伺服傳感器連接

    OpenAI GPT-5開發滯后:訓練成本高昂

    近日,據最新消息,OpenAI在推進其備受期待的下一代旗艦模型GPT-5的開發進程上遇到了困難。由于計算成本高昂且高質量訓練數據稀缺,GPT-5的開發已經落后于原定計劃半年之久。 據悉,OpenAI
    的頭像 發表于 12-23 11:04 ?724次閱讀

    為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了

    。(AMC1304x-Q1) 為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了? 為什么隔離ADC都是基于 Δ-Σ 調制器的,其他結構的(比如SAR)沒有?
    發表于 12-06 06:42

    科學家將拉曼光譜的測量速率提高100

    Ideguchi 將拉曼光譜的測量速率提高了100,拉曼光譜是一種測量分子 “振動指紋”以識別分子的常用技術。 由于測量速率一直是一個主要的限制因素,這一改進有助于在許多依賴于識別分子和細胞的領域(如
    的頭像 發表于 11-15 06:24 ?336次閱讀

    使用TPA6111A2提高放大倍數為2時發熱嚴重,為什么?

    問題:使用TPA6111A2,當放大倍數為1時,R1=20K,其反饋電阻RF=22K,空載時候電壓不升高,不發熱.而當我要提高放大倍數為2時候,反饋電阻RF=51K的時候,空載時電壓升高發熱,負載時電壓
    發表于 11-07 07:25

    6G測試速度達938Gbps,比5G速度快5000

    G智能手機網絡連接速度的5000。典型的5G運行速度約為200Mbps,而在實際使用中,由于信號連接問題,其提供的速度往往遠低于100Mb
    的頭像 發表于 10-22 16:27 ?1217次閱讀

    使用TPS5401提高了電表脫扣離線電源的負載電流能力

    電子發燒友網站提供《使用TPS5401提高了電表脫扣離線電源的負載電流能力.pdf》資料免費下載
    發表于 10-10 10:26 ?0次下載
    使用TPS5401<b class='flag-5'>提高了</b>電表脫扣離線電源的負載電流能力

    壓整流的缺點有哪些

    缺點,以下是對這些缺點的分析: 效率問題 : 壓整流電路的效率通常低于全波整流電路。這是因為在壓整流中,每個二極管在每個周期內只導通一半的時間,而全波整流則有兩個二極管在每個周期內導通,從而提高了效率。
    的頭像 發表于 10-09 11:11 ?1382次閱讀

    TPL7407L提高了外圍驅動的散熱和能效

    電子發燒友網站提供《TPL7407L提高了外圍驅動的散熱和能效.pdf》資料免費下載
    發表于 10-08 09:55 ?0次下載
    TPL7407L<b class='flag-5'>提高了</b>外圍驅動的散熱和能效

    英偉達預測機器人領域或迎“GPT-3時刻”

    未來2-3年內,機器人基礎模型的研究將迎來重大突破,這一時刻被形象地比喻為機器人領域的“GPT-3時刻”。
    的頭像 發表于 09-20 17:05 ?1072次閱讀

    Jim Fan展望:機器人領域即將迎來GPT-3式突破

    英偉達科學家9月19日,科技媒體The Decoder發布了一則引人關注的報道,英偉達高級科學家Jim Fan在近期預測,機器人技術將在未來兩到三年內迎來類似GPT-3在語言處理領域的革命性突破,他稱之為機器人領域的“GPT-3時刻”。
    的頭像 發表于 09-19 15:13 ?934次閱讀

    請問OPA690可以用作5或者10的放大嗎?電阻如何選擇?

    ,店里工作正常。 但是放大倍數只有兩,能不能制出5或者10的放大電路?這阻值如何設置?我試過了很多的阻值都不行!
    發表于 09-12 06:10

    聲發射系統的技術指標:最高采樣速度的選擇

    雖然理論上采樣速度越高獲得的數字信號越完整,但考慮到實際應用的成本,無法實現無限高甚至過高,只能選擇合理(即滿足應用要求)的采樣速度。例如,采樣速度
    的頭像 發表于 08-26 17:30 ?739次閱讀
    聲發射系統的技術指標:最高采樣<b class='flag-5'>速度</b>的選擇