女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟開源“傻瓜式”類ChatGPT模型訓練工具

OSC開源社區 ? 來源:OSC開源社區 ? 2023-04-14 09:36 ? 次閱讀

在利用 OpenAI 的 GPT-4 為 Bing Chat、 Bing Image Creator、Microsoft 365 Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了類似 ChatGPT 的功能后。微軟現又宣布推出 DeepSpeed-Chat,一種用于 RLHF 訓練的低成本開源解決方案,基于微軟開源的深度學習優化庫 DeepSpeed;聲稱即使是使用單個 GPU,任何人也都可以創建高質量的 ChatGPT 式模型。

該公司表示,盡管開源社區付出了巨大的努力,但目前仍缺乏一個支持端到端的基于人工反饋機制的強化學習(RLHF)的規模化系統,這使得訓練強大的類 ChatGPT 模型十分困難。ChatGPT 模型的訓練是基于 InstructGPT 論文中的 RLHF 方式,與常見的大語言模型的預訓練和微調截然不同,使得現有深度學習系統在訓練類 ChatGPT 模型時存在種種局限。因此,為了讓 ChatGPT 類型的模型更容易被普通數據科學家和研究者使用,并使 RLHF 訓練真正普及到 AI 社區,他們發布了 DeepSpeed-Chat。

8e39ca58-d9e7-11ed-bfe3-dac502259ad0.png

DeepSpeed-Chat 具有以下三大核心功能:

簡化 ChatGPT 類型模型的訓練和強化推理體驗:只需一個腳本即可實現多個訓練步驟,包括使用 Huggingface 預訓練的模型、使用 DeepSpeed-RLHF 系統運行 InstructGPT 訓練的所有三個步驟、甚至生成你自己的類 ChatGPT 模型。此外,還提供了一個易于使用的推理 API,用于用戶在模型訓練后測試對話式交互。

DeepSpeed-RLHF 模塊:DeepSpeed-RLHF 復刻了 InstructGPT 論文中的訓練模式,并確保包括 a) 監督微調(SFT),b) 獎勵模型微調和 c) 基于人類反饋的強化學習(RLHF)在內的三個步驟與其一一對應。此外,還提供了數據抽象和混合功能,以支持用戶使用多個不同來源的數據源進行訓練。

DeepSpeed-RLHF 系統:其將 DeepSpeed 的訓練(training engine)和推理能力(inference engine) 整合到一個統一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 訓練。DeepSpeed-HE 能夠在 RLHF 中無縫地在推理和訓練模式之間切換,使其能夠利用來自 DeepSpeed-Inference 的各種優化,如張量并行計算和高性能 CUDA 算子進行語言生成,同時對訓練部分還能從 ZeRO- 和 LoRA-based 內存優化策略中受益。DeepSpeed-HE 還能夠自動在 RLHF 的不同階段進行智能的內存管理和數據緩存。

文檔內容指出,DeepSpeed Chat 與其他先進方案相比的優勢在于:效率和經濟性方面比現有系統快 15 倍以上,在 Azure 云上只需 9 小時即可訓練一個 OPT-13B 模型,只需 18 小時既可訓練 OPT-30B 模型,分別花費不到 300 美元和 600 美元。

在速度和可擴展性方面,即使是 13B 的模型也可以在 1.25 小時內訓練,龐大的 175B 模型可以在不到一天的時間內使用 64 個 GPU 集群進行訓練。在 RLHF 的可訪問性和普及化方面,則可以在單個 GPU 上訓練超過 130 億參數的模型。此外還支持在相同的硬件上分別運行 6.5B 和 50B 的模型,實現高達 7.5 倍的提升。

8e44b440-d9e7-11ed-bfe3-dac502259ad0.png

8e6634f8-d9e7-11ed-bfe3-dac502259ad0.png

8e7a9b3c-d9e7-11ed-bfe3-dac502259ad0.png

盡管近期關于對 ChatGPT 類大語言模型發展的反對和擔憂之聲不斷,但微軟似乎仍在全力推進其 AI 開發。對于微軟的此次發布,前 Meta AI 專家 Elvis 也激動地表示,DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一個端到端的 RLHF 管道來訓練類似 ChatGPT 的模型,解決的是成本和效率方面的挑戰。這是 “微軟令人印象深刻的開源努力。..。.. 是一件大事”。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6673

    瀏覽量

    105367
  • 深度學習
    +關注

    關注

    73

    文章

    5554

    瀏覽量

    122479
  • ChatGPT
    +關注

    關注

    29

    文章

    1587

    瀏覽量

    8797

原文標題:微軟開源“傻瓜式”類ChatGPT模型訓練工具,提速省錢15倍

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    傻瓜式操作!燈具外殼氣密性檢測儀上手就會

    在燈具生產過程中,確保外殼的氣密性至關重要。而如今,有了先進的燈具外殼氣密性檢測儀,檢測工作變得輕松便捷,真正實現了“傻瓜式操作”,讓你上手就會。首先,在開始檢測前,只需將燈具外殼放置在檢測儀的特定
    的頭像 發表于 05-05 14:56 ?97次閱讀
    <b class='flag-5'>傻瓜式</b>操作!燈具外殼氣密性檢測儀上手就會

    如何高效訓練AI模型?這些常用工具你必須知道!

    模型的發展同樣面臨瓶頸,訓練所需的硬件資源日益增加,比如英偉達的芯片、電力等(這也可能是ChatGPT5遲遲沒有出來的原因)。業界有觀點認為,在大多數情況下,并不需要全能的大模型,而
    的頭像 發表于 04-17 16:43 ?1418次閱讀
    如何高效<b class='flag-5'>訓練</b>AI<b class='flag-5'>模型</b>?這些常用<b class='flag-5'>工具</b>你必須知道!

    恩智浦eIQ Time Series Studio工具使用教程之模型訓練

    大家好,eIQ Time SeriesStudio又和大家見面啦!本章為大家帶來工具核心部分-模型訓練
    的頭像 發表于 03-25 15:25 ?757次閱讀
    恩智浦eIQ Time Series Studio<b class='flag-5'>工具</b>使用教程之<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>

    構建開源OpenVINO?工具套件后,模型優化器位于何處呢?

    構建開源OpenVINO?工具套件后,模型優化器位于何處?
    發表于 03-06 08:18

    模型訓練:開源數據與算法的機遇與挑戰分析

    進行多方位的總結和梳理。 在第二章《TOP 101-2024 大模型觀點》中,蘇州盛派網絡科技有限公司創始人兼首席架構師蘇震巍分析了大模型訓練過程中開源數據集和算法的重要性和影響,分析
    的頭像 發表于 02-20 10:40 ?487次閱讀
    大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>:<b class='flag-5'>開源</b>數據與算法的機遇與挑戰分析

    【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙

    ,NVDIA與微軟的競爭 。計算能力的飛速提升是大模型得以興起的重要基石。GPU/TPU 等高性能計算設備的迅猛發展,宛如為大模型訓練打造了一臺強大的引擎。它們能夠以極高的速度處理海
    發表于 12-24 13:10

    開源AI模型庫是干嘛的

    開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經過訓練,能夠執
    的頭像 發表于 12-14 10:33 ?693次閱讀

    微軟否認使用用戶數據訓練AI模型

    近日,微軟公司正式否認了一項關于其使用Microsoft 365應用程序中客戶數據來訓練人工智能模型的指控。這一聲明旨在澄清近期在社交媒體上流傳的某些用戶的疑慮和誤解。 此前,部分用戶在社交媒體平臺
    的頭像 發表于 12-02 10:33 ?400次閱讀

    什么是大模型、大模型是怎么訓練出來的及大模型作用

    ,基礎模型。 ? 大模型是一個簡稱,完整的叫法,應該是“人工智能預訓練模型”。預訓練,是一項技術,我們后面再解釋。 ? 我們現在口頭上常說
    的頭像 發表于 11-25 09:29 ?1.2w次閱讀
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么<b class='flag-5'>訓練</b>出來的及大<b class='flag-5'>模型</b>作用

    如何在 PyTorch 中訓練模型

    PyTorch 是一個流行的開源機器學習庫,廣泛用于計算機視覺和自然語言處理等領域。它提供了強大的計算圖功能和動態圖特性,使得模型的構建和調試變得更加靈活和直觀。 數據準備 在訓練模型
    的頭像 發表于 11-05 17:36 ?855次閱讀

    ChatGPT:怎樣打造智能客服體驗的重要工具

    ChatGPT作為智能對話生成模型,可以幫助打造智能客服體驗的重要工具。以下是一些方法和步驟:1.數據收集和準備:收集和整理與客服相關的數據,包括常見問題、回答示例、客戶對話記錄等。這將用于
    的頭像 發表于 11-01 11:12 ?397次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗的重要<b class='flag-5'>工具</b>?

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具
    的頭像 發表于 10-24 09:39 ?866次閱讀

    llm模型chatGPT的區別

    基于Transformer架構的預訓練語言模型,它可以生成連貫、自然的文本。ChatGPT使用GPT模型作為基礎,通過微調和訓練來實現對話生
    的頭像 發表于 07-09 09:55 ?1875次閱讀

    解讀PyTorch模型訓練過程

    PyTorch作為一個開源的機器學習庫,以其動態計算圖、易于使用的API和強大的靈活性,在深度學習領域得到了廣泛的應用。本文將深入解讀PyTorch模型訓練的全過程,包括數據準備、模型
    的頭像 發表于 07-03 16:07 ?1727次閱讀

    英偉達開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉達宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發者們打開了通往高性能大型語言模型(LLM)訓練的新天地。該系列
    的頭像 發表于 06-17 14:53 ?830次閱讀