女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個(gè)與OpenAI兼容的API服務(wù)呢?

jf_wN0SrCdH ? 來源:Second State ? 2023-11-27 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎(chǔ)模型中微調(diào)而來。Orca 2系列模型擅長推理、文本總結(jié)、數(shù)學(xué)問題解決和理解任務(wù),是在原始 13B Orca 模型的基礎(chǔ)上進(jìn)一步發(fā)展而來,模仿更強(qiáng)大的 AI 系統(tǒng)推理過程從而提高小型模型在復(fù)雜任務(wù)中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設(shè)備上運(yùn)行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

你也可以使用同樣的方式運(yùn)行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術(shù)棧來開發(fā)和部署這個(gè)模型的應(yīng)用程序。無需安裝復(fù)雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術(shù)棧[2]。

在自己的設(shè)備上運(yùn)行 Orca-2-13B

步驟 1:通過以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長時(shí)間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個(gè)跨平臺的可移植 Wasm 文件,用于聊天應(yīng)用。該應(yīng)用能讓你用命令行與模型進(jìn)行交流。戳這里[5]查看該應(yīng)用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來,可以通過輸入以下命令在終端與模型進(jìn)行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個(gè)可移植的 Wasm 應(yīng)用會自動利用你設(shè)備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設(shè)備上,它的速度約為每秒 9.15 個(gè)token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

一個(gè)與 OpenAI 兼容的網(wǎng)絡(luò) API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個(gè) API 服務(wù)器應(yīng)用。它也是一個(gè)可以在許多 CPU 和 GPU 設(shè)備上運(yùn)行的跨平臺可移植 Wasm 應(yīng)用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動模型的 API 服務(wù)器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個(gè)終端,你可以使用 curl 與 API 服務(wù)器進(jìn)行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運(yùn)行 Orca-2-13B 大模型應(yīng)用程序最簡單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • C++語言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    7300
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86741
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13066
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    234

    瀏覽量

    7097
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1208

    瀏覽量

    8919

原文標(biāo)題:跨設(shè)備運(yùn)行微軟最新大語言模型 Orca-2-13B,只需4個(gè)命令行

文章出處:【微信號:Rust語言中文社區(qū),微信公眾號:Rust語言中文社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    安卓原生兼容服務(wù)

    安卓原生兼容服務(wù)器的定義 安卓原生兼容服務(wù)器?指基于Android系統(tǒng)內(nèi)核和服務(wù)框架構(gòu)建的服務(wù)
    的頭像 發(fā)表于 06-19 17:32 ?164次閱讀

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    OpenAI API Key 獲取與使用詳解:從入門到精通 OpenAI 正以其 GPT 和 DALL-E 等先進(jìn)模型引領(lǐng)全球人工智能創(chuàng)新。其 API 為開發(fā)者和企業(yè)提供了強(qiáng)大的 AI
    的頭像 發(fā)表于 05-04 11:42 ?2092次閱讀
    如何獲取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 獲取與代碼調(diào)用示例 (詳解教程)

    HarmonyOS NEXT開發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    。安裝完成后,打開DevEco Studio,創(chuàng)建個(gè)新的鴻蒙應(yīng)用項(xiàng)目,選擇適合的模板(如Empty Ability)。 第二步:安裝CodeGPT插件 在DevEco Studio上安裝插件:打開
    發(fā)表于 03-07 14:56

    openai api key獲取的三種方案(有種可以白嫖到 api key)

    OpenAI API Key 全攻略:官方獲取、費(fèi)用詳解與“白嫖”實(shí)戰(zhàn) 引言: 想要體驗(yàn) OpenAI 強(qiáng)大的 GPT 模型,卻苦于沒有 API Key?別擔(dān)心,本文將為你提供
    的頭像 發(fā)表于 02-24 22:16 ?9809次閱讀
    <b class='flag-5'>openai</b> <b class='flag-5'>api</b> key獲取的三種方案(有<b class='flag-5'>一</b>種可以白嫖到 <b class='flag-5'>api</b> key)

    OpenAI API Key 獲取全攻略:入門、精通與詳解教程(國內(nèi)開發(fā)者優(yōu)化版)

    引言: 想象下:只需幾行代碼,你的應(yīng)用就能像 ChatGPT 樣智能對話;輸入幾個(gè)關(guān)鍵詞,瞬間生成引人入勝的文案;上傳張圖片,AI 就能理解并分析…… 這不是科幻,而是 OpenAI
    的頭像 發(fā)表于 02-15 17:26 ?3537次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key 獲取全攻略:入門、精通與詳解教程(國內(nèi)開發(fā)者優(yōu)化版)

    DeepSeek上調(diào)API服務(wù)價(jià)格

    近日,備受用戶關(guān)注的DeepSeek-V3 API服務(wù)價(jià)格有所調(diào)整。據(jù)了解,此前DeepSeek為吸引用戶體驗(yàn)其服務(wù),推出了45天的優(yōu)惠價(jià)格體驗(yàn)期。然而,該優(yōu)惠期已于2月9日正式結(jié)束
    的頭像 發(fā)表于 02-10 10:41 ?930次閱讀

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    了更加穩(wěn)定、高效的視頻創(chuàng)建體驗(yàn)。 Sora作為款先進(jìn)的視頻處理工具,旨在為用戶提供便捷的視頻創(chuàng)作服務(wù)。然而,在過去的使用過程中,不少用戶反饋視頻創(chuàng)建錯(cuò)誤率較高,影響了整體的使用體驗(yàn)。
    的頭像 發(fā)表于 12-31 10:37 ?537次閱讀

    OpenAI宣布API恢復(fù)運(yùn)行,ChatGPT正在逐步回歸

    近日,OpenAI官方發(fā)布了則重要更新說明,宣布其API系統(tǒng)現(xiàn)已全面恢復(fù)運(yùn)行,同時(shí)確認(rèn)ChatGPT服務(wù)正在逐步恢復(fù)中。這消息對于眾多依
    的頭像 發(fā)表于 12-28 14:41 ?839次閱讀

    OpenAI 發(fā)了個(gè)支持 ESP32 的 Realtime API SDK

    “ ?昨晚 OpenAI 正式發(fā)布了 o3 模型,AI 圈片沸騰。作為電子工程師的我撓了撓頭,好像和我沒什么直接的關(guān)系??倒是 OpenAI 的另一個(gè)小發(fā)布,讓我很感興趣:
    的頭像 發(fā)表于 12-21 11:36 ?6146次閱讀
    <b class='flag-5'>OpenAI</b> 發(fā)了<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>支持 ESP32 的 Realtime <b class='flag-5'>API</b> SDK

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?528次閱讀

    api驅(qū)動的云服務(wù)是什么意思?

    API驅(qū)動的云服務(wù)是指利用API技術(shù)來驅(qū)動和提供云服務(wù)的模式。在這種模式下,云服務(wù)提供商會公開
    的頭像 發(fā)表于 11-14 10:06 ?573次閱讀

    微軟終止中國大陸個(gè)人Azure OpenAI服務(wù),為國內(nèi)大模型帶來機(jī)遇

    2024年10月17日,微軟公司宣布將在中國大陸地區(qū)停止面向個(gè)人用戶的Azure OpenAI服務(wù)。這決定緊隨OpenAI于2024年7月宣布終止對中國大陸提供
    的頭像 發(fā)表于 10-28 14:17 ?1668次閱讀

    華納云:使用 WireMock 在開發(fā)和測試中模擬 API 服務(wù)

    是 WireMock 發(fā)揮作用的地方。 WireMock 是個(gè)開源工具,可以幫助開發(fā)人員創(chuàng)建模擬真實(shí) API 行為的模擬服務(wù)器,為開發(fā)和測
    的頭像 發(fā)表于 10-25 16:46 ?869次閱讀

    esp32上使用chatGPT做些有意思的事情

    ChatGPT獲得響應(yīng),我們需要進(jìn)行以下步驟:1、在OpenAI網(wǎng)站上注冊,并在ESP32上安裝必要的庫。 2、在OpenAI API創(chuàng)建
    的頭像 發(fā)表于 10-18 10:04 ?1068次閱讀

    OpenAI api key獲取并可調(diào)用GPT-4.0、GPT-4o、GPT-4omini

    OpenAI賬戶 驗(yàn)證電子郵件 申請API訪問 獲取API Key 配置和使用API Key 1. 注冊OpenAI賬戶 首先,你需要
    的頭像 發(fā)表于 08-06 15:16 ?4553次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>api</b> key獲取并可調(diào)用GPT-4.0、GPT-4o、GPT-4omini