女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

低成本開(kāi)源聊天機(jī)器人Vicuna:可達(dá)到ChatGPT/Bard 90%以上水平

OSC開(kāi)源社區(qū) ? 來(lái)源:OSC開(kāi)源社區(qū) ? 2023-04-06 11:09 ? 次閱讀

大型語(yǔ)言模型 (LLM) 的快速發(fā)展徹底改變了聊天機(jī)器人系統(tǒng),從而實(shí)現(xiàn)了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的訓(xùn)練和架構(gòu)細(xì)節(jié)仍不清楚,阻礙了該領(lǐng)域的研究和開(kāi)源創(chuàng)新。受 Meta LLaMA 和 Stanford Alpaca 項(xiàng)目的啟發(fā),來(lái)自加州大學(xué)伯克利分校、CMU、斯坦福大學(xué)和加州大學(xué)圣地亞哥分校的成員,共同推出了一個(gè) Vicuna-13B 開(kāi)源聊天機(jī)器人,由增強(qiáng)的數(shù)據(jù)集和易于使用、可擴(kuò)展的基礎(chǔ)設(shè)施支持。

根據(jù)介紹,通過(guò)根據(jù)從 ShareGPT.com (一個(gè)用戶可以分享他們的 ChatGPT 對(duì)話的網(wǎng)站) 收集的用戶共享對(duì)話微調(diào) LLaMA 基礎(chǔ)模型,Vicuna-13B 與 Stanford Alpaca 等其他開(kāi)源模型相比展示了具有競(jìng)爭(zhēng)力的性能。

以 GPT-4 為評(píng)判標(biāo)準(zhǔn)的初步評(píng)估顯示,Vicuna-13B 達(dá)到了 OpenAI ChatGPT 和 Google Bard 90% 以上的質(zhì)量,同時(shí)在 90% 以上的情況下超過(guò)了 LLaMA 和 Stanford Alpaca 等其他模型的表現(xiàn)。訓(xùn)練 Vicuna-13B 成本約為 300 美元。訓(xùn)練和服務(wù)代碼,以及在線演示都是公開(kāi)的,可用于非商業(yè)用途。

f66c4af6-d40b-11ed-bfe3-dac502259ad0.png

為了確保數(shù)據(jù)質(zhì)量,Vicuna 團(tuán)隊(duì)將 HTML 轉(zhuǎn)換回 markdown 并過(guò)濾掉一些不合適或低質(zhì)量的樣本。以及將冗長(zhǎng)的對(duì)話分成更小的部分,以適應(yīng)模型的最大上下文長(zhǎng)度。其訓(xùn)練方法建立在 Stanford Alpaca 的基礎(chǔ)上,并進(jìn)行了以下改進(jìn):

內(nèi)存優(yōu)化:為了使 Vicuna 能夠理解長(zhǎng)上下文,開(kāi)發(fā)團(tuán)隊(duì)將最大上下文長(zhǎng)度從 Alpaca 中的 512 擴(kuò)展到 2048,大大增加了 GPU 內(nèi)存需求。通過(guò)利用 utilizing gradient checkpointing 和 flash attention 來(lái)解決內(nèi)存壓力。

多輪對(duì)話:調(diào)整訓(xùn)練損失以考慮多輪對(duì)話,并僅根據(jù)聊天機(jī)器人的輸出計(jì)算微調(diào)損失。

通過(guò) Spot 實(shí)例降低成本:40 倍大的數(shù)據(jù)集和 4 倍的訓(xùn)練序列長(zhǎng)度對(duì)訓(xùn)練費(fèi)用提出了相當(dāng)大的挑戰(zhàn)。Vicuna 團(tuán)隊(duì)使用 SkyPilot managed spot 來(lái)降低成本,方法是利用更便宜的 spot 實(shí)例以及自動(dòng)恢復(fù)搶占和自動(dòng)區(qū)域切換。該解決方案將 7B 模型的訓(xùn)練成本從 500 美元削減至 140 美元左右,將 13B 模型的訓(xùn)練成本從 1000 美元左右削減至 300 美元。

Vicuna 團(tuán)隊(duì)構(gòu)建了一個(gè)服務(wù)系統(tǒng),該系統(tǒng)能夠使用分布式 workers 為多個(gè)模型提供服務(wù);它支持來(lái)自本地集群和云的 GPU worker 的靈活插件。通過(guò)利用 SkyPilot 中的容錯(cuò)控制器和 managed spot 功能,該服務(wù)系統(tǒng)可以很好地與來(lái)自多個(gè)云的更便宜的 spot 實(shí)例一起工作,以降低服務(wù)成本。它目前是一個(gè)輕量級(jí)的實(shí)現(xiàn),未來(lái)將努力將集成更多的最新研究成果。

具體來(lái)說(shuō),開(kāi)發(fā)團(tuán)隊(duì)首先從 ShareGPT.com 收集了大約 7 萬(wàn)個(gè)對(duì)話,然后增強(qiáng)了 Alpaca 提供的訓(xùn)練腳本,以更好地處理多輪對(duì)話和長(zhǎng)序列;訓(xùn)練在一天內(nèi)在 8 個(gè) A100 GPU 上使用 PyTorch FSDP 完成。為了提供演示服務(wù),他們還實(shí)現(xiàn)了一個(gè)輕量級(jí)的分布式服務(wù)系統(tǒng)。通過(guò)創(chuàng)建一組 80 個(gè)不同的問(wèn)題并利用 GPT-4 來(lái)判斷模型輸出,對(duì)模型質(zhì)量進(jìn)行了初步評(píng)估。為了比較兩個(gè)不同的模型,團(tuán)隊(duì)成員將每個(gè)模型的輸出組合成每個(gè)問(wèn)題的單個(gè)提示。然后將提示發(fā)送到 GPT-4,GPT-4 評(píng)估哪個(gè)模型提供更好的響應(yīng)。

f6b1275c-d40b-11ed-bfe3-dac502259ad0.png

LLaMA、Alpaca、ChatGPT 和 Vicuna 的詳細(xì)對(duì)比如下:

f6e820cc-d40b-11ed-bfe3-dac502259ad0.png

Vicun 團(tuán)隊(duì)展示了 Alpaca 和 Vicuna 對(duì)基準(zhǔn)問(wèn)題的回答示例。在使用 70K 用戶共享的 ChatGPT 對(duì)話對(duì) Vicuna 進(jìn)行微調(diào)后,其發(fā)現(xiàn)與 Alpaca 相比,Vicuna 能夠生成更詳細(xì)、結(jié)構(gòu)更合理的答案,并且質(zhì)量與 ChatGPT 相當(dāng)。

例如,在要求 “撰寫(xiě)一篇引人入勝的旅游博文,介紹最近的夏威夷之行,突出文化體驗(yàn)和必去的景點(diǎn)” 時(shí),GPT-4 的評(píng)價(jià)得分為:Alpaca-13b 7/10,Vicuna-13b 10/10。并闡述理由稱,Alpaca 提供了旅行博文的簡(jiǎn)要概述,但沒(méi)有按照要求實(shí)際撰寫(xiě)博文,導(dǎo)致得分較低。Vicuna-13b 則就最近的夏威夷之行撰寫(xiě)了一篇詳細(xì)而有吸引力的旅游博文,強(qiáng)調(diào)了文化體驗(yàn)和必看的景點(diǎn),完全滿足了用戶的要求,因此獲得了較高的分?jǐn)?shù)。

與此同時(shí),Vicun 的初步發(fā)現(xiàn)表明,在比較聊天機(jī)器人的答案時(shí),GPT-4 可以產(chǎn)生高度一致的等級(jí)和詳細(xì)的評(píng)估。下圖中總結(jié)的基于 GPT-4 的初步評(píng)估顯示,Vicuna 達(dá)到了 Bard/ChatGPT 的 90% 能力。不過(guò)總的來(lái)說(shuō),為聊天機(jī)器人建立一個(gè)評(píng)估系統(tǒng)仍是一個(gè)需要進(jìn)一步研究的開(kāi)放式問(wèn)題。

f70dc6ce-d40b-11ed-bfe3-dac502259ad0.png

Vicun 團(tuán)隊(duì)提出了一個(gè)基于 GPT-4 的評(píng)估框架來(lái)自動(dòng)評(píng)估聊天機(jī)器人的性能。設(shè)計(jì)了八個(gè)問(wèn)題類別,以測(cè)試聊天機(jī)器人性能的各個(gè)方面。并基于每個(gè)類別選擇十個(gè)問(wèn)題,分別由 LLaMA、Alpaca、ChatGPT、Bard 和 Vicuna 生成答案,然后要求 GPT-4 根據(jù)有用性、相關(guān)性、準(zhǔn)確性和細(xì)節(jié)來(lái)評(píng)估答案質(zhì)量。結(jié)果發(fā)現(xiàn) GPT-4 不僅可以產(chǎn)生相對(duì)一致的分?jǐn)?shù),而且可以詳細(xì)解釋為什么給出這樣的分?jǐn)?shù)(詳細(xì)示例鏈接)。但在判斷編碼 / 數(shù)學(xué)任務(wù)方面,GPT-4 則不太擅長(zhǎng)。

f7292e00-d40b-11ed-bfe3-dac502259ad0.png

數(shù)據(jù)表明在超過(guò) 90% 的問(wèn)題中,相較 LLaMA、Alpaca 等,GPT-4 更傾向 Vicuna 生成的答案,并且它實(shí)現(xiàn)了可與專有模型(ChatGPT、Bard)競(jìng)爭(zhēng)的性能。在 45% 的問(wèn)題中,GPT-4 將 Vicuna 的回答評(píng)為優(yōu)于或等于 ChatGPT 的回答。

f764593a-d40b-11ed-bfe3-dac502259ad0.png

總的來(lái)說(shuō),雖然最近行業(yè)發(fā)展如火如荼,但事實(shí)上聊天機(jī)器人仍然面臨局限性,例如難以解決基本的數(shù)學(xué)問(wèn)題或編碼能力有限。且為聊天機(jī)器人開(kāi)發(fā)一個(gè)全面、標(biāo)準(zhǔn)化的評(píng)估系統(tǒng),也是一個(gè)需要進(jìn)一步研究的懸而未決的問(wèn)題。

開(kāi)發(fā)團(tuán)隊(duì)承認(rèn),Vicuna 不擅長(zhǎng)涉及推理或數(shù)學(xué)的任務(wù),并且在準(zhǔn)確識(shí)別自己或確保其輸出的事實(shí)準(zhǔn)確性方面可能存在局限性。此外,它還沒(méi)有得到充分優(yōu)化以保證安全性或減輕潛在的毒性或偏見(jiàn)。為了解決安全問(wèn)題,他們使用 OpenAI moderation API 來(lái)過(guò)濾掉在線演示中不適當(dāng)?shù)挠脩糨斎搿?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3586

    瀏覽量

    43467
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1222

    瀏覽量

    25275
  • 聊天機(jī)器人
    +關(guān)注

    關(guān)注

    0

    文章

    348

    瀏覽量

    12703
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1201

    瀏覽量

    8632

原文標(biāo)題:低成本開(kāi)源聊天機(jī)器人Vicuna:可達(dá)到ChatGPT/Bard 90%以上水平

文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    馬斯克DOGE團(tuán)隊(duì)開(kāi)發(fā)政府AI聊天機(jī)器人

    近日,據(jù)媒體引述消息人士透露,全球首富馬斯克旗下的政府效率部門(DOGE)正著手為美國(guó)聯(lián)邦總務(wù)署(GSA)打造一款定制的生成式人工智能(GenAI)聊天機(jī)器人——GSAi。
    的頭像 發(fā)表于 02-10 18:04 ?586次閱讀

    自然語(yǔ)言處理在聊天機(jī)器人中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,聊天機(jī)器人已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧目蛻舴?wù)到個(gè)人助理,聊天機(jī)器人的應(yīng)用范圍越來(lái)越廣泛。這些機(jī)器人能夠理解用戶的查詢,并提供及時(shí)、準(zhǔn)確的回答,這在很大程度
    的頭像 發(fā)表于 12-05 15:24 ?1034次閱讀

    馬斯克旗下xAI計(jì)劃推出Grok聊天機(jī)器人獨(dú)立應(yīng)用

    近日,據(jù)最新報(bào)道,埃隆·馬斯克旗下的xAI公司計(jì)劃最早于12月推出一款獨(dú)立的聊天機(jī)器人應(yīng)用程序,這款應(yīng)用將圍繞其旗下的Grok聊天機(jī)器人進(jìn)行打造。此舉被視為xAI在聊天機(jī)器人市場(chǎng)的重要布局,旨在
    的頭像 發(fā)表于 11-29 13:38 ?459次閱讀

    NLP技術(shù)在聊天機(jī)器人中的作用

    聊天機(jī)器人,也稱為聊天AI,是一種通過(guò)文本或語(yǔ)音與人類進(jìn)行交流的軟件。它們廣泛應(yīng)用于客戶服務(wù)、在線購(gòu)物、個(gè)人助理等領(lǐng)域。NLP技術(shù)是實(shí)現(xiàn)聊天機(jī)器人智能對(duì)話能力的關(guān)鍵。 1. 理解用戶意圖 NLP技術(shù)
    的頭像 發(fā)表于 11-11 10:33 ?888次閱讀

    ChatGPT 與傳統(tǒng)聊天機(jī)器人的比較

    隨著人工智能技術(shù)的飛速發(fā)展,聊天機(jī)器人已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧暮?jiǎn)單的客服助手到復(fù)雜的個(gè)人助理,這些虛擬助手正在逐漸改變我們與技術(shù)的互動(dòng)方式。在眾多聊天機(jī)器人中,ChatGPT無(wú)疑是
    的頭像 發(fā)表于 10-25 16:16 ?1146次閱讀

    Meta人工智能聊天機(jī)器人進(jìn)軍新市場(chǎng),挑戰(zhàn)ChatGPT

    Meta近日宣布,其人工智能聊天機(jī)器人將進(jìn)軍21個(gè)新市場(chǎng),與OpenAI的ChatGPT展開(kāi)激烈競(jìng)爭(zhēng)。
    的頭像 發(fā)表于 10-11 16:29 ?585次閱讀

    Snapchat聊天機(jī)器人集成谷歌Gemini技術(shù)

    Snap與谷歌云的戰(zhàn)略合作再升級(jí),為Snapchat平臺(tái)注入了新的智能活力。雙方宣布,Snapchat的My AI聊天機(jī)器人將深度集成谷歌Gemini技術(shù),這一創(chuàng)新舉措標(biāo)志著Snapchat在人工智能應(yīng)用領(lǐng)域的又一次飛躍。
    的頭像 發(fā)表于 09-25 14:51 ?505次閱讀

    Meta將推出音頻版聊天機(jī)器人

    Meta公司即將在年度Connect大會(huì)上揭曉一項(xiàng)創(chuàng)新舉措:推出音頻版聊天機(jī)器人。據(jù)可靠消息,Meta已與Judi Dench、Kristen Bell及John Cena等多位國(guó)際知名演員達(dá)成合作
    的頭像 發(fā)表于 09-24 15:18 ?649次閱讀

    聊天機(jī)器人初創(chuàng)公司Character.AI裁員至少5%

    聊天機(jī)器人初創(chuàng)企業(yè)Character.AI近期宣布了一項(xiàng)裁員決定,涉及員工比例至少達(dá)到5%,主要受影響的是營(yíng)銷和招聘團(tuán)隊(duì)。此次調(diào)整被視為公司在面對(duì)市場(chǎng)變化時(shí)做出的戰(zhàn)略優(yōu)化,旨在更加高效地配置資源,以支持其長(zhǎng)期發(fā)展愿景。
    的頭像 發(fā)表于 08-30 15:37 ?523次閱讀

    馬斯克旗下AI初創(chuàng)公司發(fā)布Grok-2聊天機(jī)器人

    埃隆·馬斯克麾下的創(chuàng)新AI企業(yè)xAI今日震撼發(fā)布了其最新力作——Grok-2聊天機(jī)器人,該產(chǎn)品在性能上自信地宣稱已能與業(yè)界巨頭OpenAI、谷歌及Anthropic的頂尖產(chǎn)品并駕齊驅(qū)。
    的頭像 發(fā)表于 08-15 16:05 ?1017次閱讀

    Meta關(guān)閉明星AI聊天機(jī)器人,轉(zhuǎn)向用戶自創(chuàng)AI工具

    7月31日,科技新聞源The Information透露,Meta已悄然終止了其備受矚目的明星AI聊天機(jī)器人項(xiàng)目。這些機(jī)器人曾因能夠模擬著名人物的性格特征并與用戶進(jìn)行互動(dòng),在去年九月的Meta Connect大會(huì)上大放異彩。
    的頭像 發(fā)表于 07-31 16:16 ?964次閱讀

    ShipAny推出AI聊天機(jī)器人服務(wù)

    ShipAny憑借其前瞻性的視野和創(chuàng)新的技術(shù)實(shí)力,邁出了重要的一步——正式推出面向超過(guò)6,000家客戶的AI聊天機(jī)器人服務(wù),這一舉措不僅標(biāo)志著ShipAny在智能物流領(lǐng)域的深度布局,更為其龐大的客戶群體帶來(lái)了前所未有的便捷與高效。
    的頭像 發(fā)表于 07-02 11:07 ?993次閱讀

    谷歌計(jì)劃推出明星網(wǎng)紅AI聊天機(jī)器人,與Meta展開(kāi)技術(shù)競(jìng)爭(zhēng)

    在科技界風(fēng)起云涌的當(dāng)下,谷歌再次憑借其前瞻性的戰(zhàn)略布局和創(chuàng)新能力,成為了公眾關(guān)注的焦點(diǎn)。據(jù)The Information的獨(dú)家爆料,谷歌正秘密研發(fā)一款全新的AI聊天機(jī)器人,該機(jī)器人將基于明星和YouTube網(wǎng)紅的數(shù)據(jù)構(gòu)建,為用戶提供前所未有的互動(dòng)體驗(yàn)。
    的頭像 發(fā)表于 06-26 18:23 ?1304次閱讀

    亞馬遜秘密研發(fā)AI聊天機(jī)器人Metis,挑戰(zhàn)ChatGPT

    科技巨頭亞馬遜近日被曝正在秘密研發(fā)一款代號(hào)為“Metis”的人工智能(AI)聊天機(jī)器人,意圖與OpenAI的ChatGPT一較高下。Metis,這個(gè)名字源于希臘神話中的智慧女神,象征著亞馬遜對(duì)其寄予的厚望與期待。
    的頭像 發(fā)表于 06-26 18:08 ?1314次閱讀

    Meta將推遲在歐洲推出人工智能聊天機(jī)器人

    近日,F(xiàn)acebook的母公司Meta Platforms Inc.宣布,將推遲其在歐洲推出的Meta AI聊天機(jī)器人計(jì)劃。這一決定源于歐洲監(jiān)管機(jī)構(gòu)的要求,要求該公司暫停使用歐洲用戶的帖子來(lái)訓(xùn)練其大型語(yǔ)言模型的計(jì)劃。
    的頭像 發(fā)表于 06-17 14:54 ?739次閱讀