女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)自然語言處理

關(guān)注

文章：837 被閱讀：235.2w 粉絲數(shù)：45 關(guān)注數(shù)：0 點贊數(shù)：5

大模型如何快速構(gòu)建指令遵循數(shù)據(jù)集？

構(gòu)造instruction data非常耗時耗力，常受限于質(zhì)量，多樣性，創(chuàng)造性，阻礙了instruc....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-27 16:52 ?3672次閱讀

大模型如何快速構(gòu)建指令遵循數(shù)據(jù)集？

GLoRA—高效微調(diào)模型參數(shù)

近年來，大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的顯著成就徹底改變了人工智能領(lǐng)域，在各種任務(wù)和領(lǐng)域展示了前所未有的性能。

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-27 16:47 ?1070次閱讀

GLoRA—高效微調(diào)模型參數(shù)

面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究

今天我們要講的文本生成是現(xiàn)在最流行的研究領(lǐng)域之一。文本生成的目標是讓計算機像人類一樣學(xué)會表達，目前看....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-26 14:39 ?911次閱讀

面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究

ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42%，在中文榜單位列榜首

在主要評估LLM模型中文能力的 C-Eval 榜單中，截至6月25日 ChatGLM2 模型以 71....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-26 14:30 ?1270次閱讀

ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42%，在中文榜單位列榜首

神經(jīng)編碼器-解碼器模型的歷史

基于 transformer 的編碼器-解碼器模型是表征學(xué)習(xí) 和模型架構(gòu) 這兩個領(lǐng)域多年研究成果....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-20 15:42 ?1136次閱讀

神經(jīng)編碼器-解碼器模型的歷史

基準數(shù)據(jù)集(CORR2CAUSE)如何測試大語言模型(LLM)的純因果推理能力

? 因果推理是人類智力的標志之一。因果關(guān)系NLP領(lǐng)域近年來引起了人們的極大興趣，但其主要依賴于從常識....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-20 15:39 ?2314次閱讀

基準數(shù)據(jù)集(CORR2CAUSE)如何測試大語言模型(LLM)的純因果推理能力

RLHF實踐中的框架使用與一些坑 (TRL, LMFlow)

我們主要用一個具體的例子展示如何在兩個框架下做RLHF，并且記錄下訓(xùn)練過程中我們踩到的主要的坑。這個....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-20 14:36 ?2344次閱讀

RLHF實踐中的框架使用與一些坑 (TRL, LMFlow)

GPT-Engineer一夜爆火！一個提示生成整個代碼庫，GitHub狂飆19k星

網(wǎng)友表示，「澄清問題」是真正使GPT-Engineer脫穎而出的原因，因為修復(fù)生成代碼中的問題往往比....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-20 14:34 ?745次閱讀

GPT-Engineer一夜爆火！一個提示生成整個代碼庫，GitHub狂飆19k星

基于多任務(wù)預(yù)訓(xùn)練模塊化提示

Prompt Tuning 可以讓預(yù)訓(xùn)練的語言模型快速適應(yīng)下游任務(wù)。雖然有研究證明：當訓(xùn)練數(shù)據(jù)足夠多....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-20 11:04 ?903次閱讀

基于多任務(wù)預(yù)訓(xùn)練模塊化提示

智能開源大模型baichuan-7B技術(shù)改進

baichuan-7B 主要是參考LLaMA進行的改進，且模型架構(gòu)與LLaMA一致。而在開源大模型中....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-17 14:14 ?1289次閱讀

分析自動評測器的工具包

除了各類開源模型外，還有GPT-4、PaLM 2等眾多「閉源」模型，甚至還開設(shè)了一個「準中文」排行榜....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-17 14:11 ?746次閱讀

基于 Transformers 的編碼器-解碼器模型

基于 transformer 的編碼器-解碼器模型是表征學(xué)習(xí) 和模型架構(gòu) 這兩個領(lǐng)域多年研究成果....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-16 16:53 ?1209次閱讀

基于 Transformers 的編碼器-解碼器模型

LLM in Medical Domain: 一文速覽大語言模型在醫(yī)學(xué)領(lǐng)域的應(yīng)用

由于在生成長文本的數(shù)據(jù)集上，F(xiàn)lan-PaLM和臨床醫(yī)生的結(jié)果顯示出一定gap。本文提出了使用Ins....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-15 18:00 ?2121次閱讀

LLM in Medical Domain: 一文速覽大語言模型在醫(yī)學(xué)領(lǐng)域的應(yīng)用

王小川大模型首亮相！70億參數(shù)霸榜，清北搶先用

AGIEval評測基準由微軟研究院發(fā)起，旨在全面評估基礎(chǔ)模型在人類認知和問題解決相關(guān)任務(wù)上的能力，包....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-15 17:56 ?869次閱讀

王小川大模型首亮相！70億參數(shù)霸榜，清北搶先用

梁寧：為什么中國沒有像ChatGPT和Vision Pro這樣的創(chuàng)新產(chǎn)品？

相隔 20 多年的時間再回頭看，我比較得意的一件事就是，1996 年我給聯(lián)想的總裁辦做了一次匯報，說....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-15 17:04 ?1405次閱讀

ChatGPT的潛力和局限

? 今天為大家分享一篇研究，當ChatGPT穿越到口袋妖怪世界，是否會理解并應(yīng)用這個虛構(gòu)世界的知識呢....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-13 17:23 ?733次閱讀

為k近鄰機器翻譯領(lǐng)域自適應(yīng)構(gòu)建可解釋知識庫

為了找到NMT模型的潛在缺陷，構(gòu)建更加可解釋的知識庫，我們提出以局部準確性這一新概念作為分析角度。其....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-13 15:25 ?881次閱讀

為k近鄰機器翻譯領(lǐng)域自適應(yīng)構(gòu)建可解釋知識庫

大模型參數(shù)高效微調(diào)技術(shù)原理綜述

神經(jīng)網(wǎng)絡(luò)包含很多全連接層，其借助于矩陣乘法得以實現(xiàn)，然而，很多全連接層的權(quán)重矩陣都是滿秩的。

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-13 14:59 ?2828次閱讀

大模型參數(shù)高效微調(diào)技術(shù)原理綜述

能遵循instruction的句向量模型

句向量技術(shù)是將連續(xù)的文本轉(zhuǎn)化為固定長度的稠密向量，將句子映射到同一個向量空間中

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-13 14:56 ?1218次閱讀

能遵循instruction的句向量模型

基于 RNN 的解碼器架構(gòu)如何建模

? Vaswani 等人在其名作 Attention is all you need 中首創(chuàng)了?基于....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-12 17:08 ?1090次閱讀

基于 RNN 的解碼器架構(gòu)如何建模

Meta開源文本如何生成音樂大模型

年初，谷歌推出了音樂生成大模型 MusicLM，效果非常不錯。有人稱這比大火的 ChatGPT 還重....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-12 15:11 ?1159次閱讀

Meta開源文本如何生成音樂大模型

如何將ChatGPT的能力蒸餾到另一個大模型

如何將ChatGPT的能力蒸餾到另一個大模型，是當前許多大模型研發(fā)的研發(fā)范式。當前許多模型都是采用c....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-12 15:06 ?1832次閱讀

如何將ChatGPT的能力蒸餾到另一個大模型

In-Context-Learning在更大的語言模型上表現(xiàn)不同

最近，在語言模型領(lǐng)域取得了巨大的進展，部分是因為它們可以通過In-Context- Learning....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-12 14:35 ?992次閱讀

In-Context-Learning在更大的語言模型上表現(xiàn)不同

Allen AI推出集成主流大語言模型的LLM-BLENDER框架

在推理階段，計算一個矩陣，該矩陣包含表示成對比較結(jié)果的logits。給定該矩陣，可以推斷給定輸入x的....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-11 15:06 ?933次閱讀

Allen AI推出集成主流大語言模型的LLM-BLENDER框架

使用單卡高效微調(diào)bloom-7b1，效果驚艷

在本文中我們將對QLoRA的基本原理進行介紹，并且在Firefly項目中進行實踐。我們在bloom-....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-08 15:19 ?2430次閱讀

使用單卡高效微調(diào)bloom-7b1，效果驚艷

性能媲美同時成本降低98%，斯坦福提出FrugalGPT，研究卻惹爭議

這項研究提出的思想和發(fā)現(xiàn)為可持續(xù)高效地使用 LLM 奠定了基礎(chǔ)。如果能夠在不增加預(yù)算的情況下采用更高....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-08 15:11 ?606次閱讀

性能媲美同時成本降低98%，斯坦福提出FrugalGPT，研究卻惹爭議

Transformer結(jié)構(gòu)及其應(yīng)用詳解

本文首先詳細介紹Transformer的基本結(jié)構(gòu)，然后再通過GPT、BERT、MT-DNN以及GPT....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-08 09:56 ?2580次閱讀

Transformer結(jié)構(gòu)及其應(yīng)用詳解

從大模型中蒸餾腳本知識用于約束語言規(guī)劃

為了實現(xiàn)日常目標，人們通常會根據(jù)逐步指令來計劃自己的行動。這些指令被發(fā)現(xiàn)是目標導(dǎo)向的腳本，包括一組達....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-08 09:46 ?1407次閱讀

從大模型中蒸餾腳本知識用于約束語言規(guī)劃

LLM時代NLP研究何去何從？

在當前低資源的語言基準上（如FLORES-200）改進機器翻譯性能。針對資源極低的語言，可以利用圣經(jīng)....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-02 15:52 ?1375次閱讀

iPhone都能微調(diào)大模型了嘛

自動測試分數(shù)達到 ChatGPT的99.3%，人類難以分辨兩者的回答…… 這是開源大模型最新成果，....

的頭像

深度學(xué)習(xí)自然語言處理發(fā)表于 06-02 15:26 ?933次閱讀

iPhone都能微調(diào)大模型了嘛

上一頁 1 2 3 4 567 8 9 10 11 28 下一頁