騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

近日，騰訊公司宣布成功推出業(yè)界領(lǐng)先的開源MoE(Mixture of Experts，專家混合)大語言模型——Hunyuan-Large。這款模型不僅在參數(shù)量上刷新了業(yè)界紀(jì)錄，更在效果上展現(xiàn)出了卓越的性能，標(biāo)志著騰訊在自然語言處理領(lǐng)域邁出了重要的一步。

據(jù)了解，Hunyuan-Large的總參數(shù)量高達(dá)389B(即3890億)，這一數(shù)字遠(yuǎn)超當(dāng)前許多主流的大語言模型。而其激活參數(shù)也達(dá)到了驚人的52B(即520億)，這意味著模型在處理復(fù)雜任務(wù)時(shí)能夠展現(xiàn)出更強(qiáng)的學(xué)習(xí)能力和泛化性能。

除了參數(shù)量上的優(yōu)勢(shì)，Hunyuan-Large在訓(xùn)練數(shù)據(jù)上也下足了功夫。據(jù)悉，該模型訓(xùn)練時(shí)所使用的token數(shù)量達(dá)到了7T(即7萬億)，這確保了模型能夠充分學(xué)習(xí)到語言的多樣性和復(fù)雜性。同時(shí)，Hunyuan-Large還支持最大上下文長(zhǎng)度為256K的文本輸入，這一特性使得模型在處理長(zhǎng)文本或?qū)υ拡?chǎng)景時(shí)能夠更準(zhǔn)確地捕捉上下文信息，從而生成更加連貫和自然的回復(fù)。

騰訊此次推出的Hunyuan-Large大語言模型，不僅展示了其在人工智能領(lǐng)域的深厚技術(shù)積累，也為整個(gè)自然語言處理領(lǐng)域的發(fā)展注入了新的活力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
49014

瀏覽量
249412
騰訊

騰訊

+關(guān)注

關(guān)注
7

文章
1678

瀏覽量
50297
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
561

瀏覽量
10788
自然語言

自然語言

+關(guān)注

關(guān)注
1

文章
292

瀏覽量
13654

評(píng)論

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 羅氏線圈電流傳感器的工作原理、結(jié)構(gòu)特點(diǎn)及應(yīng)用
Hot javascript的成熟分類

New TPS62261 2.25MHz 600mA 降壓轉(zhuǎn)換器，采用 2x2mm SON/TSOT23 封裝數(shù)據(jù)手冊(cè)
New TPS62262 2.25MHz 600mA 降壓轉(zhuǎn)換器，采用 2x2mm SON/TSOT23 封裝數(shù)據(jù)手冊(cè)

精選推薦
更多

文章

資料

帖子

行業(yè)AI先鋒，為何網(wǎng)絡(luò)先行？

腦極體
3小時(shí)前

194 閱讀

12V-24V電壓適配的空氣凈化器驅(qū)動(dòng)方案，零速度閉環(huán)控制下的順風(fēng)逆風(fēng)啟動(dòng)--【其利天下】

其利天下技術(shù)
4小時(shí)前

180 閱讀

納芯微固態(tài)繼電器NSI7258在絕緣監(jiān)測(cè)電路中的應(yīng)用

米芯微電子
6小時(shí)前

284 閱讀

RT-Thread Nano硬核移植指南：手把手實(shí)現(xiàn)VGLite圖形驅(qū)動(dòng)適配 | 技術(shù)集結(jié)

RT-Thread官方賬號(hào)
7小時(shí)前

272 閱讀

基于FPGA實(shí)現(xiàn)FOC算法之PWM模塊設(shè)計(jì)

FPGA研究院
6小時(shí)前

279 閱讀

盤點(diǎn)六大常見通訊接口，拿捏不定就選他們吧

Hx
237KB

免費(fèi)

139下載

openharmony第三方組件適配移植的反彈動(dòng)畫框架教程

姚小熊27
1.84 MB

免費(fèi)

2下載

Karmada云原生多云容器編排系統(tǒng)

哈哈哈
19.76 MB

2積分

1下載

Segger J-link到Tag-Connect TC2050適配器

tr4578
0.02 MB

2積分

9下載

單片機(jī)控制蜂鳴器音樂資料分享

羅生
0.67 MB

免費(fèi)

80下載

HarmonyOS AI輔助編程工具（CodeGenie）代碼智能解讀

李洋水蛟龍
21小時(shí)前

83 閱讀

ADI_PCB設(shè)計(jì)秘籍

yuu_cool
21小時(shí)前

142 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗(yàn)】+車牌識(shí)別處理與應(yīng)用方法

jinglixixi
21小時(shí)前

179 閱讀

【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書籍介紹+第一章讀后心得

jf_83922529
21小時(shí)前

190 閱讀

【中科昊芯Core_DSC280025C開發(fā)板試用體驗(yàn)】+SCI測(cè)試與代碼解讀

安安踢球球
21小時(shí)前

206 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

評(píng)論

搭建開源大語言模型服務(wù)的方法

開放原子開源大賽助力輕量級(jí)大語言模型應(yīng)用落地

PerfXCloud順利接入MOE大模型DeepSeek-V2

Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用