商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標(biāo)GPT-4 Turbo
4月23日,商湯科技董事長兼CEO徐立在2024商湯技術(shù)交流日上發(fā)布了行業(yè)首個(gè)云、端、邊全棧大模型產(chǎn)品矩陣,能夠滿足不同規(guī)模場景應(yīng)用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標(biāo)GPT-4 Turbo。
此外對于文生視頻徐立也表示商湯科技很快就會(huì)發(fā)布相關(guān)的平臺(tái)產(chǎn)品。
備受矚目的商湯科技“日日新SenseNova” 5.0多模態(tài)大模型獨(dú)特地采用了混合專家(MoE)架構(gòu),能夠無縫支持多達(dá)10T Tokens的中英文訓(xùn)練數(shù)據(jù),并在此基礎(chǔ)上,推理合成數(shù)據(jù)更是可高達(dá)數(shù)千億Token。尤為值得一提的是,該模型在進(jìn)行推理計(jì)算時(shí),其上下文窗口可以擴(kuò)展至約200K Token范圍,使得其綜合能力中的知識(shí)、推理、數(shù)學(xué)、代碼等方面均能全面對標(biāo)GPT-4Turbo。
商湯科技的領(lǐng)導(dǎo)團(tuán)隊(duì)表示,這是業(yè)界首個(gè)真正意義上的“云、端、邊”全棧大模型產(chǎn)品矩陣,旨在滿足各種規(guī)模場景的應(yīng)用需求。他們堅(jiān)信,公司的技術(shù)領(lǐng)先地位將進(jìn)一步加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,從而實(shí)現(xiàn)大模型的按需所取。
商湯科技的董事長兼首席執(zhí)行官徐立先生表示,在遵循尺度定律(Scaling Law)的原則下,商湯科技始終致力于推動(dòng)自身大模型的研發(fā)工作,并將持續(xù)探索大模型能力的KRE三層架構(gòu)(知識(shí)-推理-執(zhí)行),不斷突破大模型能力的邊界。他充滿信心地指出,“我們深信,2024年將會(huì)是端側(cè)大模型爆發(fā)的重要年份。”
據(jù)了解,自去年4月首次亮相以來,商湯科技的“日日新SenseNova”大模型體系已經(jīng)成功推出了五個(gè)重大版本迭代。而此次的更新重點(diǎn)則集中在提升了知識(shí)、數(shù)學(xué)、推理以及代碼能力等多個(gè)方面,全面對標(biāo)GPT-4 Turbo,并在主流客觀評測中達(dá)到甚至超過了GPT-4 Turbo的水平。
-
商湯科技
+關(guān)注
關(guān)注
8文章
554瀏覽量
36661 -
大模型
+關(guān)注
關(guān)注
2文章
3033瀏覽量
3835
發(fā)布評論請先 登錄
商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單
商湯科技推出“日日新”融合大模型
商湯日日新多模態(tài)大模型權(quán)威評測第一
訊飛星火大模型技術(shù)進(jìn)展及落地
訊飛星火大模型4.0 Turbo正式發(fā)布
Llama 3 與 GPT-4 比較
科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo
訊飛星火內(nèi)容運(yùn)營大師新增三大功能
云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

云知聲推出山海多模態(tài)大模型
商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署

商湯科技推出SenseFoundry-VL方舟多模態(tài)新智平臺(tái)

商湯“日日新”大模型全面賦能2024 WAIC
OpenAI推出新模型CriticGPT,用GPT-4自我糾錯(cuò)
OpenAI API Key獲取:開發(fā)人員申請GPT-4 API Key教程

評論