女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

商湯科技大模型產業化路徑的實踐經驗

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2024-09-26 10:11 ? 次閱讀

AI 2.0時代,垂直領域的數據會成為重要的生產資料,并帶來新的生產力突破。” 商湯科技董事長兼CEO徐立在“人工智能與數據要素產業生態大會”上說。

作為第七屆數字中國建設峰會的重要組成部分,人工智能與數據要素產業生態大會在福州正式召開。商湯科技董事長兼CEO徐立與中國工程院院士陳純、中國工程院院士鄧中翰、中國科學院院士林圣彩等一同出席,徐立發表主旨演講,分享了商湯科技在探索新質生產力發展過程中,對于大模型產業化路徑的獨特見解與實踐經驗。

會上,商湯與福建實達集團達成戰略合作,雙方將在人工智能算力建設、智慧城市、智慧應急、人工智能教育、城市能源管理等領域展開合作,推動福建人工智能產業創新,助力“數字中國”建設。

遵循尺度定律,

小模型也能具備大模型的能力

Scaling Law(尺度定律)被認為是大模型時代的“牛頓定律”,也是指導人工智能發展的基本法則,即隨著模型參數量、數據量、算力的增加,模型的性能也會勇往直前不斷提升。 之所以稱之為“尺度定律”而非“規模定律”,因為它是一個資源調配的“指示器”。具體而言,尺度定律具有兩個特性:

可預測性:可以跨越5~7個數量級尺度依然保持對性能的準確預測;

保序性:可以在小尺度上驗證性能優劣,并在更大尺度上依然保持。

尺度定律可以指導我們在有限的研發資源上,找到最優的模型架構和數據配方,讓較小的模型也能具備大模型的能力。

從以上實驗數據可以看出,小模型在優化數據的情況下,性能上可以逼近甚至超越跨數量級的大模型。這背后,主要源于高質量的數據要素。

用戶體驗是大模型最重要標志,

感知理解和內容生成雙輪循環

最新發布的GPT-4o和谷歌Gemini,為AI行業帶來了啟發——流暢的體驗是決定大模型好壞最重要標志。流暢的體驗來自實測問題上的性能,這與數據強相關,而要獲得強大的數據能力,則需打通“感知理解”與“內容生成”的雙輪循環。 回顧過去十年,人工智能主要解決對世界感知理解的問題,今天則進入了生成智能的時代。

如果要提升模型性能,感知理解和內容生成能力兩者需相輔相成,互相協同。理解可以助力生成,而生成又可以反向推動理解能力的提升,進而形成互相循環的飛輪。

商湯「日日新5.0」大模型體系正是通過感知算法和生成算法協同研發,實現了強大的多模態感知理解和生成能力,并帶來了出色的用戶體驗。在感知理解能力方面,不僅可以精準解讀并理解圖像內容,進行問題解答及互動,還能掌握話題及其背后深層含義。如果沒有深層次的多模態感知理解能力,那么大模型的水平只能停留在淺層的知識記憶。

基于深度的多模態理解能力,「日日新5.0」能夠精準理解圖片背后隱藏的中國文化內涵

在生成能力方面,「日日新5.0」建立在深層次的場景和語言理解能力基礎上,由此能夠精準把握畫作中場景氛圍和內容的表達。

人像是評估文生圖能力的關鍵場景之一,「日日新 5.0」生成的人像可以看出非常好皮膚的紋理,而其他幾個大模型在皮膚上都做了磨皮

在很多垂直領域,中國有大量早期發展積累下來的知識,用好這些知識,就能做出差異化的生成效果。在AI 2.0即生成式人工智能時代,垂直領域的數據會成為重要的生產資料,并帶來新的生產力突破。如果模型生產出來之后,又能夠利用好這些數據對外服務,再次數據資產化,就能形成一個不斷迭代的數據飛輪。

高效的響應速度,

是大模型能力產業化的核心

其實,最新的GPT-4o綜合能力略弱于GPT-4,但由于響應速度極快,反而可以帶來更出色的使用體驗。

商湯端側大模型全面對標甚至超過GPT-4。來看一項有趣的評測:將日日新·端側大語言模型SenseChat-Lite和GPT-4都接入到著名街機游戲《街霸》中進行對決。雖然GPT-4能夠輸出連招和復雜的動作,但SenseChat-Lite的出拳速度更快、動作更敏捷,拳拳到位,最終獲得了勝利。

紅色KEN是商湯日日新端側模型操縱,

綠色KEN是GPT-4操縱 這項評測并非比較模型性能的強弱,而是展示了在該場景下,小模型的響應速度更快。所以,只要找到合適的模型,產業化落地也會變得非常快。

SenseChat-Lite 1.8B作為商湯今年4月發布的端側大模型,核心指標全面領先所有開源2B同級別模型,甚至在大部分測試中跨級擊敗了一些7B、13B模型。 當然,單純的端側模型,性能自然比不過千億參數的云端大模型。但通過端云協同方案,將少數任務交給云端完成,而大部分任務放在端側,可以大大減少推理成本和提升響應速度。 比如,在部分特定任務中,只需要調用30%的云端模型能力,就能獲得90%~95%的性能體驗,在不損失精度的同時,降低了70%的推理成本。

在性能方面,商湯的端側大語言模型擁有業內最快的推理速度。比如,人眼睛最快的閱讀數字是每秒20個字,而商湯的端側大語言模型可在旗艦平臺達到78.3字/秒。 擴散模型同樣可在端側實現業內最快的推理速度。在某主流平臺上,商湯端側擴散模型的推理速度單張約1.0秒,比友商云端App快10倍,并且支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

由于響應速度更快,覆蓋面更廣,端側應用是生成式大模型落地的重要載體。

比如日常對話、常識問答、文案生成、相冊管理、圖片生成以及圖片擴展等應用,都可以賦能包括手機、平板電腦VR眼鏡、車載電腦在內的海量終端設備。 《時代周刊》曾在1997年、2015年、2018年分別將克隆羊、VR、人工智能作為封面。但這三個都沒有真正成為用來命名那個時代的要素,原因是沒有真正切入到一個應用來驅動。

去年,《時代周刊》又將ChatGPT放在了封面上,和前面三次選擇不同的是,ChatGPT的核心不在于GPT這項技術,而在于將GPT疊加到了Chat這項應用上。GPT是一個2018年就已經形成共識的技術。 所有技術真正意義上普及的關鍵,在于應用的疊加。中國發展人工智能的最大機會,正是在各種垂直行業的方向上,有著巨大的應用疊加的空間和潛力。

過去幾年,商湯與福建省各地市保持長期緊密合作,從城市治理到算力基礎設施服務、模型和生態層面進行了多項布局。

商湯希望依托福州新區智算平臺,推動閩港合作及各地的生態協同,共同打造以應用為驅動,以數據資產為要素的核心人工智能生態圈,繁榮AI產業發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34196

    瀏覽量

    275345
  • 人工智能
    +關注

    關注

    1804

    文章

    48701

    瀏覽量

    246445
  • 商湯科技
    +關注

    關注

    8

    文章

    552

    瀏覽量

    36651

原文標題:數字中國建設峰會丨商湯科技董事長兼CEO徐立:新質生產力下的大模型產業化

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    安世半導體在全球發展中的實踐經驗與前瞻思考

    此前,4月4日至6日,第28屆哈佛大學中國論壇成功舉辦。聞泰科技半導體業務(安世半導體)董事長兼CEO張學政受邀出席,并在“智能時代的變革與未來”分論壇上發表精彩觀點,與行業領袖共同探討全球、技術迭代與社會責任等議題,分享百年半導體公司在全球發展中的
    的頭像 發表于 04-12 14:52 ?621次閱讀

    商湯科技日日新大模型SenseNova上線聲網云市場

    日前,商湯科技日日新大模型SenseNova即將正式上線聲網云市場,開發者和企業用戶可通過聲網的實時互動云服務進行調用,將商湯領先的模型能力集成到各類應用場景中,快速構建基于日日新大
    的頭像 發表于 04-08 17:24 ?696次閱讀

    格科GC7272榮獲第八屆“IC創新獎”成果產業化

    近日,中國集成電路創新聯盟正式公布第八屆“IC創新獎”獲獎名單。格科GalaxyCore自主研發的觸控顯示驅動集成芯片(TDDI)GC7272憑借超1億顆出貨規模及自主技術產業化成果,榮膺“成果產業化獎”。這一獎項不僅是對格科技術創新的高度認可,更是對其在DDIC領域
    的頭像 發表于 03-25 16:55 ?432次閱讀

    商湯大裝置接入DeepSeek系列模型

    即日起,企業客戶和開發者可在商湯大裝置萬象平臺中,快速部署DeepSeek-V3、DeepSeek-R1等模型,可享受3個月內1000萬tokens免費使用權益。
    的頭像 發表于 02-10 10:16 ?509次閱讀

    商湯科技推出“日日新”融合大模型

    剛剛,商湯正式推出“日日新”融合大模型,領先實現原生融合模態,深度推理能力與多模態信息處理能力均大幅提升,并在兩大權威評測榜單奪得第一,成為“雙冠王”。
    的頭像 發表于 01-10 15:59 ?543次閱讀

    紫光同芯亮相SAECCE 2024汽車芯片關鍵技術及產業化應用論壇

    近日,SAECCE 2024汽車芯片關鍵技術及產業化應用論壇順利舉行。本次活動主要從汽車芯片關鍵技術、核心制造工藝、檢測認證體系建設及產業化應用等方面討論我國當前汽車芯片技術發展及產業生態建設需要
    的頭像 發表于 11-17 09:28 ?697次閱讀

    商湯科技亮相第八屆中國品牌日活動

    商湯科技董事長兼CEO徐立受邀出席中國品牌發展大會圓桌對話,闡述多條關于中國科技創新品牌建設和品牌價值積累的深刻見解和實踐經驗商湯君這里稍作整理分享給大家。
    的頭像 發表于 09-26 10:22 ?717次閱讀

    固態電池產業化加速,企業積極布局市場

    在電動的浪潮席卷全球之際,兩大核心驅動力——技術的持續革新與應用領域的廣泛拓展,正引領著固態電池產業加速邁向產業化。固態電池企業在這一進程中,不僅要深耕技術路徑的優化,還需精準錨定契
    的頭像 發表于 09-20 15:15 ?821次閱讀

    商湯日日新大模型中標上海電信訂單

    近日,中國電信上海公司公布《產數開發代碼助手》項目采購結果:憑借「日日新」大模型出色的代碼能力,商湯科技中標。由「商湯?小浣熊家族」系列產品團隊提供相關業務產品服務支持。
    的頭像 發表于 07-29 14:25 ?785次閱讀

    商湯絕影在行業率先實現原生多模態大模型的車端部署

    “基于原生多模態大模型商湯絕影正在打造一系列全新的車載智能產品,推動智能汽車向超級智能體進化。”商湯科技聯合創始人、首席科學家、絕影智能汽車事業群總裁王曉剛在WAIC 2024
    的頭像 發表于 07-23 10:52 ?808次閱讀
    <b class='flag-5'>商湯</b>絕影在行業率先實現原生多模態大<b class='flag-5'>模型</b>的車端部署

    商湯AI大模型與中國國家籃球隊達成戰略合作

    商湯科技與中國國家籃球隊達成戰略合作,將基于商湯“日日新SenseNova5.5”大模型技術共同打造AI大模型籃球產品,推動AI大模型技術與
    的頭像 發表于 07-17 09:58 ?1074次閱讀

    商湯科技與泰國DTGO集團聯合發布泰語大模型

    。 ? 「東風」泰語大模型結合了商湯與DTGO雙方的專業能力——將商湯的基模型和算力優勢,與DTGO的泰國語言文化優勢相結合, 提供本地
    的頭像 發表于 07-11 19:57 ?1472次閱讀
    <b class='flag-5'>商湯</b>科技與泰國DTGO集團聯合發布泰語大<b class='flag-5'>模型</b>

    商湯科技&quot;日日新SenseNova 5.5&quot;大模型閃耀WAIC,引領AI新紀元

    在近期舉辦的世界人工智能大會(WAIC)上,商湯科技攜其流式多模態交互大模型“日日新SenseNova 5.5”震撼登場,不僅為大會帶來了前所未有的AI體驗,更通過多場主題論壇活動,深入探討了AI大模型在各行各業的應用前景與挑戰
    的頭像 發表于 07-08 16:05 ?973次閱讀

    商湯科技發布日日新5.5大模型體系

    商湯科技近日震撼發布其最新的日日新5.5大模型體系,標志著人工智能領域又邁出了堅實的一步。該體系以6000億參數的超大規模基礎模型——日日新5.5為核心,性能較上一代實現了顯著提升,高達30%的性能飛躍,展現了
    的頭像 發表于 07-08 15:05 ?840次閱讀

    北京銘鎵半導體引領氧化鎵材料創新,實現產業化新突破

    北京順義園內的北京銘鎵半導體有限公司在超寬禁帶半導體氧化鎵材料的開發及應用產業化方面取得了顯著進展,其技術已領先國際同類產品標準。
    的頭像 發表于 06-05 10:49 ?1331次閱讀