女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實踐

NVIDIA英偉達 ? 來源:未知 ? 2022-12-05 21:20 ? 次閱讀

NVIDIA 四大主題論壇

全棧式解決方案

為您啟動 AI 引擎

12 月 8 日-10 日,CNCC 邀您共赴 “計算之約”。以算力、數據、生態為主題,本屆 CNCC 首次全面改為線上舉辦,但規模可說是史上之 “最” :邀請嘉賓包括 ACM 圖靈獎獲得者、田納西大學教授 Jack Dongarra,以及多位院士及專家,還有七百余位國內外名校學者、名企領軍人物、各領域極具影響力的業內專家。

今年,NVIDIA會在CNCC帶來涵蓋DPU、元宇宙、超大模型的推理和部署實踐三大主題的演講論壇和面向開發者的CUDA Python線上編程培訓實驗論壇,內容豐富、干貨滿滿、場場精彩!(* NVIDIA 將免費放送四大論壇,線上票價值 1080 元,千萬別錯過)

NVIDIA 在 CNCC 主題論壇概覽

時間

主題

12 月 8 日(星期四)1330

探索 DPU 應用場景

加速云原生基礎設施創新

12 月 8 日(星期四)1900

如何利用元宇宙相關技術

實現虛擬世界和現實世界的連接

12 月 9 日(星期五)1330

超大模型的推理和部署實踐

12 月 10 日(星期六)1330

基于 Python 的 CUDA 編程入門

培訓及線上編程體驗

在 8 號的“為數據中心不斷“減負” :探索 DPU 應用場景加速云原生基礎設施創新”、穿梭虛實之間,元宇宙技術是如何做到的兩期主題論壇之后。

這一程,NVIDIA 將攜手百度、騰訊、小冰,于 12 月 9 日下午共同解讀《超大模型的推理和部署實踐》。論壇云集技術大牛,您將了解:

  • 飛槳超大模型的壓縮和推理優化;

  • 基于精調、蒸餾和壓縮的大模型落地應用;

  • 通往高參數效用比的自然語言處理;

  • “小冰”如何利用 FasterTransformer 實現大規模語言模型的產品級部署等內容。

對超大模型推理及其具體應用感興趣的小伙伴們,

下方查看會議詳情!

超大模型的推理和部署實踐

12 月 9 日,星期五,1330

線上會議室 6

隨著 AI 的發展,創新和數據復雜性不斷提升,超大規模成為必然趨勢。通過本次分論壇,您將了解飛槳超大模型的壓縮和推理優化;基于精調、蒸餾和壓縮的大模型落地應用;通往高參數效用比的自然語言處理;如何利用 FasterTransformer 實現大規模語言模型的產品級部署,以及 Transformer 模型在 TensorRT 上的推理性能優化等內容。

具體議程

飛槳超大模型的壓縮和推理優化

超大模型在各類任務上取得卓越的效果,然而由于超大模型體積大、速度慢,推理部署面臨巨大的挑戰,大模型的高效推理是實現大模型產業應用落地的關鍵所在。飛槳推出了針對大模型的壓縮、推理、服務化全流程部署方案。該方案通過面向大模型的精度無損模型壓縮技術、自適應分布式推理技術,可自動感知硬件特性,完成模型壓縮、自動切分和混合并行推理計算,實現領先性能。

a213299c-749e-11ed-8abf-dac502259ad0.png

黨青青 | 百度資深研發工程師

黨青青,百度資深研發工程師,目前主要從事深度學習模型推理、壓縮、視覺算法的研究。負責飛槳推理性能優化,以及模型壓縮工具、視覺套件建設。有豐富的深度學習框架系統研發、高性能優化、算法調優經驗。

通往高參數效用比的自然語言處理-預訓練、

下游任務、與前沿展望

如今自然語言處理領域正在進行 “訓練->推理” 到 “預訓練->下游任務微調”的范式轉換,其中模型神經元數量和預訓練所用數據規模已經遠超人類大腦的神經元數量和人類人均閱讀總量,同時在 GLUE 等通用大模型評估榜單中獲得的收益是非常微弱的。對此,我們開展了一系列高參數效用比的自然語言處理預訓練、和下游任務的探索,來幫助大模型更加智能、高效的從海量數據中挖掘知識,并魯棒、準確的遷移到下游任務中。

a272c78a-749e-11ed-8abf-dac502259ad0.png

丁亮 | 京東探索研究院算法科學家

丁亮,京東探索研究院算法科學家,自然語言處理方向負責人。博士畢業于悉尼大學,師從 IEEE/ACM Fellow 陶大程教授。他致力于基于深度學習的自然語言處理,包括大規模語言模型預訓練、語言理解、生成和翻譯。他帶領團隊在 2021 年 12 月在兩個 GLUE 基準評測任務上實現首次超越人類的表現,隨后在 2022 年 1 月以均分 91.3 獲得總榜單第一。

基于精調、蒸餾和壓縮的大模型落地應用

大模型歷經過去幾年探索已經相對成熟。目前如何能夠在真實場景快速落地成為急需解決的問題。為解決大模型落地方面的各種問題,我們開發提供精調、蒸餾、壓縮、推理、服務化全流程部署方案,助力大模型快速有效落地。

a299f10c-749e-11ed-8abf-dac502259ad0.png

劉凱 | 騰訊軟件工程師

從事 NLP 訓練推理一體化服務開發。

小冰如何利用 FasterTransformer

實現大規模語言模型的產品級部署

小冰在部署 GPT 1B/6B 模型中遇到的困難;Faster Transformer (FT) 如何解決上述困難;在上述模型配置下,FT+Triton 與 baseline (Huggingface Transformers 和 Deepspeed) 在 a. latency, b. throughput, c. 可部署的最低配置GPU環境 上的差異;小冰如何利用 FT 對 soft prompt/prefix 的支持,在只使用同一個 backbone model 的情況下實現對不同用戶的高度自定義化。

a2cea67c-749e-11ed-8abf-dac502259ad0.png

趙天雨 | 小冰高級研究員

2015 年本科畢業于北京大學計算機系,2020 年博士畢業于京都大學智能信息學系,同年就職于小冰日本團隊。研究方向為自然語言處理,主要關注對話系統、大模型的訓練與部署。

a2e7bce8-749e-11ed-8abf-dac502259ad0.png

鄭鵬 | NVIDIA GPU 計算專家

畢業于佐治亞理工計算科學與工程專業,2021 年加入 NVIDIA 主要參與 FasterTransformer Multi-GPU Multi-Node 相關的優化工作。

基于 FasterTransformer

和 Triton大模型的預估

自 2020 年 OpenAI 推出 GPT 模型之後,越來越多研究證明超大模型在自然語言處理上的能力與重要性。NVIDIA 在 2021 年時基于 FasterTransformer 開發多機多卡并行推理的功能,提出第一個多機多卡大模型推理的解決方案。FasterTransformer 本身不具有收集、整理請求的能力,這在實際應用上是非常重要的功能。為了填補不足,我們將 FasterTransformer 與推理框架 Triton 進行結合,讓 FasterTransformer 能夠更好的支持實際的推理場景。在這次的演講中,我們會詳細的講解我們如何實現以上的功能,讓用戶能透過 FasterTransformer 將大模型推理實際落地。

a3360d8a-749e-11ed-8abf-dac502259ad0.png

薛博陽 | NVIDIA GPU 技術專家

2019 年加入 NVIDIA,目前主要負責 FasterTransformer 的開發與優化。FasterTransformer 提供 Transformer 模型推理上靈活與高效的調用,對比一般的框架能提供數倍到十倍以上的加速效果。除此之外,是第一個支持 GPT-3 的推理庫。FasterTransformer 針對 GPT-3 這種超大規模(1750 億模型參數)的模型提供了模型并行、優化通信開銷、顯存使用,讓使用者能以最少的 GPU、透過多 GPU、多節點在 GPT-3 的服務上得到最好的速度。

Transformer 模型

在 TensorRT 上的推理性能優化

Transformer 在 NLP 和 CV 領域大放異彩,在眾多深度學習模型中顯現了突出的效果。同時,它相比于卷積網絡需要更高的計算量,其推理優化值得關注。TensorRT 是 NVIDIA 專門針對推理場景推出的性能優化工具;NVIDIA DevTech 團隊將若干常用的 Transformer 模型移植到 TensorRT,獲得了良好的加速效果。

a3746224-749e-11ed-8abf-dac502259ad0.png

王猛 | NVIDIA GPU 技術專家

2019 年加入 NVIDIA,目前主要從事 GPU 上模型部署與優化,在 TensorRT,ONNX 和 CUDA 并行計算等領域有較多的研究和應用經驗,目前主要負責 TensorRT workflow。

小組座談

參與嘉賓:

王猛 | NVIDIA GPU 技術專家

劉凱 | 騰訊軟件工程師

怎樣報名參會

掃描下方二維碼或點擊閱讀原文添加微信小助手

并備注“CNCC”加入本次活動微信交流群

分論壇觀看入口將在直播開始前在微信群內發布

與行業先鋒一同,探尋超大模型的推理和部署實踐

a3b83260-749e-11ed-8abf-dac502259ad0.png

原文標題:CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實踐

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3926

    瀏覽量

    93190
  • 大模型
    +關注

    關注

    2

    文章

    3045

    瀏覽量

    3857

原文標題:CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實踐

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享一個好消息,百度智能云已牽手65%的央企,共同推進大模型產業落地。得益于全棧的AI能力,百度聯合眾多央國企伙伴,針對各類不同業務場景,打造了一大批可推廣、可復制的標桿
    的頭像 發表于 06-11 15:44 ?152次閱讀

    百度文心大模型X1 Turbo獲得信通院當前大模型最高評級證書

    百度在520居然還領了個證?是它, 信通院當前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估
    的頭像 發表于 05-21 18:19 ?517次閱讀
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當前大<b class='flag-5'>模型</b>最高評級證書

    百度發布文心4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發者大會在武漢舉辦。百度創始人李彥宏發布了文心大模型4.5 Turbo及深度思考模型X1 Turbo兩大模型
    的頭像 發表于 04-30 10:16 ?415次閱讀

    百度地圖在汽車智能化領域的應用實踐

    近日,在中國電動汽車人會論壇(2025)的智能汽車創新技術與產業論壇百度地圖事業部副總經理劉增剛發表主旨演講,分享了百度地圖在汽車智能化
    的頭像 發表于 04-03 15:02 ?1473次閱讀

    百度發布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理
    的頭像 發表于 03-18 16:29 ?391次閱讀

    百度文心大模型將升級并開源

    百度近日宣布,其文心大模型系列將迎來新版本升級,計劃在未來數月內逐步推出文心大模型4.5系列。這一消息無疑為AI領域注入了新的活力。 據悉,百度文心大
    的頭像 發表于 02-14 14:25 ?400次閱讀

    百度智能云四款大模型應用接入DeepSeek

    近日,百度智能云旗下四款重量級大模型應用產品——客悅、曦靈、一見、甄知,正式迎來了全新升級,接入了先進的DeepSeek模型。這一重要更新,標志著百度智能云在為企業智能化轉型提供更強動
    的頭像 發表于 02-10 18:00 ?730次閱讀

    百度云與阿里云上線DeepSeek模型部署服務

    近日,百度智能云和阿里云相繼宣布上線DeepSeek-R1和DeepSeek-V3模型部署服務,為開發者和企業用戶提供了更加高效便捷的AI服務體驗。 百度智能云方面,DeepSeek
    的頭像 發表于 02-05 15:40 ?797次閱讀

    清華與百度攜手共建生態環境預訓練大模型

    近日,在“中國環境科學學會生態環境人工智能專委會成立大會暨學術論壇”上,清華大學環境學院的徐明教授宣布了一項重要戰略合作。清華大學將與百度攜手共同打造生態環境垂直領域的預訓練大
    的頭像 發表于 01-16 11:07 ?484次閱讀

    百度科啟動“繁星計劃”

    近日,百度攜手中國科協、中國科學院大學共同舉辦了史記2024·科學科100詞發布會,并在此盛會上正式啟動了“繁星計劃”。這一計劃的核心
    的頭像 發表于 12-31 10:26 ?620次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?480次閱讀
    如何開啟Stable Diffusion WebUI<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>部署</b>

    百度文心大模型日均調用量超15億

    近日,百度在上海世博中心舉辦了主題為“應用來了”的百度世界2024大會。會上,百度董事長李彥宏分享了關于大模型行業的最新動態和百度文心大
    的頭像 發表于 11-12 15:28 ?628次閱讀

    復旦攜手百度推出全新AI模型Hallo2

    復旦大學與百度攜手合作,共同打造了一款名為Hallo2的全新AI模型。這款模型能夠在4K分辨率下生成長達數小時的人物動畫,為AI在視頻生成領
    的頭像 發表于 10-22 17:27 ?750次閱讀

    英特爾與百度共同為AI時代打造高性能基礎設施

    可持續發展等領域的實踐與探索,并圍繞為AI時代的產業發展和升級提供“芯”動力等話題進行深入探討。 英特爾市場營銷集團副總裁、中國區云與行業解決方案和數據中心銷售部總經理梁雅莉指出,“為擁抱以AI為代表的新質生產力,英特爾攜手百度
    的頭像 發表于 09-27 09:48 ?399次閱讀
    英特爾與<b class='flag-5'>百度</b><b class='flag-5'>共同</b>為AI時代打造高性能基礎設施

    NVIDIA百度飛槳攜手革新汽車風阻預測:DNNFluid-Car模型的崛起

    在追求更高效、更環保的汽車設計浪潮中,NVIDIA百度飛槳攜手突破傳統界限,共同研發了一款革命性的3D高精度汽車風阻預測模型——DNNFl
    的頭像 發表于 07-09 14:56 ?2127次閱讀