女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA H100 Tensor Core GPU性能比上一代GPU高出4.5 倍

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-09-13 15:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在行業標準 AI 推理測試中,NVIDIA H100 GPU 創造多項世界紀錄、A100 GPU 在主流性能方面展現領先優勢、Jetson AGX Orin 在邊緣計算方面處于領先地位。

在 MLPerf 行業標準 AI 基準測試中首次亮相的 NVIDIA H100 Tensor Core GPU 在所有工作負載推理中均創造了世界紀錄,其性能比上一代 GPU 高出 4.5 倍。

這些測試結果表明,對于那些需要在高級 AI 模型上獲得最高性能的用戶來說,Hopper 是最優選擇。

此外,NVIDIA A100 Tensor Core GPU 和用于 AI 機器人的 NVIDIA Jetson AGX Orin 模塊在所有 MLPerf 測試中繼續表現出整體領先的推理性能,包括圖像和語音識別自然語言處理和推薦系統。

H100 (又名 Hopper)提高了本輪測試所有六個神經網絡中的單加速器性能標桿。它在單個服務器和離線場景中展現出吞吐量和速度方面的領先優勢。

18e4d860-3041-11ed-ba43-dac502259ad0.jpg

NVIDIA H100 GPU 在數據中心類別的所有工作負載上都樹立了新標桿

NVIDIA Hopper 架構的性能比 NVIDIA Ampere 架構高出 4.5 倍;Ampere 架構 GPU 在 MLPerf 結果中繼續保持全方位領先地位。

Hopper 在流行的用于自然語言處理的 BERT 模型上表現出色部分歸功于其 Transformer Engine。BERT 是 MLPerf AI 模型中規模最大、對性能要求最高的的模型之一。

這些推理基準測試標志著 H100 GPU 的首次公開亮相,它將于今年晚些時候上市。H100 GPU 還將參加未來的 MLPerf 訓練基準測試。

A100 GPU 展現領先優勢

在最新測試中,NVIDIA A100 GPU 繼續在主流 AI 推理性能方面展現出全方位領先,目前主要的云服務商和系統制造商均提供 A100 GPU。

在數據中心和邊緣計算類別與場景中,A100 GPU 贏得的測試項超過了任何其他提交的結果。A100 還在 6 月的 MLPerf 訓練基準測試中取得了全方位的領先,展現了其在整個 AI 工作流中的能力。

自 2020 年 7 月在 MLPerf 上首次亮相以來由于 NVIDIA AI 軟件的不斷改進,A100 GPU 的性能已經提升了 6 倍。

NVIDIA AI 是唯一能夠在數據中心和邊緣計算中運行所有 MLPerf 推理工作負載和場景的平臺。

用戶需要通用性能

NVIDIA GPU 在所有主要 AI 模型上的領先性能,使用戶成為真正的贏家。用戶在實際應用中通常會采用許多不同類型的神經網絡。

例如,一個AI 應用可能需要理解用戶的語音請求、對圖像進行分類、提出建議,然后以人聲作為語音信息提供回應。每個步驟都需要用到不同類型的 AI 模型。

MLPerf 基準測試涵蓋了所有這些和其他流行的 AI 工作負載與場景,比如計算機視覺、自然語言處理、推薦系統、語音識別等。這些測試確保用戶將獲得可靠且部署靈活的性能。

MLPerf 憑借其透明性和客觀性使用戶能夠做出明智的購買決定。該基準測試得到了包括亞馬遜Arm、百度、谷歌、哈佛大學、英特爾、Meta、微軟、斯坦福大學和多倫多大學在內的廣泛支持。

Orin 在邊緣計算領域保持領先

在邊緣計算方面,NVIDIA Orin 運行了所有 MLPerf 基準測試,是所有低功耗系統級芯片中贏得測試最多的芯片。并且,與 4 月在 MLPerf 上的首次亮相相比,其能效提高了50%。

在上一輪基準測試中,Orin 的運行速度和平均能效分別比上一代 Jetson AGX Xavier 模塊高出 5 倍和 2 倍。

195dec3c-3041-11ed-ba43-dac502259ad0.jpg

在能效方面,Orin 邊緣 AI 推理性能提升多達 50%

Orin 將 NVIDIA Ampere 架構 GPU 和強大的 Arm CPU 內核集成到一塊芯片中。目前,Orin 現已被用在 NVIDIA Jetson AGX Orin 開發者套件以及機器人和自主系統生產模塊,并支持完整的 NVIDIA AI 軟件堆棧,,包括自動駕駛汽車平臺(NVIDIA Hyperion)、醫療設備平臺(Clara Holoscan)和機器人平臺(Isaac)。

廣泛的 NVIDIA AI 生態系統

MLPerf 結果顯示,NVIDIA AI 得到了業界最廣泛的機器學習生態系統的支持。

在這一輪基準測試中,有超過 70 項提交結果在 NVIDIA 平臺上運行。例如,Microsoft Azure 提交了在其云服務上運行 NVIDIA AI 的結果。

此外,10 家系統制造商的 19 個 NVIDIA 認證系統參加了本輪基準測試,包括華碩、戴爾科技、富士通、技嘉、慧與、聯想、和超微等。

它們的結果表明,無論是在云端還是在自己數據中心運行的服務器中,用戶都可以借助 NVIDIA AI 獲得出色的性能。

NVIDIA 的合作伙伴參與 MLPerf 是因為他們知道這是一個為客戶評估 AI 平臺和廠商的重要工具。最新一輪結果表明,他們目前向用戶提供的性能將隨著 NVIDIA 平臺的發展而增長。

用于這些測試的所有軟件都可以從 MLPerf 庫中獲得,因此任何人都可以獲得這些世界級成果。NGC( NVIDIA 的 GPU 加速軟件目錄)上正在源源不斷地增加以容器化形式提供的優化。在這里,你還會發現 NVIDIA TensorRT,本輪測試的每此提交都使用它來優化 AI 推斷。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29735

    瀏覽量

    212854
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106371
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4945

    瀏覽量

    131228
  • 英偉達
    +關注

    關注

    22

    文章

    3952

    瀏覽量

    93746
  • H100
    +關注

    關注

    0

    文章

    33

    瀏覽量

    419

原文標題:NVIDIA Hopper 首次亮相 MLPerf,在 AI 推理基準測試中一騎絕塵

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Blackwell GPU優化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 G
    的頭像 發表于 07-02 19:31 ?1779次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小延遲場景中的<b class='flag-5'>性能</b>紀錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知識,但該部分知識比較晦澀難懂,或許是由于我直從事的事芯片
    發表于 06-18 19:31

    GPU 維修干貨 | 英偉達 GPU H100 常見故障有哪些?

    上漲,英偉達H100GPU憑借其強大的算力,成為AI訓練、高性能計算領域的核心硬件。然而,隨著使用場景的復雜化,H100服務器故障率也逐漸攀升,輕則影響業務進度,重
    的頭像 發表于 05-05 09:03 ?978次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | 英偉達 <b class='flag-5'>GPU</b> <b class='flag-5'>H100</b> 常見故障有哪些?

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的
    的頭像 發表于 03-28 09:59 ?623次閱讀

    英偉達A100H100比較

    英偉達A100H100都是針對高性能計算和人工智能任務設計的GPU,但在性能和特性上存在顯著差異。以下是對這兩款
    的頭像 發表于 02-10 17:05 ?4398次閱讀
    英偉達A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發表于 01-06 10:45 ?660次閱讀

    芯原發布新一代Vitality架構GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構的圖形處理器(GPU)IP系列。這一新一代GPU架構以其卓越的計算性能和廣泛的應用領域,吸引了業界的廣泛關注。 Vitality
    的頭像 發表于 12-24 10:55 ?924次閱讀

    芯原推出新一代性能Vitality架構GPU IP系列

    原新一代Vitality GPU架構顯著提升了計算性能,并支持多核擴展,以進步提升性能。該GPU
    的頭像 發表于 12-19 15:55 ?493次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    和不支持的NVIDIA GPU硬件,如支持的有L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型號被標記為棄用。同時提到GPU計算要求64位計算機架構,不同
    發表于 12-16 14:25

    文梳理:如何構建并優化GPU云算力中心?

    目前最常見的AI算力中心部署的GPU集群大小為 2048、1024、512 和 256,且部署成本隨 GPU 數量線性增長。本文將以相對折中的1024 GPU卡(H100)的規模為例展
    的頭像 發表于 11-15 11:59 ?1366次閱讀
    <b class='flag-5'>一</b>文梳理:如何構建并優化<b class='flag-5'>GPU</b>云算力中心?

    英偉達H100芯片市場降溫

    隨著英偉達新一代AI芯片GB200需求的不斷攀升,其上一代明星產品H100芯片卻遭遇了市場的冷落。據業內人士透露,搭載H100的服務器通常以8卡的形式進行出售或出租,而在去年,這類服務
    的頭像 發表于 10-28 15:42 ?1640次閱讀

    如何提高GPU性能

    學習和機器學習等領域發揮著重要作用。 1. 硬件升級 a. 更換高性能GPU 最直接的提高GPU性能的方法是升級到更高性能的顯卡。隨著技術的
    的頭像 發表于 10-27 11:21 ?2507次閱讀

    AMD與NVIDIA GPU優缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產品在性能、功耗、價格等方面都有著不同的特點和優勢。 、性能
    的頭像 發表于 10-27 11:15 ?2509次閱讀

    亞馬遜云科技宣布Amazon EC2 P5e實例正式可用 由英偉達H200 GPU提供支持

    現已正式可用。亞馬遜云科技是首個將英偉達H200 GPU用于生產環境的領先云提供商。與基于英偉達H100 GPU的Amazon EC2 P5實例相比,Amazon EC2 P5e實例
    的頭像 發表于 09-19 16:16 ?884次閱讀

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42