女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新測試:NVIDIA的安培GPU測試性能是最先進(jìn) CPU的237倍

如意 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-10-23 09:49 ? 次閱讀

MLPerf組織今天發(fā)布最新的推理基準(zhǔn)測試(Benchmark)MLPerf Inference v0.7結(jié)果,總共有23個(gè)組織提交了結(jié)果,相比上一個(gè)版本(MLPerf Inference v0.5)的12個(gè)提交者增加了近一倍。

結(jié)果顯示,今年5月NVIDIA(Nvidia)發(fā)布的安培(Ampere)架構(gòu)A100 Tensor Core GPU,在云端推理的基準(zhǔn)測試性能是最先進(jìn)Intel CPU的237倍。

最新測試:NVIDIA的安培GPU測試性能是最先進(jìn) CPU的237倍

MLPerf Inference V0.7部分結(jié)果截圖

最新的AI推理測試結(jié)果意味著,NVIDIA未來可能在AI推理和訓(xùn)練市場都占據(jù)領(lǐng)導(dǎo)地位,給云端AI推理市場擁有優(yōu)勢的Intel帶來更大壓力的同時(shí),也將讓其他追趕者面臨更大挑戰(zhàn)。

MLPerf推理基準(zhǔn)測試進(jìn)一步完善的價(jià)值

與2019年的MLPerf Inference v0.5版本相比,最新的0.7版本將測試從AI研究的核心視覺和語言的5項(xiàng)測試,擴(kuò)展了到了包括推薦系統(tǒng)、自然語言理解、語音識別和醫(yī)療影像應(yīng)用的6項(xiàng)測試,并且有分別針對云端和終端推理的測試,還加入了手機(jī)和筆記本電腦的結(jié)果。

擴(kuò)展的測試項(xiàng)從MLPerf和業(yè)界兩個(gè)角度都有積極意義。

最新測試:NVIDIA的安培GPU測試性能是最先進(jìn) CPU的237倍

任何一個(gè)基準(zhǔn)測試都需要給業(yè)界具有參考價(jià)值的指標(biāo)。MLPerf基準(zhǔn)測試是在業(yè)界缺乏對AI芯片公認(rèn)的評價(jià)標(biāo)準(zhǔn)的2018年誕生,因此,MLPerf組織既需要給出各方都認(rèn)可的成績,還需要根據(jù)AI行業(yè)的發(fā)展完善評價(jià)標(biāo)準(zhǔn)。

不過,AI行業(yè)發(fā)展迅速,AI模型的參數(shù)越來越多,應(yīng)用的場景也越來越廣泛。評價(jià)AI芯片和系統(tǒng)的推理性能需要涵蓋可編程性、延遲、準(zhǔn)確性、模型大小、吞吐量、能效等指標(biāo),也需要選擇更具指導(dǎo)價(jià)值的模型和應(yīng)用。

此次增加的推薦系統(tǒng)測試對于互聯(lián)網(wǎng)公司意義重大。在王喆的《深度學(xué)習(xí)推薦系統(tǒng)》一書中提到,2019年天貓“雙11”的成交額是2684億元,假設(shè)推薦系統(tǒng)進(jìn)行了優(yōu)化,整體的轉(zhuǎn)化率提高1%,那么增加的成交額大約為26.84億元。

另外,MLPerf Inference v0.7中增加醫(yī)療影像3D U-Net模型測試與新冠大流行以及AI在醫(yī)療行業(yè)的重要性與日俱增密切相關(guān),比如一家初創(chuàng)公司使用AI簡化了超聲心電圖的采集工作,在新冠大流行初期發(fā)揮了作用。

基準(zhǔn)測試從v0.5到v0.7,能夠?yàn)橐x用AI芯片和系統(tǒng)的公司提供更直觀和有價(jià)值的參考是MLPerf基準(zhǔn)測試的價(jià)值所在,比如,幫助金融結(jié)構(gòu)的會話式AI更快速回答客戶問題,幫助零售商使用AI保證貨架庫存充足。

與此同時(shí),這也將促進(jìn)MLPerf組織在業(yè)界的受認(rèn)可程度,從接近翻倍的提交成績的組織就能看出來。

GPU云端推理性能最高是CPU的237倍

過去幾年,云端AI訓(xùn)練市場NVIDIA擁有絕對優(yōu)勢,云端AI推理市場被Intel賺取了大部分利潤是事實(shí)。這讓不少人都產(chǎn)生了GPU更適合訓(xùn)練而CPU更適合推理的認(rèn)知,但MLPerf最新的推理測試結(jié)果可能會改變這一觀點(diǎn)。

MLPerf Inference V0.7的測試結(jié)果顯示,在數(shù)據(jù)中心OFFLINE(離線)測試模式下,賽靈思U250和IntelCooper Lake在各個(gè)測試模型下與NVIDIAT4的差距不大,但A100對比CPU、FPGA和自家的T4就有明顯的性能差距。

在SERVER模式下的推薦系統(tǒng)DLRM模型下,A100 GPU對比IntelCooper Lake有最高237倍的性能差距,在其他模型下也有比較顯著的差距。值得注意的是,Intel的Cooper Lake系統(tǒng)的狀態(tài)還是預(yù)覽,其余三款芯片的系統(tǒng)都已經(jīng)可用。

A100 GPU的優(yōu)勢也在邊緣推理中也十分明顯。在單數(shù)據(jù)流(Singel-Stream)測試中,A100對比NVIDIAT4和面向邊緣終端的NVIDIAJetson AGX Xavier有幾倍到十幾倍的性能優(yōu)勢。在多數(shù)據(jù)流(Multi-Stream)測試中,A100對比另外兩款自家產(chǎn)品在不同AI模型中有幾倍到二十多倍的性能優(yōu)勢。

在邊緣OFFLINE模式下,A100對比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優(yōu)勢。

這很好地說明A100的安培架構(gòu)以及其第三代Tensor Core優(yōu)勢的同時(shí),也表明了NVIDIA能夠覆蓋整個(gè)AI推理市場。

在此次提交結(jié)果的23家公司中,除了NVIDIA外還有11家其合作伙伴提交了基于NVIDIA GPU的1029個(gè)測試結(jié)果,占數(shù)據(jù)中心和邊緣類別中參評測試結(jié)果總數(shù)的85%以上。

從提交結(jié)果的合作伙伴的系統(tǒng)中可以看到,NVIDIAT4仍然是企業(yè)的邊緣服務(wù)器推理平臺的主要選擇。A100提升到新高度的性能意味著未來企業(yè)邊緣服務(wù)器在選擇AI推理平臺的時(shí)候,可以從T4升級到A100,對于功耗受限的設(shè)備,可以選擇Jeston系列產(chǎn)品。

特別值得注意的是,NVIDIA GPU首次在公有云中實(shí)現(xiàn)了超越CPU的AI推理能力。

臨界點(diǎn)到來?AI推理芯片市場競爭門檻更高

五年前,只有少數(shù)領(lǐng)先的高科技公司使用GPU進(jìn)行推理。如今,NVIDIAGPU首次在公有云市場實(shí)現(xiàn)超越CPU的AI推理能力,或許意味著AI推理市場臨界點(diǎn)的到來。NVIDIA還預(yù)測,基于其GPU的總體云端AI推理計(jì)算能力每兩年增長約10倍,增長速度高于CPU。

另外,NVIDIA還強(qiáng)調(diào)基于A100高性能系統(tǒng)的成本效益。NVIDIA表示,一套DGX A100系統(tǒng)可以提供相當(dāng)于近1000臺雙插槽CPU服務(wù)器的性能,能為客戶AI推薦系統(tǒng)模型從研發(fā)走向生產(chǎn)的過程,具有極高的成本效益。

同時(shí),NVIDIA也在不斷優(yōu)化推理軟件堆棧,進(jìn)一步提升在推理市場的競爭力。

最先感受到影響的會是Intel,但在云端AI推理市場體現(xiàn)出顯著變化至少需要幾年時(shí)間,因?yàn)槠髽I(yè)在更換平臺的時(shí)候會更加謹(jǐn)慎,生態(tài)的護(hù)城河此時(shí)也更能體現(xiàn)出價(jià)值。

但無論如何,我們都看到NVIDIA在AI市場的強(qiáng)勢地位。雷鋒網(wǎng)七月底報(bào)道,在MLPerf發(fā)布的MLPerf Training v0.7基準(zhǔn)測試中,A100 Tensor Core GPU,和HDR InfiniBand實(shí)現(xiàn)多個(gè)DGX A100 系統(tǒng)互聯(lián)的龐大集群DGX SuperPOD系統(tǒng)在性能上開創(chuàng)了八個(gè)全新里程碑,共打破16項(xiàng)紀(jì)錄。

安培架構(gòu)A100在MLPerf最新的訓(xùn)練和推理成績表明NVIDIA不僅給云端AI訓(xùn)練的競爭者更大的壓力,也可能改變AI推理市場的格局。

NVIDIA將其在云端訓(xùn)練市場的優(yōu)勢進(jìn)一步拓展到云端和邊緣推理市場符合AI未來的發(fā)展趨勢。有預(yù)測指出,隨著AI模型的成熟,市場對云端AI訓(xùn)練需求的增速將會降低,云端AI推理的市場規(guī)模將會迅速增加,并有望在2022年超過訓(xùn)練市場。

另據(jù)市場咨詢公司ABI Research的數(shù)據(jù),預(yù)計(jì)到2025年,邊緣AI芯片市場收入將達(dá)到122億美元,云端AI芯片市場收入將達(dá)到119億美元,邊緣AI芯片市場將超過云端AI芯片市場。

憑借強(qiáng)大的軟硬件生態(tài)系統(tǒng),NVIDIA和Intel依舊會是AI市場的重要玩家,只是隨著他們競爭力的不斷提升,其他參與AI市場競爭的AI芯片公司們面臨的壓力也隨之增加。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11028

    瀏覽量

    215704
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5226

    瀏覽量

    105652
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4903

    瀏覽量

    130569
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    1.9性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測試結(jié)果,其中,英特爾??至強(qiáng)??6
    的頭像 發(fā)表于 04-07 10:58 ?168次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?483次閱讀

    比斯特電池組綜合性能測試機(jī):基于先進(jìn)技術(shù)的性能優(yōu)勢展現(xiàn)

    在鋰電池測試設(shè)備的領(lǐng)域中,比斯特BT-100V20C100F 電池組綜合性能測試機(jī)憑借其基于先進(jìn)技術(shù)構(gòu)建的強(qiáng)大性能優(yōu)勢,脫穎而出,成為了行業(yè)
    的頭像 發(fā)表于 03-07 09:49 ?211次閱讀
    比斯特電池組綜合<b class='flag-5'>性能</b><b class='flag-5'>測試</b>機(jī):基于<b class='flag-5'>先進(jìn)</b>技術(shù)的<b class='flag-5'>性能</b>優(yōu)勢展現(xiàn)

    NVIDIA推出GeForce RTX 50系列臺式機(jī)和筆記本電腦GPU

    NVIDIA 宣布為游戲玩家、創(chuàng)作者和開發(fā)者推出最先進(jìn)的消費(fèi)級 GPU——GeForce RTX 50 系列臺式機(jī)和筆記本電腦 GPU
    的頭像 發(fā)表于 01-08 11:05 ?683次閱讀

    Advantest CEO:先進(jìn)芯片測試需求大增

    技術(shù)的不斷進(jìn)步,現(xiàn)代先進(jìn)芯片在測試方面的需求較以往有了大幅提升。他透露,目前最先進(jìn)的芯片從晶圓切割到成品組裝的全流程中,需要經(jīng)過Advantest設(shè)備10~20道的測試。而在五年前,這
    的頭像 發(fā)表于 01-03 14:26 ?434次閱讀

    華為云 X 實(shí)例 CPU 性能測試詳解與優(yōu)化策略

    引言 ? 1. 測試環(huán)境搭建 ? 1.1 測試實(shí)例的選擇 ? 1.2 CPU性能測試工具介紹 ? 1.3 安裝和配置Sysbench ? 2
    的頭像 發(fā)表于 12-30 14:52 ?522次閱讀
    華為云 X 實(shí)例 <b class='flag-5'>CPU</b> <b class='flag-5'>性能</b><b class='flag-5'>測試</b>詳解與優(yōu)化策略

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問題,但會降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    發(fā)表于 12-16 14:25

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢。 一、性能
    的頭像 發(fā)表于 10-27 11:15 ?1998次閱讀

    嵌入式MXM模塊(NVIDIA安培架構(gòu))

    電子發(fā)燒友網(wǎng)站提供《嵌入式MXM模塊(NVIDIA安培架構(gòu)).pdf》資料免費(fèi)下載
    發(fā)表于 10-09 11:09 ?0次下載

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個(gè)庫,專門為實(shí)時(shí)在線 GPU 數(shù)據(jù)包處理而設(shè)計(jì)。它結(jié)合了 GPUDirect RDMA 和 GPUDirect
    的頭像 發(fā)表于 08-23 17:03 ?1082次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO<b class='flag-5'>性能</b><b class='flag-5'>測試</b>

    摩爾線程與智譜AI完成大模型性能測試與適配

    近日,摩爾線程與智譜AI在人工智能領(lǐng)域開展了一輪深入的合作,共同對GPU大模型進(jìn)行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力,還涉及了基于摩爾線程夸娥(KUAE)千卡智算集群
    的頭像 發(fā)表于 06-14 16:40 ?1382次閱讀

    性能測試的流程和步驟有哪些

    性能測試是軟件測試的一個(gè)重要環(huán)節(jié),主要目的是評估軟件在不同負(fù)載條件下的性能表現(xiàn),以確保軟件能夠滿足用戶的需求。本文將詳細(xì)介紹性能
    的頭像 發(fā)表于 05-29 16:00 ?1232次閱讀

    性能測試的實(shí)現(xiàn)方法是什么

    性能測試是一種評估軟件系統(tǒng)在不同負(fù)載下性能表現(xiàn)的測試方法。它可以幫助開發(fā)團(tuán)隊(duì)發(fā)現(xiàn)性能瓶頸,優(yōu)化系統(tǒng)性能
    的頭像 發(fā)表于 05-29 15:44 ?962次閱讀

    性能測試主要測什么 性能測試的指標(biāo)有哪些

    性能測試是軟件測試的一個(gè)重要組成部分,主要用于評估軟件系統(tǒng)在各種負(fù)載條件下的性能表現(xiàn)。性能測試
    的頭像 發(fā)表于 05-29 15:42 ?3427次閱讀

    功能測試性能測試的區(qū)別與聯(lián)系

    功能測試性能測試是軟件測試的兩個(gè)重要方面。它們在確保軟件質(zhì)量和性能方面發(fā)揮著關(guān)鍵作用。本文將詳細(xì)探討功能
    的頭像 發(fā)表于 05-29 15:40 ?1537次閱讀