女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬億的次浮點運算!

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 作者:工程師黃明星 ? 2018-07-23 17:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,橡樹嶺國家實驗室的Summit系統(tǒng)呈獻了又一場超級計算盛宴,創(chuàng)造了又一項性能記錄,該系統(tǒng)首次突破了每秒100千萬億次浮點運算性能的壁壘。

在最新發(fā)布的Top500榜單中,大部分系統(tǒng)的新處理能力均來自GPU。目前世界七大超級計算機中有五款都在采用GPU,包括美國、歐洲和日本的頂尖系統(tǒng)。

而對于Summit,GPU滿足了其95%的浮點運算性能要求。隨著摩爾定律的不斷放緩,加速計算顯然已經(jīng)成為助推器,將很快推動我們進入百億億次級計算時代。

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬億的次浮點運算!

這樣的計算性能由NVIDIA Volta Tensor Core GPU提供,其多精度計算能力將能同時應(yīng)對高性能計算所需的高精度計算挑戰(zhàn),以及深度學習所需的高效處理的要求。

加速計算登峰造極

每年兩次的超級計算展見證了加速計算近年來的飛速發(fā)展。在ISC 2018上,這一領(lǐng)域再次實現(xiàn)了突破。

Summit顯然是最有力的證據(jù)。該系統(tǒng)采用27648塊Volta Tensor Core GPU,其測得的雙精度性能達到每秒122千萬億次浮點運算。它每秒的性能相當于地球上所有人以每秒執(zhí)行一次計算的速度執(zhí)行一整年的任務(wù)。

AI性能更加令人矚目,運算速度可達到300億億次。這相當于整個地球上的人在15年內(nèi)每秒進行一次計算。

至省與至簡

多精度計算開辟了新的可能性。但是,如果GPU無法提供非凡的效率,相應(yīng)的效用將受限。

在最新的Green500榜單,GPU為全球20個最具環(huán)保效益的系統(tǒng)中的17個提供支持。Summit不僅是世界上速度最快的系統(tǒng),而且在新確立的“三級”類別(Green500 榜單中最嚴格的級別)中是世界上最高效的系統(tǒng)。

在過去10年中,GPU已經(jīng)幫助美國橡樹嶺國家實驗室將其超級計算機的能源效率提高了50倍,這些計算機包括僅支持CPU的Jaguar及由GPU加速的Titan和Summit。

而所有這些僅僅是一個開始。實現(xiàn)百億億次級計算需要在能源效率方面實現(xiàn)更大突破。以Green500榜單中系統(tǒng)的平均效率計算,為百億億次級計算提供動力將需要超過3億瓦的電能,這相當于25萬個美國家庭的電力需求。需要將能效提高10倍才能使百億億次級計算在3千萬瓦條件下運行。

GPU正在幫助Summit實現(xiàn)這一目標。

破解難題

最新頂尖系統(tǒng)具備的處理能力曾經(jīng)令人無法想象,但現(xiàn)在的研究人員將能夠借助這些系統(tǒng)解決一些科學上最棘手的難題。

比如,遺傳學。帕金森癥和阿爾茨海默癥等可以稱得上是“毀滅性”疾病,而GPU的計算能力將可以破解這樣的難題,找出人類基因組的數(shù)十億個AGCT DNA對與諸如此類疾病之間的聯(lián)系。Summit已在梳理個人基因,以實現(xiàn)在阿片成癮(美國人的主要致死原因之一)研究方面的進展。

又如,材料。超導材料可用于為MRI設(shè)備、粒子加速器或磁聚變裝置開發(fā)功能強大的科學磁體。然而,目前的材料十分易碎、難以制造,并且只能在非常低的溫度下工作。Summit正在幫助模擬和發(fā)現(xiàn)具有類金屬特性且可在室溫下工作的新型超導材料。

再如,癌癥研究。對抗癌癥的關(guān)鍵在于開發(fā)可以自動提取、分析和分類健康數(shù)據(jù)的工具,以便揭示各種疾病因素(例如基因、生物學標記和環(huán)境)之間隱藏的關(guān)系。通過與基于文本的報告和醫(yī)學影像等非結(jié)構(gòu)化數(shù)據(jù)配合使用,在Summit上擴展的深度學習算法將有助于醫(yī)學研究人員全面了解美國癌癥患者的整體情況。

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬億的次浮點運算!

繼續(xù)前進

每個國家/地區(qū)都在競相構(gòu)建百億億次級計算系統(tǒng)。2025年的Top500榜單可能會看到十多款這樣的系統(tǒng),而且多精度加速計算成為平臺首選。相比之下,本次Top500榜單上的所有系統(tǒng)加在一起才勉強實現(xiàn)一百億億次級的總計算能力。這足以說明未來蘊藏著巨大機遇。

加速計算的一大吸引力在于它屬于全棧創(chuàng)新:從架構(gòu)一直到系統(tǒng)、加速堆棧、開發(fā)人員和半導體工藝,無一不體現(xiàn)著創(chuàng)新精神。

NVIDIA已經(jīng)投入了超過10年的時間來加速整個HPC堆棧的開發(fā)。

當我們發(fā)布第一款支持CUDA的GPU時,它無法運行任何應(yīng)用程序。我們需要為全新的加速環(huán)境重新設(shè)計所有的應(yīng)用程序、算法、庫、工具、編譯器、操作系統(tǒng)和系統(tǒng)設(shè)計。打造一種能夠處理數(shù)學處理器的芯片很容易,而要使全球高性能計算開發(fā)人員可以使用和編程這些處理器,則需要在整個堆棧上實現(xiàn)非凡的創(chuàng)新。

結(jié)果,550多款高性能計算和AI應(yīng)用程序都由GPU加速,其中包括排名靠前的15種應(yīng)用程序和所有AI框架。致力于此領(lǐng)域的開發(fā)人員數(shù)量在過去的五年里增加了10倍,現(xiàn)已接近一百萬。而且,利用我們NGC容器注冊上的最新高性能計算容器,高性能計算用戶現(xiàn)在可以在他們的系統(tǒng)或Tensor Core GPU驅(qū)動的云上輕松點擊、下載并運行最新的GPU加速應(yīng)用程序。

轉(zhuǎn)折與展望

在我們快速發(fā)展加速計算的同時,一些人也正在尋找量子計算的下一個轉(zhuǎn)折點,量子計算使用量子位元(“qubits”)而不是1和0來處理信息。

這些理論十分具有吸引力。在未來的某個時候,可能會出現(xiàn)一些在量子計算機上運行的殺手級應(yīng)用程序(特別是在密碼學或量子化學領(lǐng)域),只需極小的功率即可利用超強的處理能力。

但在可預(yù)見的未來,加速計算的勢頭似乎不可阻擋。NVIDIA會繼續(xù)致力于在高性能計算領(lǐng)域的創(chuàng)新,將實現(xiàn)百億億次級計算以及其為科學領(lǐng)域帶來的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5308

    瀏覽量

    106331
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4940

    瀏覽量

    131197

原文標題:加速計算成為助推器,帶我們進入百億億次級計算時代

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【中科昊芯Core_DSC280025C開發(fā)板試用體驗】+1.開箱之浮點計算對比

    STM32F407單片機浮點運算性能 首先STM32F407單片機的主頻時168MHZ,我編寫程序分別進行1千萬浮點
    發(fā)表于 06-29 10:01

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學發(fā)展

    現(xiàn)代高性能計算不僅使得更快的計算成為可能,它正驅(qū)動著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學突破。 高性能計算經(jīng)歷了多次迭代,每一都源于對技術(shù)的
    的頭像 發(fā)表于 06-26 19:39 ?489次閱讀
    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何<b class='flag-5'>突破</b>速度極限并推動科學發(fā)展

    ?為什么GPU性能效率比峰值性能更關(guān)鍵

    在評估GPU性能時,通常首先考察三個指標:圖形工作負載的紋理率(GPixel/s)、浮點運算次數(shù)(FLOPS)以及它們能處理計算和AI工作負載的每秒8-bittera
    的頭像 發(fā)表于 03-13 08:34 ?390次閱讀
    ?為什么GPU<b class='flag-5'>性能</b>效率比峰值<b class='flag-5'>性能</b>更關(guān)鍵

    驅(qū)動 AI 邊緣計算新時代!高性能 i.MX 95 應(yīng)用平臺引領(lǐng)未來

    TOPS (每秒萬億運算) 的運算能力。這使得推理計算的時間大幅縮短,例如,在運行常見的物體檢測模型 YOLOv5 時,處理單張圖片僅需
    的頭像 發(fā)表于 03-11 08:59 ?480次閱讀
    驅(qū)動 AI 邊緣計算新時代!高<b class='flag-5'>性能</b> i.MX 95 應(yīng)用平臺引領(lǐng)未來

    方機器人完成數(shù)千萬元天使輪融資

    近日,零方機器人公司宣布已完成數(shù)千萬元天使輪融資,并成功斬獲千萬級訂單,正式邁入量產(chǎn)階段。這一消息標志著零方機器人在人形機器人領(lǐng)域的商業(yè)化進程取得了重要
    的頭像 發(fā)表于 02-11 15:41 ?545次閱讀

    AD每秒采樣100,這時采樣率應(yīng)該算100K還是100Hz?

    我用一片AD,芯片的取樣頻率為100k。如果我每秒采樣100,這時采樣率應(yīng)該算100K還是100
    發(fā)表于 02-10 06:06

    【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    , atan,等等基本操作。 當然為了測試出硬件浮點運算性能,這里很有必要在測試一下軟件浮點運算能力,方便做個測試對比,怎么做軟件
    發(fā)表于 12-30 17:55

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 12:51 ?932次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現(xiàn)過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 11:19 ?1418次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現(xiàn)過程

    如何選擇合適的NPU型號

    、智能家居等)來選擇NPU。不同場景對NPU的性能、功耗、靈活性等要求不同。 性能需求 : 確定您需要的計算性能,包括TOPS(每秒萬億
    的頭像 發(fā)表于 11-15 09:16 ?1821次閱讀

    【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點運算庫進行浮點運算

    運算。難道由于硬件不支持FPU, 常用的M0/M0+/M23/M3內(nèi)核就無緣浮點運算了呢?答案是顯然不是的。 我們可以移植使用開源的qfplib庫來實現(xiàn)浮點
    發(fā)表于 11-05 22:07

    【AG32開發(fā)板免費試用】+數(shù)據(jù)采集存儲系統(tǒng)(2)-串口輸出+浮點運算驗證

    本次學習下串口配置和輸出。 并驗證芯片的浮點運算能力。 下面直接上干貨哦。 VE 配置 SYSCLK 100 HSECLK 8 GPIO4_1 PIN_31 # LED4 GPIO4_2
    發(fā)表于 10-31 21:22

    Kafka高性能背后的技術(shù)原理

    Kafka 是一款性能非常優(yōu)秀的消息隊列,每秒處理的消息體量可以達到千萬級別。
    的頭像 發(fā)表于 10-23 09:37 ?772次閱讀
    Kafka高<b class='flag-5'>性能</b>背后的技術(shù)原理

    Flash電池充電突破了充電電流的界限

    電子發(fā)燒友網(wǎng)站提供《Flash電池充電突破了充電電流的界限.pdf》資料免費下載
    發(fā)表于 10-15 11:27 ?0次下載
    Flash電池充電<b class='flag-5'>突破了</b>充電電流的界限

    解析OrangePi AIpro:什么是 TOPS,為什么它對?AI?PC很重要?

    )的處理器(CPU),以提升人工智能特定性能。TOPS是“TeraOperationsPerSecond”(每秒萬億運算)的縮寫,它表示
    的頭像 發(fā)表于 07-29 14:50 ?1006次閱讀
    解析OrangePi AIpro:什么是 TOPS,為什么它對?AI?PC很重要?