女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Exaflop簡史

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-08-03 09:54 ? 次閱讀

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可至少進行百億億次浮點運算。

為了解決這個時代最復雜的問題,比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計算機的計算量正在不斷增加。

所有這些重大挑戰將計算帶入了現今的百億億次級時代,頂級性能通常以 exaflops 來衡量。

什么是 Exaflop?

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可以至少進行 10^18 或百億億次浮點運算。

Exaflop 中的 exa-前綴表示“百億億”,即 10 億乘以 10 億或1的后面有 18 個零。同樣,單個 exabyte 的內存子系統可以儲存百億億字節的數據。

exaflop 中的“flop”是浮點運算的縮寫。exaflop/s 是表示系統每秒浮點運算次數的單位。

浮點是指所有數字都用小數點表示的計算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15,即 1 的后面有 15 個零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的計算量到底有多大?相當于十億人中的每個人都拿著十億個計算器。

如果他們同時按下等號,就是進行了 1 個 exaflop。

擁有 Big Red 200 和其他幾臺超級計算機的印第安納大學表示,exaflop 計算機的速度相當于一個人每秒鐘進行一次計算,并一直計算 31,688,765,000 年。

Exaflop 簡史

在超級計算發展史的大部分時間里,一次浮點運算就是一次,但隨著工作負載引入 AI ,這種情況也發生了變化。

人們開始使用最高的精度格式來表示數字,這種格式被稱為雙精度,由 IEEE 浮點運算標準定義。它之所以被稱為雙精度或 FP64,是因為計算中的每個數字都需要以 64 位用 0 或 1 表示的數據塊表示,而單精度為 32 位。

雙精度使用 64 位確保每個數字都精確到很細微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

這種格式非常適合當時的大部分工作負載,比如從原子到飛機等全部需要確保模擬結果接近于真實的模擬。

因此,當 1993 年全球最強大的超級計算機榜單 TOP500 首次發布時,衡量 FP64 數學性能的 LINPACK 基準(又稱HPL)自然成為了默認的衡量標準。

AI 大爆炸

十年前,計算行業發生了 NVIDIA 首席執行官黃仁勛所說的 AI 大爆炸。

這種強大的新計算形式開始在科學和商業應用上展現出重大成果,而且它運用了一些非常不同的數學方法。

深度學習并不是模擬真實世界中的物體,而是在堆積如山的數據中篩選,以找到能夠帶來新洞察的模式。

這種數學方法需要很高的吞吐量,所以用經過簡化的數字(比如使用 1.01 而不是 1.0001)進行大量計算要比用更復雜的數字進行少量計算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通過 32 位、16 位和 8 位數讓用戶更快地進行更多計算。

混合精度不斷發展

AI 使用 64 位數就如同在周末外出時帶著整個衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術。

例如首個 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式執行矩陣乘法,然后用 FP32 累積結果以獲得更高的精度。

Hopper 通過 FP8 加速

最近,NVIDIA Hopper 架構首次發布了速度更快的低精度 AI 訓練方法。Hopper Transformer Engine 能夠自動分析工作負載,盡可能采用 FP8 并以 FP32 累積結果。

在進行計算密集度較低的推理工作,比如在生產中運行 AI 模型時,TensorFlow 和 PyTorch 等主要框架通過支持 8 位整數實現快速性能,因為這樣就不需要使用小數點來完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用戶可以實現每個工作負載的最優加速。

去年,IEEE P3109 委員會開始為機器學習中使用的精度格式制定行業標準。這項工作可能還需要一到兩年的時間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎,但當低精度數學能夠更快提供可用結果時,許多人會使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影響 HPC 應用程序性能的因素各不相同

例如,研究人員用 FP32 運行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna。基因組學也傾向于使用低精度數學。

此外,許多傳統的模擬開始在部分工作流程中采用 AI。隨著越來越多的工作負載使用 AI,超級計算機需要支持較低的精度才能有效運行這些新興應用。

基準與工作負載同步發展

在認識到這些變化后,包括 Jack Dongarra(2021 年圖靈獎得主和 HPL 的貢獻者)在內的研究人員在 2019 年首次發布了 HPL-AI,這項新基準更適合測量新的工作負載。

Dongarra 在 2019 年的博客中表示:“無論是技術不斷優化的傳統模擬,還是 AI 應用,混合精度技術對于提高超級計算機的計算效率越來越重要。正如 HPL 實現了對雙精度能力的基準測試一樣,這種基于 HPL 的新方法可以對超級計算機的混合精度能力進行大規模基準測試。”

尤利希超級計算中心主任 Thomas Lippert 同意了這一觀點。

他在去年發表的一篇博客中表示:“我們使用 HPL-AI 基準是因為它既能夠準確地衡量日益增加的 AI 和科學工作負載中的混合精度工作,也能反映準確的 64 位浮點計算結果。”

現今的 Exaflop 系統

在 6 月的一份報告中,全球 20 個超級計算機中心提交了 HPL-AI 結果,其中有三個中心提供了超過 1 exaflop 的性能。

在這些系統中,橡樹嶺國家實驗室的超級計算機在 HPL 上的 FP64 性能也超過了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 結果的采樣器

兩年前,一非傳統系統首次達到 1 exaflop。這臺由 Folding@home 聯盟組裝的眾源超級計算機在呼吁幫助抵御新冠疫情后,達到了這一里程碑,到現在已有超過 100 萬臺計算機加入其中。

理論和實踐中的Exaflop

許多組織從那時起就已開始安裝理論峰值性能超過 1 exaflop 的超級計算機。需要注意的是,TOP500 榜單同時發布 Rmax(實際)和 Rpeak(理論)分數。

Rmax 指計算機實際表現出的最佳性能。

Rpeak 是一切系統都處于高水平運行時的最高理論性能,而這幾乎從未發生過。該數值的計算方法通常是將系統中的處理器數量乘以其時鐘速度,然后再將結果乘以處理器在一秒鐘內可執行的浮點運算數。

因此,如果有人說他們的系統達到 1 exaflop,請詢問他說的是 Rmax(實際)還是Rpeak(理論)。

Exaflop 時代的眾多指標

這也是新百億億次時代的眾多細微變化之一。

值得注意的是,HPL 和 HPL-AI 屬于合成基準,即它們衡量的是數學程序的性能,而不是真實世界的應用。MLPerf 等其他基準則基于真實世界中的工作負載。

最后,衡量系統性能的最佳標準當然是它運行用戶應用程序的情況。該衡量標準不是基于 exaflop,而是基于投資回報率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5246

    瀏覽量

    105774
  • 計算機
    +關注

    關注

    19

    文章

    7630

    瀏覽量

    90188
  • AI
    AI
    +關注

    關注

    87

    文章

    34256

    瀏覽量

    275409

原文標題:什么是 Exaflop?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    爆!中芯國際一子公司被收購

    電子發燒友網報道(文/黃山明)日前,國科微發布重要公告,計劃通過發行股份與現金支付相結合的方式,向寧波甬芯等11名交易方收購中芯寧波94.366%股權,并擬向不超過35名符合條件的特定對象發行股票募集配套資金。 ? 近年來,國內持續加速半導體并購,尤其從并購六條出來后,良好的制度推動更多公司拿出更好的方案實施并購。有統計顯示,2024年9月以來,深市公司新增披露的資產收購類重組中,產業并購近八成,新質生產力行業占比超過七成,
    的頭像 發表于 06-07 00:03 ?1072次閱讀

    第三方激光雷達ASIC方案,能改變行業格局嗎?

    電子發燒友網報道(文/梁浩斌)在激光雷達行業的早期,由于需要大量的信號處理,包括控制電機、脈沖生成、激光發射、接收器控制、濾波、點云生成等,以及考慮到產量以及成本的限制,普遍是基于可編程的FPGA進行系統設計。 ? 而近年隨著激光雷達市場的爆發式增長,激光雷達降本的節奏加速,我們也看到激光雷達有自研芯片的趨勢,包括接收端的SPAD和處理端的SoC或ASIC,逐漸放棄了FPGA。但自研芯片也意味著高成本,目前只有行業頭部企業有能力
    的頭像 發表于 06-07 01:11 ?1127次閱讀
    第三方激光雷達ASIC方案,能改變行業格局嗎?

    打破性能與成本困局:離子交換膜技術革新撬動儲能萬億市場

    電子發燒友網綜合報道,在全球能源結構加速轉型的背景下,儲能技術已成為破解可再生能源波動性難題的關鍵鑰匙。其中,全釩液流電池憑借其安全性高、壽命長、規模可調等優勢,被視為長時儲能領域的核心解決方案。然而,這一技術長期受制于核心材料——離子交換膜的卡脖子困境。 ? 傳統全釩液流電池依賴美國杜邦公司的全氟磺酸膜(Nafion),其單價高達300-400美元/平方米,占電堆成本的30%-40%。這種膜雖具備優異的化學穩定性,但存在釩離子滲
    的頭像 發表于 06-07 01:09 ?293次閱讀

    加持醫療成像賽道!思特威推出首款2MP超小尺寸醫療CMOS圖像傳感器

    電子發燒友原創 章鷹 在數字化醫療時代,醫學成像技術在疾病診斷和治療中發揮著重要作用,在這一領域,隨著持續30年的CCD時代謝幕,圖像傳感器技術路線切換,CMOS傳感器憑借其在通過更小的像素尺寸獲得更高分辨率、降低噪聲水平和暗電流以及低成本方面的優越性在醫療影像領域得到越來越廣泛的應用,未來市場看漲。 據DATA INTELO最新報告顯示,2023 年全球醫用 CMOS 圖像傳感器市場規模約為 21 億美元,預計到 2032 年將達到約 48 億美元,復合年增長
    的頭像 發表于 06-07 01:06 ?920次閱讀
    加持醫療成像賽道!思特威推出首款2MP超小尺寸醫療CMOS圖像傳感器

    國內AI+腦機接口雙驅!產品從研發走向臨床,有望恢復動物視力

    電子發燒友網報道(文/莫婷婷)近期,埃隆·馬斯克(Elon Musk)的腦機接口公司Neuralink獲得6.5億美元(約合人民幣46.8億元)E輪融資的消息在業內傳開。作為侵入式腦機接口技術的“明星企業”,Neuralink的發展動態無疑引領了行業的前沿方向。 ? Neuralink的產品已成功植入3名患者體內。在國內,腦機接口技術同樣取得了相應的進步,就在6月6日,中國科學家在《科學》(Science)雜志上線的最新研究成果顯示,借助腦機接口等技術,新一代視覺假體能夠失明
    的頭像 發表于 06-07 00:04 ?938次閱讀
    國內AI+腦機接口雙驅!產品從研發走向臨床,有望恢復動物視力

    利基DRAM市場趨勢

    電子發燒友網綜合報道,基于產品和市場特性,DRAM可分為主流DRAM和利基DRAM。主流DRAM產品具有大容量、高傳輸速率的特點,主要應用于智能手機、個人計算機、服務器等大規模標準化電子設備。其市場特征表現為標準程度高、市場規模龐大、下游應用集中、 周期性顯著且技術迭代迅速。相比之下,利基DRAM與主流產品相比性能要求不那么嚴格,依賴成熟工藝技術。盡管市場規模較小,但它在滿足汽車、通訊、工業應用、醫療設備等行業的多樣化需求中扮
    的頭像 發表于 06-07 00:01 ?368次閱讀
    利基DRAM市場趨勢

    ups電源—搞定UPS電源持續蜂鳴的妙招

    一、定期檢查與維護 1、電池檢查: 定期對UPS電源的電池進行檢查,包括電池的健康狀態、連接情況以及電池液的液位(對于濕式電池)。 及時更換老化或損壞的電池,以避免電池故障引起的警報聲。 2、清潔保養: 定期清潔UPS電源的外殼和內部組件,去除灰塵和污垢,保持良好的散熱性能。 檢查并緊固所有連接線,確保連接牢固可靠。 3、軟件更新: 關注UPS電源的軟件更新,及時安裝最新的固件或驅動程序,以提升電源系統的穩定性和性能。
    的頭像 發表于 06-06 18:38 ?62次閱讀
    ups電源—搞定UPS電源持續蜂鳴的妙招

    機器人和自動化的未來(1)

    時代的到來,不僅標志著技術的飛躍,也預示著社會結構和生活方式的巨大變革。1.1機器人簡史:從幻想到現實談到機器人,人們很容易
    的頭像 發表于 04-19 08:34 ?226次閱讀
    機器人和自動化的未來(1)

    五金清洗機的簡史與未來發展趨勢解析

    想象一下,身處在繁忙的工業車間里,金屬零件堆積如山,等待著清洗。你或許會問:“這些金屬零件如何才能恢復到如新般的光澤?”這就要提到五金清洗機的神奇之處。它不僅能高效清潔,還象征著工業發展的智能化與自動化。今天,讓我們一起走進五金清洗機的歷史長河,探索它的演變、技術進步以及未來的發展趨勢。五金清洗機的誕生背景和歷史沿革五金清洗機并非一夕之間的產物,它的誕生與工
    的頭像 發表于 04-10 16:33 ?375次閱讀
    五金清洗機的<b class='flag-5'>簡史</b>與未來發展趨勢解析

    AI先鋒對話:DeepSeek爆火背后,戰略破局的新思考

    近日,阿丘科技聯合創始人鄭慧偉受邀參加由慎思行舉辦的《戰略簡史》老友會,與慎思行老羅、云南白藥戰略負責人顧嘉,一起探討AI將如何影響未來戰略這一時代命題。本次討論主要圍繞“DeepSeek火爆背后
    的頭像 發表于 02-27 15:11 ?573次閱讀
    AI先鋒對話:DeepSeek爆火背后,戰略破局的新思考

    英飛凌IGBT7系列芯片大解析

    上回書(英飛凌芯片簡史)說到,IGBT自面世以來,歷經數代技術更迭,標志性的技術包括平面柵+NPT結構的IGBT2,溝槽柵+場截止結構的IGBT3和IGBT4,表面覆銅及銅綁定線的IGBT5等。現今
    的頭像 發表于 01-15 18:05 ?980次閱讀
    英飛凌IGBT7系列芯片大解析

    安森美(onsemi)的超聲波傳感器解決方案的未來趨勢和創新

    簡要介紹超聲波傳感器的發展歷程,并結合當前和未來的應用,預測未來幾年超聲波傳感器的應用領域。? ? ? 汽車超聲波傳感器簡史 超聲波技術常用于檢測物體和發現固體材料中的缺陷,其首項專利可以追溯到上世紀30年代。一直
    的頭像 發表于 11-23 14:53 ?1629次閱讀

    名單公布!【書籍評測活動NO.50】親歷芯片產線,輕松圖解芯片制造,揭秘芯片工廠的秘密

    的知識門檻低,又獨家揭秘了芯片制造工廠的運營到管理,適用于更大讀者群。本書非常適合對芯片這個話題(不管是技術還是產業運營等)感興趣的IC從業者和大眾讀者。 相信閱讀過《芯路》《半導體簡史》《圖解
    發表于 11-04 15:38

    【「ARM MCU嵌入式開發 | 基于國產GD32F10x芯片」閱讀體驗】+書籍整體概況

    系統的概念,ARM簡史,以及前期的準備工作,視頻時長112min。 第二章介紹GD32F10x的架構,包含計算機架構,Cortex-M3架構;第三章通用輸入/輸出端口GPIO介紹,內容非常豐富,介紹
    發表于 08-25 22:48

    Perforce靜態代碼分析專家解讀MISRA C++:2023?新標準:如何安全、高效地使用基于范圍的for循環,防范未定義行

    Frank van den Beuken博士的博客系列,本期為第三篇。 在前兩篇系列文章中,我們向您介紹了 新的MISRA C++ 標準 和 C++簡史 。本文,我們將仔細研究C++中以for循環為中心
    的頭像 發表于 06-18 12:57 ?691次閱讀