女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

多種HPC應用中進行對比的基準

M8kW_icbank ? 2017-12-21 13:50 ? 次閱讀

一年一度的國際超級計算大會(SupercomputingConference,以下簡稱SC)上,每次都有一個非官方的主題出現。過去兩年的焦點是機器學習(Machine learning)和深度學習(Deep learning),而在之前則是大規模數據密集計算,以及利用云重塑超級計算未來發展方向的潛力。

所有這些主題都有一個共同點,那就是:它們的重點都不是CPU處理器。實際上,它們都是圍繞X86架構下的CPU性能提升或生態系統發展的相關話題。回想一下,近年來我們最后一次看到硬件設備成為大會的核心主題,還是在第一批大規模GPU超級計算機進入500強榜單時,然而它們只是加速器而不是設備的核心。

在今年的SC17上,核心處理器再次成為了非官方主題?;?a target="_blank">ARM架構的硬件和軟件生態系統進行了廣泛的演示,Cray等超級計算公司還展示了全面的系統集成效果,很多基準測試的結果足以與英特爾的最先進產品相抗衡。

基于ARM處理器的“Isambard”超級計算機將包含10,000個內核(采用Cavium的ThunderX2 ARM處理器),將于明年在英國布里斯托大學面世,負責開發該超級計算機的團隊一直致力于基于ARM的HPC系統的研究和開發工作。我們現在看到,在基于大量開發工作鋪墊的ARM系統中,最著名的當屬巴塞羅那超級計算中心的Mont Blanc(幾年前開始采用雙Cortex-A15 ARM,現在基于Cavium ThunderX2 ARM處理器)。

McIntosh-Smith和他的團隊日前公布了一些很有意義的基準測試結果。這次基準測試采用了Cray 8節點設備集群和32核ThunderX2 ARM處理器,并與英特爾Skylake和Broadwell解決方案進行了對比。下面列出了在多種HPC應用中進行對比的基準 -

多種HPC應用中進行對比的基準

多種HPC應用中進行對比的基準

McIntosh-Smith表示,總體而言,以內存帶寬密集型的任何應用都能夠在ThunderX2上很好地運行,性能顯著優于 Skylake。然而對于偏向浮點密集型的應用來說,因為Skylake使用了更寬的向量運算器所以會更勝一籌,但是ThunderX2 能與Broadwell平臺旗鼓相當。如果繼續增加高帶寬內存,測試結果會怎么樣?這將會非常有趣。

基準測試結果請參見下圖:

多種HPC應用中進行對比的基準

內存帶寬密集型的優勢在OpenFOAM上的HPC應用中體現得最為明顯——OpenFOAM是一種開源CFD應用,通常更多地用于商業和科研領域的高性能計算。上圖的基準測試報告顯示,ThunderX2的OpenFOAM測試結果要好于Skylake 和 Broadwell 。

多種HPC應用中進行對比的基準

天氣和氣候模擬代碼也顯示內存帶寬密集型應用的性能會有同樣的提高。上圖顯示了在ThunderX2上測試英國氣象局(Met Office)的生產代碼的情況——Nemo是一種海洋模擬代碼。

“初步的結果顯示,對于GROMACS、CP2K和VASP等計算密集型的應用,不同處理器之間的性能差距很小。而內存帶寬密集型的應用則可以顯著看出不同處理器之間的差異。這是因為,盡管這些代碼可受益于X86處理器的更廣泛向量單位,但ThunderX2可以借助更多內核和更高的時鐘速度來進行補償,“McIntosh-Smith說。

隨著高端Cray XC50系統的面世,我們將在下一屆超級計算大會上看到基于ARM處理器的實際生產環境中的超級計算機的更多測試結果。

Isambard項目架構請參見下圖:

多種HPC應用中進行對比的基準

直到今天,很多HPC ARM觀察家都知道Isambard是Cray的機型;但如果他們知道這家超級計算機生產商選擇了一條更加艱難的道路,將ThunderX2 ARM處理器與業內著名的Aries互聯芯片相集成,并可以運行全套Cray軟件的話,很多人肯定會大吃一驚。相比較而言,如果把ThunderX2添加到CS Storm系列,而不是基于Aries的產品系列中,對Cray來說將簡單得多。但在McIntosh-Smith看來,這恰恰彰顯了Cray將ARM廣泛用于HPC領域的堅定決心。

McIntosh-Smith認為,將來不同的ARM選項可能會采用同一種專用的部署方法?!皩恚贏RM的HPC將增強向量功能,達到與其他CPU廠商不相上下的水平。下一代ARM產品將具有和任何其他廠商產品相當的向量寬度?!?/p>

有趣的一點是這些結果基于單純優化內核數量和基本條件后的編譯結果,只進行了幾個小時的微調。McIntosh-Smith表示,這些今天實現的突飛猛進,實際上是多年來在基于ARM的HPC系統上堅持不懈的努力結果。在硬件就緒后,ARM在HPC應用中所需的軟件也會更快到位,隨著面向超級計算機的ARM處理器的正式上市,整個行業將迎來架構改造的新紀元,ARM架構將在HPC領域揭開廣泛處理器選擇的新篇章。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • HPC
    HPC
    +關注

    關注

    0

    文章

    332

    瀏覽量

    24200

原文標題:HPC將迎來處理器變革新時代

文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基準點識別簡述

      用來進行基準點識別的方法根據基準點的形狀而彼此獨立。最小的基準點尺寸由向量點的尺寸決定,向量點可以畫和計算到基準點邊緣。不論什么形狀的
    發表于 09-03 10:46

    Bricked Curiosity HPC無法進行編程

    嗨,所有,得到一個好奇的HPC的盒子,可以讀取固件(1.41),并試圖通過MPLAB 4.15更新到最新的PKOB固件(1.51),它失敗了。無法進行編程。好奇號HPC是否有應急引導加載程序恢復
    發表于 10-16 15:32

    HPC-95PH

    ` HPC-95PHHPC-95PH長期代理韓國HITROL液位開關吳經理:132.4667.5433 / 0755-26998458工作Q:1139878854 地址:深圳市南山區南海大道4050
    發表于 12-19 09:45

    HITROL HPC-95P

    ` 代理韓國HITROL液位傳感器,控制器吳經理:0755-26998458/132.4667.5433 工作QQ:1139878854HCC(HPC)-95P系列是一款電容式液/料位開關,它通過
    發表于 12-19 09:47

    HPC-100CT-2液位計

    HPC-100CT-2液位計 HPC-100CT-2液位計詳詢請致電: ***吳經理工作Q:1139878854 地址:深圳市南山區科技園南海大道4050號 HITROL公司運用專利的熱擴散技術,為
    發表于 01-15 17:57

    如何在FL Studio中進行側鏈?

    使用果味限制器在FL Studio中進行側鏈壓縮的方法
    發表于 11-04 09:28

    使用UMC 28HPC工藝進行MC仿真有什么問題嗎?

    最近在使用UMC 28HPC工藝進行MC仿真,發現兩個問題:1. MC仿真結果的std(標準差)和實測結果不match,實測結果大概為仿真結果的3倍。查看了一下U28HPC的model file
    發表于 06-25 06:40

    如何在android中進行驅動呢

    如何在android中進行驅動呢?并輸出dev和sys中的界面用程序調用呢?
    發表于 03-02 09:53

    多ADC系統的基準電壓設計

    本文討論了針對超聲成像系統空間受限特點定制的兩個成功應用的基準電路,這兩個方案均采用一個基準源為多個模/數轉換器(ADC)供電。最后,對這兩個電路進行了測試,測試結果將在后續的應用筆記中進行
    發表于 01-27 14:37 ?3883次閱讀
    多ADC系統的<b class='flag-5'>基準</b>電壓設計

    在Protel DXP中進行FPGA設計和仿真

    在Protel DXP中進行FPGA設計和仿真
    發表于 12-25 10:09 ?0次下載

    在SDAccel中進行調試

    在SDAccel中進行調試
    的頭像 發表于 11-29 06:20 ?2058次閱讀

    uboot中進行LCD初始化的流程免費下載

    本文檔的主要內容詳細介紹的是uboot中進行LCD初始化的流程免費下載。
    發表于 08-12 08:00 ?11次下載
    uboot<b class='flag-5'>中進行</b>LCD初始化的流程免費下載

    如何對推理加速器進行基準測試

      客戶對基準推理學習曲線的最后階段是開發自己的模型,使用通常來自 Nvidia 或數據中心的訓練硬件/軟件,然后在可能的目標推理加速器上對該模型進行基準測試。
    的頭像 發表于 06-06 16:02 ?1522次閱讀

    如何高效管理MCU內存? 多種分配算法對比

    如何高效管理MCU內存? 多種分配算法對比?
    的頭像 發表于 10-17 18:21 ?1530次閱讀
    如何高效管理MCU內存? <b class='flag-5'>多種</b>分配算法<b class='flag-5'>對比</b>?

    什么是頻率域?為什么要在頻率域中進行圖像處理?

    什么是頻率域?為什么要在頻率域中進行圖像處理? 頻率域是指在頻率上對圖像進行分析和處理的領域。在頻率域中,圖像被轉換為一組頻率成分,其中每個頻率表示圖像中某種特定的變化。頻率域分析使用一種叫做
    的頭像 發表于 11-20 14:05 ?2342次閱讀