女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于ARMv8A的處理器——Graviton系列

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:Linux閱碼場 ? 2022-07-01 10:04 ? 次閱讀

2011年ARM公司的年度技術會議TechCon發布了全新的ARMv8架構[1],同一年,在以色列,Nafea Bshara和Bilik Hrvoye從他們的前老板獲得2000萬美元的投資,創建了Annapurna Labs。四年之后的2015年,亞馬遜用35億美元收購了這家公司。Annapurna Labs從此成為亞馬遜的一個部門,這個部門相繼設計了3代基于ARMv8A的處理器——也就是Graviton系列。

話不多說,先上參數:

583f029c-f8d3-11ec-ba43-dac502259ad0.png

數據整理:健哥。

原始地址:https://fvot4kwt4n.feishu.cn/sheets/shtcn69s9nbcvYxX0bAnDgxiAUb

Graviton3們,等等,這里為什么用們?因為Graviton3這顆“芯片”(Chip)里面是由7顆芯片(die)組成的。雖然沒有召喚出神龍,Graviton3的引力吸引到了4個DDR控制器die(每個die又有兩個DDR5通道)和兩個PCIe5.0控制器die。

把多個die封裝到一個芯片中的技術稱為chiplet技術,這樣的好處是,如果將來亞馬遜有了更快的CPU,而周圍的DDR和PCIe控制器不變,則不需要重新設計制造DDR和PCIe控制器芯片,可以把新的CPU和已有的控制器封裝到一起。這樣,系統設計可以更加靈活。前面表格的華為鯤鵬920,也采用了這項技術。

芯片整體性能方面,官方的說法是每個核心的性能至少快了25%。下面的SPEC CPU 2017測試也可以說明這一點。圖中的藍色是Graviton2,綠色是Graviton3。SPEC CPU是業內通行的測試CPU性能的benchmark,包括整數測試,浮點測試等等,大多數的用例都取自最終用戶的應用,例如perl解釋器,視頻壓縮,3D渲染等等[3]。

5880905e-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

Nginx的負載均衡測試里面,Graviton3比前一代好了一倍。

58b09092-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

對于Nodejs,則提高了40%

58d007e2-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

視頻編碼提高了50%

58f71814-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

機器學習提高了幾乎150%

591c6ae2-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

由于亞馬遜做了軟硬件垂直優化,不光是芯片本身的迭代,整個服務器的結構也有改進,這次一個主板上(下圖右側)支持三顆Graviton3芯片。

594117de-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

最后,讓我們“打開”芯片,看看里面的CPU。Graviton3使用了ARM Neoverse V1。V1主要是支持ARMv8.4的特性(上次說的蘋果M2支持到ARMv8.5特性),包括MPAM,SVE,嵌套虛擬化等。

595db4f2-f8d3-11ec-ba43-dac502259ad0.png

來源:https://community.arm.com/arm-community-blogs/b/architectures-and-processors-blog/posts/neoverse-v1-platform-a-new-performance-tier-for-arm

ARMv8.4的MPAM是內存的分區和監控功能,通過Partition ID對cache的容量和內存帶寬進行劃分。SVE是ARM在NEON的下一代SIMD(單指令多數據)指令集,關于SVE指令,2020年的超級計算機排行榜的第一名的Fugaku,就是基于ARM架構并使用了SVE指令集。[4]

ARMv8.4還支持了安全世界的虛擬化(Secure EL2),平時咱們用的Linux/Android都運行在Normal World(非安全世界,和安全世界相對)。安全世界運行需要更高安全性的能力,例如手機的指紋識別,版權視頻播放等等。安全世界的虛擬化就是允許安全世界運行多個安全操作系統

59932a7e-f8d3-11ec-ba43-dac502259ad0.png

來源:https://en.wikipedia.org/wiki/Bfloat16_floating-point_format

ARMv8.6的Bfloat16不僅支持了Bfloat16浮點類型,還支持了該類型的點積和矩陣運算,以及從單精度浮點(32位)轉換到Bfloat16的命令。Bfloat16格式是由Google Brain團隊開發的格式,如上圖,指數有8位,小數有7位。該格式很適合機器學習使用。

59b3a4c0-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

Graviton3的CPU性能如何呢?有大神做了詳細的測試[5],健哥選了其中的時延測試。下圖的Amphere Altra和Graviton2一樣都采用了Neoverse N1,下圖是二者和Graviton3的memory時延對比,可以看出Graviton3的L3 cache性能(下圖虛線,第三個臺階)明顯比另外兩個處理器好。但是由于DDR5本身的延遲比DDR4大一些,再加上DDR5在另外的die上面,所以Graviton3的主內存時延比另外兩個稍稍大一些(下圖第四個臺階,圖片的右上角)。

59d74ace-f8d3-11ec-ba43-dac502259ad0.png

Graviton3在亞馬遜云服務上已經上線,一根豪華冰棍的錢(每小時15.5RMB)就能愉快的玩耍64個vCPU的虛擬機1小時,相比之下,1vCPU2G內存的虛擬機只需要每小時兩毛四。64個CPU意味著單個Graviton3的芯片完全被你所用,系統cache和內存帶寬都是你一個人的。

59f6898e-f8d3-11ec-ba43-dac502259ad0.png

對ARM架構和調測調優感興趣的小伙伴可以進群咨詢了解健哥的課程

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19805

    瀏覽量

    233530
  • 芯片
    +關注

    關注

    459

    文章

    52170

    瀏覽量

    436129
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9306

    瀏覽量

    375003

原文標題:從外到內揭開亞馬遜的自研ARM芯片:Graviton3

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    海光雙路服務主板,支持 5000/7000系列 2/3號處理器

    處理器
    jf_10805031
    發布于 :2025年04月02日 14:17:42

    Xilica XP系列音頻處理器操作手冊

    XilicaXP系列數字音頻處理器操作手冊-XilicaXP系列音頻處理器操作手冊
    發表于 03-26 14:29 ?0次下載

    Arm發布基于Armv9架構的Cortex-A320處理器

    邊緣 AI 需要更卓越的計算性能、更強大的安全性,以及更出色的軟件靈活性。隨著軟件愈發復雜化,Armv9 架構應運而生,以提供先進的機器學習 (ML) 和 AI 功能,并具備增強的安全特性。該架構現已在 Cortex-A3xx 的超高能效
    的頭像 發表于 02-27 17:10 ?706次閱讀

    在AWS Graviton4處理器上運行大語言模型的性能評估

    亞馬遜云科技 (AWS) 新一代基于 Arm 架構的定制 CPU —— AWS Graviton4 處理器已于 2024 年 7 月正式上線。這款先進的處理器基于 64 位 Arm 指令集架構的 Arm Neoverse V2
    的頭像 發表于 02-24 10:28 ?510次閱讀
    在AWS <b class='flag-5'>Graviton</b>4<b class='flag-5'>處理器</b>上運行大語言模型的性能評估

    海光處理器有哪些型號

    海光處理器是基于X86架構研發的國產處理器,擁有自主知識產權,并針對不同市場需求推出了多個系列和型號。以下是海光處理器的主要型號及其分類: 1、產品
    的頭像 發表于 02-13 14:44 ?9429次閱讀

    DaVinci系列處理器TPS659105用戶指南

    電子發燒友網站提供《DaVinci系列處理器TPS659105用戶指南.pdf》資料免費下載
    發表于 12-21 08:59 ?0次下載
    DaVinci<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>TPS659105用戶指南

    強悍的AWS Graviton4處理器及其背后的Arm Neoverse

    電子發燒友網報道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會上,該公司正式對外發布了旗下第四代自研Arm芯片——Graviton4。作為目前最強大的Graviton處理器
    的頭像 發表于 12-19 00:04 ?2220次閱讀

    Arm與AWS合作深化,AWS Graviton4展現顯著進展

    :Invent 2024大會上,AWS進一步展示了其基于Arm架構的AWS Graviton4處理器的顯著進展。AWS Graviton4作為AWS Graviton
    的頭像 發表于 12-18 14:17 ?490次閱讀

    Cortex-A55 處理器到底什么來頭?創龍教儀一文帶您了解

    53:基于ARMv8-A架構,是ARM公司推出的第一個支持64位指令集的ARM Cortex-A系列處理器核心。 Cortex-A55:基于
    發表于 12-03 17:00

    全志T536系列處理器特性概述 集成RISC-V E907協處理器

    全志T536系列處理器是一款工業、智能應用領域的高性能處理器;全志T536系列處理器可以說是基于ARM架構設計,專為高效能、低功耗的嵌入式應
    的頭像 發表于 11-18 15:21 ?3565次閱讀
    全志T536<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>特性概述 集成RISC-V E907協<b class='flag-5'>處理器</b>

    AM3517/AM3505高性能ARM Cortex-A8處理器數據表

    電子發燒友網站提供《AM3517/AM3505高性能ARM Cortex-A8處理器數據表.pdf》資料免費下載
    發表于 08-08 14:13 ?0次下載
    AM3517/AM3505高性能ARM Cortex-<b class='flag-5'>A8</b>微<b class='flag-5'>處理器</b>數據表

    AMD的銳龍9000系列處理器將延后至8月發布

    國際媒體傳來消息,AMD公司已正式向其全球合作伙伴宣布,原計劃于7月31日面世的銳龍9000系列處理器將延后至8月發布。這一調整源自于AMD在最終品質檢驗階段發現的首批生產批次未能全面符合其嚴苛的質量標準。
    的頭像 發表于 07-25 14:24 ?962次閱讀

    GITSATR 集特國產 商務臺式機電腦龍芯3A6000處理器

    處理器
    GITSTAR 集特工控
    發布于 :2024年07月22日 15:52:19

    亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用

    北京2024年7月15日?/美通社/ -- 亞馬遜云科技宣布基于自研芯片Amazon Graviton4處理器的Amazon Elastic Compute Cloud (Amazon EC2
    的頭像 發表于 07-15 16:09 ?563次閱讀

    亞馬遜網絡服務即將推出第四代Graviton處理器

    7月10日,雅虎財經獨家報道了亞馬遜網絡服務(AWS)即將推出的重大技術進展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由AWS的計算與人工智能產品管理總監拉胡爾·庫爾卡尼在德克薩斯州奧斯汀的亞馬遜
    的頭像 發表于 07-10 15:51 ?844次閱讀