女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

前ARM工程師批評:RISC-V不完美之處

Q4MP_gh_c472c21 ? 來源:嵌入式ARM ? 作者:嵌入式ARM ? 2020-12-30 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

本文最初完成于幾年之前,彼時作者正在 ARM 公司擔任執(zhí)行核心驗證工程師職位。作者當時的工作深入或圍繞多種處理器核心,而文中提到的觀點深受這些經(jīng)驗的影響,換句話說,這些觀點存在不同程度的偏見。

作者依舊堅持認為 RISC-V 的設計并不完美,但同時也承認,如果現(xiàn)在需要搭建一個 32 或 64 位的 CPU,他在實現(xiàn)構(gòu)建時也會從現(xiàn)有工具中受益。

本文主要基于 RISC-V ISA 規(guī)范 v2.0,部分已更新至 v2.2。

一些觀點

RISC-V ISA 對極簡主義的追求鉆了牛角尖,它極力強調(diào)減少指令數(shù)量,規(guī)范編碼等等。而這種追求則導致了錯誤的正交性(分支、調(diào)用、返回時重復使用同一指令),以及對贅余指令的需求,這些在程序大小和指令數(shù)量上都會影響到代碼密度。

以下面的 C 代碼為例:

int readidx(int *p, size_t idx){ return p[idx]; }


簡單的數(shù)組索引,非常常見的操作。將其在 x86_64 中編譯:

mov eax, [rdi+rsi*4]ret

或者是 ARM 中:

ldr r0, [r0, r1, lsl #2]bx lr // return

但是在 RISC-V 中需要的代碼則是:

# 很抱歉如果有任何語法錯誤,risc-v 并沒有在線編譯器slli a1, a1, 2add a0, a1, a1lw a0, a0, 0jalr r0, r1, 0 // return

RISC-V 的極簡主義讓解碼器(CPU 前端)變得更簡單,代價則是需要執(zhí)行更多的指令。然而,相對于拓寬流水線這個難題而言,解碼不規(guī)則指令的問題很好解決,主要難點在于確定指令的長度是否一致。x86 的眾多前綴就是個極佳的反面教材。對指令集的簡化不應追求極限。寄存器 + 移位寄存器的內(nèi)存操作指令是程序中非常常見且簡單的操作,對于 CPU 而言也很容易實現(xiàn)。即使無法直接執(zhí)行,CPU 也可以相對輕松地將其分步執(zhí)行,其操作復雜程度遠遜色于融合簡單操作的序列。

CISC CPU 中的“復合”指令,繁復、少有使用且普遍性能低下,而 CISC 和 RISC CPU 通用的“功能”指令則意指結(jié)合了少量操作序列并且使用率高、性能高的指令。這二者應當有所區(qū)分。

還不錯的部分

幾乎不受任何限制的可擴展性。雖說這是 RISC-V 的賣點,但它同時也是碎片化、不兼容生態(tài)系統(tǒng)的罪魁禍首,在管理時還需加倍小心。

調(diào)用、返回和寄存器間接分支使用同一指令(JALR)。分支預測需要額外解碼。

調(diào)用:Rd = R1

返回:Rd = R0, Rs =R1

間接分支: Rd = R0, Rs≠ R1

(奇怪分支:Rd≠ R0, Rd ≠ R1)

可變長度編碼無法自我同步。x86 和 Thumb-2 中都存在的常見問題,會導致實現(xiàn)和安全性方面的各種漏洞,例如面向返回的編程攻擊。

RV64I 規(guī)定所有 32 位值的符號擴展。這一點會導致不必要的上半切換,或者需要對寄存器的上半部分進行特殊調(diào)整。建議采用零擴展,在減少切換的同時,通常還可以在已知上半部分為零的情況下,通過追蹤”為零“位來進行優(yōu)化。

乘法是可選項。考慮到高速乘法器在微型實現(xiàn)中占用的面積不容忽視,創(chuàng)建占用更小,還可以將現(xiàn)有 ALU 廣泛用于多循環(huán)乘法的小型乘法器不失為良策。

LR/SC 指令對有限使用子集有嚴格的最終轉(zhuǎn)發(fā)要求。盡管這項限制頗為嚴苛,但對于沒有緩存的小型實現(xiàn)而言有可能會帶來一些問題。

這一點似乎是 CAS 指令的替代品,具體請參照有關(guān)該指令的注釋。

FP 粘性位和舍入模式處于同一寄存器中。如果想通過執(zhí)行 RMW 操作改變舍入模式,則需要對 FP 管道進行序列化。

FP 指令支持的編碼精度有 32 位、64 位和 128 位,唯獨沒有硬件中更為常見的 16 位。

這點很容易修正:我們有免費的字組編碼 2’b10。

更新:v2.2 中添加了十進制 FP 擴展占位符,但仍然沒有半精度占位符。迷惑行為。

FP 寄存器文件中的 FP 值未指定,但可以通過加載 / 存儲觀察到。

仿真器作者要恨死你了。

VM 遷移會將變?yōu)椴豢赡堋?/p>

更新:v2.2 需要 NaN 裝箱更寬的值。

糟糕的部分

沒有條件代碼,只有比較和分支指令。這一點自身沒什么問題,但它意味著:需要編碼一到二個寄存器說明符,導致條件分支中的編碼空間減少。

沒有條件選擇,這一點在高度不可預測的分支中很有用。

加法 / 減法沒有加進位或借位。(即使這樣,這也比 ISA 將 flag 寫入通用寄存器 GPR,然后在結(jié)果 flag 上分支要好。)

用戶級 ISA 需要高精度計數(shù)器。在實踐中,將這些計數(shù)器暴露給應用程序意味著側(cè)通道攻擊的好機會。

乘法和除法同屬于一個擴展,無法單獨實現(xiàn)其中之一。相比除法,乘法要簡單許多,而且在大多的 CPU 上很常見。

基礎(chǔ) ISA 中沒有原子指令。多核微型處理器越來越普遍的今天,LL/SC 類型原子指令也越來越廉價:只需要 1 位 CPU 狀態(tài)即可完成最小 CPU 實現(xiàn)。

LR/SC 和更復雜的原子指令同屬于一個擴展。直接限制了小型實現(xiàn)的靈活性。

非 LR/SC 的一般原子指令不包含 CAS 原語

CAS 的設計是為了避免需要一條指令讀取 5 個寄存器的情況,例如:加法器、Cmp:CmpLo,SwapHi:SwapLo。但 LR/SC 用于取代 CAS 的保底進度很可能只會在實現(xiàn)上帶來更高的開銷。

原子指令僅支持 32 位或 64 位操作,不支持 8 位或 16 位。

對 RV32I 而言,想在整數(shù)和浮點寄存器文件之間轉(zhuǎn)換 DP 和 FP,只能通過內(nèi)存解決。

舉例來說:RV32I 的 32 位 ADD 和 RV64I 的 64 位 ADD 共用同一套編碼,RV64I 又多加了一套 ADD.W 編碼。如此一來,CPU 實現(xiàn)這兩種指令時麻煩了許多,不如直接新增一套 64 位編碼。

沒有 MOV 指令。匯編器對于 MV 的等效指令是:MV rD, rS -> ADD rD, rS, 0。MOV 優(yōu)化通常由高端處理器,尤其是失序處理器完成。識別 RISC-V 規(guī)范的 MV 需要一個 12 位的立即數(shù)。

在沒有 MOV 指令的情況下,ADD rD, rS, r0 是對 MOV 不錯的替代。它更易被解碼,而 CPU 通常也會有特殊情況下的邏輯來識別零寄存器。

尤為糟糕的部分

JAL 在本該只是 R1(分支時是 R0)的鏈接寄存器編碼上浪費了 5 比特。

這意味著 RV32I 有 21 位的分支位移(對于諸如瀏覽器等大型應用時,不使用多指令序列或者分支 island 時會不夠用)。

其實是 1.0 版本 ISA 的歷史遺留問題

盡管 RISC-V 在統(tǒng)一編碼上花了大功夫,但加載 / 存儲指令的編碼仍然是不同的(寄存器 vs 立即字段互換)。

似乎寄存器編碼的最終正交性要比兩種高度相關(guān)指令的正交性更受歡迎。考慮到地址生成是對時序更為敏感的操作,這種選擇有點奇怪。

寄存器偏移量(Rbase +Roffset)或索引(Rbase + Rindex << Scale)沒有負載。

FENCE.I 意味著指令緩存和前面的存儲區(qū)必須完全同步,無論是否有 fence。實現(xiàn)時需要在 fence 上刷新 I,或者通過snoop的方式監(jiān)視D 和存儲緩存區(qū)。

RV32I 中,讀取 64 位計數(shù)器需讀取上半部分兩次,并進行比較和分支,以防在讀取操作時下半部分和上半部分發(fā)生借位。

通常 32 位 ISA 包含了一個“讀取一對特殊寄存器”的指令來避免這個問題。

架構(gòu)上沒有定義“提示”編碼空間。提示編碼是指在當前處理器上作為 NOP 執(zhí)行,但在之后的變量上有操作的編碼。

“NOP 提示”的常見例子是自旋鎖 yield。

更復雜的提示也有實現(xiàn)。即那些對新處理器有明顯副作用的提示,例如 x86 的邊界檢查指令被編碼在提示空間,以便二進制文件保持向后兼容。

責任編輯:xj

原文標題:前ARM工程師批評:RISC-V尤為糟糕的部分!

文章出處:【微信公眾號:嵌入式ARM】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5150

    文章

    19659

    瀏覽量

    317397
  • RISC-V
    +關(guān)注

    關(guān)注

    46

    文章

    2562

    瀏覽量

    48785

原文標題:前ARM工程師批評:RISC-V尤為糟糕的部分!

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RISC-VARM有何區(qū)別?

    在微處理器架構(gòu)領(lǐng)域,ARMRISC-V是兩個備受關(guān)注的體系。ZLG致遠電子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,這引發(fā)了人們對這兩種架構(gòu)差異的深入探討。
    的頭像 發(fā)表于 06-24 11:38 ?853次閱讀
    <b class='flag-5'>RISC-V</b>和<b class='flag-5'>ARM</b>有何區(qū)別?

    “開放·連接 ”2025玄鐵 RISC-V 生態(tài)大會議程公布!

    2025年2月28日,我們誠邀您參與“開放·連接 ”2025玄鐵 RISC-V 生態(tài)大會。與來自全球的行業(yè)專家、技術(shù)領(lǐng)袖、企業(yè)決策者和 RISC-V 資深工程師共赴北京,一同探討技術(shù)趨勢、行業(yè)洞見及產(chǎn)業(yè)未來,齊心共筑
    發(fā)表于 02-24 16:25

    ArmRISC-V架構(gòu)的優(yōu)劣勢比較

    關(guān)于ArmRISC-V的討論涉及多個層面。雖然多種因素共同作用于這些架構(gòu)的整體性能,但每種架構(gòu)都有其最適合的幾類主要應用場景。 Arm 長期以來,專有技術(shù)往往意味著高昂的許可費用,Arm
    發(fā)表于 02-01 22:30

    RISC-V架構(gòu)及MRS開發(fā)環(huán)境回顧

    PowerPC以及現(xiàn)在統(tǒng)治嵌入式市場的ARM。 2. 什么是RISC-V RISC全名Reduced Instruction Set Computer,即精簡指令集計算機;V是羅馬字
    發(fā)表于 12-16 23:08

    RISC-VARM 架構(gòu)的區(qū)別 RISC-V與機器學習的關(guān)系

    在現(xiàn)代計算機架構(gòu)中,RISC-VARM是兩種流行的處理器架構(gòu)。它們各自具有獨特的特點和優(yōu)勢,適用于不同的應用場景。 1. RISC-V架構(gòu) RISC-V(讀作“risk-five”)
    的頭像 發(fā)表于 12-11 17:50 ?2982次閱讀

    RISC-V能否復制Linux 的成功?》

    。與開源軟件的共同點是,RISC-V也沒有IP版權(quán)問題,參與者可以共享其設計成果。簡而言之,RISC-V允許設計工程師進行創(chuàng)新,為他們提供選擇的自由。 SiFive聯(lián)合創(chuàng)始人兼首席架構(gòu)
    發(fā)表于 11-26 20:20

    什么是RISC-V?以及RISC-VARM、X86的區(qū)別

    工程師共同開發(fā)的,以下是一些主要貢獻者: Krste Asanovic:加州大學伯克利分校電子工程與計算機科學教授,RISC-V的創(chuàng)始人之一。 Andrew Waterman:加州大學伯克利分校博士
    發(fā)表于 11-16 16:14

    RISC-Varm指令集的對比分析

    RISC-VARM指令集是兩種不同的計算機指令集架構(gòu),它們在多個方面存在顯著的差異。以下是對這兩種指令集的詳細對比分析: 一、設計理念 RISC-VRISC-V的設計理念是簡化指
    發(fā)表于 09-28 11:05

    ISA ARM 對比 RISC-V

    、擴展方式以及目標應用場景等方面有顯著差異。 要深入對比ARMRISC-V的指令集,需要從指令集架構(gòu)(ISA)的設計原則、擴展模塊、指令的復雜性、特性以及它們的實際性能表現(xiàn)來進行討論。RISC-V作為第五代的
    的頭像 發(fā)表于 09-10 09:26 ?1597次閱讀

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

    加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進步的關(guān)鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?874次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    沁恒在歷屆峰會上分享RISC-V在MCU領(lǐng)域的創(chuàng)新成果,和大家共同見證了本土RISC-V產(chǎn)業(yè)的成長。早在第一屆RISC-V中國峰會上,沁恒就公開了青稞RISC-V系列量產(chǎn)芯片的關(guān)鍵技術(shù)
    的頭像 發(fā)表于 08-30 18:18 ?2364次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    裝,針對各式客戶量體裁衣。 07 免費專業(yè)開發(fā)環(huán)境 MRS讓RISC-V落地更省 沁恒重視廣大工程師群體,通過配套、完善RISC-V的開發(fā)工具,為客戶提供更舒適的產(chǎn)品體驗。專業(yè)的免費開發(fā)環(huán)境
    發(fā)表于 08-30 17:37

    risc-varm哪個更有前途?

    如今risc-v發(fā)展迅猛,我想預測將來他與arm誰會更優(yōu)秀?
    發(fā)表于 08-29 21:12

    risc-v的發(fā)展歷史

    RISC-V的發(fā)展歷史可以追溯到2006年左右,當時David Patterson和其他研究者開始探索創(chuàng)建一個開放和可擴展的指令集架構(gòu)(ISA)。以下是RISC-V發(fā)展的主要里程碑: 一、起源與初步
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開源的指令集架構(gòu)(ISA),自其誕生以來就受到廣泛關(guān)注和應用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點: 1. 性能問題 相對于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18