訪問寄存器代替內(nèi)存引用

我們先看一個例子：

有這么兩個程序：它們的目的就是將數(shù)組x中的數(shù)，按照下標累加到數(shù)組y中，最后在把數(shù)組y中的數(shù)據(jù)累加到一個數(shù)dest里面。為了驗證效果，我們將這個過程重復(fù)10000遍。

Prog 1 Prog2

這兩個程序的區(qū)別就在Prog2中紅框里面的內(nèi)容。那么哪個程序運行的更快呢？

話不多說，我們看實際的結(jié)果：

這里為了說明效果，我們編譯的時候，并沒有采用優(yōu)化（編譯優(yōu)化，確實可以提高程序運行的效率，但是過高的編譯優(yōu)化等級會有一定的副作用，另外編譯器優(yōu)化也具有一定的局限性，高效的代碼仍然應(yīng)該是我們追求的目標）。可以看到，Prog2要明顯比Prog1快。

要想理解上面的例子，我們必須先介紹一下寄存器和匯編代碼的相關(guān)知識：

寄存器

CPU內(nèi)部用來存放數(shù)據(jù)的一些小型存儲區(qū)域，注意寄存器是在CPU內(nèi)部，受限于CPU的物理尺寸，寄存器數(shù)量不會太多。我們只需要記住兩點：

1）寄存器和CPU的L1 cache相比，速度雖然還在一個數(shù)量級，但是L1 cache的訪問速度還是要慢幾倍。具體的數(shù)據(jù)見下文表2

2） CPU只能從寄存器直接取數(shù)據(jù)或者指令，如果取不到，獲取的順序是L1-》L2-》L3-》主存-》磁盤。

從下文表2中可以看出，如果cpu的cache訪問miss了，性能損失還是很大的。如果內(nèi)存里面再miss了，那對性能來說不亞于一場災(zāi)難了。

計算機訪問速度分級：

表1 時間單位

以3.3GHz的CPU為例：

表2 系統(tǒng)的各種延時

正如你所見，CPU周期的時間非常短，這段時間，光的速度大約只能走0.5米。想象一下，是不是非常震撼？

x86-64 CPU的整數(shù)寄存器：

我們無需刻意去記住這些寄存器的名稱，不同架構(gòu)的寄存器的數(shù)量和名稱也不一樣，我們只要知道他們是cpu內(nèi)部的效率極高的存儲單元即可。

回到前面的例子，為什么Prog2要比Prog1快，是因為Prog2里面用DEST這個局部變量代替了dest。DEST是一個局部變量，在匯編指令里是直接訪問寄存器，而dest則需要去訪問內(nèi)存cache。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

寄存器

寄存器

+關(guān)注

關(guān)注
31

文章
5425

瀏覽量
123544
cpu

cpu

+關(guān)注

關(guān)注
68

文章
11049

瀏覽量
216153
內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
8

文章
3111

瀏覽量
75032
程序

程序

+關(guān)注

關(guān)注
117

文章
3824

瀏覽量
82504

麥辣雞腿堡
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 麒麟9000s相當于驍龍多少和驍龍多少處理器相當
Hot 華為麒麟9000s是多少納米的麒麟9000s什么檔次

New 15KV ESD保護 RS-232發(fā)射器/接收器ICL3237E數(shù)據(jù)手冊
New ICL3223 1A電源電流250kbps RS-232發(fā)射器/接收器數(shù)據(jù)手冊

精選推薦
更多

文章

資料

帖子

MPS MPM3695GPJ-20電源模塊產(chǎn)品特性

MPS芯源系統(tǒng)
1天前

388 閱讀

傳統(tǒng)路線與其利天下的分水嶺，無刷電鉆驅(qū)動方案對比--【其利天下】

其利天下技術(shù)
1天前

475 閱讀

智多晶PLL使用注意事項

智多晶
1天前

398 閱讀

【飛凌嵌入式】基于i.MX9352開發(fā)板M核的FreeRTOS設(shè)計例程

飛凌嵌入式
1天前

516 閱讀

HZ-T536-SP_EVM：藏在Labubu百萬身價背后的“中國芯”

合眾恒躍
1天前

769 閱讀

LTE測試技術(shù)開發(fā)方案精選

盧國藝
3123KB

3積分

78下載

monitor_agent主機監(jiān)控節(jié)點

張霞
0.02 MB

2積分

2下載

Socorro程序崩潰報告系統(tǒng)

李巍
1.26 MB

免費

0下載

Brouhaha iOS深度學習框架

劉滿貴
12.75 MB

免費

0下載

HP 09825-66552用于HP 9825老式計算器的Crowbar保護電路

早知
0.01 MB

免費

0下載

【正點原子STM32MP257開發(fā)板試用】智能門鎖

jf_47210120
7天前

310 閱讀

【RA4L1-SENSOR】02 LCD上顯示ADC采樣電壓值

jf_83922529
1天前

402 閱讀

【RA4L1-SENSOR】01 ADC單次掃描采集外部電壓輸入+串口輸出

jf_83922529
1天前

629 閱讀

【RA4L1-SENSOR】電子相冊

gtbestom
1天前

610 閱讀

【正點原子STM32MP257開發(fā)板試用】介紹、上電測試、系統(tǒng)連接

jf_07365693
2天前

680 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

訪問寄存器代替內(nèi)存引用

評論