女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCUXpresso IDE下編譯優(yōu)化等級(jí)設(shè)置方法

恩智浦MCU加油站 ? 來(lái)源:恩智浦MCU加油站 ? 作者:恩智浦MCU加油站 ? 2022-09-08 09:14 ? 次閱讀

最近為了測(cè)試一款Cortex-M33產(chǎn)品性能達(dá)標(biāo),驗(yàn)證團(tuán)隊(duì)將coremark基準(zhǔn)測(cè)試程序當(dāng)作了一個(gè)測(cè)試用例,而在RTL環(huán)境里指定的 C 編譯器是標(biāo)準(zhǔn)GCC,當(dāng)發(fā)現(xiàn)跑出來(lái)的 coremark程序測(cè)試結(jié)果與Arm給的Cortex-M33參考值4.02 CoreMark/MHz有一定差距,因此對(duì)這個(gè)問(wèn)題進(jìn)行了調(diào)查。

在Arm的Cortex-M33主頁(yè),其備注了4.02 CoreMark/MHz參考值來(lái)自于 EEMBC官網(wǎng)上的一款恩智浦LPC55S69JBD100芯片跑出來(lái)的結(jié)果,頁(yè)面里備注了跑分結(jié)果是在Arm Clang Compiler v6.12下開(kāi)啟最高優(yōu)化等級(jí) -Omax 下得到的,而驗(yàn)證團(tuán)隊(duì)用得是GCC,由此斷定問(wèn)題大概率是由不同編譯器優(yōu)化性能差異引起的,借著這個(gè)實(shí)際問(wèn)題,今天就跟大家聊一聊MCUXpresso IDE下編譯優(yōu)化等級(jí)設(shè)置方法。

注:本文使用的MCUXpresso IDE軟件版本是 v11.6.0_8187。

一、查看MCUXpresso的GCC版本

有朋友可能會(huì)覺(jué)得奇怪,文章開(kāi)頭里明明聊得是GCC下coremark跑分問(wèn)題,為何要引出MCUXpresso IDE?其實(shí)MCUXpresso IDE是恩智浦推出的免費(fèi)集成開(kāi)發(fā)環(huán)境,其底層編譯器就是標(biāo)準(zhǔn)GCC工具鏈,使用MCUXpresso IDE,我們就不用像使用GCC那樣手動(dòng)準(zhǔn)備相應(yīng)Makefile去做編譯了。

因?yàn)槲覀兪墙柚鶰CUXpresso IDE來(lái)測(cè)試GCC編譯優(yōu)化性能,所以需要了解當(dāng)前 GCC版本,可以在MCUXpresso IDE安裝目錄的如下路徑下找到GCC版本信息。

執(zhí)行 arm-none-eabi-gcc.exe -v 命令即可知道其版本,MCUXpresso IDE v11.6 使用得是 GCC v10.3.1。

MCUXpressoIDE_11.6.0_8187ide oolsinarm-none-eabi-gcc.exe

MCUXpressoIDE_11.6.0_8187ide oolslibgccarm-none-eabi10.3.1

二、GCC支持的優(yōu)化等級(jí)

既然咱們聊得是優(yōu)化等級(jí)設(shè)置方法,首先我們得知道GCC下支持哪些優(yōu)化等級(jí),我們可以在MCUXpresso IDE安裝目錄或者GCC官網(wǎng)找到用戶手冊(cè)(gcc.pdf),手冊(cè)里面 Section 3.11 Options that Control Optimization 章節(jié)有詳細(xì)的解釋。

MCUXpressoIDE_11.6.0_8187ide oolssharedocgcc-arm-none-eabipdfgcc.pdf

https://gcc.gnu.org/onlinedocs/gcc-10.3.0/gcc.pdf

GCC本身支持非常多的優(yōu)化策略小項(xiàng),大概有如下 100 多個(gè),可以在手冊(cè)里去看每個(gè)小項(xiàng)的具體解釋,了解了這些小項(xiàng),我們?cè)诰幾g時(shí)當(dāng)然可以把這些策略參數(shù)按需加上去,不過(guò)這種方式顯然比較繁瑣。

6b364c9a-2f0e-11ed-ba43-dac502259ad0.png

GCC為了化繁為簡(jiǎn),將這些策略小項(xiàng)做了分類整理,形成了如下8個(gè)等級(jí)(基于代碼大小和運(yùn)行速度兩個(gè)方向逐步加檔),我們?cè)趯?shí)際編譯時(shí)一般直接用這8個(gè)優(yōu)化等級(jí)即可。

優(yōu)化等級(jí) 策略解釋
-O0 不進(jìn)行任何優(yōu)化(如果沒(méi)有指定優(yōu)化級(jí)別,即為此默認(rèn)設(shè)置)。
-O或者-O1 在不影響編譯速度的前提下,盡量采用一些優(yōu)化算法降低代碼大小和提高可執(zhí)行代碼的運(yùn)行速度。
- 此等級(jí)執(zhí)行了 45 個(gè)策略小項(xiàng)。
-O2 犧牲部分編譯速度,采用幾乎所有的目標(biāo)配置支持的優(yōu)化算法,用以提高目標(biāo)代碼的運(yùn)行速度。
-此等級(jí)在-O1所有優(yōu)化策略小項(xiàng)之上增加了 48 個(gè)策略小項(xiàng)。?
-O3 采取很多向量化算法,提高代碼的并行執(zhí)行程度,比如利用現(xiàn)代CPU中的流水線,Cache等,目標(biāo)是寧愿增加目標(biāo)代碼的大小,也要拼命的提高運(yùn)行速度。
-此等級(jí)在-O2所有優(yōu)化策略小項(xiàng)之上增加了16個(gè)策略小項(xiàng)。
-Os 與-O3有異曲同工之妙,但兩者的目標(biāo)不一樣,這個(gè)等級(jí)是為了盡量的降低目標(biāo)代碼的大小,這對(duì)于存儲(chǔ)容量很小的設(shè)備來(lái)說(shuō)非常重要。
-此等級(jí)在-O2所有優(yōu)化策略小項(xiàng)之上減掉了 6 個(gè)策略小項(xiàng),然后使能了 -finline-functions 策略。
-Ofast 不會(huì)嚴(yán)格遵循語(yǔ)言標(biāo)準(zhǔn),會(huì)針對(duì)某些語(yǔ)言啟用部分優(yōu)化,以達(dá)到最快的運(yùn)行速度。
-此等級(jí)在-O3所有優(yōu)化策略小項(xiàng)之上增加了 -ffast-math 和 -fallow-store-data-races 策略。
-Og 在保持快速編譯和良好調(diào)試體驗(yàn)的同時(shí),提供合理的優(yōu)化級(jí)別。
-Oz 比-Os更激進(jìn)的去降低目標(biāo)代碼的大小,GCC v12.x之后的版本才引入。

三、MCUX下設(shè)置優(yōu)化等級(jí)的三種方法

在 MCUXpresso IDE 工程里,我們有三種方法來(lái)設(shè)置優(yōu)化等級(jí),分別針對(duì)單個(gè)函數(shù)、單個(gè)源文件、整個(gè)工程源文件。

3.1 在源文件中設(shè)置

第一種優(yōu)化等級(jí)設(shè)置方法主要針對(duì)單個(gè)函數(shù),即使用 __attribute__ 來(lái)修飾函數(shù)(這其實(shí)是GCC下通用做法,與MCUX關(guān)系不大),經(jīng)過(guò)修飾的函數(shù)可以不受 MCUXpresso IDE工程整體優(yōu)化等級(jí)設(shè)置影響。

void __attribute__((optimize("O3"))) function(void)
{
    ...
}

第二種優(yōu)化等級(jí)設(shè)置方法主要針對(duì)多個(gè)相鄰函數(shù)或者整個(gè)源文件,即使用如下 #pragma組合語(yǔ)句來(lái)修飾代碼(這也是GCC下通用做法,與MCUX關(guān)系不大),經(jīng)過(guò)修飾的代碼也同樣不受MCUXpresso IDE工程整體優(yōu)化等級(jí)設(shè)置影響。

#pragma GCC push_options     // 代碼作用范圍起始處
#pragma GCC optimize("O3")   // 代碼優(yōu)化等級(jí)設(shè)置
void function1(void)
{
    ...
}
void function2(void)
{
    ...
}
...
#pragma GCC pop_options      // 代碼作用范圍結(jié)尾處

3.2 在IDE選項(xiàng)中設(shè)置

第三種優(yōu)化等級(jí)設(shè)置方法主要針對(duì)工程全部源文件,即在MCUXpresso IDE工程選項(xiàng)里Optimization Level一欄項(xiàng)目里做切換選擇,這里基本上與 GCC v10.3 優(yōu)化等級(jí)定義是一致的,但是缺少了 -Ofast 選項(xiàng)。

6b647174-2f0e-11ed-ba43-dac502259ad0.png

四、MCUX下設(shè)置-Ofast等級(jí)

使用一塊MIMXRT595-EVK開(kāi)發(fā)板(主芯片為Cortex-M33內(nèi)核),在其配套SDK 里的hello world工程基礎(chǔ)之上移植了coremark程序,在IAR v9.10最高優(yōu)化等級(jí)下(High-Size No size constraints)得到了3.94 CoreMark/MHz的跑分,這很接近Arm基準(zhǔn)值,但是在MCUXpresso IDE最高優(yōu)化等級(jí)下(-O3)僅得到了2.76 CoreMark/MHz。

莫非是必須要在MCUXpresso IDE下開(kāi)啟GCC的最快運(yùn)行優(yōu)化等級(jí) -Ofast 才能得到理想coremark跑分,但是MCUXpresso IDE選項(xiàng)里并沒(méi)有 -Ofast 怎么辦?

別著急,剛才工程選項(xiàng)下還有Other optimization flags后門,我們?cè)谶@里手動(dòng)添加上 -Ofast 比 -O3 多的那兩個(gè)優(yōu)化策略小項(xiàng),以及MCUX團(tuán)隊(duì)要求的 -fno-semantic-interposition 小項(xiàng),這樣基本就等于 - Ofast 效果。

-ffast-math -fallow-store-data-races -fno-semantic-interposition

6ba61c50-2f0e-11ed-ba43-dac502259ad0.png

重新編譯,再跑一次 -Ofast 等級(jí)下的MCUXpresso IDE工程,發(fā)現(xiàn)coremark跑分結(jié)果并沒(méi)有比 -O3 等級(jí)下有多大提升。

想了想雖然跑不到IAR 上 3.94 CoreMark/MHz的高分有點(diǎn)不甘心,但是這也很正常嘛,免費(fèi)的GCC編譯器如果能達(dá)到商業(yè)IAR編譯器那樣的效果,那人家商業(yè)編譯器還怎么收費(fèi)呢,理解萬(wàn)歲!

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:MCUXpresso IDE下設(shè)置代碼編譯優(yōu)化等級(jí)的幾種方法

文章出處:【微信號(hào):NXP_SMART_HARDWARE,微信公眾號(hào):恩智浦MCU加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IAR編譯優(yōu)化等級(jí)設(shè)置介紹

    IAR擁有靈活的優(yōu)化等級(jí)設(shè)置,包括不同等級(jí)和不同層級(jí)的編譯優(yōu)化
    發(fā)表于 11-21 17:36

    如何使用MDK/MCUXpresso IDE/IAR工具編譯生成燒錄固件文件

    使用MDK/MCUXpresso IDE/IAR工具編譯生成燒錄固件文件。使用MCU BootUtility來(lái)加載hex文件或者bin文件或者是.srec文件進(jìn)行一站式燒錄。默認(rèn)情況
    發(fā)表于 11-04 06:55

    RISC-V MCU IDE MRS(MounRiver Studio)開(kāi)發(fā)之: 設(shè)置函數(shù)的優(yōu)化等級(jí)

    在嵌入式開(kāi)發(fā)過(guò)程中,有時(shí)為了調(diào)試代碼,我們需要對(duì)單個(gè)函數(shù)或多個(gè)函數(shù)設(shè)置單獨(dú)的優(yōu)化等級(jí),下面以RISC-V MCU IDE MounRiver Studio(MRS)為例,介紹兩種添加函
    發(fā)表于 12-13 14:27

    MCUXpresso IDE怎么使用?

    為什么NXP的跨界 RT單片機(jī)沒(méi)有什么人用?教程也非常少。在外面其實(shí)很多人用的。 使用MCUXpresso IDE就更少。我不是開(kāi)發(fā)技術(shù)。我是做產(chǎn)品設(shè)計(jì)的。先了解一怎么回事。希望大家指教。1
    發(fā)表于 01-12 06:14

    分享MCUXpresso IDE將關(guān)鍵函數(shù)重定向到RAM中執(zhí)行的幾種方法

      大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是MCUXpresso IDE將關(guān)鍵函數(shù)重定向到RAM中執(zhí)行的幾種方法。  前段時(shí)間痞子衡寫(xiě)了一篇 《在IAR開(kāi)發(fā)環(huán)
    發(fā)表于 02-10 06:44

    MCUXpresso IDE將應(yīng)用程序RW段分散鏈接有哪幾種方法

    MCUXpresso IDE將應(yīng)用程序RW段分散鏈接有哪幾種方法
    發(fā)表于 02-10 08:03

    求分享MCUxpresso IDE的LPC54113 ADC代碼和配置設(shè)置

    我需要 MCUxpresso IDE 的 LPC54113 ADC 代碼和配置設(shè)置
    發(fā)表于 04-10 07:51

    MCUXpresso IDE在Flash調(diào)試的注意事項(xiàng)

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家介紹的是 MCUXpresso IDE 使用 J-Link 下載算法在 Flash 調(diào)試注意事項(xiàng)。 介紹一如何使用新生成的
    的頭像 發(fā)表于 12-23 13:53 ?1219次閱讀

    痞子衡嵌入式:MCUXpresso IDE將關(guān)鍵函數(shù)重定向到RAM中執(zhí)行的幾種方法

      大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是MCUXpresso IDE將關(guān)鍵函數(shù)重定向到RAM中執(zhí)行的幾種方法。  前段時(shí)間痞子衡寫(xiě)了一篇 《在IAR開(kāi)發(fā)環(huán)
    發(fā)表于 12-06 19:36 ?9次下載
    痞子衡嵌入式:<b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b><b class='flag-5'>下</b>將關(guān)鍵函數(shù)重定向到RAM中執(zhí)行的幾種<b class='flag-5'>方法</b>

    LPC1768 MCUXpresso IDE環(huán)境使用完整64K內(nèi)存的方法

    MCUXpresso IDE是NXP公司免費(fèi)提供的一款針對(duì)自家平臺(tái)的IDE簡(jiǎn)單來(lái)說(shuō)就是 Eclipses 外加GCC編譯器和自家芯片平臺(tái)的IDE
    發(fā)表于 12-07 13:06 ?7次下載
    LPC1768 <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>環(huán)境<b class='flag-5'>下</b>使用完整64K內(nèi)存的<b class='flag-5'>方法</b>

    不同IDE應(yīng)用程序RW段分散鏈接的方法~

    今天痞子衡給大家介紹的是MCUXpresso IDE將應(yīng)用程序RW段分散鏈接的幾種方法。早期的 MCU 芯片,一般都會(huì)嵌入內(nèi)部 Flash 和 RAM,并且 Flash 和 RAM
    發(fā)表于 12-07 13:21 ?9次下載
    不同<b class='flag-5'>IDE</b><b class='flag-5'>下</b>應(yīng)用程序RW段分散鏈接的<b class='flag-5'>方法</b>~

    MCUXpresso IDE下工程鏈接文件配置管理與自動(dòng)生成機(jī)制介紹

    我們知道不同 IDE 鏈接文件語(yǔ)法是不一樣的,而恩智浦 MCUXpresso IDE 底層編譯器是 Arm GCC,因此其鏈接文件就是標(biāo)準(zhǔn)
    的頭像 發(fā)表于 11-17 10:41 ?3465次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>下工程鏈接文件配置管理與自動(dòng)生成機(jī)制介紹

    MCUXpresso IDE下生成鏡像文件的方法及其與IAR,MDK差異

    MCUXpresso IDE下生成鏡像文件的方法及其與IAR,MDK差異
    的頭像 發(fā)表于 09-28 17:05 ?1079次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>下生成鏡像文件的<b class='flag-5'>方法</b>及其與IAR,MDK差異

    MCUXpresso IDE將源碼制作成Lib庫(kù)方法及其與IAR,MDK差異

    MCUXpresso IDE將源碼制作成Lib庫(kù)方法及其與IAR,MDK差異
    的頭像 發(fā)表于 11-07 17:13 ?1689次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b><b class='flag-5'>下</b>將源碼制作成Lib庫(kù)<b class='flag-5'>方法</b>及其與IAR,MDK差異

    如何在MCUXpresso IDE中測(cè)量能耗?

    如何在MCUXpresso IDE中測(cè)量能耗?
    的頭像 發(fā)表于 09-19 16:40 ?787次閱讀
    如何在<b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>中測(cè)量能耗?