女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過并行處理和異構(gòu)SoC超越摩爾定律

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Brandon Lewis ? 2022-07-10 10:24 ? 次閱讀

2021 年嵌入式處理器報告:隨著晶體管擴展的可靠每瓦性能增益接近尾聲,未來幾代處理器將如何訪問有效執(zhí)行要求苛刻的工作負載所需的計算?我的答案來自異構(gòu) SoC 上的并行處理。

“我們已經(jīng)在 7 nm 上工作了很長時間,在那段時間里,我們不僅看到了摩爾定律的終結(jié),而且還看到了阿姆達爾定律和丹納德縮放的終結(jié),”硅營銷總監(jiān) Manuel Uhm 說在賽靈思。“這意味著,如果我們所做的只是采用 FPGA 并將這些晶體管從我們之前的節(jié)點(即 16 納米)縮小到 7 納米,然后收工,許多試圖遷移完全相同的設計的客戶可能很可能最終得到的設計坦率地說沒有任何性能提升,實際上可能會增加功耗。

“很明顯,這是完全錯誤的方式。”

需要明確的是,將硅晶體管縮小到 7 nm 以下并非不可能;5nm 器件已經(jīng)投入生產(chǎn)。這是因為底層金屬沒有更快地運行,并且電流泄漏正在上升。

同時,在另一個方向上,傳統(tǒng)的多核設備自身也遇到了擴展限制。當然,這些并行處理器在歷史上一直是同質(zhì)的,“而現(xiàn)實情況是,沒有一個處理器架構(gòu)可以優(yōu)化地完成每項任務,”Uhm 爭辯道。“不是 FPGA,不是 CPU,不是 GPU。”

這并不是說并行性在處理現(xiàn)代應用程序呈現(xiàn)的復雜處理任務方面沒有優(yōu)勢。事實上,除了摩爾定律和丹納德定標之外,并行計算可能是我們在高性能計算 (HPC) 和其他要求苛刻的用例中的最佳選擇。

是的,我們?nèi)匀恍枰⑿刑幚怼5珜儆诋愵悺?/p>

異構(gòu)處理:不僅適用于數(shù)據(jù)中心

如前所述,異構(gòu)并行處理技術(shù)的前沿是對高端應用中性能壁壘的回應。但這些架構(gòu)在嵌入式計算環(huán)境中也變得越來越普遍。

VDC Research 高級分析師 Dan Mandell 指出,雖然“許多異構(gòu)處理架構(gòu)確實專注于高端應用,特別是數(shù)據(jù)中心和 HPC……FPGA SoC 和其他異構(gòu)加速芯片的小型化是最重要的。讓 Microsemi 和 Xilinx 等公司將更多此類設備帶入智能邊緣基礎(chǔ)設施,如邊緣/工業(yè)服務器和物聯(lián)網(wǎng)網(wǎng)關(guān)。”

根據(jù) Mandell 的說法,嵌入式市場中通用異構(gòu)計算平臺的一個關(guān)鍵驅(qū)動因素“是當今 OEM 和其他廠商對硬件架構(gòu)的承諾猶豫不決。” 他說,這種猶豫是專用加速芯片快速發(fā)展的產(chǎn)物,以及未來幾年邊緣軟件和人工智能生態(tài)系統(tǒng)將產(chǎn)生的框架和工作負載的不確定性。

他預計所有這些情況都會“對未來的半導體采購產(chǎn)生重大影響”,以及芯片供應商如何處理他們的處理器路線圖。

“當今大多數(shù) FPGA SoC 的價格和功率范圍將迫使供應商最初專注于相對高端、資源豐富的嵌入式和邊緣應用,”Mandell 假設。“然而,正在積極努力使 FPGA SoC ‘尺寸不可知’,最終甚至支持電池供電的連接設備。”

因此,隨著異構(gòu)并行處理變得越來越多常見的問題是,嵌入式工程師是否應該為系統(tǒng)設計的范式轉(zhuǎn)變做好準備?英偉達副總裁兼嵌入式與邊緣計算總經(jīng)理 Deepu Talla 不這么認為。

“如果你仔細想想,嵌入式處理器總是使用加速器,”Talla 說。“即使在 20 年前,也有 Arm CPU,有 DSP,然后在特定硬件中完成視頻編碼/解碼,對吧?它們在某種意義上是固定功能的,但它們都在并行處理事物。

“你需要這樣做的原因是成本、功率、尺寸,”他繼續(xù)說道。“并行處理器的效率比 CPU 高出幾個數(shù)量級。”

Nvidia 的 Xavier SoC 是其 Jetson Xavier 嵌入式平臺的核心設備,以及公司將于 2021 年底或 2022 年推出的下一代 Orin 架構(gòu),均配備 GPU、Arm CPU、深度學習加速器、視覺加速器、編碼器/解碼器和其他專門的處理模塊(圖 3)。

【圖3 | Nvidia Xavier SoC 配備了基于 Arm 的 Carmel CPU、Volta GPU、深度學習和視覺加速器以及其他可以并行處理工作負載的固定功能計算模塊。]

然而,隨著高級異構(gòu) SoC 變得越來越普遍,嵌入式開發(fā)人員可以期待的一個變化是使用片上網(wǎng)絡 (NoC) 互連,在過去十年中,這種互連從傳統(tǒng)的片上總線(如 AMBA 接口)發(fā)展而來。這提供了“控制如何連接 CPU、GPU、視頻編碼器、深度學習加速器、顯示處理器、相機處理器、安全處理器,所有這些東西,”Talla 說。

NoC 有助于加速和優(yōu)化跨 SoC 的塊到塊的數(shù)據(jù)流,這有助于盡可能高效地執(zhí)行工作負載。例如,NXP 在其多功能 i.MX SoC 系列中利用了 NoC 和傳統(tǒng)總線架構(gòu)。

“異構(gòu)計算是我們多年來一直在實施的東西。NXP Semiconductors, Inc. 邊緣處理業(yè)務和技術(shù)戰(zhàn)略主管 Gowrishankar Chindalore 博士說,我相信現(xiàn)在是我們真正開始達到最佳使用點的地方。機器學習,因為我們今天使用的是 CPU、GPU、DSP 和神經(jīng)處理單元 (NPU)。

“但優(yōu)化的一部分,不僅僅是計算元素。系統(tǒng)周圍的一切都需要發(fā)生,”他繼續(xù)說道。“因此,除了異構(gòu)計算之外,我們專注于提高效率的地方,正在關(guān)注芯片分割流水線、視頻流水線、圖形流水線中整個流程的浪費。

“因為我們做得越多,我們在性能方面獲得的效率就越高,顯然,用于執(zhí)行相同功能的能量就越少,”他補充道。

(編者按:閱讀《異構(gòu)多核實現(xiàn)十倍嵌入式內(nèi)存性能的三種方法》)

走向異質(zhì)世界

Mandell引用 VDC Research 的 2020 年物聯(lián)網(wǎng)、嵌入式和移動處理器技術(shù)報告,預計嵌入式 SoC 的全球市場將“在未來幾年繼續(xù)超過 MPU、MCU、GPU 等分立半導體的商業(yè)市場”,因為 OEM 看起來整合計算資源和多芯片實現(xiàn)。他說,從長遠來看,對工作負載加速和處理器優(yōu)化的需求只會“推動進一步增長”。

與此同時,我們衡量性能和功耗的方式將不得不改變。正如 The Linley Group 的高級分析師 Mike Demler 在其公司的《深度學習處理器指南》中所說,即使是像 TOPS/W 這樣的以 AI 為中心的新基準測試也“具有誤導性,因為真正的 AI 工作負載從未達到接近 100% 的利用率。”

他說,我們將不得不用“一個真實的工作負載,比如 Bert NLP 模型,而不是一個基于理論的、基于架構(gòu)的規(guī)范”來衡量諸如電源效率之類的東西。

但是,孤立地測量處理器復合體是否有意義?它真的很重要嗎?一如既往,重點將放在它在您的系統(tǒng)環(huán)境中提供的內(nèi)容上。

“在使用每個流程節(jié)點之前,就像‘哦,太好了。我得到兩倍的性能,一半的功耗!‘”Uhm 說。“那些日子已經(jīng)一去不復返了。那些日子對每個人來說都已經(jīng)一去不復返了。在 7 nm 時,這些晶體管現(xiàn)在開始泄漏。你只會遇到其他類型的問題在許多情況下,我們認為這是無法克服的。

“因此,在意識到這一點后,我們現(xiàn)在正在研究系統(tǒng)級問題,”他繼續(xù)說道,“我們將所有這些東西放在一起,了解所有這些權(quán)衡,并確保我們能夠涵蓋以允許滿足性能和功率預算的方式進行盡可能多的處理。再說一次,這些不再是容易的事情了。我們意識到我們將能夠提供更高的性能或降低功耗,在某些情況下它是非此即彼的。你會得到兩者并不總是給定的。

“再說一次,沒有任何處理器是最適合所有事情的。您不能總是提高性能并降低功耗,”Uhm 繼續(xù)說道。“但專注于這種新架構(gòu),一種異構(gòu)處理器,基本上可以讓他們做到這一點。”

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19799

    瀏覽量

    233434
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9977

    瀏覽量

    140586
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34144

    瀏覽量

    275234
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    擊碎摩爾定律!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    增加一倍,性能也將提升一倍。過去很長一段時間,摩爾定律被認為是全球半導體產(chǎn)業(yè)進步的基石。如今,這一定律已經(jīng)逐漸失效,延續(xù)摩爾超越摩爾路線紛
    的頭像 發(fā)表于 06-04 00:06 ?4409次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    電力電子中的“摩爾定律”(2)

    04平面磁集成技術(shù)的發(fā)展在此基礎(chǔ)上,平面磁集成技術(shù)開始廣泛應用于高功率密度場景,通過將變壓器的繞組(winding)設計在pcb電路板上從而代替利茲線,從而極大降低了變壓器的高度。然而pcb的銅帶厚度并不大,一般不會超過4oz(140μm),因此想要通過pcb傳輸大電流會
    的頭像 發(fā)表于 05-17 08:33 ?140次閱讀
    電力電子中的“<b class='flag-5'>摩爾定律</b>”(2)

    跨越摩爾定律,新思科技掩膜方案憑何改寫3nm以下芯片游戲規(guī)則

    。 然而,隨著摩爾定律逼近物理極限,傳統(tǒng)掩模設計方法面臨巨大挑戰(zhàn),以2nm制程為例,掩膜版上的每個圖形特征尺寸僅為頭發(fā)絲直徑的五萬分之一,任何微小誤差都可能導致芯片失效。對此,新思科技(Synopsys)推出制造解決方案,尤其是
    的頭像 發(fā)表于 05-16 09:36 ?3827次閱讀
    跨越<b class='flag-5'>摩爾定律</b>,新思科技掩膜方案憑何改寫3nm以下芯片游戲規(guī)則

    電力電子中的“摩爾定律”(1)

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自上海科技大學劉賾源的投稿。著名的摩爾定律中指出,集成電路每過一定時間就會性能翻倍,成本減半。那么電力電子當中是否也存在著摩爾定律呢?1965年,英特爾
    的頭像 發(fā)表于 05-10 08:32 ?128次閱讀
    電力電子中的“<b class='flag-5'>摩爾定律</b>”(1)

    瑞沃微先進封裝:突破摩爾定律枷鎖,助力半導體新飛躍

    在半導體行業(yè)的發(fā)展歷程中,技術(shù)創(chuàng)新始終是推動行業(yè)前進的核心動力。深圳瑞沃微半導體憑借其先進封裝技術(shù),用強大的實力和創(chuàng)新理念,立志將半導體行業(yè)邁向新的高度。 回溯半導體行業(yè)的發(fā)展軌跡,摩爾定律無疑是一個重要的里程碑
    的頭像 發(fā)表于 03-17 11:33 ?316次閱讀
    瑞沃微先進封裝:突破<b class='flag-5'>摩爾定律</b>枷鎖,助力半導體新飛躍

    混合鍵合中的銅連接:或成摩爾定律救星

    將兩塊或多塊芯片疊放在同一個封裝中。這使芯片制造商能夠增加處理器和內(nèi)存中的晶體管數(shù)量,雖然晶體管的縮小速度已普遍放緩,但這曾推動摩爾定律發(fā)展。2024年5月,在美國丹佛舉行的IEEE電子器件與技術(shù)大會(ECTC)上,來自世界各地
    的頭像 發(fā)表于 02-09 09:21 ?503次閱讀
    混合鍵合中的銅連接:或成<b class='flag-5'>摩爾定律</b>救星

    石墨烯互連技術(shù):延續(xù)摩爾定律的新希望

    半導體行業(yè)長期秉持的摩爾定律(該定律規(guī)定芯片上的晶體管密度大約每兩年應翻一番)越來越難以維持。縮小晶體管及其間互連的能力正遭遇一些基本的物理限制。特別是,當銅互連按比例縮小時,其電阻率急劇上升,這會
    的頭像 發(fā)表于 01-09 11:34 ?468次閱讀

    摩爾定律是什么 影響了我們哪些方面

    摩爾定律是由英特爾公司創(chuàng)始人戈登·摩爾提出的,它揭示了集成電路上可容納的晶體管數(shù)量大約每18-24個月增加一倍的趨勢。該定律不僅推動了計算機硬件的快速發(fā)展,也對多個領(lǐng)域產(chǎn)生了深遠影響。
    的頭像 發(fā)表于 01-07 18:31 ?1090次閱讀

    “芯合”異構(gòu)混合并行訓練系統(tǒng)1.0發(fā)布

    ITD(Inhomogeneous Task Distribution)算法的3D并行策略。該策略利用通用混合訓練框架,實現(xiàn)了異構(gòu)數(shù)據(jù)并行異構(gòu)流水線
    的頭像 發(fā)表于 12-13 15:46 ?515次閱讀

    摩爾定律時代,提升集成芯片系統(tǒng)化能力的有效途徑有哪些?

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)當前,終端市場需求呈現(xiàn)多元化、智能化的發(fā)展趨勢,芯片制造則已經(jīng)進入后摩爾定律時代,這就導致先進的工藝制程雖仍然是芯片性能提升的重要手段,但效果已經(jīng)不如從前,先進封裝
    的頭像 發(fā)表于 12-03 00:13 ?2952次閱讀

    異構(gòu)集成封裝類型詳解

    隨著摩爾定律的放緩,半導體行業(yè)越來越多地采用芯片設計和異構(gòu)集成封裝來繼續(xù)推動性能的提高。這種方法是將大型硅芯片分割成多個較小的芯片,分別進行設計、制造和優(yōu)化,然后再集成到單個封裝中。
    的頭像 發(fā)表于 11-05 11:00 ?1159次閱讀
    <b class='flag-5'>異構(gòu)</b>集成封裝類型詳解

    高算力AI芯片主張“超越摩爾”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    越來越差。在這種情況下,超越摩爾逐漸成為打造高算力芯片的主流技術(shù)。 ? 超越摩爾是后摩爾定律時代三大技術(shù)路線之一,強調(diào)利用層堆疊和高速接口技
    的頭像 發(fā)表于 09-04 01:16 ?3922次閱讀
    高算力AI芯片主張“<b class='flag-5'>超越</b><b class='flag-5'>摩爾</b>”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應用場景

    傳統(tǒng)的ASIC(專用集成電路)設計,F(xiàn)PGA的靈活性使得其開發(fā)成本更低,且能夠快速響應市場變化。RISC-V的開源特性也進一步降低了開發(fā)成本。 安全性與可靠性 : 異構(gòu)處理器可以通過硬件隔離等
    發(fā)表于 08-31 08:32

    “自我實現(xiàn)的預言”摩爾定律,如何繼續(xù)引領(lǐng)創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應邀在《電子》雜志上發(fā)表了一篇四頁短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?449次閱讀