女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于有效使用TinyML的隨機計算架構

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Abhishek Jadhav ? 2022-07-11 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經網絡是一種流行的機器學習模型,但它們需要更高的能耗和更復雜的硬件設計。隨機計算是平衡硬件效率和計算性能之間權衡的一種有效方式。然而,由于算術單元的低數據精度和不準確性,隨機計算見證了 ML 工作負載的低準確性。

為了解決與傳統隨機計算方法相關的問題,并通過更高的精度和更低的功耗來提高性能,正在進行的研究提出了一種改進的基于塊的隨機計算架構。通過在輸入層中引入塊,可以通過利用高數據并行性來減少延遲。更重要的是確定全局優化方法所需要的塊數。

現有的方法包括增加比特流的長度以提高數據精度,甚至使用指數比特來獲得準確的結果。然而,這引入了較長的計算延遲,這對于 TinyML 應用程序來說是不合理的。因此,為了應對這種不斷上升的計算延遲,比特流被分成塊然后并行執行。結合塊內算術單元和輸出修正 (OUR) 方案可緩解塊間不準確問題,從而提供高計算效率。

基于塊的隨機計算架構

研究提供了一種新穎的架構,其中輸入被劃分為塊并使用優化的塊內算術單元并行執行乘法和加法。此外,在 TinyML 應用程序的延遲-功耗權衡方面,所提出的模型是一個出色的架構。

架構劃分如下:

塊劃分

如上圖所示,輸入比特流被劃分為“k”個值塊。所提出的想法是,為比特流選擇大量塊并不能保證是最佳的,但可以用于接近近似值。如果在選擇塊數時出現錯誤,這可能會自相矛盾地導致大錯誤。在確定來自輸入比特流的正和負部分的兩個平均值的概率方面存在復雜的計算。

塊內計算

緩解了傳統加法器面臨的OR加法器相關問題和分離加法器溢出問題。新修改的架構設計在輸入之間帶有 XNOR+AND 門,以消除雙極計算的相關性。

每個輸入位都在并行計數器 (PC) 中獲取,對于正負部分 (Ap, An) 分別進行處理。有兩個專用累加器用于處理有符號位。取輸入位后,累加器之間發生減法,如正負部分所示。目標是獲得所有輸入的累積 1 的數量。進一步地,比較取時間輸出(Sop,Son)中的一位,在多個“n”個循環之后,計算符號位,并根據符號位Ap和An,選擇Sop和Son的輸出結果。

這種新的基于累加器的符號幅度格式加法器利用 unNSADD 加法器來比較輸出和輸入中的實際累加 1 以確定輸出位。這種方法消除了相關性和快速溢出問題的影響。

塊間??輸出修正方案

盡管塊內加法器解決了相關性和溢出問題,但塊劃分引入了新的塊間不準確錯誤。乘法器不會發生這種情況,因為輸入是 XNORed 和 ANDed。但是對于加法器,輸出中 1 的數量可能會偏離所產生的不準確性。輸出修訂方案在并行塊內計算階段之后添加或刪除 1s,而不會引入任何額外的延遲來解決這些塊間不準確錯誤。

新穎的基于塊的隨機計算架構旨在提高隨機計算運算電路的精度,同時降低計算延遲和能源效率。根據研究結果,該方法比現有方法的準確度提高了 10% 以上,并節省了 6 倍以上的功率。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103564
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134582
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    芯片功能安全必修課 FMEDA量化分析的最佳實踐

    Analysis),用于評估芯片架構處理隨機硬件失效的有效性和評估芯片架構隨機失效的概率足夠低
    的頭像 發表于 07-07 14:28 ?166次閱讀
    芯片功能安全必修課  FMEDA量化分析的最佳實踐

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經從最初的圖形渲染專用處理器,發展成為強大的并行計算引擎,廣泛應
    的頭像 發表于 05-30 10:36 ?368次閱讀
    GPU<b class='flag-5'>架構</b>深度解析

    Arm架構何以成為現代計算的基礎

    2025 年 4 月,Arm 架構迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構。從傳感器、智能手機、筆記本電腦,到汽車、數據中心等諸多領域,有數十億設備如今運行在 Arm
    的頭像 發表于 05-20 10:02 ?486次閱讀

    揭秘云計算架構的分層奧秘

    的重要基石。那么,云計算架構究竟是如何構建的呢?今天,我們帶您揭秘云計算架構的分層奧秘——邊緣層、IaaS、PaaS、SaaS。
    的頭像 發表于 02-26 17:41 ?512次閱讀

    熵基科技實現BioCV TinyML與DeepSeek大模型融合

    近日,熵基科技宣布了一項重大技術突破。該公司自主研發的“BioCV TinyML模型”已成功與全球知名的LLM大模型DeepSeek實現接入與融合。 這一融合成果不僅彰顯了熵基科技在智能物聯和智慧
    的頭像 發表于 02-19 16:15 ?798次閱讀

    HPC云計算的技術架構

    HPC云計算結合了HPC的強大計算能力和云計算的彈性、可擴展性,為用戶提供了按需獲取高性能計算資源的便利。下面,AI部落小編帶您了解HPC云計算
    的頭像 發表于 02-05 14:51 ?385次閱讀

    ADS1282是32位ADC,在計算對紋波要求的時候,LSB按照32位計算,還是按照有效位數計算

    ADS1282是32位ADC,那么在計算對紋波要求的時候,LSB按照32位計算,還是按照有效位數計算(有效位數才20位)。
    發表于 12-04 08:36

    開源芯片系列講座第24期:基于SRAM存算的高效計算架構

    鷺島論壇開源芯片系列講座第24期「基于SRAM存算的高效計算架構」明晚(27日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目基于SRAM存算的高效計算架構報告簡介
    的頭像 發表于 11-27 01:05 ?847次閱讀
    開源芯片系列講座第24期:基于SRAM存算的高效<b class='flag-5'>計算</b><b class='flag-5'>架構</b>

    ads1256有效位數怎么計算

    您好,對于ADS1256有效位數的計算,數據手冊給出的測試公式是怎么推到出來的呢?能夠幫我推到出來嗎?對于第一張圖中rms的計算是怎么出來的?
    發表于 11-22 07:07

    用于MySQL的dbForge架構比較

    dbForge Schema Compare for MySQL 是一種工具,用于輕松有效地比較和部署 MySQL 數據庫結構和腳本文件夾差異。該工具提供了 MySQL 數據庫架構中所有差異的全面視圖。
    的頭像 發表于 10-28 09:41 ?570次閱讀
    適<b class='flag-5'>用于</b>MySQL的dbForge<b class='flag-5'>架構</b>比較

    邊緣計算架構設計最佳實踐

    邊緣計算架構設計最佳實踐涉及多個方面,以下是一些關鍵要素和最佳實踐建議: 一、核心組件與架構設計 邊緣設備與網關 邊緣設備 :包括各種嵌入式設備、傳感器、智能手機、智能攝像頭等,負責采集原始數據
    的頭像 發表于 10-24 14:17 ?1101次閱讀

    內存儲器分為隨機存儲器和什么

    內存儲器是計算機系統中用于臨時存儲數據和程序的關鍵部件,它直接影響到計算機的運行速度和性能。內存儲器主要分為兩大類:隨機存儲器(RAM,Random Access Memory)和只讀
    的頭像 發表于 10-14 09:54 ?2878次閱讀

    閃存隨機讀寫與連續讀寫哪個重要

    快速響應的應用中,如數據庫操作、服務器處理請求等,隨機讀寫速度至關重要。 多任務處理能力 : 隨機讀寫能力強的閃存能夠更有效地處理多個并發任務,因為它們可以更快地訪問和修改存儲在不同位置的數據。 連續讀寫的重要性 大數據傳輸 :
    的頭像 發表于 10-12 11:44 ?1056次閱讀

    用于控制和保護的HVDC架構和解決方案簡介

    電子發燒友網站提供《用于控制和保護的HVDC架構和解決方案簡介.pdf》資料免費下載
    發表于 09-04 09:24 ?1次下載
    <b class='flag-5'>用于</b>控制和保護的HVDC<b class='flag-5'>架構</b>和解決方案簡介

    瑞薩電子推出Reality AI Explorer Tier,用于開發AI與TinyML解決方案

    全球半導體解決方案供應商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發工業、汽車和商業應用中的AI與TinyML解決方案。
    的頭像 發表于 07-19 10:03 ?734次閱讀