女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奇異摩爾專用DSA加速解決方案重塑人工智能與高性能計算

奇異摩爾 ? 來源:奇異摩爾 ? 2024-09-19 11:45 ? 次閱讀

寫在開頭,奇異摩爾的 NDSA 互聯(lián)系列產(chǎn)品基于高性能RoCEv2 RDMA引擎,是面向智算網(wǎng)絡(luò)通信加速及無損數(shù)據(jù)傳輸?shù)膶S肈SA加速解決方案。

本文部分內(nèi)容來源于麥肯錫白皮書

隨著摩爾定律下的晶體管縮放速度放緩,單純依靠增加晶體管密度的通用計算的邊際效益不斷遞減,促使專用計算日益多樣化,于是,針對特定計算任務(wù)的專用架構(gòu)成為計算創(chuàng)新的焦點。

在過去的幾十年的時間里,半導體晶圓上的晶體管密度幾乎每兩年翻一番,這一趨勢令人矚目。但在過去幾年中,晶體管縮放的速度顯著放緩,比摩爾定律預測的速度落后了大約十倍。

2018年,著名計算機架構(gòu)師約翰·亨尼斯西(John Hennessy)和大衛(wèi)·帕特森(David Patterson)在圖靈講座中指出,半導體工藝創(chuàng)新的放緩將逐漸增加對架構(gòu)創(chuàng)新的激勵——即集成電路的設(shè)計方式,以執(zhí)行計算任務(wù)。

“他們認為,通用計算架構(gòu)(如CPU)固有的低效性將開始被專門針對特定計算任務(wù)的架構(gòu)(也稱為領(lǐng)域?qū)S眉軜?gòu),DSAs)的計算能力和成本效益所取代 。”

與此同時,隨著計算和數(shù)字化在云計算(人工智能和高性能計算)、網(wǎng)絡(luò)、邊緣、物聯(lián)網(wǎng)(IoT)和自動駕駛等眾多應(yīng)用領(lǐng)域中普及,高度領(lǐng)域?qū)S玫挠嬎愎ぷ髫撦d正在為DSAs提供有意義的性能優(yōu)勢。大型語言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作負載中提供了進一步的專業(yè)化,這促進了進一步的硬件專業(yè)化。 DSA(domain-specific architecture)為特定應(yīng)用領(lǐng)域開發(fā)的硬件和軟件的商業(yè)潛力是巨大的。專用的圖形處理單元 (GPU) 和張量處理單元 (TPU) 已經(jīng)在數(shù)據(jù)中心獲得了重要的市場份額,它們在 AI 工作負載學習和推理方面的表現(xiàn)優(yōu)于 CPU。使用GPU和TPU對某些應(yīng)用的性能提升是非常顯著的,特定工作負載的可以實現(xiàn)15 到 50 倍的加速。此外,在汽車領(lǐng)域,來自領(lǐng)先供應(yīng)商的定制的專用于某些計算場景的DSA硬件也提供了安全支持日益提高的自動駕駛水平所需的低延遲、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

隨著 DSA 擴展到其他應(yīng)用領(lǐng)域,麥肯錫咨詢估計到 2026 年,DSA 將占約 900 億美元的收入(約占全球半導體市場的 10% 至 15%),高于 2022 年的約 400 億美元。因此,我們看到在這個方向的硬件類的風險投資顯著增加也就不足為奇了。

01 算力革命下的高性能網(wǎng)絡(luò)DSA

隨著人工智能及高性能計算的高速發(fā)展,服務(wù)器集群的瓶頸逐漸從單CPU、GPU、APU的算力轉(zhuǎn)換到硬件間的互聯(lián)能力。傳統(tǒng)的數(shù)據(jù)中心架構(gòu)中包含CPU、內(nèi)存、存儲和網(wǎng)絡(luò)等組件,但CPU目前已經(jīng)公認不再是運行基礎(chǔ)設(shè)施功能的最佳位置了。對于下一代數(shù)據(jù)中心而言,面向網(wǎng)絡(luò)加速的DSA將扮演重要的角色,根據(jù)不同應(yīng)用場景的需求,加速數(shù)據(jù)傳輸。同時,以太網(wǎng)速度從25G增加到100G、200G、400G,再到800G,甚至還有持續(xù)增長的趨勢,超大規(guī)模數(shù)據(jù)中心的硬件架構(gòu)在逐漸轉(zhuǎn)變。

據(jù)估計,對于超大規(guī)模數(shù)據(jù)中心來說,大約有一半的CPU被用在了非創(chuàng)收型任務(wù)上。網(wǎng)絡(luò)DSA可以承擔大部分繁重的工作,將CPU解放出來,專注于創(chuàng)收的應(yīng)用處理上。同時,由于功能和作用不同,北向網(wǎng)絡(luò)和高帶寬域在設(shè)計時側(cè)重點不同。北向網(wǎng)絡(luò)側(cè)重于網(wǎng)絡(luò)控制與管理,主要是網(wǎng)絡(luò)控制器與上層應(yīng)用之間的接口通信。高帶寬域網(wǎng)絡(luò)側(cè)重于數(shù)據(jù)傳輸性能,旨在提供高速度、低延遲的網(wǎng)絡(luò)連接。基于RoCE的RDMA技術(shù),兼容現(xiàn)有的以太網(wǎng)基礎(chǔ)設(shè)施,擁抱開放生態(tài),是業(yè)界解決高帶寬域網(wǎng)絡(luò)與北向網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)闹匾鉀Q方案。

02 Chiplet設(shè)計方法與DSA的完美結(jié)合

結(jié)合Chiplet設(shè)計方法學與DSA的設(shè)計,可以構(gòu)建出高效、靈活且高度定制化的計算平臺。Chiplet設(shè)計方法學通過將處理器設(shè)計拆分為多個獨立的Chiplet,每個Chiplet可以針對特定功能進行優(yōu)化。這樣可以在設(shè)計、制造和測試中提高靈活性。同時,不同的Chiplet分工明確,可以專門處理不同的任務(wù),例如CPU核心、內(nèi)存控制器、I/O接口等。而DSA針對特定計算任務(wù)進行優(yōu)化,例如生成式人工智能、圖形處理、網(wǎng)絡(luò)處理等,相比于通用處理器,DSA在其特定領(lǐng)域內(nèi)具有更高的性能和能效比。

通過Chiplet方法學,可以將多個DSA集成到一個系統(tǒng)中,創(chuàng)建一個高度定制化的平臺。比如,一個系統(tǒng)可以包含CPU、GPU、TPU、DPU等Chiplet,根據(jù)應(yīng)用需求靈活組合。在這一背景下,組件之間的高速可連接對于確保順利快速的數(shù)據(jù)傳輸至關(guān)重要。互聯(lián)標準、帶寬、延遲和低延遲是關(guān)鍵指標。

03奇異摩爾NDSA網(wǎng)絡(luò)加速與無損數(shù)據(jù)傳輸解決方案

在智算中心領(lǐng)域,奇異摩爾 的NDSA互聯(lián)系列產(chǎn)品復用以太網(wǎng)基礎(chǔ)設(shè)施,基于高性能RoCEv2 RDMA引擎,面向智算網(wǎng)絡(luò)通信加速及無損數(shù)據(jù)傳輸?shù)膶S肈SA加速解決方案。

AI原生智能網(wǎng)卡

奇異摩爾的Kiwi NDSA-SNIC AI原生智能網(wǎng)卡針對網(wǎng)絡(luò)數(shù)據(jù)傳輸,基于RoCE V2 RDMA技術(shù),自適應(yīng)網(wǎng)絡(luò)調(diào)度算法,搭載可編程加速核心SDPU,高達800G傳輸帶寬,實現(xiàn)Tb級萬卡集群無損數(shù)據(jù)傳輸。

高性能網(wǎng)絡(luò)加速芯粒

奇異摩爾的高性能網(wǎng)絡(luò)加速芯粒 – Kiwi NDSA互聯(lián)芯粒針對高帶寬域數(shù)據(jù)傳輸,基于RoCEv2 RDMA技術(shù),單芯粒傳輸帶寬高達800G,攜帶UCIe-D2D芯粒可擴展互聯(lián)接口,實現(xiàn)集群內(nèi)TB級的高速通信。

寫在最后,無論是在高性能計算領(lǐng)域還是在人工智能領(lǐng)域,我們會預見更多加速數(shù)據(jù)傳輸?shù)腄SA問世。它們通過提供高吞吐量效率,計算節(jié)點之間的超快速互連,或提升人工智能訓練的效率,為半導體價值鏈的參與者及其客戶帶來更多的革新和挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52169

    瀏覽量

    436100
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48701

    瀏覽量

    246448
  • 奇異摩爾
    +關(guān)注

    關(guān)注

    0

    文章

    54

    瀏覽量

    3659

原文標題:Kiwi Talks | DSA專用領(lǐng)域芯片正在重塑人工智能與高性能計算

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應(yīng)/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能人工智能
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長領(lǐng)域提供解決方案,包括企業(yè)級AI
    的頭像 發(fā)表于 03-26 14:42 ?246次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺,<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ,涵蓋了通信、人工智能、工業(yè)自動化、視頻處理等多個領(lǐng)域: ? 通信行業(yè):用于基站、網(wǎng)絡(luò)邊緣計算等場景,處理復雜的物理協(xié)議和邏輯控制。 ? 人工智能:FPGA的并行處理能力使其在高性能
    發(fā)表于 03-03 11:21

    GIGABYTE CES 2025全方位展示人工智能計算解決方案

    GIGABYTE Technology,作為全球服務(wù)器和數(shù)據(jù)中心解決方案的領(lǐng)先創(chuàng)新企業(yè),再次展現(xiàn)了其在人工智能計算發(fā)展領(lǐng)域的卓越實力。在即將到來的CES 2025上,GIGABYTE將全方位展示
    的頭像 發(fā)表于 01-10 14:16 ?733次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應(yīng)用開發(fā)熱度高漲,數(shù)量激增。但在三方應(yīng)用鴻蒙化進程中,性能問題頻出。為此,HarmonyOS NEXT推出了一整套原生頁面高性能解決方案,包括
    發(fā)表于 01-02 18:00

    Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計算模塊

    的直接替代品。 ArmSoM 在其創(chuàng)建過程中寫道:“ArmSoM-CM5 是一款由 Rockchip RK3576 第二代 8nm 高性能 AIOT(人工智能物聯(lián)網(wǎng))平臺驅(qū)動的計算模塊。它集成了四核
    發(fā)表于 12-11 18:38

    德晟達推出高性能醫(yī)療專用AI一體機

    隨著AI人工智能技術(shù)的飛速發(fā)展,醫(yī)療行業(yè)正迎來一場前所未有的變革,德晟達提供的硬件解決方案,服務(wù)客戶圍繞“AI人工智能+醫(yī)療”的行業(yè)創(chuàng)新發(fā)展方向,深度研發(fā),將AI人工智能診斷技術(shù)與
    的頭像 發(fā)表于 11-26 16:25 ?665次閱讀

    機智云入選廣州市“人工智能+”優(yōu)秀解決方案

    人工智能+”優(yōu)秀解決方案冊。該方案融合了人工智能與物聯(lián)網(wǎng)技術(shù),旨在顯著提升工業(yè)生產(chǎn)中的質(zhì)量檢測效率和準確性,助力企業(yè)實現(xiàn)智能化轉(zhuǎn)型。
    的頭像 發(fā)表于 11-19 09:45 ?482次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    學習和更新提供了可能,從而使人工智能應(yīng)用能夠不斷適應(yīng)和優(yōu)化。 總的來說,嵌入式系統(tǒng)在人工智能中的作用不容忽視。它不僅為人工智能硬件加速提供了強大的支持,還在邊緣
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    滿足人工智能圖像處理中對于高性能、低功耗和特定功能的需求。 低功耗 : 在人工智能圖像處理中,低功耗是一個重要的考量因素。RISC-V架構(gòu)的設(shè)計使其在處理任務(wù)時能夠保持較低的功耗水平,這對于需要
    發(fā)表于 09-28 11:00

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計,提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學習的加速和云計算加速,還可以針對特定應(yīng)用場景進行定制化
    發(fā)表于 07-29 17:05

    人工智能與大模型的關(guān)系與區(qū)別

    在科技日新月異的今天,人工智能(AI)已成為推動社會進步的重要力量。而在人工智能的眾多分支中,大模型(Large Models)作為近年來興起的概念,以其巨大的參數(shù)數(shù)量和強大的計算能力,在多個領(lǐng)域展現(xiàn)出了非凡的潛力。本文旨在深入
    的頭像 發(fā)表于 07-04 16:07 ?5234次閱讀

    奇異摩爾上海總部進駐上海浦東科海大樓

    。 三年風雨兼程? 三年春華秋實 奇異摩爾于2021年在上海創(chuàng)立,依托于Chiplet和RDMA高性能網(wǎng)絡(luò)互聯(lián)技術(shù),旨在打造了一整套全棧式AI智算集群互聯(lián)架構(gòu)及產(chǎn)品解決方案。 過去年的
    的頭像 發(fā)表于 07-01 18:57 ?3408次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>上海總部進駐上海浦東科海大樓

    人工智能數(shù)據(jù)中心的新型連接解決方案

    支持新型人工智能數(shù)據(jù)中心架構(gòu)的先進連接解決方案不斷涌現(xiàn)。高速板對板連接器、下一代電纜、背板和近似集成電路連接器對電纜解決方案的運行速度高達224Gb/s-PAM4,將加速未來
    的頭像 發(fā)表于 06-13 08:26 ?959次閱讀
    <b class='flag-5'>人工智能</b>數(shù)據(jù)中心的新型連接<b class='flag-5'>解決方案</b>