女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

昇騰AI云服務(wù),中國AI的翼翼長城

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-05-20 09:45 ? 次閱讀
wKgZO2grHWmACv5BAAepNNO1j1g055.jpg

過去幾天,中美經(jīng)貿(mào)關(guān)系發(fā)生著極速變化。而變化的主基調(diào)是,美國希望從貿(mào)易戰(zhàn)的短期沖撞,重新回到長期進行,同時也更加殘酷的科技絞殺上。

5月12日中美雙方發(fā)布聯(lián)合聲明,決定大幅下降關(guān)稅。緊隨其后的5月14日,美國政府亮出了瞄準中國AI的“獠牙”,美國商務(wù)部工業(yè)與安全局(BIS)突然宣布,即日起在全球范圍內(nèi)禁用中國先進集成電路。

美國出招絕非無的放矢,就在一個月前,華為發(fā)布了CloudMatrix384 超節(jié)點,該技術(shù)通過384張卡構(gòu)建超節(jié)點集群,超級云服務(wù)器,最高提供300Pflops的算力規(guī)模。這意味著,美國通過N卡禁售來限制中國AI算力發(fā)展的技術(shù)圍堵,或?qū)⒈粡氐状蚱啤?/p>

從DeepSeek的算法層突破,到CloudMatrix384的算力層突圍,中國AI正以系統(tǒng)性創(chuàng)新,彌補單芯片制程差距,美國發(fā)現(xiàn)其“卡脖子”邏輯正在失效。

接下來,美國必然會進一步打壓中國AI的任何生存空間,更證明了模型自主與算力自強的重要性。昇騰云算力就是出路,就是防線。

wKgZPGgrHWqAOu3uAAQSAuy96Ls028.jpg

5月16日,華為云AI峰會中,華為云副總裁黃瑾又進一步披露了更多CloudMatrix 384 超節(jié)點的創(chuàng)新技術(shù)細節(jié)。CloudMatrix 384 超節(jié)點持續(xù)壯大,把“殺不死你的必會讓你更強大”寫進現(xiàn)實。

wKgZO2grHWuAcXXXAAGi_jMpPTY067.jpg

過去的8年里,單卡硬件的算力增長了40倍,但是節(jié)點內(nèi)的總線帶寬只增長了9倍,跨節(jié)點的網(wǎng)絡(luò)帶寬只增長了4倍。集群網(wǎng)絡(luò)通信成為當前大模型訓(xùn)練和推理的最大挑戰(zhàn),也是科技競逐的焦點之一。

514美國禁令的恐懼根源,或許就在于昇騰的架構(gòu)創(chuàng)新,破解了網(wǎng)絡(luò)帶寬拓展比單卡算力增長更滯后的技術(shù)難題,使CloudMatrix384 實現(xiàn)了集群穩(wěn)定性,中國AI的算力長城,正在CloudMatrix384的基石上崛起。

具體來說,CloudMatrix 384 超節(jié)點實現(xiàn)了MatrixLink超節(jié)點網(wǎng)絡(luò)服務(wù)。這項技術(shù)能夠通過擴展訓(xùn)練集群實現(xiàn)大模型的訓(xùn)推性能提升20%,從而在網(wǎng)絡(luò)側(cè)滿足最為苛刻的模型推訓(xùn)需求。

突破了內(nèi)外部通信瓶頸的CloudMatrix 384,實現(xiàn)了AI算力資源的集約式高效利用,以及超大規(guī)模AI訓(xùn)練集群可云上獲取,支撐昇騰AI云服務(wù)以更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的成本,為千行百業(yè)智能化提供充沛且普惠的云上AI算力服務(wù),從而為中國AI算力爭取到了長足的領(lǐng)先空間與發(fā)展窗口。

更值得一提的是,當產(chǎn)業(yè)從萬卡向十萬卡集群演進,超節(jié)點修筑AI算力長城的腳步也并未停下。華為云AI峰會上,華為云公布了CloudMatrix 384 超節(jié)點的創(chuàng)新技術(shù)優(yōu)勢。

wKgZPGgrHWuACpvWAAHL2mAqQGM639.jpg

昇騰云和CloudMatrix 384 超節(jié)點,實現(xiàn)了MoE親和、以網(wǎng)強算、以存強算、長穩(wěn)可靠、朝推夜訓(xùn)、即開即用六大科技創(chuàng)新,這些創(chuàng)新如同“技術(shù)磚石”,穩(wěn)固支撐AI 產(chǎn)業(yè)發(fā)展更進一步,成為AI時代理想的基礎(chǔ)設(shè)施。

為什么這么說?這就要提到各行各業(yè)的AI訓(xùn)推需求,要求云上算力,豎起三道重要的防線:

一是算力充沛的性能防線。

正如杰文斯悖論所說的,Deepseek雖然降低了單個模型對算力的需求,但隨著應(yīng)用AI的用戶越來越多,算力資源的總需求量非但沒有減少,反而進一步增加了。這一背景下,國產(chǎn)AI算力面臨雙重困境,一是單卡性能落后英偉達最新產(chǎn)品,二是多卡集群會“打群架”,堆卡但不增效。而提升算力集群的資源利用率,需要存儲(存力)、網(wǎng)絡(luò)(運力)的共同做功,來適配最新的計算架構(gòu)。

簡單來說,在DeepSeek的推動下,MoE已經(jīng)成為主流大模型共同追求的實踐路徑,所謂MoE架構(gòu),就是從GPT4這樣的少量大專家的超大規(guī)模參數(shù)模型,變成了大量小專家的模式,在每張卡上都部署多個小專家。但傳統(tǒng)架構(gòu)下,MoE模型容易因為專家負載不均、AllToAll通信延遲等,導(dǎo)致算力浪費,降低資源利用率。

CloudMatrix 384 超節(jié)點的分布式推理平臺可以說是專為MoE大模型而生,具有MoE親和的技術(shù)特性。對比一卡多專家的“小作坊模式”,超節(jié)點通過高速互聯(lián)總線,降低跨機通信損耗,從而實現(xiàn)一卡一專家高效分布式推理,單卡的MoE計算和通信效率都大幅提升。通過聯(lián)接力打破單點算力的性能制約,最大限度地釋放算力共振的能力,也體現(xiàn)了超節(jié)點以網(wǎng)強算的技術(shù)優(yōu)勢。

除了網(wǎng)絡(luò)通訊,顯存容量不高也會制約MoE模型的開發(fā)。大模型推理的不同階段,對計算/訪存的資源需求其實并不一致,比如prefill階段需要高算力,而decode階段需要高防存,但傳統(tǒng)“存算綁定”的模式不夠靈活,就限制了資源利用和性能吞吐。

解決MoE模型的“存力”難題,華為云首創(chuàng)了EMS彈性內(nèi)存存儲,通過內(nèi)存池化技術(shù),實現(xiàn)顯存和算力解綁。一方面,用EMS替代NPU中的顯存,可使得首Token時延降低,最高降幅可達80%;另一方面,當NPU的顯存不足時,EMS獨立擴容,不必再通過堆NPU以獲得更多內(nèi)存。同時,EMS還支持算力卸載,這也使得系統(tǒng)吞吐量提升100%。

提高運力以網(wǎng)強算、提高存力以存強算,合力提高綜合計算性能,從而為各行各業(yè)應(yīng)用Deepseek等MoE模型,提供澎湃算力,正是CloudMatrix 384 所筑起的性能防線。

二是算力可靠的穩(wěn)定防線。

解決了性能問題,接下來還解決多卡集群“打群架”的可靠性問題。千卡乃至萬卡級算力集群的運維挑戰(zhàn),已經(jīng)成為算力的關(guān)鍵瓶頸。集群規(guī)模增大,故障頻發(fā),導(dǎo)致訓(xùn)練中斷,模型開發(fā)團隊不得不頻繁執(zhí)行檢查點checkpoint保存操作,這不僅延長了大模型訓(xùn)練周期,還會導(dǎo)致計算資源浪費,開發(fā)成本增高。

構(gòu)建高可靠性的智能運維體系,已成為云上算力長城的必要職責(zé)。對此,華為開發(fā)了昇騰云腦運維“1-3-10”標準,即1分鐘感知、3分鐘定界、10分鐘內(nèi)恢復(fù),從而具備了保障長穩(wěn)大模型訓(xùn)練的能力。

也意味著,中國AI有了更具韌性的算力基礎(chǔ)設(shè)施。

三是算力普惠的成本防線。

DeepSeek到來之后,AI推理側(cè)的任務(wù)激增,而訓(xùn)練側(cè)的算力需求則在下降。對于云服務(wù)商來說,針對用戶訪問的潮汐特征(日間推理峰值遠遠大于夜間),做好算力資源的動態(tài)平衡,可以進一步優(yōu)化資源利用效率,避免算力閑置,這樣能夠?qū)崿F(xiàn)綜合成本最優(yōu),最終讓成本優(yōu)勢變成價格優(yōu)勢、普惠能力,為行業(yè)和用戶提供像“水電”一樣實時、普惠、靈活的算力。

目前,華為云已經(jīng)在全國三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點規(guī)模布局,支持百TB級的帶寬互聯(lián),10毫秒時延圈覆蓋全國19個城市群,讓行業(yè)用戶不需要自建數(shù)據(jù)中心,可以像水電氣一樣,第一時間享受到即開即用的AI算力資源。

同時,華為云通過“訓(xùn)推共池”“靈活調(diào)度”兩大技術(shù),實現(xiàn)朝推夜訓(xùn),白天進行模型推理,晚上閑時進行模型訓(xùn)練,實現(xiàn)了全國超節(jié)點算力資源的“錯峰用電”,算力資源利用率可提升30%以上。

通過性能、穩(wěn)定、普惠的三道防線,華為云CloudMatrix 384 超節(jié)點可以更好地守護各行各業(yè)的智能化需求,成為中國AI巍然挺立的堅實基礎(chǔ)設(shè)施。

正如長城的出現(xiàn),守護了古代中國的國土安全。超節(jié)點通過多項技術(shù)特征的加持,讓以卡為單位的分散式AI算力,走向了集中式AI計算底座,成為真正意義上的下一代AI基礎(chǔ)設(shè)施,一座堅固的云上算力長城。

wKgZO2grHW2AUGslAAGxKOc9y50716.jpg

更宏觀的角度來看,超節(jié)點技術(shù)不僅僅是一項工程性創(chuàng)新,它還徹底改變了芯片制造領(lǐng)域的技術(shù)對壘格局。

英偉達最新推出了基于第五代NVLink技術(shù)的NVL72,并且將其局限在自身生態(tài)當中,客觀上構(gòu)成了對中國AI算力的發(fā)展制約。但實際上,我們真正需要的不是芯片本身,而是算力。通過重新定義AI基礎(chǔ)設(shè)施,超節(jié)點技術(shù)為AI算力的供給提供了前所未有的澎湃動力,進而突破了被芯片制程鎖死的AI進程。

在當前國際博弈的大背景下,超節(jié)點的出現(xiàn),正是中國應(yīng)對挑戰(zhàn)、把握AI機遇的有力證明。

除了超節(jié)點之外,華為云還在大模型、AI生態(tài)等領(lǐng)域進行了持續(xù)升級,持續(xù)迭代的盤古大模型,已經(jīng)在30多個行業(yè)、400多個場景中應(yīng)用,在制造、金融、政務(wù)、醫(yī)療、制藥、汽車、氣象等七個行業(yè)保持市場規(guī)模領(lǐng)先。

在算力底座、資源調(diào)度、推理服務(wù)及集群可靠四個方面,華為云全面升級昇騰AI云服務(wù),協(xié)助客戶進行模型的開發(fā)、訓(xùn)練、托管和應(yīng)用。目前,昇騰AI云服務(wù)已適配包含DeepSeek在內(nèi)的160多個第三方大模型,并面向政府、金融、互聯(lián)網(wǎng)、零售等行業(yè)服務(wù)600多家創(chuàng)新先鋒企業(yè)。

就像美國的貿(mào)易沖擊,掀不翻中國經(jīng)濟的汪洋大海,美國的一紙禁令,也禁不了昇騰這座云上AI算力長城。

當山姆·奧特曼在國會參議院建議要加大AI基礎(chǔ)設(shè)施投入的時候,昇騰AI云服務(wù)已經(jīng)通過超節(jié)點的建設(shè),以及更多技術(shù)、產(chǎn)品、資源的匯集,為接下來的中國AI應(yīng)用大爆發(fā)做好了準備——下一代AI基礎(chǔ)設(shè)施,就是中國AI走向強大的內(nèi)因。

wKgZO2grHW6AXiuWAAGSt1o7yW4601.jpg

2025年5月16日,被制裁整整六年的華為依舊在茁壯生長,并且在這些年里拿出了MetaERP、數(shù)據(jù)庫、軟硬件工具鏈等等核心技術(shù)突破。如今超節(jié)點的加入,讓這六年中所有的故事都更加熠熠生輝。

華為的故事在反復(fù)提醒著一件事:我們除了強大,無路可走。

曾幾何時,先進AI算力必然來自西方,被認為是一個“鐵律”。但CloudMatrix 384 超節(jié)點的突破,不僅證明了中國可以有自主化的可靠AI算力基礎(chǔ)設(shè)施,更證明了中國AI算力可以實現(xiàn)系統(tǒng)性領(lǐng)先,甚至可以改變企業(yè)用戶的AI算力獲取方式,給全球AI一個更好的算力選擇。

近幾個月,所有國際新聞都在提醒我們,只有當自身足夠強大,能夠給自己和他人提供選擇,我們才有話語權(quán),才有交流和談判的空間,才能為多元、開放與平等添加一份保障。

從這個意義來說,CloudMatrix 384 超節(jié)點就如同AI世界中的長城。它佇立在那里,確保了全球AI的自由勃發(fā)與平等成長。

巍巍昆侖,翼翼長城。一些源于中國文化的智慧,一些來自中國科技的態(tài)度,此刻正無言流淌在奔騰的AI算力中,相信它們很快會被世界讀懂。

wKgZO2grHW-AY96SAAG23sBDw_I658.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    35021

    瀏覽量

    255023
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7969

    瀏覽量

    139334
  • 昇騰
    +關(guān)注

    關(guān)注

    1

    文章

    154

    瀏覽量

    6881
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1141

    瀏覽量

    15440
  • 昇騰AI
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    717
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    中軟國際推出金融AI解決方案和一體機v1.0

    近日,中軟國際重磅推出金融AI解決方案和一體機v1.0,該方案基于AI基礎(chǔ)軟硬件平臺,完
    的頭像 發(fā)表于 03-28 17:05 ?476次閱讀

    創(chuàng)思遠達與合作推動AI PC應(yīng)用創(chuàng)新

    近日,端側(cè)智能領(lǐng)域創(chuàng)新者創(chuàng)思遠達攜手,基于算力平臺正式發(fā)布一系列AIPC應(yīng)用。雙方深度融合了
    的頭像 發(fā)表于 03-25 10:22 ?480次閱讀

    (原創(chuàng))310B(8T/20T)算力主板定制方案

    310B(20T)算力主板規(guī)格書 1.功能、性能與接口a)310B 20T算力處理器, 4個64位TAISHAN V200M處理器核,最高主頻1.8GHz,計算加速器如下:1)
    發(fā)表于 03-16 21:43

    湖南 DeepSeek+騰云技術(shù)應(yīng)用沙龍成功舉辦,拓維信息助力 AI 新范式探索

    人工智能技術(shù)如何賦能產(chǎn)業(yè)升級,DeepSeek與騰云服務(wù)技術(shù)融合及行業(yè)應(yīng)用前景。作為華為“鯤鵬/AI+大模型/
    的頭像 發(fā)表于 02-26 18:23 ?534次閱讀
    湖南 DeepSeek+<b class='flag-5'>昇</b>騰云技術(shù)應(yīng)用沙龍成功舉辦,拓維信息助力 <b class='flag-5'>AI</b> 新范式探索

    推理服務(wù)器+DeepSeek大模型 技術(shù)培訓(xùn)在圖為科技成功舉辦

    2月17日,華為政企業(yè)務(wù)團隊受邀蒞臨圖為科技深圳總部,并成功舉辦了一場聚焦于《推理服務(wù)器+DeepSeek大模型》的專業(yè)知識培訓(xùn)。 此次培訓(xùn)活動不僅深化了雙方的技術(shù)交流,更標志著
    的頭像 發(fā)表于 02-26 17:38 ?505次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>推理<b class='flag-5'>服務(wù)</b>器+DeepSeek大模型 技術(shù)培訓(xùn)在圖為科技成功舉辦

    研華發(fā)布AI Box及Deepseek R1模型部署流程

    近日,隨著深度求索(DeepSeek)大模型的發(fā)布在行業(yè)內(nèi)掀起熱議,研華科技正式推出了基于Atlas平臺的邊緣AI Box MIC-ATL3S,并同步發(fā)布了與Deepseek R1模型的部署流程
    的頭像 發(fā)表于 02-19 10:41 ?639次閱讀

    軸科技ZStack智塔攜手AI實現(xiàn)DeepSeek模型部署

    DeepSeek為人工智能AI產(chǎn)業(yè)帶來一場革命,為企業(yè)級AI應(yīng)用私有化部署場景(Private AI)注入強勁動力。作為企業(yè)級私有化AI Infra平臺,
    的頭像 發(fā)表于 02-18 09:59 ?628次閱讀
    <b class='flag-5'>云</b>軸科技ZStack智塔攜手<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>實現(xiàn)DeepSeek模型部署

    軟通動力亮相福建AI產(chǎn)業(yè)發(fā)展論壇

    近日,福建AI產(chǎn)業(yè)發(fā)展論壇在廈門舉辦。軟通動力應(yīng)邀出席,并作為“福建人工智能自主創(chuàng)新聯(lián)合體”重要成員,與華為及生態(tài)伙伴等多方機構(gòu)共同宣布了聯(lián)合體的成立,旨在積極布局福建省人工智能產(chǎn)業(yè),培育人工智能新業(yè)態(tài),為數(shù)字經(jīng)濟注入嶄新活
    的頭像 發(fā)表于 12-23 13:52 ?490次閱讀

    AI+鴻蒙,OrangePi AIpro在武漢AI開發(fā)者創(chuàng)享日上很“吸睛”

    11月22日,AI開發(fā)者創(chuàng)享日·武漢站在武漢·富力威斯汀酒店成功舉辦。活動邀請了國內(nèi)頂尖AI技術(shù)大咖、科研帶頭人,知名企業(yè)技術(shù)專家,通過“1場主論壇+3場分論壇+全天互動打卡展區(qū)”
    的頭像 發(fā)表于 11-27 13:36 ?437次閱讀
    <b class='flag-5'>AI</b>+鴻蒙,OrangePi AIpro在武漢<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>開發(fā)者創(chuàng)享日上很“吸睛”

    研華發(fā)布高性能工業(yè)邊緣 AI 算力方案 攜手引領(lǐng)邊緣 AI 革新

    上海2024年9月25日 /美通社/ -- 全球工業(yè)物聯(lián)網(wǎng)廠商研華公司(股票代號:2395.TW)今日在中國工業(yè)博覽會現(xiàn)場隆重舉辦 "研華×邊緣 AI 戰(zhàn)略合作暨新品發(fā)布會",攜手
    的頭像 發(fā)表于 09-26 10:54 ?557次閱讀
    研華發(fā)布高性能工業(yè)邊緣 <b class='flag-5'>AI</b> 算力方案 攜手<b class='flag-5'>昇</b><b class='flag-5'>騰</b>引領(lǐng)邊緣 <b class='flag-5'>AI</b> 革新

    思原生,助力智譜打造自主創(chuàng)新大模型體系!

    自從全面啟動原生開發(fā),越來越多的生態(tài)伙伴選擇,大模型生態(tài)從“應(yīng)用遷移”走向“原生開發(fā)”,充分依托
    的頭像 發(fā)表于 08-20 18:29 ?686次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>與<b class='flag-5'>昇</b>思原生,助力智譜打造自主創(chuàng)新大模型體系!

    香橙派亮相AI開發(fā)者創(chuàng)享日,打造“AI+鴻蒙”高算力開發(fā)板

    6月29日,AI開發(fā)者創(chuàng)享日·廣東站在廣州成功舉辦。本次活動匯聚人工智能領(lǐng)域頂尖人才,為開發(fā)者帶來
    的頭像 發(fā)表于 07-05 15:31 ?957次閱讀
    香橙派亮相<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>開發(fā)者創(chuàng)享日,打造“<b class='flag-5'>AI</b>+鴻蒙”高算力開發(fā)板

    基于AI Yolov7模型遷移到平臺EA500I邊緣計算盒子的實操指南

    科技攜手推出了一系列邊緣計算產(chǎn)品,具備性能強勁、更寬工溫、外設(shè)接口豐富、利舊性強等特點,同時,得益于AI軟件棧的全面支持,這些產(chǎn)品為
    的頭像 發(fā)表于 06-26 17:51 ?1090次閱讀
    基于<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>  Yolov7模型遷移到<b class='flag-5'>昇</b><b class='flag-5'>騰</b>平臺EA500I邊緣計算盒子的實操指南

    華為AI服務(wù)可適配100多個大模型

    在近日舉辦的華為開發(fā)者大會2024上,華為常務(wù)董事、華為CEO張平安向全球開發(fā)者們宣布了一項重大進展——華為AI
    的頭像 發(fā)表于 06-24 10:49 ?1111次閱讀

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

    香橙派AIpro開發(fā)板采用AI技術(shù)路線,接口豐富且具有強大的可擴展性,提供8/20TOPS澎湃算力,可廣泛使用于AI邊緣計算、深度視覺學(xué)習(xí)及視頻流
    的頭像 發(fā)表于 06-04 14:23 ?831次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b>推理應(yīng)用