女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

轉載 | 高性能計算與AI網絡大融合,如何重塑網絡智能時代?

華為數據通信 ? 來源:未知 ? 2023-08-31 12:45 ? 次閱讀

wKgaomTwG_qATWR-AABYb2B4C6Q886.png

近年來,數據中心網絡技術一直在不斷發展,以滿足日益增長的數據處理需求。從最初的傳統結構,到軟件定義網絡(SDN),再到云原生網絡(CN-NFV),數據中心網絡技術已經走過了一個漫長的發展歷程。AI時代,高性能計算需求正呈現爆發性增長態勢,數據中心網絡面臨更為復雜的挑戰,技術將會有哪些新的變化?是否有合適的解決之道?

wKgaomTwG_uAcCX4AAAAjgjvZ2U503.png

wKgaomTwG_uAZjFuABAUaoSDmqk775.png

華為數據通信產品線數據中心網絡領域副總裁 張白

2023年8月23日-25日,全國高性能計算學術年會(CCF HPC China 2023)在青島舉辦,CCF HPC China是高性能計算領域全球最具影響力的三大超算盛會之一,有著“中國超算風向標”的稱號。本次大會上,華為數據通信產品線數據中心網絡領域副總裁張白分享隨著AI時代的到來,高性能計算對網絡新的訴求,以及如何依靠星河AI網絡解決方案去解決智能時代網絡面臨的新的挑戰。

高性能計算需要什么樣的互聯網絡?

當前,新一輪科技革命和產業變革加速演進,高性能計算正帶領人類從“信息時代”走向“算力時代”。據中國電子信息產業發展研究院發布的《2022中國數字經濟發展研究報告》顯示,目前中國算力規模約占全球的27%,排名第二。我國算力進入高速發展階段,到2025年總算力規模將達到300EFlops,同比2020年增長120%。

數據的爆炸性增長需要算力去解決,一方面需要更高效的算力結構,另一方面需要好的算力網絡。高性能計算主要關注如何利用大規模計算的資源來解決科學、工程和商業問題。HPC應用程序通常需要使用并行計算,億級、10億級的超算,它的并行計算帶給網絡非常大的挑戰。比如,并行通信、數據同步、大規模穩定運行等。同時,隨著AI人工智能快速發展,HPC和AI結合的研究,HPC和AI應用程序通常需要處理大量的數據,并且在計算節點之間進行數據傳輸和存儲,對網絡的吞吐及負載均衡也提出了新的挑戰。

以當前火爆的大模型來說,其對數據中心網絡要求更為苛刻,可以說,大規模算力環境下的網絡問題已成為當今數據中心所面臨的“緊箍咒”之一。

官網顯示,ChatGPT-4輸入參數已經達到萬億,2.5年增長了570倍,1.5萬張A100卡來支撐訓練,大量服務器通過高速網絡組成算力集群,共同完成訓練任務。但是大規模不等于大帶寬,AI大模型的訓練場景中會存在負載不均衡的情況,而且設備網絡規模越大,傳統負載方式沖突會越嚴重。類似于要想提高車輛運行速度,在拓寬道路的基礎上,還需要解決堵車的難題。大規模的網絡不僅讓業務調優復雜,后期運維也是雪上加霜,無法采用傳統手段運維,據統計50%的迭代過程會被迫中斷,定位時長平均1天以上。由此可見,AI訓練對于網絡的訴求可以用三個詞來歸納:大規模,高吞吐,高可靠。

如何釋放高性能計算100%算力?

加大高性能計算供給,必須增加算力網絡可靠性。自2020年至今,大模型引領AI進入新的發展階段,但大模型訓練是個復雜的系統工程,網絡基礎設施正是長穩訓練的關鍵之一。對于用戶來說,其需要投入大量的資金和人才戰略來施行其智能化戰略,要怎樣才能進行數據中心的創新,建立其符合未來需求的數據中心網絡呢?

針對當前業界火爆的AI大模型,華為在2023CCF全國高性能計算學術年會(CCF HPC China 2023)上帶來星河AI網絡解決方案,提供“運得多、運得快,運得穩”的高運力數據中心網絡,為客戶提供大規模、高吞吐、高可靠的網絡建設。

AI場景下對網絡的第一要求是大規模,適配萬卡集群是網絡最基本的要求。華為采用業界最高密200/400GE交換機,匹配大模型訓練基本硬件算力訴求,支持超大帶寬組網,支持萬億參數量,規模可以達到IB的2-4倍。

網絡的另一個要求是高吞吐,面對大規模網絡采用算網一體化的方式部署,效率可以提升10倍以上。在AI場景中網絡時延不是關鍵指標,而網絡吞吐才是業務性能的關鍵因素,華為獨創AI智能加速器,提高網絡吞吐,訓練效率提升20%。

高可靠同樣是客戶對網絡的重要要求,華為采用智能化運維的方式來保證訓練實時可視分鐘級識別慢主機,保證訓練的過程不中斷。通過采用網絡的控制器,包括網絡以及計算強強聯手,實現“算網一體的融合”,最終實現算力網絡“運得多,運得快,運得穩”的目標,從而實現算力100%釋放。

進入AI時代,數據中心的使命正在從聚焦業務快速發放向聚焦數據高效處理進行轉變,計算、存儲、網絡等這些IT基礎設施的核心組成部分,正在融入更多的AI元素。企業如果想要打造未來型數據中心,就必須尋找優秀的技術合作伙伴,致力于提供一套更好的網絡基礎設施。華為星河AI網絡解決方案通過構建支持AI業務的網絡,實現從大型模型訓練到推理的全過程。目前,華為星河AI網絡解決方案已在成全球100+企業部署商用。

如何打造面向未來的AI 網絡?

到2030年,全球聯接數預計將達到2000億,數據中心流量10年增長100倍,IPv6地址滲透率將達到90%,AI算力將增長500倍。當前及未來的數據中心將如何應對這些趨勢和發展要求?這就需要構建一個立體超寬、滿足確定性時延的智能原生AI網絡。在華為看來,AI網絡的所有技術手段,都需要以業務為本,核心指標就是減少模型的訓練時間。

首先,大模型需要規模算力,需要非常大的GPU集群。而把大規模的GPU集群連起來,需要大規模的網絡。對于數據中心網絡而言,大規模網絡本身不是問題,更重要的是要考量建網的成本。華為主張采用大容量的交換設備組網降低網絡的層次,由原來的三層合適組網變成兩層寬河組網,從而來降低組網的成本。

其次,大規模的集群只是把AI物理服務器物理上連接在一起,要發揮效果還需要釋放集群算力。網絡在提高集群的加速比上需要發揮更加關鍵的作用。

最后,AI訓練的本質是并行計算,有典型的木桶效應,水桶的盛水量是由幾塊木板中最短的一塊決定的。一個環節出問題,會拉慢整個系統甚至讓整個系統癱瘓。網絡需要盡可能多的保障服務器之間的連通性,對網絡的高可靠需求更高。未來網絡要提高集群的整體可用性,做到在99%的情況下都不會因為網絡導致訓練中斷。

在過去20年,網絡技術獲得了長足發展——2000年開始的ALL IP技術推動了互聯網的大規模應用,2010年開始的All Cloud技術驅動了企業IT基礎設施的大規模云化。而今天,AI浪潮正撲面而來,持續演進的AI對網絡的需求將會處于指數級增長的態勢,網絡也需要全面擁抱人工智能時代。在這個過程中,華為將繼續攜手伙伴開放合作與持續創新,在算力領域的發展和應用中作出更大的貢獻。

wKgaomTwG_yANRmPAAEQIydIJUA826.png

wKgaomTwG_yANHPHAABH79rerUY833.gif 點擊“閱讀原文”,了解更多華為數據通信資訊!


原文標題:轉載 | 高性能計算與AI網絡大融合,如何重塑網絡智能時代?

文章出處:【微信公眾號:華為數據通信】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    35026

    瀏覽量

    255050

原文標題:轉載 | 高性能計算與AI網絡大融合,如何重塑網絡智能時代?

文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數據通信】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經網絡處理器 NPU, Android 14.0/
    發表于 04-23 10:55

    6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界

    在萬物互聯的時代背景下,邊緣計算與8K顯示的融合需求日益迫切。傳統的云端處理模式在面對8K超高清視頻數據時,常常出現延遲高、帶寬壓力大等問題,而邊緣計算設備由于算力有限,難以支撐8K視
    發表于 04-18 15:32

    適用于數據中心和AI時代的800G網絡

    數據中心依賴數千甚至上萬個GPU集群進行高性能計算,對帶寬、延遲和數據交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環境提供推理服務。這類數據中心要求
    發表于 03-25 17:35

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    的發展,加速創新和降低成本。 總之,FPGA與AI的結合正在重塑芯片生態,推動技術融合、應用拓展和產業變革。未來,FPGA將在AI加速、邊緣計算
    發表于 03-03 11:21

    華為5G-A智能核心網助力運營商加速網絡商業變現

    5G-A與AI技術的融合,不僅拉開了移動AI時代的序幕,更標志著通信網絡加速邁向智能世界邁進的里
    的頭像 發表于 02-25 16:11 ?774次閱讀

    AI賦能邊緣網關:開啟智能時代的新藍海

    功耗的AI邊緣計算平臺;對于算法企業,要研發更輕量化、更精準的邊緣AI模型;對于系統集成商,則要構建完整的邊緣智能解決方案。這個萬億級的新市場,正在等待更多創新者的加入。 在這場
    發表于 02-15 11:41

    高性能計算,名副其實的“算力皇冠”

    近年來,從金融到汽車、從教育到醫療,人工智能技術,特別是以ChatGPT為代表的生成式人工智能,正在給整個世界帶來顛覆性體驗。在如今這個“人工智能時代”,人工
    的頭像 發表于 02-08 14:27 ?644次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>,名副其實的“算力皇冠”

    中國信通院栗蔚:云計算AI加速融合,如何開啟智算時代新紀元?

    中國信通院栗蔚:云計算AI加速融合,如何開啟智算時代新紀元?
    的頭像 發表于 01-17 18:48 ?887次閱讀
    中國信通院栗蔚:云<b class='flag-5'>計算</b>與<b class='flag-5'>AI</b>加速<b class='flag-5'>融合</b>,如何開啟智算<b class='flag-5'>時代</b>新紀元?

    華為星河AI網絡共贏行業智能

    近日,華為年度旗艦活動——HUAWEI CONNECT 2024·PARIS開幕。大會期間,星河AI網絡論壇成功舉辦,200+名全球行業領袖、技術專家和合作伙伴參加,共同探討智能時代
    的頭像 發表于 11-18 11:29 ?711次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術發展的基石,更是推動AI應用落地、加速產業升級的重要工具。以下,是對AI
    的頭像 發表于 11-11 09:56 ?578次閱讀

    InfiniBand網絡計算的關鍵技術和應用

    InfiniBand在高性能計算(HPC)和人工智能AI)應用中發揮著關鍵作用,體現在它提供了高速、低延遲的網絡通信能力,以支持大規模數據
    的頭像 發表于 10-23 11:33 ?816次閱讀

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究中的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數據集,從而發現隱藏在數據中的模式和規
    發表于 10-14 09:16

    AI云服務器:開啟智能計算時代

    ,旨在為人工智能應用提供堅實的支持。 特點 高性能:配備先進的處理器,如多核CPU和高性能GPU,能夠快速處理大量復雜的計算任務,滿足深度學習和機器學習模型訓練及推理的需求。 可擴展性
    的頭像 發表于 08-09 16:08 ?1522次閱讀

    燧原科技與銳捷網絡攜手共筑AI數據中心高性能網絡新紀元

    近日,燧原科技與知名網絡解決方案提供商銳捷網絡正式簽署戰略合作協議,雙方宣布將共同研發面向未來人工智能數據中心的高性能網絡互聯解決方案。此次
    的頭像 發表于 07-29 11:27 ?848次閱讀

    芯品# 高性能計算芯片

    (LSE:AWE)是全球技術基礎設施高速連接和計算芯片的全球領導者,與Arm合作開發基于Arm ? Neoverse?計算子系統(CSS)的高級計算芯片,用于人工智能/機器學習(
    的頭像 發表于 06-27 10:28 ?7340次閱讀