科技云報道原創。
隨著以大模型為代表的AIGC時代拉開序幕,算力需求持續爆發,AI與邊緣深度融合已是大勢所趨,越來越多的企業開始積極布局GenAI。
GenAI技術的商用化部署和應用成為企業競逐的新陣地,勾勒出大模型從“技術力”轉向“生產力”的新生態。
算力就是生產力,更豐富的算力資源成為人工智能競爭的核心基石。
IDC預計,全球AI計算市場規模將從2022年的195億美元增長到2026年的346.6億美元,其中GenAI計算市場規模將從2022年的8.2億美元增長到2026年的109.9億美元。
GenAI計算占整體AI計算市場的比例將從4.2%增長到31.7%。
AI算力瓶頸下邊緣計算崛起
隨著AI大模型爆發,大模型迭代和訓練所需的算力呈指數級增長。同時,單個AI超算規模也受到功耗、土地、散熱等因素制約,算力供給與需求的缺口持續放大。
此前,ChatGPT官網一度停止Plus付費項目的購買,GPT-4推出之后也已多次下調付費用戶訪問限制,原因是訪問量激增超出了服務器的承受能力。
隨著這場GenAI熱潮逐步擴張,算力短缺已成為行業面臨的共同挑戰。
如果說傳統算力是AI大模型的筋骨,那么邊緣算力就是遍布全身的神經系統。
英偉達指出,為了有效運用算力達成AI應用目標,大規模數據中心勢必要增加資本支出以擴大云端運算效能,同時也將帶動邊緣設備的銷售。
在AI向實際場景落地的過程中,邊緣算力的重要性將加速凸顯。未來的AI運算將呈現出“訓練與迭代在云端、推理與內容生產梯度分布(云側+霧側+邊緣側)”的格局變化,邊緣算力有望成為AI算力的重要組成部分。
相較于傳統云端,邊緣計算作為一種分布式計算架構,具有低延遲、高安全性、高可靠性、保護用戶隱私等優勢,其在實時決策在自動駕駛、醫療保健、金融、制造等各個領域都至關重要。
從效率方面看,邊緣計算使GenAI模型能夠在邊緣處理數據,從而顯著減少延遲并實現更快洞察。這意味著可以實時做出關鍵決策,從而提高運營效率、增強客戶體驗和更好的整體業務成果。
其次,通過利用邊緣計算,企業可以在邊緣設備網絡上分配計算負載,從而優化資源利用率并有效擴展。這種方法最大限度地減少了集中式云基礎設施的壓力并優化了帶寬使用,從而節省了成本并提高了性能。
第三,通過邊緣計算,GenAI模型可以直接在邊緣設備或本地服務器上運行,最大限度地減少將敏感數據傳輸到集中式云服務器的需要。
通過使數據更接近其來源,公司可以顯著降低與數據泄露、未經授權的訪問和合規性問題相關的風險。
從關系上看,邊緣計算并不尋求取代云計算,相反是對其重要的補充。邊緣計算和云之間的協作可實現混合架構,最大限度地發揮兩種范式的優勢。
GenAI模型可以利用云的可擴展性和存儲功能,同時受益于邊緣設備的低延遲和本地處理能力。這種融合確保了GenAI采用的多功能且適應性強的基礎設施。
邊緣計算重構生產力邊界
隨著企業開始越來越多地擁抱AI,邊緣計算和AI的融合擁有改變全球行業的巨大潛力。通過利用本地化處理、實時洞察和優化的資源利用,可以充分釋放AI的全部潛力,同時保護敏感數據并推動組織進入AI時代。
對此,全球科技巨頭開始將目光越來越多地轉向這一領域。
比如,華為、高通均推出邊緣AI產品。去年3月,高通中國在安卓手機上首次演示了模型參數超過10億的Stable Diffusion;華為于去年7月發布智慧搜圖功能,該功能通過對模型進行小型化處理。
華為與高通一定程度上驗證了高性能邊緣AI的可行性,并且表明通過模型壓縮+聯網智能的方式有望在邊緣端實現AI大模型的體驗。
此外,英偉達黃仁勛也表示,人工智能的下一個浪潮將是具身智能。具身智能能夠在物理世界中進行操作和感知,輸出各種機械動作。
具身智能將邊緣算力需求提升到了一個新高度,具身智能的“大腦”不僅要處理視覺信息、生成提示詞,更要負責輸出指令來執行機械動作。在移動芯片無法滿足所需算力的場景下,邊緣IDC將是算力的有效補充措施。
AIPC、AI手機、具身智能、自動駕駛等AI新應用的興起,無疑為邊緣云市場帶來了巨大影響,這種影響既體現在市場規模的擴張,也反映在技術要求的提升方面。
AIPC、AI手機作為AI普惠的終端,其本質在于云端與本地端的混合協作,通過利用云端的大數據處理能力來豐富本地設備的使用場景。
這種混合協作模式對云計算的性能和穩定性提出了更高的要求,同時也為云計算帶來了更多的數據處理和存儲需求。
邊緣云作為離用戶最近的數據處理中心,能夠迅速響應這些需求,提供低延遲、高帶寬的數據處理服務。
具身智能和自動駕駛的發展,更是推動了邊緣云市場的快速增長。智能機器人需要在真實的物理環境下執行各種任務,這就需要邊緣云提供強大的實時計算能力和數據交互能力。
不僅如此,邊緣AI應用場景仍在持續豐富。邊緣云服務提供商Zenlayer技術專家表示,對于實時性要求極高的應用,如自動駕駛和智能制造,邊緣計算能夠提供毫秒級的低延遲響應。
通過在車輛或生產線上部署邊緣計算節點,客戶可以實時處理傳感器數據,進行決策和控制,從而確保安全和高效的生產運行。
其次,對于需要處理大量數據的應用,如智能視頻監控和智慧城市,邊緣計算能夠減輕中心云的壓力,實現數據的本地化處理。
通過在攝像頭或傳感器附近部署邊緣計算設備,可以對視頻流進行實時分析,識別異常事件,并及時進行響應。
此外,邊緣計算還能夠解決大模型在數據傳輸和隱私保護方面的問題。通過將模型推理過程放在邊緣端進行,可以減少數據傳輸量,降低網絡帶寬要求,同時保護用戶數據的隱私和安全。
事實上,目前已有企業開始探索邊緣計算在AI大模型中的應用。
據Zenlayer技術專家介紹,某家專注于大模型技術的初創企業基于Zenlayer提供的一整套SDN解決方案,通過智能路由和數據傳輸協議優化等手段,搭建了一條高效穩定的數據傳輸通道,確保大模型在訓練、推理等關鍵環節都能獲得及時、準確的數據支持,從而顯著提升了模型的應用效果和用戶體驗。
此外,還有對于一些AI大模型客戶希望將算力資源部署至海外,Zenlayer針對這類需求,提供了算力托管或算力租賃服務,將計算資源部署在靠近用戶的邊緣數據中心,使大模型推理能夠在本地進行,極大地降低了數據傳輸的延遲和成本。
同時,Zenlayer還為客戶提供了一系列數據本地存儲和傳輸方案,在滿足各個國家對數據合規要求的同時,盡量優化業務交互體驗。
結語
如果把視線放得更長遠,在AI等眾多顛覆性技術的背后,總離不開邊緣計算的存在。當全球都沸騰在AIGC的風潮里,邊緣云服務商正通過邊緣端和云邊的融合協同,滿足更多元的AI應用場景,以更自如的算力,讓AI技術更自如地普惠。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
邊緣計算
+關注
關注
22文章
3273瀏覽量
50503 -
算力
+關注
關注
2文章
1141瀏覽量
15434 -
AIGC
+關注
關注
1文章
383瀏覽量
2200
發布評論請先 登錄
小型化邊緣計算設備
如何選擇 邊緣計算服務器

6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界
157 TOPS 算力!AIO-OrinNX 主板助力邊緣 AI 應用

《RK3588核心板:AIoT邊緣計算的革命性引擎,能否解鎖智能物聯新范式?》
【新品體驗】幸狐Omni3576邊緣計算套件免費試用
未來邊緣GPU算力在車聯網中的創新應用(下)

英特爾攜手浪潮信息從邊緣計算向邊緣智算邁進
未來邊緣GPU算力在車聯網中的創新應用

邊緣計算網關在儲能領域的應用分享
邊緣AI需求爆發,邊緣計算網關亟待革新
邊緣計算網關是什么?邊緣計算網關的特點及價值

評論