4月10日,CNCF(云原生計算基金會)正式接納由華為云捐贈的容器批量計算項目Volcano, 迎來CNCF首個容器批量計算項目。Volcano項目的加入,將CNCF的云原生版圖進一步擴展至AI、大數據、基因等批量計算領域,為構建“云原生批量計算平臺”奠定了基礎。
華為云CTO張宇昕表示:“ 華為云多年來一直致力于云原生技術推廣,不僅在國內最早推出了Kubernetes云原生容器技術的商業化產品云容器引擎CCE和云容器實例CCI,而且在開源社區發起并領導了多個生態項目,幫助各行業更快地落地并實踐云原生技術。Volcano是基于Kubernetes的云原生批量計算引擎,基于華為云在AI、大數據領域的深厚業務積累,補齊了Kubernetes在面向AI、大數據、高性能計算等批量計算任務調度、編排等場景下的短板,向下支持鯤鵬、昇騰、X86等多元算力,向上使能TensorFlow、Spark、華為MindSpore等主流行業計算框架,讓數據科學家和算法工程師充分享受到云原生技術所帶來的高效計算與極致體驗。”
Volcano介紹
隨著Kubernetes的成熟,越來越多的企業把Kubernetes作為AI、大數據以及高性能批量計算的下一代基礎設施,得益于Kubernetes在應用一致性、跨云遷移便利性、靈活任務調度等方面的優勢,使得Kubernetes在大數據、AI、以及高性能批量計算領域快速得到廣泛應用。
然而,Kubernetes作為普適的容器化解決方案,應用到大數據、AI、高性能批量計算等專業領域時,仍與業務訴求存在一些差距,主要體現在:
?K8s的原生調度功能無法滿足計算要求
?K8s作業管理能力無法滿足AI訓練的復雜訴求
?數據管理方面,缺少計算側數據緩存能力,數據位置感知等功能
?資源管理方面缺少分時共享,利用率低
?硬件異構能力弱
華為云容器團隊針對以上問題,推出高性能容器批量計算解決方案。
同時,為加快云原生技術在各行業的快速普及,于2019年將解決方案的核心引擎Volcano開源,Volcano在調度、作業管理、數據管理、資源管理四個方面進行了重點優化。
? 增強了任務調度能力,如公平的調度(fair-share),組調度(gang-scheduling)
? 進一步優化了作業管理能力,如multiple pod template能力, 更靈活的error handling機制
? 增加計算側數據緩存,提升數據的傳輸與讀取效率
? 引入多維度的綜合評分機制,實現資源更高效的管理和分配
? 多元算力支持:支持x86、鯤鵬和昇騰等算力
生態合作
針對不同應用場景,Volcano已與多個主流計算框架社區完成官方合作集成,包括Kubeflow、Spark、PaddlePaddle、Horovod (MPI)、Cromwell 、MindSpore等。
Volcano彌補了Kubernetes在AI場景下的不足,為飛槳分布式深度學習對接Kubernetes提供了更好支持,PaddlePaddle on Volcano方案顯著簡化了飛槳推薦系統解決方案 ElasticCTR的部署落地,我們非常期待Kubernetes+Volcano+PaddlePaddle的整套開源部署方案更加成熟完善,給AI開發者帶來更大便利”。
—飛槳(PaddlePaddle)總架構師于佃海
MindSpore是華為開源的一款支持端邊云全場景的深度學習訓練推理框架,當前主要應用于計算機視覺、自然語言處理等AI領域,旨在為數據科學家和算法工程師提供設計友好、運行高效的開發體驗,提供昇騰AI處理器原生支持及軟硬件協同優化。Volcano開源項目將有助于提升Kubernetes對AI任務的調度能力支持,有利于MindSpore等深度學習框架更加有效的部署,為AI和云原生兩大領域的攜手共創繁榮開源生態打下了堅實的基礎。
—MindSpore社區技術委員會主席、華為MindSpore首席科學家陳雷教授
Volcano自2019年6月宣布開源以來,受到了廣泛的關注和支持,來自15家大企業/機構的80+核心開發者參與了社區開發及貢獻。
商業應用
目前,Volcano已在華為云容器批量計算解決方案商用,并支撐多家國內外頭部企業應用于AI、大數據、基因等計算場景。Volcano支持批量任務與容器的快速發放,最快每秒可發放1000容器,并提供公平調度、隊列調度等高級功能,同時與華為鯤鵬、昇騰處理器深度融合,打造更高性能、更高性價比的容器批量計算解決方案。
未來可期
此次CNCF正式將Volcano接納為云原生領域唯一容器批量計算項目,將極大促進Volcano上下游社區生態構建及合作,吸引廣大云原生企業用戶深度參與,Volcano將在企業數字化、云原生轉型過程中發揮越來越重要的作用,華為云也將在云原生領域持續耕耘、持續引領創新、繁榮生態,助力各行業走向快速智能發展之路。
責任編輯:gt
-
華為
+關注
關注
216文章
35021瀏覽量
255021 -
AI
+關注
關注
87文章
34146瀏覽量
275303 -
大數據
+關注
關注
64文章
8949瀏覽量
139449
發布評論請先 登錄
DevEco Studio構建分析工具Build Analyzer 為原生鴻蒙應用開發提速
云原生AI服務怎么樣
調理電路的噪聲余量計算如何計算
云原生LLMOps平臺作用
如何選擇云原生機器學習平臺
艾體寶與Kubernetes原生數據平臺AppsCode達成合作
k8s微服務架構就是云原生嗎?兩者是什么關系
云原生和非云原生哪個好?六大區別詳細對比
基于Arm架構的Azure虛擬機助力云原生應用開發
京東云原生安全產品重磅發布

從積木式到裝配式云原生安全

基于DPU與SmartNic的云原生SDN解決方案

首批認證!拓維信息梧桐云原生平臺獲鯤鵬原生開發技術認證

評論