何金池
IBM 大中華區(qū)科技事業(yè)部資深架構師
現在搞大模型,GPU 芯片就是命根子,沒有高性能的 GPU 芯片,大模型跑不動,大模型的應用也玩不轉。所以高性能芯片的研發(fā)就變得非常關鍵,就拿一個 7nm 芯片的仿真來說,每分鐘能噴涌出,幾千個甚至上萬個作業(yè),可能會瞬間擠爆計算資源。那如何把成千上萬個作業(yè)有序的調度到大規(guī)模的集群中呢?這時候,就得請出 HPC(高性能計算)調度界的“大宗師”—— IBM Spectrum LSF!
在大模型時代,電子半導體是當前技術攻堅的關鍵領域,IBM Spectrum LSF 如何助力半導體企業(yè)應對 AI 時代的高性能芯片需求?
作為 HPC 調度領域的扛把子,LSF 經過三十年的發(fā)展,但凡你想到調度的這種需求,基本都能滿足。LSF 有一系列的智能調度策略,可以讓作業(yè)在最合適的資源,以最快的速度來完成。比如說對一些關鍵的作業(yè),LSF 會開綠燈,保證高優(yōu)先級的作業(yè)插隊完成,低優(yōu)先級的作業(yè)先靠邊站。也可以根據作業(yè)的一些依賴關系編排工作流。同時,LSF 還會實時的掃描整個集群的狀態(tài),然后發(fā)現哪個服務器在偷水摸魚就會立刻抓出來,給他安排上合適的作業(yè)。
這里我分享一個半導體客戶的案例。他在芯片仿真過程中,遇到了作業(yè)不能及時完成、資源利用率低的情況,導致產品的上市周期非常長。用了 LSF 之后,他的資源利用率暴增 40%,芯片仿真的驗證周期幾乎縮短到了原來的一半。原來一個作業(yè)要等很長時間才能出結果,現在可以說,溫酒斬華雄,工程師泡的咖啡還沒涼,作業(yè)已經算完了。
LSF 如何助力企業(yè)降本增效?
LSF 不光可以幫企業(yè)增效,也可以降本。比如說,在EDA(Electronic Design Automation,電子設計自動化)軟件里,有一些商業(yè)的許可證非常昂貴,貴到讓人懷疑人生。曾經有一個半導體客戶,他每年購買 EDA 的軟件的商業(yè)許可證,要花費幾千萬的美金。對于普通的調度器來說,它只管硬件資源,不管像許可證這樣的一些其他資源的調度。而 LSF 作為調度界的“瑞士軍刀”,它有一個功能模塊叫做License Scheduler,是業(yè)界唯一具備的功能,可以幫助企業(yè)去調度商業(yè)許可證,按需分配,不用的時候及時收回,還可以跨項目的去調度這個許可證。就拿剛才的案例來說,這個半導體企業(yè)利用LSF License Scheduler功能模塊,它的許可證利用率暴漲了 38%,還避免了因為沒有License的時候,經常導致作業(yè)失敗的情況。所以 LSF 幫助企業(yè)省錢的同時,還提高了工作效率,真正做到了一舉兩得。
IBM Spectrum LSF的獨特優(yōu)勢有哪些?
首先,LSF 被稱為“瑞士軍刀”,就是因為它強悍的性能和豐富的功能。LSF同時可以支持幾千個用戶向它提交作業(yè),可以同時管理幾百萬個作業(yè)。LSF 的功能也非常齊全,基本上我們看到在 HPC 這種場景下看到的需求,不管是作業(yè)管理、作業(yè)編排、作業(yè)調度、作業(yè)監(jiān)控,LSF 都可以滿足。其他這種調度軟件,它可能只滿足一些基本的調度需求,對于一些高性能的策略,更智能的策略,它是沒有的。還有一些,比如說商業(yè)許可證調度功能,其他調度軟件也是沒有的。
另一方面,IBM 具有全世界范圍內 7x24小時的專業(yè)支持團隊。如果您在使用 LSF 過程中遇到問題,您隨時可以登錄我們的系統或撥打電話去尋求解決方案。這種貼身的專業(yè)支持,一些開源軟件也是不具備的。
IBM Spectrum LSF的應用場景有哪些?
LSF 的應用場景非常廣泛。比較常見的,比如剛提到的芯片 EDA 的仿真,還有生命科學和生物制藥,一些高端制造的 CIE 的場景,還有石油、天然氣、天氣預報、人工智能,以及一些超級的計算中心。
目前在芯片電子半導體企業(yè),不管是大型的企業(yè)還是微創(chuàng)的企業(yè),基本上我們看到百分之七八十已經在用了。還有一些醫(yī)療行業(yè),因為我們跟一些醫(yī)療的軟件可以無縫的集合起來,能做這種基因的檢測,或者蛋白質的仿真。
在新冠期間,LSF 是幕后英雄。它在新冠疫苗研發(fā)里起了非常大的作用。國外某家新冠疫苗研發(fā)企業(yè),它使用了 LSF 來做它的作業(yè)調度,使得它的疫苗盡快的推上市場。
我們每天看精準的天氣預報,比如說要刮大風,要下雨了,也是離不開 LSF 在幕后幫我們做的高性能的資源編排、作業(yè)的調度。
最后,我用 14個字來總結 IBM Spectrum LSF:智能調度快如風,資源管理準又精。如果您遇到“作業(yè)算不過來” “資源管不過來”等問題,歡迎聯系我們,IBM Spectrum LSF 讓您的超級計算不再“超級難”。
于 IBM
IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175個國家和地區(qū)的客戶,從其擁有的數據中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。
-
芯片
+關注
關注
459文章
52145瀏覽量
435920 -
IBM
+關注
關注
3文章
1806瀏覽量
75443 -
AI
+關注
關注
87文章
34146瀏覽量
275292 -
超級計算
+關注
關注
1文章
42瀏覽量
11393
原文標題:IBM Spectrum LSF:讓超級計算不再“超級難”
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
先楫半導體MCU具有哪些優(yōu)勢?
Nordic nRF54 系列芯片:開啟 AI 與物聯網新時代?
漢高亮相SEMICON China 2025 助力半導體產業(yè)在AI時代打造新質生產力

適用于數據中心和AI時代的800G網絡
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
砥礪創(chuàng)新 芯耀未來——武漢芯源半導體榮膺21ic電子網2024年度“創(chuàng)新驅動獎”
北京市最值得去的十家半導體芯片公司
Cadence如何應對AI芯片設計挑戰(zhàn)
大模型時代的算力需求
IBM陳旭東:攜手IBM加速 AI 規(guī)模化應用,解鎖企業(yè)新質生產力

評論