近日,北鯤云攜手西安電子科技大學(以下簡稱西電)舉辦了高性能計算平臺實操線上培訓,吸引了人工智能、電子信息、生物醫學工程、計算數學等多個專業的師生參與。這也是北鯤云超算平臺首次進入高校進行培訓講解。
此次培訓講座由北鯤云高級工程師陳仕鑫主講,通過理論+實操的方式詳細講解了如何使用北鯤云超算平臺,其中包括可視化提交、工作站提交、以及命令行提交作業。
可視化提交作業只需要選擇軟件,再選擇適合的作業模板。
然后進入設置軟件,并在此處上傳作業的輸入文件,并填寫相應的參數。用戶可以根據自己的需要決定是否選擇使用案例模板,模板中已經預置了輸入文件和參數,可以直接運行。
點擊下一步,進入硬件設置。北鯤云超算平臺提供豐富的CPU和GPU計算資源,用戶可以根據需求選擇相應的資源類型,并輸入對應的資源數量。頁面右側將展示所選資源的核時或卡時的費用信息。接著,預覽作業配置,并填寫作業名稱。確認無誤后即可提交。
提交后,作業將經過校驗、創建集群等流程,最后進入執行狀態。作業執行過程中,用戶可以在界面上及時查看輸入、日志、結果和日志文件,也可以連接到節點上查看進程狀態。
圖形界面分為工作站和圖形應用。
工作站包含Windows和Linux工作站,在界面上選擇用戶需要的操作系統,比如Linux工作站,再選擇硬件配置后點擊確定。當系統為用戶創建好節點后,用戶可以連接到節點并在上面安裝軟件或提交作業。
圖形應用為Linux桌面,啟動流程和工作站類似。
當用戶連接到節點后,將自動加載對應的軟件。用戶可以使用計算軟件來提交作業,或使用可視化軟件瀏覽計算結果。
當用戶在工作站提交作業之后,建議在設置中進行作業結束配置。系統將根據你設置的條件判斷作業是否完成,滿足條件后會及時通知用戶作業計算完成或自動釋放當前的節點。接收通知的方式請前往用戶中心-通知設置中進行查看。
命令行操作,北鯤云超算平臺技術支持建議用戶使用Linux管理節點提交作業。
首先,啟動管理節點。管理節點配置為2核4G。用戶可以在節點上調用軟件、編寫腳本和提交作業。
啓動成功後即可連接到節點上。
平臺預裝了300多種軟件,用戶可以輸入module avail 查看已經安裝好的軟件,如果用戶在計算中需要使用某個軟件,可以在作業的腳本中通過module add再加軟件的名字就可以自動加載這個軟件。我們在這里演示如何加載Anaconda。這樣用戶就加載上Anaconda了
本平臺使用slurm進行作業調度。提交作業前,用戶可以通過sinfo查看可選的隊列,每個隊列對應一種硬件規格,如c-4-1表示4核、每核1G內存的cpu計算節點。g-v100-1表示v100單卡的gpu計算節點。
提交作業時,通過-p參數來指定這個作業想使用哪個隊列,系統將為用戶動態創建集群并執行作業。
提交後用戶可以通過squeue命令及時查看作業的執行狀態。啟動計算節點大概需要1分鐘的時間。可以看到作業已經在運行狀態中了。用戶可以通過sacct命令來查看歷史作業。可以看到剛剛提交的作業已經執行完成了。用戶也可以通過通知設置,在作業結束或異常時自動接收通知。
未來,北鯤云將和更多的高校及及科研所展開更多的合作,從產品咨詢、技術支持、技術培訓、人才服務等各個方面,為高性能計算用戶提供更高效、更便捷的云端高性能計算服務和解決方案,滿足廣大科研人員日益增長的科研計算需求,助力國內科研發展。
評論