產前超聲檢查能夠有效預防和降低出生缺陷,受到了越來越多家庭的重視。然而傳統的產前超聲檢查對于醫師的專業能力要求較高,且耗時耗力。針對這些問題,深圳開立生物醫療科技股份有限公司(以下簡稱:開立醫療)推出了基于人工智能(AI)技術的 S-Fetus 4.0 產科掃查助手1,能夠有效簡化工作流程,減輕醫師負擔,并為患者提供更好的診療服務。
為提升性能表現,開立醫療在基于英特爾 酷睿 i7 處理器的平臺上使用英特爾 oneAPI Base 工具包進行跨架構開發與優化,從而實現更高的經濟性、跨架構擴展性和靈活性。
背景
智能超聲診斷面臨諸多挑戰
超聲診斷是一種將超聲檢測技術應用于人體,通過測量了解生理或組織結構的數據和形態,進而發現疾病、做出提示的一種診斷方法2,現已成為人類疾病診療、尤其胎兒產前篩查重要的影像學診療手段。但是,傳統超聲檢查高度依賴醫師經驗水平,且手動操作效率低下,給醫師和醫院帶來諸多困擾。
為解決上述問題,開立醫療推出基于人工智能技術的智能診斷超聲解決方案,在方案開發過程中遇到了如下挑戰:
1
如何進一步優化性能
相關的深度學習算法眾多且需要協同工作,以幫助醫療機構快速處理不同數據類型的任務,并根據場景無等待地最優執行用戶發起的任務。這對于超聲終端的算力、算法優化均帶來了較高要求。
2
如何應對移動應用需求
目前搭載了 S-Fetus 4.0 產科掃查助手的開立醫療超聲診斷系統為移動型系統,對于系統整體的功耗、尺寸有著較高的限制,這給獨立 GPU 的部署帶來了很大的挑戰。
3
如何面向不同場景實現跨架構擴展
S-Fetus 4.0 產科掃查助手需要跨多種架構進行遷移和擴展,以應對多種復雜場景。
解決
使用英特爾 oneAPI工具包
優化超聲診斷
為應對上述挑戰,開立醫療與英特爾合作,探索通過英特爾 oneAPI Base 工具包對 S-Fetus 4.0 產科掃查助手進行優化。
硬件層面
在硬件層面,方案采用了基于第 11 代英特爾 酷睿 i7 處理器的算力基礎架構。該處理器實現了更出色的執行性能,搭載全新內核和顯卡架構,并具備基于人工智能的智能性能,能夠為各種工作負載提供卓越性能。該處理器具備英特爾 深度學習加速(英特爾 DL Boost)技術,可為 AI 引擎提供強大支持,為人工智能、數據分析等多種復雜負載提供出色的性能支撐。
第 11 代英特爾 酷睿 處理器還集成了英特爾銳炬 Xe 顯卡,充分利用該集成顯卡來提升工作負載的性能。此外,這一顯卡還能夠支持多種數據類型,并采用了低功耗架構。
解決方案的數據處理流程如圖 1 所示。其中英特爾銳炬 Xe 顯卡提供數據密集計算核,負責實時識別追蹤流程,實現高頻實時執行(每一幀圖像都要進行處理或智能推理)。英特爾 酷睿 i7 處理器負責標準面決策及調度、自適應切面特征提取、量化分析等流程,執行業務邏輯或空閑期執行 AI 推理。
圖1 基于英特爾 酷睿 處理器的
開立醫療 S-Fetus 4.0 產科掃查助手方案架構圖
軟件工具優化
多模態數據優化處理作為一個數據密集與邏輯判斷相結合的模塊,開立醫療與英特爾使用英特爾 oneAPI 工具包,重點針對這一環節進行了 4 個方面的優化。優化后,開立醫療 S-Fetus 4.0 產科掃查助手可以靈活調用 CPU 和 iGPU 的資源,大幅提升了性能,在滿足業務需求的同時,改善了超聲用戶體驗。
■ 優化一
開立醫療使用英特爾 VTune Profiler 對工作負載進行分析,隨后通過英特爾 oneAPI 工具包中的 DPC++ 編譯器對代碼進行重新編譯并生成向量化指令以提升性能。通過這種方式,將工作負載的處理速度從 141ms 大幅縮短到 33ms3。
圖2 標量操作 Vs 向量操作
■ 優化二
通過英特爾 VTune Profiler 進一步發現性能瓶頸后,開立醫療使用英特爾 Integrated Performance Primitives(英特爾 IPP)中的 API 對其進行替換。通過這一步驟的優化,開立醫療將工作負載的處理速度從 33ms 進一步縮短到 13.787ms4。
■ 優化三
通過使用英特爾 IPP 替換源碼中的 openCV 函數,應用代碼在各代英特爾平臺上均能夠很好地運行,并在大規模數據場景下表現出更好的可擴展性。
■ 優化四
S-Fetus 4.0 產科掃查助手應用了英特爾 DPC++ Compatibility Tool,將現有的 CUDA 代碼高效地遷移到DPC++ 代碼,從而實現跨架構運行,大幅縮短了代碼遷移時間
圖3 英特爾 DPC++ Compatibility Tool 工作流程圖
通過上述優化,開立醫療 S-Fetus 4.0 產科掃查助手在基于英特爾 oneAPI DPC++ 的異構平臺上的性能較優化前的基準性能數據,實現了近 20 倍的性能提升(具體性能數據見圖 4)5。
圖4 使用英特爾 oneAPI 異構平臺優化前后的性能對比6
收益
卓越的性能與跨架構擴展能力
通過采用集成英特爾銳炬 Xe 顯卡的英特爾 酷睿 處理器提供底層算力,并使用英特爾 oneAPI 異構平臺進行優化,開立醫療 S-Fetus 4.0 產科掃查助手實現了性能、經濟性和異構擴展性等方面的兼顧:
● 高性能:通過基于英特爾 oneAPI 工具包的英特爾 XPU 混合架構開發,開立醫療 S-Fetus 4.0 產科掃查助手實現了近 20 倍的性能提升,為高效的產科智能超聲診斷奠定了堅實的基礎7。
● 更優成本:得益于英特爾 酷睿 處理器的強大性能和靈活架構,以及全方位的優化,開立醫療只需使用 CPU + iGPU就可以實現預期的性能指標。同時,由于硬件的精簡,供電、散熱、空間等成本顯著降低,使得其可以搭載在尺寸更小的超聲診斷設備中,更靈活地應對不同場景的需求。此外,CPU + iGPU 的組合也意味著更持久的電池續航時間,以及更高的穩定性與可靠性。
● 異構擴展性:該方案能夠在 CPU、iGPU 等異構化硬件上進行統一編程,有效提升跨架構編程的開發效率,支持開立醫療 S-Fetus 4.0 產科掃查助手靈活地在不同的硬件配置中運行,同時確保流暢的用戶體驗。
展望
加速 “AI + 醫療” 的落地
智能超聲診斷是 “AI + 醫療” 的重要場景,有助于大幅減少醫生工作量,提升醫療業務流程效率。為了推動 “AI + 醫療” 技術的落地,英特爾正在與開立醫療等伙伴合作,通過包含 CPU、iGPU、專用加速器以及 FPGA 的 XPU 混合架構,以及英特爾 oneAPI 工具包等軟硬件產品,加速數字化創新,推動更多智慧化產品與方案在醫療行業的落地。
審核編輯 :李倩
-
英特爾
+關注
關注
61文章
10169瀏覽量
173946 -
智能化
+關注
關注
15文章
5103瀏覽量
56944 -
人工智能
+關注
關注
1804文章
48726瀏覽量
246573
發布評論請先 登錄
智慧路燈如何應用人工智能技術

機智云入選廣州市“人工智能+”優秀解決方案冊
嵌入式和人工智能究竟是什么關系?
對話華為大咖,探討油氣行業數字化轉型和人工智能技術的應用與實踐

未來智慧建筑:人工智能技術的無限可能
《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
risc-v在人工智能圖像處理應用前景分析
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI
鯤云科技AI視頻分析解決方案入選人工智能典型應用示范案例

評論