在本次大會上,來自整個生態系統的專家們將分享有關在本地部署 AI 的見解。
生成式 AI 正在重新定義計算,為在 PC 和工作站上構建、訓練和優化 AI 模型解鎖了新途徑。從內容創作、大和小語言模型到軟件開發,AI 賦能的 PC 和工作站正在革新工作流并提升工作效率。
在 3 月 17 日至 21 日于圣何塞會議中心舉行的 GTC 2025 大會上,泛 AI 生態的專家將分享有關在本地部署 AI、優化模型以及利用先進的硬件和軟件來增強 AI 工作流的見解,并重點介紹 RTX AI PC 和工作站的主要進展。
在 RTX 上進行開發和部署
RTX GPU 基于專用 AI 硬件 —— Tensor Core 構建而成,能夠為運行算力要求極為苛刻的最新 AI 模型提供所需的計算性能。這些高性能 GPU 可以幫助構建數字人、聊天機器人、AI 生成的播客等。
隨著 GeForce RTX 和 NVIDIA RTX GPU 用戶超過 1 億,開發者在部署新的 AI 應用和功能時,將能夠面向龐大的受眾群體。在“為 RTX PC 和工作站打造數字人、聊天機器人和 AI 生成的播客”會議中,NVIDIA 高級產品經理 Annamalai Chockalingam 將展示一套端到端工具,供開發者用于簡化開發并快速部署 AI 應用。
模型行為
大語言模型(LLM)的使用場景多種多樣,并可延伸到各種復雜任務,如編寫代碼或將日語翻譯為希臘語。但是,由于它們通常在廣泛的應用范圍內利用豐富的知識進行訓練,因此可能不適合執行特定任務,例如在電子游戲中生成非玩家角色對話。相比之下,小語言模型會通過減小模型大小來滿足更多本地運行需求,并保持準確性。
在“關注您的語言:構建可在設備上運行的小語言模型”會議中,NVIDIA 高級工程經理 Oluwatobi Olabiyi 將展示一些工具和技術,以便當今的開發者和發燒友用于生成、整理和提煉數據集 — 然后訓練可以執行目標任務的小語言模型。
在 Windows 工作站上充分發揮 AI 性能
由于硬件配置和軟件環境多種多樣,要在基于 Windows 的工作站上優化 AI 推理和模型執行,需要進行戰略性軟硬件調優。在“在 Windows 工作站上優化 AI 工作負載:策略和最佳實踐”會議中,將探討 AI 優化的最佳實踐,包括模型量化、推理工作流增強和硬件感知調優。
NVIDIA 軟件工程師團隊還將介紹面向 ONNX Runtime、NVIDIA TensorRT 和 llama.cpp 的硬件感知優化,幫助開發者更大限度地提高 GPU、CPU 和 NPU 上的 AI 效率。
推動本地 AI 開發
即使未連接到基于云的服務,在本地基礎設施上構建、測試和部署 AI 模型也能確保安全性和性能。Z by HP 的 AI 解決方案由 NVIDIA RTX GPU 加速,提供在本地開發 AI 所需的工具,同時保持對數據和 IP 的掌控。
參加以下會議了解詳情:
Dell Pro Max 和 NVIDIA:開啟 AI 開發的未來[S74220]:本次會議將介紹搭載 NVIDIA RTX GPU 的 Dell Pro Max PC、高性能筆記本電腦和面向專業人士的臺式電腦。了解這兩款功能強大的組合如何幫助快速啟動 AI 戰略,并轉變 AI 開發者、數據科學家、創作者和高級用戶的創新方式。
借助 Z by HP GenAI Lab 和 AI Studio 開發并評估本地生成式 AI[S74470]:本次會議將展示 Z by HP 解決方案如何簡化本地模型訓練和部署,利用 NVIDIA NGC Catalog 中的模型和 Galileo 評估技術安全高效地優化生成式 AI 項目。
借助 Z by HP GenAI Lab 和 AI Studio 為生成式 AI 開發提供強效助力[S74465]:本次會議將探討 Z by HP 的 GenAI Lab 和 AI Studio 如何助力本地 LLM 開發,同時確保全面的數據安全性和控制。了解這些工具如何簡化從實驗到部署的整個 AI 生命周期,同時集成 NVIDIA NGC Catalog 中提供的模型,以提高協作和工作流效率。
開發者和發燒友可以使用 NVIDIA NIM 微服務在 RTX AI PC 和工作站上著手進行 AI 開發。今天推出的首個公開測試版包括 Llama 3.1 LLM、用于自動語音識別(ASR)的 NVIDIA Riva Parakeet 和用于計算機視覺的 YOLOX。
NIM 微服務是經過優化的預構建模型,適用于生成式 AI。它們涵蓋對 PC 開發至關重要的模態,并且易于通過行業標準 API 下載和連接。
-
NVIDIA
+關注
關注
14文章
5238瀏覽量
105730 -
AI
+關注
關注
87文章
34145瀏覽量
275248 -
模型
+關注
關注
1文章
3483瀏覽量
49957
原文標題:GTC25 | 在 NVIDIA GTC 2025 大會上探索 RTX AI PC 和工作站如何強效助力 AI 開發
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
立訊技術亮相英偉達GTC 2025大會

研華科技亮相NVIDIA GTC 2025大會
英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業存儲領域,加速AI工廠部署
羅克韋爾亮相NVIDIA GTC 2025大會
英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

商湯絕影王曉剛亮相NVIDIA GTC 2025并發表主題演講
NVIDIA GTC 2025精華一文讀完 黃仁勛在GTC上的主題演講

評論