北京2024年9月18日/美通社/ -- 亞馬遜云科技宣布由英偉達H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)實例現已正式可用。亞馬遜云科技是首個將英偉達H200 GPU用于生產環境的領先云提供商。與基于英偉達H100 GPU的Amazon EC2 P5實例相比,Amazon EC2 P5e實例GPU內存容量提升1.7倍,GPU內存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復雜的大型語言模型(LLM)和多模態基礎模型(FM)的訓練、微調和推理,用于支持最苛刻和計算密集型的生成式AI應用,如問答、代碼生成、視頻和圖像生成、語音識別等。
Amazon EC2 P5e實例提供8個英偉達H200 GPU,具有1128GB高帶寬GPU內存,同時提供第三代AMD EPYC處理器,2TB系統內存和30TB本地NVMe存儲。Amazon EC2 P5e實例還提供3,200 Gbps的聚合網絡帶寬并支持GPUDirect RDMA,從而能夠繞過CPU進行節點間通信,實現更低的延遲和高效的橫向擴展性能。Amazon EC2 P5e實例具有的更高的內存帶寬、更大的GPU內存容量和對更大的batch sizes的支持,從而顯著提升客戶工作負載的性能、降低成本并簡化運營。
Amazon EC2 P5e實例現已可通過Amazon EC2 Capacity Block for ML工具訪問并在美國東部(俄亥俄州)區域正式可用。
此外,亞馬遜云科技還宣布將推出Amazon EC2 P5en實例,通過將英偉達H200 GPU與定制的第四代英特爾Xeon可擴展處理器相結合支持PCle Gen5,將提供高達四倍的CPU和GPU之間的帶寬,降低網絡延遲,進一步提高工作負載性能。
-
gpu
+關注
關注
28文章
4938瀏覽量
131196 -
英偉達
+關注
關注
22文章
3944瀏覽量
93652 -
Amazon
+關注
關注
1文章
125瀏覽量
17648 -
亞馬遜云科技
+關注
關注
0文章
100瀏覽量
263
發布評論請先 登錄
AMD最強AI芯片,性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

GPU 維修干貨 | 英偉達 GPU H100 常見故障有哪些?

GMI Cloud推出基于英偉達H200的DeepSeek系列模型
NeuroBlade攜手亞馬遜EC2 F2實例,加速數據分析
亞馬遜云科技發布Amazon Bedrock新功能
亞馬遜云科技宣布Amazon Trainium2實例正式可用

評論