女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Bottlerocket和Amazon EC2部署AI模型

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Uttara Kumar ? 2022-04-08 15:37 ? 次閱讀

在大規(guī)模生產(chǎn)中部署人工智能支持的服務(wù),如基于語音的助手、電子商務(wù)產(chǎn)品推薦和呼叫中心自動化,是一項(xiàng)挑戰(zhàn)。在降低運(yùn)營成本的同時(shí)提供最佳的最終用戶體驗(yàn)需要考慮多個(gè)因素。其中包括底層基礎(chǔ)設(shè)施的組成和性能、基于用戶需求擴(kuò)展資源的靈活性、集群管理開銷和安全性。

為了應(yīng)對大規(guī)模部署人工智能的挑戰(zhàn),企業(yè) IT 團(tuán)隊(duì)已采用 Kubernetes ( K8s )進(jìn)行容器編排和 NVIDIA 加速計(jì)算,以滿足生產(chǎn)人工智能部署的性能需求。此外,人們越來越關(guān)注操作系統(tǒng)( OS )在生產(chǎn)基礎(chǔ)設(shè)施中的作用。生產(chǎn)環(huán)境的主機(jī)操作系統(tǒng)對安全性、資源利用率以及調(diào)配和擴(kuò)展額外資源所需的時(shí)間有直接影響。隨著用戶需求的增加,這會影響用戶體驗(yàn)、安全性和部署成本。

Botterocket :基于 Linux 的容器優(yōu)化操作系統(tǒng)

Bottlerocket 是 AWS 開發(fā)的基于 Linux 的最小開源操作系統(tǒng),專門為運(yùn)行容器而構(gòu)建。它非常強(qiáng)調(diào)安全性,只包括運(yùn)行容器的基本軟件。

這減少了攻擊面和漏洞的影響,從而減少了滿足節(jié)點(diǎn)合規(guī)性要求的工作量。此外, Bottlerocket 的最小主機(jī)占用空間有助于提高節(jié)點(diǎn)資源利用率和引導(dǎo)時(shí)間。

對 Bottlerocket 的更新只需一步,必要時(shí)可以回滾。這將降低錯(cuò)誤率,并改善容器應(yīng)用程序的正常運(yùn)行時(shí)間。它們還可以使用容器編排服務(wù)(如 Amazon 彈性庫伯內(nèi)特斯服務(wù)( EKS )和 Amazon 彈性容器服務(wù)( ECS ))實(shí)現(xiàn)自動化。

在 NVIDIA GPU 支持的 Amazon EC2 實(shí)例中使用瓶裝火箭

AWS 和 NVIDIA 已經(jīng)合作,使 Bottlerocket 能夠支持所有由 NVIDIA 供電的系統(tǒng) Amazon EC2 實(shí)例 包括 P4d 、 P3 、 G4dn 和 G5 。這種支持將 NVIDIA 驅(qū)動的 GPU 實(shí)例的計(jì)算能力與容器優(yōu)化操作系統(tǒng)的優(yōu)勢結(jié)合起來,可以在 K8s 集群上大規(guī)模部署 AI 模型。

其結(jié)果是增強(qiáng)了安全性和更快的啟動時(shí)間,尤其是在運(yùn)行人工智能工作負(fù)載時(shí),實(shí)時(shí)擴(kuò)展其他基于 GPU 的實(shí)例。

對 NVIDIA GPU 的支持以 GPU 優(yōu)化的 AMI 的形式提供。這包括 NVIDIA 驅(qū)動程序、 K8s GPU 設(shè)備插件,以及內(nèi)置在基礎(chǔ)映像中的 containerd 運(yùn)行時(shí)。

AMI 提供了提供和注冊自我管理節(jié)點(diǎn)的一切, NVIDIA 支持的 GPU 實(shí)例和 Amazon EKS 集群的虛擬操作系統(tǒng)。

此外,您還可以利用 AWS 市場上的 NVIDIA NGC 目錄 中的 NVIDIA 優(yōu)化軟件,這是一個(gè)用于預(yù)訓(xùn)練模型、腳本、掌舵圖以及各種 AI 和 HPC 軟件的中心。

對于 AWS 上的人工智能推理部署,您可以利用 NVIDIA Triton 推理服務(wù)器 。使用開源推理服務(wù)軟件在任何 CPU 或 CPU 基礎(chǔ)設(shè)施上部署來自多個(gè)框架的經(jīng)過培訓(xùn)的人工智能模型,包括 TensorFlow 、 TensorRT 、 PyTorch 、 ONNX 、 XGBoost 和 Python

關(guān)于作者

Uttara Kumar 是 NVIDIA 的高級產(chǎn)品營銷經(jīng)理,專注于 GPU - 云計(jì)算中的人工智能加速應(yīng)用。她非常關(guān)心讓每個(gè)人都能獲得技術(shù)的民主化,讓開發(fā)者能夠利用 NVIDIA 數(shù)據(jù)中心平臺的力量來加快創(chuàng)新步伐。在 NVIDIA 之前,她領(lǐng)導(dǎo)半導(dǎo)體和科學(xué)計(jì)算軟件公司的軟件產(chǎn)品營銷。她擁有安娜堡密歇根大學(xué)的 Eel CTR 工程碩士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11457

    瀏覽量

    212771
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7081

    瀏覽量

    124940
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48691

    瀏覽量

    246426
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南------Docker Desk
    發(fā)表于 04-16 18:30

    MSP430部署

    MSP430可以部署簡單的模型
    發(fā)表于 03-16 19:29

    請問STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?

    STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?
    發(fā)表于 03-13 07:34

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測試,開啟這場充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開發(fā)板基于先進(jìn)的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,在
    發(fā)表于 02-14 17:42

    NeuroBlade攜手亞馬遜EC2 F2實(shí)例,加速數(shù)據(jù)分析

    數(shù)據(jù)分析加速領(lǐng)域的領(lǐng)航者NeuroBlade,近日宣布與亞馬遜云科技(AWS)最新推出的Amazon Elastic Compute Cloud (Amazon EC2) F2實(shí)例實(shí)現(xiàn)
    的頭像 發(fā)表于 12-31 11:37 ?484次閱讀

    亞馬遜云科技發(fā)布Amazon Trainium2實(shí)例

    的發(fā)布,標(biāo)志著亞馬遜云科技在人工智能訓(xùn)練和部署領(lǐng)域邁出了重要一步。 為了滿足用戶對高性能和高性價(jià)比的雙重需求,亞馬遜云科技還推出了Amazon EC2 Trn2 UltraServer
    的頭像 發(fā)表于 12-27 14:57 ?555次閱讀

    企業(yè)AI模型部署攻略

    當(dāng)下,越來越多的企業(yè)開始探索和實(shí)施AI模型,以提升業(yè)務(wù)效率和競爭力。然而,AI模型部署并非易事,需要企業(yè)在多個(gè)層面進(jìn)行細(xì)致的規(guī)劃和準(zhǔn)備。下
    的頭像 發(fā)表于 12-23 10:31 ?720次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    以及邊緣計(jì)算能力的增強(qiáng),越來越多的目標(biāo)檢測應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時(shí)也減輕了云端服務(wù)器的壓力。然而,在邊緣端部署高效且準(zhǔn)確的目標(biāo)檢測模型
    發(fā)表于 12-19 14:33

    Amazon Bedrock推出多個(gè)新模型和全新強(qiáng)大的推理和數(shù)據(jù)處理功能

    亞馬遜云科技助力客戶加速采用生成式AI 模型擴(kuò)展規(guī)模空前,并新增推理優(yōu)化工具及額外的數(shù)據(jù)功能,為客戶提供了更大的靈活性和控制力,更快構(gòu)建和部署生產(chǎn)級生成式AI ?亞馬遜云科技在2024
    的頭像 發(fā)表于 12-07 19:31 ?949次閱讀
    <b class='flag-5'>Amazon</b> Bedrock推出多個(gè)新<b class='flag-5'>模型</b>和全新強(qiáng)大的推理和數(shù)據(jù)處理功能

    亞馬遜云科技宣布Amazon Trainium2實(shí)例正式可用

    亞馬遜云科技推出新一代AI訓(xùn)練芯片Amazon Trainium3 全新Amazon EC2 Trn2實(shí)例采用亞馬遜云科技最新的Traini
    的頭像 發(fā)表于 12-06 09:15 ?478次閱讀
    亞馬遜云科技宣布<b class='flag-5'>Amazon</b> Trainium<b class='flag-5'>2</b>實(shí)例正式可用

    AI模型部署和管理的關(guān)系

    AI模型部署與管理是AI項(xiàng)目成功的兩大支柱,它們之間既相互獨(dú)立又緊密相連,共同推動著AI技術(shù)從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。
    的頭像 發(fā)表于 11-21 10:02 ?593次閱讀

    企業(yè)AI模型部署怎么做

    AI模型部署作為這一轉(zhuǎn)型過程中的關(guān)鍵環(huán)節(jié),其成功實(shí)施對于企業(yè)的長遠(yuǎn)發(fā)展至關(guān)重要。在此,AI部落小編為您介紹企業(yè)AI
    的頭像 發(fā)表于 11-04 10:15 ?696次閱讀

    亞馬遜云科技宣布Amazon EC2 P5e實(shí)例正式可用 由英偉達(dá)H200 GPU提供支持

    1.7倍,GPU內(nèi)存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復(fù)雜的大型語言模型(LLM)和多模態(tài)基礎(chǔ)模型(FM)的訓(xùn)練、微調(diào)和推理,用于支持最苛刻和計(jì)算密集型的生成式
    的頭像 發(fā)表于 09-19 16:16 ?781次閱讀

    亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實(shí)例正式可用

    北京2024年7月15日?/美通社/ -- 亞馬遜云科技宣布基于自研芯片Amazon Graviton4處理器的Amazon Elastic Compute Cloud (Amazon EC2
    的頭像 發(fā)表于 07-15 16:09 ?560次閱讀

    如何在tx2部署模型

    在本文中,我們將詳細(xì)介紹如何在NVIDIA Jetson TX2部署深度學(xué)習(xí)模型。NVIDIA Jetson TX2是一款專為邊緣計(jì)算和人工智能應(yīng)用而設(shè)計(jì)的高性能嵌入式平臺。它具有強(qiáng)
    的頭像 發(fā)表于 07-09 10:16 ?1075次閱讀