女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2023-02-03 04:55 ? 次閱讀
前面兩篇文章,已經(jīng)將 Triton 的“無狀態(tài)模型”、“有狀態(tài)模型”與標(biāo)準(zhǔn)調(diào)度器的動(dòng)態(tài)批量處理器與序列批量處理器的使用方式,做了較完整的說明。 大部分的實(shí)際應(yīng)用都不是單純的推理模型就能完成服務(wù)的需求,需要形成前后關(guān)系的工作流水線。例如一個(gè)二維碼掃描的應(yīng)用,除了需要第一關(guān)的二維碼識(shí)別模型之外,后面可能還得將識(shí)別出來的字符傳遞給語(yǔ)句識(shí)別的推理模型、關(guān)鍵字搜索引擎等功能,最后找到用戶所需要的信息,反饋給提出需求的用戶端。 本文的內(nèi)容要說明 Triton 服務(wù)器形成工作流水線的“集成推理”功能,里面包括“集成模型(ensemble model)”“集成調(diào)度器(ensemble scheduler)”兩個(gè)部分。下面是個(gè)簡(jiǎn)單的推理流水線示意圖,目的是對(duì)請(qǐng)求的輸入圖像最終反饋“圖像分類”與“語(yǔ)義分割”兩個(gè)推理結(jié)果: 6bce43b4-a33b-11ed-bfe3-dac502259ad0.png 當(dāng)接收到集成模型的推斷請(qǐng)求時(shí),集成調(diào)度器將:
  1. 確認(rèn)請(qǐng)求中的“IMAGE”張量映射到預(yù)處理模型中的輸入“RAW_IMAGE”。
  2. 檢查集合中的模型,并向預(yù)處理模型發(fā)送內(nèi)部請(qǐng)求,因?yàn)樗璧乃休斎霃埩慷家丫途w。
  3. 識(shí)別內(nèi)部請(qǐng)求的完成,收集輸出張量并將內(nèi)容映射到“預(yù)處理圖像”,這是集成中已知的唯一名稱。
  4. 將新收集的張量映射到集合中模型的輸入。在這種情況下,“classification_model”和“segmentation_model”的輸入將被映射并標(biāo)記為就緒。
  5. 檢查需要新收集的張量的模型,并向輸入就緒的模型發(fā)送內(nèi)部請(qǐng)求,在本例中是分類模型和分割模型。請(qǐng)注意,響應(yīng)將根據(jù)各個(gè)模型的負(fù)載和計(jì)算時(shí)間以任意順序排列。
  6. 重復(fù)步驟 3-5,直到不再發(fā)送內(nèi)部請(qǐng)求,然后用集成輸出名稱的張量去響應(yīng)推理請(qǐng)求。
整個(gè)流水線使用 3 個(gè)模型,并進(jìn)行以下三個(gè)處理步驟:
  1. 使用 image_prepoecess_model 模型,將原始圖像處理成preprocessed_image 數(shù)據(jù);
  2. 將 preprocessed_image 數(shù)據(jù)傳遞給 classification_model 模型,執(zhí)行圖像分類推理,最終返回“CLASSIFICATION”結(jié)果;
  3. 將 preprocessed_image 數(shù)據(jù)傳遞給 segmentation_model 模型,執(zhí)行語(yǔ)義分割推理計(jì)算,最終返回“SEGMENTATION”結(jié)果;
在執(zhí)行過程中,推理服務(wù)器必須支持以下的功能,才能將多種推理模型集成一個(gè)或多個(gè)工作流水線,去執(zhí)行完整的工作流程:
  • 支持一個(gè)或多個(gè)模型的流水線以及這些模型之間輸入和輸出張量的連接;
  • 處理多個(gè)模型的模型拼接或數(shù)據(jù)流,例如“數(shù)據(jù)處理->推理->數(shù)據(jù)后處理”等;
  • 收集每個(gè)步驟中的輸出張量,并根據(jù)規(guī)范將其作為其他步驟的輸入張量;
  • 所集成的模型能繼承所涉及模型的特征,在請(qǐng)求方的元數(shù)據(jù)必須符合集成中的模型;
為了實(shí)現(xiàn)的推理流水線功能,Triton 服務(wù)器使用集成模型與集成調(diào)度器的配合,來完成這類工作流水線的搭建管理。接著就執(zhí)行以下步驟來創(chuàng)建一個(gè)流水線所需要的配套內(nèi)容:
  1. 在模型倉(cāng)里為流水線創(chuàng)建一個(gè)新的“組合模型”文件夾,例如為“ensemble_model”;
  2. 在目路下創(chuàng)建新的 config.pbtxt,并且使用“platform: "ensemble"”來定義這個(gè)模型要執(zhí)行集成功能;
  3. 定義集成模型:
無論工作流水線中調(diào)用多少個(gè)模型,Triton 服務(wù)器都將這樣的組合視為一個(gè)模型,與其他模型配置一樣,需要定義輸入與輸出節(jié)點(diǎn)的張量類型與尺度。 以上面示例圖中的要求,這個(gè)集成模型有一個(gè)名為“IMAGE”的輸入節(jié),與兩個(gè)名為“CLASSIFICATION”“SEGMENTATION”的輸出節(jié)點(diǎn),至于數(shù)據(jù)類型與張量維度內(nèi)容,就得根據(jù)實(shí)際使用的模型去匹配。這部分配置的參考內(nèi)容如下:
name:"ensemble_model"
platform: "ensemble"
max_batch_size: 1
input [
  {
    name: "IMAGE"
    data_type: TYPE_STRING
    dims: [ 1 ]
  }
]
output [
  {
    name: "CLASSIFICATION"
    data_type: TYPE_FP32
    dims: [ 1000 ]
  },
  {
    name: "SEGMENTATION"
    data_type: TYPE_FP32
    dims: [ 3, 224, 224 ]
  }
]
從這個(gè)內(nèi)容中可以看出,Triton 服務(wù)器將這個(gè)集成模型視為一個(gè)獨(dú)立模型。 4. 定義模型的集成調(diào)度器:這部分使用“ensemble_scheduling”來調(diào)動(dòng)集成調(diào)度器,將使用到模型與數(shù)據(jù)形成完整的交互關(guān)系。 在上面示例圖中,灰色區(qū)塊所形成的工作流水線中,使用到 image_prepoecess_modelclassification_modelsegmentation_model 三個(gè)模型,以及 preprocessed_image 數(shù)據(jù)在模型中進(jìn)行傳遞。 下面提供這部分的范例配置內(nèi)容,一開始使用“ensemble_scheduling”來調(diào)用集成調(diào)度器,里面再用“step”來定義模組之間的執(zhí)行關(guān)系,透過模型的“input_map”“output_map”“key:value”對(duì)的方式,串聯(lián)起模型之間的交互動(dòng)作:
ensemble_scheduling{
  step [
    {
      model_name: "image_preprocess_model"
      model_version: -1
      input_map {
        key: "RAW_IMAGE"
        value: "IMAGE"
      }
      output_map {
        key: "PREPROCESSED_OUTPUT"
        value: "preprocessed_image"
      }
    },
    {
      model_name: "classification_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "CLASSIFICATION_OUTPUT"
        value: "CLASSIFICATION"
      }
    },
    {
      model_name: "segmentation_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "SEGMENTATION_OUTPUT"
        value: "SEGMENTATION"
      }
    }
  ]
}
這里簡(jiǎn)單說明一下工作流程: (1) 模型 image_preprocess_model 接收外部輸入的 IMAGE 數(shù)據(jù),進(jìn)行圖像預(yù)處理任務(wù),輸出 preprocessed_image 數(shù)據(jù);(2) 模型 classification_model 的輸入為 preprocessed_image,表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù),執(zhí)行的推理輸出為 CLASSIFICATION;(3) 模型 segmentation_model 的輸入為 preprocessed_image,表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù),執(zhí)行的退輸出為 SEGMENTATION;(4) 上面兩步驟可以看出 classification_model 與 segmentation_model 屬于分支的同級(jí)模型,與上面工作流圖中的要求一致。 完成以上的步驟,就能用集成模型與集成調(diào)度器的搭配,來創(chuàng)建一個(gè)完整的推理工作流任務(wù),相當(dāng)簡(jiǎn)單。 不過這類集成模型中,還有以下幾個(gè)需要注意的重點(diǎn):
  • 這是 Triton 服務(wù)器用來執(zhí)行用戶定義模型流水線的抽象形式,由于沒有與集成模型關(guān)聯(lián)的物理實(shí)例,因此不能為其指定 instance_group 字段;
  • 不過集成模型內(nèi)容所組成的個(gè)別模型(例如image_preprocess_model),可以在其配置文件中指定 instance_group,并在集成接收到多個(gè)請(qǐng)求時(shí)單獨(dú)支持并行執(zhí)行。
  • 由于集成模型將繼承所涉及模型的特性,因此在請(qǐng)求起點(diǎn)的元數(shù)據(jù)(本例為“IMAGE”)必須符合集成中的模型,如果其中一個(gè)模型是有狀態(tài)模型,那么集成模型的推理請(qǐng)求應(yīng)該包含有狀態(tài)模型中提到的信息,這些信息將由調(diào)度器提供給有狀態(tài)模型。
總的來說,Triton 服務(wù)器提供的集成功能還是相對(duì)容易理解與操作的,只要大家留意模型之間所傳遞的數(shù)據(jù)張量格式與尺度,就能輕松搭建起這樣的推理工作流,去面對(duì)實(shí)際環(huán)境中更多變的使用需求。


原文標(biāo)題:NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3922

    瀏覽量

    93135

原文標(biāo)題:NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測(cè)報(bào)告

    近日,阿里巴巴通義千問團(tuán)隊(duì)正式推出新一代開源大語(yǔ)言模型——Qwen3 系列,該系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合
    的頭像 發(fā)表于 05-09 15:05 ?646次閱讀
    <b class='flag-5'>NVIDIA</b> RTX 5880 Ada與Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>實(shí)測(cè)報(bào)告

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開源的混合推理大語(yǔ)言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源模型系列包含兩款混合專家
    的頭像 發(fā)表于 05-08 11:45 ?793次閱讀
    <b class='flag-5'>NVIDIA</b>使用Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>的最佳實(shí)踐

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫(kù)加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千
    的頭像 發(fā)表于 03-20 15:03 ?548次閱讀

    NVIDIA推出開放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺語(yǔ)言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。
    的頭像 發(fā)表于 01-09 11:11 ?640次閱讀

    Triton編譯與GPU編程的結(jié)合應(yīng)用

    Triton編譯簡(jiǎn)介 Triton編譯是一種針對(duì)并行計(jì)算優(yōu)化的編譯,它能夠自動(dòng)將高級(jí)語(yǔ)言代碼轉(zhuǎn)換為針對(duì)特定硬件優(yōu)化的低級(jí)代碼。
    的頭像 發(fā)表于 12-25 09:13 ?742次閱讀

    Triton編譯如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯扮演著至關(guān)重要的角色。它們不僅將高級(jí)語(yǔ)言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行的代碼,還通過各種優(yōu)化技術(shù)提升程序的性能。Triton 編譯作為一種先進(jìn)的編譯,通過多種方式提升
    的頭像 發(fā)表于 12-25 09:12 ?686次閱讀

    Triton編譯的優(yōu)化技巧

    在現(xiàn)代計(jì)算環(huán)境中,編譯的性能對(duì)于軟件的運(yùn)行效率至關(guān)重要。Triton 編譯作為一個(gè)先進(jìn)的編譯框架,提供了一系列的優(yōu)化技術(shù),以確保生成的
    的頭像 發(fā)表于 12-25 09:09 ?804次閱讀

    Triton編譯的優(yōu)勢(shì)與劣勢(shì)分析

    Triton編譯作為一種新興的深度學(xué)習(xí)編譯,具有一系列顯著的優(yōu)勢(shì),同時(shí)也存在一些潛在的劣勢(shì)。以下是對(duì)Triton編譯
    的頭像 發(fā)表于 12-25 09:07 ?1043次閱讀

    Triton編譯在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯概述 Triton編譯NVIDIA Triton推理服務(wù)平臺(tái)的一部分
    的頭像 發(fā)表于 12-24 18:13 ?882次閱讀

    Triton編譯的常見問題解決方案

    Triton編譯作為一款專注于深度學(xué)習(xí)的高性能GPU編程工具,在使用過程中可能會(huì)遇到一些常見問題。以下是一些常見問題的解決方案: 一、安裝與依賴問題 檢查Python版本 Triton編譯
    的頭像 發(fā)表于 12-24 18:04 ?2570次閱讀

    Triton編譯支持的編程語(yǔ)言

    Triton編譯支持的編程語(yǔ)言主要包括以下幾種: 一、主要編程語(yǔ)言 Python :Triton編譯通過Python接口提供了對(duì)Triton
    的頭像 發(fā)表于 12-24 17:33 ?874次閱讀

    Triton編譯與其他編譯的比較

    Triton編譯與其他編譯的比較主要體現(xiàn)在以下幾個(gè)方面: 一、定位與目標(biāo) Triton編譯 : 定位:專注于深度學(xué)習(xí)中最核心、最耗時(shí)的
    的頭像 發(fā)表于 12-24 17:25 ?893次閱讀

    Triton編譯功能介紹 Triton編譯器使用教程

    Triton 是一個(gè)開源的編譯前端,它支持多種編程語(yǔ)言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯框架,允許開發(fā)者添加新的編程語(yǔ)言
    的頭像 發(fā)表于 12-24 17:23 ?1509次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)
    的頭像 發(fā)表于 09-09 09:19 ?847次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)
    的頭像 發(fā)表于 09-06 14:59 ?621次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B<b class='flag-5'>模型</b>幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)