手机看片1024黄色网旧片,偷拍上海女人黑人全部内容,绿色小导航你懂得

案例簡(jiǎn)介

本案例通過利用NVIDIA TensorRT-LLM加速指令識(shí)別深度學(xué)習(xí)模型，并借助NVIDIA Triton推理服務(wù)器在NVIDIA V100 GPU上進(jìn)行高效部署，幫助必優(yōu)科技的文檔智能體 UTalk-Doc 將用戶指令識(shí)別服務(wù)吞吐量提升了 5 倍，單個(gè)請(qǐng)求響應(yīng)時(shí)間縮減了三分之一，大幅提升服務(wù)運(yùn)行效率，提升資源利用率。Triton 模型分析能力還協(xié)助必優(yōu)科技，將尋找最佳推理配置所需的時(shí)間從數(shù)周減少到數(shù)小時(shí)。

智能體迭代和

用戶增長(zhǎng)的并發(fā)壓力

必優(yōu)科技旗下 UTalk-Doc 是新一代協(xié)助用戶進(jìn)行表達(dá)的辦公產(chǎn)品。其中“用戶指令識(shí)別”能力是產(chǎn)品組成中十分重要的一環(huán)。目前該能力主要由底層指令識(shí)別深度學(xué)習(xí)模型提供服務(wù)支持。

深度學(xué)習(xí)模型在運(yùn)行過程中需要較大的計(jì)算量，在用 Pytorch 進(jìn)行模型的推理時(shí)，一方面時(shí)延特別大，導(dǎo)致用戶體驗(yàn)受損；另一方面，顯存占用很大，導(dǎo)致推理請(qǐng)求的并發(fā)數(shù)上不去，請(qǐng)求失敗的概率太高，只能通過增加機(jī)器的方式來提高并發(fā)能力，業(yè)務(wù)部署成本較高；再次，使用的模型經(jīng)常變化，而業(yè)務(wù)需要更換后的模型能夠快速地加速和上線部署。NVIDIA GPU 硬件和軟件框架的強(qiáng)大性能幫助企業(yè)解決了海量計(jì)算需求，滿足了必優(yōu)科技多模態(tài) office 智能體的迭代和用戶幾何倍增長(zhǎng)的并發(fā)壓力。

利用 NVIDIA產(chǎn)品技術(shù)組合

提升用戶體驗(yàn)

基于以上挑戰(zhàn)，必優(yōu)科技選擇了采用 NVIDIA 的 TensorRT-LLM SDK 對(duì)模型進(jìn)行推理加速，并利用 NVIDIA Triton推理服務(wù)器在 V100 GPU 上進(jìn)行在線部署，在提升用戶體驗(yàn)的同時(shí)，大幅降低了服務(wù)成本。

通過使用 TensorRT-LLM 對(duì)指令識(shí)別深度學(xué)習(xí)模型進(jìn)行加速，在都使用 FP32 的情況下，與 Pytorch 相對(duì)，時(shí)延降低 50% 左右。

使用 TensorRT-LLM 結(jié)合 NVIDIA V100 GPU 的 FP16 Tensor Core，在保證精度的同時(shí)，模型推理的時(shí)延進(jìn)一步降低了 40%。

Triton 的 dynamic batch 及多實(shí)例特性，在滿足時(shí)延要求的同時(shí)，提高了系統(tǒng)整體的并發(fā)能力。

TensorRT-LLM 可以對(duì)模型進(jìn)行快速地加速，Triton 則可以對(duì)加速后的模型進(jìn)行快速地部署，滿足了業(yè)務(wù)對(duì)修改后的模型進(jìn)行快速部署的需求，同時(shí)也大大減少了工程人員的工作量。

NVIDIA 賦能文檔智能體

在 NVIDIA 技術(shù)和初創(chuàng)加速生態(tài)的加持中，必優(yōu)科技旗下應(yīng)用產(chǎn)品 ChatPPT（UTalk-Doc）在短短幾個(gè)月內(nèi)自然注冊(cè)用戶破 100 萬，同時(shí)通過內(nèi)容表達(dá)場(chǎng)景（如 PPT 演示），賦能了如金融、教育、醫(yī)療等垂直行業(yè)領(lǐng)域客戶，并且在硬件生態(tài)合作等方面也做了更多的探索，共同推進(jìn)整個(gè) AI 行業(yè)的快速發(fā)展。

“NVIDIA 提供的 GPU 解決方案，解決了深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的技術(shù)難題，是我們公司在人工智能道路上一路狂飆所不可或缺的一環(huán)。”必優(yōu)科技創(chuàng)始人兼 CTO 陳潤(rùn)天博士表示。

必優(yōu)科技成立于 2020 年，是國內(nèi)較早期就專注于人工智能領(lǐng)域的智能內(nèi)容生成技術(shù)的科技型公司，公司目前主要圍繞智慧辦公場(chǎng)景做相關(guān)業(yè)務(wù)開發(fā)服務(wù)，如 2023 年 3 月上線的 Chatppt（AI 生成 PPT）6 個(gè)月用戶過百萬；全新下一代產(chǎn)品 UTalk-Doc——不拘泥于格式、自由切換文檔格式的產(chǎn)品，將徹底顛覆、改變和引領(lǐng)下一代 office 產(chǎn)品，幫助用戶更好地進(jìn)行表達(dá)。

NVIDIA 初創(chuàng)加速計(jì)劃

必優(yōu)科技是 NVIDIA 初創(chuàng)加速計(jì)劃 (NVIDIA Inception) 會(huì)員企業(yè)。NVIDIA 初創(chuàng)加速計(jì)劃為免費(fèi)會(huì)員制，旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計(jì)劃聯(lián)合國內(nèi)外知名的風(fēng)投機(jī)構(gòu)，創(chuàng)業(yè)孵化器，創(chuàng)業(yè)加速器，行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等，打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣，技術(shù)支持，市場(chǎng)宣傳，融資對(duì)接，業(yè)務(wù)推薦等一系列服務(wù)，加速創(chuàng)業(yè)公司的發(fā)展。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5246

瀏覽量
105793
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4912

瀏覽量
130681
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5555

瀏覽量
122498

原文標(biāo)題：NVIDIA GPU 解決方案加速必優(yōu)科技新一代文檔智能體

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

評(píng)論