开心激情春色,美女老师脱衣服,成在人线AV无码网站网址

NVIDIA TensorRT 8 BERT在1.2毫秒內(nèi)進(jìn)行推斷

NVIDIA 發(fā)布的TensorRT 8.0 ，通過(guò)新的優(yōu)化將 BERT 的大推理延遲降低到 1.2 毫秒。該版本還提供了 2 倍的精度為 INT8 精度與量化意識(shí)的訓(xùn)練，并通過(guò)支持稀疏性，這是引進(jìn)安培 GPU 的顯著更高的性能。

TensorRT 是一個(gè)用于高性能深度學(xué)習(xí)推理的 SDK ，包括推理優(yōu)化器和運(yùn)行時(shí)，提供低延遲和高吞吐量。 TensorRT 用于醫(yī)療、汽車、制造、互聯(lián)網(wǎng)/電信服務(wù)、金融服務(wù)、能源等行業(yè)，下載量近 250 萬(wàn)次。

有幾種新的基于 transformer 模型被用于會(huì)話人工智能。 TensorRT 中的新的廣義優(yōu)化可以加速所有這些模型，將推理時(shí)間減少到 TensorRT 7 的一半。

此版本的亮點(diǎn)包括：

BERT 在 1.2 毫秒內(nèi)進(jìn)行推斷，并進(jìn)行了新的 transformer 優(yōu)化

使用量化感知訓(xùn)練，以 INT8 精度實(shí)現(xiàn)與 FP32 相當(dāng)?shù)臏?zhǔn)確性

引入稀疏性支持對(duì)安培 GPU 的快速推理

關(guān)于作者

About Jay Rodge

Jay Rodge 是 NVIDIA 的產(chǎn)品營(yíng)銷經(jīng)理，負(fù)責(zé)深入學(xué)習(xí)和推理產(chǎn)品，推動(dòng)產(chǎn)品發(fā)布和產(chǎn)品營(yíng)銷計(jì)劃。杰伊在芝加哥伊利諾伊理工學(xué)院獲得計(jì)算機(jī)科學(xué)碩士學(xué)位，主攻計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理。在 NVIDIA 之前，杰伊是寶馬集團(tuán)的人工智能研究實(shí)習(xí)生，為寶馬最大的制造廠使用計(jì)算機(jī)視覺(jué)解決問(wèn)題。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴