女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

英特爾物聯網 ? 來源:OpenVINO 中文社區 ? 2024-05-10 10:36 ? 次閱讀

大語言模型推理的改進

LLM 的發展仍保持著驚人的速度。盡管現有的 LLM 已經具備強大的功能,但通過 OpenVINO 的優化和推理加速,可以對這些復雜模型的執行進行精煉,實現更快、更高效的處理,減少計算開銷并最大限度發揮硬件潛力,這將直接導致 LLM 實現更高的吞吐量和更低的延遲。

通過采用壓縮嵌入實現額外優化,有效地縮減了 LLM 的編譯耗時與內存占用。與此同時,基于英特爾銳炫GPU,以及英特爾高級矩陣擴展(Intel AMX)的第4代和第5代英特爾至強平臺之上,LLM 的第一個 token 處理性能得到了顯著提升。

通過 oneDNN 可實現更好的 LLM 壓縮與性能提升。如今,經過量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上,針對部分小型 GenAI 模型顯著減少了內存消耗。

此外,現在可以在 PyTorch 模型進行訓練后量化之后,對其進行微調,以提高模型精度并簡化從訓練后量化過渡到訓練感知量化的過程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進一步深入了解搭載 OpenVINO 的生成式 AI,該新版本拓寬了生成式AI的邊界,使其能夠覆蓋更廣泛的神經網絡架構與應用場景。

針對最新發布的最先進的 Llama 3 和 Phi3 模型, OpenVINO 對其實現了支持和優化。

具備混合專家(MoE)架構的 LLM 模型 Mixtral 以及 URLNet 模型,均針對英特爾至強處理器進行了性能提升優化。

文生圖模型 Stable Diffusion 1.5以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,則專為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進行了推理速度的改進和優化。

現在,OpenVINO 已支持 Falcon-7B-Instruct,這是一款即用型、具備優秀性能指標的生成式AI大語言模型,適用于聊天與指令場景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統。

我們還在 OpenVINO Notebooks 存儲庫中提供了 Jupyter Notebook 示例。

新平臺的更改和現有平臺的增強

除了 PyPI 上的主 OpenVINO 軟件包外,英特爾酷睿Ultra 處理器的預覽 NPU 插件現在在 OpenVINO 開源 GitHub 存儲庫中可用。

現在,可以通過 npm 存儲庫更輕松地訪問 JavaScript API,使 JavaScript 開發人員能夠無縫訪問 OpenVINO API。我們擴展了文檔,可幫助開發人員將他們的 JavaScript 應用程序與 OpenVINO 集成。

現在,默認情況下已在 ARM 處理器上為卷積神經網絡(CNN)啟用 FP16 推理。在多種 ARM 設備上,已顯著提升了眾多模型的性能。已實現與 CPU 架構無關的構建,旨在為不同 ARM 設備提供統一的二進制分發。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價值的資源,用于展示如何利用 OpenVINO 在人工智能領域實現重要進展。最近,我們對 OpenVINO notebooks 存儲庫做了一些改動,包括將默認分支從 'main' 更改為 'latest',以及對 "notebooks" 文件夾內 notebook 的命名結構進行了改進



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GPU芯片
    +關注

    關注

    1

    文章

    305

    瀏覽量

    6120
  • 生成式AI
    +關注

    關注

    0

    文章

    525

    瀏覽量

    704
  • OpenVINO
    +關注

    關注

    0

    文章

    113

    瀏覽量

    413

原文標題:解鎖 LLM 新高度,拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運行 | 開發者實戰

文章出處:【微信號:英特爾物聯網,微信公眾號:英特爾物聯網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    2.5MW全球首發,綠慧充引領行業新高度

    ,它以雙兆瓦級系統架構與全場景兼容能力,革新大功率充電技術標準,引領行業新高度。01智能投切全場景功率適配產品單機功率達2.5MW,通過智能投切技術動態分配功率,
    的頭像 發表于 04-25 12:18 ?212次閱讀
    2.5MW全球首發,綠<b class='flag-5'>能</b>慧充引領行業<b class='flag-5'>新高度</b>!

    陶瓷圍壩:解鎖電子封裝領域防護新高度的關鍵

    電子封裝技術作為電子產業發展的基石,其防護性能直接關乎電子設備的可靠性與穩定性。陶瓷圍壩憑借其獨特的材料特性和結構優勢,在電子封裝防護領域嶄露頭角,成為解鎖防護新高度的關鍵要素。本文深入剖析陶瓷圍壩在電子封裝中的作用、優勢及發展趨勢,旨在揭示其對電子封裝領域的重要意義……
    的頭像 發表于 03-24 17:10 ?164次閱讀

    利用OpenVINO GenAI解鎖LLM極速推理

    隨著 DeepSeek、 GPT 和 Llama 等大語言模型(LLMs)不斷推動人工智能的邊界,它們在高效部署方面也帶來了重大挑戰。這些模型在生成類似人類的文本方面具有革命性,但每生成一個
    的頭像 發表于 03-18 14:09 ?531次閱讀
    利用<b class='flag-5'>OpenVINO</b> GenAI<b class='flag-5'>解鎖</b><b class='flag-5'>LLM</b>極速推理

    富士通如何解鎖生成AI紅利 從人才進化到業務

    生成AI技術正以每周迭代一次的速度重塑商業世界。利用生成AI,營銷部門10分鐘就可以產出百張
    的頭像 發表于 02-25 17:32 ?733次閱讀

    C#集成OpenVINO?:簡化AI模型部署

    在開源測控、機器視覺、數采與分析三大領域中,如何快速將AI模型集成到應用程序中, 實現AI和應用增值? 最容易的方式是:在C#中,使用 Open
    的頭像 發表于 02-17 10:03 ?1823次閱讀
    C#集成<b class='flag-5'>OpenVINO</b>?:簡化<b class='flag-5'>AI</b>模型部署

    古河云接入DeepSeek!AI,智能化應用場景再升級

    AI能力接入,古河云將其領先的智能算法與數據分析能力融入“開河”平臺,進一步提升平臺的技術深度與應用價值,致力于為企業提供更精準、更高效的 智能化管理服務 。 應用場景升級 AI
    的頭像 發表于 02-14 17:21 ?401次閱讀
    古河云接入DeepSeek!<b class='flag-5'>AI</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>,智能化應用場景再升級

    C#中使用OpenVINO?:輕松集成AI模型!

    與分析三大領域中,如何快速將AI模型集成到應用程序中,實現AI和應用增值?最容易的方式是:在C#中,使用OpenVINO?工具套件集成
    的頭像 發表于 02-07 14:05 ?719次閱讀
    C#中使用<b class='flag-5'>OpenVINO</b>?:輕松集成<b class='flag-5'>AI</b>模型!

    解鎖光伏發電新高度:探秘 400V 轉 660V 升壓變壓器核心力量

    解鎖光伏發電新高度:探秘 400V 轉 660V 升壓變壓器核心力量 在追求綠色能源變革的征程中,光伏發電已然成為耀眼的明星,而 400V 轉 660V 升壓變壓器則是隱藏在幕后、默默發力的關鍵
    的頭像 發表于 12-27 10:27 ?391次閱讀
    <b class='flag-5'>解鎖</b>光伏發電<b class='flag-5'>新高度</b>:探秘 400V 轉 660V 升壓變壓器核心力量

    解鎖光伏發電新高度:探秘400V轉660V升壓變壓器核心力量

    解鎖光伏發電新高度:探秘400V轉660V升壓變壓器核心力量 光伏發電作為綠色能源的重要組成部分,在全球能源結構中扮演著越來越重要的角色。400V轉660V升壓變壓器,作為光伏發電系統中的關鍵設備
    的頭像 發表于 12-13 13:51 ?395次閱讀
    <b class='flag-5'>解鎖</b>光伏發電<b class='flag-5'>新高度</b>:探秘400V轉660V升壓變壓器核心力量

    三行代碼完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個安裝包分別是基礎包與生成AI支持包,新發布的Ge
    的頭像 發表于 08-30 16:49 ?674次閱讀
    三行代碼完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

    高通第三代驍龍7s移動平臺發布,中端智能手機以卓越AI新體驗

    AI技術,并兼容包括Baichuan-7B及擁有10億參數的Llama 2在內的大型語言模型(LLM),極大地推動了智能手機智能化進程的新高度
    的頭像 發表于 08-21 15:42 ?2852次閱讀

    亞馬遜云科技Shulex打造基于生成AI的客服和消費者洞察

    "Shulex")在亞馬遜云科技的技術下,打造基于生成AI的"AI Agent客服機器人"
    的頭像 發表于 08-13 20:38 ?501次閱讀

    使用OpenVINO GenAI API的輕量級生成AI

    隨著 ChatGPT 等聊天機器人的風暴席卷全球,生成預訓練 Transformers (GPT) 在開發者中正在成為家喻戶曉的新名字。生成 A
    的頭像 發表于 07-24 15:08 ?1036次閱讀

    商湯發布《2024生成AI教育未來》白皮書

    生成AI正在各個行業中展現出巨大的應用前景。在關系國計民生的教育行業,生成AI能夠催生哪些創
    的頭像 發表于 06-29 09:48 ?1313次閱讀

    亞馬遜云科技攜手SAP通過生成AI解鎖創新潛力

    科技與SAP宣布擴大戰略合作,旨在革新現代化的云ERP體驗,并利用生成AI為企業帶來全新功能與效率提升。雙方將共同努力,簡化客戶在亞馬遜云科技上采用RISE with SAP解決方案的流程,提高SAP工作負載在云端
    的頭像 發表于 06-07 10:53 ?559次閱讀