微軟OmniParser V2：大模型轉化為計算機智能體

微軟近日宣布，視覺Agent解析框架OmniParser已發布最新版本V2。這一新版本具有將大型語言模型如OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)以及Anthropic(Sonnet)等，轉化為“計算機使用智能體”(Computer Use Agent)的能力。

與前一版本相比，OmniParser V2在檢測更微小、可交互的元素時展現出了更高的精度和更快的推理速度。這一顯著提升得益于V2采用了更大規模的交互元素檢測數據集和圖標功能描述數據進行訓練。通過這些訓練，OmniParser V2能夠更好地理解和識別計算機界面中的各種元素，從而為用戶提供更加智能、便捷的操作體驗。

此外，OmniParser V2還通過縮小圖標描述模型的輸入圖像尺寸，進一步降低了推理延遲。據微軟透露，與前代版本相比，V2的推理延遲降低了60%，這意味著用戶可以更加迅速地獲得系統的響應和反饋。

微軟OmniParser V2的發布，標志著大型語言模型在計算機使用智能體領域的應用取得了重要進展。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6667

瀏覽量
105345
計算機

計算機

+關注

關注
19

文章
7626

瀏覽量
90112
大模型

大模型

+關注

關注
2

文章
3011

瀏覽量
3790

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot javascript的成熟分類
Hot 光伏逆變器安裝接線步驟

New LMG5126 具有輸出電壓跟蹤功能的 2.5MHz 42V 寬 VIN 同步 GaN 升壓轉換器數據手冊
New TPS54538 3.8V 至 28V、5A、200kHz 至 2.2MHz、同步降壓轉換器數據手冊

精選推薦
更多

文章

資料

帖子

使用寄存器點亮LED燈

瑞薩MCU小百科
9小時前

200 閱讀

解鎖水泵降噪“新密碼”，無刷驅動方案智解難題--【其利天下】

其利天下技術
8小時前

201 閱讀

零極點仿真分析簡介

巨霖
9小時前

173 閱讀

一文詳解干法刻蝕工藝

中科院半導體所
9小時前

284 閱讀

ElfBoard嵌入式教育科普|CAN接口全面解析

ElfBoard
10小時前

196 閱讀

自動控制工程技術工作手冊

緣墨凌
27.3 MB

免費

0下載

鍵盤芯片CH451DS1中文手冊

lanlanw
212 KB

免費

179下載

基于openharmony適配移植的文本裝飾實現教程

姚小熊27
0.10 MB

免費

1下載

用于openharmony和動畫的加載視圖控件

姚小熊27
1.64 MB

免費

4下載

Karmada云原生多云容器編排系統

哈哈哈
19.76 MB

2積分

1下載

搭載OpenHarmony 5.0系統！視美泰M-K1HSE開發板免費試用

ElecFans小喇叭
1天前

149 閱讀

HarmonyOS優化應用文件上傳下載慢問題性能優化三

李洋水蛟龍
1天前

204 閱讀

換能器接收信號異常

hugeforever
1天前

335 閱讀

【米爾-RK3562開發板試用評測】EtherCat移植、編譯

jinyi7016
1天前

163 閱讀

TLV3501輸出有毛刺，有什么辦法減少？

jf_74744425
1天前

449 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

微軟OmniParser V2：大模型轉化為計算機智能體

評論