女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AppAgent讓移動App應(yīng)用測試更輕松

vliwulianw ? 來源:軟件質(zhì)量報道 ? 2023-12-26 10:26 ? 次閱讀

AppAgent 的創(chuàng)新技術(shù)值得我們測試人員的關(guān)注。

最近大語言模型(LLMs)的進(jìn)展導(dǎo)致了智能代理(Agent)的創(chuàng)建,這些代理能夠執(zhí)行復(fù)雜的任務(wù)。而由騰訊團隊開發(fā)的AppAgent, 其智能代理能力可以用于操作任何 App,它在 50 個復(fù)雜手機任務(wù)上展示了強大的能力。

這項技術(shù)通過引入一種基于大型語言模型(LLMs)的多模態(tài)智能代理(Agent)框架,賦予了智能體操作智能手機應(yīng)用的能力。與傳統(tǒng)的智能助手如 Siri 不同,AppAgent 不依賴于系統(tǒng)后端訪問,而是通過簡化的操作空間來操作智能手機應(yīng)用程序,可以模擬人類的點擊和滑動等操作,直接與手機應(yīng)用的圖形用戶界面(GUI)互動。這種獨特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應(yīng)應(yīng)用界面的變化和更新,從而擴大了它在各種應(yīng)用程序中的適用性。

AppAgent 的核心在于其創(chuàng)新的學(xué)習(xí)方式,智能體可以通過自主探索或觀察人類演示來學(xué)習(xí)如何導(dǎo)航和使用新應(yīng)用。在自主探索過程中,。這個過程還可以通過觀察少數(shù)幾個人類演示來加速,使智能體能夠更快地理解復(fù)雜功能。

AppAgent分為兩個階段,分別稱為探索階段和部署階段。在自主探索階段,AppAgent智能體通過一系列預(yù)定義的動作與應(yīng)用互動,觀察不同應(yīng)用程序的用戶界面交互(每個動作帶來的界面變化),AppAgent與智能手機應(yīng)用程序進(jìn)行交互,并從結(jié)果中學(xué)習(xí),所學(xué)到的知識被精心編制成文件(構(gòu)建知識庫)。一旦這個學(xué)習(xí)階段完成,AppAgent變得擅長使用應(yīng)用程序,就準(zhǔn)備好行動了,即在探索階段之后的部署階段,AppAgent利用編制在此文檔中的信息來高效地操作和導(dǎo)航應(yīng)用程序,完成不同應(yīng)用程序中的各種復(fù)雜任務(wù)。

ab92392a-a217-11ee-8b88-92fbcf53809c.png

(圖1 框架的兩階段方法:探索階段和部署階段)

為了驗證其實用性,研究團隊對 AppAgent 進(jìn)行了廣泛測試,覆蓋了社交媒體、電子郵件、地圖、購物以及復(fù)雜的圖像編輯工具等 10 種不同的應(yīng)用中的 50 個任務(wù)。測試結(jié)果證明,AppAgent 在處理各種高級任務(wù)方面表現(xiàn)出色,顯示出其適應(yīng)性、用戶友好性以及高效的學(xué)習(xí)和操作能力。

1.實驗環(huán)境

實驗環(huán)境建立在Android操作系統(tǒng)的命令行界面(CLI)上,允許AppAgent與智能手機應(yīng)用程序進(jìn)行交互。代理接收兩個關(guān)鍵輸入:顯示應(yīng)用程序界面的實時截圖和詳細(xì)的交互元素的XML文件。為了增強AppAgent識別和無縫交互這些元素的能力,我們?yōu)槊總€元素分配了一個唯一的標(biāo)識符。這些標(biāo)識符要么來自XML文件中的資源ID(如果提供),要么是通過組合元素的類名、大小和內(nèi)容構(gòu)建而成。這些元素以半透明的數(shù)字疊加在截圖上。這有助于AppAgent在不需要指定屏幕上精確位置的情況下準(zhǔn)確交互,并增強了AppAgent在控制手機時的精度。

行動空間:AppAgent的行動空間反映了人們在智能手機上的常見交互方式:輕觸和滑動,設(shè)計了四種基本功能,并用到Android的兩個系統(tǒng)級的操作:

Tap(element : int):這個函數(shù)模擬對屏幕上標(biāo)有數(shù)字的UI元素進(jìn)行輕觸。例如,tap(5)將點擊標(biāo)有“5”的元素。

Long_press(element : int):這個函數(shù)模擬對UI元素進(jìn)行長按(1秒)。

Swipe(element : int, direction : str, dist : str):在指定方向(上、下、左、右)和距離(短、中、長)上滑動一個元素。例如,swipe(21, "up", "medium")將在元素“21”上向上滑動一段中等距離。

Text(text : str):為了繞過低效的虛擬鍵盤輸入,這個函數(shù)在虛擬鍵盤可見時直接將文本輸入到輸入框中。例如,text("Hello, world!")輸入字符串“Hello, world!”。

Back():系統(tǒng)級功能,幫助代理返回到前一個UI頁面,特別適用于退出不相關(guān)頁面。

Exit():特地的函數(shù)用于結(jié)束進(jìn)程,通常在成功完成任務(wù)時調(diào)用。

這些預(yù)定義的動作旨在簡化AppAgent的交互,特別是通過消除對精確屏幕坐標(biāo)的需求,這對于大語言模型(LLM)準(zhǔn)確預(yù)測來說可能會帶來挑戰(zhàn)。

2. 探索階段

探索階段是這個框架的核心。

在此階段,AppAgent被分配一個任務(wù),并開始自主與UI元素進(jìn)行交互,通過試錯學(xué)習(xí)智能手機應(yīng)用程序的功能和特性

AppAgent使用不同的動作,并觀察應(yīng)用界面的變化,以了解其工作原理。由LLM驅(qū)動的AppAgent試圖通過分析每個動作之前和之后的截圖來弄清楚UI元素的功能和特定動作的影響。這些信息被編制成一個記錄了對不同元素應(yīng)用的動作效果的文檔。

當(dāng)一個UI元素被多次操作時,AppAgent將根據(jù)過去的文檔和當(dāng)前觀察更新文檔以提高質(zhì)量。為了使探索更加高效,如果當(dāng)前UI頁面似乎與應(yīng)用的主要任務(wù)無關(guān),如廣告頁面,AppAgent將停止進(jìn)一步探索UI元素。在這種情況下,它使用Android系統(tǒng)的Back()函數(shù)返回到前一個UI頁面。

與隨機探索(如深度優(yōu)先搜索和廣度優(yōu)先搜索)相比,這種目標(biāo)導(dǎo)向的探索方法確保代理專注于對應(yīng)用程序有效操作至關(guān)重要的元素。AppAgent還利用LLM對用戶界面的現(xiàn)有知識來提高探索效率。當(dāng)AppAgent完成分配的任務(wù)時,探索停止。

通過觀看演示進(jìn)行探索。另一種常見且通常更有效的探索方法涉及AppAgent觀察人類示范。這些演示為代理提供了高效使用應(yīng)用程序的示例,特別是對于理解可能通過自主交互難以發(fā)現(xiàn)的復(fù)雜功能。在這種方法中,一個人類用戶操作應(yīng)用程序,而AppAgent觀察并記錄人類使用的元素和動作。這種策略縮小了探索空間,防止代理與無關(guān)的應(yīng)用頁面進(jìn)行交互,使其與自主交互相比成為更加簡化和高效的方法。

3. 部署階段

在探索階段之后,代理已經(jīng)具備了執(zhí)行復(fù)雜任務(wù)的能力,這是基于其積累的經(jīng)驗。當(dāng)給定任務(wù)時,代理遵循一種逐步的方法,每一步都包括對當(dāng)前UI截圖的訪問和動態(tài)生成的文檔,詳細(xì)說明了UI元素的功能以及動作對當(dāng)前UI頁面的影響。提示還提供了所有可用動作的詳細(xì)解釋。

在每一步中,代理首先被要求提供對當(dāng)前UI的觀察,然后闡述其對任務(wù)和當(dāng)前觀察的思考過程。隨后,代理開始執(zhí)行動作,調(diào)用可用的函數(shù)。在每個動作之后,代理總結(jié)了交互歷史和當(dāng)前步驟中所采取的動作。這些信息被納入下一個提示中,為代理提供了一種記憶形式。這種細(xì)致的方法增強了代理行動的可靠性和可解釋性,從而促進(jìn)了更明智的決策制定。當(dāng)代理確定任務(wù)已經(jīng)完成時,部署階段停止,此時它可以通過執(zhí)行Exit()動作退出流程。

aefef242-a217-11ee-8b88-92fbcf53809c.gif









審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GUI
    GUI
    +關(guān)注

    關(guān)注

    3

    文章

    676

    瀏覽量

    40748
  • XML技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    6102
  • CLI
    CLI
    +關(guān)注

    關(guān)注

    1

    文章

    80

    瀏覽量

    8729

原文標(biāo)題:震撼:AppAgent讓移動App應(yīng)用測試更輕松

文章出處:【微信號:軟件質(zhì)量報道,微信公眾號:軟件質(zhì)量報道】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    【HarmonyOS 5】App Linking 應(yīng)用間跳轉(zhuǎn)詳解

    ![](<> \"點擊并拖拽以移動\")? 如何開發(fā) 開發(fā)前注意事項:使用 App Linking 需使用手動生成簽名,自動簽名將無法啟動應(yīng)用。 1.開通 App
    發(fā)表于 05-16 16:24

    APP自動化測試框架

    APP自動化測試框架是一套結(jié)合工具鏈、設(shè)計模式和技術(shù)規(guī)范的集成解決方案。以下是基于主流技術(shù)實踐的核心要點總結(jié): 一、核心模塊構(gòu)成 環(huán)境管理? 支持物理機/虛擬機/容器化部署,集成ADB、Appium
    的頭像 發(fā)表于 05-07 07:35 ?69次閱讀
    <b class='flag-5'>APP</b>自動化<b class='flag-5'>測試</b>框架

    秒驗:重構(gòu)APP用戶體驗與運營效率

    秒驗:重構(gòu)APP用戶體驗與運營效率 在移動互聯(lián)網(wǎng)競爭日益激烈的今天,APP用戶對便捷性和安全性的需求持續(xù)升級。傳統(tǒng)短信驗證碼的“輸入-等待-驗證”流程,因延遲、操作繁瑣等問題,已成為用戶流失的重要
    的頭像 發(fā)表于 02-28 10:40 ?277次閱讀

    聲智APP暢享多元模型體驗

    重點并生成思維導(dǎo)圖。 ——這不是科幻電影,而是聲智APP用戶正在經(jīng)歷的真實日常 ,它就像一個時刻待命的 “AI 超腦”,為用戶的生活、工作和學(xué)習(xí)排憂解難,每一個復(fù)雜任務(wù)都變得輕松簡單。 聲智
    的頭像 發(fā)表于 02-22 14:09 ?565次閱讀

    App發(fā)布前完整測試的重要性:從Sonos的失敗中汲取教訓(xùn)

    在當(dāng)今數(shù)字化時代,App 已成為企業(yè)與用戶溝通的關(guān)鍵橋梁,其質(zhì)量直接關(guān)乎企業(yè)的聲譽與命運。Sonos 公司的 App 更新失敗事件,堪稱一場災(zāi)難性的警示,淋漓盡致地展現(xiàn)了 App 發(fā)布前進(jìn)行完整
    的頭像 發(fā)表于 01-16 09:12 ?389次閱讀

    LambdaTest發(fā)布新一代SmartUI,重塑可視化測試體驗

    升級,旨在徹底改變傳統(tǒng)的可視化測試工作流程,測試過程變得更加無縫、直觀且高效。通過引入一系列創(chuàng)新功能和優(yōu)化界面設(shè)計,LambdaTest的新一代SmartUI為用戶提供了一個更加簡潔明了的操作環(huán)境,使得
    的頭像 發(fā)表于 01-02 13:56 ?424次閱讀

    “兼具”性能與成本,INDEMIND新一代視覺方案機器人落地更輕松!

    機器人開發(fā)更快速,落地更穩(wěn)健。
    的頭像 發(fā)表于 12-06 14:46 ?386次閱讀
    “兼具”性能與成本,INDEMIND新一代視覺方案<b class='flag-5'>讓</b>機器人落地<b class='flag-5'>更輕松</b>!

    基于瑞薩FPB-RA4E2智能床頭燈項目——4 APP制作

    App Inventor是一款由Google開發(fā)的在線移動應(yīng)用開發(fā)平臺,主要用于開發(fā)Android應(yīng)用程序。它通過可視化編程方式,允許用戶使用拖放和連接編程塊來創(chuàng)建應(yīng)用程序,無需編寫復(fù)雜代碼。App
    發(fā)表于 11-29 22:38

    谷歌Pixel Recorder應(yīng)用用戶參與度顯著提升

    Google Pixel 的 Recorder 應(yīng)用允許用戶錄制、轉(zhuǎn)錄、保存和共享音頻。為了用戶更輕松地管理和回顧自己的錄音,Recorder 的開發(fā)者將目光鎖定在功能強大的設(shè)備端大語言模型
    的頭像 發(fā)表于 11-15 13:46 ?602次閱讀

    移動終端測試儀的技術(shù)原理和應(yīng)用場景

    不同的實際環(huán)境中進(jìn)行現(xiàn)場測試,評估手機的性能表現(xiàn)。 教學(xué)和培訓(xùn):在電子通信相關(guān)的教學(xué)和培訓(xùn)中,便攜綜測儀可以學(xué)生更直觀地了解手機的性能測試過程。 移動終端
    發(fā)表于 11-04 16:01

    Python常用函數(shù)大全

    在 Python 世界里,有一些寶藏函數(shù)和模塊,它們可以你編程更輕松、代碼更高效。這篇文章將帶你一一認(rèn)識這些神器,你的開發(fā)生活瞬間輕松不少!
    的頭像 發(fā)表于 10-27 17:20 ?796次閱讀

    移動電源的測試方法與測試標(biāo)準(zhǔn)規(guī)范

    移動電源測試系統(tǒng)是針對便攜式移動電源綜合性能測試的自動化測試軟件,能夠全面檢測移動電源性能和質(zhì)量
    的頭像 發(fā)表于 08-23 11:41 ?1606次閱讀
    <b class='flag-5'>移動</b>電源的<b class='flag-5'>測試</b>方法與<b class='flag-5'>測試</b>標(biāo)準(zhǔn)規(guī)范

    谷歌針對Android和iOS版Chrome發(fā)布五項更新

    移動設(shè)備上搜索內(nèi)容應(yīng)該像在電腦上一樣流暢。近期,我們針對 Android 和 iOS 版 Chrome 發(fā)布了五項更新,旨在您能夠更輕松地在手機或平板電腦上進(jìn)行搜索。
    的頭像 發(fā)表于 08-09 16:56 ?991次閱讀

    LE OTA APP崩潰的原因?

    Bluetooth_LE_Battery_Server proj開發(fā)自己的工程代碼,在安卓環(huán)境下使用LEOTA APP進(jìn)行測試開發(fā),藍(lán)牙連接都是正常的,在選擇升級文件,點擊update按鍵時,LEOTA APP會崩潰,程序顯示
    發(fā)表于 07-04 08:26