近日,微軟的研究團(tuán)隊(duì)對 API 代理和 GUI 代理進(jìn)行了對比研究,發(fā)現(xiàn)這兩種代理各有特點(diǎn),可以根據(jù)不同需求進(jìn)行合理選擇。API 代理通過可編程接口與軟件進(jìn)行交互,而 GUI 代理則模擬人類的操作方式,通過點(diǎn)擊按鈕和導(dǎo)航菜單來完成任務(wù)。例如,若要安排一個(gè)活動,API 代理可能只需一次函數(shù)調(diào)用,而 GUI 代理則需要打開日歷應(yīng)用,逐步填寫相關(guān)信息。
在研究中,微軟團(tuán)隊(duì)評估了這兩種代理在九個(gè)類別上的表現(xiàn)。其中一個(gè)主要差異在于它們與軟件的交互方式:API 代理利用函數(shù)調(diào)用,通常表現(xiàn)得更穩(wěn)定且出錯概率低;而 GUI 代理則依賴于視覺界面內(nèi)容,雖然效率較低,卻具備更高的靈活性。GUI 代理能夠控制幾乎所有具有可見界面的軟件,即使這些軟件并不提供 API。
研究還指出,API 代理在安全性和維護(hù)上具有優(yōu)勢,因?yàn)榭梢栽诠δ芗墑e限制訪問權(quán)限,并且受益于版本控制。相比之下,GUI 代理則更加脆弱,稍微的視覺變化就可能導(dǎo)致其無法正常工作。然而,GUI 代理的透明度更高,用戶可以清晰地看到每個(gè)操作,方便審計(jì)。
微軟提出了三種結(jié)合 API 代理與 GUI 代理的混合系統(tǒng)策略。第一種是通過 API 封裝隱藏 GUI 操作,例如將生成財(cái)務(wù)報(bào)告的多步驟過程簡化為一個(gè)單一的 GenerateReport () 函數(shù)。第二種策略是使用編排工具來協(xié)調(diào) API 和 GUI 的步驟,適用于數(shù)據(jù)庫查詢和信用檢查等工作流。第三種策略是低代碼和無代碼平臺,允許非技術(shù)用戶通過拖放界面構(gòu)建自動化流程。
在選擇合適的代理時(shí),研究團(tuán)隊(duì)提供了明確的指導(dǎo)。API 代理適合性能要求高的任務(wù),特別是在與良好文檔的接口打交道時(shí),而 GUI 代理則適用于缺乏 API 的舊系統(tǒng)以及移動應(yīng)用等場景。隨著時(shí)間的推移,混合系統(tǒng)能夠適應(yīng)新出現(xiàn)的 API,提供更大的靈活性。
劃重點(diǎn):
?? API 代理通過函數(shù)調(diào)用實(shí)現(xiàn)快速、穩(wěn)定的任務(wù)完成,適合安全要求高的環(huán)境。
?? GUI 代理靈活性強(qiáng),能夠應(yīng)對視覺界面的變化,適合老舊系統(tǒng)和需要視覺確認(rèn)的任務(wù)。
?? 混合系統(tǒng)結(jié)合了兩者的優(yōu)點(diǎn),能根據(jù)具體需求選擇最優(yōu)方案,助力自動化進(jìn)程。