寻找最新最佳的计算机使用代理人工智能。浏览最全面的AI数据库,每日持续更新。
最新
GameWorld 是在交互式环境中评估游戏代理的基准。它旨在测试人工智能代理是否能够感知游戏状态、计划行动、遵循目标并适应动态反馈。该产品与具体人工智能、强化学习、计算机使用代理、游戏自动化和一般代理评估相关。
该基准可能提供游戏任务、观察空间、动作界面和代理表现的评分规则。技术评估应侧重于规划范围、行动有效性、状态理解、奖励设
CUA-Suite 是一个大量人工注释视频演示的集合,用于培训和评估计算机使用代理。该套件被设计为跨桌面应用程序的统一生态系统,这使其与代理 UI 自动化、动作模仿和大规模评估相关。它的范围涵盖许多专业工作流程,而不是一个狭窄的基准。
项目页面描述了三个互补组件,包括 VideoCUA、UI-Vision 和 GroundCUA。