寻找最新最佳的智能体人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Gamma-World 是一种生成式多智能体世界模型,专为超越两个可控玩家的交互模拟而设计,同时保持共享世界的一致性。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 Gamma-World 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的人工智能生成或人工
Qwen 3.7 是 Qwen 大型语言模型版本,专为高级推理、代理工具使用、编码、多模式工作流程和一般助理任务而设计。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 Qwen 3.7 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的人工智能生成或人工智能
ReactiveGWM 是一种反应式游戏世界模型,旨在通过高级策略在生成的游戏世界中引导非玩家角色。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 ReactiveGWM 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的人工智能生成或人工智能分析的内容。<
Step 3.7 Flash 是一个针对现实世界代理的高效多模式 Flash 模型,专为使用工具的代理而设计,这些代理可以理解图像、搜索网络、编排工具以及跨常见工具执行操作。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 Step 3.7 Flash 不是提供通用演示,而是针对具体的能力差
LabOS 是一个面向现代实验室的 AI-XR 联合科学家平台,它将代理推理与现实世界的实验执行联系起来。它旨在通过结合多模式人工智能代理、XR 智能眼镜、实验室专用视觉语言模型和文档工作流程,帮助科学家从干实验室规划转向湿实验室行动。目标是让人工智能看到研究人员所看到的内容,推理协议状态,并实时指导或验证物理实验步骤。
该系统是
CausalCine 是一种用于多镜头叙事创作的实时自回归视频生成系统。它专为交互式导演而设计,用户可以在系统随意流式传输视频的同时附加新的镜头级提示。 CausalCine 不是生成单个孤立的剪辑,而是在各个镜头中维护故事背景,因此序列可以随着连续性和新的创意方向而演变。
该系统重用内容感知的 KV 内存来保留远程叙事上下文和跨
Articraft 是一个代理系统,用于生成铰接式 3D 资产,这些资产是为模拟和交互而构建的。它针对具有移动部件的对象,例如烤箱、抽屉、自行车、椅子、灯具和机械组件,而静态网格体在这些情况下是不够的。该系统旨在生成包括功能关节的资产,以便可以在模拟或交互式环境中对其进行操作。
核心工作流程使用编码代理,根据 LLM 友好的 SD
ML Intern 是 Hugging Face 的开源机器学习工程代理,可读取论文、训练模型和发布 ML 模型。它旨在自动化 ML 工作的实际循环,从理解研究想法到运行实验并生成可部署的工件。该产品面向希望人工智能代理能够参与真正的机器学习工作流程而不仅仅是讨论它们的开发人员和研究人员。
该系统很有用,因为机器学习工程通常涉及一
Gen Searcher 是一种搜索增强图像生成代理,经过训练可以将搜索用作创意生成过程的一部分。它可以检索或推理外部信息,以更好地创建地面图像,而不是仅依赖提示和先验固定模型。这使得它对于需要特异性、事实基础或迭代视觉细化的生成任务非常有用。
该系统将监督微调与代理强化学习相结合,教授图像生成的搜索行为。从技术上讲,代理必须决定
ARA(即 Agent-Native Research Artifacts)是一个将研究论文转换为结构化知识包的系统,AI 代理可以通过编程方式执行、检查和构建这些知识包。它的设计理念是,对于研究作者和研究读者都可能是人工智能系统的未来来说,静态 PDF 是一种糟糕的格式。 ARA 将研究成果重新想象为机器可操作的工件,而不是纯叙述性的文档。
递归 MAS 是一种递归多智能体框架,通过潜在空间递归连接智能体来扩展协作。它没有将代理协作视为单独参与者之间的长文本对话,而是将多代理系统视为统一的递归计算。这种设计旨在提高复杂任务的推理质量、速度和令牌效率。
该框架引入了一个轻量级的 RecursiveLink 模块,可以在异构代理之间传输潜在状态,从而允许以更紧凑和结构化的
GameWorld 是在交互式环境中评估游戏代理的基准。它旨在测试人工智能代理是否能够感知游戏状态、计划行动、遵循目标并适应动态反馈。该产品与具体人工智能、强化学习、计算机使用代理、游戏自动化和一般代理评估相关。
该基准可能提供游戏任务、观察空间、动作界面和代理表现的评分规则。技术评估应侧重于规划范围、行动有效性、状态理解、奖励设
IronClaw 被设计为一个强大的、开源的运行时解决方案,用于执行复杂的 AI 智能体,同时将敏感信息的绝对安全放在首位。它直接解决了那些不太安全的智能体框架中固有的关键漏洞,通过在 NEAR AI 云基础设施上托管的加密飞地内运行来实现。这种基础设计确保了,尽管智能体拥有浏览、研究和自动化等复杂任务所需的必要能力,但任何凭据、API 密钥或令牌都完
clawXiv被介绍为一个开创性的、免费的发行服务和开放获取的档案库,专门用于研究自主智能体。它填补了一个关键的空白,提供了一个专门的平台,可以在其中快速传播有关智能体行为和能力的最新发现、实验和理论模型。该服务允许研究人员和开发人员立即与对智能体开发的尖端技术感兴趣的社区分享他们的工作,这与既定的预印本服务器的功能相呼应,但完全专注于这个新兴领域。c
GitHub Copilot SDK 提供了一个多平台接口,旨在将 GitHub Copilot 强大的智能体能力无缝嵌入到各种应用程序和自定义服务中。该产品公开了驱动 GitHub Copilot CLI 的相同、经过生产测试的智能体运行时,允许开发者以编程方式编排复杂的应用程序流程,而无需自行构建底层的协调逻辑。它负责处理计划、执行工具调用、管理文
SIMA 2 是一个通用的 AI 智能体,它可以在虚拟世界中遵循人类语言指令、思考其目标、与用户对话,并随着时间的推移不断改进自身。通过整合 Gemini 模型的先进能力,SIMA 2 已从一个指令跟随者发展成为一个交互式的游戏伙伴。这是朝着通用人工智能(AGI)迈出的重要一步,对机器人技术和一般 AI 具身化的未来具有重要意义。
AI Meme Arena 是一个创新平台,它将幽默与科技相结合,为用户打造独特的互动体验。它是一个实时战场,由人工智能驱动的智能体(称为“Memegent”)根据用户提供的提示,竞相创作最搞笑的表情包。该平台允许用户输入背景信息,例如热门话题或特定主题,然后让两个 Memegent 相互竞争,创作出具有竞争力的表情包。用户可以投票选出自己最喜欢的表情