关键功能

为现实世界的机器人操作提供开放的机器人基础模型。
改进需要扎实空间理解的物理任务的 3D 动作推理。
针对需要协调控制的双手操作和其他机器人行为。
附带支持数据和代码,以便研究人员可以重现和扩展工作。
将多模态感知与具体人工智能系统的动作生成联系起来。
支持在现实任务设置中评估机器人策略。
帮助研究语言、视觉和行动政策如何在物理环境中相互作用。
专为构建透明且可扩展的机器人堆栈的研究人员而设计。

该系统强调 3D 动作推理和机器人在双手操作、家务任务和实验室式工作流程等环境中的实际行为。 MolmoAct 2 结合了模型发布、数据、代码和新的操作数据集,以便社区可以重现、研究和扩展系统。这种开放基础方法很重要,因为机器人技术的进步在很大程度上取决于透明的数据集、策略评估以及对培训和部署堆栈的访问。


对于机器人团队来说,MolmoAct 2 为构建可以从视觉语言理解转向真实驱动的实体代理奠定了基础。它对于评估多模态模型如何在物理场景中进行地面指令、策略如何表示 3D 空间关系以及开放数据集如何提高操作可靠性非常有用。该产品最好被理解为现实世界机器人动作模型的开放研究平台,而不仅仅是博客公告或演示。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!