关键功能

用于长篇幅深度研究的开源端到端训练框架
结合了监督微调和具有演化标准的强化学习(RLER)
灵活的智能体堆栈支持多工具搜索和异步工具调用
包含 dr-agent-lib 用于并发管理和多工具集成
模块化设计支持使用自定义工具堆栈和特定领域扩展进行部署
在行业基准测试中表现出色,优于更大的专有模型

DR Tulu 从一个强大的基础模型开始,经过多个阶段的训练,包括提示策划、使用教师生成的轨迹进行监督微调以建立基础研究技能,以及使用演化奖励框架的强化学习,重点是提高工具使用、综合质量和引用行为。该模型旨在与灵活的智能体堆栈集成,使其能够动态地在各种搜索和浏览工具中进行选择,从而提高其从不同来源有效收集和综合信息的能力。


DR Tulu 最显著的特点之一是其模块化和可扩展性;它包含一个名为 dr-agent-lib 的智能体库,提供多工具、异步调用框架来有效管理并发和缓存。这使用户能够使用自己的自定义工具堆栈部署智能体,通过易于访问的训练方案和检查点实现可重现性,并通过插入特定领域的检索系统来扩展模型的能力,而无需重新训练。DR Tulu 表现最佳的 80 亿参数模型在严格的基准测试中展示了相对于更大的专有系统的显著改进,同时保持了成本效益和部署灵活性。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!