关键功能

从 2B 到 35B 参数的开放深度研究代理系列。
接受过完全合成的标题树任务的培训。
目标是事实查找、报告综合和引文基础。
对研究工作流程使用结构化上下文管理。
结合中期训练、监督微调和强化学习。
发布模型、数据、训练代码和数据合成脚本。
通过八个深度研究和搜索基准进行评估。
提供论文、Hugging Face 演示、模型合集和 GitHub 代码链接。

训练方法结合了基于标题树的任务合成、结构化上下文管理以及跨越训练中期、监督微调和强化学习的三阶段管道。该项目强调发布模型、数据、数据合成脚本和训练代码。


QUEST 对于构建需要搜索、引用和合成长格式报告的深度研究代理的研究人员和开发人员很有用。其基准比较侧重于广泛的研究代理能力,而不是单一的狭隘搜索任务。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!