Qwen3-Coder 采用了预训练和后训练相结合的方法进行训练。在预训练期间,该模型沿多个维度进行了扩展,以增强其核心功能,包括扩展标记、上下文和合成数据。该模型在 7.5T 的 token 上进行训练,代码量占比达到 70%,在保持通用和数学能力的同时,表现出色。此外,该模型原生支持 256K 上下文,并可通过 YaRN 扩展至 1M,并针对 repo 规模和动态数据进行了优化。
Qwen3-Coder 可与多种工具配合使用,包括 Qwen Code,这是一款改编自 Gemini CLI 的研究用途 CLI 工具。Qwen Code 已增强自定义提示符和函数调用协议,以充分发挥 Qwen3-Coder 在代理编码任务中的潜力。此外,Qwen3-Coder 可与流行的编码工具 Claude Code 配合使用。该模型还可以通过阿里云模型工作室 API 访问,方便开发者将其集成到自己的应用程序中。