关键功能

480B 参数混合专家模型,包含 35B 个有效参数
原生支持 256K 令牌的上下文长度,并使用外推方法支持 1M 令牌的上下文长度
在 Agentic 编码、Agentic 浏览器使用和 Agentic 工具使用等开放模型中取得最佳成果
与社区最好的开发工具无缝协作
已对 7.5T 标记进行预训练,代码率达 70%
原生支持 256K 上下文,可通过 YaRN 扩展至 1M
可与 Qwen 代码和 Claude 代码一起使用
可通过阿里云模型工作室 API 访问

Qwen3-Coder 采用了预训练和后训练相结合的方法进行训练。在预训练期间,该模型沿多个维度进行了扩展,以增强其核心功能,包括扩展标记、上下文和合成数据。该模型在 7.5T 的 token 上进行训练,代码量占比达到 70%,在保持通用和数学能力的同时,表现出色。此外,该模型原生支持 256K 上下文,并可通过 YaRN 扩展至 1M,并针对 repo 规模和动态数据进行了优化。


Qwen3-Coder 可与多种工具配合使用,包括 Qwen Code,这是一款改编自 Gemini CLI 的研究用途 CLI 工具。Qwen Code 已增强自定义提示符和函数调用协议,以充分发挥 Qwen3-Coder 在代理编码任务中的潜力。此外,Qwen3-Coder 可与流行的编码工具 Claude Code 配合使用。该模型还可以通过阿里云模型工作室 API 访问,方便开发者将其集成到自己的应用程序中。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!