Qwen3-Coder

Paid 编码软件开发

网站推广

关键功能

480B 参数混合专家模型，包含 35B 个有效参数

原生支持 256K 令牌的上下文长度，并使用外推方法支持 1M 令牌的上下文长度

在 Agentic 编码、Agentic 浏览器使用和 Agentic 工具使用等开放模型中取得最佳成果

与社区最好的开发工具无缝协作

已对 7.5T 标记进行预训练，代码率达 70%

原生支持 256K 上下文，可通过 YaRN 扩展至 1M

可与 Qwen 代码和 Claude 代码一起使用

可通过阿里云模型工作室 API 访问

Qwen3-Coder 采用了预训练和后训练相结合的方法进行训练。在预训练期间，该模型沿多个维度进行了扩展，以增强其核心功能，包括扩展标记、上下文和合成数据。该模型在 7.5T 的 token 上进行训练，代码量占比达到 70%，在保持通用和数学能力的同时，表现出色。此外，该模型原生支持 256K 上下文，并可通过 YaRN 扩展至 1M，并针对 repo 规模和动态数据进行了优化。

Qwen3-Coder 可与多种工具配合使用，包括 Qwen Code，这是一款改编自 Gemini CLI 的研究用途 CLI 工具。Qwen Code 已增强自定义提示符和函数调用协议，以充分发挥 Qwen3-Coder 在代理编码任务中的潜力。此外，Qwen3-Coder 可与流行的编码工具 Claude Code 配合使用。该模型还可以通过阿里云模型工作室 API 访问，方便开发者将其集成到自己的应用程序中。

在您的网站添加此徽章，以获得更多点赞并登上搜索结果顶部！

Qwen3-Coder

关键功能

Subscribe to the AI Search Newsletter