Mistral Large 3 是一个最先进的开源模型,使用 3000 个 NVIDIA H200 GPU 从头开始训练,代表着预训练方面的一个巨大飞跃。它在通用提示方面实现了与最好的指令调优开源权重模型相当的性能,同时还展示了图像理解能力和在多语言对话方面的最佳性能。该模型在 OSS 非推理模型类别中排名第二,为企业和开发者社区的进一步定制提供了坚实的基础。
Mistral 3 提供了一系列专为前沿智能、多模态灵活性和无与伦比的定制性而构建的模型。这些模型提供从 3B 到 675B 参数的各种尺寸,可以精确地部署用于编码、创意协作、文档分析或工具使用工作流程。Ministral 3 系列实现了任何 OSS 模型的最佳成本性能比,使其适用于边缘和本地用例,并且可以通过微调或企业级训练进行定制以满足特定需求。

