该模型已使用 Python 3.10、Torch 2.6.0 和 Transformers 4.57.1 进行了测试,并在多个基准测试中进行了评估,包括 CVTG-2K、LongText-Bench、DPG-Bench、GenEval、OneIG-EN 和 OneIG-ZN。它在这些基准测试中表现出强劲的性能,证明了其生成高质量文本到图像输出的能力。该模型的设计架构高效且可扩展,适用于广泛的应用场景。
Ovis-Image 已被合并到几个流行的代码库中,包括 stable-diffusion.cpp、diffusers 和 ComfyUI。它也被证明在生成高质量的文本到图像输出方面非常有效,有示例展示了其能力。该模型设计易于使用,具有简单直观的界面,适用于文本到图像生成、图像编辑等广泛的应用。

