OmniSVG

OmniSVG 的核心优势在于其技术架构，它将 SVG 命令和坐标转换为离散的标记，将结构逻辑与几何细节分离。这种标记化机制可实现高效的训练和富有表现力的 SVG 生成，支持多达 30,000 个标记的长上下文序列，从而实现高度精细的输出。该系统采用基于视觉变换器 (ViT) 的图像编码器和专用适配器，将图像嵌入投影到大型语言模型的潜在空间中，从而实现无缝的多模态输入处理。文本提示通过专门的标记器和嵌入器进行处理，使模型能够生成准确反映视觉和文本指令的 SVG 代码。最终形成了一个强大而灵活的 SVG 生成流程，可以顺利集成到专业设计工作流程中。

OmniSVG 还支持字符参考 SVG 生成等高级功能，使用户能够为不同姿势和场景中的特定角色创建一致的矢量插图。这对于动画、品牌和游戏设计尤其有用，因为在这些设计中，保持多个资源的风格一致性至关重要。该项目是开源的，MMSVG-Icon 和 MMSVG-Illustration 等数据集已开放供公众使用，并且计划在未来发布字符数据集。 OmniSVG 提供强大的生成模型和丰富的带注释数据集，是各种创意和技术领域中可扩展、自动化矢量图形创建的关键推动者。

主要功能包括：

文本到 SVG 生成，用于将描述转换为可编辑的矢量图形
图像到 SVG 转换，用于将光栅图像转换为结构化 SVG
字符引用 SVG 生成，用于风格一致的插图
支持高度详细和复杂的 SVG 结构，并具有长上下文处理功能
用于研发的开源数据集和评估协议
高效且富有表现力的 SVG 标记化，用于逻辑和可编辑的输出

Subscribe to the AI Search Newsletter