高质量 SVG生成！开源方法OmniSVG带来全新体验|svg|云计算费用|开源方法

可缩放矢量图形（SVG）因其分辨率无关性和可编辑性，成为平面设计中广泛采用的重要图像格式。生成高质量SVG的研究持续吸引着AIGC领域设计师与研究者的关注。然而现有方法要么输出非结构化结果且计算成本高昂，要么仅能生成结构过度简化的单色图标。

因此为产出高质量复杂SVG，复旦提出OmniSVG—一个利用预训练视觉语言模型（VLMs）进行端到端多模态SVG生成的统一框架。OmniSVG能够自回归生成覆盖广泛复杂度的高质量SVG—从简单图标到精细动漫角色皆可胜任。该框架通过文本生成SVG（Text-to-SVG）、图像转SVG（Image-to-SVG）和角色参照SVG（Character-Reference SVG）等多模态生成方式，展现出卓越的泛化能力，成为适应多样化创意需求的强大灵活解决方案。（链接在文章底部）

01 技术原理

OmniSVG基于预训练视觉语言模型Qwen-VL构建，并集成了SVG分词器。该模型将文本和图像输入统一编码为前缀标记（prefix tokens），同时通过SVG分词器将矢量图形指令编码至统一表征空间。

SVG 绘图指令：OmniSVG使用的绘图指令及其参数和可视化效果如下所示。起始位置 (x1, y1) 是隐式定义的，即由前一个指令的结束位置决定。

与当前最先进方法在 Text-to-SVG 任务上的定性对比。在评估基准（包括图标、插画和角色）上，将所提出的方法与当前最先进的 Text-to-SVG 方法进行了比较。

局限性与未来工作：推理阶段，OmniSVG生成复杂样本时需产出数万量级标记，导致生成耗时显著。当前框架仅支持矢量风格图像输入，无法处理自然图像。

02 演示效果与数据集

文本转SVG：图像转SVG：

角色参考 SVG：

MMSVG-2M 数据集由三个子集组成，分别为图标（Icon）、插画（Illustration）和角色（Character）。其中，图标、插画以及部分角色子集的样本来自互联网下载；另一部分角色子集由数据生成流程自动构建，可为图像提示任务提供图像与 SVG 的配对数据。

OmniSVG 在图像转 SVG 任务中的局限性：OmniSVG 能够成功生成矢量风格图像，但无法很好地拟合自然图像。

https://arxiv.org/pdf/2504.06263
https://github.com/OmniSVG/OmniSVG

欢迎交流～，带你学习AI，了解AI

高质量 SVG生成！开源方法OmniSVG带来全新体验

热搜

热门跟贴

热搜

热门跟贴

相关推荐

执法车堵企业门11天 基层执法该守怎样的边界？

检爱同行 向阳生长丨【SVG】谁在守护少年？这是一份跨越时光的答卷

今晚，数百人准备在南京路排通宵！消费者：“预想到火爆，没想到比预想的更火爆”

贵州大学招聘管理岗引质疑，要求配偶须是本校在职博士，校方：不是“萝卜岗”

地毯拖拽行李费力？广州白云机场回应T3三大热点

神舟二十二号载人飞船顺利撤离空间站组合体

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水 厂家：系旧包装，已改名“一滴水”

一键生成PPT和科研绘图，北大开源Paper2Any，全流程可编辑

官方通报低保老人被贷款20万

广州市市长孙志洋：2030年广州GDP将达4.5万亿元，2035年达到6万亿元

浙江两级文物部门回应：文物战国青铜剑疑有拼接痕调查结束 近期通报

首进大满贯16强创历史，重新出发的王曦雨学会“只看眼前”

网线被人拔断、传感器被阻断，瓦斯监测为何失效？

“一人住院”不再“全家受累” 上海持续破解“陪护难”

广东小学生合唱粤语歌《上海滩》 一男孩不停随歌摇摆

美国与古巴两军高级将领举行罕见会晤

博闻丨250万粉丝医学大V涉虚假宣传被封号后换壳复出，记者采访时对方又展示“表演天赋”

北欧豪华纯电旗舰沃尔沃EX90 & 沃尔沃ES90正式上市

重庆：望乡台瀑布进入最佳观赏期

夜空中最亮的星

执法车堵企业门11天基层执法该守怎样的边界？

检爱同行向阳生长丨【SVG】谁在守护少年？这是一份跨越时光的答卷

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

浙江两级文物部门回应：文物战国青铜剑疑有拼接痕调查结束近期通报

广东小学生合唱粤语歌《上海滩》一男孩不停随歌摇摆