「你只需要一句话,即可生成多样、复杂的视觉信息图。」当兔展智能放出这句话时,GPT-Image-2刚刚用社交媒体截图和高考试卷刷屏朋友圈。两家公司的发布时间差,短到让人来不及消化前一个冲击。
正方:这是"理解即生成"的技术跃迁
这两天,大家伙朋友圈是不是被GPT-Image-2刷屏了?
文字渲染精准、高密度的信息图,复杂布局和美学UI一次到位,真实感爆棚。
连社交媒体截图、高考试卷都能近乎一比一还原,这完全颠覆了曾经以往的文生图模型,彻底解决了文字、信息图这些长期以来的痛点问题。
大家看完的第一反应,几乎都是:设计师真要失业了……
而就在刚刚,兔展智能甩出一张王炸:UniWorld-V2.5,居然直接"重现"了GPT-Image-2的某些惊艳Cases。
提示词:生成一个篆书碑刻拓片,内容是"由兔展智能首席科学家袁粒领导团队研发"
可以说,在InfoGraph、文字密集、图文交错等此前被公认为"AI生图天花板"的场景上,UniWorld-V2.5的完成度已经对齐GPT-Image-2,并显著超越其他国内外主流文生图模型。
更重要的是,UniWorld-V2.5需要输入的prompt非常简短,不需要像之前一样提供极其复杂和详细的prompt。
你只需要一句话,即可生成多样、复杂的视觉信息图,背后是一整套完整的视觉生成系统在做支撑。
结构化排版+高密度中文+复杂多样数学公式+曲线图+立体图,同时出现在一张图里。
几乎所有文生图模型,在这个场景下表现都很不稳定,甚至根本无从下手。
UniWorld-V2.5则表示:这只是基本功。
一张图里同时包含:选择题、填空题、解答题、函数图像、几何证明……
密密麻麻一整页,格式规范,字迹清晰,连答题线和页码都一个不落。
这已经不是"像不像"的问题,而是"能不能直接拿去给学生考试"的问题。
与此类似的,对中文排布要求很高的场景"简历生成",效果也同样可圈可点:
这种文字密集生成能力,此前的主流模型几乎无法做到。
在中文密集文字和复杂排版领域,这是前所未有的降维打击。
想要AI生成一个真实感的社交媒体APP界面?
传统模型生成的界面要么布局错乱,要么文字胡言乱语。
给UniWorld-V2.5布置作业,让它一句话生成一套完整、可乱真的社交媒体界面及布局。
主播、商品弹窗、价格、实时弹幕、打赏特效,细节真实到"细思极恐"。
咖啡馆照片、店名、推荐指数、评论、点赞、导航栏,一个不落,调性精准。
热点头条、热度值、标签、按键等,全都可以直接生成,直接以假乱真。
博主信息、播放量、推荐列表、评论区,UI细节精准到让人分不清真假。
这哪里是"生图"啊?这简直是"赛博截图"。
这么看来,UniWorld-V2.5理解的不是像素,而是产品逻辑和用户场景本身。
高密集、复杂的信息图是公认的AI生图"无人区"。
它要求模型同时理解数据、图表、文字排版和逻辑关系,信息密度越高,难度越大。
让UniWorld-V2.5尝试露一手,它交出的作业是这样的:
肌肉、骨骼、内脏等细节可视化呈现,中英文混排清晰,数据图表严谨。
它不是在"画"一张看起来像的图,而是在理解并构建一个完整的信息体系。
这种能力才是模型真正的技术护城河,标志着它从一个"生图工具"向"会思考、懂设计的视觉生成系统"的跨越。
让它试着画一张Air Jordan 1产品宣传海报。
鞋的质感、中文文案、版式层次、品牌调性……看这商业级完成度:
字体、排版、风格,专业摄影风格图片,美学和质感可以说是拉满了:
UniWorld-V2.5的横空出世绝非偶然,它背后站着一位视觉AI深水区的"领跑者":
深圳兔展智能科技有限公司,由董少灵在北京大学宿舍于2014年发明最早的H5工具而创立。
后来到了2022年,其与北京大学年轻一代视觉AI领军人才袁粒等二次创业。
公司总部位于深圳,已服务超4100万家企业用户。
截至目前,兔展智能已获深创投、腾讯、龙岗金控、嘉道资本、中国风投、青岛人工智能基金、招商局创投等头部机构投资,完成F轮融资。
它还是国家高新技术企业、国家级专精特新"小巨人"企业、大湾区最具潜力独角兽、广东省首个"AI国家级高技能人才培训基地"。
兔展智能的UniWorld系列模型,为什么能做到"理解即生成"?
值得一提的,是UniWorld系列发布的历史时间线:
面向高度结构化且依赖复杂世界知识推理的生成任务,传统的一句话出图范式已难以支撑。
区别于传统prompt-to-image的范式,团队将超过80%的token预算用于意图理解、推理与布局规划,相当于引入资深的"总设计师"来全程指挥和全局控制。
这从源头上保证了生成的质量,也体现了理解与生成统一的多模态范式优势。
其中,兔展智能首席科学家、北京大学袁粒老师,及其博士生晏志远等人,深度参与了核心能力的设计与实现,是V2.5关键突破的重要贡献者。
兔展智能一直围绕着让人类叙事更生动高效的使命,投入到最前沿的视觉智能创新。
据悉,兔展智能
热门跟贴