AIPress.com.cn报道
12 月 31 日,阿里巴巴旗下通义千问团队正式发布新一代图像生成模型 Qwen-Image-2512。该版本在人物真实度、自然纹理刻画以及复杂文字渲染等方面实现大幅升级,被官方称为“更接近真实世界的图像生成模型”。
据介绍,Qwen-Image-2512 在前代模型基础上进行了系统性优化,尤其针对以往生成图像中常见的“AI 感”问题进行重点改进。在人物肖像、自然场景、文字排版等多个维度,新模型展现出更高的真实度与稳定性。
在人物生成方面,Qwen-Image-2512 显著提升了皮肤质感、面部细节和发丝表现力。无论是年轻人、老年人,还是不同性别与气质的人物形象,模型均能呈现更自然的面部纹理和光影变化,减少以往常见的塑料感和模糊边缘。在多组对比示例中,新模型对眼神、表情和肢体姿态的还原更加符合真实摄影效果。
在自然环境和物体纹理方面,Qwen-Image-2512 同样表现出更高的细节密度。山川、河流、植物、动物毛发等元素的层次更加丰富,纹理过渡更加自然。官方展示的案例中,无论是瀑布水流、森林植被,还是动物皮毛与岩石表面,均呈现出更接近真实摄影的质感。
值得注意的是,Qwen-Image-2512 还显著增强了复杂文字与图文混排的生成能力。模型在生成包含标题、段落、信息图、PPT 页面等内容时,能够更准确地控制文字布局、层级结构与排版逻辑,减少错字、错位和排版混乱问题。这使其在信息图、演示文稿、科普海报等场景中具备更强的实用性。
在技术层面,官方表示,新版本在模型训练和推理策略上进行了系统优化,使模型在保持高分辨率输出的同时,进一步提升了稳定性与一致性。根据团队披露的数据,在多个公开评测中,Qwen-Image-2512 的综合表现已达到或超过当前主流开源图像模型,并在部分指标上接近闭源商业模型水平。
目前,Qwen-Image-2512 已同步上线 ModelScope、Hugging Face 以及阿里云百炼平台,支持开发者和创作者直接调用。官方表示,未来还将继续围绕真实感、可控性与专业创作场景进行迭代,推动图像生成从“可用”迈向“可商用”。
热门跟贴