一个开源项目把阿里巴巴的Z-Image基础架构做了全量微调,专门面向动漫风格生成。原版模型未公开具体参数规模,这次微调在Hugging Face上放出了完整权重。
开发者称这是"full fine-tune",意味着不是简单的LoRA轻量适配,而是对基础模型的端到端重训练。这种做法成本更高,但理论上风格一致性会更强。
打开网易新闻 查看精彩图片
动漫风格的图像生成一直是开源社区的活跃赛道。此前Stable Diffusion生态中有大量基于动漫数据的微调版本,但基础模型多为SD 1.5或SDXL。这次直接拿阿里未开源细节的架构动手,算是一次新的尝试。
打开网易新闻 查看精彩图片
目前该模型尚未经过大规模评测,实际出图质量、对提示词的理解能力、以及是否保留了原版的文字渲染优势,还需要社区进一步验证。Hugging Face的下载量和讨论区反馈会是早期风向标。
打开网易新闻 查看精彩图片
热门跟贴