打开网易新闻 查看精彩图片

Hi,我是洛小山,你学习 AI 的搭子。

这篇文章,我想手把手教会你私有化部署开源超强生图模型 混元图像 3。

前几天我不是横测了一下开源的混元图像 3 嘛,但只是 API 的版本,我想试试本地化部署是不是有所不同。

先给你看看我这几天折腾的成果吧,我顺便开发并开源了图片管理系统。

地址:https://github.com/itshen/hunyuan_image_3_playground

LICENSE 是 AGPL-3.0。

欢迎 Star 和 Fork,一起完善这个项目。

01|选取设备

根据混元的技术博客,想要部署混元图像 3 ,需要 8 × 80G 显存的设备。

不差钱的老板可以用 140 万左右购买 8 台 H20,或者 18 万直接买 12 台顶配的 Mac Mini 进行本地化部署。

我只是想尝鲜体验的话,这些成本对我来说过于昂贵。

那天在群里问来着,发现有小伙伴推荐这个。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

后悔了,非运维出身的我部署快一天,钱花了一堆然后没搞成…

后来她看不下去了…

找了他们技术给我做了一个镜像…

测完之后,我把使用过程发出来,希望能帮到你。

共绩云运营看到的话,给我打钱!谢谢!

第一步:申请账号

登录 suanli.cn ,点击右上角的「控制台」。

打开网易新闻 查看精彩图片

第二步:点击弹性部署服务

打开网易新闻 查看精彩图片

现在开始,计算鼠标点击次数。

第一下:点击新增部署任务

打开网易新闻 查看精彩图片

第二下:点击 8 卡

这里推荐 8 × H20,性价比最高,

8 × A800 显存刚好 640 G ,生成一张图大概要 8 分钟,一个小时只能生成 9 张图,虽然设备相对便宜(46 元/小时) ,平均每张图 5 元。

8 × H20 设备约 59 元/小时,虽然贵一些。

但生成一张图只需要两分钟左右,一个小时能生成约 26 张图,平均每张图 2.3 元,单价比 8 × A800 便宜一半。

打开网易新闻 查看精彩图片

第三下:选择 Hunyuanlmage-3-Instruct Demo 镜像

打开网易新闻 查看精彩图片

第四下:点击同意协议

第五下:点击部署服务

打开网易新闻 查看精彩图片

然后就可以等系统拉取镜像并部署了。

结贴!!

打开网易新闻 查看精彩图片

02|使用模型

对了,拉取镜像的过程是不收费的,多贵的服务器都不收。服务器部署好了之后,点击这里打开页面。

打开网易新闻 查看精彩图片

你就能看到混元镜像里的测试页面。

打开网易新闻 查看精彩图片

这个页面非常难用!

所以,我推荐你使用我做的开源工具来管理。

https://github.com/itshen/hunyuan_image_3_playground

不但能管理所有任务、查看历史图像,还能帮你统计每一张图片大概多少钱,超级方便。

你直接把仓库下载下来,然后运行就行了~

不会的话可以在 Cursor 里直接给 AI 提要求:帮我运行就行。

打开网易新闻 查看精彩图片

你只需要把镜像里的链接贴到这里,然后填一下服务器价格。

打开网易新闻 查看精彩图片

接着填你的提示词,如果你不知道填什么,可以点击「快速选择」按钮,点击一下「手气不错」,系统就会从几百个提示词模板里随便挑选一个给你生成。

打开网易新闻 查看精彩图片

你也可以自己输入提示词,选好迭代步数进行创作。

生成参数你可以随机,也可以保持不动,不那么影响。

尺寸和比例建议你选择 Auto。

因为混元图像 3 还不支持 2K / 4K(也可能是我姿势不对),超过 1356 宽度的好像都会变成 1280 宽度的图。

打开网易新闻 查看精彩图片

发起任务之后,你可以在右上角查看所有的任务,可以把其中一些任务置顶,也可以取消。

打开网易新闻 查看精彩图片

如果你需要垫图,可以直接把图片上传上来,再填写提示词即可。

点击右边图片就能预览了。

如果你有垫图,你可以按一下空格键,能快速切换垫图和新图,方便你进行对比。

打开网易新闻 查看精彩图片

画廊我做了两种模式,一种是「快速编辑模式」,这里可以直接看到每张图的分辨率以及估算的成本。

点击提示词就能快速在左侧复现,节省你的操作链路,提升生图效率,降低服务器成本。

打开网易新闻 查看精彩图片

另一种模式,就是「紧凑模式」

我很喜欢 Pinterest 这样画廊的设计,为了画面美观。

打开网易新闻 查看精彩图片

于是这个视图隐藏掉了额外信息,只给你美的体验。

打开网易新闻 查看精彩图片

对了,你也可以把你电脑里的图片上传上来,然后使用鼠标对图片进行排序(就像手机应用那样)。

你可以把喜欢的图拖到一边(或者相关的图放到一边),然后通过键盘左右键对比。

感兴趣的可以看下面这个视频。

03|ShowCase

举个例子,昨晚群友给的 Case 是 Sketchup 生成渲染图。

打开网易新闻 查看精彩图片

这些渲染图渲染一张非常贵,好像是几十到几百一张。

我尝试用混元图像 3 试了一下。

原图:

打开网易新闻 查看精彩图片

原网站渲染效果:

打开网易新闻 查看精彩图片

图片来源:sketchupbox.com

混元图片 3 渲染效果:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

视频对比:

从一致性来看,混元图像 3 更准确。

而且用户可以提出换更多角度看最终效果。

04|为什么要这样私有化部署?

昨晚我把这个系统发到群里,一些群友很感兴趣,想要试试。

另一些群友问:为什么要私有化部署?

服务器费用折合下来, 两块多一张,确实不便宜。

Gemini 3 Pro 一张是 0.14 刀,即梦一个月会员费是 69,差不多是一个多小时服务器的钱。

确实,如果只看单张图的成本,API 和订阅制的商业产品,纸面上便宜了太多。

但这账不能这样算。

因为可控性才是私有化部署的核心价值。

第一:数据不外泄

和普通用户需求不同,如果你是商业设计师、建筑师,或者任何涉及商业机密的创作者,你的设计稿、你的客户项目,以及每一张喂给云端 API 的图片,理论上都已经离开了你的控制范围。

平台会拿着这些图做什么,你是没法控制的,如果你用的是中转的服务,那泄密风险还会 +1 。

但私有化部署意味着,所有数据在你自己的服务器上流转,生成完就是你的,不经过任何第三方。

这对于一些企业用户来说,这几乎是硬性要求。

你的服务如果不满足 ISO 27001 和 27701 你甚至不能入库。

第二:不受平台审核限制

用各种平台生图的伙伴都有体验:有些完全正常的提示词,会被莫名其妙地拦截。

想生成一个拿着刀的厨师?敏感。

想生成一个穿着比基尼或者内衣的模特?敏感。

想生成一些风格化的带视觉冲击力的作品?大概率也敏感。

因为平台有平台的合规压力,而且还会给你带上水印。

但当你私有化部署之后,你拿到的是相对完整的模型能力。

过程中的创作自由度,完全不是一个量级(发布仍要遵循相关法规)。

第三,可魔改,可接入,可进一步工程化。

商业 API 给你的是黑盒产品:输入提示词,输出图片。

私有化部署给你的是整个引擎。

你可以直接基于模型做二次训练。

32 个 safetensors 文件,加起来大概 170 G,这是 80B 参数的全部数值。

你可以基于这套权重做 LoRA 微调(虽然代价很大)。

虽然官方目前还没有放出微调脚本,但权重是开源的,社区已经有人在探索方案了。

这是我觉得鹅这一开源最性感的地方。

打开网易新闻 查看精彩图片

05|为什么要弹性?

刚讲的是私有化部署的好处,接下来想分享一下为什么要弹性计算。

说白了还是算力太贵了。

因为你其实并不需要 24 小时开着一台 59 块/小时的服务器。

8 × H20 的服务器,59 元/小时,一天 24 小时开着就是 1,416 元。

一个月下来,4 万多。

但真正在生图的时间有多少?

我这几天实测下来,提前准备好提示词,每次开机俩小时,批量跑完,关机走人。

一次花费大概 100 块左右,能出 50 多张图(可控的图)。

我觉得这就是弹性计算的意义:用多少算多少。

不用的时候,服务器是停着的,不计费。

需要的时候,几分钟拉起来,镜像都是现成的,不需要再重新部署。

但如果你真的买了 18 万的 Mac Mini 放在那儿,除非你的业务划分能够撑满这些算力, 7 × 24 不间断生图(比如你是生图 API 服务商),不然弹性计算是性价比最高的私有化部署方案。

否则,每张图的成本会被闲置时间的开销拉高。

你可以看看我的消耗曲线,闲时关了就完事了。

打开网易新闻 查看精彩图片

这样,既享受私有化部署的所有好处,又不用承担自建机房的固定成本。

说白了,就是拿租房的钱,享受了买房的体验。

完美。

06|一些建议

分享几个我折腾下来的经验。

服务器选择:推荐 8 × H20。

A800 看着便宜,但生成效率低,单张成本反而更高。

使用节奏:服务器是按秒计费的,一定要提前准备好提示词,集中时间批量生成。 不要开着服务器再慢慢想提示词,那真的是在烧钱。

Playground 里的「快速选择」和「提示词复用」就是帮我解决这个问题的。

打开网易新闻 查看精彩图片

迭代步数:默认 30 步基本够用。 对细节要求高可以拉到 50 步,但生成时间会明显变长。不建议 20 步以下(不允许 10 步以下),质量下降比较明显。

垫图:混元图像 3 的垫图能力挺强的,特别适合建筑渲染、产品设计这类需要保持结构一致性的场景。

更多测评可以看我之前的

但需要注意垫图分辨率最好选 Auto ,不然否则可能出现变形。

数量:建议一张一张来,万一毁了可以再改。

模式:如果你的服务器也是 H20 这种,不要点并发,服务器可能会遭不住。

终|写在最后

这个我折腾了快一周了,从部署疯狂翻车到开发这个工具,再到跑了几百张图…

说实话,当我把一个 80B 参数的生图模型跑在自己的服务器里,再看着它一张一张地吐出图片的时候,那种成就感和调 API 完全不同。

过程中我不断调试,我会更清楚知道,这个模型的能力边界。这种 AI 工程化的理解,不完全靠看Paper、看测评获得。绝知此事要躬行。

好啦,希望这篇教程能帮到你。

如果你在部署过程中遇到任何问题,欢迎在评论区聊聊。

点击「查看原文」你也来部署一下试试看吧!

你打算拿混元图像 3 来做什么?

我是洛小山,我们下次见。

关于我

我是洛小山,一个在 AI 浪潮中不断思考和实践的大厂产品总监。

我不追热点,只分享那些能真正改变我们工作模式的观察和工具。

如果你也在做 AI 产品,欢迎关注我,我们一起进化。

本文知识产权归洛小山所有。

未经授权,禁止抓取本文内容,用于模型训练以及二次创作等用途。