老朋友都知道我一直关注北美和日本的 AI。

总能发现一些火爆海外的产品或者开源项目,打听一圈,结果发现是我们国内做的。

“杭州六小龙”的说法可能都没那么服众,毕竟武汉、南京、苏州、成都……各有各在海外一等一能打的 AI 应用。

最近看到一个东京的 KOL,多次力荐一个叫 HeyGem.ai 的开源数字人。

据说口播效果、音画匹配、真实感呈现等等,质量都属上乘,关键还开源免费。

再一看,在 GitHub 开源 10 天就 突破 3200+ 颗 Star,到今天已经突破 4200 Star,可以说在数字人开源这么一个垂直领域也掀起了不小的水花。

开源地址:

https://github.com/GuijiAI/HeyGem.ai

又一查,产品原来是南京的硅基智能做的,这一次不仅在东京得到关注,也在 Reddit、YouTube 上引发讨论。

开源和出海,像是彼此促进的两个齿轮,正在牵引更多国内产品,在海外实现新的增长飞轮。

而这一次,开源飓风的中心,是数字人。

开源数字人,效果如何?

HeyGem.ai之所以受到广泛关注,源于其对数字人制作门槛的根本性降低。

只要一张照片或一秒视频,就能生成高度逼真的数字分身,完整复刻面容与声音,并在60秒内输出4K高清视频口播。

性能测试显示,生成视频在复杂光影、侧脸或遮挡情况下,均能实现100%唇动匹配和自然表情呈现。

这也意味着着数字人正式从实验室、从秘而不宣的黑盒,开始走进大众创意、日常开发场景。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

硅基智能heygem.ai生成数字人视频

更有普惠价值的是,HeyGem.ai 采用了免费、无限制、完全离线运行的开源策略。

相较于美国同类产品动辄数万美元的授权费用,HeyGem.ai大幅降低了中小企业与个人开发者的使用门槛。

这就让我非常心动。

以前在数字人领域,算力以外的技术、产品溢价非常高。

之前我们自己业务想给老人定制数字分身,成本高并且改动难,只能在对方的闭源方案上提需求,还常常得不到满足。

自研的部分又需要和对方的完整链路去解耦,总之非常难受。

而开源则是一个真正产品个性化开发、快速迭代的一个开始。

68%的开发者表示,“超快速克隆、100%口型精准匹配”是他们首选 Heygem.ai 的核心原因。

超过30%的开发者集中讨论Heygem.ai与其他人工智能模型融合,实现“文本-数字人-场景”全链路视频自动生产。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

HeyGem.ai开源数字人效果

场景重塑、交互重建

新旧交互、新老场景,是我构建的一个评价坐标。

基于开源的 DeepSeek、Qwen、HeyGem.ai 等越来越多的模型和能力,新的交互形式将逐渐显现优势,原有场景也将得到改造和新的实现。

HeyGem.ai 非常锐利的点,就是用极低的使用门槛与高度灵活的开发能力,给更多大众开发者提供了“趁手好用的武器”。

个人 IP 也能构建专属AI分身;小机构、小工厂、小店铺,都可以借助数字人,重新想象一下内容生产、品牌传播与人机交互的新可能。

拿内容创作领域来说,HeyGem.ai 正在改变创作者与内容的关系。

短视频博主、知识型KOL,或者独立艺术家,通过 HeyGem.ai 快速生成视频,从文本脚本到数字人演绎全流程自动化。

一个数字人就是一个新的电子名片。

我一直没做视频号,甚至很长一段时间公众号都没时间写,“数字分身弗兰克”也会是我的一个很好的补充。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

如果是销售、品牌推广场景,HeyGem.ai 配合 AdBot 系统,是个面向品牌方与营销机构的的传播工具。

用户只需上传产品图与文案,系统便能在10秒内生成4K高清带货视频,精准匹配用户画像,实现内容定制与传播效果的最优化。

对创业公司,这就能大幅降低广告制作成本、提升营销效率,品牌传播迈向智能化与规模化就不止是一句口号了。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

heygem.ai数字人用于广告营销

在影视与数字娱乐行业,HeyGem.ai 为虚拟角色的高效生成与演绎提供了新的解决方案。

可以说,一个数字人就是一个新的影视角色。

导演与制作团队可利用HeyGem.ai快速克隆演员形象,实现无需实拍的高保真演出,赋能剧集预演、AI数字演员以及虚拟直播等多种形态。

提升制作效率还在其次,关键是拓展艺术表现空间,同时激发全新的叙事可能性。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

还有刚需的教育领域,HeyGem.ai 也许也能引发蝴蝶效应,重构传统教学模式。

AI Tutor 从概念到产品,之前落地偏慢,一大原因就是开源模型少——自己搞模型、搞管线、搞封装、搞工作流,太慢!

基于数字人技术的AI教师,开发就容易多了。

能够实现因材施教与实时互动,覆盖语言训练、学科辅导、实验仿真等多个维度。

通过融合多模态内容生成与智能反馈机制,HeyGem.ai 为学习者提供沉浸式、个性化的教育体验,也许这才能叫“因材施教”?

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?

现在基本上大小老板都有考虑过自己做IP、真人形象出镜的事,HeyGem.ai 可能提供了一个低成本试错、快速获得反馈、即时验证效果的数字化表达方式。

不用花什么钱,就能让老板体验一把数字人的感觉,这个事,不止是情绪价值,也是很多传统企业的刚需。

企业品牌形象塑造得好很难,但塑造得更多维、更立体、更科技,这个事 AI 擅长,HeyGem.ai 更擅长。

数字人所具备的可控性与可扩展性,使得知识与影响力突破了时间与空间的限制,实现了“自我”的持续放大与价值沉淀。

HeyGem.ai的开源不仅意味着技术的共享,更代表着一种技术价值观的转变——推动数字人走出实验室,走入社会,激活产业创新生态。

从开源,到“跨国乐高”

我一直觉得,创意、创造、创新,这些人类最美好的艺术和科技表达,是在碰撞中实现突破的。

Heygem.ai 的开源,就不止是单纯的技术输出,也像一场面向全球开发者的共建AI生态的邀请。

就像开放了一个游乐场和创意园,有各种好玩的情景、感人的故事,在一幕幕上演。

 东京 KOL 为什么喜欢南京的开源数字人?
打开网易新闻 查看更多视频
东京 KOL 为什么喜欢南京的开源数字人?
用heygem.ai帮助一位来自东欧的母亲“复活”儿子

在Heygem.ai的GitHub代码仓库中,已有大量海外团队积极贡献代码。

开源模型的“乐高化”,逐渐在形成一种“全球协作”的新形式,可能一个非常极致的数字人开源产品,就是世界各地的开发者一行一行代码大家“拼装”出来的。

社区开发提交 Issue、改进代码,就使得项目更新非常快。相比之前我们之前给老人定制数字人,采用闭源方案就只能被动等更新、被动提需求、有啥用啥。

国内开发者、创作者也已经有了大量的实操分享

这也是开源的根本优势,“集智、集创、即时反馈”。

甚至可以说,在数字人或者特定垂直领域,先开源的优秀玩家,才能建立先发优势,通过更大范围全世界开发者的“挑刺”、“脑洞”,逐渐滚雪球从而形成新的技术优势。

往大了说,从 DeepSeek 开始,更加包容开放的开源精神已经有了其土壤,甚至中国的开源项目所带来的连锁反应,也在重新建构大洋彼岸对中国科技的评价标准和估值体系。

不开源就不会被看见,也无从被了解,更难去交朋友。

开源以后,很多项目甚至有了欧美面孔主动寻求参与和加入的机会。

开源接力赛,南京到世界

DeepSeek、Manus 火爆全网之后,杭州和武汉的受关注程度也直线提升。

甚至有憨憨美国朋友以为 Wuhan 是一个阿拉伯城市。

这一次, Heygem.ai 也给了海外开发者一个了解南京的契机,更是一个开源演进的开始。

开源接力赛,南京站,正式打响!

倒不觉得国内这些中心城市之间有什么竞争关系,即便有也是良性竞争,都是在国际技术市场上建立共识的队友。

是曲线突围还是弯道超车,是生态共创还是优胜劣汰,让我们拭目以待!