智东西作者 王涵编辑 冰倩
打开网易新闻 查看精彩图片
智东西作者 王涵编辑 冰倩

智东西3月24日报道,今天,京东技术团队正式公布京东云“龙虾天团京东云基于JoyAI大模型,推出了OpenClaw(昵称:龙虾)轻量云主机一键部署、一体机、云上SaaS版等产品,以及CodingPlan大模型套餐包。

据京东团队统计,京东云“龙虾”系列产品上线后,近一周token调用量环比增长455%

打开网易新闻 查看精彩图片

同时,京东首次开源了通用基础大模型JoyAI-LLM Flash的Instruct版本,该模型参数量为48B,激活3B参数,在性能测试上超过了GLM-4.7 Flash(non-thinking)等同等规模模型。

开源地址:

https://huggingface.co/jdopensource/JoyAI-LLM-Flash-Base

https://huggingface.co/jdopensource/JoyAI-LLM-Flash

数字人方面,京东自研JoyAvatar数字人视频生成框架发布,其核心通过双教师DMD后训练、动态CFG调制、历史帧+伪帧专属模型结构三大创新技术,解决文本控制弱、多模态控制信号冲突、长视频生成能力不足等痛点问题。目前,该框架性能超越Omnihuman-1.5、KlingAvatar 2.0等国际SOTA模型。

打开网易新闻 查看精彩图片

具身智能方面,京东透露,其将成为全球最大的具身智能数据公司。京东将于一年内积累500万小时人类真实场景视频数据,两年内积累超1000万小时优质数据,同步实现采集机器人本体数据100万小时,并且将建成全球规模最大、场景最全的具身智能数据采集中心

一、京东推出龙虾一体机,已在轻量云主机预置OpenClaw应用镜像

目前,京东云已在轻量云主机预置OpenClaw应用镜像,支持三步部署,开发者无需手动搭建运行环境。京东团队透露,最新数据显示,京东云OpenClaw云服务用户规模单周增长超300%,云端部署需求还在不断上升。

打开网易新闻 查看精彩图片

面向中大型企业OpenClaw部署需求,京东云还正式推出了OpenClaw一体机,相关方人称其具备三大优势:首先是零代码开箱即用,3分钟即可上岗;其次是原生开源生态融合;第三,支持官方持续更新。

当前,京东云OpenClaw一体机有三大硬件规格:

  • 标准版型号1:数据安全合规,支持超80人同时使用,日均处理Tokens 10亿+。
  • 标准版型号2:追求高模型精准度和并发的中大型企业,兼顾性能与隐私,支持50人同时使用,日均处理Tokens 5亿+。
  • 个人版:本地闭环OpenClaw和模型,适合5人及以下团队同时使用,日均处理Tokens 3.5亿+。
二、京东开源通用基础大模型,引入“纤维丛”数学工具

京东首次开源了通用基础大模型JoyAI-LLM Flash的Instruct版本,该模型参数量为48B,激活3B参数,公开测试基上,超过了GLM-4.7 Flash(non-thinking)等同等规模模型。

打开网易新闻 查看精彩图片

在算法上,JoyAI-LLM Flash将几何流形学中“纤维丛”这一数学工具引入强化学习,提出了创新的强化学习技术——FiberPO。

打开网易新闻 查看精彩图片

在激活参数保持3B的前提下,该模型通过动态稀疏路由实现更高计算效率,稀疏比例优于GLM-4.7-Flash等模型。

打开网易新闻 查看精彩图片

在代码方面, 基于稀疏优化+训推协同技术,JoyAI-LLM Flash在辅助代码开发时,响应速度超越同级别小参数量模型,让程序员可以“边写边调”。

基于预训练+多轮微调,模型对编程语法、多语言适配(React/Vue等)、代码逻辑的理解足够精准,生成的代码可直接复用。

在智能体方面,JoyAI-LLM Flash可以低成本快速适配用户复杂业务场景。目前京东JoyAI大模型技术已经在超过2000+场景应用,融入京东“超级供应链”。据京东团队透露,京东内部运行的智能体数量已超5万个。

三、唇形同步、身份稳定达商用级,京东自研数字人框架超越Omnihuman

京东自研JOYAvatar数字人视频生成框架,在分布匹配蒸馏(DMD)后训练框架中,引入音频、文本两个专属教师模型,实现 “音视频同步能力” 和 “文本控制能力” 的分离式监督、融合式学习。

该框架无需新增训练数据,即可将通用视频大模型的文本可控性迁移到数字人模型中,让数字人精准响应复杂动作、镜头交互等指令。

打开网易新闻 查看精彩图片

该框架根据视频生成的去噪时间步,动态调整文本、音频的无分类器指导尺度:生成早期优先根据文本控制信号确定数字人的动作框架,生成后期优先根据音频控制信号确保唇形同步。

通过Frame pack历史帧编码模块+伪最后一帧策略, 该框架构建专属长视频生成模型结构,突破传统数字人模型 “生成时长短、帧闪烁、身份漂移” 的技术限制,支持30秒以上长视频生成,并且可以全程保持身份稳定、动作流畅。

打开网易新闻 查看精彩图片

在客观量化指标评测中,JoyAvatar在唇形同步、身份稳定与动作自然度上达到商用级水准。其中唇形同步相似度Sync-C达5.57,高于Omnihuman-1.5、KlingAvatar2.0及商用模型 HeyGen。JoyAvatar的手部关键点置信度HKC为0.87,保证了肢体动作的自然流畅。

打开网易新闻 查看精彩图片

JoyAvatar可快速落地电商服务、智能客服、内容创作等核心场景:

  • 京东内部场景:数字人主播(直播间复杂动作、多主播互动)、智能客服(多角色智能问答)、京东云生态(为客户提供数字人技术底座)等;
  • 通用产业场景:影视动画(快速生成卡通人物 / 非人类主体视频)、线上会议(虚拟分身多轮对话)、教育科普(虚拟讲师复杂动作演示)、文旅文创(数字文旅形象定制)等场景。
四、京东JoyInside开发平台上线,提供AI能力+硬件模组

京东推出的JoyInside面向硬件终端提供智能化适配能力,支持拟人化交互与多人群适配。

2026年初,该能力新增社交玩法并升级语音合成技术,与京东京造联动搭建跨品类智能硬件互联体系,实现设备互通,并扩展至八大方言识别交互。截至目前,JoyInside已接入近百家家电家居品牌、超40家机器人及AI玩具厂商。

此外,京东还推出“JoyInside开发平台”,提供低代码可扩展环境及“搭建环境+AI能力+硬件模组+产业资源”的一站式解决方案:

  • 面向大众与设计师:提供可视化工具与即插即用模组;
  • 面向开发者:支持定制与外部Agent集成;
  • 面向厂商:通过便捷API助力老硬件低成本智能化升级,并对接京东零售渠道与营销资源。
结语:京东正以完整技术栈加速AI规模化落地

依托累计超1700亿元的技术投入,京东已形成从京东云算力底座、JoyAI系列基础模型,到智能体、数字人、附身智能的完整技术矩阵。

这一立体化布局,不仅推动京东内部海量业务场景的智能化升级,更以开放生态加速AI从技术突破走向普惠应用。