智东西3月24日报道,今天,京东技术团队正式公布京东云“龙虾天团”:京东云基于JoyAI大模型,推出了OpenClaw(昵称:龙虾)轻量云主机一键部署、一体机、云上SaaS版等产品,以及CodingPlan大模型套餐包。
据京东团队统计,京东云“龙虾”系列产品上线后,近一周token调用量环比增长455%。
同时,京东首次开源了通用基础大模型JoyAI-LLM Flash的Instruct版本,该模型参数量为48B,激活3B参数,在性能测试上超过了GLM-4.7 Flash(non-thinking)等同等规模模型。
开源地址:
https://huggingface.co/jdopensource/JoyAI-LLM-Flash-Base
https://huggingface.co/jdopensource/JoyAI-LLM-Flash
数字人方面,京东自研JoyAvatar数字人视频生成框架发布,其核心通过双教师DMD后训练、动态CFG调制、历史帧+伪帧专属模型结构三大创新技术,解决文本控制弱、多模态控制信号冲突、长视频生成能力不足等痛点问题。目前,该框架性能超越Omnihuman-1.5、KlingAvatar 2.0等国际SOTA模型。
具身智能方面,京东透露,其将成为全球最大的具身智能数据公司。京东将于一年内积累500万小时人类真实场景视频数据,两年内积累超1000万小时优质数据,同步实现采集机器人本体数据100万小时,并且将建成全球规模最大、场景最全的具身智能数据采集中心。
一、京东推出龙虾一体机,已在轻量云主机预置OpenClaw应用镜像
目前,京东云已在轻量云主机预置OpenClaw应用镜像,支持三步部署,开发者无需手动搭建运行环境。京东团队透露,最新数据显示,京东云OpenClaw云服务用户规模单周增长超300%,云端部署需求还在不断上升。
面向中大型企业OpenClaw部署需求,京东云还正式推出了OpenClaw一体机,相关方人称其具备三大优势:首先是零代码开箱即用,3分钟即可上岗;其次是原生开源生态融合;第三,支持官方持续更新。
当前,京东云OpenClaw一体机有三大硬件规格:
- 标准版型号1:数据安全合规,支持超80人同时使用,日均处理Tokens 10亿+。
- 标准版型号2:追求高模型精准度和并发的中大型企业,兼顾性能与隐私,支持50人同时使用,日均处理Tokens 5亿+。
- 个人版:本地闭环OpenClaw和模型,适合5人及以下团队同时使用,日均处理Tokens 3.5亿+。
京东首次开源了通用基础大模型JoyAI-LLM Flash的Instruct版本,该模型参数量为48B,激活3B参数,公开测试基上,超过了GLM-4.7 Flash(non-thinking)等同等规模模型。
在算法上,JoyAI-LLM Flash将几何流形学中“纤维丛”这一数学工具引入强化学习,提出了创新的强化学习技术——FiberPO。
在激活参数保持3B的前提下,该模型通过动态稀疏路由实现更高计算效率,稀疏比例优于GLM-4.7-Flash等模型。
在代码方面, 基于稀疏优化+训推协同技术,JoyAI-LLM Flash在辅助代码开发时,响应速度超越同级别小参数量模型,让程序员可以“边写边调”。
基于预训练+多轮微调,模型对编程语法、多语言适配(React/Vue等)、代码逻辑的理解足够精准,生成的代码可直接复用。
在智能体方面,JoyAI-LLM Flash可以低成本快速适配用户复杂业务场景。目前京东JoyAI大模型技术已经在超过2000+场景应用,融入京东“超级供应链”。据京东团队透露,京东内部运行的智能体数量已超5万个。
三、唇形同步、身份稳定达商用级,京东自研数字人框架超越Omnihuman
京东自研JOYAvatar数字人视频生成框架,在分布匹配蒸馏(DMD)后训练框架中,引入音频、文本两个专属教师模型,实现 “音视频同步能力” 和 “文本控制能力” 的分离式监督、融合式学习。
该框架无需新增训练数据,即可将通用视频大模型的文本可控性迁移到数字人模型中,让数字人精准响应复杂动作、镜头交互等指令。
该框架根据视频生成的去噪时间步,动态调整文本、音频的无分类器指导尺度:生成早期优先根据文本控制信号确定数字人的动作框架,生成后期优先根据音频控制信号确保唇形同步。
通过Frame pack历史帧编码模块+伪最后一帧策略, 该框架构建专属长视频生成模型结构,突破传统数字人模型 “生成时长短、帧闪烁、身份漂移” 的技术限制,支持30秒以上长视频生成,并且可以全程保持身份稳定、动作流畅。
在客观量化指标评测中,JoyAvatar在唇形同步、身份稳定与动作自然度上达到商用级水准。其中唇形同步相似度Sync-C达5.57,高于Omnihuman-1.5、KlingAvatar2.0及商用模型 HeyGen。JoyAvatar的手部关键点置信度HKC为0.87,保证了肢体动作的自然流畅。
JoyAvatar可快速落地电商服务、智能客服、内容创作等核心场景:
- 京东内部场景:数字人主播(直播间复杂动作、多主播互动)、智能客服(多角色智能问答)、京东云生态(为客户提供数字人技术底座)等;
- 通用产业场景:影视动画(快速生成卡通人物 / 非人类主体视频)、线上会议(虚拟分身多轮对话)、教育科普(虚拟讲师复杂动作演示)、文旅文创(数字文旅形象定制)等场景。
京东推出的JoyInside面向硬件终端提供智能化适配能力,支持拟人化交互与多人群适配。
2026年初,该能力新增社交玩法并升级语音合成技术,与京东京造联动搭建跨品类智能硬件互联体系,实现设备互通,并扩展至八大方言识别交互。截至目前,JoyInside已接入近百家家电家居品牌、超40家机器人及AI玩具厂商。
此外,京东还推出“JoyInside开发平台”,提供低代码可扩展环境及“搭建环境+AI能力+硬件模组+产业资源”的一站式解决方案:
- 面向大众与设计师:提供可视化工具与即插即用模组;
- 面向开发者:支持定制与外部Agent集成;
- 面向厂商:通过便捷API助力老硬件低成本智能化升级,并对接京东零售渠道与营销资源。
依托累计超1700亿元的技术投入,京东已形成从京东云算力底座、JoyAI系列基础模型,到智能体、数字人、附身智能的完整技术矩阵。
这一立体化布局,不仅推动京东内部海量业务场景的智能化升级,更以开放生态加速AI从技术突破走向普惠应用。
热门跟贴