打开网易新闻 查看精彩图片

行业首创!泛娱乐赛道终于迎来专属开源大模型。

打开网易新闻 查看精彩图片

元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent,包含中、英文双版本。模型深度适配泛娱乐(Entertainment)核心领域,覆盖社交互动、游戏叙事、文化创作(含小说、剧本)等关键场景,支持轻量化部署与垂直场景深度落地,填补了泛娱乐领域专属开源大模型的空白。

XVERSE-Ent 在通用大模型能力基础上,依托元象AI 泛娱乐产品服务全球千万级用户的实践经验,经稀缺的垂直领域数据深度训练与优化,在角色一致性、剧情逻辑等方面能更精准地契合泛娱乐场景的真实需求,为中小开发者与泛娱乐企业提供了低成本、高效率的泛娱乐创新底座模型。模型特色主要体现为:

• 角色一致性强化:能长期保持虚拟角色人设、记忆与说话风格稳定,有效优化“遗忘”或“出戏”的问题。

• 长剧情精准理解:精准把握复杂故事线、人物关系与伏笔,生成逻辑合理的剧情。

• 多元语境适配:针对不同题材(古风、科幻、都市等)具备丰富的风格化表达与背景知识。

01
中英双开源,核心技术创新

依托两大核心技术创新,XVERSE-Ent实现“通用能力稳、领域适配准、部署成本低” 的核心优势,分别开源中英双版本模型,精准满足多语言泛娱乐创作与全球化出海需求,形成 “技术筑基 + 多语言拓展” 的完整泛娱乐开源方案。技术创新如下:

1、MoE 热启动技术:基于一个 Dense 模型改造出一个 MoE 模型。第一步,将 Dense 模型的 FFN 部分进行细粒度拆分,得到多个子网络,每个子网络作为 MoE 模型的一个专家;结合推理时的显存大小,对专家子网络进行一定次数的复制。第二步,复用 Dense 模型的 attention 部分。

FFN 部分的细粒度拆分方式如下图所示。图中,完整的 FFN 被拆分为 2 个子网络。

打开网易新闻 查看精彩图片

相对的,完整 FFN 不做拆分作为一个专家的方式,称为粗粒度,如下图所示。在实践中,细粒度拆分方式的效果更好,也能更灵活地根据硬件配置进行模型结构的设计。

打开网易新闻 查看精彩图片

2、多阶段训练策略:通过 S0 能力重建、S1 语言倾斜、S2 领域增强三个阶段的训练,构建适用于特定语言、特定领域的专用模型。前 2 个阶段的数据为通用数据,后 1 个阶段的数据为通用数据和领域数据的混合。

整体流程示意如下:

打开网易新闻 查看精彩图片

本次开源包含两大文本模态模型,满足多语言应用落地需求:

• 中文:XVERSE-Ent-A4.2B,总参数量25B,由通用底座 XVERSE-MoE-A4.2B 经过 S2 领域增强获得,针对中文语境下的角色扮演、故事生成、对话互动进行了极致优化,文化契合度高。

• 英文:XVERSE-Ent-A5.7B,总参数量36B,依托成熟的出海应用经验打造,在英文创意写作、游戏对话及跨文化交流场景中表现优异。

中英文模型的上下文窗口大小均为8K,经过了近万亿 token 数据的训练。

模型现已在Github、Huggingface与魔搭开源:

• HuggingFace:

https://huggingface.co/xverse/XVERSE-Ent-A4.2B

https://huggingface.co/xverse/XVERSE-Ent-A5.7B

• ModelScope:

https://modelscope.cn/models/xverse/XVERSE-Ent-A4.2B

https://modelscope.cn/models/xverse/XVERSE-Ent-A5.7B

• Github:https://github.com/xverse-ai/XVERSE-Ent

02
性能卓越,低成本部署

评测结果显示,XVERSE-Ent 泛娱乐模型不仅在小说与对话生成等泛娱乐核心任务上表现卓越,更在MMLU、数学、代码等通用能力上基本不下降,能力保留98%以上。这标志着模型成功实现了“专精”与“通用”的平衡:既成为特定领域的专家,又保持了应对多样任务的全能选手潜力,从根本上规避了能力单一化的风险。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

XVERSE-Ent 中英文模型评测结果

(*X开头的为领域能力相关的指标,数值越低越好

fiction:小说类文本构成的测试集

conversation:对话类文本构成的测试集

webcc:通用文本构成的测试集)

模型支持高并发低成本部署方案,支持云端单卡部署,实现推理成本与处理效率的平衡,大幅降低开发者的部署门槛与运维成本。

03
落地成效显著,赋能产品全球化布局

泛娱乐产业作为数字经济的重要增长体,市场空间巨大,模型应用量极高。根据前不久OpenRouter 与 a16z 联合发布的基于全球300多个模型的百万亿级 token 数据分析报告显示,角色扮演已成为开源模型最主要的落地场景,占据超过50%的开源模型使用量,尤其在游戏化互动、创意叙事等泛娱乐场景中备受青睐。

打开网易新闻 查看精彩图片

角色扮演在2025年开源模型应用中占比最高

源自:《State of AI:An Empirical 100 Trillion Token Study with OpenRouter》

元象将聚焦泛娱乐的模型 XVERSE-Ent开源,正精准契合这一市场需求,以开源模型赋能千行百业,旨在与全球开发者共建繁荣、共享进步的泛娱乐 AI 生态。

目前,XVERSE-Ent已成功落地 AI 社交产品 “Saylo”。依托模型在泛娱乐场景的深度技术赋能,Saylo在全球几十个国家和地区登上免费榜单和畅销榜单前列,在美国、德国、法国、意大利、拉美地区均收获海量用户和稳健商业回报。模型在剧情连贯性、角色人设统一性、多轮交互趣味性等核心指标上表现突出,验证了技术创新与商业落地的高效融合。

元象始终坚信开源是加速技术创新与产业普及的最有效路径。作为长期深耕开源生态的践行者,元象已相继成功开源、、等重量级通用底座大模型,及,能够进行多样化的场景适配,构建起覆盖通用能力、轻量化部署等多维度的开源模型全家桶。

此次 XVERSE-Ent 泛娱乐大模型的发布与开源,将进一步完善元象开源生态布局,为中小开发者与泛娱乐企业降低创新门槛,未来元象还将探索多模态生成能力,持续拓展泛娱乐 AI 的应用边界,让开源成果惠及更多场景与用户。

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。