随着大模型技术逐步普及,AI应用正全面渗透办公、研发、设计、科研等细分场景,立足当下AI场景融合落地的行业趋势,港股AI企业云知声对外发布新一代通用大语言模型U2。区别于传统对话式大模型,U2定位面向个人、开发者、组织的原生智能体大模型,提出“高智能密度×高Token价值”纯粹技术主张,不再聚焦浅层对话应答,主攻跨场景端到端任务闭环交付。

打开网易新闻 查看精彩图片

性能层面,U2有两大优势,一是特别能干活,IFBench指令遵循、Claw系列Agent评测、GDPval办公能力评测都打到了前排,而且完成复杂任务的交互轮次更少,不会动不动卡壳来回折腾;二是“以小胜大”,GPQA硬核推理和长文本理解上,仅凭极低激活参数,打出了接近甚至超过部分超大模型的效果。

实际应用测评中,U2展现出极强的自主创作与复杂任务处理能力。面对“做一个值得上Awwwards的前端demo,可自由选择创意主题,单文件HTML、不用外部库”的开放性需求,U2很快就交出了一个交互式粒子宇宙,将近1000行代码,没有引用任何外部依赖,全部原生实现。打开HTML,鼠标移动会扰动附近粒子的运动轨迹,点击会触发吸引、排斥、环绕三种模式的切换,左上角面板还能实时显示当前粒子数量及运动状态。

在创意应用开发中,面对“做一个12星座版的《TA到底在想什么》应用”需求,U2还能自主完成12星座情感分析应用的五大功能模块搭建,同步实现AI回复等功能,生产力级VibeCoding能力突出。

打开网易新闻 查看精彩图片

如果说上面这些还只是体现了U2的Agent开发能力,那么下面这一测评则是真正考验它的推理和研究深度。在用U2对OPC(一人公司)赛道做的全景式深度研究HTML报告测试中,全程没给任何资料,没有指定数据来源,就一句指令。没想到U2却交出了一份让人眼前一亮的报告:左侧固定导航,右侧内容区从产业概述、核心数据、行业分布一路覆盖到政策解读和未来展望……页面底部显示数据均出自国家市场监督管理总局、中国OPC发展调研报告2026等公开数据。数据有出处,判断有逻辑,不是凑字数,是真在做研究。

打开网易新闻 查看精彩图片

当每一个Token都能创造更多价值时,显而易见,“更大”便不再是唯一答案,行业的评价坐标,将从“谁的模型更大”,逐渐转向“谁的模型更值”。而U2,正是这一转变的第一块试金石。可以预见,未来云知声依托U2底座,持续完善智能体工具链,面向ToC个人提效、ToB开发者赋能、ToG行业定制三大市场开放能力。