原标题:微博COO王巍出席数字中国建设峰会:可信AI的根基 在于可靠的数据
4月30日,在第九届数字中国建设峰会上,微博COO、新浪移动CEO王巍发表了题为《可靠数据,驱动可信AI——微博的大模型实践与思考》的演讲。结合微博的实践,王巍分享了数据赋能可信AI的路径与思考。
王巍指出,当前大模型能力加速跃迁,数据重要性同步提升。一方面,DeepSeek V4等开源模型实现深度思考能力跃升,OpenAI GPT-Image-2等多模态生成技术已达以假乱真的商用水平;另一方面,OpenClaw推出后,AI智能体快速普及,“养龙虾”热潮成为AI自主执行任务落地的典型现象。然而,在模型能力加速进化的同时,数据质量决定模型输出质量的核心规律始终不变。可信AI的根基,在于可靠的数据。
王巍以微博为例介绍,作为运营超16年、月活用户近6亿的平台,微博在数据的结构和质量上有自己的独特优势。第一个优势是数据规模扎实,质量可信。权威机构和媒体、专业大V、普通用户三层信源交织,形成了微博数据兼具权威性和真实性的独特属性。第二个优势是实时、多元、有温度。微博是重大热点事件的“第一现场”,几乎覆盖全社会不同视角,这种“有温度”的维度在许多其他数据源中相对稀缺。
王巍表示,基于这一数据基础,微博探索了微博智搜、微博评论机器人、微博龙虾助手等大模型应用实践。微博智搜引入深度思考大模型,实现智能总结、多轮交互、可信验证,满足用户在热点事件中快速获得完整、权威信息的需求。微博评论机器人具备多模态理解与情绪价值供给能力,不仅能生成更精准、更有趣的评论,也能理解用户情绪并给出恰当回应。微博龙虾助手则打通了OpenClaw生态和微博用户场景,大幅降低AI智能体使用门槛,满足用户对AI Agent的需求,同时也给AI厂商提供了一条相对可复制的落地路径。
王巍认为,可信AI不是单一技术命题,而是系统工程。概括成一个公式就是:可信AI = 可靠数据 + 可解释模型 + 可溯源内容,三者缺一不可。在数据侧,要确保真实信源、合规采集和持续治理;在模型侧,虽然AI具有不可解释性,也要努力去实现决策路径和推理过程的透明;在内容侧,则需要落实《人工智能生成合成内容标识办法》,让生成内容有身份标签,能够被追溯,也能够被问责。
“微博既是数据的守护者,也是AI应用的实践者,更希望成为可信AI生态的积极共建者。这件事需要数据提供方、AI开发者、内容平台和监管机构一起发力。”王巍在分享结束时表示,数据要素和人工智能双向赋能的进程正在持续推进,微博愿与各方共同推动这个进程走得更稳、更远。
热门跟贴