独家｜腾讯杰出科学家、混元大模型技术负责人之一刘威离职|元大|刘威|大模型|知名企业|腾讯|计算机视觉

编辑 | 褚杏娟、蔡芳芳

AI 前线独家获悉，腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威，目前已经从腾讯离职。

今年 5 月，刘威以混元大模型技术负责人之一的身份，出席 InfoQ 举办的并发表了《腾讯混元大模型技术和应用实践》的主题演讲。今年 9 月，他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。

刘威于 2012 年获得美国哥伦比亚大学计算机科学与电子工程博士学位，曾任 IBM 沃森研究中心研究科学家。刘威博士长期从事计算机视觉、机器学习、数据挖掘、信息检索等领域的基础研究和产品开发，迄今发表和录用论文 100+ 篇，总引用次数为 3600+ 次。

刘威曾先后获得 2011 年底 Facebook 博士研究生奖学金、2013 年度哥伦比亚大学优秀博士论文奖、2014 年度计算机视觉与模式识别国际会议 (CVPR) 青年研究者奖、2016 年度国际信息检索大会 (SIGIR) 最优论文荣誉奖。

刘威多次担任国际权威期刊的客座编委与审稿人，自 2007 年起一直担任国际顶级会议 NIPS、CVPR、ICCV 等的程序委员成员，担任第四届自然语言处理与汉语计算会议 NLPCC 2015 的领域主席，并自 2014 年起担任美国自然科学基金信息与智能系统分部 (NSF IIS Division) 的研究项目评审。

2017 年 3 月，刘威从 NSF IIS Division 离职，加盟腾讯 AI Lab，担任 AI Lab 计算机视觉中心总监、广告多媒体 AI 中心总监，负责图像视频数据相关的 AI 研究。

2022 年 11 月，刘威入选 2023 IEEE Fellow，入选理由是对大规模机器学习和智能多媒体的贡献。IEEE Fellow 是 IEEE 授予成员的最高荣誉，每年由同行专家在做出突出贡献的会员中评选出，当选人数不超过 IEEE 会员总人数的 0.1%。

刘威曾对外介绍，腾讯混元大模型名称的由来，表示“混元”在古代汉语中意味着从无序到有序、从混乱到规律的过程，这也正是生成模型的使命。

去年 9 月，腾讯混元大模型上线，之后腾讯又发布了混元大模型 MoE，目前已经涵盖了轻量版到中版，并且轻量版在腾讯云上完全免费。今年 5 月，腾讯混元文生图大模型发布，并宣布开源；到了 9 月，腾讯宣布推出新一代大模型“混元 Turbo”。

腾讯混元积累了大量自研技术，包括创新的专家路由 Routing 算法、独创的 MoE Scaling Law 机制以及合成数据技术，实现模型总体性能相比上一代 Dense 模型提升 50%，在文生图方面，混元实现了基于 LLM + DiT 的生成能力；视频生成上，腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频等多种能力，支持 1k~4k 的分辨率。

“有人问腾讯为何如此拥抱生成式 AI？我认为软件的未来就是生成式 AI。”刘威曾在公开演讲中表示。据悉，目前混元大模型已接入腾讯内部 700 多个司内业务应用及场景，有很多是轻量模型，如微信输入法、微信“搜一搜”、腾讯新闻、腾讯会议、企业微信等。

在推理方面，刘威认为，如果一个 AI 无法推理，人类可以写一个很长的 Prompt 告诉它如何推理，但几年后 ChatBot 可能就不再有用了。因此，AI 的推理能力必须从被动推理变为主动推理。

在刘威看来，大模型越来越大的原因是人们希望无论是多模态、单模态、听说读写还是具身智能，它做越来越多的任务。由于整个方法论范式的改变，从单任务变成了多任务、从单模态变成多模态，多网络变成了一个大网络，这便是系统性的革新。生成式 AI 的系统性变革至少包含三个维度，即方法论的变革、运算模式的变革和算力的变革。

会议推荐

就在 12 月 13 日 -14 日，AICon 将汇聚 70+ 位 AI 及技术领域的专家，深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外，还有丰富的圆桌论坛、以及展区活动，满足你对大模型实践的好奇与想象。现在正值 9 折倒计时，名额有限，快扫码咨询了解详情，别错过这次绝佳的学习与交流机会！

今日荐文

你也「在看」吗？