打开网易新闻 查看精彩图片

【导读】杨强院士:数据消耗速度远超新增库存成AI发展瓶颈,联邦学习是克服AI落地挑战的有力方法之一

中国基金报记者 吴娟娟

5月29日,智能投研技术联盟(ITL)主席、加拿大工程院及加拿大皇家学院院士杨强在中国基金报举办的第二届全球资产管理论坛上发表了题为“人工智能与联邦学习”的视频演讲。杨强表示,数据消耗速度远高于库存速度将成为AI发展的瓶颈,解决这一难题的方法之一,是通过联邦学习探索私域数据。在杨强看来,联邦学习在垂直领域问题上拥有广阔应用潜力,是人工智能赋能资产管理等行业的关键技术路径,也为全社会更广泛地分享人工智能发展红利提供了可行方案。

打开网易新闻 查看精彩图片

AI的技术路线

杨强在演讲中首先回顾了AI的发展现状与趋势。他指出,自2014年以来生成式AI进入高速发展期,其核心为在拟合数据分布基础上学习生成样本的规律,底层驱动力来自芯片算力与算法效率的提升。在此之前,决策型与分析型AI虽取得了一定进展,但规模和影响力远不及生成式AI。

他认为,目前AI的发展存在几条技术路线:

第一, 多数头部大模型企业专注于发展基座模型和大参数模型的研发,主要布局于编程、Token经济等方向,其目标是让大模型为人类服务。

第二, 新探索方向正在出现。一方面,科学家尝试降低对大量标注数据的依赖,寻找无需大规模预训练和标注的数据智能技术路径;另一方面,李飞飞和Yann LeCun(杨立昆)提出具身智能与世界模型,强调空间智能与物理一致性,认为三维物理感知与语言模型存在本质差异;此外,David Silver(AlphaZero领导者)创办“Ineffable Intelligence”,其AI系统通过强化学习在环境中自主试错,不依赖人类生成数据,目标是实现超级智能的自主发现与科学突破。

第三, 企业正在加速AI应用落地。Anthropic和OpenAI近期成立咨询公司,推进企业级AI应用。他们认为,大模型不仅需要通用智能,还需本体知识库,以及迁移学习和联邦学习的协同支持。

AI发展的瓶颈与企业落地困局

杨强指出,目前AI发展的瓶颈之一是数据消耗速度远高于库存速度。他援引预测表示,三年内人工标注和数据积累将大幅落后于AI需求。

破解这一困局有多种思路:其一是探索私有数据,通过联邦学习等技术在保护隐私前提下建立模型;其二是超级智能(ASI),让模型在现实环境中自主学习,而不依赖大量预训练数据(代表人物为David Silver)。

杨强重点介绍了第一种思路。

他指出,解决现实问题通常需要多个智能系统协同。然而,在多智能体环境中,安全边界至关重要。若忽视边界可能引发系统性风险。MIT 2025年底发布的报告印证了这一判断。该报告显示,95%的美国企业AI投入未产生实质回报,仅约5%的企业实现显著营收增长,这些企业通常聘请AI咨询公司贯穿业务全生命周期。

某国际科技公司指出,AI ToB业务容易陷入“死亡陷阱”,原因在于客户需求含大量非标准化、低频次、个性化需求,而这些需求任务营收偏低,最终导致“业务越多,亏损越大”的恶性循环。

迁移学习与联邦学习的破局优势

杨强认为,打破僵局的关键在于模型能够举一反三,将从A任务中学习到的知识使用到B任务。若模型在每个业务应用中获得可迁移知识,则新任务不会显著增加企业成本。规模效应随之显现。业务越多、亏损越大的循环可被打破。

实现这一目标需要本地和云端同时构建统一的认知。业内用本体(Ontology)表达这种认知。本体包含三个维度:数据维度—— 物体、人物、特征及其关系;逻辑维度——事物间的因果、先后关系;行为维度——企业业务流程与操作范式,可用工作流形式呈现。

迁移学习模式下,模型将已有知识应用于新领域,同时吸收旧任务经验。大模型预训练本质上也使用了迁移学习方法。它通过少量数据微调即可快速适配现实场景。此外,结合知识蒸馏可将模型部分知识应用于垂直领域。

不过,迁移学习虽重要,但仍不足以应对多小模型整合与数据隐私保护问题。联邦学习的作用在此凸显。联邦学习解决了“数据不动,模型动,原始数据不出域”的问题,包括横向和纵向架构。通用大模型可与本地垂域小模型协同,既可由大模型提供“教师指导”,也可由本地模型反馈知识,循环迭代实现迁移学习、分层学习和知识蒸馏,兼顾隐私与效率。

商业应用案例与“可信联邦学习”展望

联邦学习已在商业领域成功应用。

记者查询公开信息发现,2025年8月,全球知名金融机构摩根大通Kinexys与纽约梅隆银行合作Project AIKYA,联合训练AI异常检测模型,无需共享敏感交易数据。实验结果表明,联邦训练模型性能优于单一机构独立训练模型,同时跨机构欺诈模式得以识别。Kinexys首席技术官Suresh Shetty表示,许可区块链网络上构建联邦协同模型,可让贡献者和使用者共同受益。

杨强指出,目前,联邦学习落地仍面临隐私泄露、数据投毒、模型造假等挑战。他提出“可信联邦学习”范式,强调保护隐私、提升算法效率、兼顾模型性能,并保证决策过程可解释、可审计、公平。他形象比喻:“要养出性能最优的羊(AI模型),它必须吃够多样青草(数据)。若羊走了几十个牧场,每个牧场喂草,最终羊出问题,如何追溯问题草源?如何提供完整、可追溯、不可篡改证据?做到这一点,才能安全商用。”

为推动可信联邦学习的研究与落地,杨强领衔的香港理工大学人工智能高等研究院(PAAI)于2026年4月1日成立下属联邦学习研究院(RIFL),该研究院核心研究方向包括以下四个方面。其一,基础联邦学习研究。 纵向与横向联邦学习理论、框架与基础设施。其二,联邦大模型与智能体。 融合基础模型与领域模型,解决隐私、效率及异构性问题。其三,面向医疗的联邦学习应用。 基于敏感分布式数据的医疗诊断与科学发现。其四,面向科学的联邦学习应用。 商业与金融统计建模、数据合成及商业智能。

最后,杨强总结道,联邦学习与迁移学习、本体知识库的结合,能克服AI落地挑战。未来,团队将继续推动联邦学习在金融、医疗、制造等领域应用,为社会赋能。

编辑:赵新亮

校对:王玥

制作:舰长

审核:陈墨

版权声明

《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。

授权转载合作联系人:于先生(电话:0755-82468670)