来源:市场资讯

(来源:网易智能)

2月6日消息,近日,针对首个面向信贷场景的多模态评测基准FCMBench-V1.0相关话题,奇富科技联合复旦大学、华南理工大学研究人员进行了直播研讨。作为奇富科技多模态负责人杨叶辉表示,AI是工具,而金融、医疗这样的高门槛行业则是足够“肥沃”的土地。正因为金融业务对隐私、安全与合规有着天然的高要求,模型能力是否真的可靠,不能只靠“自说自话”。

评测先行,本质上是在做一把尺子。”杨叶辉谈到,当前金融机构在选择模型和方案时,常常陷入“不同模型分别声称得到了95分和98分,到底哪个好?”的困惑。没有统一、公平、公开的评测体系,决策就容易失焦。FCMBench的价值,正在于把模型拉到同一条起跑线上,让能力在真实业务条件下接受检验。

与此同时,华南理工大学许言午教授表示,很多人直觉上觉得AI在金融领域“存在感不强”,其实并不准确。AI早已深度参与保险定价、资产评估和量化交易,只是这些价值并不直接呈现在ToC产品中,因此“看不见”。许言午认为,金融行业更短的业务迭代周期,反而为模型评测和更新提供了现实土壤。他将数据集的发展分为三个阶段:先夯实数据质量,再通过学术与赛事运营形成影响力,最终获得行业层面的官方认可,成为类似托福、雅思那样的“准入门槛”。在他看来,FCMBench正处在一个极具潜力的起点。

复旦大学陈涛教授表示,深度学习真正的分水岭,并不只是算法突破,而是ImageNet的出现,让评测尺度第一次实现了数量级跃迁,终结了小数据集时代“各说各话”的局面。陈涛谈到,从数据规模、任务覆盖度到评测设计的系统性来看,FCMBench已经是目前国内金融领域,乃至国际金融AI研究中规模最大、最具权威性、同时也是少有的统一评测基准。更重要的是,它并非为某一家机构服务,而是以行业共识为目标,定义了真正有价值的问题边界。(易智)