(来源:经济日报)

转自:经济日报

近日,奇富科技发布首个面向信贷场景的多模态评测基准FCMBench-V1.0。

复旦大学陈涛教授表示,从数据规模、任务覆盖度到评测设计的系统性来看,FCMBench已经是目前国内金融领域金融AI研究中规模最大、同时也是少有的统一评测基准。它并非为某一家机构服务,而是以行业共识为目标,定义了真正有价值的问题边界。

“评测先行本质上是在做一把尺子。”奇富科技模态负责人杨叶辉指出,当前金融机构在选择模型和方案时,常常陷入“不同模型分别声称得到了95分和98分,到底哪个好”的困惑。没有统一、公平、公开的评测体系,决策就容易失焦。FCMBench的价值,正在于把模型拉到同一条起跑线上,让能力在真实业务条件下接受检验。(经济日报记者 彭江)