原标题:将搜索引擎的机器学习技术用于风控,氪信希望指数级提高金融模型的训练效率

氪信的创始人朱明杰之前是搜索引擎的数据工程师,现在他把技术应用在了金融风控上,近期获得了真格基金 700 万人民币的天使投资。

氪信的产品包括非或然引擎(下文简称 “引擎”)和 XCloud 两部分,“引擎” 是一套数据模型处理系统,解决的是不同场景下的风控模型校正问题。以物流行业为例,通过输入企业 ERP 数据、位置信息数据等场景内数据,以机器学习的技术调整各数据维度的权重,从而建立针对场景的风控模型。

XCloud 是一个数据收集和整理系统,对接身份信息、个人信用信息等通用信息,同时可以输出一个普适的模型,也可以为 “引擎” 建模提供外部数据基础。氪信对传统场景的贡献首先在于对其数据进行了适配和存储,提炼出有风控意义的指标,以供未来使用。

据朱明杰介绍,机器学习的模型和统计的做法完全不同。初期通过业务人员的辅助,以半监督式的学习方式,机器的学习速度可以达到传统模型的上百倍,传统上金融机构需要十万个样本才能建立的模型,机器只需要几千个样本就够了。

目前氪信的 “引擎” 输出的是授信额度和违约概率,供金融机构进行决策参考。朱明杰表示,他们和一些 P2P 公司进行了测试,其综合衡量准确率和召回率的 KS 指标明显高出同类产品。长远来讲,氪信希望用技术解决场景化的风控问题,建立完全数据化的风控模型,不再依赖人力进行风控审核,从而提高信贷的效率

“海量数据的处理能力是我们的核心技术。” 朱明杰说。朱明杰曾在雅虎、eBay 搜索做了 10年 的数据挖掘、机器学习工作,据他介绍,搜索引擎需要服务数亿用户,理解用户真实的搜索意图,其数据维度通常有数万个,而其负责训练机器进行学习的人员可能仅有上百人。金融风控方面的数据维度明显少于搜索引擎,因此做金融模型算是能力降维。

信贷本身是一个体量大、需求旺盛的市场,分拆到不同的场景,其规模仍然很可观,仍然拿物流举例,其行业规模占到 GDP 的 18%,这一个场景就可以支持数千亿的信贷规模。目前氪信对 XCloud 按照流量进行收费,而对非或然引擎根据定制程度按套收费。

朱明杰毕业于中科大少年班,微软亚洲研究院博士,曾在德国马克思普朗克研究院从事大规模数据挖掘工作。COO 孙楠曾在海外工作数年,回国后负责携程的国际网站。目前氪信服务物流、供应链、商户贷、房产等几个领域,已与民生银行、证通、小赢理财、爱屋吉屋等 10 几家机构达成合作。

我是 36 氪专注报道互联网金融和教育行业的作者 Justin,欢迎大家与我联系,切磋讨论。我的微信是 :196215239

原创文章,作者:老扎,如若转载,请注明出处:http://36kr.com/p/5044919.html

“看完这篇还不够?如果你也在创业,并且希望自己的项目被报道,请戳这里告诉我们!”