近日,“2024-ADD数据应用场景大会暨Talk@Taihu台湖见面会启动仪式”在北京市通州区台湖镇隆重举办,百望云受邀出席,与数据要素创业者、投资人一起走进通州台湖,共话北京副中心产业发展新机遇。

打开网易新闻 查看精彩图片

会上,百望云数字经济与金融科技研究院院长李国平、神州云合高级副总裁高林东、飞利信人工智能研究院院长林会杰、东方至远创始人兼董事长李吉平、见知数据联合创始人沈航、Datablau数语科技联合创始人&CTO朱金宝,在《释放数据价值,推动产业发展》主题对话中的精彩观点如下:

  1. 未来几年,财务部将成为企业重要数据的集中地。在所有的财务数据中,现金流数据是非常高质量的数据。企业的采购、生产、再到销售与回款这一套生态,都反映在了银行的收支流水数据里。

  2. 数据并不是天生就能被应用的。数据是日常经营活动留下的记录,这些记录通过ID系统或其他手段积累的,并不是专门为分析而设计的。从术语的角度来讲,企业要真正应用数据,通常要从供给端和消费端两端来做。

  3. 我认为算力和算法可能很快就会达到瓶颈,未来的驱动力主要在于数据。如果数据质量高,即使模型很小很简单,也能提供很好的服务。未来AI的变数都在数据上,主体也会回到企业或政府手中。掌握数据的一方,才是我们最大可挖掘的财富方。

  4. 数据是数字经济时代的生产资料,是原油,AI是发动机引擎,到底加92号还是加95号,这一选择决定人工智能的质量。

以下为现场对话内容:

林会杰(嘉宾主持):今天下午我们探讨的话题,是以数据要素为主题。在座的对话嘉宾,各自所在的企业业务也都与数据相关,包括做金融、遥感、税务相关的等等。有请各位嘉宾先做自我介绍。

李国平我是来自百望股份(股票代码:06657.HK)的李国平,今年7月份公司在港交所上市,成为港股“电子发票第一股”。百望云自2015年创立,是中国领先的票财税融一体化解决方案服务商和数据要素生态平台构建者。我们以发票数字化为切入点,在获得企业授权后,帮助金融机构基于数字交易凭证洞察用户业务情况,进行企业的风控建模、信用评分,优化风险管理措施,做好金融“五篇大文章”,助力普惠金融落地。

去年数据要素、数据资产入表的风口来临后,我们公司也正式推出了“百望云金数数据要素解决方案”,致力于解决数据要素的采集、加工、生产难题,推动数据要素的安全互换、互联。今天很荣幸有机会在台湖小镇与大家做交流。

高林东:我是高林东,我们希望在同业或者说异业合作上做一些探讨。

沈航:大家好,我是见知数据的沈航,我个人在财务自动化和银行的基础设施建设领域,深耕了近20年,很荣幸与大家交流。见知数据成立于2015年,是一家专注企业现金流数据公司,我们帮助大企业来实现银企直联,建立超级网银的资金系统。我们目前服务了许多中大型的企业,例如三一集团、联合利华、通用电气、B站、滴滴等企业,并且深耕了约24个重点行业的头牌客户,积累了大量经验。比起其他资金系统,见知数据的一大亮点是抓住了最没有行业属性的现金流数据,通过这些数据,能帮助到企业优化经营。

朱金宝:大家好,我来自Datablau数语科技,公司创建于2016年,专注于数据治理。我们服务于国内客户,涵盖金融、汽车、芯片、能源制造等多个行业。我个人在数据行业有丰富的经验,见证了数据行业从数字舱时代到BI时代,再到现在的泛化应用,包括机器人和数据知识变现。今天,我们的主题是数据要素,这也是我服务的企业一直在探索的方向。我很高兴今天能与各位领导和专家一起探讨这个话题。

李吉平:大家好,我是东方至远的李吉平。东方至远是一家看变化的公司,我们使用卫星监测技术,为政府部门提供服务,监测包括山水林田湖草在内的万物变化。我们还可以通过细微的形变,感知基础设施、地质灾害等风险,并提供预警。

林会杰(嘉宾主持):感谢各位嘉宾的分享。我补充介绍一下飞利信的业务。飞利信的业务与各位嘉宾的业务是非常互补的。我们过去做“大小空间”,“大空间”是以地理位置信息系统做的GIS系统,“小空间”是智能会议系统。

飞利信是一家在2012年主板上市的公司。近两年,我们也开始转向算力板块,建立了多个算力中心,从普算转向智算。我们期待与包括通州在内的企业家们有更多的合作机会。

回到今天的主题,数据已经成为劳动力、经济、技术等要素之外的“第五大要素”。数据要素作为贯穿整个产业链上下游的关键点,对于产业的发展有很大的促进作用。各位嘉宾,你们如何利用数据要素,去推动整个产业的发展?

李国平:百望云的业务主要分为两部分:一是面向2300万家企业提供财税数字化服务,即SaaS服务;二是数据服务(Daas),处理企业日常的订单、发票和财务上下游的对账结算,这些数据在中国云服务市场中以私有云为主,少部分互联网和偏小的公司在使用公有云,这些数据在传统的业态中,都是离散的。

在人工智能时代,算法、算力和大数据是核心要素。现在,大模型技术通过Transformer等技术,比以往的小模型有了显著进步。在中美人工智能竞争中,如何让我们的行业模型更贴近业务真实,关键在于数据价值的挖掘和利用。

2019年,一些数据商因合规问题面临风险。百望云开始探索合法合规的企业数据变现方式。因为我们为中长尾企业提供服务是不收费的,这也是扩税机、降税率的范畴。

中长尾企业需要资金支持、需要上下游结算协同,链主不能很好的发挥支持和赋能上下游资金的作用,小微散客面临融资难、融资贵的问题。在这个点上,我们找到了数据的变现点。

我们与工商银行、建设银行等国有六大行,招商银行、平安银行等十二家股份制商业银行,及全国上百家城商行和互联网金融公司开展合作。行业面临的主要问题是,如何做到普惠金融,将金融向中小微企业做倾斜和支持。

发票数据是我们的强项。在中国,B2B支付都需要开发票,企业各种经营活动也会需要发票。发票数据可以帮助金融机构识别企业信用,同时帮助金融机构进行数字化营销,为产品线上化奠定基础。

朱金宝:关于数据要素,我们服务的客户遍布全国,包括行业顶尖企业。他们对数据要素的探索代表了国内前沿的方向。

企业对数据要素的应用有两个循环:内循环和外循环。内循环主要偏管理,如查看财报和业绩增长。外循环则涉及到与其他企业的合作。

大家最早都是从内循环开始做,从2016年之后,进入了一个比较新的阶段。从算法上而言,过去大数据基本解决了基础设施的问题,还带来了机器学习算法、大模型算法等新算法。数据基本上沿着DIKW模型发展,数据要变成信息、知识再到智慧,过去主要依靠人力进行整理分析,是劳动密集的工作。大模型的出现,加速了这一过程,并且把成本降低了。

从整个内循环而言,大模型从管理到业务都进行了赋能。例如物流行业,已经有了无人速递,将信息流打通。在汽车制造业,我们用数字化追踪汽车制造的过程,包括到每一个零部件的走向,完全实现了数字化,数字化去追踪。目前,内循环已经实现了赋能生产力。

一些国企、央企也在思考,如何做外循环?数据要素过去和金融业结合比较多,现在大家想用资产化的形式放大数据要素的作用,能够更开放去合作,跟国家大形势以及其他的企业结合起来。总体来说,外循环还在探索中。

沈航:从我们行业的角度来看,企业最重要的数据集中在资金部和财务部。未来几年,财务部将成为企业重要数据的集中地。在所有的财务数据中,现金流数据是非常高质量的数据。企业的采购、生产、再到销售与回款这一套生态,都反映在了银行的收支流水数据里,对企业很重要。

我们曾经服务过一个大企业,其法人实体将近100家,海内外一共百家银行3000多个账户,光流水就有300多万的流水,在现金流领域体现了很多企业的经营行为,包括存量资金、流量资金。根据这些数据,可以优化企业的经营和投资。

李吉平:开展对地观测工作,卫星数据是基础,所以东方至远一直秉承着数据的积累工作,有着丰富的卫星数据资源。目前为止东方至远已经积累了全国范围内400余座城市长达13年的雷达卫星数据,我们能够捕捉到每个建筑物、房屋、道路的形变,推断其风险所在,形变监测精度达到了毫米量级。

随着国家对商业航天和防灾减灾的重视,东方至远也走到了一个关键的发展阶段。未来我们计划加强在上游的数据积累。因此,我们正在筹划公司自有卫星星座建设,充分挖掘大数据的价值,实现对全球的基础设施和自然灾害做到周级的反应速度,为国家大数据战略做出贡献。

高林东:找到所有数据的逻辑关系是最重要的。因此,我们在企业跟上系统之前,都要进行数据梳理,统一数据之间的关联关系,寻找业务逻辑关系,真实地去反映一个企业真实情况。由于一些数据需要企业内部授权才能使用,如海关数据和出口退税数据,所以我们先解决了企业内部的数据治理问题。随着这些应用的推广,我们正在寻找更多场景来扩展数据的外延,激活企业的数据资产,帮助他们拓展业务。这是我们的发展方向。

林会杰(嘉宾主持):刚才聊到,在数据产生的过程中,一方面是数据的确权,有些数据的权益到底是属于谁,另外一方面企业生产这个数据,能如何使用这些数据,如何让这些数据为企业、为公共平台创造更大的价值,这是当下数据要素企业面临的一个痛点。

在整个的数据的生产消费链条中,有大量的数据还没被应用起来。我想问一下,几个嘉宾,我们当下如何能够更大化的,更大化利用在生产消费各个环节中所产生的数据,为企业创造更大的价值?

李国平:这几年在百望云的数据应用探索中,发现政府手中有大量沉睡的数据,这些数据未来可以作为公共数据或数据基础设施,甚至可以作为推动中国数字经济高速发展的基础设施,为广大企业和消费者服务。而像我们这样的数商属性企业,可以在此基础上进一步提升数据的价值。

朱金宝:数据应用的链条比较长,生产数据的一方未必是用数据的一方。这就需要我们用数据治理的过程,把组织和流程连接起来,让数据信息在企业中平等地流通。大模型能够使知识平等,我们治理也希望使信息,数据所代表的信息能够平等。这是我们从两个角度来解决大量数据存在却用不起来的问题。这是一个迭代的过程,当大家使用数据时,就会再去挖掘数据,使数据变得更好。这也是随着我们投入产出,整个社会大进程逐步改善的过程。

沈航:现金流数据中隐藏着许多宝贵信息。比如,银行交易类型、企业间的支付信息,这些都能提供企业的工商信息。通过摘要和备注,也可以了解流水信息。例如,如果一家企业的支付对象是携程,那么很可能是差旅费用。我们首先要清理数据,然后对数据进行标记,在此基础上进行聚类分析。这样,我们就能真正利用起企业中最重要的现金流数据,在许多方面发现标准财务方法可能忽视的资金风险和经营风险,或者帮助企业提高运营收益。

李吉平:数据量的增加有助于推动我们研发更先进的AI模型。最初我们只能进行房屋的简单体检,现在我们可以通过AI模型对地物进行更深入的诊断,实现对数据进行价值分类和体制机制上的协调,提升了服务的价值。这既是数据深入挖掘的方向,尤其是对对地观测的空间数据的深入挖掘,同时也是未来的发展方向。

高林东:外部第三方的宏观数据如何解析和支撑企业发展,这个未来是我们探索的方向。

林会杰(嘉宾主持):最近,Scale AI年化收入已经到10亿美金,凸显了人工智能在数据生产发挥的巨大价值。请各位嘉宾简短分享一下,人工智能在数据要素过程当中,起到什么作用。

李国平:数据是数字经济时代的生产资料,是原油,AI是发动机,到底加92号还是加95号,这一选择决定人工智能的质量,还有数据的治理和规范以及价值利用。

朱金宝:因为未来的模型最终会沉淀到私域,融入企业自身的知识环境中,为企业的管理、业务生产等各个方面提供支持。我们需要保护好自己的数据,进行良好的治理,以迎接大模型时代真正到来的时刻。

沈航:我认为,AI最后产出的质量的关键,在于数据的质量,所以我们一直在帮助企业把数据清理好。第二点,我们也有一些比较简单的免费方式,给企业们快速做一个体检,通过现金流保障,帮大家捕捉到企业中的一些经营行为,优化经营。

林会杰(嘉宾主持):在数据要素领域结合人工智能,有很多的结合点与数据应用潜力,感谢各位专家的真知灼见。