前言

公众号断更很久了,本来立flag一月一更的,木有坚持下来。

这篇文章去年8月就写好了,放了1年多一直没发。内容上不够全面,权当一个思路上的参考吧。

在利用新数据分析技术处理类财务场景的问题时,如何兼顾理解算法、财务指标的含义?

背景介绍

2019年1月,康得新因无力按期兑付15亿短期融资券本息,业绩真实性存疑,引发各方关注。2019年7月,证监会下达《对康得新作出处罚及禁入告知》,康得新在2015年至2018年期间共涉嫌虚增利润总额达119亿元。

康得新财务舞弊持续时间之长、金额之大、手段之恶劣,震惊资本市场。自无法兑付本息业绩存疑后,大量新闻媒体对康得新造假进行了各种事后财务分析,但曾经的白马股爆出如此巨雷,对资本市场及广大股民的伤害已难以挽回。

资本市场存在大量公开数据,本文主要探讨:

1、是否可以利用上市公司公开数据,构建机器学习模型,量化财务舞弊风险,达到财务舞弊事前防范、预警的功能

2、注册会计师对康得新财务舞弊年度的审计报告,均出具了标准无保留意见,审计失效。是否可以通过财务舞弊风险的量化,减少注册会计师的主观判断,降低审计框架中注册会计师职业判断所带来的审计风险

理想的解决方案:

构建机器学习模型,输入足量上市公司历史的正常、舞弊财务数据供模型学习;

利用学习后的模型判断某上市公司财务数据是否舞弊。

一、实现思路

1、数据获取:使用Python获取康得新自2007年至2019年披露的所有公开财务指标数据(年报、半年报、季报)

数据来源:调用巨潮资讯-数据超市API接口,自动获取康得新各年度财务指标。

2、数据清洗:从康得新50余项指标中,选取杜邦分析法及其他核心财务指标作为机器学习模型的数据特征。

选取结果:净资产收益率、净利率、总资产周转天数、产权比率、营业收入增长率、三费比重、存货周转率、应收账款周转率、每股收益、每股现流。

3、构建模型:使用scikit-learn库,将选取的康得新财务指标作为数据特征,构建机器学习模型。

二、机器学习

1、模型的目的:

给定一条康得新年度财务指标数据,机器学习模型自动判断该年度财务指标是否舞弊

典型的二分类问题,使用的算法:决策树、线性回归。

2、数据处理:

获取康得新财务数据共43条,将2007年至2014年、2019年数据分类为未舞弊(23条),贴上标签“正常”(量化值0);2015年至2018年数据分类为舞弊(20条),贴上标签“舞弊”(量化值1)。

3、构建模型

使用sklearn包中的train_test_split模块,将43条数据随机分为训练集和测试集,训练集用来构建机器学习模型,测试集用来评估模型的精度结果。随机分配结果:训练集32条(20条正常、12条舞弊数据),测试集11条(3条正常,8条舞弊数据)。

4、评估模型精度

使用训练集数据构建机器学习模型后,将11条测试集数据输入机器模型,评估模型精度。机器模型输出的预测标签结果为[1 1 1 0 0 1 0 0 1 1 1](0正常、1舞弊) ,测试集实际的标签值为[1 1 1 0 0 1 1 0 1 1 1],仅第七条数据预测结果错误(实际值为1,预测结果为0),模型测试集精度达到91%。

三、模型分析

在传统财报分析中,我们更关注财务指标与目标公司间的因果关系。但数据量足够大时,机器模型可通过数据间的相关性来进行判断和预测分析。

我们可以利用决策树算法模块中的export_graphviz函数将构建的决策树可视化,深入理解决策树模型判断是否舞弊时的过程:

图中每个节点的samples给出了该结点中的样本个数,values给出的是每个类别的样本个数。观察应收账款周转率<=3.045分支左侧的子结点15个样本(4个正常、11个舞弊),左侧其余分支通过存货周转率、资产收益率将15个样本中的正常、舞弊样本更精细的分离出来。

另外,我们可调用决策树模型的feature_importance_参数,检查模型的特征重要性,总结决策树的工作原理,即判断康得新训练集数据是否舞弊时所依赖财务指标的比重。

通过检查模型的特征重要性,我们可以看出机器学习模型在判断是否舞弊时,主要依据应收账款周转率(51.79%)、存货周转率(30.48%)、净资产收益率(17.73%)。

(是不是正好是财报审计中高舞弊风险的指标)

四、结语

本文构建的机器学习模型仅为验证财务舞弊风险量化的思路,过程略显粗糙,仍存在许多问题:

1、数据量不足:只选取了康得新本公司的财务指标数据构建机器学习模型。若选取康得新所在同行业所有公司的财务指标,更有意义。

2、数据特征选择上只是主观简单选取财务指标,未具体考虑财务指标间的关联关系。

3、算法选择:未充分考虑所选算法的适用性。

- END -

来源:一只强仔仔,审计之家编辑整理。版权归原作者所有(如有转载,请注明以上信息)。

版权说明:如涉版权问题,请与我们联系,谢谢!

温馨提示:加入审友交流群/转载/投稿请联系:审家小编 shenjizhijia1。