APP下载

基于机器学习的研发型制造业财务风险预警研究

2023-11-07北京工商大学商学院闽江学院新华都商学院柯剑闽江学院新华都商学院王琦琦

管理会计研究 2023年5期
关键词:预警制造业转型

文 · 北京工商大学商学院 闽江学院新华都商学院 柯剑 闽江学院新华都商学院 王琦琦

一、引言

制造业作为我国实体经济的核心,其发展质量和水平对我国经济的发展起到举足轻重的作用。2022年,我国制造业增加值占全球比重近30%,制造业规模已经连续13年居世界首位。但同发达国家的先进制造业相比,现阶段我国制造业在许多方面都存在明显差距,总体水平还处在全球产业链的中低端(胡迟,2019),且面对全球贸易环境恶化、已有劳动力低成本优势减弱、创新能力不足、中低端和无效供给过剩、高端和有效供给不足(黄群慧,2017)等问题,传统制造业企业迫切需要加大以创新为导向的技术研发来实现转型升级,提高制造业发展质量和水平,以适应不断变化的内外部环境。以创新为导向的技术研发,包括新产品、新生产工艺以及新生产制造技术的研发。随着数字经济的发展,为提升转型效率,制造业企业加大对大数据、人工智能、移动互联网、云计算等数字技术的投入来助力企业技术研发,使得企业投入大量的资金到企业的数字化转型中。同时,在制造业企业技术创新的过程中,企业面临着全新的生产制造平台的变革。这个平台既包括制造智能化(生产制造过程的数字化),也包括运营管理过程中管理信息系统的数字化,这又会使得传统制造业面临成本上升、产品竞争更激烈的问题,从而使得其以前的规模效益曲线下降。为改变这一现状,传统制造业企业更加需要投入大量资金进行数字化转型。而在研发投入和数字化转型投入增加的双重压力下,企业将面临未来不确定竞争环境中的财务风险,因此亟须构建研发型制造业财务风险预警系统,动态预测企业的财务风险。

对于财务风险的预测是多数企业关注的重要问题。已有的风险预测方法主要可以分为两类。第一类是以财务比率为基础的财务预测指数方法。此类方法从关注单变量关键财务指标不断演化发展为关注多变量判别方法预警模型(Beaver,1966;Altman,1968),其中广泛应用的Z-Score 模型具有较为综合的评价效果。近年来,随着大数据分析技术的发展,构建机器学习的风险管理预警模型逐渐成为第二类预测风险的方法。孟杰(2014)通过随机森林与支持向量机等其他4种机器学习方法财务预测结果的对比,发现相比于其他常用的财务预警模型,随机森林模型的预测精度更高,稳健性更好。刘玉敏等(2017)利用粒子群算法(PSO)优化支持向量机算法进行财务危机预警。刘玲莉 等(2021)利用本福特定律的随机森林,为上市公司危机预警研究提供新视角。

可见,国内外学者对于财务风险预警的研究在不断发展。由于当前企业所处的运营环境日益复杂,已有的预警模型中对于制造业企业生产经营活动所面临的多种叠加因素的影响的反映不够充分,尤其是,既要反映企业数字化转型提高生产运营效率获得行业竞争优势所面临的资金投入压力,还要同时反映企业适应产品创新和生产工艺创新为主的技术创新研发投入压力。因此,常见的财务风险预警模型无法满足研发型制造业财务预警的需要。所以,本文基于制造业企业面临的转型环境特征以及风险管理框架中的风险源评估要素,提出基于拓展的风险源分析框架的财务预警模型,结合应用机器学习测度工具,有针对性地提高对当前研发型制造业企业的风险预警模型的预测价值。

二、研发型制造业财务风险成因及财务风险预警体系现状

(一)研发型制造业企业财务风险成因

根据国泰安数据库的数据,在数字化转型背景下,制造业企业的研发投入强度(研发投入占营业收入的比重)加大。如图1所示,2017年沪深A股制造业平均研发投入占营业收入的比重仅为4.80%,2020年达到近5年的最高值,为27.46%。尽管2021年研发投入强度有所下降,但仍是2017年数值的3倍左右。本文对2017—2021年沪深A股制造业企业的混合样本数据进行统计,得到“研发投入强度”指标的75%分位点数值为6.29%,按照分位数分类的原则,将“研发投入强度”指标处于高分位(75%分位数)以上的样本分类为研发型制造业企业样本。随着研发投入的加大以及数字化转型的不断深入,企业将面临在未来不确定竞争环境下的财务风险。研发型制造业企业财务风险成因主要表现在以下几个方面。

图1 2017—2021年制造业研发投入强度平均比重

1.营运资金压力大,面临供给不足

随着数字技术的迅猛发展,在数字经济的浪潮推动下,制造业企业之间的转型竞争日趋激烈。在经济下行以及同行竞争压力下,为避免被市场淘汰,有些企业可能在未提前做好资金规划的情况下盲目开始转型。而数字化转型的实施,又离不开资金的支持,研发型制造业企业本身所面临的资金压力就很大,如果盲目开始转型,预期收益更加不稳定,需要维持日常运营的资金压力更大,资金链可能面临断裂,造成现金流风险。

2.创新研发的成效存在着较大的不确定性

制造业自主创新局限于少数龙头企业,制造业普遍缺乏自主创新的核心技术(唐琼,2022)。企业的研发资金,一方面,受到技术约束等条件的影响,需要不断地投入以实现技术的突破;另一方面,企业研发周期长,预期收益不稳定,为维持日常研发需要,需要大量的资金支持,这使得新产品投放市场的转化率低,短期内研发资金的投入与新产品市场的转化率不成正比,而为维持日常的运营,企业将会面临较大的偿债压力。

3.以财务报表为基础的风险预警体系测度效率不足

处于转型阶段的制造业企业,对数据要素的认识还不够深入,它们往往对公司财务数据较为重视,而忽视非财务因素对财务风险体系构建的重要影响,使得财务风险预警体系对非财务指标反映不足。仅局限于财务数据,使得以财务报表为基础的风险预警体系测度效率不足,企业无法建立全面、动态的财务风险预警体系,尤其随着企业的发展和所处经营环境的不断变化,当前的财务风险预警体系在企业内部使用中普遍面临着失效的问题。

(二)当前财务风险评价体系存在的不足

现有的财务风险评价指标体系构建视角较为单一,且普遍更重视企业传统财务数据,而对企业的研发能力、公司治理等指标的量化评价存在不足,没有对企业所面临的风险源做出有效的分类和评价。同时,在指标选取时,往往注重预警模型构建时增加指标选择的数量,而忽视了指标之间的相关性,造成指标选择冗余,进而影响模型的运算效率。此外,现有的评价指标中,对于动态分析考虑不足。

三、基于机器学习的随机森林方法

面对企业各类数据,运用机器学习能够有效提升预测的质量和效率。机器学习的能力还可以根据数据的不断更新得到升级。随机森林作为一种常见的机器学习方法,拥有很好的抗噪声能力,即使在不用降维的情况下,也能够处理高维度的数据,准确率较高,而且能够得到每一个指标的重要性测度值。通过对指标重要性测度值的排序和可视化,可以更直观地找到影响企业财务风险的关键指标。因此本文选用基于机器学习的随机森林方法来构建研发型制造业财务风险预警模型。

随机森林是一种组合学习的机器学习方法。2001年Leo在“套袋法”的基础上提出随机森林方法。“套袋法”使用bootstrap来搅动数据,对训练数据进行有放回的再抽样,得到K个样本,且每个样本的容量均相同;然后根据所选样本估计N棵不同的决策树,最后将N棵决策树的预测效果进行投票,得出分类结果。随机森林在“套袋法”的基础上,优化决策树节点的分裂方式,在每个节点进行分裂时,仅随机选取部分变量(m个)作为候选的分裂变量,在下一个节点再次随机选择(可能不相同的)m个变量作为候选的分裂变量,以此类推,对随机森林中的每棵决策树都如此操作,最后将每棵决策树的预测效果进行投票,得出分类预测结果。

四、基于机器学习的研发型制造业财务风险预警系统的构建

(一)机器学习样本数据选择

机器学习的学习能力依赖于样本数据的质量,因此需要通过选择典型或代表性样本作为训练集来使模型获得学习能力,模型预测效果使用测试集来检验。按照分位数分类原则,以大于2017—2021年沪深A股制造业企业混合样本中“数字化转型指数”指标75%分位数43.85为界,筛选出数字化转型背景下的制造业企业样本。企业是否面临财务风险以“Z-Score”指标值作为判断依据:小于1.8的标记为面临财务风险的制造业企业样本,大于“Z-Score”指标75%分位数5.73的标记为财务正常企业样本。剔除退市和数据严重缺失的企业,共取得242家制造业企业的543个面临财务风险样本,259家制造业企业的592个财务正常样本。样本数据来源于国泰安(CSMAR)和万得(WIND)数据库。

(二)基于拓展的风险源分析框架的风险测度指标体系构建

风险评估是对企业资产面临的威胁、存在的弱点和弱点造成的影响,以及三者综合作用而带来的可能性以及影响程度的评估。在进行风险评估的过程中,有几个关键问题需要考虑:一是每项资产可能面临多种威胁;二是危险源可能不止一个;三是每种威胁可能利用一个或多个弱点。因此,基于拓展的风险源分析框架中“风险评估”这一重要内容以及研发型制造业企业数字化转型过程中面临的环境特征的因素,本文从投入产出效益、债务压力、成长性、资产运营效率、现金流、创新效率、公司治理环境以及融资约束的角度,提出对数字化转型环境下研发型企业风险源的分类和主要风险测度指标的选择,如表1所示。

表1 主要风险测度指标

续表

为进一步明确关键指标,根据指标选择的有效性原则,本文对主要风险测度指标进行主成分分析筛选。首先分析缺失值,然后对剩下的数据进行正态检验和显著性检验,最后利用主成分分析法对指标进行进一步的筛选。通过分析本文数据,删除缺失值>10%的指标X10、X14、X17、X18、X20;然后剔除没有通过显著性检验的指标X19、X26和X33;最后经过主成分分析法后,筛选出的财务风险预警关键指标如表2所示。

表2 财务风险预警关键指标

(三)构建基于机器学习的研发型制造业财务风险预警模型

根据前文关键指标数据的筛选结果确定模型最终的输入变量X和Y。其中X为样本数据的9个财务风险预警关键指标,Y为企业是否会面临财务风险,以Z-score值进行划分:面临财务风险样本标记为1,财务正常样本标记为0。在训练集和测试集的划分上,本文按照7:3的比例,将70%的样本数据用于训练模型使其具备预测能力,30%的样本数据用于验证模型的预测效果。由于数据样本为不平衡数据,其中面临财务风险的样本量为543,财务正常的样本量为592,因此为减少数据不平衡造成的模型预测结果不准确问题,本文采用欠采样(undersampled)法对样本数据进行平衡处理。经过平衡处理后,模型样本数据集内两组数据比例为1:1,即包含543个面临财务风险的样本和543个财务正常的样本。

(四)随机森林模型预测结果分析

为了评估随机森林模型识别财务风险预测的结果,选择准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1得分作为评估模型性能的指标。假定TP和TN分别代表预测正确的面临财务风险的样本和财务正常样本的数量,将FP和FN分别代表预测错误的面临财务风险的样本和财务正常样本的数量。表3为评估指标具体计算公式。

表3 模型性能评估指标

根据训练集训练的好的模型,将测试集数据输入模型中进行分类预测,将得到的预测分类值与实际的分类值进行对比,如表4所示。模型测试集评估指标结果如表5所示。

表4 随机森林模型测试集预测结果混淆矩阵

表5 随机森林模型测试集评估指标结果

从表4显示的预测结果可知,在测试集中,8个面临财务风险的样本被错误归入财务状况正常类;同时,19个财务状态正常的样本被错误归入面临财务风险类。根据表5数据综合来看,随机森林模型整体预测准确率为92%,预测准确率较高,可以用于研发型制造业财务风险预警模型的构建。

(五)关键风险预警指标重要性测度

虽然最终的关键财务风险预警指标只有9 个,但是每个指标对于风险预测的贡献程度是不同的。为能更好地对企业财务风险进行监测,弄清各指标的重要性,本文通过随机森林模型进一步测度每一个关键指标的重要性。

图2 为制造业的财务风险预测过程中得到的指标重要性排序情况。其中排名前三的指标分别是总资产净利润率、财务费用率、研发投入占营业收入的比例。结合我国制造业数字化转型过程中制造业企业研发成本高、成果转换周期长等特点,这些指标为判断企业是否面临财务风险提供了有效参考标准。

图2 随机森林模型指标重要性

五、案例应用分析

为进一步验证模型的适用性,按照前文对研发型制造业企业样本的分类标准,本文在已有数字化转型背景下制造业企业样本的基础上,筛选出研发型制造业企业的样本数据集,并将该数据集作为测试样本应用于建立好的模型中。该数据集包含2017—2021年157家未面临财务风险的研发型制造业企业的331个样本以及94家面临财务风险的研发型制造业企业的167个样本。其中,面临财务风险的94家企业中,C39计算机、通信和其他电子设备制造业面临财务风险的数量最多为32家,排名第二的行业是C35专用设备制造业,数量为28家,如图3所示。

图3 研发型制造业企业行业分布

将上述数据集作为测试集输入模型,得出的预测结果如表6所示。从表6可以看出,该模型的总体判断率为98%,所以该模型可以用于研发型制造业的财务风险预测,模型指标体系较为理想。

表6 研发型随机森林模型测试集预测结果

为能获取模型在公司实际应用中的具体效果情况,本文通过已有数据集,在C39计算机、通信和其他电子设备制造业中选取Z-Score值最大的企业和最小的企业的9项指标作为验证数据,分别输入前文已建立好的基于随机森林的财务风险预警模型中,分析该公司的财务情况,验证财务预警模型的实际应用效果。为避免给两家公司带来的影响,本文将两家公司分别命名为M公司和N公司。M公司是一家致力于信息探测、处理与传递领域的技术和综合应用的企业,具备齐全的科研生产资质和认证,与多家科研院所和高校建立了战略合作伙伴关系,成立了联合实验室、工程中心。N公司是一家从事计算机、OLED平板显示、显示屏材料制造、通信设备、光电子器件、电子元件、其他电子设备、模具、电子和电工机械专用设备、医疗仪器设备及器械、输配电及控制设备的研发、设计、生产、销售和售后服务的企业。

为了实现对上市公司财务风险的动态监测,本文选择M公司和N公司2021年度的9项财务指标代入已搭建好的基于机器学习的财务风险预警模型中,进行了不同随机数的200次重复实验,分别计算预测两家公司每一次实验面临财务风险的概率P。P 值范围为0到1,P值大于0.5 判断该上市公司面临财务风险,P值小于0.5判断为正常。两家公司的9项财务风险测度关键指标的具体数据如表7所示。

表7 M公司和N公司财务风险指标值

图4和图5分别为M公司和N公司200次不同随机数下财务风险预警模型预测该公司财务面临风险的概率的结果。其中M公司200次重复实验中,预测该公司面临财务风险的最大值小于0.5,说明该公司状况正常;N公司200次重复实验中,预测该公司面临财务风险的最小值大于0.5,说明该公司财务面临风险。且2021年N公司的Z值仅为-0.02,说明该模型能有效分辨公司是否面临财务风险,能满足上市公司的实际应用。

图4 M公司财务风险预警结果

图5 N公司财务风险预警结果

六、结论及建议

(一)结论

数字化转型已成为当前各行各业关注的重点。本文以我国制造业企业为例,结合制造业数字化转型的背景,以Z-score值为判断是否面临财务风险的标准,选取2017—2021年沪深A股242家面临财务风险的制造业企业样本以及259家未面临财务风险的制造业企业样本,基于制造业企业面临的转型环境特征以及风险管理框架中的风险源评估要素,提出基于拓展的风险源分析框架的财务预警模型,从投入-产出效益、债务压力、成长性等多个角度提出对数字化转型环境下研发型制造业企业的风险源的分类以及选择主要风险测度指标,并通过主成分分析法进一步提炼9项关键指标,借助python软件进行基于随机森林算法的机器学习模型训练。后进一步选取研发型制造业企业数据集以及两家代表性研发型企业分别对模型适用性进行检验。研究结果显示:①随机森林模型总体预测准确率为92%,预测效果较好;②研发型制造业的总体预测准确性为98%,模型具有较好的适用性;③将财务风险预警模型应用于两家研发型制造业企业,发现该财务风险预警模型能够完成对财务风险发生概率的预测,实现对上市公司财务风险状况的动态监测,实际应用价值高;④研究发现总资产净利润率、财务费用率、研发投入强度为财务风险预测贡献程度前三的指标,表明企业在日常财务风险的监测过程中,应着重关注这3项指标。

(二)建议

1.完善财务风险预警系统,制定科学合理的财务风险预警指标

财务风险预警系统的建立,能帮助企业及时监测可能的财务风险,做到“早发现、早预防”。我国上市公司的财务风险系统还存在着一些问题,如财务指标单一、不符合公司自身特征等。尤其是在经济下行的大环境下,企业面临的外部环境日益复杂,企业亟须制定一套符合自身经营状况的全方位、科学合理的财务风险预警系统,为实现企业的高质量发展提供重要的保障。尤其是如今的数字技术日益成熟,企业要利用好数字资源,不断提高财务风险预警系统的准确性、及时性。

2.提高运营效率,提升研发创新效率

随着数字化转型不断深入发展,研发型企业一方面面临产品研发投入的资金压力,另一方面也将面临数字化转型投入的资金压力。在双重压力下,企业的内部运营资金可能面临不足,需要转向外部发行债券等方式筹集资金,而这种筹资方式会让企业债务负担大,一旦企业未及时偿还债务,必定会加大企业的偿债压力和风险。因此,企业要拓宽资金的来源和渠道,提升现金流的水平,避免资金链发生断裂。

3.数字化转型要立足自身实际情况,切忌盲目转型

研发型制造业企业在数字化转型过程中,一方面想通过数字化转型这一途径来提升研发能力,打破“低端困局”;另一方面在数字化转型的浪潮中,不转型就会面临被淘汰的困境,因此部分企业未对自身情况进行评估,错误地选择数字化转型的方式,导致数字化转型效率低下,无法满足投资者的预期期望。因此,企业要结合自身的发展状况来选择数字化转型的方式,切记照搬他人的转型模式。

猜你喜欢

预警制造业转型
冰雪制造业的鲁企担当
转型发展开新局 乘风破浪向未来
航天器在轨管理模式转型与实践
喜看新中国七十年突飞猛进的制造业
法国发布高温预警 严阵以待备战“史上最热周”
转型
园林有害生物预警与可持续控制
沣芝转型记
机载预警雷达对IFF 的干扰分析
2014上海民营制造业50强