APP下载

基于CNN的医药制造业财务危机预警研究

2023-06-25王晓华马悦邢东森

现代信息科技 2023年4期
关键词:主成分分析法卷积神经网络

王晓华 马悦 邢东森

摘  要:医药制造业是国家重点产业之一,具有高投入、高产出、高风险的特点。2019年新型冠状病毒(2019-nCoV)疫情暴发,医药制造业迎来了加速发展的良好契机,同时更容易诱发财务危机。规避财务风险,促进行业健康发展至关重要。文章构建了基于主成分分析法和卷积神经网络(CNN)相结合的财务危机预警模型,对73家医药公司2015—2020年的财务指标进行分析,以期为医药行业的发展提供借鉴,合理预测财务危机。这对促进医药行业健康发展,保障民生安全意义重大。

关键词:医药制造企业;卷积神经网络;财务危机预警;主成分分析法

中图分类号:TP39;F275  文献标识码:A  文章编号:2096-4706(2023)04-0014-04

Research on Financial Crisis Warning of Pharmaceutical Manufacturing Industry Based on CNN

WANG Xiaohua, MA Yue, XING Dongsen

(School of Management Engineering and Business, Hebei University of Engineering, Handan  056038, China)

Abstract: Pharmaceutical manufacturing industry is one of the key industries in the country with the characteristics of high input, high output and high risk. The outbreak of the new Corona Virus in 2019 (2019-nCoV) has ushered in a good opportunity for the pharmaceutical manufacturing industry to accelerate its development. At the same time, it is more likely to induce financial crisis. It is crucial to avoid financial risks and promote the healthy development of the industry. In this paper, a financial crisis warning model based on the combination of Principal Component Analysis and Convolutional Neural Network (CNN) is constructed, and the financial indicators of 73 pharmaceutical companies from 2015 to 2020 are analyzed, so as to provide reference for the development of the pharmaceutical industry and reasonably predict the financial crisis. This is of great significance to promoting the healthy development of the pharmaceutical industry and ensuring the safety of people's livelihood.

Keywords: pharmaceutical manufacturing enterprise; CNN; financial crisis warning; Principal Component Analysis

0  引  言

醫药行业与人民的生活息息相关,在国民经济中有着至关重要的地位。随着国民需求的不断增强与全球医药行业市场扩张,以及疫情暴发以来国家在政策上对健康产业的大力支持,与人民对健康关注度的不断提高,医药行业已逐渐成为增长最快的行业之一[1],2020年中国医药制造业共有规模以上企业7 665个,较2019年增加了283个,同比增加3.8%。2020年,医药制造业的营业收入达24 857.3亿元,较2019年增加了973.14亿元,同比增长4.07%。2020年以来,新冠疫情在全球范围内爆发并蔓延直至今日,这种全球性的传播引发了各界对医药行业的关注,同时使行业面临更大的竞争压力。医药制造业是典型的“三高”行业,行业财务风险远高于平均水平,而且我国医药制造行业处于向高质量转型阶段,国际同质化竞争加剧、创新研发能力严重不足等使无数医药制造企业更容易遭受财务危机,利用CNN对医药制造业进行财务危机预警,有利于提高企业资金利用率,对防范和化解制药企业财务风险,保持企业健康、稳定和快速发展,具有极为重要的现实意义。

自20世纪30年代,学者们主要采用趋势分析法进行财务危机预警,即研究发生财务困境的公司和财务状况健康的公司关键财务指标的变化趋势[2]。之后渐渐发展出包括单变量分析方法[3]和多变量分析方法等的判别分析模型。但不管是Logistic模型[4]还是多元判别分析[5]等统计学方法,其识别和评价效果受统计假设的限制;层次分析这类的风险评价方法效果会受到主观赋权法的影响;TOPSIS[6]等具有客观赋权的特点,在变量指标少的时候有较好的评价效果;上述所提到的模型与方法均无法有效的处理大数据下的海量财务数据,并且大多数仅能用于短期预测,无法满足医药制造上市公司长期持续发展需求。因此,针对医药制造业高投入、高产出、高风险、高技术密集型的特点,本文提出构建基于CNN(卷积神经网络)在处理大数据尤其是非线性数据上具有很高的准确率,利用CNN可以快速识别数据并从中提取特征。基于CNN优秀的特征识别和评价分类性能,并结合主成分分析法对指标进行选取,以减少CNN模型的输入参数,降低输入因子间的相关性。探索在财务危机管理领域的运用,对弥补传统方法的缺陷,提高财务风险管理的效率。

本文的目的是構建基于CNN的医药制造业财务危机预警模型,结合主成分分析法提高模型准确率,以期能帮助医药制造业企业合理预测财务危机,制定相应对策,规避财务危机,并为CNN在财务危机预警方面的应用提供新的思路。

1  样本及指标的选取

本研究选取了73家2015—2020年中国沪深A股医药行业上市公司,以企业是否被ST作为划分企业是否发展财务危机的标准,将企业连续两年净利润小于0而被实施ST的企业视为财务危机企业,将非ST的企业视为财务健康企业[7]。

本研究采用企业(t-2)年的财务数据作为样本预测企业是否在第t年会被ST。样本具体包括2015—2020年被ST的10家企业,并按照1:6的比率,选取了63家资产规模与ST企业相似的非ST企业作为财务健康的对比样本,合计为73家企业数据作为样本,并安装1:5的比例提取测试集与训练集。在训练中,将判断为ST的企业输出的结果记为0,非ST企业记为1,最后将结果与企业实际数据进行对比,计算模型预测准确率。

本研究的数据来源于CSMAR数据库中的“财务指标分析版块”。结合其他学者研究成果的基础上,进行指标的选取。最终确定6个一级财务指标为:盈利能力、营运能力、发展能力、偿债能力、现金流量状况、比率结构。并在此基础上,选取33个二级财务指标,如表1所示。

2  基于主成分分析对指标体系的优化

考虑到选取出来的33个二级财务指标之间或许会有着一定的相关性,为了提高财务预警模型中指标的代表性,运用主成分分析法剔除交叉负载较高的因子,筛选出其中代表性较强的主成分指标。

如表2所示。KMO统计量为0.624,大于0.5,Bartlett球形度检验的显著性小于0.05,结果表明各因子之间存在着较强的相关性,可以进行后续主成分分析。

运用SPSS软件对上述73家医药制造上市公司的33个财务指标数据进行主成分分析,将存在较高相关性的因子剔除,筛选出具有代表性的主成分因子,从而对数据进行降维和简化处理[8]。经过第一轮主成分分析,根据旋转后的结果反映交叉负载较高的因子为F6、F7、F12、F13、F30、F31,需要剔除上述六个因子后进行第二轮主成分分析。由第二轮主成分分析法旋转后的成分矩阵可知,F27因子交叉负载较高,仍需要剔除F27因子后进行第三轮主成分分析。

因子分析中,对变量的贡献率达到70%即可作为主成分因子。本次输出结果中,8个主成分因子的初始特征值大于1,且累计特征值达到89.968%,可以将前8位因子作为主成分。

由表4可看出8个中公因子各不相关,主成分X1由F19、F20、F21、F23、F24、F25、F26解释,主成分X2由F10、F15、F22、F32解释。主成分X3由F1、F2、F3解释,主成分X4由F4、F5、F18解释,主成分X5由F11、F29、F33解释,主成分X6由F16、F17解释,主成分X7由F8、F14解释,主成分X8由F9、F28解释,通过得分系数矩阵可得出X1~X8的表达式为

X1=-0.015F1-0.009F2-0.013F3+0.043F4+0.043F5+

0.01F8-0.061F9-0.021F10+0.017F11-0.003F14+0.023F15-0.066F16-0.037F17+0.028F18+0.167F19+0.161F20+0.17F21+

0.017F22+0.104F23+0.163F24+0.152F25+0.172F26+0.034F28-0.017F29+0.065F32-0.038F33

X2=-0.012F1-0.016F2-0.037F3+0.004F4+0.01F5-0.053F8-0.016F9+0.238F10+0.036F11-0.045F14-0.285F15+0.016F16-0.017F17+0.019F18-0.027F19-0.033F20-0.048F21+0.288F22-0.013F23-0.006F24+0.005F25-0.058F26+0.011F28-0.017F29-0.342F32-0.028F23

X3=0.34F1+0.343F2+0.353F3-0.09F4+0.08F5+0.028F8+

0.075F9-0.008F10-0.014F11+0.001F14+0.022F15-0.009F16+

0.042F17+0.104F18+0.009F19+0.019F20-0.018F21-0.014F22-0.066F23-0.023F24-0.045F25+0.049F26+0.006F28+0.037F29+

0.03F32+0.046F33

X4=0.069F1+0.078F2+0.096F3+0.27F4+0.385F5-0.035F8+0.035F9-0.103F10+0.135F11-0.02F14-0.023F15-0.034F16+0.012F17+0.373F18+0.061F19+0.036F20+0.007F21+

0.057F22-0.119F23+0.04F24+0.019F25+0.108F26+0.021F28-0.049F29-0.03F32-0.034F33

X5=0.022F1+0.027F2+0.036F3+0.02F4+0.003F5-0.03F8+0.054F9-0.057F10+0.32F11+0.006F14-0.008F15-0.017F16+0.02F17-0.024F18+0.003F19-0.001F20-0.01F21+0.008F22-0.022F23+0F24-0.022F25+0.007F26-0.065F28+0.411F29-0.01F32+0.432F33

X6=0.02F1+0.007F2-0.019F3-0.059F4-0.061F5-0.16F8-

0.124F9+0.094F10-0.053F11+0.114F14+0.19F15+0.57F16+

0.371F17+0.073F18-0.031F19-0.026F20-0.101F21+0.042F22+

0.012F23-0.027F24-0.003F25-0.158F26+0.02F28-0.03F29-0.062F32+0.03F33

X7=0.035F1+0.029F2+0.041F3-0.147F4-0.007F5+0.577F8+0.056F9-0.02F10-0.146F11+0.384F14-0.048F15-0.154F16+0.221F17+0.028F18+0.009F19+0.021F20+0.058F21-0.121F22-0.08F23+0.002F24-0.077F25+0.058F26-0.135F28+0.024F29+0.116F32+0.061F33

X8=0.025F1+0.035F2+0.084F3+0.045F4-0.059F5-0.156F8+0.497F9-0.005F10+0.047F11+0.148F14+0.003F15-0.106F16+0.065F17+0.095F18-0.051F19-0.051F20-0.013F21-

0.014F22+0.15F23-0.113F24+0.053F25+0.02F26+0.554F28-0.019F29-0.003F32-0.063F33

3  构建财务预警模型

3.1  卷积神经网络模型的生成

CNN(卷积神经网络)相较于早期的BP神经网络,“参数共享”与“局部感知”是它最重要的两个优点,它的权值共享这特点能够极大程度的减少权值的数量并将整个网络模型的复杂程度最小化。卷积神经网络的成功之处在于利用空间关系减少需要学习的参数数目。在一定程度上提高前向算法的性能。在卷积神经网络中,层级结构的最低层输入一般为局部感受区域,再逐层向下传送到其他层,每层都有数字滤波器,通过它们进行数据特征的提取。假设第i层为卷积层,第i+1层为子采样层,则第i层第j个特征值的计算公式为[9]:

上面的*号实质是让卷积核k在第i-1层所有关联的特征集上做卷积运算,然后求和,再加上一个偏置参数,取sigmoid得到最终激励值的过程。b为第i层的预设值, 为第j个输入样本所对应的偏向参数。f ()为sigmoid函数,计算方式为:

对训练例(xm, ym),假定输出为 ,则网络在(xm, ym)上的均方误差为:

3.2  卷积神经网络数据处理流程图

卷积神经网络数据处理流程如图1所示。

4  结果与精度验证

本文构建的卷积神经网络模型用于训练的数据量为584条,训练集与测试集比例为4:1,即训练集467条数据,测试集117条数据。首次构建模型卷积层选用卷积核大小为5×5,深度为6。迭代下降速率初始为1,在训练过程中可设置随迭代次数逐渐减少。批处理样本数量为2。输入数据矩阵大小为41×710,其中每条数据包含33项指标数据和5项标签数据。每次进行训练的训练集为随机选取467条数据,余下数据作为测试集。

将测试集数据输入模型中,以检验该CNN模型训练的效果,并对检验结果进行测算。检验结果如图2所示,训练后的模型,最终测试结果模型的损失值最终达到0.143,模型测试集准确率达到100%。

对于神经网络模型的训练,损失值过大会对检测造成影响,过小容易导致过度拟合。该结果显示测试集的准确率相较于训练集上的准确率有小幅度提升,证明该模型具备较好的泛化能力。输出结果代码为:

Total params:698

Trainable params:698

Non-trainable params:0

Test loss:0.14269129931926727

Test accuracy:1.0

predict_label:[1,1,1,1,1,1,1,1,1,1,1,1,1,0,0]

True_label:[1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,0.0,0.0]

Process finished with exit code 0

5  结  论

本研究通过对我国沪深A股医药制造上市公司进行财务危机预测。结合医药行业特点对行业财务指标进行深度分析,运用主成分分析法对财务指标进行筛选,并输出对企业是否发生财务危机有显著影响的指标作为主成分因子,完成基于主成分分析法的行业财务危机预警指标体系的优化,然后构建基于深度学习理论的构建基于CNN的医药制造业财务危机预警模型,预测企业是否存在被ST的风险.研究发现,采用主成分法对企业预警数据进行预处理可以剔除干扰指标信息,大幅度提高模型的训练率.研究建立的模型测试集的准确度达到100%,有较高的准确率,在识别健康公司与财务危机公司上有较好的效果。且所构建的模型能够帮助医药制造业企业合理预测财务危机,规避财务危机,这对促进医药行业健康发展,保障民生安全意义重大。

本文构建的模型还有很多需要改进的地方,比如模型的数据量较少,目前只研究了医药制造行业,没有研究其他行业的样本数据,对于卷积神经网络模型的构建还可尝试其他的激活函数与池化方法。

参考文献:

[1] 曾铮.中国医药产业发展概况及其趋势研究 [J].经济研究参考,2014(32):4-38.

[2] 宋歌,马涛.基于深度学习的上市公司财务风险预警模型研究 [J].价值工程,2019,38(1):53-56.

[3] FITZPATRICK P J. A Comparison of the Ration of Successful Industrial Enterprises with Those of Failed Companies [J].Certified Public Accountant,1932,3:656-662.

[4] 张静瑜,林娟,王玲.基于Logistic的信息产业上市公司财务预警模型构建 [J].财会通讯,2017(32):100-104+129.

[5] 马若微,张微.基于Logistic与Fisher的上市公司财务困境判别模型比较研究 [J].北京工商大学学报:社会科学版,2014,29(2):88-95.

[6] 尹夏楠,鲍新中.基于熵权TOPSIS方法的高新技术企业财务风险评价——以生物制药行业为例 [J].会计之友,2017(4):70-74.

[7] 谭媛元,陈建英,孙健.基于CNN的上市公司财务危机预警研究 [J].西南师范大学学报:自然科学版,2021,46(5):73-80.

[8] 程寅骁.基于因子分析法的城投公司财务预警体系研究 [J].全国流通经济,2021(3):60-62.

[9] 周志华.机器学习 [M].北京:清华大学出版社,2016.

作者简介:王晓华(1974—),女,汉族,河北保定人,副教授,硕士学位,研究方向:会计理论与实务、财务分析;马悦(1996—),女,汉族,湖北潜江人,硕士研究生在读,研究方向:财务危机预警;邢东森(1997—),男,漢族,河北石家庄人,硕士研究生在读,研究方向:财务管理、财务预警分析。

收稿日期:2022-10-11

基金项目:2022年度河北省社会科学发展研究课题(20220202106)

猜你喜欢

主成分分析法卷积神经网络
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
深度学习算法应用于岩石图像处理的可行性研究
基于主成分分析的煤层气赋存影响因素分析
基于深度卷积网络的人脸年龄分析算法与实现
基于主成分分析法的高校财务风险评价指标体系构建
基于卷积神经网络的树叶识别的算法的研究