APP下载

区块链技术与数据挖掘技术对数字经济发展的推动作用研究

2022-09-07袁澍清

西安财经大学学报 2022年4期
关键词:数据挖掘区块数字

袁澍清,王 刚

(1.杭州数澜科技有限公司,浙江 杭州 311100;2.西安财经大学,陕西 西安 710100)

一、引言

人类正在经历以互联网技术为基础的数字技术革命,其对经济、效率和公平的影响巨大且深远。当前,大数据、云计算、人工智能等信息技术成为推动社会经济创新发展最有效的方法和手段之一,依托这些信息技术创造出了互联网金融、数字经济等一系列新业态。在过去的5~10年里,随着数据价值化认知和数字化发展水平的提高,中国的数字经济得到了快速发展。以数字技术为核心驱动力量,以数据为生产要素,以网络发展为载体,快速推动数字与经济深度融合,使得数字经济成为推动经济发展的新动力、新引擎。近年来,伴随着区块链、大数据、人工智能、物联网和5G通信技术的兴起[1],信息技术又加速推动着数字化与实体经济深度融合,数字产业化快速迭代升级,产业数字化产出增加、效率提升,数字产业化和产业数字化交替螺旋上升并不断释放出巨大潜能,为经济模式带来了全面变革,从科学技术、生产方式、产业结构、商业模式、经济核算等多个层面,共同驱动了国家治理水平的提升及国民经济水平的提高。《中国数字经济发展白皮书(2021)》显示,2020年我国数字经济规模达到39.2万亿元,占GDP比重的38.6%;数字经济增速达到GDP增速3倍以上,成为稳定经济增长的关键动力。地方上,广东、江苏、山东等13个省市数字经济规模超过1万亿元;北京、上海数字经济GDP占比超过50%[2]。

由此可见,数字经济已成为继农业经济、工业经济之后的主要经济形态,数字化改革促使生产方式、生活方式和治理方式发生了深刻变革,其对世界经济、政治和科技格局将产生深远影响,作为支撑数字经济的现代信息技术则在其中起到了极大的作用。目前国内对于数字经济的研究大多聚焦于数字经济发展的宏观趋势研究、经济应用研究以及关于构建数字经济的协同机制等相关内容的研究,关于数字经济发展所涉及的一些前沿技术及其新型技术对数字经济发展如何起到推动作用的研究则相对较少。

鉴于此,本文选取区块链技术和数据挖掘技术作为研究对象揭示其推动数字经济发展的内在规律和机理,以便为社会经济发展提供一定的参考。选择区块链技术和数据挖掘技术作为研究对象主要从两个方面进行考虑:第一,区块链技术能够保证数据的安全性、可信性,同时还能有效保证数据的唯一性和完整性,能高效解决数据确权、共享和安全等问题,是经济健康良性发展的基石;第二,数据挖掘技术能充分解释数据的意义、揭示出隐含的相关经济发展规律和机理,大幅提升数字经济中数据的价值,其典型应用也更具有经济辅助决策能力,为推动数字经济有序和有效发展提供动力。

二、数字经济的概念和内涵

(一)数字经济的概念

数字经济这一概念源于2014年Don Tapscott的《数字经济:智力互联时代的希望与风险》[3]一书。1998年美国商务部发布了《新兴的数字经济》报告,指出截至1998年,美国连续三年的经济增长有三分之一都来源于数字经济[4],由此数字经济的提法正式成型。在2017年发布的《G20数字经济发展与合作倡议》中,将“数字经济”定义为以科学技术为核心驱动力量,以数据为第五生产要素,以信息系统建设及网络发展为载体,推动数字经济与实体经济相融合,加速产业数字化渗透率的一种新经济形态[5]。2021年5月国家统计局发布的《数字经济及其核心产业统计分类(2021)》[6]中将数字经济定义为以数据资源为关键生产要素、以现代信息网络为重要载体、以信息通信技术的有效使用为效率提升和经济结构优化的重要推动力的一系列经济活动。随着对数字经济逐渐深入的研究,当前其概念得到了不断丰富完善与明确,使其更加具有抽象性与普适性。数字经济时代,数据成为继土地、劳动力、资本、技术之后的第五关键生产要素(如图1所示),参与到企业成本与国民经济核算中[7]。数字经济是以数据为核心要素,以数字技术为辅助,以互联网为载体,结合经济学理论和实体经济现有成果,推动中国经济持续稳定健康地发展,提升中国经济发展能力和空间。

图1 数字经济关键生产要素

(二)数字经济的内涵

数字经济的内涵可以从数字经济的表现特征及新经济形态两个角度进行深入解读。在表现特征方面,中国信息通信研究院发布的《中国数字经济发展白皮书(2021年)》针对数字经济的概念提出了具有“四化”的框架特征:数据价值化、数字产业化、产业数字化和数字化治理。其中,数据价值化是指数据采集、数据汇聚、统一标准、数据共享、数据归属、数据存储、数据交易、数据价值、数据流转和数据安全,在全生命周期的各个环节均形成了全链条、全流程的数据产业体系。利用数据挖掘技术使数据价值得到充分地挖掘和更好地发挥,数据的管理和应用能力得到显著提高。数字产业化是指信息通信产业的高速发展,如电信业、电子信息制造业、软件和信息技术服务业、互联网行业、数字相关服务业等相关数据产业发展强劲,信息技术对数字经济的发展提供技术、产品、服务和解决方案等。产业数字化则是指工业、农业、服务业、金融业、保险业等多个行业的实体作为数字经济发展的重要战场,利用数字技术,结合实体经济所产生的数据,基于不同领域的行业特点做出相应的生产方式变革,提升实体经济生产的效率和质量,推动服务水平的提高,实现价值增值。数字化治理是指通过数据的多方治理、依法治理、协同治理,推进国家治理体系的逐渐完善。数字化治理是提高国家治理能力的重要手段,是数字经济创新发展的有力保障。利用数字技术,构建完善的国家组织管理制度体系,创造新型服务监管方式,完善现有的国家治理模式,并打造新型政府治理模式,实现技术和管理相结合的数字化公共服务。

(三)数据在数字经济中的价值

数字经济是在特定背景下,与大型数字社会和数字企业相互作用,通过各种方式驱动数字业务的经济过程,形成生产力集合。在数字社会和企业活动中将产生海量的数据和技术深度融合,支撑数字经济的大力发展,整合数据的深度和广度,完善包括数据在内的生产要素,以新型数据技术指导经济的发展,为中国数字化建设提供坚实的基础。下面从数据的转化和数据的赋能两个价值层面,阐明数据对数字经济的影响。

第一,数据的转化。在数字经济中,数据作为原始材料,犹如石油一般,石油在其原始状态下没有价值,通过提炼、分发和消费,石油才拥有了价值。在组织或者企业的经营过程中产生数据后,需通过加工和提炼,完成生产要素价值化的转换过程,才能作为企业或组织的资产,被不断复用创造新的活力并持续产生使用效益。

第二,数据的赋能。企业、政府和军队等数据使用者在日常经营活动与业务发展过程中采集、挖掘,并将数据存储在业务系统中。数据作为生产要素的一个组成部分在数据使用者的经营活动中发挥着重要的价值,为社会经济发展提供了有效的支撑,使数据赋能各行各业,助力中国经济稳健发展,发挥数据的价值已成为数字经济背景下的一种常态。

数据作为数字经济的关键要素,需要实现数据到智慧应用的转换。从数据中提取信息,转换为知识,提炼成智慧(如图2所示)。在这一过程中,将数据作为原始材料,利用数据处理手段从中提取信息,然后对信息进行挖掘,使数据之间内含的逻辑关系显示出来。企业作为数据使用主体,借助技术挖掘数据间的逻辑关系,将信息转化为具有应用效益的知识。在将多个知识点相连接,形成网状知识图谱时,就形成了以数据为基础的智慧体系,其具有体系化与复杂性的特点,进一步帮助企业做出经营决策及分析预测,真正实现了数据赋能。

图2 数据产生价值的过程

三、国内外文献综述和现状分析

(一)国内数字技术与数字经济综述

国内许多研究者针对数字经济进行了大量的研究,取得一些成果,主要集中在以下两个方面:

1.数字技术与数字经济的深度融合

何大安从数字经济的不同阶段展现的对数字经济的现状及未来发展进行了详细地阐述,以大数据技术和人工智能运用为数字经济分析主线,研究数字经济未来发展的格局和框架[1]。李娟、刘爱峰以模型分析、控制变量、数据分析的方式,针对中国不同区域展现的数字产业发展平衡性做出了分析[8],指出产业发展不平衡的经济现状;同样的观点也在陆岷峰的文章中做出了进一步总结,给出了我国数字经济产业结构发展失衡、规划机制有待完善的结论[9]。童庆禧等人从生产活动产生数字进而代替经济,物联网和工业互联网产生传统经济生产过程中不存在的新经济形式即数字创造经济两个角度对数字经济进行了定义。同时,将数字技术作为数字经济时代到来的技术路径演进展开论述[10]。邝劲松等人从区块链具有数据一致存储、难以篡改、可追溯和智能合约等核心技术特性、加强区块链技术安全监管应用等方面详细阐述了区块链技术对促进数字经济发展的重要作用,并从完善区块链人才机制和区块链技术角度,指出区块链技术助力数字经济发展所具有的独特优势和特性[11]。王婧从数据挖掘技术在金融市场中的应用和发展角度进行了相关论述,表明当前企业需要借助于数据挖掘等信息技术来保证企业的良性和健康发展,使企业的发展具有指导性和保护性,扩大企业的发展空间,为企业经营战略决策提供参考依据和多样化选择[12]。郭晗、任保平、师博从数字经济发展的逻辑、机制、路径角度出发,面向数字化发展对于促进数字经济与实体经济的融合、城市经济高质量发展等方面做出了分析[13-15]。

2.大数据下的数据价值研究和挖掘

Hadoop、云计算、MapReduce和移动通信服务等数据处理技术被广泛地使用并逐渐趋于成熟,帮助数据创造出更大的价值。数据价值蕴含着各种知识的关联,从数据中提取相应的知识,通过不同的特征对人物和事物进行画像。同时,数据标准规范体系的构建和各类数据服务创新应用的建立也为提升数据价值创造了条件。付登坡等人认为提升数据价值的策略如下:一是描述性元数据。可对数据进行详细描述,找到数据之间的关联关系,为知识发现和数据重用建立基础。二是知识图谱。从数据中提取知识,利用知识将人物和事物进行画像,通过画像完善和扩展知识图谱,发现潜在的数据价值。三是智能应用。利用区块链、人工智能、物联网、软件科学领域等先进技术,让数据不同的形式满足业务应用场景需求[16]。

(二)国外数字技术与数字经济综述

国外研究主要集中在数字技术在数字经济中的应用。在《Digital Economics 2017》和《Digital Economics:How AI and Robotics Are Changing Life》中,指出数字技术是以比特为代表的信息,该技术降低了数据存储、计算和传输的成本[17]。同时指出数字技术参与到数字经济活动降低了五种不同经济成本,即:搜索成本,复制成本,运输成本,跟踪成本和验证成本[18]。在《Data Mining of Regional Economic Analysis Based on Mobile》中,Yucong指出物联网技术可以实时监控并采集各种信息,具有优越的信息采集能力。数据挖掘技术是机器学习、人工智能和统计相关的综合产物,被广泛应用于各个领域。物联网技术与数据挖掘技术的深度融合,可以提高数据采集,提升挖掘的效率和质量,并快速获取有效知识。科学技术的发展使得多种融合技术广泛应用于经济分析,创新分析思路,将研究成果转化为生产力,促进经济繁荣[19]。Cong Gu强调,利用C4.5挖掘决策树算法,结合美国政府金融干预部门提供的贷款数据,生成决策树并将其转换为分类规则,发现贷款数据背后隐藏的法律及其可能违反相关金融政策的信息,为政府干预金融提供了可靠的依据,提高了金融干预的效率[20]。

Murodovna描述了区块链的主要技术和原则,利用区块链技术解决涉及金钱、股票和有价值文档的日常交易,通过分布式网络进行存储和传输,对数据进行加密保护,有效地提升了数字经济的发展效能[21]。Agung Purnomo采用文献计量技术与来自Scopus文献索引平台的次级资料,通过使用 VOSviewer 文献可视化工具以及 Scopus 平台上的分析搜索可视化功能,指出数字经济的研究发展和未来趋势[22]。

(三)文献评述

综合国内外文献发现,第一,当前国内研究人员大多从理论层面出发,宏观上强调了数字技术在数字经济发展中的重要作用。国外研究人员更多采用定量分析及数据可视化工具将理论和实践相结合,发达国家如美国、德国、英国等,在数字产业化上更关注具体应用的落地,例如,基于数据挖掘等技术的设计决策支持系统,基于决策树算法的数据挖掘技术对于金融行业银行卡办理及信用贷款等业务流程中存在的困难和风险的干预。第二,国内外对数字技术的政策不同,相对于发达国家,我国在数字经济发展的整体布局相对落后,成为国内数字经济发展的一个瓶颈。因此,当前国内的热点研究方向包括技术成熟度的研究应用、综合性数字人才的培养及数字技术对当前数字经济的影响和内在推动机理等。

(四)中国数字技术与经济融合存在的问题

随着数字经济被逐渐地提升为国家战略,中国数字经济发展总体规划将重点从数字技术的快速发展转向经济社会各领域深度融合发展,但发展中还存在着一些问题和挑战。

第一,数字技术与经济发展无法深度融合,制约数字经济发展。数字经济的发展需要数字技术与实体经济的协同发展,对产业升级有着巨大的影响。其主要体现在产业创新、产业关联和产业融合三个效能的提升上[23]。产业创新重点在于传统生产部门的信息化改建,利用数字技术扩大产品创新边界,使数据作为产业关联的关键要素,实现产业组织的调整和产品结构的转型,形成产业融合模式,使传统经济模式逐步向数字经济模式转变。目前,数字经济的整体结构仍需升级优化,全量数据需逐层打通,数字技术与经济有待进一步深度融合,避免底层技术制约数字经济的稳步发展。

第二,互联网模式下的数字经济存在安全可信、数据确权、协同共享等方面的问题。当前互联网模式下的数字经济所采用的是经典的B/S架构[24]。这一架构实现了数据在同一互联网环境下的数据共享与交换,在大力推动数字经济发展的同时也存在很多数据分割确权、安全可信方面的隐患。在中心化的数据存储机制下,大量数据隐私受到侵害、数据资产易被复制盗取、数据信息非法交易等现象层出不穷。

第三,数据挖掘技术在各领域不同业务环节之间的数据智能化水平参差不齐。数据智能化是指通过业务数据和其他数据,利用大数据分析和数据挖掘技术,实现经济特定场景的应用。以制造业和金融业为例,制造业的转型程度展现出两端数字化程度高,中间环节较低的“U型结构”,两头的研发设计端与销售端逐渐趋向精准化定制的制造业服务,但中间生产过程中的制造环节数字化程度仍然不足[25]。

第四,缺乏综合性数据人才的培养。随着产业数字化的发展程度不断加深,各领域的数字化水平越来越高,就越需要对实体行业有充分了解并掌握数字发展核心技术的综合性高素质人才。而综合性人才的缺乏是困扰我国数字经济发展和经济增长不可忽视的一个重要因素。目前高校缺少对数字经济领域新型专业的开设,缺少对综合性数据人才有意识的培养。此外,人才在各行业分布不均匀。由于部分企业内部未建立人才管理与激励的长效机制,文化程度高、技术能力强、经验丰富、跨领域的综合性人才争夺剧烈,造成企业发展的不稳定,一定程度上限制了企业的数字化转型及国家数字经济的发展。

四、区块链技术与数据挖掘技术对数字经济发展的影响

数字技术逐渐运用到市场经济发展与企业生产经营中,不仅改变了传统的企业经营模式与市场经济形态,还实现了对生产力、生产环节、生产要素、经营场所、生产规模和效率等方面的重大变革,数字化的技术、产品和服务已经由传统产业形态向多维度、多层面、多链条的数字经济模式加速发展与转变,产业结构与国家经济发展战略也在数字经济的背景下发生了转变。当前我国在数字经济背景下的重点数据工程建设包括数据挖掘、区块链、5G通信、物联网等新型基础设施,其本质就是围绕科技进步与数字经济发展新型产业模式[26]。在数据应用的过程中,一个完整的数据生命周期分为四个阶段:第一个阶段为采集和传输;第二个阶段为汇聚和交换;第三个阶段为处理、应用和呈现;第四个阶段为销毁。在这一过程中,5G技术提高了数据通信传输的速度,物联网技术扩大了可接入数据的广度,二者共同完成了数据生命周期的第一个阶段——数据的采集和传输。区块链技术增强了数据生命周期的第二个阶段——数据汇聚和交换的安全性和唯一性。第三个阶段采用数据挖掘技术能更好展示数据的价值,应用到经济场景中将其呈现,可以预测经济未来趋势。数据的汇聚与存储强调数据的安全性与分布性,数据的应用与呈现强调数据的价值最大化。

(一)区块链技术对数字经济发展的推动作用

近年来,国内外相关企业和机构大力推进区块链在数字经济众多领域的应用和探索,并取得了重大进展。数字经济时代的到来,改变了人们的生活模式,对已往的信息化建设成果提出了更高的要求和挑战,但是目前传统的互联网所存在的特点使其难以适应现代经济的高速发展:首先,当前的互联网以HTTP协议作为传输通道,具有中心化的特点,即用户获取数据的过程需要通过中心化的服务器下载数据,中心化的访问在高并发量下会限制数据的传输速度。其次,随着信息化的发展,海量的数据存储需求给传统互联网带来了新的挑战,以HTTP为协议的网页生存周期相对较短,存储成本高,文件无法永久保留。最后,传统互联网出于安全性的考虑,对数据进行了层层保护,数据的匿名性使得用户行为难以追踪。信息爆炸式发展使得去中心化成为硬性需求及发展趋势,亟待一种具有分布式存储、防篡改、保证数据一致性的新型技术来适应数字经济的发展,而区块链技术恰好提供了一种安全可信、去中心化的数据交换网络,并能利用非对称加密技术对数据进行传输,实现数据确权和数据资产的价值。区块链技术通过在线共享文档的形式,将共享文档分发给所有需求用户,使得拥有这个共享文档的用户可以随时修改个人数据,其操作内容都会完整记录在操作系统内,同时这个文档属于所有用户。

1.区块链技术特性助力数字经济发展

从区块链技术特性角度来看,区块链将分布式记账(Distributed Ledger Technology,DLT)作为核心技术,具有去中心化、分布式、不可篡改、可追溯、安全可信等优点。通过对分布式数据存储、点对点传输、共识机制、密码学和智能合约等技术的集成,能有效解决传统交易模式中的数据篡改、造假、行为作弊等问题。区块链所具有的共识算法技术使得多源的数据在共享时具有一致性,解决了传统互联网在数据交换时由于缺乏统一接口或多源异构的数据难以存储及共享所造成的困难。数字加密技术进一步对数据做出保护,防止数据在传输的过程中被篡改或伪造,为数据的安全共享交换提供了保护屏障。智能合约以唯一用户接口、制定完善的逻辑流程来确保交易过程中合约的真实性和唯一性,其典型产品如以太坊,一个以智能合约为主要功能的公共区块链平台。另外,区块链所具有的独特的分布式记账技术,其存储和传输时所产生的计算可以处理百万级TPS的交易,利用分布在各个节点的数据源以及各个节点空闲设备的计算力、存储容量和带宽,可以大幅度减少中心化计算的耗时费力等问题,大幅度降低计算和存储的成本[27],使得利用区块链技术创造未来“可信数据共享”“可信价值互联网”等相关数字经济发展具有重要的推动意义和应用价值。区块链技术的特性总结及其对推动数字经济发展所产生的主要影响如表1所示。

表1 区块链技术对数字经济发展的主要影响

2.区块链应用特性助力数字经济发展

从三个区块链技术应用特性角度来看,第一,将物联网上的各个设备所产生的数据源加载到区块链网络中,使其深度融合,从数据的交换、传输、通信、存储上确保其安全、可信等问题。第二,将区块链技术应用服务于实体经济,不断拓展其技术的典型应用空间,进一步释放创新活力,例如:去中心化跨域交易、用户隐私数据保护和证券确权等。第三,采用点对点的全链互联互通的传输数据方式,解决数据挖掘中海量数据在传输和存储时计算力短缺的问题。

3.区块链技术助推数字经济的发展方向

从区块链产业数字化角度来讲,区块链技术能对现有产品或生产模式进行改良式创新,改善行业中存在的信用痛点、数据篡改和丢失的问题,如金融行业中凸显的信用问题、金融数据不容篡改和丢失的问题。当前,区块链技术已开始在金融领域中崭露头角,如数字货币、跨境支付、供应链金融、保险、证券等[28]。区块链技术的应用可以有效提升上链数据的可信性和安全性,确保线下和线上相互映射,提升数据在数据平台或业务系统上的可信性、安全性和一致性,促进金融业务应用场景落地,增加区块链技术在数字经济中的实用性,助力数字经济快速发展。未来将出现由区块链技术构建的新业务模型,大量的区块链人才将助推数字经济的腾飞,具体的发展方向可归纳为以下几点[29]:

(1)区块链技术不断迭代更新,产业将飞速发展,实现更多应用场景的落地;

(2)跨链(公有链、私有链、联盟链)互联将成为一个重要的趋势;

(3)编制区块链行业标准,形成行业范围的标准化应用;

(4)采用多样性数据隐私保护机制;

(5)区块链将为数据的传输过程提供安全性保障服务;

(6)区块链人才将成为未来一个重要的人才培养方向。

(二)数据挖掘技术对数字经济的推动作用

数据挖掘技术是对海量的数据进行提取和分类处理,挖掘出有价值的信息并转换成知识的过程,帮助数据实现价值化,使数据在实际经济应用场景中得到最大程度的发挥。在产业数字化的过程中,多数实体经济的数字化转型都因为使用数据挖掘技术进行了经营决策分析和市场策略优化,帮助企业完成了相关商品预测、个性化推荐和决策支持等,拓展出更多应用场景。数据挖掘技术成为当前数字经济发展必不可少的重要经营和决策辅助工具。数据挖掘技术融合了多个研究领域的内容,其中包括:数据库技术、人工智能(监督、半监督和非监督的机器学习)、数理统计学、知识工程(知识库和知识图谱等)、信息检索、高性能计算以及数据可视化等相关技术。数据挖掘技术可以帮助企业、政府在内的数据使用主体将原始数据转化为数据资产,进而提炼成为指导经营发展的可用信息。通过使用数据分析算法工具在海量数据中分析、寻找数据之间的关联关系,建立用户行为模型及数据模型。数据挖掘技术在行业发展、经济分析、市场洞察等多个领域都有着广泛的应用。通过数据挖掘技术,可以帮助数据的使用主体更好地从数据中提炼信息,创造新的应用场景,优化资源配置,并帮助数据使用者做出更科学的决策。接下来将从数据挖掘技术特性助推数字经济发展、数据挖掘技术应用特性助推数字经济发展和数据挖掘技术在数字经济中的应用场景三个层面阐明数据挖掘技术对数字经济发展的推动作用。

1.数据挖掘技术特性助推数字经济发展

数据挖掘技术特性可分为广义和狭义两种。广义数据挖掘是指从大量的行业数据中发现隐藏、内在和应用的经济应用场景信息和知识。通过广义的数据挖掘,对经济信息和知识进行模拟和分析,初步构建数字经济知识图谱框架,使各行业数据具有关联性,对数字经济的发展发挥潜在的互联作用,提升整个经济体系的数据价值。狭义数据挖掘通常是利用数据挖掘算法,结合各行业的数据,从数据中提炼出知识的过程,将广义的数据挖掘现实化,转换为经济应用场景,它是经济应用场景建模的重要环节和关键。数据挖掘技术与数字经济应用场景相关度较高的技术方法有关联规则挖掘、聚类分析、分类分析、回归分析等数据挖掘技术。

(1)关联规则挖掘

关联规则挖掘是数据挖掘在数字经济应用里最常使用的方法之一。该方法主要是反映经济事件之间的关系和依赖度,可以挖掘出无明显相关性的两个独立事件内在的关联关系。为呈现独立经济事件数据的关联规则,需设定两个事件的阈值,即最小支持度和最小可信度,分析二者之间的提升度。最小支持度即最低联系程度,要挖掘经济事件之间的关系,须满足事件之间规定的最小支持度。可信度也可以用术语“置信度”来表达,通常情况下算法里的置信度值都具有小于1的规则[或采用百分比的表示方法,如某某置信度:0.18(18%)或0.95(95%)]。事件集的置信度除以支持度得出提升度,有三种表现形式:一是当提升度等于1时,表示二者并无关联关系;二是当提升度大于1时,反映两个事件发生的可能性呈正相关关系;三是当提升度小于1时,反映二者呈反向相关关系。一般通过设定最小支持度,以事件所包含的数据集为基础,对可信度进行计算,利用二者比例分析结果计算出提升度,以此判断独立事件之间的关联关系,推断事件之间的相关度和拟合情况。关联规则挖掘的技术特性支持营销策略制定、促销商品组合、销售情况复盘、经济事件关系分析等应用场景。

(2)聚类分析

聚类分析属于无样本集的事件集数据归类,通过类知识描述一类经济事物,这类事物具有一定意义上的共同特征属性。聚类分析通过设定一个簇按照相似性归成若干类别,使属于同一类别的个体之间的差别小,而在不同类别上的个体间的差别大。聚类分析可以对数据直接进行分析,而不需要对数据进行分类,重点对数据中存在的对象关系信息进行挖掘。聚类分析的几种典型的应用场景包括精准营销和消费评估能力,在企业数字化转型及行业数字化的过程中有着广泛的应用前景。

(3)分类分析

分类分析属于有样本集的事件集数据归类,其典型特点为预测型数据挖掘。分类分析结合分类类型和规则,对原始经济数据进行分类,从每一种类型中提出不同的类型值。分类分析支撑已知的类别表及其所包含的数据对象和训练集,其过程为:建立分类规则,整理数据集,创建分析模型,确定分类结果,最后得到连续的或离散的预测值。分类分析的目标是根据样本数据形成的类知识对源数据进行分类,进而也可以预测未来数据的归类。在个人征信评估、用户人群圈选与广告投放、用户行为模式挖掘与预测等经济场景中有着广泛的应用前景。分类分析主要包括:决策树、贝叶斯分类、神经网络、遗传算法与进化理论、类比学习,或其他(粗糙集、模糊集)方法。

(4)回归分析

回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系,主要包含三个度量:自变量的个数、因变量的类型以及回归线的形状。不同于分类分析预测的属性值是一个标签,回归分析是数值类预测,预测的属性是数字的,即希望的预测结果呈现出一个具体的数值。回归分析方法通常用于预测分析的应用场景较多,例如,基于历史经营数据预测公司未来的利润或股价,利用时间序列模型以及发现变量之间的因果关系,结合公司经营现状,改善经营状况和模式,提升公司生产能力,助力公司经济发展。

这四类技术对于推动数字经济发展所产生的主要影响如表2所示。

表2 数据挖掘技术对数字经济发展的主要影响

2.数据挖掘技术应用特性助推数字经济发展

从数据挖掘技术在数字经济中应用特性角度来看,数据挖掘技术随着人工智能逐渐进入人们的视野与生活,并在很多经济智能化场景中取得了巨大进展。数据挖掘技术被应用在机器学习,如SVM支持向量机、贝叶斯动态序列、聚类和分类等算法。使用数据挖掘技术之前,应该具有海量的数据,处理海量数据需要一个存储和计算的系统,有相应模块多数据进行分布式、存储、调度等处理,数据挖掘技术对处理后的数据要进行分析和挖掘,使算法与数据之间相辅相成,产生出更多更好的经济方面的应用场景。

3.数据挖掘技术在数字经济中的应用场景

数据挖掘技术在数字经济中所涉及的方法包括关联规则挖掘(关联分析)、聚类分析、分类分析和回归分析。分类分析的应用场景比较多,如医院可能希望将患者患某种疾病的风险分类为高、中、低三个类别。学校会将学生成绩分类为优秀、良好、合格或不合格。电商网站可能会根据用户行为,把购物车物品的购买率分类为极有可能购买、可能购买、可能不会购买和不会购买的类别,实现用户行为精确分析,提升电商平台经济效能。关联规则挖掘有“超市购物篮分析”和“尿布与啤酒”两个比较典型的数字经济应用场景,目的是结合购买行为数据,通过分析顾客放入购物车内的不同商品之间的联系,挖掘出顾客的消费习惯,推荐商品给顾客,提升商品的推广能力,实现精准营销。

通过数据挖掘技术,将行业数据里有用的信息和知识提取到行业数据集,构建商业决策分析、税务变化与税收查询、客户状态分析、企业成本分析、投资风险预警、贷款欺诈告警、国民经济预测、市场趋势变化等应用场景[30]。接下来,将具体列举几个数据挖掘技术在数字经济中的典型应用场景:

一是精准营销场景:在数字化的商业发展应用中,数据挖掘技术应用聚类分析的方法帮助企业在战略规划中进一步做出市场细分和用户群圈选。通过对不同的会员客群进行购买模式和消费习惯的归类,切分出潜在市场,分析具体的消费行为。

二是用户画像场景:基于用户的行为数据、移动社交数据,利用大数据技术,对每个用户所具有的相似特征进行提取,然后通过为用户打上如年龄、性别、兴趣爱好、购物习惯和消费记录等的标识特征标签,绘制基于用户数据分析的用户画像。消费者画像为营销提供有用的决策,帮助企业和公司对消费者进行精准营销。

三是保险投保者分组场景:保险公司可根据投保者的收入、年龄、购买的保单类型或先前的索赔经验对客户进行分组。例如,通过对不同收入人群进行分组,结合汽车价值分类,以优化汽车保险单的设计。

五、对策和建议

利用数字化技术提升数字经济发展已成为当前学术界的共识。运用云计算、数据挖掘、物联网和区块链等数字技术手段,结合政策扶持及人才培养,全方面提升数字经济的发展水平。从产业创新、关联和融合、数据深度融合、数字技术及应用场景的角度出发,以政策、法规、标准、规范和综合性高素质人才培养为支撑,以农业、制造业和服务业为底层数据支撑,以区块链技术实现安全可信节点为保障,构建数字经济数据资源池,利用数据挖掘技术对数据进行深度加工,实现数字经济应用场景,如图3所示。

图3 区块链技术与数据挖掘技术对数字经济的推动作用

(一)通过政策扶持,加强数字技术与经济融合力度

数字经济持续有效的健康发展离不开国家相关政策的干预与支持,应在数字技术、数据和经济这三个方面提升行政干预力度。第一,数字技术方面,根据具体商业模式和行业特点,着力发展数字经济相关技术的重点领域专业化制度建设,完善相关政策和法律法规,提升数字经济的发展空间。第二,数据方面,数据与传统的土地、劳动力、金钱、技术等方面一样,正逐步成为重要的生产要素。因此,继续培育数据元素、保护数据资源、开放和共享数据、最大化数据利用价值以及改进数据元素至关重要。数据要素的流通效率和市场活力,成为推动经济高质量发展的新动力。第三,经济方面,加强数字技术、数据和经济的综合政策的制定和发布,提升数字技术与经济的融合力度。

数字经济发展需要在一定范围内保障其独立性,在保证市场经济健康发展的前提下,适当降低行政干预力度。在科学合理研究制定审查规范政策体系时,要根据数字经济发展特点来执行,从源头上杜绝因行政干预不当造成的数字领域资源配置低效,在数字经济的发展中有效防止行政权力不当干预公平竞争。一方面,要根据具体商业模式和行业特点,着力发展数字经济重点领域的专业化制度建设,完善相关法律法规,提高监管过程中的确定性;另一方面,刺激数字信息要素的持续创造,从而帮助数字要素资本的扩张。

(二)利用区块链技术保障数据的安全可信、真实可靠、归属权明确

安全可信节点使用区块链技术架构,运用哈希值、默克尔树、链表结构构建一个可溯源和防篡改的总账本,采用IFPS内容寻址协议,在分布式系统的每个节点实现安全可信数据加密传输和交换。通过安全可信传输和交换网络,对银行、证券、保险、交易、个人消费、生产和经营等数据进行保护,划分数据权利界限,解决数据确权、共享、交换、传输、安全可信的问题,使各个领域之间达成数据使用、共享和交换的共识,采用智能合约机制减少人工参与,确保数字经济健康的发展。

(三)利用数据挖掘技术充分发挥数据价值,提升数智化水平

数据处理采用数据挖掘技术的支持向量机、线性回归、决策树、聚类和贝叶斯序列等算法,对预处理之后的数据进行分析和处理,结合多源数据及经济学理论和模型,挖掘数据中潜在的价值。对已建立的应用场景的数据挖掘算法模型不断地训练和测试,最终形成数据智能场景模型,如:投资风险预警、业务关联分析、信贷欺诈告警等模型,提升数字经济数智化水平。

(四)加大数字化转型的综合性人才培养力度

加大数字技术、数据管理与经济发展的综合性人才培养,建立健全人才培养机制,是企业实现数字化转型的必经阶段,也是保证数字经济长效发展、持续创新的必要手段。为实现国民经济快速增长,应联合高校和研究机构,制定相应的人才培养计划,开设数字经济理论、技术应用的相关学科,开展数字经济学术论坛,聚集多方数字经济综合人才,完善人才体系建设,有序地推动数字经济高效健康发展。同时,高素质综合人才的培养方向不仅应聚焦到专业内容本身,还应加强对数据、数字技术和数字理念等方面的引导。

六、结论与展望

数字经济的发展是以数据为基础,以新兴数字技术为核心,基于信息化的建设成果,与实体经济相融合,推动数字产业化、产业数字化,增强数字化治理水平,促进各个产业智能化协同发展。本文选取了两种新型数字技术作为重点分析内容,阐述了区块链技术和数据挖掘技术对数字经济的影响及重要性。本文对数字经济推动作用研究的新突破如下:

第一,区块链技术作为一种颠覆性革命技术和一种底层存储技术基础设施技术,与数据挖掘、人工智能、物联网等技术可以相互促进和融合发展,联合开创更多更大的价值空间,不断创新各类应用场景,加快商业场景落地[31]。区块链可与人工智能融合使用,对数据的采集、汇聚和共享有着重要的支持作用。

第二,通过利用算法挖掘数据的价值,提炼重要信息为数字经济的发展创造新的应用场景。特别是当数据量以PB级别的积累和存储,形成海量数据时,一些简单的查询和统计功能已经不能满足各领域的需求,这一现象在经济领域尤为显著。

通过对区块链技术和数据挖掘技术的特点、应用特性等方面介绍,分析了发展数字技术对于数字经济发展的意义,总结了在当前政策背景下数字经济发展存在行业发展不平衡、数智化发展程度不均匀、存在数据安全与确权问题、缺乏数据方面的综合性人才等问题,并提出了数字经济发展的蓝图规划和四点对策建议。

数字化转型已经进入到经济、社会、政府治理、军事作战和国家战略规划等各个领域。未来,通过数字技术的不断优化提升,管理制度的不断完善,人才机制的建立健全,数字化转型在提升企业转型创新、优化政务和军事作战等方面还有较大的潜力和发展空间,数字经济也会逐渐趋向更加健康、稳定、有序、可控的发展。

猜你喜欢

数据挖掘区块数字
探讨人工智能与数据挖掘发展趋势
区块链:一个改变未来的幽灵
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
答数字
数字看G20
一种基于Hadoop的大数据挖掘云服务及应用
成双成对