APP下载

数据价值化:研究评述与展望

2023-12-22朱秀梅林晓玥王天东苗淑娟

外国经济与管理 2023年12期

朱秀梅, 林晓玥, 王天东, 苗淑娟

(1. 吉林大学 商学与管理学院, 吉林 长春 130012;2. 哈尔滨工业大学 经济与管理学院, 黑龙江 哈尔滨150001;3. 哈尔滨工程大学 经济管理学院, 黑龙江 哈尔滨 150001)

一、 引 言

数据是数字经济时代的战略性资源和重要生产力,作为新兴生产要素,已和其他要素一起融入经济价值创造过程之中,不断催生新业态、新产业、新模式,并推动产业加速升级。2023年初国务院提请审议组建国家数据局,意味着数据要素的转化已经上升到国家战略高度。数据价值化、数字产业化、产业数字化、数字化治理共同组成了数字经济的“四化框架”(中国信息通信研究院在2021年发布的《中国数字经济发展白皮书》),其中,数据价值化成为核心驱动因素。然而国际知名咨询公司埃森哲发布的研究报告显示,三分之二以上的企业对于如何用好数据仍然一头雾水。与此同时,我国数据要素市场化配置改革刚刚起步,许多尝试犹如“摸着石头过河”,亟待以系统性、创新性的理论研究指引企业数据价值化实践,数据价值化研究也成为激发学者深入探讨的“新蓝海”。

在理论层面,学者们从不同角度出发对数据为什么创造价值及如何创造价值进行讨论,但这些研究分散于多个学科、多个领域,缺少能够“穿针引线”的整合研究。西方学者率先对数据的特征和数据管理问题展开讨论(Günther等,2017),并结合供应链管理(Brinch,2018)、营销管理(Johnson等,2019)、人力资源管理(Garcia-Arroyo和Osca,2021)等具体场景讨论数据的作用和影响。我国学者则特别关注数据形态的演化问题(李海舰和赵丽,2021),并围绕数据市场化流通问题展开研究(何玉长和王伟,2021)。总体看,数据价值化的中西方研究成果侧重点有差异,关于数据价值化的内涵和特征、数据价值实现过程等关键问题并没有形成清晰完整的回答。为此,本文拟在文献梳理的基础上融汇已有观点,尝试回答以上关键问题,以响应学界和业界关于数据理论创新的急呼。

基于此,本文以建构式综述的形式,从四个方面推进数据价值化研究。第一,系统回顾和梳理已有研究,明确已有成果的研究脉络和研究主题。利用Cite Space5.8R3软件对与数据价值化相关的250篇英文文献和117篇中文文献进行量化分析,科学呈现和对比中西方研究主题。第二,分析数据价值化的内涵,明晰数据价值化研究的范围和边界。数据价值化作为数据转化为价值的关键过程,能够整合现有较为分散和独立的数据相关研究,并成为极具价值和挑战性的科学问题。本文结合来源、参与主体、过程、目标结果等价值创造要素提出数据价值化的完整内涵,并比较数据要素和传统要素在对象、范围、效益、模式、创新等方面的差异。第三,构建数据价值化的整合研究框架,推动数据价值化理论体系的构建。中国信息通信研究院2021年发布的《中国数字经济发展白皮书》指出“数据价值化”包括但不限于数据采集、数据确权、数据定价、数据交易等,而后学术研究引用和发展了这一观点,提出数据资源化、数据资产化、数据商品化和数据资本化四个阶段。本文整合现有研究,利用价值链理论,揭示数据资源化、数据资产化、数据商品化、数据资本化四个阶段的关键数据行为,并依据“前置因素—实现过程—结果产出”的研究逻辑建立数据价值化的整合研究框架。第四,提出未来需要深入探究的五大研究议题。

总的来看,数据价值化的相关研究数量多、涉及面广,但鲜有研究对此进行整合、总结和提升,研究脉络和研究重点不甚清晰,缺少高质量的综述性学术成果。本文旨在系统展示中西方数据价值化研究主题,并对比分析研究的差异及其原因,进而提出未来值得研究的问题,从而对现有研究进行归纳、总结和提升,以启发和引领后续研究。

二、 数据价值化研究的量化分析

为了全面把握已有研究的进展,本文首先以“big data”“data driven”为关键词,组合“value”等关键词,以“article”“review”为文献类型在Web of Science、ProQuest、EBSCO等英文数据库进行搜索,以“数据”与“价值”“赋能”“驱动”为组合关键词在中国知网进行搜索,进行文献初筛。第二步,在时间方面,由于与“大数据”相关的期刊文章在2011年开始频繁出现,因而重点审查2011—2022年发表的文献,这一时间范围也与大数据广泛应用的时间相吻合(Wamba等,2015)。在领域方面,由于数据价值化具有明显的跨学科特质,因而广泛搜索管理学、经济学、计算机科学、信息系统等领域的文献。英文文献剔除非核心合集和开放获取的文献,中文文献保留期刊来源,共获得英文文献971篇,中文文献315篇。第三步,阅读每篇文献的摘要和结论,以题目、摘要或关键词能否反映出“数据价值化”这一研究主题为标准评估文献的主题匹配性和内容适宜性,并进一步筛查和补充上述文献的参考文献,最终共得到英文文献250篇,中文文献117篇。

(一)数据价值化英文文献分析

本文利用Cite Space5.8R3软件分析了数据价值化英文文献关键词聚类图谱和关键词突现情况(见图1)。

图1 英文文献关键词聚类图谱和关键词突现分析

文献分析后生成15个聚类,这些聚类是确定研究主题的基础,包括数据收集(data collection)、机器学习(machine learning)、大数据管理(big data management)、商业分析(business analytics)、用户关系管理(customer relationship management)、数据驱动营销(datadriven marketing)、创业导向(entrepreneurial orientation)、供应链管理(supply chain management)、动态能力理论(dynamics capability theory)、智力资本(intellectual capital)、数据科学家(data scientists)、用户留存(customer retention)、数据挖掘(data mining)、价值创造(value creation)和产品开发(product development)。聚类模块值(modularity)Q=0.7618>0.3,聚类结构显著,聚类平均轮廓值(weighted mean silhouette)S=0.8273>0.7,聚类非常合理。

由关键词突现分析结果可知,数据价值化英文研究的演变路径为:数据自身的管理问题→数据在具体场景中的应用。据此,本文将数据价值化英文文献的具体研究内容归纳为以下两大研究主题。

1.数据自身的管理问题

LaValle等(2011)较早地注意到数据经过分析后能够产生洞察力指导行动进而创造价值,可视为早期数据价值化研究的雏形。数据自身的管理问题涉及数据行为、大数据管理、价值创造、大数据能力等细分问题。(1)数据行为。现有研究常基于价值链理论讨论从数据获取到数据决策的整个数据管理过程中的数据行为(Miller和Mork,2013),涉及数据生成、数据采集、数据预处理、数据存储、数据分析、数据可视化和数据利用等(Janssen等,2017;Faroukhi等,2020a;b)。(2)大数据管理。学者们主要围绕数据特征以及隐私与安全等问题展开讨论。数据特征被认为是影响价值实现的关键技术特征,包括数据数量、数据速度、数据多样性、数据准确性、便携性和互联性等(Günther等,2017;Ghasemaghaei和Calic,2019)。同时,大数据平台的安全和隐私执法不力被认为是企业激发数据价值的主要障碍(Colombo和Ferrari,2015),可能产生包括主体歧视等13个数据伦理挑战和社会风险(Clarke,2016;Breidbach和Maglio,2020)。(3)数据价值创造。部分学者从不同视角构建了大数据价值创造的模型,例如Comuzzi和Patel(2016)建立支持企业利用大数据创造价值的五层次成熟度模型;Günther等(2017)构建大数据价值实现的集成模型,指出数据价值实现是工作实践、组织模式和利益相关者之间持续互动的结果;Ylijoki和Porras(2019)改进了DIKW(data-information-knowledge-wisdom,数据—信息—知识—智慧)和VVC(virtual value chain,虚拟价值链)模型,提出大数据价值创造过程模型,包含资产创造、能力创造、转化、竞争等过程;Wang和Wang(2020)开发了大数据和知识管理协同关系的概念模型;Santarsiero等(2023)提出了大数据与智力资本交互并增强组织价值创造的概念框架。(4)大数据能力。大数据能力是数据发挥生产要素作用,改善微观运行效率和提高企业创新绩效的必要条件(谢康等,2020),其细分能力包括大数据分析能力、大数据预测能力、商业智能能力等(Yasmin等,2020)。

2.数据在具体场景中的应用

有些学者将数据价值化置于战略导向、供应链管理、用户管理、营销管理、业务流程管理、人力资源管理、数字技术创新等具体场景中进行讨论。(1)战略导向。学者们已经发现数据能够驱动企业战略导向发生改变,从而更有效地产生和捕获市场价值,例如Akter等(2021)系统综述了国际企业大数据战略导向研究,确定了数据驱动战略导向的三个中心主题:数字平台导向、市场导向、创新和创业导向,并建立大数据战略导向的整体框架。(2)供应链管理。主要涉及供应链管理中的大数据采集来源、大数据存储、大数据分析、大数据在网络中的应用、大数据增值等细分主题(Addo-Tenkorang和Helo,2016)。Brinch(2018)基于价值发现、价值创造和价值捕获三个价值创造的维度,构建了大数据供应链管理框架。(3)用户管理。Line等(2020)研究发现互惠的大数据价值创造是用户在使用数据方面获得的利益和控制水平的函数,并提出了四种大数据互惠价值创造的类型。此外,在线社交大数据研究中已经形成了数据产生和收集的来源、表征数据的属性、数据处理技术,以及数据分析的价值挖掘四个细分主题(Solazzo等,2021)。(4)营销管理。研究主要关注营销部门如何通过大数据分析改进营销策略,例如Johnson等(2019)提出营销部门需要经历大数据分析实施的五个阶段:萌芽、认可、承诺、文化转变和数据驱动营销;Martens等(2016)构建针对用户行为的大规模精细数据营销预测模型。(5)业务流程管理。数据分析和流程改进实践能够互为补充(Wu等,2020),在业务流程中使用大数据可以培养企业的灵活性、敏捷性和活力,从而提高组织的探索和利用能力(Dezi等,2018)。Zhan等(2017)和Sultana等(2022)分别构建了数据驱动的创新能力框架和产品创新流程的大数据框架。(6)人力资源管理。数据对人力资源实践的影响包括信息、学习、知识、效率等方面(Garcia-Arroyo和Osca,2021),更重要的是,数据能够改变企业的决策文化,从而产生数据驱动的决策(Frisk和Bannister,2017;Tian和Liu,2017),并出现了数据分析师、数据科学家、首席数据官等新职位(Carillo,2017)。(7)数字技术创新。工业4.0(Klingenberg等,2021)、云计算(Shou等,2020)、区块链(Bhatti等,2021)、人工智能(Lee等,2021)等技术的发展能够帮助企业更好地利用数据创造价值。

(二)数据价值化中文文献分析

本文基于Cite Space5.8R3软件分析了数据价值化中文文献关键词聚类图谱和关键词突现情况(见图2)。

图2 中文文献关键词聚类图谱和关键词突现分析

文献分析呈现11个聚类,这些聚类是确定研究主题的基础,包括大数据、数据要素、数据赋能、数据价值、反垄断、价值、价值运动、企业信息化、大数据交易平台、价值孵化和场景。聚类模块值Q=0.7101>0.3,聚类结构显著,聚类平均轮廓值S=0.8844>0.7,聚类非常合理。

由关键词突现分析结果可知,数据价值化中文研究的演变路径为:数据价值挖掘→数据市场化流通。据此,本文将数据价值化中文文献的具体研究内容归纳为以下两大研究主题:

1.数据价值挖掘

国内对数据价值化的研究起步较晚,目前研究成果集中讨论了数据赋能、数据价值、数据要素、场景、反垄断等关键数据问题,并关注了数据形态的演化问题。(1)数据赋能。主要包括数据赋能与价值共创、与制造升级、与社群问题、与弱势群体等四个方面(孙新波等,2020)。(2)数据价值。主要以数据价值链为视角展开数据价值化路径研究,例如叶春森等(2014)研究了云计算——大数据的价值链驱动产品与服务创新平台化的机制问题;王雷等(2016)基于价值链构建了大数据驱动的共享价值创造模型;李晓华和王怡帆(2020)分析了数据价值链在生产环节中的价值创造机制。值得注意的是,已有学者研究提出数据形态沿着“数据资源—数据资产—数据商品—数据资本”动态进化,各阶段价值形态分别对应潜在价值、价值创造、价值实现和价值增值(李海舰和赵丽,2021)。(3)数据要素。主要聚焦数据要素价值创造的实现方式展开研究,例如王建冬和童楠楠(2020)讨论了数据要素与其他生产要素协同联动的“五链协同”机制并构建理论模型;张昕蔚和蒋长流(2021)探究了数据要素的形成过程及其融合发展机理。此外,安小米等(2021)、梁正和吴培熠(2021)还关注释放数据要素价值过程中的数据治理问题。(4)场景。数据应用场景的研究较少,仅关注到在产品突破性创新(李树文等,2021)和营销(杨扬等,2020)等场景中的作用。(5)反垄断。数据的爆炸式增长引起学界围绕大数据具体行为的认定以及如何规制等问题展开讨论,现有关于数据垄断问题的研究主要分为理论探讨型和规制对策研究型两种类型,例如反对大数据限制竞争的学者从竞争与创新两个维度探讨大数据对市场与消费者的影响,而支持对数据垄断进行限制的学者则认为数据垄断将数据优势转化为竞争优势,并获取消费者剩余,可能造成的危害构成了一种社会成本(费方域和闫自信,2018)。

2.数据市场化流通

随着数据市场化步伐加速,数据交易和流通的问题同时引发学者的关注并成为未来研究的核心问题之一,主要涉及数据市场和数据权利两个方面。(1)数据市场。数据要素市场化是市场经济条件下资源优化配置的需要,涉及市场配置、市场定价、市场交易、市场竞争、市场制度等具体问题(何玉长和王伟,2021),例如张敏(2017)基于交易安全视域讨论了大数据交易法律监管的原则和制度构建问题;黄倩倩等(2022)提出“报价—估价—议价”相结合的数据价格生成路径和“冷启动期—成熟期”分步走的数据产品动态定价策略。也有学者提出数据市场化流通的新业态和新模式,例如尹西明等(2022)提出以数据银行为业务模式载体的“要素—机制—绩效”动态整合价值化理论模型。(2)数据权利。数据权利形成于一组多个权利集合的“权利束”,包含数据所有权、数据运营权、数据使用权的“三权分置”,涉及个人、集体、组织、国家等多元主体(赵瑞琴和孙鹏,2021)。

(三)数据价值化中英文文献对比分析

本文对关键词出现频次、第一次出现的年份和中心性进行计算与整理,对数据价值化中英文文献排名前10位的关键词进行共现统计,如表1所示。

表1 中英文关键词聚类及分布对比

文献分析可以发现,数据价值化中英文文献的焦点并不完全一致,但却形成互补之势。数据价值化的英文文献主要侧重于大数据分析在具体场景中的应用,数据的价值主要从数据资产的角度进行解释,对数据形态及其动态演化问题关注有限。数据价值化的中文文献则围绕数据要素的形态变化和市场流通问题展开研究,但对数据在具体场景中如何发挥作用的讨论不如西方充分。值得注意的是,中西方学者都注意到数据价值链在揭示数据价值流动方面的重要作用,本文借此进一步揭示数据价值的实现过程问题。

中西方研究焦点和演变路径的差异很大限度上源于所处背景的不同,中国数字经济起步晚,但势头猛、动力足,形成“立足产业和市场优势,有效市场和有为政府相互促进”的中国模式①资料来源:中国信息通信研究院. 全球数字经济白皮书[R]. 北京:中国信息通信研究院,2021.。中国数字经济实现了跨越式发展,数字技术和数据在生产和生活领域充分应用,政策加速推动数据要素市场化改革。西方特别是美国数字经济布局早,核心技术的领先实力和地位为其数字经济发展提供强大动力,形成“依托持续领先的技术创新,巩固数字经济全球竞争力”的美国模式,数据随着新技术、新产业、新业态、新模式的不断迭代而不断创造新价值。

三、 数据价值化的内涵与特征

在梳理数据价值化已有研究的基础上,本文进一步引入数据价值创造的要素视角提出数据价值化的完整内涵,并对比数据要素价值化与传统要素价值化的核心特征,从而整合提升已有数据价值化内涵与特征的研究,明晰数据价值化的理论研究基础和边界。

(一)数据价值化的概念内涵

数据价值化的定义存在两种视角:一是关系视角,该视角认为大数据是价值创造的重要因素,现有研究主要构建了数据相关变量与价值相关变量之间的关系模型并剖析影响路径,例如Pinochet等(2021)的研究发现大数据分析能力积极影响基于流程导向的动态能力,进而影响产品创新绩效。二是形态视角,该视角从数据资源、数据资产、数据商品、数据资本等数据形态的演进出发,破解数据价值识别与配置问题,例如中国信息通信研究院提出数据价值化是指以数据资源化为起点,经历数据资产化、数据资本化阶段,实现数据价值化的经济过程②资料来源:中国信息通信研究院政策与经济研究所. 数据价值化与数据要素市场发展报告[R]. 北京:中国信息通信研究院,2021.。何伟(2020)和孙克(2021)认为全面激发数据要素价值需要经历三个阶段,即数据资源化阶段提升数据质量、数据资产化阶段释放数据价值、数据资本化阶段扩展数据价值。谢康等(2020)、赵瑞琴和孙鹏(2021)、曲佳宝(2020)、杜庆昊(2020)分别讨论了各个数据形态的价值化机制。

本文基于现有研究,结合来源、参与主体、过程、目标结果等价值创造要素(孙新波等,2021),将数据价值化定义为企业在“数据资源化—数据资产化—数据商品化—数据资本化”的各个阶段中实施数据价值链行为,从而将数据要素纳入经济系统并与传统要素深入结合,进而激发数据自身价值、经济价值和社会价值。

(二)数据要素价值化与传统要素价值化核心特征的对比

随着数字技术的不断发展,数据成为数字经济的核心关键要素和血液。满足原始性、机读性和具有一定质量的数据被称为数据要素(高富平和冉高苒,2022)。与劳动、资本、土地、知识、技术、管理等传统生产要素相同,数据要素也具有直接或间接被生产所需、明确的产权归属、各自功能互相组合、范围不断变化以及使用增殖性等特点(王柏玲等,2020)。与传统要素不同的是,数据要素在价值化对象、价值化范围、价值化效益、价值化模式、价值化创新等方面表现出新特征,也使数据价值化的底层逻辑发生了明显转变(见表2)。

表2 传统要素价值化与数据要素价值化核心特征比较

价值化对象方面,传统要素不依赖载体,能够直接投入和参与经济活动当中创造价值(张昕蔚和蒋长流,2021)。数据要素在企业内部无法单独创造价值(Ylijoki和Porras,2019),必须与其他传统要素构建新的要素组合和结构,体现出强渗透性(戴双兴,2020),经过数据整合、数据融通、数据洞察、数据赋能以及数据复用实现“两要素互补、多要素协同、全要素耦合”(白永秀等,2022;尹西明等,2022),全面激发对经济社会价值创造的乘数效应。

价值化范围方面,传统生产要素主要通过传统的价值链、产业链、供应链流动。数据要素的外部性和低复制成本、非竞争性等特性,促使数据在多主体之间广泛传播和共享,在互动过程中产生更多数据,并促进传统要素流动,推动大规模协作的广度、深度、频率进入一个新阶段(张昕蔚和蒋长流,2021),甚至出现了数字平台、虚拟团队、众包等新的主体集合形式,实现网络协同效应和要素跨界融合(Nambisan等,2017)。同时,数据要素的外溢又可以吸引更多的主体参与数据价值化生态,不断放大数据的价值产出。

价值化效益方面,传统要素具有稀缺性和不可再生性,在一定时间与空间范围内的要素总是有限的,一般遵循边际效益递减、边际成本先减后增的规律,制约着社会生产和增长能力的提高(王柏玲等,2020)。数据要素由于自身的可复用性、共享性、无消耗性等特性,能够源源不断地产生和循环使用(陈书晴等,2022)。随着数据要素规模的不断扩大,数据要素能够反映并赋能生产、运营、销售等活动环节,价值产出呈现指数级增长,边际成本随之降低甚至趋近于零,产生规模经济和网络外部性(潘家栋和肖文,2022)。

价值化模式方面,传统要素价值化的模式是固定、单一和确定的,而数据要素的价值化模式是多样和灵活的。面对不同的场景、使用者和目标时,数据要素的效用和价值化模式大相径庭(冯科,2022)。数据要素与其他传统要素协同联动具体涉及三种模式(陈书晴等,2022):一是价值倍增,即通过提升传统单一要素的生产效率来产生倍增效应,催生出人工智能等“新技术”、金融科技等“新资本”、智能机器人等“新劳动力”、数字孪生等“新土地”等要素的新组合和新形态。二是投入替代,即通过替代传统要素的投入与功能产生替代效应,例如机器人替代员工完成危险工作。三是资源优化,即通过优化传统要素之间的资源配置效率,促进传统生产要素的革命性融合与裂变,产生优化效应,例如智慧工厂、定制个性化产品等。与此同时,加工的数据商品可以在数据交易中心挂牌交易,再次进入买方企业内部与传统要素相结合,创造跨越企业边界的价值。

价值化创新方面,传统要素是有限的、不可再生的,企业在创新过程中基于碎片化的信息做出创新决策进而配置各个要素,以期投入有限的资源获取最大的收益,企业依靠外部驱动进行被动创新或内部驱动进行主动创新。数据要素的可再生性、即时性决定了数据体量更大、迭代速度更快(潘家栋和肖文,2022),这对数据处理能力的要求往往超出了人类能力的上限,需要企业主体和数字技术形成合力共同应对。对于企业主体而言,利用数据要素产生对市场需求的洞察力,催生电商直播、无人经济等新业态和新模式。对于数字技术而言,可以利用自我增殖、自我演化和自我学习等特点,通过算法和人工智能等技术实现自主创新(Hutchinson,2021)。

四、 数据价值化的整合研究框架

基于对现有研究的系统梳理,本文基于“前置因素—实现过程—效果产出”的逻辑构建了数据价值化的整合研究框架(见图3)。首先,将前置因素归纳为技术因素、组织因素和环境因素。其次,在划分数据资源化、数据资产化、数据商品化和数据资本化四个阶段的基础上,通过整理各阶段涉及的研究主题,并基于价值链理论提炼出数据价值化四个阶段中的数据行为,分析数据流动与价值创造沿着企业活动链条相伴而动的过程,明晰数据价值化的实现过程。最后,将数据价值化的结果产出归纳为数据价值、经济价值和社会价值三类。

图3 数据价值化的整合研究框架

(一)数据价值化的前置因素

1.技术因素。技术因素指企业激发数据价值所依赖的各类技术,具体包括系统质量、IT基础设施和供应商支持(Surbakti等,2020),分层架构设计、机器学习算法(Mauro等,2019),技术的相对优势、风险和不安全性、可追溯性、可观察性、复杂性、兼容性(Maroufkhani等,2020),技术资源(Yadegaridehkordi等,2018)。

2.组织因素。组织因素指企业利用数据的内部结构和流程,具体包括数据导向、高层管理支持、用户导向、沟通与协作、员工的知识和技能、员工敬业度(Surbakti等,2020),创业导向(Kollmann和Stöckmann,2014),大数据战略(Pinochet等,2021),可观察的成本、变革效率(Yadegaridehkordi等,2018),组织意愿(Maroufkhani等,2020),组织准备度(Maroufkhani等,2022)。

3.环境因素。环境因素指企业在数据价值化过程中外部主体行为的影响,具体包括竞争压力、外部支持、政策法规(Maroufkhani等,2020),竞争对手大数据分析能力(Lai等,2018),合作方压力(Yadegaridehkordi等,2018)等。

(二)数据价值化实现过程和关键数据行为

1.数据资源化行为

数据资源化是按需求对无序混乱的原始数据进行标准化、结构化处理从而“抽丝剥茧”出高质量、有潜力的数据,以可采、可见、标准、互通、可信的形式管理、存储和共享这些数据的过程(何伟,2020;孙克,2021)。当数据能够被理解和利用时,原始数据就成为数据资源。

数据资源化阶段的目标是提升数据质量,包括数据产生、数据获取、数据预处理和数据存储等关键数据行为,涉及对数据自身的管理问题。(1)数据产生。根据数据的来源,可以分为物联网、社交媒体、运营和商业数据,或者业务、机器、人工流程生成的数据,同时也可以通过购买和共享获得数据。根据这些数据的性质,可以分为结构化、半结构化和非结构化数据(Faroukhi等,2020b)。(2)数据获取。接收和收集数据具体包括数据标识、数据收集和数据传输三个子步骤。(3)数据预处理。使用不同的技术,使数据能够提供简洁易懂的内容,包括过滤、提取、转换、验证、清理、融合、缩减、链接、聚合和标准化等步骤(Faroukhi等,2020a)。(4)数据存储。将大量原始数据和预处理数据存储在高度分散的存储区域中,利用不同的数据模型搭建数据存储的基础架构和分布式处理基础架构(Faroukhi等,2020a)。

2.数据资产化行为

数据资产化是实现数据价值的核心,通过将数据与劳动、资本、土地、知识、技术、管理等传统生产要素相结合,赋能战略导向、供应链管理、用户管理、营销管理、业务流程管理、人力资源管理、数字技术创新等场景(何伟,2020),从而将可控性、可量化、可变现的数据资源转化为数据资产。

数据资产化阶段的目标是数据对场景的赋能,包括数据分析、数据决策、数据编排、数据资产评估等关键数据行为,遵循“分析—决策—实施—评估”的行为逻辑。(1)数据分析。通过对大量数据进行不同视角的分析以发现数据间相关性、构建新知识模型,一般包括描述性、诊断性、预测性和规定性数据分析(Ghasemaghaei和Calic,2019)。(2)数据决策。在面对不确定性商业机会时,结合数据形成的洞察力决定是否进行资源投入的抉择,决策模式由“经验驱动”向“分析驱动”转变(Tian和Liu,2017)。(3)数据编排。依据决策对数据、人、财、物等关键资源进行构建、整合和利用以主动适应外界环境变化,开发新机会,进而创造新价值(Sirmon等,2011)。(4)数据治理。以设计、实施、监控数据资产管理的战略计划为目标,协调实施一系列活动,涉及数据体系、数据分类、数据感知、数据质量、数据安全与隐私等(安小米等,2021)。(5)数据资产评估。对数据资产在某一时点的价值进行估计,有些学者提出基于剩余法的多期超额收益模型等多种数据资产价值评估方法(陈芳和余谦,2021)。

3.数据商品化行为

数据商品化是数据资产升级为数据商品的过程,使有需求的企业能够在数据市场上以相对公允的价格获取所需的数据要素(李海舰和赵丽,2021)。当数据能够以各种形式灵活交易时,数据资产就成为数据商品。

数据商品化阶段的目标是数据脱敏与封装,使之可灵活整合为一系列数据商品,通过卖出或买入获得收益和补充企业数据池,包括数据打包、数据定价、数据交易等关键数据行为。(1)数据打包。利用区块链、隐私计算等技术,自发或通过数据信托机构将政府公开数据、企业内部数据、数据供应方提供数据、网页爬虫数据和合作伙伴数据进行脱敏,包括脱敏、清洗、分析、建模、可视化等步骤,形成可供出售的一系列的API、数据包、数据定制服务以及数据产品等(王卫等,2019)。(2)数据定价。国内对数据定价的探索主要依托于大数据交易平台展开,共形成两类定价方式:第一种是协商定价,具体包括拍卖定价、反馈性定价和自由定价等,第二种是可信第三方定价,具体包括固定定价、自动计价和实时定价等(孙克,2021)。(3)数据交易。我国各地以多种形式开展了关于数据交易的探索和实践,形成了数据撮合交易和数据增值服务两种主要交易模式(田杰棠和刘露瑶,2020)。

4.数据资本化行为

数据资本化是数据商品升级为数据资本的过程,类似于马克思在资本论中提到的商品到货币的“惊险一跃”,本质是按照市场化手段对数据要素进行投入产出管理(杜庆昊,2020),使数据能够通过资本运营实现增值,将数据作为一种可替代货币进行投融资,但该阶段现仍处于初级探索阶段。当数据从商品世界分离出来固定地独占一般等价物地位时,数据商品就成为数据资本。

数据资本化阶段的目标是实现数据投融资,包括数据资本运营和数据资本收益分配等关键数据行为。(1)数据资本运营。数据成为一种可以流通的资本,能够与股票、证券、基金、保险、期货、期权等金融工具相结合,具体模式包括市场化租赁经营、参股控股等(Pinochet等,2021),实现生产要素优化配置和产业结构的动态重组,也是数据资本和资产的交换。(2)数据资本收益分配。对资本运用成果的分配,既是资本运动过程的终点,又是下一次资本运动的起点。数据资本收益分配形式可以设计现金股利分配和财产股利分配等多种形式。

(三)数据价值化的结果产出

1.数据价值。数据价值是数据创造的直接、易观察的价值,是创造经济价值和社会价值的基础,包括企业数据治理与企业战略的匹配度、数据支撑企业业务的数量及深度、数据标签量、数据覆盖领域等(郭明军等,2020)。

2.经济价值。数据价值化能够为企业带来可观的经济价值,具体包括财务绩效和市场绩效(Maroufkhani等,2020;Pinochet等,2021)、供应链绩效(Thekkoote,2022)、营销绩效(Gupta等,2021)、创新绩效(Ghasemaghaei和Calic,2020)、运营绩效(Yasmin等,2020)、战略绩效(Bhatti等,2021)、客户关系绩效(Chierici等,2019)、国际绩效(Gnizy,2019)、生产效率提升和成本节约(Kache和Seuring,2017)、业务流程的灵活性与效率效果(Saide和Sheng,2020)、企业竞争优势(Shan等,2019;Hossain等,2021)、可持续生产(Bag和Pretorius,2022)、可持续绩效(Imran等,2021)等。

3.社会价值。数据价值化带来的社会价值包括企业社会绩效(Calic和Ghasemaghaei,2021)、就业增长(Loebbecke和Picot,2015)、循环经济绩效(Awan等,2021)等。

五、 结论与未来展望

(一)结论

本文对2011—2022年发表于重要期刊的250篇数据价值化英文文献和117篇中文文献进行系统归纳和拓展提升,明晰数据价值化的研究主题、内涵和特征,讨论数据资源化、数据资产化、数据商品化和数据资本化四个阶段的价值实现过程,构建数据价值化的整合研究框架。研究结论为《“十四五”大数据产业发展规划》中激发数据要素价值的目标提供了较为完整的理论解释,对于构建数据价值化理论体系具有重要推动意义,有力回应了李海舰和赵丽(2021)、尹西明等(2022)等学者发出的加强数据价值化研究的呼吁,也为企业数据利用实践和数据要素市场化配置提供管理启示。主要结论如下:

第一,本文对数据价值化研究进行梳理和述评。通过文献梳理发现,中西方对数据价值化研究的关注重点并不完全相同。数据价值化英文文献研究重点由数据自身的管理演化为数据在具体场景中的应用,主要涉及数据行为、大数据管理、价值创造、大数据能力等主题,以及战略导向、供应链管理、用户管理、营销管理、业务流程管理、人力资源管理、数字技术创新等场景,研究亮点在于结合具体场景细化讨论数据创造价值的过程和机制。数据价值化中文文献研究重点由数据价值挖掘到数据市场化流通,主要涉及数据赋能、数据价值、数据要素、场景、反垄断、数据交易和流通等主题,研究亮点在于从过程视角对数据资源、数据资产、数据商品、数据资本等数据形态进行划分,能够更具体地解释数据价值化的实现过程。

第二,本文明晰了数据价值化的内涵和特征。首先,在融合现有研究中的关系视角和形态视角的基础上,明确数据价值化的内涵。其次,对比分析数据作为新型生产要素,与传统要素在对象、范围、效益、模式和创新方面的差异,在此基础上提出数据价值化的核心特征,即对象上依赖其他传统要素、范围上基于更广泛的生态、效益上能够产生规模经济性、模式上灵活多样、创新上支持自主开发新业态和新模式。

第三,本文构建了数据价值化的整合研究框架。数据价值化包括数据资源化、数据资产化、数据商品化和数据资本化四个阶段,各个阶段中的关键数据行为使数据在数据价值链中流动并创造数据价值,这个过程受到技术、组织和环境等前置因素的影响,能够产生数据价值、经济价值和社会价值。四个阶段的数据行为由围绕数据自身的提质处理,到企业范围内数据与场景相结合,再到数据市场上的数据商品交换,最后涉及整个社会市场经济中的数据投融资。这个过程中数据流动范围越来越大,数据利用程度越来越高。

(二)未来展望

第一,数据治理、数据价值评估、数据交易、数据资本运营、数据资本收益分配等关键数据行为值得未来进一步关注。本文从数据实践需求出发,呼吁未来研究关注如下问题:(1)数据治理方面,分析集中式、分散式与联邦式的数据治理运营模式;探究如何将分类分级工作与数据安全管控的要求结合起来形成数据安全的统一管控策略;从数据结构角度、数据内容来源角度、技术业务角度探讨数据标准分类问题;构建数据质量的技术和管理评估框架;讨论元数据的定义、类型、应用和管理模型;基于数据全生命周期建立数据安全治理能力成熟度模型。(2)数据价值评估方面,探寻市场法、成本法、权益法等传统定价方法之外,适合数据和数据产品低复制成本、较大的价格歧视空间等特征的多角度、多维度价值评估方法(熊巧琴和汤珂,2021)。(3)数据交易方面,讨论数据交易权利归属、定价方式和盈利模式(李成熙和文庭孝,2020)。(4)数据资本运营和数据资本收益分配的讨论可以在借鉴货币资本等传统资本理论基础上,探索数据资本独特的投资运营模式、提升运营效率的原则和策略、收益分配机制与演化博弈等问题。

第二,我国数据商品化和数据资本化刚刚起步,亟须集思广益指导实践发展,学界可以从数据行为优化和创新研究方法入手。在数据行为优化方面,未来研究可以重点关注如何利用人工智能、区块链等数字技术做出最优的数据买入和卖出决策?如何利用数据服务商等新兴主体促进数据交易?数据资本影响绩效的路径以及资本结构的动态调整等问题。在研究方法方面,受制于现实发展情况,理论研究方法成为主流。随着数据商品和数据资本逐渐普及,届时可以开发专项量表,利用大样本实证、案例、fsQCA、计算机模拟等多种研究方法,建立和验证严格的假设,为促进我国数据交易和流通贡献智慧。

第三,结合数字化转型、数字化创新、数字创业、数字创业生态系统等数字化情景深化数据价值化研究。现有研究对于数据价值化如何驱动企业和生态系统创造数字价值关注有限,这成为数据价值化研究与数字化研究中均亟待破解的问题。未来研究可以重点关注:(1)数据价值化驱动企业进行数字化活动创造效益的机理。数据是企业进行全方位、多角度、全生态链条数字化的核心驱动力,后续研究可以从大数据能力和要素的视角,分别讨论在数据资源化、数据资产化、数据商品化和数据资本化四个阶段中数据行为与利用模式对产品、服务、流程、模式和组织方面的数字化创新与创业的影响,挖掘不同阶段的数字价值产出,以及阶段之间进化的动力。(2)多主体之间协同推进数据价值化影响生态系统层面数字价值创造的机理。在生态系统开发和释放数据价值依赖于高效有序地组织、调动、整合多主体数据,进行更大范围、更深层次、更具活力的数据流动和共享。后续研究可以关注生态系统中多主体协同进行数据价值化活动的路径和机制,以及由此形成的数字价值共创过程和价值分配等问题。

第四,未来可植入中国本土化的独特因素,开展场景化的数据价值化研究。西方学者率先结合供应链管理、用户管理等具体场景展开数据价值化的相关研究并取得了较为丰富的研究成果。然而,我国数据价值化研究起步晚,结合具体场景的讨论十分不足,需要从多场景的角度进一步丰富现有研究。实际上,华为、小米、海尔等为代表的中国企业已经将数据应用于众多具体场景之中,产生了数据与应用场景深度融合的成功实践,为理论研究提供了丰富的素材,因而有必要探究中国企业如何在不同场景、不同行业中如何推进持续的数据价值化过程,从而形成对本土组织实践的新洞察,推动本土理论的创新和发展。

第五,未来研究还应注意到作为企业的优势,可以利用来自用户、员工、供应商等利益相关者的数据来创造新价值过程中存在的潜在风险或消极影响,包括数据垄断、大数据杀熟、数据贩卖、数据泄露等各种数据安全问题,亟须探索如何防范和化解可能的消极影响和风险。同时,企业数据价值化行为规则的构建和数据使用伦理等问题也亟待深入探讨。