APP下载

出版业通用数据交换生态构建

2021-09-18赵毓峰丛磊

全国新书目 2021年8期
关键词:数据交换出版业

赵毓峰 丛磊

摘要:针对当前出版业普遍存在的对于数据交换的迫切需求,以及各种系统之间数据接口系统扩展性、开放性和兼容性差的问题,本文提出了构建“出版业通用数据交换生态”的概念,并且阐述了构建“出版业通用数据交换生态”的应用目标、构建原则、体系架构及运行模式,从而大幅降低产业链数据共享投入,解决产业链数据共享难题,为产业信息交换的规范性、科学性提供应用保障,实现出版业内外无差别的数据交换。

关键词:出版业;通用;数据交换;生态构建

在数字化、信息化大潮的引领下,各出版单位都根据自己的实际情况进行了数字化、信息化建设。从图书的选题策划到编辑加工、印制发行等各个环节都有相应的数字化、信息化产品在运行,并产生了海量数据。在出版业的各个环节中,利用以物联网、大数据、云计算、人工智能、5G网络、区块链为代表的现代信息技术使这些数据互联互通,消除信息孤岛,从而构建全行业的通用数据交换生态,为有力推进出版业信息化进程作出贡献。

一、出版业数据交换的问题与挑战

目前,出版企业存在大量数据交换、分析方面的迫切需求,不仅有企业内部数据交换需求,同时还有大量企业对外数据交换需求。

当前,国内外出版企业普遍采用“FTP+XML[1]”接口模式进行数据交换。基于此模式开发的接口采用的是“软件代码与业务代码交织在一起”的模式,任意节点业务规则的变化,都会导致所有接口需要重新开发。此种数据交换模式,无论是研发费用,还是后续的维护和修改都耗资巨大,大大超出了出版企业的承受能力。具体表现在:①投入费用高。交换接口需定制开发,且是特定的一对一方案,开发及维护投入较高。②绑定规则死。交换接口中“软件代码与业务代码交织在一起”,任意节点业务规则发生变化,所有接口都要重新开发。③应用标准难。企业既对标准的认知存在偏差,又缺少平台去应用标准。交换接口品种繁多,对标准的应用水平参差不齐,造成“有标准不用、有标准难用”的困境。④保障安全少。企业无力投入大量资金去设计部署安全方面的硬件、软件、网络一体化架构,给数据安全带来极大隐患。

针对上述问题,出版产业通用数据交换技术重点实验室提出构建“出版业通用数据交换生态”,实现技术应用平台化,从而构建“四用”新生态的概念。这里的“四用”是指:①通用。即信息互联,采用“逻辑分离、应用贴合”原则,不再需要另行开发交换接口,任意两个信息系统之间均可实现数据交换,彻底消除“信息孤岛”。②可用。降低投入,出版企业无须专门购买交换平台(含软件),仅用少量资金或免费的方式,即可满足高安全性、高稳定性、高实时性的数据交换需求。③好用。模式重组,采用“云平台+客户端”运行模式,用户使用更加方便。④实用。改变交换接口只能由原厂商开发的弊端,让更多单位(或个人)成为数据交换方案创作者。超额流量收费,定额流量免费,流量费与“端交换方案”创作者进行分成,构建行业数据交换新的应用生态。

二、出版业通用数据交换生态构建方案

1.出版业通用数据交换生态构建应用目标

出版业通用数据交换平台旨在建立一个开放的、通用的信息交换生态环境,支持不同厂家、不同版本的出版业应用系统接入,以实现各种出版业应用系统进行数据和信息的交换,减少对特定系统开发厂商的依赖。同时,可利用通用数据交换自主拓展更多创新服务。

2.出版业通用数据交换生态构建原则

出版业通用数据交换生态构建体现标准化、通用性和开放性原则。

(1)标准化原则

严格融入并执行国家标准、行业标准、企业标准等现行标准,推动标准的落地应用。有标准的,严格执行基于标准的数据交换。无标准的,按创作规范创作“准中间标准”,用于数据交换。改变出版业“有标准不用、有标准难用”的现状。

(2)通用性原则

出版业大数据包括七类数据,分别是机构数据、人员数据、产品数据、政务数据、商务数据、用户数据和内容数据。出版行业数据分散在不同的主体当中,这七类数据散落在党和政府部门、出版单位、发行商、图书馆、科研院所、广电商、电商平台等。主體收入数据分散,导致主管部门与出版行业主体之间、产业链上中下游主体之间信息不畅,信息系统缺乏互联互通,产业链数据不能真正融合[2]。平台提供通用的解决方案,不同系统厂商开发的各种业务系统都可以根据接口规范完成数据和业务逻辑的无缝交互。

(3)开放性原则

提出“端交换方案”创作标准,用以规范技术厂商(或个人)根据不同交换需求及信息系统业务逻辑制作的“端交换方案”,使“端交换方案”制作简单可循,逻辑严谨完整,交换顺畅无误。遵循“代码分离、应用贴合”的应用规则,将“端交换方案”的创作权交还给技术厂商或对信息系统业务规则有深入把握的第三方技术服务商(或个人),而不是由特定开发商进行定制开发。

3.出版业通用数据交换生态的体系架构

出版业通用数据交换生态以“出版产业通用数据交换云平台”的形式体现,通过“端交换方案+中间标准库”的模式提供服务,具体架构包含三个层次,分别是中间标准层、数据交换层和应用层。(如图1所示)

(1)中间标准层

中间标准层是构建出版业通用数据交换生态的基石,整合与出版产业相关的60余种出版、发行、信息类标准,如2006年颁布的《图书流通信息交换规则》[3],以及2013年颁布的《中国出版物在线信息交换(CNONIX)图书产品信息格式》[4]等标准,将标准中规定的信息交换的内容、类型、格式规范、技术规范等定义在出版业通用数据交换生态中,形成“中间标准库”。在出版业通用数据交换生态中的所有数据交换行为,都以中间标准库中的定义为蓝本进行。

出版业通用数据交换生态是一套开放的、通用的系统,中间标准库的存在,只是为不同应用系统或同一系统的不同版本提供一套数据交换依据,绝不是要求生态中的用户根据中间标准库的定义修改正在运行的业务系统,而是在原有系统用户不做任何修改的前提下进行无缝对接。中间标准库是出版业通用数据交换生态构建标准化原则的具体体现。

对于现实中有交换需求,但又无国家(或行业、企业)标准的,可以由需求方按照中间标准库”的设计规范,自行创作交换规范,形成“准中间标准”上传至“中间标准库”。

(2)数据交换层

数据交换层是出版业通用数据交换生态中通用性和开放性原则的体现,生态中不同系统、不同版本的数据,依据中间标准层的定义在这里完成交换。数据交换层由两个部分组成,分别是开发及管理终端和端交换方案。

1)开发及管理终端

开发及管理终端是出版业通用数据交换生态中的一个通用的工具软件,以C/S架构中客户端的形式免费提供给所有用户,包括应用系统开发厂商、应用系统用户、第三方开发者以及生态系统管理者。

对于应用系统开发厂商及第三方开发者,开发及管理终端可用于检索中间标准库中的各种定义格式,以此为依据开发应用系统的端交换方案和准中间标准库。最后上传到出版业通用数据交换生态中。

对于应用系统用户,开发及管理终端用于选择适合自己的端交换方案并进行配置。

对于生态系统管理者,开发及管理终端用于系统管理、权限管理等。

2)端交换方案

端交换方案将信息系统运作行为抽象为connect、select、insert、update、delete、up、down、import、export、execute等类型,开发者只需根据具体的业务系统的相应版本,以中间标准库为依据,按照创作规范标准将数据库交换字段及业务逻辑进行编制,并经过与中间标准库的审核确认,即可形成该版本的端交换方案。在出版业通用数据交换生态中,任意一款应用任意版本的端交换方案,都不是唯一的,由于中间标准库以及创作规范标准都是开放的,无论是系统的开发厂商、系统用户甚至是与应用系统无关的第三方,只要愿意,都可以根据自己对应用系統的理解和使用习惯开发端交换方案,并提交到出版业通用数据交换生态中供用户选用。端交换方案并不局限于不同实体间(如:出版社与渠道商之间)数据的交换,同样适用于单个实体内部不同应用系统之间(如出版社内部ERP系统与官网之间)的数据交换。

端交换方案开发者能够因“端交换方案”被用户采用而获得收益,从而促进更广泛的参与,避免仅靠应用系统原厂商单打独斗开发接口的局面,从而构建起数据共享、数据交换新的应用生态。

(3)应用层

应用层是出版业通用数据交换生态中的最终用户,他们只需要根据自己的实际情况,在出版业通用数据交换生态中选择最适合自己的端交换方案进行部署。由于所有端交换方案都是以中间标准库为依据进行编制且进行过审核确认,因此,只要用户选择了自己满意的端交换方案并且正确部署,即可与出版业通用数据交换生态中的任意系统进行数据交换。

由于端交换方案部署在应用系统的服务器端,不与应用系统的实际使用者发生直接的联系,对于实际使用者是完全透明的,只需按照原来的操作运行即可,无须针对端交换方案进行专门的适应和培训。

4.出版业通用数据交换生态的运行模式

如图2所示,出版业通用数据交换生态由数据交换云平台、技术厂商以及企业用户三种角色组成。

(1)数据交换云平台

数据交换云平台定位于出版业通用数据交换生态的中间标准层,承担着生态系统维护管理、标准制定与存储、规则制定、端方案管理与校准、资源调度、收益分配、争议仲裁等作用。

数据交换云平台需要保障整个通用数据交换生态正常运转,进行平台内部各种系统的维护与控制,维护信息安全,保障传输网络高效流畅,处理各种突发事件。

数据交换云平台整合与出版产业相关的60余种出版、发行、信息类标准,将标准中规定的信息交换的内容、类型、格式规范、技术规范等定义在出版业通用数据交换生态中,形成 “中间标准库”,并提供检索服务。

数据交换云平台免费提供开发及管理终端,用于技术厂商客户端进行中间标准检索并以此为依据编制端交换方案。

数据交换云平台存储各方编制的端交换方案,供需要进行数据交换的企业用户选用。同时,对端交换方案的状况进行评估,制定端交换方案的使用规则。

(2)技术厂商

技术厂商定位于出版业通用数据交换生态的数据交换层,主要职能是为出版业通用数据交换生态提供针对各种应用的端交换方案,具体工作流程是:

1)从数据交换云平台获取开发及管理终端,向平台注册并登录;

2)选择需要编制端交换方案应用系统及版本;

3)从数据交换云平台中间标准库检索并下载对应的中间标准;

4)编制端交换方案;

5)将编制好的端交换方案上传到数据交换云平台;

6)经过数据交换云平台审核认证后,成为最终的端交换方案供企业用户使用;

7)根据数据交换云平台制定的规则获取收益;

8)迭代升级。

技术厂商在出版业通用数据交换生态中并不局限于某个应用系统的实际开发者,而是一个开放的概念,可以是应用系统的开发企业自身,也可以是系统的应用者、第三方企业甚至个人。只要对需要编制端交换方案的应用系统有足够的了解和使用经验,并且愿意参与其中,就可以以技术厂商的身份向数据交换云平台注册账户,提交自己编制的端交换方案并从中获取收益。

(2)企业用户

企业用户定位于出版业通用数据交换生态中的应用层,是出版业通用数据交换生态的最终使用者。企业用户在出版业通用数据交换生态中选择、使用端交换方案,与各种应用系统进行无缝的数据交换,提出自己的端交换方案需求,并根据数据交换生态中的规则支付费用。具体工作流程是:

1)从数据交换云平台获取开发及管理终端,向平台注册并登录;

2)选择开发应用系统的厂商;

3)选择应用系统及版本;

4)选择需要进行数据交换的企业用户;

5)选择端交换方案;

6)选择启用的单据;

7)设置必要的运行参数;

8)启动方案成功;

9)进行数据交换;

10)缴纳方案使用费;

11)根据实际使用情况提交升级需求;

12)迭代升级。

企业用户只选择针对自己应用系统及版本的端交换方案,而无须选择针对需要和自己进行数据交换对方编制的端交换方案。选择需要进行数据交换的企业,是为了通过本方选定的端交换方案向对方选定的端交换方案推送本方数据需求。由于双方的端交换方案都是依据中间标准库编制并经过了中间标准库的认证,虽然双方的应用系统、数据表项的表达方式、数据结构都各不相同,但是通过端交换方案的转换,即可进行数据的有效对接和交换。

端交换方案使用费分为内网交换和外网交换兩种情况。

端交换方案的内网交换是指本企业内部各种应用系统之间的数据交换,由于数据交换在企业局域网内部进行,不通过数据交换云平台,免费使用。

端交换方案的外网交换是指通过数据交换云平台与本企业以外的其他应用系统进行数据交换,这种情况根据使用该方案交换的数据流量进行计费。每个企业在首次接入数据交换云平台时,数据交换云平台都会为这个企业设定一个流量阀值,交换的数据流量低于流量阀值时,免费使用;数据交换流量超过预设流量阀值时按照数据流量收费,并与企业所选定的端交换的编制者按照比例分成。

端交换方案使用费的收取一方面为出版业通用数据交换生态不断注入资金,使之能够稳定流畅地运行并不断提高发展;另一方面端交换方案的编制者获得了实际收益,能够吸引更多的技术厂商加入出版业通用数据交换生态中,并对已有的交换方案不断改进提高;企业用户虽然付出了少量资金,但是能够流畅准确地与相关应用系统进行数据交换,大大提高工作效率。三方各取所需,形成良性循环。

三、总结与展望

出版业通用数据交换生态项目结合生产实际设计,为行业服务。由中国新闻出版研究院、新华文轩出版传媒股份有限公司、北京印刷学院、北京理工大学出版社、北京南北天地科技股份有限公司建立联合研究机构,该研究机构已被国家新闻出版署批准成立“出版产业通用数据交换技术重点实验室”,共同打造开放式研发平台。项目设计紧跟国家发展战略,服务大局,在媒体深度融合、产业数据交换方面发挥主力军作用。

出版业通用数据交换生态项目的推进,将大幅降低产业链数据共享投入,解决产业链数据共享难题,推动标准的落地应用,为产业信息交换的规范性、科学性提供应用保障,实现企业对内、对外无差别的数据交换,并通过大数据技术推进行业智慧决策、智慧生产、智慧服务。

[参考文献]

[1] 叶枝平,李振坤,刘竹松,等.基于XML的数据交换平台的研究与设计[ J ] .微计算机信息,2008(9):243-244.

[2] 刘成勇.树立数据思维,建设新闻出版大数据体系[ J ] .出版参考,2016(7):5-8

[3] CY/T 39-2006,图书流通信息交换规则 [ S ]

[4] GB/T 30330-2013,中国出版物在线信息交换(CNONIX)图书产品信息格式 [S]

(作者单位:出版产业通用数据交换技术重点实验室北京理工大学出版社有限责任公司)

猜你喜欢

数据交换出版业
曙光初现了,出版业
XBRL在财务报表网络数据交换中的应用
西班牙出版业发展现状
融合出版背景下的出版业管理人才培养
新闻出版业“十三五”规划调研座谈会在长沙召开
国际物流客户服务平台架构与实现