APP下载

科技成果转化平台的关键技术研究

2020-11-12李文全徐素萍

韶关学院学报 2020年9期
关键词:异构科技成果子系统

李文全,徐素萍

﹙韶关学院 信息工程学院,广东 韶关 512005 ﹚

科技成果转化为现实生产力的能力是衡量一个国家和地区科技发展水平的重要标志,对国家和地区经济增长有着重要意义.由于科研与生产脱节、成果转化体系不完善等通病的存在,导致大量的科研成果躺在档案室,或散落在科研人员手中,转化率同发达城市相比相对偏低[1].成果转化工作的滞后严重影响了科技能力与企业盈利能力的提升.为了提高科技成果转化率,有效串起成果转化过程中涉及的上、中、下游各环节,建设线上与线下相结合的技术交易服务平台,迫切需要建立完善的科技成果转化平台[2].解决科技成果与市场需求之间信息不对称难题,使科技成果与市场紧密的联系在一起,真正有效地促进科技成果的转化,实现科技成果的产业化.

为了促进科技成果的转化,美国、德国、日本等国家通过完善转化体系,构建基于产学研相结合的科技成果转化平台,成功地促进了成果转化;国内部分省市和学者也十分重视科技成果转化工作,搭建了面向不同行业的科技成果转化平台.李正权等为有效实现成果所有方和需求方、企业与技术之间的对接和交易,构建了基于“互联网+”的广东省科技成果转化平台[3];姚宁广等为提高农业科技成果的资源利用率,设计了一种基于面向服务体系架构的农业科技成果转化平台[4];尚珊等针对高校研发能力强转化能力弱缺陷,建立了基于信息咨询的高校科技成果转化平台.但它们主要关注科技成果数据的共享与集成[5].在我国促进政府数据开放共享,推动资源整合的大数据背景下,科技成果转化还面临一些新的挑战:

(1)需要动态集成多个部门的业务数据,如科技专家数据和科技成果数据分布存储在不同科研院所、高校、企业等单位的业务数据库中,需要动态实现集成并为其他业务平台和决策系统提供科技成果转化的数据服务.

(2)需要集成遗留的科技成果转化系统的应用,相关部门已有不少科技成果转化的应用,为了保护投资,需要集成这些遗留的业务系统中数据,使其一起协调工作.

(3)以往的检索服务没有语义背景,难于满足类型复杂与形式多样的科技成果检索需要,迫切需要加强以科技成果内容为关键词的提取,提高数据的检索效率和迎合用户检索兴趣.

针对新形势下的挑战,搭建了一个基于Web的科技成果转化平台,通过Web Services实现了数据的动态集成和多部门协作;通过XML技术实现异构数据的互操作;通过科技成果信息的关键词提取,提高了用户的检索效率和优化了用户体验.

1 平台架构设计

科技成果转化平台是基于Web开发,目标是在Internet/Intranet上实现分布、异构的专家和科技成果信息的互操作,并实现新的业务数据服务的动态装配和松散耦合.平台架构采用三层架构,由数据层、业务层和用户层组成,见图1.架构将业务应用和数据管理分离,便于数据的动态管理和有机集成,并保证系统具有一定的稳定性和可扩展性.

图1 平台架构

(1)数据层.数据层是指分布式存储在不同业务平台中与科技成果转化相关的数据,主要包括科技专家数据库、科技成果库、成果转化库、企业信息库,以及其他相关数据库或文件.这些数据存储在关系数据库或文件系统中.

(2)业务层.业务层是整个架构的桥梁与纽带.对用户层的发出的请求进行解析,通过调用业务系统,将请求转化成内部处理规则,并向数据层转发数据请求;数据层响应请求后,对返回的数据进行组织,以用户预设形式呈现给用户.业务层由业务系统和支撑服务系统两部分组成,其中业务系统包括科技专家子系统、企业信息子系统、科技成果子系统、交易子系统.支撑服务系统包括在线交流子系统、政策发布子系统、身份认证子系统、角色权限子系统、数据报表子系统、数据服务子系统.数据服务向外提供了标准的Web Services服务接口,支持新的业务数据动态集成和为其他系统动态提供数据服务.

(3)用户层.用户层是平台的最终用户,包括企业用户、科技专家、科研院所、高等院校、科技管理部门.专家人才通过平台可以进行技术和成果展示;企业用户通过平台可以搜寻技术和发布需求;科技管理部门依据平台数据辅助决策,发布成果转化政策;当科技成果与企业需求对接成功,可以通过平台完成交易,促进科技成果的转化.

2 关键技术及实现

2.1 基于XML的异构数据的集成

为了保护已有投资,集成遗留业务系统中的数据,需要一种能够满足在异构环境下进行数据交换和传输的标准.XML是一种用来描述数据的中介语言,它是一种任何人都写入和读出的标准化语言,它为异构化的结构数据提供了标准化描述格式.通过XML不仅可以很好地集成原有业务系统中数据,而且方便为其他系统应用提供信息共享.XML作为半结构化的描述语言,将XML的文档描述与现有数据库表中字段一一对应,可实现科技成果数据与XML文档的互相转换.只要遗留的业务系统遵循XML数据规范和交换标准,就可以实现异构业务数据的互操作.基于XML的异构数据集成模型见图2.

XML转换服务是实现分布异构业务数据与XML数据互相转换的关键服务.通过调用XML转换服务可以轻松地将关系数据库或文档数据转换成XML格式数据,也可轻松地对XML格式数据实施精准查询和模型抽取.另外为了消除了异构系统和平台的差异,实现异构业务数据服务的动态装配和松散耦合,XML适配服务采用了Web Services技术实现.只要新系统或原有业务系统向外提供和发布Web Services数据接口,就可以被动态地发现和集成,从而实现对遗留业务系统数据的集成.

图2 基于XML异构数据集成模型

2.2 科技成果关键词的提取算法

传统数据检索服务是将前台输入的关键词进行SQL拼接,并与数据库表的文本标题或内容进行配对,返回所有包含关键词的记录.这种方式比较适合数据量小、类型简单的数据检索.然而在类型复杂、形式多样的科技成果的检索时,面临两个难题:一是成果所有者给定的关键词与用户所期望的往往存一定偏差且耗时费力,提取效果也会因为提取人的喜好导致较大差异;二是科技成果类型复杂、形式多样,检索时常常需要访问多个关联数据表,随着科技成果的数据量的增加,检索服务的性能将下降.克服上述问题的关键在于关键词的提取,以科技成果为背景的关键词检索既可提高检索效率,检索结果也更能迎合用户兴趣.科技成果的关键词可以反映成果的主题,帮助用户快速对科技成果的内容建立画像.

关键词抽取是指从给定的科技成果描述文本中获取有代表性的词语,用以反映不同科技成果的技术要点、应用领域等主题的关键信息.TextRank 算法是一种适用于文本内容的词汇重要性排序算法,通过由词汇构成的网络结构的迭代计算出词语的重要性.算法的优点是不需要事先对文本进行相关的学习训练,非常适用于科技成果关键词的提取[6].算法的基本思路是对给定的文本进行分割,划分为由若干词语节点构成的图模型.利用PageRank算法对图模型进行迭代计算,直到节点的累加权重收敛,然后根据权重对所有节点进行排序,最后输出关键词[7].节点的权值计算公式为:

图3 关键词提取流程图

其中In(Vi)表示指向Vi的节点集合,Out(Vj)表示Vj指向的节点集合,Wji表示节点Vj与Vi边的权重,d为阻尼系数,一般取值为0.85,其主要作用是保证让权重能够稳定传递至收敛.为了有效提高关键词提取效果,将根据关键词出现的频次与语料库中的频数的算术平均值来确定每个词语的权重值,其值越大表示对主题的表现力越好.关键词提取的流程见图3.

(1)成果文本预处理.利用语句分隔符对科技成果描述信息进行切分,通过分词器和领域词典对切分后的信息进行分词,通过词表过滤停用词、代词、指示词等词语,保留与语义相关的名词、动词、形容词等包含科技成果关键信息的词语.

(2)构建图模型.根据第一步得到的词汇,构建以词语为节点的图模型G(V,E),V表示词语节点集合,E表示节点间边的集合.以参数值k滑动窗口对两节点包含的词汇进行标记,当两节点之间的词语存在共现关系时,则两节点间将存一条边,遍历所有节点,得到所有的边.

(3)计算节点权重.根据节点权重公式,迭代计算所有分词节点的权重值,直至收敛到可接受的区间值,则停止计算,此时,节点权重值越大说明该节点携带越多的关键信息.

(4)节点排序.遍历图中所有节点,根据迭代收敛时的权重对节点排序.

(5)提取关键词.将排序得到权重较大的前N个词语当作对应科技成果的关键词,并在原文中标注.

2.3 基于角色访问控制策略

科技成果是对某领域的科学技术进行研究取得的具有一定学术或应用价值的成果.科技成果信息来自不同部门、不同单位,涉及政治、经济、文化等方面的敏感信息,甚至国家机密,因此,为了防止数据篡改和非法访问,有必要利用访问控制策略对科技成果信息按权限受限地访问控制[8].科技成果转化平台的用户可划分为企业用户、专家人才、科研院所、高等院校、科技管理部门五类,因此,在用户与权限之间引入相应的五类角色,一个用户拥有若干角色,一个角色拥有若干权限.通过角色分配实现用户与权限之间的关联,通过权限授予实现权限与资源之间的关联,从而避免了用户与资源直接关联,实现了按用户角色权限受限地对系统功能进行访问控制,访问控制模型如图4所示.

在上面的访问控制过程中,通过角色实现了用户与访问资源的逻辑分离.一方面它有利于简化授权过程,另一方面有利于多样化的安全策略.

图4 基于角色访问控制模型

2.4 应用实例

遵循资源共享、效益共赢、动态发展的原则,结合科技成果转化的实际需求,笔者将相关技术应用于某市科技成果转化平台中.主要实现了通知管理(短信管理、平台通知、政策法规、推送提醒)、成果管理(成果信息、成果展示、成果评估)、需求管理(成果需求、人才需求、评估需求)、交易管理(意向管理、在线竞价、合同管理、成果成效)、数据服务(数据查询、统计分析、数据报表、服务接口)、用户管理(人才管理、企业管理、管理员管理、信息审核)、系统管理(数据备份、数据还原、用户角色、角色权限、修改口令)等功能,有效地疏通了科技成果转化的上、中、下游的各环节,解决了科技成果转化过程中的信息不对称问题,提高了科技成果资源的综合利用能力,促进了科技成果的转化.

3 结语

构建科技成果转化平台是贯彻落实科技创新思想、实施创新驱动发展战略的一个具体措施,是促进科技成果转化的主要手段.文中针对实际的需求,提出了一个科技成果转化平台框架,通过该框架解决了异构业务数据的动态集成、用户检索效率低、保障数据安全等关键问题,并通过实例证明了它的可行性和实用性.平台的构建将有效解决科技成果与市场需求之间信息不对称难题,使科技成果与市场紧密的联系在一起,真正有效地促进科技成果的转化,实现科技成果的产业化.

猜你喜欢

异构科技成果子系统
不对中转子系统耦合动力学特性研究
试论同课异构之“同”与“异”
GSM-R基站子系统同步方案研究
吴健:多元异构的数字敦煌
打通科技成果转化“最后一公里”
驼峰测长设备在线监测子系统的设计与应用
异构醇醚在超浓缩洗衣液中的应用探索
LTE异构网技术与组网研究
科技成果
科技成果