APP下载

农业科研试验基地数据管理标准体系构建

2020-04-10王启现崔运鹏

农业工程学报 2020年4期
关键词:标准规范农业科研数据管理

陈 丽,王启现,刘 娟,崔运鹏,王 末

农业科研试验基地数据管理标准体系构建

陈 丽1,2,王启现3,刘 娟1,2※,崔运鹏1,2,王 末1,2

(1. 中国农业科学院农业信息研究所,北京 100081;2. 农业农村部农业大数据重点实验室,北京 100081;3. 中国农业科学院成果转化局,北京 100081)

农业科学数据作为重要战略性资源,在推动农业科技创新、增强农业科技竞争力方面发挥重要作用。农业科研试验基地是一手科研数据的主要来源,其数据管理标准体系的建立不仅是试验基地数据规范化管理的基础,也是规范化数据管理工作的重要一环,对于提高数据可复用性,最大程度发挥数据价值有重要意义。该研究通过国内外涉农长期观测网络、试验站数据管理标准体系内容梳理,以及对中国农业科研试验基地数据特点、数据全生命周期管理流程调研,构建了农业科研试验基地数据管理统一工作流;基于“霍尔三维结构”从标准适用数据管理阶段、标准性质、标准专业领域3个维度构建农业科研试验基地数据管理标准体系框架,并编制了农业科研试验基地数据管理标准体系基本构成表,梳理出涵盖数据全生命周期管理的标准20项,首期必建标准12项,以期为推进农业科研试验基地建设和数据管理共享提供支撑。

科学数据;标准规范体系;农业科研试验基地;数据管理

0 引 言

随着新一代信息技术与科学研究过程的结合,数据密集型科学发现已成为继“经验科学(亦称实验科学)”、“理论科学”和“计算科学”之后的第四科研范式,推动科学研究由传统的假设驱动向基于科学数据进行探索的科学方法转变[1]。科学数据不仅是科研活动的产物,还是科研活动开展的基础。到20世纪90年代,科学数据已被提高到科技发展“牵引力”的高度[2]。同样,在农业领域,随着农业信息化、数字化、智能化发展,农业科学数据面临着爆发式的产生、衍变和积累。农业科学数据作为重要战略性资源,在推动农业科技创新、增强农业科技竞争力方面也将发挥重要作用。

农业生产是自然再生产与经济再生产相互交织的过程。与其他科研领域相比,农业科研具有试验(或实验)性农学研究的特点,必须依靠分布在全国各地的农业科研试验基地,面向农业一线生产开展研究[3]。据不完全统计,目前全国各级各类涉农科研机构、院校建立的以科研用途为主的农业试验基地1 000余个[4],有效支撑了国家重点研发计划、国家自然科学基金、省级及地方、科研单位等的研究项目,成为科技创新、成果转化、科技信息辐射和交流合作的重要平台[5-8]。同时,随着信息化和科研手段的提升,基于农业科研试验基地的观测、监测、实验,产生并快速积累起一大批有价值的农业科学数据资源。然而,由于绝大多数数据的收集都是依靠相关科研项目的支持,造成数据采集不连续、保存分散、缺乏统一规范化治理,可关联、可比较和分析价值大打折扣。

因此,本研究通过梳理国内外涉农长期观测网络、试验站数据管理标准体系,基于中国农业科研试验基地数据特点及全生命周期数据管理流程,从3个维度构建农业科研试验基地数据管理标准体系框架,以期为推进农业科研试验基地建设和数据统一规范治理与共享提供支撑。

1 国内外农业科研试验基地数据管理标准体系建设情况

目前,国内外涉农领域的“Experimental Station”、“Experimental Farm”、“Research Station”、“Observation and Research Station”、“野外观测站”、“野外试验站”、“试验基地”、“实验站”等表述各异的观测/监测/试验/实验站点所获取数据的标准化管理,多集中于生态系统、气候、环境等反映自然现象动态变化的持续观测数据方面,通过构建国家、区域性或全球性的长期观测研究网络实现统一标准下的数据规范化管理与共享。仅有少数如英国洛桑试验站(1843年)这种集作物学、遗传学、生化与分子生物学、生物统计学、昆虫学、土壤学、植物营养学和植物保护学等诸多学科为一体的综合性长期试验站点,建有专门的数据管理分析团队和企业、数据管理标准体系以及数据发布与共享网站[9]。中国农业科研试验基地建设以及数据共享管理起步较晚,除部分纳入长期观测研究网络中的农业试验基地数据管理有标准可依外,大部分农业科研试验基地数据管理标准体系不健全,处于无序、散乱、可用性差的原始数据管理阶段。

通过表1梳理,也可以看出,国内外观监测网络虽然对其网络内部试验站数据的规范化管理制定了相关标准规范,但主要还是立足于观监测网络层级的数据统一汇交管理和促进数据共享,与试验基地层级数据管理仍有一定区别[10-16]。各观监测网络数据管理标准规范可作为本研究标准体系建设内容的重要参考,若要提高各农业科研试验基地自身的数据管理和利用水平,尚需结合中国农业科研试验基地数据特点和数据管理流程,构建科学、有效的标准规范体系。

表1 国内外观监测网络数据管理标准规范

注:数据管理标准来自7大国内外长期监测网络、数据中心的数据管理网站,未通过网站对外公布的标准未计入本表。

Note: The data management standards came from the data management websites of 7 major domestic and foreign long-term monitoring networks and data centers. The standards not published through the websites are not included in this table.

2 农业科研试验基地数据特点及管理流程

2.1 农业科研试验基地数据类型与特点

农业科研试验基地是农业科技创新活动重要载体,根据功能定位不同,各有侧重的从事科学(田间)试验、科学观测、技术集成和工艺优化试验等科研活动及科研成果示范、展示、推广活动[17],也有一些实力较强的综合试验站,承担了科研实验、长期科学观测、监测以及技术集成示范等多项功能。农业科研试验基地不仅是一手科研数据的主要来源,而且集聚了类型各异的海量科研数据。

农业科研试验基地数据类型,根据学科领域[18-19]不同,分为农业气象、土壤、农艺、园艺、植物保护、农业工程、畜牧、水产等方面的科研试验数据;根据数据获取方式[20]不同,分为观测数据、实验数据、试验数据、监测数据、检测数据以及调查数据等;根据数据类型不同,可以分为数值型数据、文本型数据、遥感数据、图像及视频数据;根据数据实际保存主体不同,可以分为试验基地采集保存数据(也称为自有数据)、科研人员或团队依托试验基地采集并保存数据(也称为长尾数据)。由于长尾数据[21]通常由个人或小团队为特定目的收集,数据多源、多尺度、时序性短、高度分散,虽然单个数据集体积小但整体数量庞大,通过科学制定农业科研试验基地数据管理标准体系,疏通数据管理路径,将这部分数据纳入所依托科研试验基地的整体数据管理体系,对于促进其广泛利用共享,关联分析、最大化其数据价值意义重大。

农业科研试验基地数据特点:1)多源异构性。农业科研试验基地数据的多源性,一方面体现在领域上,涉及农业气象、土壤、作物栽培、种质资源、病虫害测报、有害生物防治等多方面的数据;另一方面体现在获取手段上,既包括传统的观测、调查数据,也包括各类科学仪器设备的监测、检测、模拟、分析数据等。数据的涉及面广而复杂,数据获取手段的多样性,也就造成了其异构性特点,数据类型、结构、存储格式等各异,对数据进行描述的元数据标准也差异较大。2)小集中、大分散。数据多散落在各农业科研团队或科研人员中,试验基地作为一个科研试验载体,在数据管理上没有发挥应有的数据汇聚作用。全国尺度来看,也是如此,没有形成一个有效的农业科研试验基地数据汇聚管理和共享平台,数据广泛散落在全国各地、各单位机构和个人手中。此外,从数据量的角度看,无论是单个农业科研试验基地还是立足全国,都是处于集中管理的数据少,分散管理的数据量大。3) 数据时序短、连续性差。除开展长期观测研究获取的数据外,农业科研试验基地的大部分数据采集具有严重的项目跟随特点,项目结束,数据采集也告结束。4)标准化程度低,共享不充分。基于农业科研试验基地数据多源异构的特性以及当前数据小集中、大分散的现状,导致农业科学数据不完整、质量参差不齐等问题非常显著。除少数参与到国家某一长期观测网络中或项目有数据汇交要求的科研试验基地采集数据有部分共享外,鲜有科研试验基地建有数据库和数据管理标准规范,支撑数据统一治理与共享。

2.2 农业科研试验基地数据管理工作流

通过对中国农业科学院新乡综合试验基地、中国农业大学曲周试验站等农业科研单位、高校试验基地数据管理状况调研,本研究梳理了当前农业科研试验基地常规化数据管理的工作流模式(图1a和图1b),并基于数据的全生命周期管理[22-23],提出统一标准体系框架下农业科研试验基地规范化数据管理工作流模式(图 1c)。

目前,中国农业科研试验基地数据基本处于图1a和图1b两种割裂的管理模式下。图1a模式下,研究人员依托试验基地开展观测、试验、检测、调查或监测等科研活动采集获取数据,数据经过加工、分析后,一方面形成研究成果随论文出版或直接数据出版;另一方面形成各类数据集,被研究人员保存管理。对于已经出版的数据,用户可以直接通过网络获取;对于研究人员手中的各数据集数据,无论是外部用户还是内部用户均需向研究人员提出数据需求,并等待研究人员的反馈。由于此数据“申请-反馈”途径非公开化,且研究人员没有对外提供数据服务的义务,因此,与内部用户相比,外部用户往往很难通过此途径获取到数据,或只能获取到很少量的数据。图1b模式下,农业科研试验基地数据采集、加工、分析、存储、共享的全生命周期数据管理与图1a模式基本完全相同,仅缺少了研究成果形成阶段。这是由于绝大部分农业科研试验基地独自开展科研能力比较有限,主要还是承担一些农业及相关领域的科学观测、监测等任务,或协助研究人员开展科研试验、调研等,几乎没有文章出版或数据出版环节。

在割裂的数据管理模式下,无论是研究人员的数据管理还是科研试验基地的数据管理,一般都会制定简单的数据管理计划,数据也是掌握在采集者手中,由于缺乏专业、统一的农业科研试验基地数据管理标准体系,数据共享、可复用率很低,数据价值难以得到充分挖掘和实现。而基于统一的数据管理标准体系,图1c模式下可以有效解决数据“小集中、大分散”的问题,将研究人员和试验基地采集数据汇交起来,形成规范的专业数据集和对应的统一数据治理,帮助用户更好的发现数据、获得数据、利用数据。用户直接向分离出的专门的数据管理部门/组织提出数据需求,在统一的数据共享开放的原则下,获得数据。相较于直接向数据所有者申请数据,提升了用户发现数据的概率,而且由于有专门的数据汇交治理工具和人员,数据质量也可得到有效保障。

注:①内部用户:指与数据所有者之间有研究项目、任务等纽带联系的其他研究人员,即同一科研项目或任务下,数据所有者以外的其他参与研究人员或团队成员;②外部用户:指与数据所有者之间没有形成研究项目、任务等纽带联系的其他研究人员。

3 农业科研试验基地数据管理标准规范体系构建

3.1 构建原则

在国家《科学数据管理办法》的指导下,参照《中华人民共和国国家标准(GB/T 13016—2018):标准体系构建原则和要求》中有关规定以及相关研究[24-25],结合农业科研试验基地数据管理特点,确定标准体系构建原则。主要包括以下3个方面:

1)全面覆盖、层次清晰原则。标准体系应覆盖农业科研试验基地数据全生命周期管理过程,根据标准性质、适用数据管理阶段和标准之间的共性特点,体现一定的层次性。为便于理解、减少复杂性,标准体系的层次也不宜太多。

2)结构合理、有效衔接原则。科学数据管理不是简单的数据标准化,还涉及从数据采集、加工、存储、共享等工作业务流程和数据管理工作,标准体系构建既要满足基本建设需要,又要形成结构合理的系统内容,涵盖技术、工作、管理等多方面。此外,体系内部标准规范之间应相互衔接,避免内容重复或彼此脱节;与国内外数据监测、管理网络/平台数据管理系统之间,注重有效衔接,促进数据的开放共享。

3)循序渐进、重点突出原则。农业科研试验基地属于基础数据采集管理单位,数据管理工作经验不足、人员配备有限,标准体系构建应根据试验基地开展数据管理工作的阶段特点和实际情况,循序渐进、重点突出制定不可或缺的核心标准规范,以最小资源投入获得最大的标准化效果。

3.2 标准规范体系框架构建

本研究借鉴美国系统工程专家霍尔(Hall A D)[26]提出的系统工程方法论“霍尔三维结构”,即从时间维、逻辑维和知识维来解释系统工程的一般过程,从农业科研试验基地数据管理过程流和工作内容实际出发,通过建立“霍尔三维结构”下系统工程一般过程到农业科研试验基地数据管理过程映射关系(表2),构建了适用于农业科研试验基地数据管理的标准体系三维结构,如图2所示。从标准适用数据管理阶段维度看,农业科研试验基地数据管理标准体系构建应围绕的从数据采集到加工、汇交(存储)、共享不断推进的全生命周期管理流程,每个数据管理阶段都应有相应的标准规范作为依据和指导;从标准性质维度看,农业科研试验基地数据管理标准体系应包括技术标准、工作标准和管理标准,不同性质标准互为补充,保障数据管理工作规范有序开展;从标准专业领域维度看,指导类标准是基础,数据类标准是核心,管理类标准是保障。

表2 “霍尔三维结构”到农业科研试验基地数据管理三维结构映射关系

图2 农业科研试验基地数据管理标准体系三维结构图

3.3 标准规范体系表编制

基于图2,本研究采用主客观相结合的方法对农业科研试验基地数据管理标准规范进行筛选以及必要性的判断,具体步骤如下:

步骤1:体系表内容初选。在农业科研试验基地数据管理标准体系三维架构下,以国内外观监测网络数据管理标准规范和“国家科技基础条件平台中心”“国家生态系统观测研究共享服务平台”“国家地球系统科学数据共享平台”“国家农业科学数据共享平台”等制定的有关数据管理系列标准规范为参考,结合农业科研试验基地数据管理标准体系建设基本情况和需求调研,进行标准规范体系表内容初步筛选。

步骤2:专家评议。根据评价目的,将标准规范的重要程度划分为4个等级:不重要(建议剔除)、一般(非必建)、重要(必建)、非常重要(必建),分别用1、2、3、4来代表不同等级。评议专家由科学数据管理、科研试验基地管理两个领域的专家组成,专家可以在初步筛选结果基础上新增标准规范,并进行评级。

本研究共进行了2轮专家评议,第1轮是针对步骤1初步筛选出的24项标准规范进行专家评议,第2轮是对第一轮新增标准规范和评议测算结果进行研讨,确定出数据全生命周期管理需要建设的20项标准规范、标准规范内容描述以及首期必建标准规范12项,以指导农业科研试验基地的标准体系建设工作落实(表3)。各农业科研试验基地可以根据自身建设阶段、数据管理要求和涉及阶段在12项必建标准规范基础上,不断进行充实和完善。

表3 农业科研试验基地数据管理标准体系表

4 结论与讨论

农业科研试验基地数据管理标准体系是一项系统工程,对于推动基层试验基地数据规范化管理有重要支撑作用。本研究通过对国内外涉农长期观测网络、试验站数据管理标准体系内容梳理,以及对中国农业科研试验基地数据特点、数据全生命周期管理流程调研,构建了农业科研试验基地数据管理统一工作流;基于“霍尔三维结构”从标准适用阶段、标准性质、标准专业领域3个维度构建农业科研试验基地数据管理标准体系框架,并编制了农业科研试验基地数据管理标准体系基本构成表,以期为推进农业科研试验基地建设和数据管理共享提供支撑。

1)通过分析总结,农业科研试验基地数据在涉及学科领域、数据获取方式、数据类型以及管理保存主体等方面均展示出了类型的多样性,并具有:①多源异构性;②小集中、大分散;③数据时序短、连续性差;④标准化程度低、共享不充分的数据特点。制定科学合理的数据管理标准体系,疏通数据管理路径,对于农业科研试验基地规范化数据管理以及将长尾数据纳入统一管理,有重要推动和促进作用。

2)在当前农业科研试验基地自有数据与长尾数据割裂管理模式下,构建了集二者于一体的统一数据管理工作流,有效解决了数据“小集中、大分散”的问题,同时数据典藏共享作为一项专门的服务,从前端采集分析工作中分离出来,直接面向用户,将大大提升用户发现数据的概率,保障数据质量,并有效减轻数据所有者管理数据的工作量。

3)通过建立“霍尔三维结构”下系统工程一般过程到农业科研试验基地数据管理过程映射关系,构建了适用于农业科研试验基地数据管理的标准体系三维结构,并通过多轮专家评议形成了农业科研试验基地数据管理标准体系表。该表以标准体系建立的三项核心原则为主旨,围绕数据全生命周期管理,提出农业科研试验基地标准体系建设基本标准规范20项,核心必建标准规范12项,用于指导不同农业科研试验基地的个性化标准体系建设,实现以最小资源投入获得最大的标准化效果。

本研究为农业科研试验基地数据管理标准规范编制明确了方向,为农业科研试验基地数据科学、持续、高效管理奠定了基础,目前虽然尚未开展实例应用,无法评估该套标准体系的适用效果,但下一步将以农业科学院“试验基地项目”为依托,开展部分试验地基的标准体系落地应用和成效评价。

此外,标准体系建设是农业科研试验基地数据规范化管理的基础,也是规范化数据管理工作的重要一环,其能否在农业科研试验基地数据管理工作中发挥良好的效用,还面临一个巨大挑战,即如何打通试验基地生产数据的各汇集通道,将数据(尤其是长尾数据)集中管理起来,还需要建立一套完整的协作机制。

[1]邓仲华,李志芳. 科学研究范式的演化:大数据时代的科学研究第四范式[J]. 情报资料工作,2013,34(4):19-23. Deng Zhonghua, Li Zhifang. The evolution of scientific research paradigm: The fourth paradigm of scientific research in the era of big data[J]. Information and Documentation Services, 2013, 34(4): 19-23. (in Chinese with English abstract)

[2]孙鸿烈,刘闯. 国际科学技术数据前沿领域发展研究[J]. 地球科学进展,2003,18(3):329-333. Sun Honglie, Liu Chuang. Frontier research of international science and technology data[J]. Advances in Earth Science, 2003, 18(3): 329-333. (in Chinese with English abstract)

[3]王启现,潘燕荣,邱国梁,等.农业科研试验基地在乡村振兴中的地位与作用[J]. 浙江农业科学,2019,60(2):180-183. Wang Qixian, Pan Yanrong, Qiu Guoliang, et al. The position and function of agricultural scientific research and experiment station in rural vitalization[J]. Journal of Zhejiang Agricultural Sciences, 2019, 60(2): 180-183.(in Chinese with English abstract)

[4]王启现,位运粮,吴晓磊,等. 典型发达国家农业科研试验基地管理的几点做法及对我国的启示[J]. 农业科技管理,2018,37(1):52-55. Wang Qixian, Wei Yunliang, Wu Xiaolei, et al. Experience of management of agricultural scientific research experimental base in typical developed countries and its enlightenment to China[J]. Management of Agricultural Science and Technology, 2018, 37(1): 52-55. (in Chinese with English abstract)

[5]王涛,徐秀娟,佘磊,等. 农业科研试验基地服务乡村振兴战略SWOT分析与路径探究——以安徽省农业科学院为例[J]. 安徽农业科学,2018,46(36):212-213,224. Wang Tao, Xu Xiujuan, She Lei, et al. SWOT analysis and path exploration of agricultural research experimental base serving rural revitalization strategy—A case study of Anhui academy of agricultural sciences[J]. Journal of Anhui Agricultural Sciences, 2018, 46(36): 212-213, 224. (in Chinese with English abstract)

[6]战徊旭,张忠锋,许立峰,等. 农业科研试验基地在乡村振兴中的引领作用:以中国农业科学院烟草研究所试验基地为例[J]. 中国农业资源与区划,2019,40(2):8-12,39. Zhan Huaixu, Zhang Zhongfeng, Xu Lifeng, et al. The leading role of agricultural scientific research base in rural vitalization: Taking tobacco research institute of case as an example[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(2): 8-12, 39. (in Chinese with English abstract)

[7]鲍先巡,徐秀娟,佘磊,等. 农业科研试验基地管理模式探讨:以安徽省农业科学院为例[J]. 农学学报,2017,7(12):137-140. Bao Xianxun, Xu Xiujuan, She Lei, et al. Discussions on management model of agricultural scientific research base a case study of Anhui academy of agricultural sciences[J]. Journal of Agriculture, 2017, 7(12): 137-140. (in Chinese with English abstract)

[8]张志刚,马宾生,李瑞云. 我国农业科研基地运行现状及发展对策[J]. 农业科研经济管理,2017(3):32-35. Zhang Zhigang, Ma Binsheng, Li Ruiyun. The current situation and development strategy of agricultural scientific research experimental base in China[J]. Management for Economy in Agricultural Scientific Research, 2017(3): 32-35. (in Chinese with English abstract)

[9]Rothamsted Experimental Station (RES)[EB/OL]. http://www. era.rothamroth.ac.uk/contact/

[10]International Long-term Ecological Research Network (ILER)[EB/OL]. https://www.ilter.network/

[11]UK Environmental Change Network (UK ECN)[EB/OL]. http://www.ecn.ac.uk/

[12]Long Term Ecological Research Network (LTER)[EB/OL]. https://lternet.edu/

[13]National Ecological Observatory Network (NEON)[EB/OL]. https://www.neonscience.org/

[14]Chinese Ecosystem Research Network (CERN)[EB/OL]. http://www.cern.ac.cn/0index/index.asp/

[15]National Soil Fertility and Fertilizer Effects Long-term Monitoring Network[EB/OL]. http://fla.cern. ac. cn/

[16]National Agricultural Data Center (NADC) [EB/OL]. http://www.agridata. cn/rules/regulars. aspx/

[17]王启现,任德芹,邱国梁. 农业科研试验基地的基本功能与主要分类[J]. 安徽农业科学,2018,46(5):215-217,222. Wang Qixian, Ren Deqin, Qiu Guoliang. Study on function and classification of agricultural scientific research experimental base[J]. Journal of Anhui Agricultural Sciences, 2018, 46(5): 215-217, 222. (in Chinese with English abstract)

[18]李俊清,宋长青,周虎. 大数据背景下农业数据资源分类及应用前景浅析[J]. 农业图书情报学刊,2018,30(4):23-27. Li Junqing, Song Changqing, Zhou Hu. Analysis of agricultural data resource classification and application prospect under the background of big data[J]. Journal of Library and Information Sciences in Agriculture, 2018, 30(4): 23-27. (in Chinese with English abstract)

[19]中华人民共和国国家治理监督检验检疫总局,中国国家标准化管理委员会. GB/T 13745—2009学科分类与代码[S]. 北京:中国标准出版社,2009.

[20]邢文明. 我国科研数据管理与共享政策保障研究[D]. 武汉:武汉大学,2014. Xing Wenming. Research on Policy Guarantee of Scientific Data Management and Sharing in China[J]. Wuhan: Wuhan University, 2014. (in Chinese with English abstract)

[21]彭秀媛. 农业科学数据共享模式与技术系统研究——以辽宁省为例[D]. 北京:中国农业科学院,2018. Peng Xiuyuan. Research on Agriculture Science Data Sharing Mode and Technology System--Taking Liaoning Province as an Example[D]. Beijing: Chinese Academy of Agricultural Sciences, 2018. (in Chinese with English abstract)

[22]Austin C C, Bloom T, Dallmeier-Tiessen S, et al. Key components of data publishing: using current best practices to develop a reference model for data publishing[J]. International Journal on Digital Libraries, 2017, 18: 77-92.

[23]Leslie H, Raleigh L M, Brandon M, et al. Data management, sharing, and reuse in experimental geomorphology: Challenges, strategies, and scientific opportunities[J]. Geomorphology, 2015, 244: 180-189.

[24]中华人民共和国国家治理监督检验检疫总局,中国国家标准化管理委员会. GB/T 13016—2018标准体系构建原则和要求[S]. 北京:中国标准出版社,2018.

[25]石彦琴,赵跃龙,李笑光,等. 中国农业工程建设标准体系构架研究[J]. 农业工程学报,2012,28(5):1-5. Shi Yanqin, Zhao Yuelong, Li Xiaoguang, et al. Infrastructure of standard system for agricultural engineering construction in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 1-5. (in Chinese with English abstract)

[26]刘光盛,王红梅,胡月明,等. 中国土地利用工程标准体系框架构建[J]. 农业工程学报,2015,31(13):257-264. Liu Guangsheng, Wang Hongmei, Hu Yueming, et al. Infrastructure of standard system for land use engineering in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(13): 257-264. (in Chinese with English abstract)

Establishment of data management standard system for agricultural scientific research and experiment station

Chen Li1,2, Wang Qixian3, Liu Juan1,2※, Cui Yunpeng1,2, Wang Mo1,2

(1.,,100081,; 2-,,100081,; 3.,,100081,)

Agricultural science data is an important strategic resource. As first-hand scientific research data producers, agricultural scientific research and experiment station gathers massive scientific research data of different types which are in a loosely managed state. So, the establishment of its data management standard system is not only a basis for standardized data management but also an important part of standardized data management work. And it is of great significance for improving data reusability and fully developing data value. In this research, by investigating the data characteristics and the whole life cycle management process of the agricultural scientific research and experiment station in China, we found that the data had four characteristics: 1) multi-source and isomerism; 2) Small data centralized management, big data decentralized management; 3) short time duration and poor continuity of data; 4) low data standardization and insufficient data sharing. And based on the problem of “small data centralized management, big data decentralized management”, we explored the workflow for routine data management in agricultural scientific research and experiment station, then designed a unified workflow. Under the fragmented data management workflow, it was usually a lack of professional and unified standard system in agricultural scientific research and experiment station, so the data sharing and reusability rate were very low, and the data value was hard to realize. But, based on a unified data management standard system, there were the specialized person responsible for data management and sharing and provided services for users, which effectively guaranteed the data quality, greatly improved the probability of the users to discover the data, and reduced the workload of the data owners to manage the data. Additionally, based on the “Hall three-dimensional structure”, we constructed the standard system framework for data management of agricultural scientific research and experiment station from three dimensions: standard application data management stage, standard features, and standard professional field. From the dimension of standard application data management stage, the data management standard system should focus on the life-cycle management process such as data collection, data processing, data archiving, data storage and sharing, and each data management stage should have corresponding standards as the basis and guidance. From the dimension of the standard features, the data management standard system should include technical standards, work standards, and management standards. And different types of standards complemented each other to ensure the orderly implementation of data management. From the dimension of the standard professional field, guidance standard was the foundation, data standard was the core and management standard was the guarantee. Based on the previous research and two rounds of expert review and discussion, the data management standard system table of agricultural scientific research and experiment station was compiled. It contained 20 standards covering the whole life cycle of data management of data. Among them, 12 standards were mandatory construction standards for the first construction phase. This table could be used to guide the construction of a personalized standard system for different agricultural scientific research and experiment stations, to achieve the maximum standardization effect with minimum resource input. This standard system was the basis of standardized data management of agricultural scientific research and experiment station and was of great significance to promote the construction of agricultural scientific research and experiment station. However, there is still a big challenge: how to get through the data collection channels to centralize the data (especially the long tail data) from different data producers? A complete collaboration mechanism is also needed.

scientific data; standard system; agricultural scientific research and experiment station; data management

陈 丽,王启现,刘 娟,崔运鹏,王 末. 农业科研试验基地数据管理标准体系构建[J]. 农业工程学报,2020,36(4):193-201. doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org

Chen Li, Wang Qixian, Liu Juan, Cui Yunpeng, Wang Mo. Establishment of data management standard system for agricultural scientific research and experiment station[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(4): 193-201. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org

2019-11-21

2020-02-05

中国农业科学院基本科研业务费专项(Y2019PT27)

陈 丽,助理研究员,博士,主要从事科学数据管理、土地规划和利用研究。Email:chenli02@caas.cn

刘 娟,副研究员,博士,主要从事农科学数据管理及农业领域应用研究。Email:liujuan@caas.cn

10.11975/j.issn.1002-6819.2020.04.023

F306.3

A

1002-6819(2020)-04-0193-09

猜你喜欢

标准规范农业科研数据管理
农业科研档案管理现状及改进措施分析
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
加强农业科研档案数字化管理的策略
国内外技术成熟度评价相关标准规范对比分析研究
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
农业科研单位档案管理现状及改进方法初探
互联网健康服务新应用