APP下载

有色地质资料信息化建设实践——以地质云·北京有色节点为例

2021-09-16安天浩张会琼孙紫坚熊靓辉薛陈利

矿产勘查 2021年4期
关键词:字段有色扫描仪

安天浩,张会琼,孙紫坚,熊靓辉,薛陈利

(北京矿产地质研究院有限责任公司,北京 100012)

0 引言

近年来,伴随着信息科技的快速发展,信息技术对各行业产生了深远影响。“十三五”纲要提出实施国家大数据战略(赵林林等,2019),有色金属地质工作也逐步进入数据密集型时代。在有色地质工作中,项目人员采集到的大量电子化数据需要安全存储,数据的共享、分析、挖掘需要便捷高效的资料借阅体系支撑。因此,以纸介质为主,光盘为辅的存储模式,以纸质目录、简单的电子表格作为借阅索引的传统资料借阅管理模式,已经成为了横亘在有色地质工作者之间的“数据壁垒”(李丰丹等,2019)。北京矿产地质研究院有限责任公司以建设“地质云·北京有色”节点为契机,对馆藏的有色地质资料开展了数字化工作,优选其中典型、特色、代表性的资料通过“地质云·北京有色节点”向社会发布共享;在单位内部设计部署了有色地质资料借阅系统,显著提高了有色地质资料利用率。

1 有色地质资料数字化

1.1 资料的梳理

在开展数字化工作前需对现有的资料进行全盘梳理,收集并研究有色地质资料数字化、标准化的相关标准。对资料进行分类、查重,梳理资料的工作手段、工作区位置与形成时间等要素。挑选其中具有较高价值的有色地质资料作为数字化加工对象,并根据资料的内容、涉密级别划定其共享方式。

1.2 加工环境部署

加工环境的部署包含加工设备的选择、加工所需场地及网络环境与安防系统的部署、数字化加工流程的制定。明确的数字化加工流程是保障数字化生产效率、质量的重要基础,其内容是对场地内的不同工作区域进行划分,对各环节的加工标准进行明确。各环节分区作业可避免实体资料交叉,同时可提升加工的总效率。

数字化加工设备主要有高速扫描仪、平板式扫描仪、大幅面扫描仪、切纸机、胶装机、工作站等。高速扫描仪用于加工便于拆除装订的资料,平板扫描仪处理不宜拆除装订的资料。扫描设备最高分辨率不低于300 dpi。加工场所内建立局域网,使用千兆交换机和六类或更高级别网线,接入全部扫描设备及工作站与磁盘阵列。通过局域网保障数字化文件在加工流转中的传输效率,利用磁盘阵列备份加工的过程性文件。

1.3 数字化加工

完成加工环境部署,建立加工流程后,即可开展数字化加工。数字化加工分为领取资料、数字化前处理、资料扫描、图像处理、质量检查、资料复原、设备维护等7个环节,各环节内包含的工作如图1所示。

图1 有色地质资料数字化流程

档案实体资料领取需根据资料形成时间与资料实体的特点,分批次进行。同时对照纸质档案实体,对每个批次领取的每一档资料登记成表。

数字化前处理需要对褶皱、破损的资料进行修复、除尘并根据情况拆除装订。

资料扫描过程中,可拆除装订的纸质资料使用切纸机进行剪切,而后利用高速扫描仪进行加工,不可拆除装订的纸质资料使用平板式扫描仪进行加工。图件类的纸质资料使用大幅面扫描仪加工,对超出所使用扫描仪扫描尺寸的图件可采用更大幅面扫描仪进行扫描,如硬件条件有限,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式进行处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标板等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。对于极其珍贵且尺寸不规则的档案,为方便直观显示原件大小,可采用标板、标尺等方式标识原件大小等信息。为最大限度保留资料原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描,建议扫描分辨率不小于300 dpi,保存格式推荐为为TIFF、JPEG或JPEG2000等通用格式(黄少芳和刘晓鸿,2016)。

图像处理环节需要对生产出的图像文件进行图像拼接、旋转及纠偏、裁边、去污等精细处理,力求保持档案原貌,不建议用软件纠偏或自动裁剪功能处理档案原有页面。

完成处理后需进行质量检查,图像质检必须逐页翻看检查图像,检查图像反映的文件数量、页数是否与其目录一致,图像是否还原档案原貌、文字清晰,每页图像的页码是否存在,有无漏失、多页、不清晰、变形、偏斜、失真、页码错误等情况。根据检查结果进行修改完善,对成品进行备份,并同步开展文件级目录的制作。

1.4 制作文件级目录

地质资料的目录是开展有色地质资料管理工作的基础,是对地质资料数据描述、组织和管理的着力点(高学正等,2019),传统的以案卷级目录对地质资料进行管理的方式,已经不能适应目前的信息化、碎片化管理需求(江云华,2019)。因此在加工的过程中,需按标准为每档资料制作文件级目录。在文件级目录中,文件题名是建立电子档案检索系统、实现档案信息计算机检索目标的基本要素(田园等,2019),因此需要形成文件级目录标准,对“题名”等字段的内容与表述结构进行规范,按统一标准制作文件级目录,并完成自检、互检、抽检,保证文件级目录的质量。

1.5 有色地质资料元数据著录

元数据是有色地质资料管理工作的核心,也是提供数字化服务的根本,因此在开展元数据著录工作前,需制定元数据标准。元数据著录的本质是资料碎片化的过程,重点是设计元数据的字段。字段数量不宜繁冗,但需涵盖研究对象要素、资料来源、时空位置等多角度要素,同时对各类有色地质资料具有普遍适用性。有色地质资料元数据设计为54个字段,见表1。

表1 有色地质资料元数据字段

内容相对单一的字段需规范元数据内容,如“行政区”、“矿种”等内容固定的字段,应设计字典值;对于“时间”、“坐标”等内容范围较大的字段,应规定填写格式;对于“内容提要”等无法确定内容范围的字段需要规定描述的模式,例如普查、详查、勘探类报告资料,可规定描述模式,如先描述矿床位置、大地构造,再描述主要工作量,最后描述结论与建议等。

在元数据著录过程中,应同步设置自检、互检、抽检等环节,确保元数据内容准确,另外需根据提取的进度,合理安排元数据的备份。

2 信息化系统建设

有色地质资料管理系统是高效利用元数据的工具,系统设计的优劣决定了资料检索结果的准确性与全面性。因此,开展系统的设计工作需要明确系统的核心功能需求(图2):

图2 系统架构设计

①储存管理非结构化数据及其元数据。包括数据的上传、删除、调用以及元数据的增、删、改、查等。

②实现数据的借阅申请、审批、下载与权限管理等功能。同时,系统的设计需遵循国家及行业相关标准,以实用、标准、安全和可扩展为原则的前提下进行,同时为与“地质云”资源管理系统对接预留接口(汪艳梅,2020)。

系统的基础设施即服务层包括网络设备、服务器等硬件设施以及虚拟化平台和虚拟化操作系统等软件环境,提供有色地质资料管理系统运行的硬件、网络基础。系统部署在Win2008 Server R2环境的服务器内,借阅者和管理者可在局域网内直接访问服务器的IIS服务,也可通过网关设备远程拨号进入局域网使用系统(谭永杰,2016)。

数据即服务层包含数据库管理系统SQL Server,实体数据分为结构化数据与非结构化数据。结构化数据含有两部分内容:在数字化加工环节提取出的全体数据的元数据(缪谨励等,2020)与有色地质资料中以数据库形式存储的数据(任晓霞等,2019)。非结构化数据包含数字化加工环节生产出的文档、图件等。

应用即服务层包含两个功能模块:有色地质数据管理模块、有色地质资料借阅模块。两个模块统一认证登陆。管理模块中包含数据管理、用户管理、权限管理、借阅审批等四方面的主要功能。数据管理功能包括对结构化与非结构化数据的增、删、改、查。用户管理功能包括对借阅用户的增加、删除与用户角色的设置(高学正等,2018)。权限管理为资料设置权限,实现特定的数据只向特定的用户组开放,如某些特定的结构化数据只对借阅用户组开放其元数据的查询功能,从而实现数据的精准管理与高效利用(高振记等,2018)。借阅审批功能包括对接收到的借阅申请进行审批、反馈意见等功能。

有色地质资料借阅模块是地质工作者借阅资料的主模块,包含资料检索功能、折叠菜单分类功能。资料检索功能包含对资料的关键字检索、多条件检索、检索结果展示等。折叠菜单分类功能展示资料的不同类别,并设计折叠隐藏功能,单击某一级菜单后,即可展示分布于该级菜单下的检索结果。

3 信息化系统应用与服务

有色地质资料管理系统已完成搭建并通过测试,系统界面见图3。经过试运行阶段的探索、完善,北京有色节点制定了《有色地质数据权限管理办法》,对资料的敏感程度及其权限的管理办法进行明确;制定了《有色地质资料复制借阅管理办法》,划分不同敏感程度的有色地质资料的服务方式,补充线下共享的服务方式;制定了《有色地质数据管理系统运行维护管理办法》,对系统的数据上传、修改、删除以及用户管理、权限管理等运维工作进行了明确划分(梁虹等,2020)。

图3 有色地质资料管理系统界面

结合试运行阶段的使用情况分析,对系统的元数据批量导入功能进行优化,增强稳定性。弱化对于元数据导入过程中对必填字段的检查,提升导入效率(张丽华,2020)。

4 结论与建议

通过有色地质资料数字化与信息化建设工作,梳理查清了馆藏的有色地质资料情况,完成了资料的数字化工作,并按规范提取了资料的元数据。设计建设有色地质资料管理系统,完成元数据、数据入库,实现了在线查询、借阅、管理有色地质资料,使原有的纸介质资料,零散分布的电子资料得到充分运用(陈建平等,2017),并通过“地质云·北京有色”节点向社会发布共享。截止2020年末,提供有色地质产品服务3000余件次,服务对象包括高校、地勘单位、有色地勘单位等,取得了良好的社会效益。因此倡导各有色行业单位尽快开展有色地质资料数字化与信息化建设工作。

关于有色地质资料的数字化需严格遵守国家相关法律与《地质资料管理条例》、《涉密地质资料管理细则》等法规。对于数字化工作与信息化建设的建议如下:

(1)非涉密但内容敏感,即公开后会造成一定范围或一定程度社会影响的有色地质数据,以及涉及单位或个人利益等的有色地质数据,可采取“只提供部分元数据”的方式进行共享。

(2)元数据著录的字段及其字典值的设计建议由有色地质档案管理人员参与完成,数字化加工完成后形成的文件级目录、元数据、电子文档应进行异地备份、多介质备份。

(3)系统设计工作需地质专家与信息化专业人员共同参与,保障系统满足地质人员需求且结构稳定易于运维。

猜你喜欢

字段有色扫描仪
食物中的“有色”营养素
便携式膀胱扫描仪结合间歇性导尿术在脑卒中合并神经源性膀胱患者中的应用
带钩或不带钩选择方框批量自动换
浅谈台湾原版中文图书的编目经验
浓郁质感色来袭 这个秋冬有色可循
凉爽有色
用保鲜膜保护超声扫描仪提高猪场生物安全性
便携高速文件扫描仪
陕西有色上半年实现工业总产值590亿元
无正题名文献著录方法评述