APP下载

Open Street Map数据在全球测图项目中的应用及程序化转换实现研究

2022-05-05孙睿英李德元

经纬天地 2022年1期
关键词:数据源矢量要素

曹 鹏 孙睿英 李德元

(自然资源部第三地形测量队,黑龙江 哈尔滨 150081)

0.引言

全球地理信息资源建设与维护更新(以下简称”全球测图”)是新时期国家在全球范围内开展的一次时空认知新征程,它主要描述全球的地形地貌、地理环境和相关自然、人文信息,其主要成果数据涵盖数字正射影像(DOM)、数字地表模型(DSM)、数字高程模型(DEM)及核心矢量要素(DLG)等;项目主要解决当前国家全球多尺度地理数据匮乏和高精度自主服务能力不足的问题,并为其他全方面的研究和规划提供基础的地理信息资源,为全面掌握全球地理信息状况,推进“一带一路”建设贡献力量。

全球测图项目的开展离不开基础数据的支持。当前国内外形势及版图数据的保密性,为众源地理数据的使用提供了应用基础。而Open Street Map数据作为典型的众源地理数据代表,内容涵盖了交通、水系、建筑物等,且该数据主要由GPS轨迹数据和基于遥感卫星数据的用户绘制而成,具有较强的可信度。

1.基本概念

Open Street Map(简称OSM,意为公开地图)作为一个开放众源地理信息数据平台,由网络大众共同打造,显著特点为免费、开源及可编辑的地图服务。OSM的测绘地图由用户充分利用GPS设备、航空摄影图像、卫星遥感影像、人工架站全站仪甚至地方政府基础性测绘成果进行绘制而成的,一些合作的商业公司也向OSM授权提供基础数据。其数据覆盖全球多个国家,不同区域数据的详细程度不同,数据标准不统一,数据质量好坏程度不一致,故对其数据结构进行深入探索,会很大程度上帮助我们获取更可信的地理信息大数据,为全球测图项目数据的可靠性、真实性和准确性提供更好的支持。

核心矢量要素在以点、线、面形式表达地理信息要素的矢量数据中,根据需求、重要性和可操作性选取主要要素形成数据集。在全球测图项目中,核心矢量要素主要包含铁路(RAILN)、公路(ROALN)、交通顶层线(ROLEL)和水系线面(HYDLN/HYDPL)等五个要素层的数据集成果,它是通过将OSM数据进行数据转换、结构规整、编辑整理、几何配准、地图配图等工序处理制作而成。其数据格式主要采用ESRI Geodatabase(*.gdb),主要图层命名(如表1所示):

表1 数据图层命名表

2.OSM数据特点

OSM数据与传统专业数据相比,具有更新频繁、动态性强等特点,基本上每周发布一个版本。

OSM数据主要类型为Node、Way和Relation,分别代表各个数据节点、路线和相互之间的数据关系。通过点、线和数据关系,我们可以直接准确描述新的GIS数据和其中各个节点、线和面要素。OSM数据的数据格式主要有两种:一种是用文本形式存储的xml文件(*.osm),它查看起来比较方便,可直接用word等文本编辑器编辑查看;另一种是用二级制格式存储的用户自定义的pbf格式文件(*.pbf),它的显著特点为数据占用空间较少,数据量较小。两种格式数据都可直接从osm官方网站上下载,在全球测图项目中主要采用XML文件(*.osm)作为数据模型解析的主要数据源。

3.生产技术处理流程

3.1 主要技术路线及流程图

通过下载近一个月内的OSM为数据源,对其进行整合处理,将其数据中的交通数据和水系数据通过数据转换、几何配准、编辑整理、地图配图等工序处理,制作该项目的核心矢量要素成果。在编辑整理过程中参考DOM和其他网络地图来补充、更新重要铁路、公路、水库及重大河流湖泊。道路、水系名称需进行翻译(由中图社负责),成果应包括中文、英文,如果数据源中含当地文字,应予以保留。具体流程(如图1所示):

图1 生产流程图

3.2 核心处理环节要求

3.2.1 数据转换

(1)传统方式为通过格式转换工具(如,FME等)将OSM数据格式转换为通用格式,如,ARCGIS File Geodatabase(*.gdb)、ARCGIS Shapefile(*.shp),再将属性对应转换过去。该方式较为烦琐,且容易丢失属性。

(2)转换完毕后,需对转换数据进行一致性检查,检查转换前后数据的数据量是否缺失、数据范围是否一致、数据逻辑性是否合理等。

3.2.2 结构规整

结构规整是指把矢量数据转换为《核心矢量要素数据生产技术规程》要求的数据结构,包括数据分析模型、对比方案设计和结构转换参数。本项目基于《核心矢量要素数据生产技术规程》创建铁路、公路、交通顶层线和水系数据模板。将转换的几何要素数据railway_line导入RAILN,highway_line导入ROALN,waterways_lines导入HYDLN,landuse_polygon、natural_polygon和relation_multiplygon_polygon导入HYDPL要素类中,导入数据示意图(如图2所示),进而形成核心要素的基础数据库。导入时注意目标字段SRCID对应匹配源字段的id[字符串],其他目标字段不对应匹配源字段的任何属性。

图2 导入数据示意图

结构规整是全球测图项目应用的转换核心所在,项目所在国家、地区不同,数据源数据结构、数据质量及详尽程度的不同,形成的转换方案亦不同,因此需要结合当地实情、实际问题综合考虑分析,从而制作出符合项目要求的对照方案设计表。

3.2.3 属性及空间处理

依据《核心矢量要素数据生产技术规程》要求,由于国家、地区以及数据结构的不同,所以规整后的数据仍会出现属性不合理及空间关系不合理的内容项。

对于数据属性处理,我们可以通过较大程度地维持原始数据的属性信息,并结合项目其他资料甚至谷歌卫星影像逐项检查、核改完善相应属性项,确保最终转换数据属性的有效、信息的完全和覆盖度的全面性。如,澳大利亚的国家语言为英语,由于数据属性字段有英语名称,因此给本地语言属性赋值时,不再将英语名称赋值给LOCALNAME1,仅将loc_name赋值给LOCALNAME1,LOCALNAME2不进行赋值。

对于空间处理,主要是拓扑处理和空间关系处理。拓扑处理主要是处理数据中存在的不合理拓扑问题,主要包括重复线处理、相交线处理、悬挂点处理以及伪结点处理。重复线处理主要处理的是数据中的重复要素、数据的自相交、数据的立体不合理相交,按照相应的技术要求删除、协调即可。相交线处理主要处理的是数据的拓扑关系问题,如,道路应打断而未打断问题。悬挂点处理主要处理的是一些重要要素的悬挂问题,如,重要交通和主要水系的悬挂问题,其他不相关悬挂问题不处理。一般要求悬挂距离不得超过实地0.1米。伪结点处理需要处理数据中的所有伪结情况。空间关系处理主要是参照DOM及其他资料改正数据中的不合理交叉和孤立要素。孤立铁路、道路与周边不联通的,其ISNETWORK属性赋值为“0”。

4.OSM数据转换程序化设计及实现

4.1 OSM数据转换程序化设计

数据转换程序化设计关键是建立两种数据间对应层和对应层字段属性的转换规则模型。对应层间数据转换,即将OSM数据层中的Way和Relation几何图形和属性数据转到全球测图项目中核心矢量要素数据成果中对应的RAILN、ROALN、ROLEL、HYDLN和HYDPL层中要素。以铁路层数据为例,其具体对应内容规则(如表2所示):

表2 核心矢量要素要素层和OSM数据对应要素层规则表

建立了对应层间数据转换后,进行对应层字段属性间转换,经综合研究分析核心矢量要素和OSM数据的各自特点,设计了基于OSM数据唯一ID和核心矢量要素数据的SRCID的一一对应字段转换规则模型。以铁路层数据为例,其具体对应字段属性规则(如表3所示)。对应转换规则模型建立后,可看到核心矢量要素属性字段中一些属性项在OSM数据中仍是无对应字段的,而这些无对应的字段属性正是该项目需要结合其他相关资料和DOM数据赋值填写的。

表3 OSM数据和核心矢量要素数据铁路属性对应赋值规则表

4.2 程序化实现

鉴于OSM数据结构复杂且属性项较多,程序采用C#语言,首先直接基于OSM数据唯一ID及核心矢量要素数据唯一SRCID完成多面体-环-线-点的多级ID-SRCID的关联映射,其次依据项目技术规定建立的对应层和对应字段转换关系数据表解析读取OSM数据,并通过调试FileGdbAPI开源库实现对gdb数据的直接读写,从而实现OSM属性数据和几何要素向gdb数据要素的直接、快速赋值转换。软件界面及操作上简单清晰,直接选用下载好的原始OSM文件格式数据,后选择转入到设计符合技术规定的标准格式空数据库,转换GISOTAL FOR OSM应用界面(如图3所示)。处理完成后应对属性项进行异常值检查,确保每条矢量数据均匹配到对应属性信息。

图3 GISOTAL FOR OSM应用界面图

4.3 软件应用效果及优势

软件通过解决核心矢量要素数据预处理阶段最为烦琐和不确定的OSM预处理,解决了以往几何图形转换和属性数据转换两步操作带来的检查及不对应问题,实现了最大程度的简化;同时自动化操作避免了多次提取、关联导致的中间软件字符串处理异常、数据丢失以及图形异化等问题。

软件已应用于全球地理信息资源建设与维护更新项目澳大利亚、纳米比亚等测区并取得了较好的效果。技术要求的逐步完善,将给OSM数据的处理提供更为完善的支持和解决方案。

5.结束语

OSM数据作为全球覆盖的众源数据源,有别于传统测绘的新型地理数据源。本文通过对其数据特点的研究,结合全球测图具体项目设计要求,建立OSM数据数据格式与现有常用数据格式一一对应关系并实现程序自动化,为后期对该数据的研究及转换应用提供了思路,特别是在全球化的大背景下,大数据、云计算和人工智能高新技术不断更新,国内外生产项目必将更多涌现,对其深入研究显得更为有意义。

猜你喜欢

数据源矢量要素
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
掌握这6点要素,让肥水更高效
一种多源数据融合过程中的实体关联性计算方法
利用属性集相关性与源误差的多真值发现方法研究
Web 大数据系统数据源选择*
基于矢量最优估计的稳健测向方法
三角形法则在动态平衡问题中的应用
也谈做人的要素
2015年8月债券发行要素一览表