APP下载

多源异构POI融合方法及应用

2018-04-08吴张峰夏兰芳

测绘通报 2018年3期
关键词:位置服务空间融合

吴张峰,夏兰芳

(上海市测绘院,上海 200063)

伴随着信息时代的到来,位置服务需求的深度和广度在不断增加,位置服务的产生离不开基础数据的支持。POI数据作为位置服务的重要载体,直接掌控着位置服务的质量。与此同时,以POI为代表的位置服务数据的获取和更新模式正在发生深刻变化。另一方面,随着位置服务的普及,POI数据的鲜活性成为提升位置服务质量的核心因素。如何进行高质量的数据采集和多源POI数据的融合成为提升位置服务能力的关键。本文在广泛试验的基础上,探索出一套基于FME Server的多源异构POI融合方法,为POI数据的动态维护更新提供了一种新的思路。

1 研究框架

本文的研究框架如图1所示。

本文研究的核心内容为:首先将来源可靠且经过质检的POI数据形成一个母库;然后将来源不同的POI数据进行数据清洗,进行基于FME Server空间位置信息和门址等属性信息的融合,形成内容详尽、结构规整的POI融合库;最后,对于形成的POI融合库再进行基于空间约束关系的门址挂接,建立POI数据与门址信息的对应关系,满足各类基于LBS和Location Point的业务应用。

2 研究内容

2.1 多源数据的预处理

对获取的大量的POI数据进行处理,处理的方法是利用FME软件流程化的模块设计对数据进行清洗,从而保证用于融合的数据的基本质量。处理流程如图2所示,主要包括以下内容。

(1) 针对数据中存在特殊分隔符的问题,分析数据产生的原因,对特殊字符进行删除处理。

(2) POI数据格式的统一,非汉字字符统一使用英文字符。

图1 研究框架

图2 数据清洗流程

(3) 设计标准POI库的属性结构,规范POI属性名称,如原始的POI数据结构中属性字段各不相同,需建立原始字段与标准字段的对应关系,统一到标准的POI属性字段名称。

(4) 删除奇异点,删除空间字段为NULL的POI数据,优化POI数据质量。

(5) 删除重复项,进行POI数据中同名地物的判断及删除。

(6) 坐标统一,坐标变换,使获取的POI数据具有相同的坐标系。

2.2 母库的建立

数据源采用实测并经过质检的数据,母库的属性结构定义如图3所示,建成的母库如图4所示。

字段名称含义描述数据类型空值性唯一性KEY_ID唯一标识NUMBER(38)NOTTYPE类型VARCHAR2(38)NULLNAME名称VARCHAR2(100)NOTA_NAME所属区县VARCHAR2(50)NULLCOUNTY所属街道VARCHAR2(50)NULLDOORPLATE_ID挂接门址IDVARCHAR2(100)NULLNAME_PHONETICIZE拼音VARCHAR2(200)NULLNAME_ENG英文名称VARCHAR2(50)NULLNAME_ABBR简称VARCHAR2(50)NULLNAME_ALIAS别名VARCHAR2(50)NULLNAME_REGIS工商登记名称VARCHAR2(50)NULLTEL电话号码VARCHAR2(50)NULLPOSTAL_CODE邮政编码VARCHAR2(50)NULLURL网址VARCHAR2(100)NULLEMAIL电子邮箱VARCHAR2(50)NULLDATA_SOURCE数据来源VARCHAR2(50)NULLDES描述信息VARCHAR2(50)NULLCOLLECTION_TIME采集时间DATENULLUPDATE_TIME更新时间DATENULLSTOP_TIME停用时间DATENULLDOOR_ACCU门址挂接准确度NUMBERNULLIMPORT_TIME入库时间DATENULLPOI_TYPEPOI类型VARCHAR2(50)NULLDOOR_TYPE门址挂接类型NUMBERNULLPATCH批次VARCHAR2(50)NULLORIGINAL_ADDRESS原始地址VARCHAR2(100)NULLLINKED_ADDRESS挂接地址VARCHAR2(100)NULLGEOMETRY空间字段MDSYS.SDO_GEOMETRYNOT

图3POI库的属性结构

图4 建成的母库

2.3 基于加权的多属性相似度的POI融合

在进行POI融合过程中,首先要进行同名地物的判别,即同名POI点的识别。本文采用文本名称相似度、距离相似度、门址相似度3个指标进行同名POI点的判别,在判别过程中,分别赋予0.6、0.2、0.2的权重。对于两个POI对象,如果总体相似度大于阈值(本文设定为0.9),则认为是同名POI点,否则认定为新的POI点,进行POI数据的增量融合更新。具体流程图5所示。

图5 多属性相似度的POI融合流程

2.4 基于空间约束关系的门址挂接

POI作为点状地物,与其他地物存在空间约束关系。在进行门址挂接的时候,要充分考虑其与参考地物(包括街道数据、小区数据和建筑面数据)的逻辑关系。如图6所示,首先进行POI数据、门址点POI与参考地物之间的空间关系计算,判断出与参考地物逻辑关系一致的POI点和门址点,再按照相对最近原则进行挂接。

门址挂接的结果如图7所示。如果发现POI数据所挂接的门址数据与原始地址有较大出入,可以进行异常抛出,进一步进行数据质量的检查。

图6 基于空间约束关系的门址挂接

图7 门址挂接结果

2.5 基于FME Server的动态流程化更新维护

(1) 首先制作FME数据处理模板,主要将POI处理流程中的各阶段数据处理分步制作成FME模板。具体包括以下模板:数据清洗模块、POI母库建立模块、POI融合模块、POI与门址挂接模块、POI维护更新模块。

(2) 将制作好的模板通过FME Workbech发布到FMEServer上,形成数据处理服务,如图8所示。

(3) 模板的更新维护。通过FME Workbench从FME Server中下载工作空间进行维护,进行需要的升级,并重新发布到FME Server。

3 结 语

本文提出了一种多源POI数据归并融合方法。该方法通过对POI信息的门址信息、位置信息和属性信息进行比对,确定不同POI数据之间是否需要融合,最终形成一个结构统一、信息丰富的新POI库,用于基于LBS和Location Point的业务应用。总体来说,该方法是一种比较实用而且简单的方法,为多源POI资源的有效利用提供了一种新的思路。

图8 发布服务

参考文献:

[1] 邵蕾.网络POI数据增量更新技术研究[D].兰州:兰州交通大学,2016.

[2] 高新院.基于空间位置信息的多源POI数据融合问题的研究[D].青岛:中国海洋大学,2013.

[3] 张巍,高新院,李瑞姗.空间位置信息的多源POI数据融合[J].中国海洋大学学报(自然科学版),2014,44(7):111-116.

[4] 陈瑞.基于多源POI数据的匹配融合方法研究[D].兰州:兰州交通大学,2014.

[5] 李瑞姗.基于自然语言处理的多源POI数据融合的研究[D].青岛:中国海洋大学,2013.

[6] 王婷婷.基于位置与属性的多源POI数据融合的研究[D].青岛:中国海洋大学,2014.

[7] 曾李阳,齐华,谭明建,等.基于天地图的POI数据采集系统设计与实现[J].测绘与空间地理信息,2016,39(3):55-58.

[8] 周春辉,朱欣焰,苏科华,等.基于LBS的兴趣点查询与更新机制研究[J].微计算机信息,2009,25(19):143-145.

[9] 林娜,王斌.空间数据库增量式更新机制的研究[J],测绘科学,2008,33(3):198-200.

[10]宋晓红,张立朝,禄丰年,等.地理国情普查中多源异构数据整合研究[J].测绘通报,2014(9):104-107.

[11]曹劲舟,武红宇.基于微博位置签到数据的POI更新方法[J].地理空间信息,2013,11(2):15-18.

[12]朱庆,陈松林,黄铎.关于空间数据质量标准的若干问题[J].武汉大学学报(信息科学版),2004,29(10):863-866.

[13]LONEY K.Oracle Database 10g完全参考手册[M].北京:清华大学出版社,2008.

[14]KOTHURI R,GODFRIND A,BEINAT E.Oracle Spatial空间信息管理[M].北京:清华大学出版社,2009.

[15]朱宏斌,陆海英,盛琦,等.城市基础地理信息数据库更新方案研究[J].测绘通报,2011(1):29-31.

猜你喜欢

位置服务空间融合
村企党建联建融合共赢
融合菜
空间是什么?
从创新出发,与高考数列相遇、融合
星站差分与PPP技术在深远海调查中的位置服务精度分析
创享空间
《融合》
互联互通 畅享未来 第12届卫星导航与位置服务运营商大会在深圳举行
第六届中国卫星导航与位置服务年会暨首届卫星应用国际博览会
中位协二十周年庆典暨第四届中国卫星导航与位置服务年会将在北京举行