APP下载

武汉市不动产登记存量数据检查技术研究

2022-10-02毕仁敏张欢王明袁亚雄艾楠竹

地理空间信息 2022年9期
关键词:压盖宗地界址

毕仁敏,张欢,王明,袁亚雄,艾楠竹

(1.武汉市测绘研究院,湖北 武汉 430022;2.中铁第四勘察设计院集团有限公司,湖北 武汉 430063)

为保障不动产登记工作顺利开展,建成空间参考一致、数据关联正确、历史信息完整的不动产登记数据库[1],武汉市中心城区青山区和武昌区自2018年起开展不动产登记存量数据清理整合工作。清理对象为2016年两区开展不动产统一登记之前,原国土和房产管理部门形成的各类不动产登记系统数据和历史档案,具体包括青山区和武昌区的国有建设用地使用权登记、房屋所有权登记以及土地和房屋抵押、查封登记的业务属性数据、空间图形数据和影像档案数据[2]。

清理整合后的不动产登记存量数据需满足入库要求方能入库,以确保数据库属性数据、图形数据、图像数据的准确关联和内容一致,保证数据具有完整性、唯一性和准确性,能满足不动产统一登记的需求[3]。清理整合后,属性数据存在属性字段填写不规范、值域范围不符合、必填字段值缺失、表内业务逻辑关联不一致、表间逻辑关联不一致等错误;空间图形数据存在自相交、重叠、未封闭等拓扑关系问题[4],因此需要开展数据全面检查工作。前期投入了大量的人力进行人工检查,但由于数据量大、检查项多,传统的人工检查耗时费力、事倍功半,还可能导致成果数据被错误编辑修改等问题,数据检查工作出现不断返工的情况。因此,探索一种准确高效开展数据检查的技术方法迫在眉睫。

SQL语言在数据库查询和修改中应用广泛,FME在空间图形和属性数据处理中功能强大,两种技术均适用于数据对象的属性检查和空间检查。本文探讨了这两种技术在数据检查实践工作中的具体应用,分析了其应用效果和特点,以期为数据检查工作提供借鉴。

1 数据内容

土地登记电子数据和房屋登记电子数据共计180万条,通过数据清洗分类、查档补档、统一编号、数据整合和数据建库等步骤,形成了属性信息较完整规范、准确、关联基本正确的数据成果。属性数据库成果表单共计22张,包括宗地基本信息表(ZDJBXX)、自然幢表(ZRZ)、界址线表(JZX)、界址点表(JZD)、户表(H)等空间属性信息表,独立宗建设用地使用权表(JSYDSYQ_DLZ)、共用宗建设用地使用权表(JSYDSYQ_GYZ)、房地产权表(FDCQ2)、抵押权表(DYAQ)、查封登记表(CFDJ)等主表,登记信息表(DJXX)、预告登记表(YGDJ)、权利人表(QLR)、义务人表(YWR)以及发证表(FZ)、归档表(GD)、收件表(SJ)、收费表(SF)、申请人表(SQR)、审核表(SH)、缮证表(SZ)、发证表(FZ)等8张业务审批表。其中,登记信息表记录了房产的登记业务信息,包括房地产、房产查封、房产抵押的登记信息。

属性数据成果存在的主要问题包括:①值域范围不符合,字段值不在数据字典表范围内;②必填字段值为空;③数据缺失或错误;④表内业务或表单间逻辑关联不一致;⑤部分数据需重新生成,如抵押表中抵押原因是“预告商品房合同抵押权设立”或“预购商品房合同抵押权设立”,需单独形成预告登记表,土地抵押数据需生成义务人信息,由于土地抵押原始数据无义务人信息,因此需根据抵押表中相关信息生成义务人表单;⑥部分数据需踢除,由于超出清理范围或重复入库、数据错误等原因,一些数据需从成果数据中剔除,需将与该数据关联的各表单数据信息都剔除干净。

不动产存量数据清理空间图形成果主要包括宗地和自然幢图形。空间数据主要存在宗地压盖、自然幢压盖、界址点重叠、界址线重叠、界址线与宗地边界重叠等问题。因此,空间数据检查主要针对宗地、自然幢、界址点、界址线的拓扑关系进行检查。

2 技术路线和关键技术

2.1 技术路线

数据检查的具体步骤为:①在SQL Server数据库中利用SQL语言对所有属性数据成果包括空间数据属性信息进行批量检查和修改;②根据数据成果按宗地汇交要求,将SQL Server数据库中的数据按宗地代码分多个批次导出,属性数据导出格式为Access,空间图形数据导出格式为Shape。每个批次的数据量大大减少,方便更全面细致的检查修改。数据检查技术路线如图1所示。

图1 数据检查技术路线图

2.2 关键技术

1)SQL语言。SQL语言是计算机数据库语言中专用的数据语言,主要用于规模较大的关系型数据库系统中,也可用于数据量较小的中小型数据库系统中。SQL语言包括数据定义语言、数据操作语言和数据控制语言[5]3种主要语句。本文数据检查的第一步就在SQL Server数据库中进行。SQL语言中的查询、插入、修改、删除等数据操作语言满足了数据检查和修改的需求,如在SELECT语句中可采用数据字典表检查值域范围的符合性,采用NULL检查字段值为空的情况,采用COUNT检查数据是否重复,采用计算公式检查面积相等,采用“<>”或“!=”检查一致性等。数据检查后利用UPDATE语句可实现数据修改。

2)FME是加拿大Safe Software公司开发的空间数据转换处理系统[6],拥有模块化和可视化编程的特性,同时支持上百种数据格式的读写,是一款构建数据与应用之间桥梁的软件,具有很强的数据转换处理功能。本文数据检查需要处理的数据量较大,且包含不同平台的空间数据和属性数据,利用FME可以很方便地读取空间数据,进行空间数据检查,并形成方便编辑的文本格式的检查结果。例如,利用AreaOnAreaOverlayer转换器可进行面压盖检查,利用ListConcatenator转换器可进行宗地号或自然幢号的关联,利用Aggregator转换器可统计压盖数量,可通过写模块的方式定义输出结果格式。属性数据成果包含多个表单,每个表单又有众多字段,数据检查项目繁多,类型多样,利用FME各类模块可以很方便地进行表单间、字段间的关联检查和处理。例如,利用Tester转换器可进行条件判断,利用FeatureMerger转换器可进行条件匹配,利用AttributeManager转换器可进行属性信息编辑,利用Counter转换器可进行数量统计。

3 数据检查内容与关键技术的应用

3.1 属性数据检查

属性数据检查主要包括值域范围符合性检查、必填字段为空检查和逻辑关联检查。

3.1.1 值域范围符合性检查

值域范围符合性检查,即要求字段值符合数据字典表中的值域要求,不可超出其范围。例如,查封登记表中查封类型字段值域需符合如表1所示的要求,查封类型以代码表示,应为1~4,若查封类型为“5”或“查封”,则值域范围不符合,需更正。

表1 查封类型字典表

根据数据字典表和常见的值域错误,本文列举了值域范围符合性检查的必查字段(表2),以全面排查字段值域问题。

表2 值域必查字段

在SELECT语句中利用数据字典表即可进行值域范围符合性检查。例如,查封登记表(CFDJ)的查封类型(CFLX)字段值域检查,其SQL语句为:

select*from CFDJ where CFLX not in(select DatakeyfromDataDictionarywhereType=1)orCFLX is null

3.1.2 必填字段为空检查

必填字段不允许为空,数据检查时需对必填字段为空的情况进行排查。由于各表单必填字段较多,本文不再详细列举。查封文件和查封文号、权利人证件号和权利人证件类型等成对出现的字段需同时有值,详细列表如表3所示。

表3 同时有值字段列表

在SELECT语句中利用NULL即可检查字段值为空的情况。例如,检查抵押权表(DYAQ)区县代码(QXDM)字段为空的情况,其SQL语句为:

3.1.3 逻辑关联检查

逻辑关联检查(表4)涉及两个以上的表单或字段,是指数据具有逻辑内容上的关联关系(如房地关联)或字段具有逻辑内容或数学上的关联关系(如字段值相等、其他数学关系)。在SQL Server数据库中,房地产权、查封登记、抵押权、登记信息表都有唯一标识码(WYBSM)字段,登记信息、户、共用宗建设用地使用权表均有户唯一标识码(HWYBSM)字段。数据批量检查修改时主要通过WYBSM字段和HWYBSM字段进行表单间关联。

表4 逻辑关联检查项

在SELECT语句中利用IN检查房地关联。例如,检查有房无地的情况,若FDCQ2表中的数据在JSYDSYQ_GYZ表中未通过关联字段匹配成功,则表示该数据有房产信息无土地信息,FDCQ2表和DJXX表可通过WYBSM关联,DJXX表和H表可通过HWYBSM关联,JSYDSYQ_GYZ表中有HWYBSM字段而没有WYBSM字段,因此进行有房无地检查,需借助DJXX表和H表,共涉及4个表单间的关联。

在SELECT语句中利用COUNT进行数据重复检查,通过COUNT计算出现次数即可实现重复检查。

在SELECT语句中利用“<>”或“!=”检查一致性。例如,房地产权表(FDCQ2)中不动产权证号(BDCQZH)和DJXX表中证书号码(ZSHM)的一致性检查,其SQL语句为:

select A.WYBSM,B.HWYBSM,A.BDCQZH,B.ZSHM from FDCQ2 A left join DJXX B on A.WYBSM=B.WYBSM where B.WYBSM is not null and A.BDCQZH<>B.ZSHM

在SELECT语句中利用计算公式检查面积相等情况。例如,FDCQ2表中建筑面积(JZMJ)等于专有建筑面积(ZYJZMJ)和分摊建筑面积(FTJZMJ)之和的检查,其SQL语句为:

select*from FDCQ2 where(JZMJ IS NOT NULL AND ZYJZMJ IS NOT NULL AND FTJZMJ IS NOT NULL)AND(ROUND(JZMJ,2)!=ROUND(ZYJZMJ+FTJZMJ,2))

3.2 空间数据拓扑关系检查以及数据生成和踢除

空间数据拓扑关系检查主要包括宗地压盖检查、自然幢压盖检查、界址点重叠检查、界址点是否位于界址线端点检查、界址线重叠相交检查、界址线与宗地边界是否重叠检查。成果数据检查时,部分数据需重新生成。一些数据由于超出清理范围或重复入库、数据错误等原因,需从成果数据中剔除。

1)宗地压盖检查。利用AreaOnAreaOverlayer转换器进行面压盖检查,利用ListConcatenator将压盖相关的两个宗地号关联,利用Aggregator转换器对宗地压盖数量进行统计,输出结果形如:宗地420106005003GB00133与420106005003GB00068压 盖两处。自然幢压盖检查原理与宗地压盖检查一致,不再赘述。

2)界址点检查。界址点重叠检查利用Coordinate-Extractor转换器提取坐标点坐标,利用DuplicateFilter转换器根据坐标和宗地代码综合筛选出有重叠的界址点,输出结果。界址点是否位于界址线端点检查,利用CoordinateExtractor转换器提取界址线端点并构建端点图层,利用SpatialRelator转换器判断界址点与端点层点位重合情况,未找到相交点的界址点即不在界址线端点上,输出检查结果。

3)界址线检查。界址线重叠相交检查,即检查界址线是否相交于界址点处,利用LineOnLineOverlayer转换器判断界址线的相交情况,对输出的打断界址线进行聚合,若界址线相交检查后被打断即为有线段重叠相交的情况,输出相交界址线信息。界址线与宗地边界是否重叠检查,即检查宗地边界线与界址线是否严格套合,利用GeometryCoercer转换器将宗地转换为线图层,利用SpatialRelator转换器判断界址线是否位于宗地线图层之上,输出不套合的界址线结果。

4)预告登记表生成。根据DJYY字段中的“预告商品房合同抵押权设立”或“预购商品房合同抵押权设立”,利用Tester转换器进行判断,根据BDCDYH、YWH字段与DJXX表,利用FeatureMerger转换器进行匹配,获取YGDJ表所需字段信息,将BDCDYH字段与FDCQ2表进行匹配,获取有房地产数据的相关字段信息,对字段进行编辑处理后生成YGDJ表。

5)宗地业务表数据剔除。若宗地的权利人和8张业务表信息都已入库,无需重复入库时,则从成果数据中剔除。根据YWH字段,利用FeatureMerger转换器匹配宗地与QLR表和8张业务表,写模块输出未匹配的数据即可得到剔除后成果数据中的QLR表和8张业务表。

4 检查结果分析

SQL语言实现了对所有属性数据的检查,每项检查内容反馈的错误记录数量会不一样。值域范围符合性和必填字段为空,均可利用UPDATE语句进行修改;逻辑关联错误,部分可利用UPDATE语句进行修改,如房地关联检查中有房无地的情况,可批量添加备注信息,部分则需人工查档修改,如房产面积的修改。

检查结果包括错误数量和内容,如检查房地产权表(FDCQ2)的建筑面积(JZMJ)等于专有建筑面积(ZYJZMJ)和分摊建筑面积(FTJZMJ)之和(图2),共有6 938条记录错误,红框部分为存在错误记录的面积字段。SQL语言检查时存在一个弊端,检查结果页面不可直接修改编辑,需另写修改语句或返回至数据表单人工修改。

图2 FDCQ2的JZMJ等于ZYJZMJ和FTJZMJ之和的检查结果

SQL语言检查具有以下特点:①SQL语言简单灵活,句式可套用;②同一类错误的句式结构一样,只需替换表单名称和字段名称即可;③可用多条SQL语句同时检查多条错误,检查结果页面显示为结果1、结果2、结果3等;④检查结果中需呈现的字段,可在语句中进行限定。

FME实现了对所有空间数据拓扑关系的检查,针对每一类问题的检查程序都是固定的,可重复使用。FME除完成空间数据的检查外,在属性数据较复杂的处理上也发挥了重要作用。FME检查具有以下特点:①FME可实现不同数据格式间的转换,适合空间数据检查,检查结果输出格式可自行定义,检查结果可直接利用,无需编辑修改;②FME转换器多样,转换器组合运用可实现较复杂的功能,适合对多条数据和表单进行处理;③FME可视化强,界面呈现更直观、完整,可直接利用转换器对检查结果进行编辑修改得到成果数据,甚至数据检查和修改可一步完成,如数据重复检查时,DuplicateFilter转换器可输出去重后的数据,再利用写模块写出成果数据即可。

5 结语

本文介绍了武汉市不动产登记存量数据的基本情况、数据检查技术路线和关键技术,梳理了数据检查内容,阐述了SQL语言和FME在数据检查中的具体应用,并讨论了两种技术在数据检查中的特点和效果。结果表明,采用SQL语言和FME检查是一种高效、可行、便捷的方法,通过自动化处理的手段切实提高了检查效率,极大减少了检查人员的工作量。在数字档案清理整合研究中,对详细技术应用的探讨较少,多为整合方案和技术路线的研究,本文基于工作实践对SQL语言和FME在数据检查中的具体应用进行了阐述,可促进数据检查实践工作中对技术应用的思考和选择利用,对实践工作具有借鉴意义。

数据检查工作还有很多方便实用的技术,如基于GeoGloble[7]、AE[8]等相关平台开发的数据质量检查软件。本文对技术的探讨还不够深入,相关技术在数据检查中的应用也未形成统一的体系,这是本文存在的一个局限,也是今后研究和实践工作改进的方向。

猜你喜欢

压盖宗地界址
农村不动产测量中界址点、界址线属性数据快速处理方法
浅谈分体式压盖在核桃壳搅拌器上的尝试
基于ArcObjects二次开发的宗地四至快速提取方法的实现与改进
CASS地籍图中界址信息批量转出方法研究
基于ArcGIS的宗地图自动化制图研究
用气泡体复合保温隔热毯进行粮面压盖控温效果浅析
地籍调查成果在数字时代下的管理研究
钻井泵用L型阀箱
往复式活塞隔膜泵油缸及油缸压盖刚度分析
基于宗地层次的合肥市产业用地集约利用评价