看过来!地名信息整合新思路
文章来源:本站 发布者: 发布时间:2023-03-17 阅读:948 次
来源:地名笔谈
万冉冉 李婷
“十三五”国家信息化规划明确提出“完善政务基础信息资源共建共享应用机制,依托政府数据统一共享交换平台,加快推进跨部门、跨层级数据资源共享共用。”随着大数据技术应用及智慧城市的试点建设,我国政务信息建设的重心正逐步由信息化建设转向政务信息资源的共享应用阶段发展。在信息化建设阶段,很多部门均建立了面向其业务需要的专题地理信息系统,而且政府大多通过政务资源共享平台获取到各部门的共享数据。然而,由于缺乏统一的空间信息共享标准,与地理位置有关的信息存在数据编码和信息标准不统一的问题,大多数共享的专题地理信息难以整合,同一地理位置的相关政务信息无法在相应位置集中展现,制约着政务信息共享的进一步发展。因此,如何解决政务信息与空间信息的关联,实现多源、异构政务信息资源整合,成为政务信息资源共享应用的关键技术研究。目前,利用大数据技术和地理信息对政务信息资源进行整合研究,国内专家学者们取得了一定的研究成果。文献利用地理网格方法,对多源政务信息资源进行空间定位,实现了政务信息资源空间化和时空一致性处理,有利于跨地区、跨部门政务信息资源空间关联分析和深度整合利用。文献以国土空间规划为例,提出了以地理空间属性为核心的政务数据、服务等资源的整合模式。有关统计表明,约80%的政务信息均与空间位置有直接或间接的关系,而且基本上均是通过地名地址的描述信息确定其空间地理位置。但是,从现状来看,各部门分头采集、没有统一标准,对于地名地址的表述不一致,即使实现了政务信息的空间化,不同部门的政务信息也难以汇聚至统一的地理位置。或者信息汇聚后,由于汇聚类型单一,无法开展多数据源的数据挖掘与分析。因此,迫切需要建立标准地名地址数据模型和数据库,实现地名地址空间定位的唯一性,实现多源政务信息资源的整合。本文以智慧新余时空信息云平台项目建设为例,提出一种基于标准地名地址匹配的政务信息空间定位方法。首先,建立标准地名地址数据库;然后,通过地名地址匹配的方式对政务信息进行空间化处理,赋予其空间坐标。整合的政务信息只是具有各类属性信息的空间数据,实现共享应用才是最终目标。随着测绘地理信息服务的迅速发展,基于地理实体的数据模型被提出,近年来,将地理实体应用于政务信息共享中成为一个研究热点。2019年5月25日,龚健雅院士在新型基础测绘技术体系高级研修班的会上作了《信息化时代 新型测绘地理信息技术的发展》报告,提出了地理实体作为连接自然地理信息与人文社会经济信息的桥梁和纽带,是实现信息共享的抓手。解决多源、异构的海量三维城市空间对象的一致性关联和检索匹配问题,有效实现多尺度异构三维空间数据的管理和应用。文献提出了一种基于地理实体的异构三维空间数据集成方法。因此,本文对整合后的政务信息和地理实体数据进行了融合挂接,通过地理实体与政务专题数据的关联融合,可实现空间展示每个地理实体相关的专题数据,并且可对多源政务信息进行统一时空基准的统计、分析和数据挖掘,为政府精细化管理提供数据支持。
1现状分析
1.1政务信息资源现状政务信息涉及国民经济、资源环境、人口、法人等多方面内容,具有数据表现形式多样、数据量大、碎片化等特点。碎片化体现为政务信息资源是零散的、不系统的、无序的、互不关联的知识碎片,明显阻碍了政务信息资源整合和政务功能协同运作进程。本文收集了表格形式的常住人口基本信息、个体工商户信息(如图1所示),这两类政务信息均包含地址信息,如果能通过地址信息在政务信息之间建立联系,那么即可实现政务信息资源整合。
图1 常住人口基本信息和个体工商户信息1.2地名地址现状地名是指地理实体的专有名称,地址是指具有地名的某一特定空间位置上自然或人文地理实体位置的结构化描述。然而,在现有管理体制内,地名属于民政部门的管理范围,地址在各省则由国土、民政、公安、房产、工商、统计等部门分别管理,地址通常包含于各部门政务信息资源中,用以确定空间位置信息。由于各部门工作重点不同及建设过程中缺乏统一的规范,造成各类地址信息规范性和统一性不高,主要表现为地址描述的不规范性和多样性。如图2所示,同样是中大·奥林园小区,房屋测绘数据的地址是劳动北路中大奥林园,常住人口基本信息的地址是劳动北路1377号,这就造成无法通过地址在这两类政务信息之间建立联系。因此,迫切需要规范和统一各政务信息资源中的地址描述信息。
图2为了解决地址描述不规范、不统一等问题,我国已经陆续制定了相关国家标准和行业标准,但由于标准较为宏观,各省地址的实际情况不同,因此,在一定程度上无法指导某些省份标准地址的建设。针对该问题,本文根据江西省实际情况,制定了适用于江西省地名地址数据的3项地方标准,不仅规范了地名地址数据,而且能够实现各行业部门现有地名地址数据的整合处理。
2 标准地名地址的政务信息整合方法
2.1标准地名地址数据库建设按照制定的2项江西省地方标准《地名地址数据规范》和《地名地址数据处理技术规范》的要求,生产覆盖新余市整个建成区范围274km²的点状地名地址数据、道路数据和各类面状地名地址数据,并通过统一的地理编码结构要求,建立新余市标准地名地址数据库,包括表1的各类地名地址数据。表1 地名地址数据构成
标准地名地址数据的生产方式包括外业采集和对现有的不同来源的地名、地址及兴趣点数据的整合处理。整合处理方法为通过设计有效的地名匹配策略,对同一地名进行去重处理,在此基础上将对应的地名地址数据进行归并处理,实现对地名地址数据的空间重组。该方法不仅有效地生产了标准地名地址数据,而且改变了数据生产模式,充分利用了现有数据成果,避免了地名地址数据的重复建设。在对不同来源的地名、地址及兴趣点数据进行整合处理过程中,存在有些兴趣点由于各数据源地址不一致而无法直接整合的情况,主要表现在道路名、门牌号的不一致。本文采用的处理方式如下:(1)如果兴趣点依附于某小区、单位或大厦,则道路名、门牌号与所依附的小区、单位、大厦一致。(2)如果兴趣点不依附于某小区、单位或大厦,则通过营业执照上的注册场所和邻近道路名称确定采用的数据的道路名、门牌号。如果各数据源地址中的道路名均与营业执照上的注册场所和邻近道路名称不一致,为了保证成果质量,舍弃该条数据。2.2政务信息整合目前除测绘部门和公安部门的政务信息属于空间数据以外,其他部门的政务信息均是通过地名地址的描述信息确定其空间地理位置,因此,首先需要对政务信息赋予空间属性,即进行空间化处理。政务信息空间化是通过政务信息中的地址信息与标准地名地址数据库中的标准地名地址进行匹配实现的,采取“软件自动化+人工干预”的处理方式。对政务信息的数据结构、属性字段等进行清洗整理后,才可以进行空间化。对于Excel表格数据的清洗整理主要是调整字段格式,保证其可在导入GIS软件后正确显示。空间化的具体步骤为:①基于标准地名地址数据库,利用地名地址索引生产工具,创建地名地址索引文件。②将创建的地名地址索引文件发布成地名地址匹配服务,提供地名地址匹配的能力。③参照制定的江西省地方标准《地名地址地理编码服务规范》,利用地名地址信息作为匹配参数,将政务信息与标准地名地址数据进行匹配,得出匹配结果。对匹配结果进行分析,并对未匹配或匹配度不高的数据进行人工判读、修改。获取匹配成功地名地址数据的地理坐标值,并补充到政务信息数据属性中,即可完成政务信息空间化。政务信息空间化后,同一个地理位置的相关政务信息能够在相应位置集中展现;能够进行统一存储和管理,从而实现多源、异构政务信息资源的整合。
3 数据融合应用
地理实体数据是通过对基础地理信息数据进行内容提取、模型对象化重构等处理后形成的,是具有社会意义和经济意义的最小地理单元。地理实体的图形数据由单个或多个点、线、面几何对象组合而成,具有特定的地理意义与空间唯一性。构建具有唯一标识、标准地址、时空坐标信息的地理实体数据,可作为关联和承载政务信息资源的纽带和桥梁,实现信息交换共享。因此,在智慧新余时空信息云平台项目中,本文将整合后的政务信息与地理实体数据进行融合挂接,建立了关联政务信息的地理实体数据库,搭建了智慧新余时空信息云平台,如图3所示。
图3 智慧新余时空信息云平台政务信息与地理实体数据融合挂接的实现方法是通过标准地名地址匹配的方式,将政务信息与地理实体数据进行匹配,再将地理实体的唯一标识码赋给政务信息。建立的关联政务信息的地理实体数据库包括地理实体数据和政务数据两部分,具体数据(部分)类型见表2。表2 地理实体数据库数据类别(部分)
智慧新余时空信息云平台可实现空间展示每个地理实体相关的专题数据,政务数据和基于地理实体数据的GIS功能均可通过数据服务、功能服务、地名地址服务和云服务等方式提供给多个应用部门,完成部门之间的数据交换共享。通过整合常住人口信息、学生基本信息、教师基本信息等,利用二元回归模型,开展了教育承载力基本情况分析,完成了新余市中小学教育配比图、学区人口、学区分类等专题图(如图4所示)。另外,智慧信息与时空信息云平台政务版智能制图实现了将数据服务、功能服务和地名地址服务进行集成,用户可根据自身需求任意组织数据。绘制地图、分享地图,实现了用户工作“一张图”;实现了用户单位的“协同一张图”;实现了新余市的智能“一张图”(如图5所示)。
4结语
本文通过标准地名地址在各类政务信息资源之间建立联系,提出了一种基于标准地名地址匹配的政务信息资源整合方法,并将整合后的政务信息与地理实体进行融合挂接。实践表明,本文方法不仅能够提高政务信息资源的整合效率,而且有利于开展综合政务数据的统计、分析和深度信息挖掘,为政务大数据整合和共享应用提供了新的思路。但是,综合政务信息的应用将会随着政府部门职能的变化而不断地进行调整和深化,政府部门围绕社会管理、公共服务及经济调节等方面的应用需求将会逐渐增多,因此,后续工作将对政务信息资源的深度应用进行重点研究。