建筑功能对城市规划至关重要,而利用多源数据进行建筑功能分类有助于支持城市规划政策。本研究通过分析建筑特征和POI密度,识别了中国三个城市群的建筑功能,并使用XGBoost模型验证了其在大规模映射中的高准确性和有效性。研究强调了建筑环境对分类准确性的影响,并发现长三角和珠三角城市群的开发策略较为协调,而京津冀城市群则不然。
【论文题目】
Identifying building function using multisource data: A case study of China's three major urban agglomerations
【题目翻译】
使用多源数据识别建筑功能:以中国三大城市群为例
【期刊信息】
Sustainable Cities and Society,Volume 108, August 2024, 105498
【作者信息】
Yue Zheng, 广东省城市化与地理仿真重点实验室,地理与规划学院,中山大学,广州 510275,中国
Xucai Zhang, 地理系,根特大学,比利时根特9000;跨学科空间分析实验室(LISA),土地经济系,剑桥大学,英国
Jinpei Ou, 广东省城市化与地理仿真重点实验室,地理与规划学院,中山大学,广州 510275,中国
Xiaoping Liu,广东省城市化与地理仿真重点实验室,地理与规划学院,中山大学,广州 510275,中国;南方海洋科学与工程广东省实验室(珠海),珠海 519000,中国,[email protected]
【论文链接】
https://doi.org/10.1016/j.scs.2024.105498
【关键词】
建筑功能映射、XGBoost、兴趣点、建成环境、建筑几何特征
【本文亮点】
-
一种在大规模下快速识别单个建筑功能的方法。
-
通过迁移实验验证建筑环境的有效性。
-
成功识别了中国3900万座建筑的功能。
【摘要】
作为塑造城市景观的关键地理成分,定义建筑功能在规划城市发展和促进社会经济活动中发挥着重要作用。现有的大规模映射研究主要忽视了建筑周围环境,导致在某些学科中对大规模建筑级别映射的需求不能得到充分满足。为了弥补这一差距,本文计算了建筑轮廓的几何特征、建筑与邻近物体的距离以及兴趣点(POI)的核密度,以识别中国三个城市群(京津冀城市群、长三角城市群和珠三角城市群)中的建筑主要功能。通过利用XGBoost,我们的模型在三个城市群中分别达到了0.936、0.934和0.940的准确率,以及0.883、0.868和0.891的kappa系数,表明其在大规模映射中识别建筑功能的能力。此外,对不同特征组合和迁移能力的实验强调了建筑环境在提高分类准确性方面的重要性。此外,对三个城市群建筑分类结果的分析显示,长三角城市群和珠三角城市群的开发策略协调一致,而京津冀城市群的城市则没有表现出相同的发展策略。所有结果表明,利用多源可获得数据来高效地对大区域内的建筑功能进行分类是可行的,并且具有成本效益。这一方法可以在中国甚至更大范围内复制,为复杂的城市空间提供洞察,并帮助城市规划者提供政策支持,如旧城改造和新城规划。
【引言】
城市和城市群作为经济和社会发展的主要引擎,是中国现代化的主战场(Fang et al., 2013; Fang & Yu, 2017; Guan et al., 2018)。自改革开放政策以来,中国大力推动城市化,根据中国国家统计局发布的《政府工作报告》,城市化率从1978年的17.9%激增至2022年的65.2%(Keqiang, 2023; Xiaobo et al., 2018)。建筑物构成了城市的物质基础,是城市生活的核心,第一项国家自然灾害风险调查显示,中国城市和农村地区的建筑总数高达6亿。快速的城市化进程带来了中国建筑数量和功能的重大变化(Wang et al., 2015)。建筑功能作为建筑的核心元素,提供了人类的基本需求,并揭示了人类活动的社会经济形式(Niu & Silva, 2021; Zhang & Zhang, 2009)。在这种背景下,对国家建筑功能分类的全面和细致理解有助于未来的城市规划、环境保护、热岛效应响应、建筑部门的碳中和以及其他各种倡议(Choi & Yoon, 2023; Shen et al., 2021)。然而,传统的手工建筑功能调查费时且覆盖面有限。商业地图服务如Google Maps通常无法直接提供单个建筑的功能,只提供兴趣点(POI)的功能。因此,急需提出一种快速且自动化的大规模建筑功能识别方法。
几十年来,许多研究人员专注于智能功能映射方法的深入研究,这些方法适用于大规模映射。传统方法主要关注地块级别的土地利用分类,主要依赖遥感数据和地理特征或纹理,忽视了人类活动的社会经济特征(Hu & Wang, 2013; Pacifici et al., 2009)。近年来,许多新兴的城市数据,如手机信号数据(Wei Tu & Li, 2017)、社交网络签到数据(Cai et al., 2022)和兴趣点数据(POI)(Andrade et al., 2020),被用于更细粒度的城市土地利用映射。同时,机器学习算法的广泛应用促进了这些不同数据集与遥感信息的更有效集成,为城市土地利用研究开辟了新的途径。例如,GongPeng et al.(2020)应用随机森林算法,利用高德POI、腾讯MPL、夜间灯光影像及其他遥感数据对中国440,000个城市地块进行了分类。类似地,Zhang et al.(2020)利用微博签到数据来细化广州的土地利用类型,并比较了随机森林、支持向量机和朴素贝叶斯模型的性能。尽管这些研究在一定程度上提高了准确性,但其对地块级别分类(Zhang et al., 2020)的关注仍不足以探索具有高度混合和快速变化土地利用的现代城市。迫切需要开发新技术以实现细粒度的建筑功能映射,尤其是在大规模下,以描述单个建筑功能的分布。
在城市土地利用分类的基础上,关于单个建筑功能分类的研究已经展开。高分辨率遥感影像包含丰富的地面细节信息,学者们从中提取光谱特征以分类屋顶类型或连续建筑类型(Taubenböck et al., 2009)。然而,从这些地球观测遥感影像中推断建筑类型仍然具有挑战性。此外,像素级别的遥感影像可能导致建筑边缘或角落几何信息的丢失。此外,地面图像数据被引入用于识别单个建筑的功能,常用来源包括通过在线地图服务如OpenStreetMap或Google Street View获取的街景图像(Shivangi Srivastava & Tuia, 2020; Srivastava et al., 2018),这些图像提供了建筑轮廓和建筑立面的详细特征(Atwal et al., 2022)。例如,Kang et al.(2018)使用街景数据推广了一种实例建筑分类方法,并在美国和加拿大的多个城市进行实验,将建筑分类为八个类别,并取得了更好的结果。然而,街景地图的明显缺点是覆盖范围有限&