一直以来,关于城市密度与健康风险之间的关系,学界内存在不同的观点。本次我们给大家带来一篇SCI论文的全文翻译。该论文运用可解释机器学习的方法,来理解城市密度和健康风险之间的复杂关联,有助于回答城市密度与健康风险之间的关系和机制问题。
【论文题目】
The association between urban density and multiple health risks based on interpretable machine learning: A study of American urban communities
【题目翻译】
基于可解释机器学习的城市密度与多种健康风险之间的关联:美国城市社区研究
【期刊信息】
Cities, Volume 153, October 2024, 105170
【作者信息】
Zerun Liu,纽约大学坦登工程学院,:[email protected];
Chao Liu,同济大学建筑与城市规划学院城市规划系,[email protected]。
【论文链接】
https://doi.org/10.1016/j.cities.2024.105170
【关键词】
城市密度、可解释机器学习、公共卫生、建成环境、慢性病、人口密度。
【摘要】
随着城市的日益复杂,城市已成为前所未有的复杂系统。本文旨在开发可解释的机器学习(ML)方法来解开复杂的关联。在对美国城市社区的案例研究中,我们应用可解释的机器学习方法,识别城市密度与多种健康风险之间的关系。我们从人口、建成环境和活动三个维度定义城市密度,并根据身体疾病、心理疾病和健康负担的分类来衡量多种健康风险。首先,我们进行聚类分析,以控制社会经济变量并选择研究样本。接着,我们构建多个机器学习模型,包括多元线性回归、决策树、随机森林和极端梯度提升。我们采用可解释的方法来解析模型,如特征重要性、部分依赖图、个体条件期望和夏普利加性解释,以识别重要因素、非线性关系以及变量之间的交互作用。结果显示,可解释的机器学习方法在效率和透明度方面具有明显优势。我们的研究发现,城市密度与多种健康风险之间的关系非常复杂。各种健康风险之间的相似性和差异性提供了关于关键因素、阈值和病理特征的宝贵证据,可以指导城市的健康和可持续发展。
【前言】
随着全球城市人口的不断增加,城市密度最近引起了广泛关注。一般而言,城市密度是指在城市特定区域内人、建筑和活动的集中程度。城市密度体现了城市空间的物理和文化特征,并在经济和社会中具有重要意义,是量化和衡量城市的有效工具(Bettencourt et al., 2007)。然而,关于城市密度的一个争议性讨论在于,尽管高密度有助于提高效率、多样性以及促进资源共享,但城市的紧凑性却可能降低个体生活质量,因为这会导致疾病、污染和犯罪的增加(Glaeser et al., 2001; Pan et al., 2013)。最近的研究,尤其是在疫情期间的研究,加剧了这一矛盾。证据表明,尽管密集的城市地区拥有更好的医疗条件和基础设施系统,但其高活动强度、频繁的人际流动和紧密的社会接触却导致病例的迅速激增。然而,目前尚没有统一且令人信服的研究来说明城市密度的机制和规律。
事实上,关于城市密度影响的辩论自城市诞生之初就已经存在。作为城市化的产物,空间密度的概念源于城市诞生以来的聚集属性。最初,密集的城市中心是创新和财富集中的关键,促进了从农村到城市社会的转变(Becker et al., 1999; Bettencourt & West, 2010; Bettencourt et al., 2007; Milgram, 1974)。然而,工业革命带来了人口的快速增长和密集的、常常不健康的生活条件,突显了控制城市发展的必要性。这导致了1848年公共卫生法的出台,标志着政府管理城市规划的开始(Townshend & Lake, 2009)。19世纪和20世纪见证了现代城市规划的兴起,以及由埃比尼泽·霍华德提出的田园城市运动,旨在平衡城市设施与绿地,以应对城市蔓延(Howard, 1902)。这一运动强调了控制城市蔓延和管理城市密度的重要性。进入21世纪,城市化和全球化的加剧带来了新挑战,要求在确保宜居性、效率和可持续性的同时,妥善应对城市的增长。然而,目前对现代城市中城市密度的角色以及如何适当地引导密集城市区域的发展,仍然缺乏明确和一致的结论。
在物理学、经济学、社会学、地理学、建筑学和城市规划等多个领域,密度的概念具有重要意义。其定义因领域而异,这种变化在城市研究中尤为明显,其含义可能存在显著差异。广义上,密度涵盖了社会互动、经济活动、能量流动、生态环境、文化、历史等多方面的整合。从狭义上说,特别是从城市规划和建设的实践角度来看,城市密度通常指人口密度和建筑密度,这些通常与土地利用、可达性、道路网络等一同讨论(Carlino et al., 2007; Dovey & Pafka, 2014)。最近的研究揭示了社会关系密度和人口密度如何影响城市中创意的高效产生和生产力的提升(Pan et al., 2013)。越来越多的学者关注网络内部的互动和人类流动的空间聚集(Gonzalez et al., 2008; Levinson, 2012; Louf & Barthelemy, 2014; Simini et al., 2012)。亟需一个通用模型来解释覆盖人口、建成环境和流动性的密度如何与城市发展相关,从财富和创新到犯罪和疾病。因此,在本研究中,我们从三个方面衡量城市密度:人口密度(单位空间如区域和房间内的人口分布强度)、建成环境密度(城市空间的开发强度)和活动密度(活动和设施的空间分布强度)。综合考虑这些方面,我们能够全面衡量和理解城市。
在关于城市密度的广泛研究中,关注健康风险的研究尤为引人注目。健康风险被定义为不良健康结果的概率,涵盖了可能对个体身心健康造成危害的广泛因素(WHO, 2009)。一般而言,健康风险可分为三类:(1)身体疾病,包括慢性病如心脏病、癌症和糖尿病,以及流感和艾滋病等传染病;(2)心理疾病,包括抑郁症和精神分裂症;(3)健康负担,指显著的公共卫生危害,增加患上多种疾病的概率,如肥胖、睡眠不足、焦虑、吸烟和饮酒。已有文献证明,健康风险可以源自多种因素,包括遗传易感性、环境因素、社会经济条件、生活方式和行为。显然,城市密度与所有这些方面密切相关,因此有必要调查和解释其与多种健康风险的关联。
然而,关于城市密度与健康风险之间的关系,存在不同的观点。一些研究得出结论,密集的城市地区可能因为资源有限和空间拥挤而导致健康问题。另一些研究则认为,城市内部的密度能够带来更多的生活便利和丰富的设施,从而改善健康和医疗保健。此外,许多研究者认为这种关系是复杂的或非线性的。然而,尚未有统一明确的结论来描述城市密度与健康风险之间的关联。因此,在本研究中,我们旨在识别城市密度与多种健康风险之间的复杂关系。利用可解释的机器学习,我们衡量多维度的城市密度,并比较其与各种健康风险的关联,从而全面洞察城市密度与健康风险的关系。所采用的可解释机器学习方法对于检测复杂和非线性关系具有重要价值,适用于其他旨在揭示非线性关系的研究工作。
本研究从以下几个方面为以往的理论和文献做出了贡献:研究结果