2024年1月9日下午,中国地理学会“行为地理学高级研习班”的第九讲在线上顺利举行。本次讲座的主题是“地理信息与时空行为大数据”,由北京联合大学孟斌教授主持,北京大学城市与环境刘瑜教授、深圳大学乐阳教授应邀开讲。刘瑜教授以“地理学中的空间效应”为题,详细介绍了四种空间效应,并以一些具体的研究工作为例介绍了在人工智能方法中如何去体现空间效应并揭示地理规律。乐阳教授以“出行的(不)可预测性——从大数据到AI不变的逻辑”为题,分享了她对模型可预测性的思考,并阐述了从大数据发展到人工智能AI的过程中,预测算法的一些本质问题。本次研习班通过腾讯会议和会议直播方式进行,共吸引了全国各地800多人次参加。
讲座1:刘瑜教授——地理分析中的空间效应
刘瑜教授的讲座共分为三个部分。刘瑜教授首先从学科的角度,介绍了地理信息科学和地理学的关系,强调了地理信息科学在维护地理学整体性以及推动地理学研究上的作用;接着详细阐述了地理学中的四种空间效应:空间异质性、空间依赖和空间自相关、空间交互和距离衰减、空间聚合与尺度效应;然后讨论了人工智能在地理学中的应用,并以一些具体的研究工作为例介绍了在人工智能方法中如何去体现空间效应并揭示地理规律。
第一部分,刘瑜教授从学科角度介绍了地理信息科学与地理学之间的关系。首先,地理信息系统作为工具,为部门地理学提供数据整合分析的方法。其次,地理信息科学中的数据模型和抽象分析方法体现了空间思维和统一性,对地理学科的统一性非常有意义。地理学一直以来受到空心化问题的困扰,而地理信息科学的空间思维和抽象表达在维护地理学整体性、凝聚地理学的核心方面起到了重要作用。此外,地理信息科学中的算法和系统的实现,能够将地理学的研究成果输出到其他领域,例如公共卫生领域、城市规划领域等,从而产生知识溢出,进而体现地理学“经世致用”的特点。
第二部分,刘瑜教授结合近些年的思考梳理了地理学中的四种空间效应:空间异质性效应、近邻效用(空间依赖和空间自相关)、距离衰减效应(空间交互中距离衰减)、尺度效应。空间异质性是地理学的一个最基本的特征,表现各个要素在地球上不同位置的分布不一致。地理学与物理学之间的差异也在于空间异质性,尽管这种异质性使得地理学很难像物理学一样去探求普遍规律。地理数据由于受空间相互作用和空间扩散的影响,彼此之间可能不再相互独立,而是相关的,表现为空间依赖性。很多的空间计量模型中都涉及空间近邻的依赖性,例如空间滞后模型、空间误差模型、地理加权回归模型等,都是将这种空间临近的依赖关系考虑进来,使得我们对空间变量的预测更加准确。此外,距离衰减效应中也非常重要。人、物品、资金在空间上的交互、流动都会受到距离的影响。刘瑜教授提到了不同的距离衰减函数,同时也介绍了常用的欧氏距离度量的局限性,强调了地理分析中距离的复杂性。最后,空间聚合和尺度效应是另一个重要的方面。由于地理现象没有天然的分析单元,需要人为设定。正因为这一点,导致了空间分析中经常讨论的可变面积单元问题和不确定地理语境问题。
第三部分,刘瑜教授详细介绍了人工智能方法在地理学中的应用。他强调了对AI模型的改造,以使其能够更好地体现空间效应。接着,通过四个方面的具体研究案例,刘瑜教授展示了如何在人工智能方法中体现先前提到的空间效应,并揭示地理规律。这四个方面的案例分别为:(1)体现空间效应的神经网络。包括利用神经网络模型来处理空间权重,利用单元格之间联系权重来体现空间的影响,以及利用图卷积网络实现空间回归,通过图结构来体现空间邻近和距离衰减效应。(2)地理表示学习。在地理表征中进行压缩编码,从空间交互和距离衰减的角度表示场所。(3)地理规律的揭示。利用神经网络和符号回归方法去揭示空间交互规律,并顾及空间异质性。(4)地理生成式人工智能。利用生成对抗网络模拟城市以及遥感多模态大模型。
GIS&S和地理学的关系
会议交流:
孟斌教授对刘瑜教授的报告进行了简要总结。随后,柴彦威教授就大数据如何创新行为地理的研究以及国外空间认知、大数据与行为地理学结合的最新进展与刘瑜教授展开了热烈讨论。孟斌教授也针对行为地理学所关注的个体行为建模问题与刘瑜教授进行了交流。主要摘录如下:
柴彦威教授提出了关于空间认知和行为研究的问题,特别是如何通过数学方法和大数据深化这方面的研究。他还询问了大数据在行为研究中的创新和难点,以及刘老师对最新关于大数据与时空行为结合的动态的看法。刘瑜教授强调了大数据在行为地理学中的重要性。他指出,在大数据时代,行为地理学需要更多关注个体之间的异质性,并指出大数据在汇总过程中可能会丢失个体的细节特征,认为挖掘大数据的细节特征并将其与行为地理学的一般性规律结合起来可能会产生有意义的研究工作。此外,刘瑜教授提到了大数据与行为地理学结合的重要性,并分享了他最近在写一篇文章的观点。他谈到了空间交互语义的概念。传统的人文地理学关注交互强度,比如从一个地方到另一个地方的人数。然而,大数据的出现使得我们可以获取更多细节特征,例如人群的年龄、性别、出行时间等。通过大数据,我们可以清楚地了解这些细节信息,这对于理解行为的语义特征非常有帮助,如果我们在行为地理学研究中更加重视语义的表征,可能会取得一些进展。他认为这使得值得努力探索的方向。
孟斌教授提出了在大数据时代对个体GIS数据模型关注方面进展的问题。刘教授认为近期主要还是关于时空轨迹、时空点、汇总、以及语义的加入等。
讲座2:乐阳 教授——出行的(不)可预测性:从大数据到AI不变的逻辑
本次报告中,乐阳教授首先基于其国家自然科学基金项目《数据驱动的空间选择行为机制的研究》,简要介绍了围绕基金所取得的主要研究和发现;并重点分享了在项目完成过程中的两点思考:1)研究服务可持续发展,2)模型可预测性的辩证思考。
首先,乐阳教授介绍了大数据进行空间行为选择的一些代表性研究,例如多源数据融合方法、数据采样率对建模精度的影响,以及利用大数据对商业中心的空间吸引力模型及影响因素识别,通勤与职住平衡的实证分析等。在以上成果的基础上,乐阳教授提出一个思考:影响空间行为选择的因素众多,如何做更有意义的研究?她认为很多研究和算法本质上是在为资本服务,如推荐算法;另一方面,还可以考虑服务于社会,如城市规划和城市管理,需要兼顾公平和效率,从而保障社会的整体可持续发展。
接下来,乐阳教授分享了她在城市可持续发展方面的研究,主要是针对中低收入群体的多项代表性成果,如利用公交刷卡数据分析中低收入人群居住迁徙、中低收入群体及新移民是否存在活动分异、从活动空间角度分析交通的不均等性等。
随后,针对模型对人群行为模型,乐阳教授探讨了人类相关现象整体大致可预测、部分细节不可预测的本质。她以其博士研究所从事的城市路网短期交通预测为例,强调短时交通可预测性的关键在于训练数据的质量以及模型对模式和关系的挖掘能力;因此,随着预测时间间隔的增大,历史平均值得到的预测效果反而会优于各种算法。此外,乐老师以大语言模型预测下一个token的思路为例,探讨模型预测的结果。她认为算法预测的是“平均”现象,所以算法的预测精度在逻辑上是有边界的;除了“卷”算法,建模时更应该深入认识现象的本质。
最后,以轨迹数据的表示学习为例,乐阳教授介绍了其团队在”Science for AI”思路下的研究工作,其核心在于如何更高效准确地表达轨迹数据的时空相关性。在这项工作中,乐阳教授的团队将轨迹的时空相关性这一先验知识与AI算法进行融合,并利用成都、纽约和东京的真实轨迹数据验证了轨迹表示学习的效果。乐老师认为这些轨迹数据的隐空间中也包含了一定的时空特征,她期待大家可以一起探索,在这个方向上能够得出一些有趣的结果。
会议交流:
在报告结束后,孟斌教授对乐阳教授的报告进行了简要点评,认为该报告有很多哲学层面的思考以及新技术,特别是AI热潮的关注和相关实例。与会师生与乐阳教授展开了热烈的讨论与交流。其中,孟斌教授提出在大语言模型这类新的技术到来时,AI是否会为人文地理背景的同学提供一个弯道超车的可能性这一问题。乐老师认为大语言模型的出现可能会给各领域都提供了一个弯道超车的机会,因为大家都处于学习的起点阶段。她认为人文地理学者在理解人或社会方面更加擅长,并提醒大家不仅仅关注算法和技术细节,而是要思考如何将人文地理学知识与AI算法结合起来,以更好地理解人类和社会,这是人文地理学者的优势所在;尤其是结合城市问题去做模式挖掘和机理的解释,而不是单纯地“卷”算法。她再次强调“科技向善”,算法应服务于社会的公平、效率和可持续发展。
部分参会代表合影
“行为地理学高级研习班”由中国地理学会组织领导、行为地理专业委员会策划并承办,旨在进一步加强我国行为地理学研究的理论与实践水平,持续了解国际学术前沿,促进与国际研究的接轨,搭建学术交流与互动的平台,促进行为地理学人才队伍培养,尤其是帮助那些在行为地理学相关领域从事科研与教学的青年教师、行业骨干及研究生。
供稿:中国地理学会行为地理专业委员会委员李秋萍副教授
地 址:北京市朝阳区大屯路甲11号
邮政编码:100101
电子信箱:gsc@igsnrr.ac.cn
电 话:010-64870663
传 真:010-64870663