-
开放科学(资源服务)标识码(OSID):

-
网约车作为一种新兴出行方式,逐渐成为居民日常出行的重要组成部分。因此,挖掘影响网约车出行需求的关键要素,并据此合理分配与调度资源,对于提高城市交通系统服务水平至关重要。由于土地利用对交通出行的本源性影响,已有大量学者开展了建成环境与不同出行方式互动关系的研究。然而,当前研究尚未明确建成环境对网约车出行需求的具体影响及其作用机制。因此,有必要通过厘清建成环境对网约车出行需求的影响机制,进一步深化理解建成环境与出行行为之间的相互作用关系。
目前,国内外学者针对建成环境与各传统出行方式的互动关系开展了大量研究,主要围绕密度、多样性、设计、目的地可达性、公共交通可达性等维度展开。这些研究为解析建成环境和出行行为互动机制提供了实证证据。例如,在密度维度,Newman[1]从人口、生态、可持续性3个层面研究了城市建成环境对出行的影响,发现高人口密度的城市开发模式有利于提高公共交通使用比例,并减少私家车数量。在设计维度,李康康等[2]通过分析影响老年人公交出行便捷性的个体与建成环境要素,发现道路密度对老年人公交出行具有正向调节作用,而交叉口密度会限制老年人公交出行的便捷性。在多样性方面,Cervero等[3]基于美国旧金山湾区的研究发现,高土地利用混合度通常会降低居民出行率,并在一定程度上鼓励非机动车出行。杨励雅等[4]基于北京市第四次居民出行调查数据,探究不同目的出行行为与建成环境的关系,发现土地利用混合度是对生活出行链影响最大的空间变量。尹超英等[5]基于长春市居民出行数据,构建了考虑空间异质性的多层logistic模型,证实土地利用混合度对居民非机动化出行和公交出行比例具有显著影响。在目的地可达性方面,Ding等[6]采用多层次结构方程模型,并纳入个人出行决策的空间异质性,发现建成环境变量中到中央商务区的距离有助于出行者选择慢行交通。Munshi[7]基于印度拉杰果德市的个人访谈数据,分析建成环境对出行方式的影响,发现工作地可达性对出行方式选择有显著影响,在工作地可达性较高的区域,居民更倾向于步行。在公共交通可达性维度,吴静娴等[8]利用南京市流动人群通勤数据,构建了基于贝叶斯网络的通勤方式转移模型,旨在探究建成环境对通勤方式变化的影响,研究表明地铁可达性等变量是影响非机动车通勤人群转向机动化出行的关键因素。
网约车凭借其便捷性和灵活性等特点,满足了居民多样化的出行需求。相关学者亦开始关注网约车出行需求与建成环境的关联。既往研究多使用广义线性模型或数据驱动模型,如Sabouri等[9]基于美国24个地区的网约车订单运营数据构建多层线性回归模型,发现人口密度、土地利用混合度、公共交通站点密度及目的地可达性等变量均是影响网约车出行需求的关键要素。类似地,Bi等[10]利用机器学习模型分析建成环境对网约车出行需求的影响,发现建成环境变量中人口密度和工作密度对网约车出行需求影响最显著。但上述模型忽略了建成环境和网约车出行需求关系中的时空不平稳性。为进一步探究建成环境中的时空异质性问题,学者们引入了地理加权回归类模型。例如,于乐等[11]运用空间杜宾误差模型,同时考虑空间滞后和空间误差因素,探究职住地建成环境与网约车通勤出行的空间相关性,发现建成环境对网约车通勤出行的影响存在空间差异。Wang等[12]利用成都市滴滴出行数据,构建地理加权回归模型(Geographically Weighted Regression,GWR),分析了不同时段网约车出行需求和空间特征之间的关联,发现人口密度、容积率、房价、与地铁站的距离等变量与网约车出行量呈正相关。
综上所述,相关研究虽取得进展,但仍存在一定局限性:如忽略网约车出行需求在不同时间和空间维度上的变化情况;探究建成环境各变量对网约车出行需求的影响时未统一模型框架;传统的GWR模型以内生变量服从正态分布为前提,在回归模型框架下针对网约车出行需求进行建模时,未考虑因变量(网约车出行需求)的计数数据类型及实际分布,从而难以准确刻画二者之间的作用关系。
针对上述问题,本研究纳入网约车出行需求的时空异质性,构建符合实际出行需求分布规律的地理加权泊松回归模型(Geographically Weighted Poisson Regression,GWPR),以探究建成环境各变量对网约车出行需求影响的时空异质性,进而为城市规划决策和网约车行业的发展提供科学依据。
全文HTML
-
本研究选取南京市主城区(玄武区、鼓楼区、建邺区、秦淮区、栖霞区及雨花台区)作为研究区域,覆盖面积为788.33 km2。为精细化研究网约车出行需求影响因素的空间异质影响,将研究区域划分为1 km×1 km的网格单元。剔除不包含人类活动的空间区域(水域等),共得到621个网格单元。研究区域划分及网约车出行需求空间分布情况如图 1所示。
-
基础数据为2022年南京全市网约车订单运营数据,选取2022年4月18日(周一)网约车订单运营数据,数据包含订单起讫点经纬度、乘客上下车时间及车辆ID等多个属性信息。分析前对数据进行预处理。首先,提取与本研究相关的字段属性,包括“乘客上车时间” “订单起点经度”及“订单起点纬度”3个字段;其次,剔除干扰数据,包括单次出行时间小于0 min或大于2 h、载客里程小于500 m、异常数据缺失及研究区域外的订单数据;最终,得到南京市主城区111 847条有效网约车出行数据。
为探究建成环境各变量对网约车出行需求的时间异质性影响,本研究分别选取早高峰(7:00~9:00)、平峰(11:00~13:00)、晚高峰(17:00~19:00)3个连续时段。网格单元内网约车出行需求数据统计如表 1所示。
-
本研究选取密度、设计、公共交通可达性及多样性4个维度表征城市建成环境特征。在密度维度,选取人口密度和13类兴趣点(Point of Interest,POI)数量作为衡量指标。其中,人口数据来源于LandScan全球人口动态数据,利用ArcMap平台计算对应网格人口密度;13类POI数据基于高德地图开放的应用接口提取。在设计维度,选取道路密度变量表征建成环境特征,道路网络数据从OpenStreetMap开源地图中获取,利用ArcMap平台计算道路密度。在公共交通可达性维度,选取公交站点数量、地铁站点数量、距公交站点的距离及距地铁站点的距离4个变量进行测度[13],公交站点数量和地铁站点数量由应用接口提取,距公交、地铁站点的距离分别由各网格单元质心点到最近公交和地铁站点的欧氏距离表示。在多样性维度,选取土地利用混合度变量表征,该指标由单位格网内POI分类的信息熵值表示[14],计算公式如下:
式中:Ej表示网格单元j的混合熵指数;Ajp表示网格单元j中第p类用地占比;Pj表示网格单元j中POI数量。建成环境各变量的定义和数据统计如表 2所示。
1.1. 研究区域
1.2. 数据来源
1.2.1. 网约车数据
1.2.2. 建成环境变量选取
-
由于城市形态的功能性分布,因变量和自变量的空间格局具有潜在的空间非平稳性。因此,在使用空间回归模型前,需要对自变量进行空间自相关检验。本研究采用莫兰指数(Moran's I)对各个自变量进行空间自相关检验,计算公式如下[15-16]:
式中:I为莫兰指数;n为网格单元数量;wijk为自变量k在网格单元i和网格单元j之间的空间权重;xik和xjk分别为网格单元i和网格单元j的第k个自变量的值;xk为第k个自变量的平均值。I的取值范围通常为[-1, 1]:I>0表明空间正相关,空间分布越聚集时,空间相关越明显;I<0表明空间负相关,空间分布越离散时,空间相关越显著;I=0时表明空间呈现随机性。
Moran's I的零假设以自变量独立、不存在空间自相关性为前提。Moran's I统计检验零假设的显著性指标用Z值表示,计算公式如下:
式中:E(I)和Var(I)分别为Moran's I的期望值和标准方差。设置显著性水平为p<0.1[17]。
-
GWPR模型以地理加权广义线性模型(Geographically Weighted Generalized Linear Model,GWGLM)为框架,是全局回归模型和传统GWR模型的整合模型。其中,全局回归模型假设变量与其所在的地理位置无关,且变量符合正态分布,可用来探究一个或多个变量的变化对另一个变量的影响程度;传统GWR模型在全局回归模型的基础上考虑了变量关系随地理位置的变化,可有效捕捉空间异质性。
网约车出行需求频率分布如图 2a所示。由图 2a可知,网约车出行需求分布显著左偏,不符合传统普通最小二乘法回归模型的正态分布假设。经过对数转换后,网约车出行需求仍不满足正态分布,如图 2b所示。因此,假设网约车出行需求遵循泊松分布[18],构建GWPR模型用于处理非负整数值的计数数据,并将网约车出行需求分为早高峰、平峰、晚高峰3个时段,利用模型结果解释空间非平稳性、系数估计的时空异质性。GWPR模型表达式为:
式中:yi为因变量网约车出行需求;(ui,vi)为自变量的地理坐标;β0(ui,vi)为截距项;k为第k个自变量;βk(ui,vi)为自变量k的局部回归系数;xik为自变量k在第i个网格单元中的值;εi为第i个网格的误差项;Ni为位移变量。位置(ui,vi)的估计系数β ∧ k(ui,vi)可通过以下公式获得:
式中:X和Y分别为自变量(建成环境变量)和因变量(网约车出行需求)的矩阵;w(ui,vi)为n×n维空间加权矩阵,在空间分析中选择自适应的双平方核函数(Adaptive Bi-square)计算方法用来定义空间权重矩阵,进而提高回归分析的准确性和可靠性[19]。其公式如下:
式中:wij是网格单元i和网格单元j之间的空间权重;θi(j)是网格单元i和最近网格单元j之间的距离;dij是网格单元i和网格单元j之间的欧氏距离。采用黄金分割比例法确定最佳带宽大小,选取修正赤池信息准则(Akaike Information Criterion corrected,AICc)作为带宽和模型决策的度量标准。
2.1. 空间相关性分析
2.2. GWPR模型构建
-
本研究所选各个自变量的莫兰指数检验结果如表 3所示。所有变量都在p<0.1水平上具有统计学意义,且Moran's I统计量和对应Z值均大于0,表明自变量在空间上呈现显著的集聚特征,因此有必要选择局部回归模型对建成环境各变量进行空间异质性分析。
-
在分析建成环境对网约车出行需求影响模型时,将网约车出行需求作为因变量,各个空间单元的建成环境特征作为自变量。同时,为证明GWPR模型的可行性和优越性,将其与传统的GWR模型进行对比,模型对比结果如表 4所示。表中GWPR模型的AICc低于GWR模型,在平峰和早、晚高峰时段分别比GWR模型低53.07%、32.50%和40.09%;GWPR模型的AIC也比GWR低,在早高峰、平峰和晚高峰时段分别比GWR模型低34.53%、54.81%及41.32%。这说明GWPR模型对计数类型的网约车数据具有更好的拟合优度。
GWPR模型局部变量回归系数的结果如表 5所示。由表 5可知,各个自变量的回归系数在空间研究单元内各不相同,且随着时间变化而变化,表明建成环境各变量对网约车出行需求存在时空异质性影响。本研究选择2个统计变量(平均值和标准差)描述每个自变量的空间非平稳效应。结果表明,商务住宅及休闲场所在早高峰、平峰和晚高峰时段与网约车出行需求呈正相关,原因在于高密度兴趣点处,网约车出行需求较多,这与Yu等[20]的研究结论相似。道路密度在早高峰、平峰和晚高峰时段对网约车出行需求亦呈正向影响。而金融保险、风景名胜及运动健身在不同时段对网约车出行需求均起到抑制作用,这是因为以上变量一般位于交通设施较完善地区,居民倾向选择公共交通出行。地铁站点数量和距公交、地铁站点的距离与网约车出行需求呈负相关,且标准差较大,表明上述变量对网约车出行需求的影响在空间上变化较大,存在较强空间异质性。人口密度、餐饮设施及土地利用混合度等变量在不同时段的作用存在差异。例如,人口密度、公司企业、酒店住宿、生活服务在平峰时段对网约车出行需求存在抑制作用,而在早、晚高峰时段对其存在促进作用,表明以上变量对网约车出行需求的影响存在显著的时间异质性。文化传媒、汽车相关兴趣点以及公交站点数量在平峰和晚高峰时段与网约车出行需求呈正相关,但在早高峰时段呈负相关,这是由于文化传媒和汽车相关兴趣点多为就业岗位集中区域,在早高峰时一般为居民出行终点,故网约车需求较少。公交站点数量在早高峰时段对网约车出行需求有负向影响,原因在于早高峰时段一般为通勤人员出行,公交专用道的存在可在一定程度上降低交通拥堵对公交出行的影响,若选择网约车出行,通勤成本较高,且易发生交通拥堵,使通勤时间变长。因此,此类人群倾向选择公共交通,以达到降低出行成本和确保通勤时间可控的目的。而在平峰与晚高峰时段,居民出行需求较为多样,如下班通勤、购物以及娱乐活动等,出行目的地较为分散。在公交站点周边区域,网约车可补充公交出行,进而解决“最后一公里”问题。土地利用混合度在早高峰和平峰时段与网约车出行需求呈正相关,这与Ghaffar等[21]的研究结论相同,说明土地利用混合度高的区域出行需求较多。然而,在晚高峰时段呈负相关,说明土地利用混合度对网约车出行需求的影响存在时间异质性。
-
基于4个维度中显著性较高的风景名胜、道路密度、土地利用混合度及距地铁站点的距离4个变量,对模型拟合的回归系数进行可视化分析。
-
风景名胜回归系数的时空分布如图 3所示。在早高峰时段,雨花台区和栖霞区因通勤与旅游需求的叠加,区域对网约车的需求增强。在平峰时段,建邺区、鼓楼区以及秦淮区三区交汇处的风景名胜对网约车出行需求有促进作用,回归系数为0.00~0.31,这可能是因为这些区域景点集中,吸引了游客在非高峰时段的出行需求。在晚高峰时段,城市中心部分区域的风景名胜对网约车出行需求的影响逐渐减弱,甚至呈负相关。原因在于这些区域周围的公共基础设施相对完善,晚高峰时段市中心交通流量较大,网约车出行易发生交通拥堵,导致出行需求降低。
-
道路密度回归系数的时空分布如图 4所示。由图 4可知,道路密度对网约车出行需求的影响呈现一定的时空异质性。在空间维度,栖霞区中心区域、建邺区东北部以及秦淮区等道路密度高的区域,网约车出行需求受到抑制。原因在于这些区域道路密度高,公共交通分布广泛,网约车出行需求相对较低。在栖霞区东北部和雨花台区等公共交通基础设施相对不足的区域,道路密度对网约车出行需求起促进作用,回归系数高至0.60。网约车作为公共交通的补充工具,在此类区域需求较高。在时间维度,早高峰时段和晚高峰时段表现出一定相似性。但晚高峰时段栖霞区的道路密度对网约车出行需求的正向影响范围更广。这可能是由于早高峰时段居民出行多与通勤相关,而晚高峰时段出行目的较为多样且出行方向更加分散,公共交通的服务能力和覆盖范围在这一时段难以完全满足居民出行需求,从而增加了网约车的出行需求。
-
土地利用混合度回归系数的时空分布如图 5所示,土地利用混合度回归系数的空间分布情况如图 6所示。在建邺区和秦淮区这类土地利用混合度较高的区域,网约车出行需求受到抑制,早晚高峰时段负向影响尤为显著,回归系数达到-6.80(图 5)。原因在于这两个区域的综合性功能较强,居民的日常活动范围较为集中,出行需求可通过步行、自行车等方式满足,从而降低了对网约车的依赖。在雨花台区和栖霞区,早晚高峰时段,土地利用混合度与网约车出行需求呈显著正相关,这可能是由于上述区域主要是制造业和高新技术产业基地,就业岗位密集,高峰时段通勤出行需求稳定,加之现有基础设施相对匮乏,交通站点之间距离较远,仅靠公共交通无法满足通勤需求。因此,通勤工作人员往往选择网约车出行或换乘。
-
距地铁站点的距离回归系数的时空分布如图 7所示。在大部分区域,距地铁站点的距离对网约车出行需求起抑制作用。其中,栖霞区各时段距地铁站点的距离与网约车出行需求均呈负相关,原因在于该区域公共交通密度相对较低,网约车可作为公共交通的补充方式提供接驳服务。而在鼓楼区和秦淮区,各时段距地铁站点的距离与网约车出行需求均呈正相关,回归系数为0.17~0.83。这是由于以上区域是商圈汇集地,公共设施较为完善,地铁可达性较高。因此,居民出行更倾向选择地铁,以避免交通拥堵、缩短出行时间并降低出行费用。
3.1. 莫兰指数检验结果
3.2. 模型结果
3.3. 时空异质性分析
3.3.1. 风景名胜
3.3.2. 道路密度
3.3.3. 土地利用混合度
3.3.4. 距地铁站点的距离
-
为刻画网约车出行需求影响因素的时空异质性,构建地理加权泊松回归(GWPR)模型,从时间和空间2个维度探究建成环境对网约车出行需求的影响,并以南京市网约车数据为例开展实证研究。结果表明:
1) 相较于传统的地理加权回归(GWR)模型,考虑空间非平稳性及出行需求非正态分布的GWPR模型具有更优的拟合效果,这表明在对建成环境和网约车出行需求互动关系建模时,应考虑出行需求的计数数据分布特征及二者关系中的空间异质性。
2) 局部变量的回归结果表明,多数建成环境变量对网约车出行需求的影响存在时空异质性。其中土地利用混合度和人口密度对网约车出行需求的影响呈较为显著的时空异质性;距地铁、公交站点的距离和地铁站点数量对网约车出行需求的影响主要表现为空间异质性,时间异质性较弱;餐饮设施和购物服务对网约车出行需求的影响则呈时间异质性,且该影响在平峰和高峰时段具有显著差异。
3) 在建成环境的4个维度中,对网约车出行需求有较显著影响的变量分别为风景名胜、道路密度、土地利用混合度及距地铁站点的距离。其中,风景名胜越密集的区域,交通设施越发达,出行选择性会随之增加,进而抑制网约车出行需求。道路密度高的区域对网约车出行需求存在抑制作用,反之则表现为促进作用。就土地利用混合度而言,土地利用混合度较高的区域,网约车出行需求减少,居民倾向选择步行等慢行交通方式。在大部分区域,距地铁站点的距离对网约车出行需求起抑制作用。
下载: