借助手机网络数据,监测德国城市地区人们的出行模式
文| 曾游
编辑| 曾游
(相关资料图)
引言
手机的出现,以前所未有的方式,彻底改变了现代生活的许多方面。在德国,注册的手机号码数量从1992年的不到一百万增加到了2018年的近1.37亿。
这意味着在一个拥有超过8300万人口的国家,大多数人都至少拥有一部手机,并且很可能会在大部分时间里随身携带。
利用手机定位数据进行监测的想法并不新鲜。汽车行业的学者和工程师一直在进行所谓的手机出行调查。
最初,这些研究集中于将实时交通数据用于改善车载导航设备。如今,实时交通信息在许多高级路线规划和导航应用程序中被广泛使用。
其他学科也开始利用这些新的可能性来了解个人出行行为。例如,空间规划师现在对所有交通方式进行出行调查,包括公共交通和积极的出行方式(步行、骑行)。
到目前为止,只有新技术的早期采用者,在拥有特权数据访问的领域中,正在尝试利用这些新数据集。区域范围的空间监测概念,尚未利用从移动电话网络数据中获得的可能性,来跟踪实现空间政策目标。
在德国,研究大多依赖于归档的土地利用统计数据、地形地理数据和出行调查。这些数据通常要等到三年后才能组合使用。
分析选项受到数据所带来的限制。例如,随时间不一致的土地利用分类、有限或不匹配的空间分辨率,或缺少关于不属于统计数据覆盖范围内的州社会保障系统的通勤者的信息。
现在可以通过使用更及时的移动电话网络数据,来克服这些缺点。随着与数据保护相关的法律问题得到解决,整合移动电话网络数据进行长期监测的概念现在是可行的。
背景:监测流动模式
为了规划交通基础设施,规划者需要提供不仅是有关物理交通网络、其容量和使用模式的供应信息,还需要有关当地人口和经济的流动需求信息。
这样的信息收集和管理在过去几十年中得到了发展:一开始只是交通工程和规划学科的专属领域,现在则采用更多元化的跨学科方法,包括空间规划学科和社会科学。
在这种情况下,可持续交通规划的方式导致人们关注出行行为研究。现在的规划实践将对流动需求管理策略的新见解与流动需求研究相结合。
为了支持这种加强版的可持续交通规划,现代信息系统需要整合各种主题的数据,例如土地利用、交通基础设施、人口统计和预测。
在过去,这样的信息是从各种来源收集的,有时涉及成本高昂和耗时的人工劳动(例如交通计数、家庭调查、服务水平评估)。
所谓的数据化社会看到新的数据驱动应用程序,产生了丰富的新信息(大数据)关于一系列主题。
一个重要的问题是,以前手动收集的信息是否可以被同样频繁、质量和深度的自动生成数据所取代,例如移动电话网络数据。
这将允许交通规划研究的地理范围得到极大扩展,消除过去由于数据收集所需的成本和时间,而导致的交通分析和相关监测活动范围的限制。
数据源和数据融合
Telefónica Next提供了聚合和匿名化的移动电话网络数据,这是基于近4500万注册移动电话号码、2100万客户和80亿个网络事件的起点-终点矩阵。
当移动设备与手机基站通信时,例如在上网或打电话时,这个数据库就会记录移动设备的活动并进行匿名化和处理,以识别出移动和旅行的轨迹。
在进一步的工作中,通过重复的模式对移动进行分类,识别出居住和工作地点或通往其他目的地的路径。
为了负责任地实现此类移动性数据的统计分析,Telefónica Next开发了一个特定的匿名化程序,符合数据保护法规。
移动网络流量的空间范围涵盖了整个德国,邮政编码被用作交通数据的空间单位。数据的巨大空间范围提供了探索不同城市定居类型之间移动模式的机会,例如交通流量。
出行数据以逗号分隔值(CSV)文件的形式提供,每小时为一个时间序列。数据基本上有五个属性,即起始区域、终止区域、日期、小时和出行数量。
这里使用的术语起始区域和终止区域,表示出行的起点和终点的邮政编码。
这种数据结构允许按天、小时和邮政编码进行聚合查询,这意味着可以分析早晚高峰或特定小时的出行模式,并过滤感兴趣的起始和终止区域,以及工作日和周末的出行模式。
为了检测具有邮政编码作为空间单元的数据中的空间流动模式,从而回答关于起点和终点之间功能关系的研究问题,需要添加有关起点和终点的性质和功能的附加信息。
为此目的的一个有用的表示单元是所谓的RegioStaR分类(德语:‘Regionalstatistische Raumtypen’,英语翻译:‘regional statistics spatial types’),它由德国联邦交通部(BMVI Citation2018)定义,并被用作本研究的辅助数据源。
该新分类于2018年中期发布,旨在将功能上同质的市镇划分为空间类型,特别是用于交通和流动性规划的研究。
另一个要求是建立稳健的、可以随时间更新和补充的空间类型,以用于监测目的。
在此基础上,按RegioStaR类别(1)农村地区及其子类型(边缘农村地区和城市区域内的农村地区)、(2)小型和中型城市及其通勤区域(德语:‘Regiopolitane Stadtregionen’)和(3)较大的大都市地区(德语:‘Metropolitane Stadtregionen’)对出行量进行了聚合。
这使研究人员能够检测这些空间类型之间的典型流动模式(例如通勤者在市中心工作的早高峰),或者识别出观察到偏离流动模式理论假设的情况,并需要解释。
为此,将原始移动电话网络数据,与德国约11,000个市镇的RegioStaR分类进行了关联。
请注意,电话数据缺乏有关交通方式的信息,这是任何综合旅行行为分析的重要属性。这是移动电话网络数据在目前发展状态下的一个弱点。
理论上,应该可以通过使用电话位置数据来确定速度,即从一个位置到另一个位置所需的时间,从而确定交通方式。
然而,精度因地区和交通方式而异;在许多交通选择的密集市中心区域区分交通方式仍然是一个开放的研究问题。
汇总和匿名的移动数据被存储为PostgreSQL数据库中的一个表。根据查询执行计划的细节,在表中创建索引以加快查询速度。
计算密集的地理处理任务,如所谓的空间连接,也在PostgreSQL中使用其空间数据库扩展器PostGIS提供的功能执行。
除了来自BMVI的分类数据,另一个重要的辅助数据来源是,来自OpenStreetMap(OSM)的德国道路网络数据。
从Geofabrik GmbH获得的OSM数据,被预处理为可路由的shapefile,用于图形处理,例如用ArcGIS Network Analyst进行路由或可达性分析。
OSM数据被用来计算行程长度,即起点和终点之间的距离。行程长度和行程频率是研究中分析的两种流动性措施。
起点区和终点区之间的行程频率从移动数据记录中获得,而行程长度则使用ArcMap 10.5.1中的网络分析器扩展计算,ArcMap 10.5.1是由ESRI公司开发的商业桌面GIS软件包。
这套软件经常被交通规划部门使用,因此被视为从业人员最容易使用的程序。
数据准备和分类
作为数据准备的一部分,研究人员采用了基本的数据质量检查和汇总程序。主要目的是,将数据从邮政编码单位,转换为与政策层面相关的空间单位。
在德国,使用空间指定的最重要的政策级别是区域计划和地区/地方区域计划。监测相关计划中的空间政策,和文本表述中的目标的最重要基础单位是市镇(根据欧盟的命名法,LAU2级)。
因此,数据转换需要将邮编数据转换为市镇,大部分情况下没有重叠。为了克服任何最终的重叠,研究人员制定了规则,根据重叠单位的面积比例来重新分配数据。
在总共8222个邮编中,有1363个被发现覆盖了一个以上的市镇。其中只有211个跨越了属于不同地区分类的城市。
这些邮编被分配到重叠面积最大的城市的区域分类中,从而将模糊性降到最低。
然后将所得到的按邮编划分的空间类型学,与具有空间功能的PostgreSQL数据库中的移动交通数据表联系起来。出于性能考虑,需要使用索引来提高查询性能。
基于GIS的网络分析
频率和空间范围构成了流动性的两个关键维度。在这个意义上,研究人员首先将频率测量为两个区域之间的旅行次数,这种模式在一天中的不同时间和一周中的不同日子里是不同的。
空间和时间频率模式在城市研究中具有多种用途,例如,确定一个区域的吸引力(有时从建模的角度称为 "引力")。
为了建立起点区和终点区之间的距离,在OSM提供的街道网络中创建了旅行路线,使研究人员能够计算出,起点区和终点区的几何中心点之间,每次旅行的大致长度。
计算8222(德国邮政编码)数据点之间的路线需要密集处理。即使不是所有可能的组合都是实用的(人们不可能每天都进行长距离的旅行,而且偏远的地方也不经常去),路线计算还是决定了重要的性能考虑。并行化有助于提高处理性能。
讨论和未来工作
耗时和昂贵的专门旅行调查的组织和实施,在很大程度上可以通过分析移动电话网络数据,来取代和补充。
定能从这些数据中获益的用户是交通规划者和交通工程师,他们在很大程度上依靠交通统计来应用最佳实践的基础设施规划和评估程序。
这些数据对运输和空间规划相关学科的学术界、运输经济学、从事地方和区域政策的学者,和规划从业人员,以及关注移动性转型的政策制定者也很有帮助,因为移动性转型是运输部门脱碳的关键。
一些研究得出的结论是,移动电话网络数据比任何专门的旅行调查,都能更好地捕捉流动趋势。
这些数据是由移动电话网络供应商自动收集的,因此很容易获得,至少对于一个公司的客户群的空间活动是如此。
只要样本规模足够大,就可以利用特定地点的预测,在现有样本的基础上推算出出行的绝对数量。
在这方面,研究中使用的西班牙电信公司的数据,涵盖了相当大的市场份额,从而可以进行稳健的预测。
它覆盖了整个德国,其数据格式很容易成为持续监测的纵向数据源。与现有的专注于大都市地区的特权数据访问的研究相比,研究显示了在国家、州或地区层面的空间规划中为这种持续监测服务的概念。
数据保护问题,通常由允许使用匿名数据作为合同的一部分的客户同意条款涵盖。
保护个人匿名的一般数据保护条例(GDPR),阻碍了家庭结构和人口统计信息的收集,从分析的角度来看,这是一个 “不错的选择”。
可以在个人层面上与社会特征相联系的关于流动行为的详细信息可能仍然是小组研究和微观普查报告的范畴。例如,德国和瑞士自20世纪70年代以来一直定期报告其各自人口的流动行为。
数据收集耗时且昂贵,这就是移动电话网络数据的用武之地:它可以以更大的样本量,频繁而及时地补充微观普查数据。
目前,仍有一些弱点,例如在识别出行使用的交通方式方面。希望在不久的将来,可以通过整合额外的交通基础设施数据,和智能手机内置传感器(如加速器或磁力计)所收集的信息,来改进交通方式的识别算法。
结论
研究描述了如何设置和微调这样的分析路径,以便在可接受的处理时间内执行。这个技术骨干自然需要接受过此类技术培训的数据分析员。准备好这些数据进行分析,只是其中的一步。
另一个步骤是提出用于空间监测的分析概念,使规划者能够详细地识别例如流动性模式。在此背景下,展示了一些例子,要求将数据汇总到与交通部门政策制定相关的空间类型学中。
监测对于评估这些政策的有效性是至关重要的。从分析的角度来看,新方法有望在这方面将监测应用提高到一个新的水平。
从组织的角度来看,这种应用的数据集目前只能从商业供应商那里获得。潜在的用户将不得不依赖他们在数据结构和价格方面的持续可用性。
与政府提供的官方数据集(人口普查数据、区域统计、地理地形)相比,必须根据数据集为监测目的提供的附加值来评估这种风险。
同时,还有一些问题需要解决:为了使移动网络数据成为运输监测的标准,需要提供运输方式。
数据的可用性和一致性需要达到多年来时间序列的稳定性和可比性。有充分的证据表明,这些问题将在不久的将来得到解决,这意味着研究所展示的概念和应用可以进一步发展并被社会所接受。
参考文献:
1.Ahas, R., A. Aasa, Y. Yuan, M. Raubal, Z. Smoreda, Y. Liu, C. Ziemlicki, M. Tiru, and M. Zook. 2015. “Everyday Space–Time Geographies: Using Mobile Phone-Based Sensor Data to Monitor Urban Activity in Harbin, Paris, and Tallinn.” International Journal of Geographical Information Science 29 (11): 2017–2039.
2.Andrienko, G., N. Andrienko, W. Chen, R. Maciejewski, and Y. Zhao. 2017. “Visual Analytics of Mobility and Transportation: State of the Art and Further Research Directions.” IEEE Transactions on Intelligent Transportation Systems 18 (8): 2232–2249.
3.BMVI (Bundesministerium für Verkehr, und digitale Infrastruktur). 2018. RegioStaR Regionalstatistische Raumtypologie für die Mobilitäts-und Verkehrsforschung. July. Accessed May 2, 2019.
4.Böltken, F., and G. Stiens. 2002. “Siedlungsstruktur und Gebietskategorien.” In Nationalatlas Bundesrepublik Deutschland. Dörfer und Städte, edited by Institut für Länderkunde Leipzig, 30. Berlin: Verlag.
5.Bundesamt für Statistik Schweiz. 2017. Verkehrsverhalten der Bevölkerung. Ergebnisse des Mikrozensus Mobilität und Verkehr 2015. Neuchatel. Accessed August, 29, 2019.
关键词:
推荐阅读
阿波罗11号未解之谜 阿波罗11号登月证据是什么?
阿波罗11号未解之谜1969年7月16日,巨大的土星5号火箭载着阿波罗11号飞船从美国卡纳维拉尔角肯尼迪航天中心点火升空,开始了人类首次登月的 【详细】
大数据有什么用?大数据技术的应用领域介绍
大数据有什么用?大数据指的是在一定时间范围内不能被传统软件工具捕获、管理和处理的数据集。它是一种海量、高增长和多样化的信息资产,需 【详细】
验钞机什么牌子好?验钞机的价格介绍
验钞机什么牌子好?康艺康艺始于1994年。是行业标准的起草单位,其产品人民币外币柜台 清分机 复点机 捆钞机 扎把机 取款箱是研发康艺专业生 【详细】
苹果秋季发布会正式官宣 iPhone 12系列手机有什么型号?
苹果秋季发布会正式官宣昨晚,苹果正式宣布了秋季发布会的时间,线上会议将于9月16日凌晨1点举行。这也是今年在苹果举行的第二次线上会议, 【详细】
高岭土是什么?高岭土主要应用在哪些领域?
高岭土是什么?高岭土是一种非金属矿物,是一种粘性的土和粘性的土岩,主要由高岭石族的粘土矿物组成,有黏土和黏土岩。因其白色细腻,又叫 【详细】
相关新闻
- 借助手机网络数据,监测德国城市地区人们的出行模式
- 禁令副作用出现!华为孟晚舟正式宣布,外媒:挡是挡不住了-世界要闻
- 苹果首款!25000元! 天天消息
- 每日视点!“吃顿饭的工夫收费500元”?特斯拉充电站这笔“超时占用费”该收吗
- 驻马店开启“静音”模式 “城管蓝”全力护航逐梦学子
- 观焦点:沪苏浙皖签署文旅发展框架协议 拟打造长三角文旅一体化新样本
- 广州拟出新规:电动自行车将分层次、分时段限行 天天快看
- 全球热推荐:提前还清房贷,我连海底捞都不敢吃了
- 希沃学习机W3,满满护眼黑科技,呵护孩子好视力
- 新款Jeep角斗士的无伪谍照曝光:新车最快有望在9月份发布
- 电脑快速入门指南按键解锁_电脑快速入门
- 天天快看点丨林子力_关于林子力概略
- 阜阳师范大学_阜阳大学
- 食管裂孔疝吃什么药(食管裂孔疝吃什么药好)
- 利亚德:智能显示板块直销业务今年相对恢复比较快 确认收入和订单同比增长20%左右
- 汉缆股份:公司及控股子公司拟使用不超过10亿元投资理财产品
- Joby希望电动空中出租车能满足大众需求
- 全球观速讯丨在哪些银行办信用卡比较好 来看看这些
- 【世界报资讯】哪些贷款app容易通过 哪些通过率高
- “红蕴天平”双月社区周项目启动 首期活动吸引17家专业医疗机构支持