英國較難獲取實時的大空間尺度的精細化人口流動數據,因此我考慮利用歷史交通大數據為當下的疫情防控問題提供幫助。第一個案例是基于歷史普查數據的大尺度通勤出行矩陣模擬。第二個案例是一個傳統的交通大數據研究,利用機動車軌跡數據識別通勤行為,希望能有助于Covid-19疫情后的交通需求情景分析。
一、基于歷史普查數據的大尺度通勤出行矩陣模擬
如何利用歷史普查的通勤數據合成新近年份的通勤矩陣?我們基于通勤矩陣雙向約束的特性,國內服務器,利用2011年的觀測矩陣作為初始輸入,輸入2018年的工作地和居住地總數作為新約束,香港服務器,通過iterative proportional fitting方法調整矩陣。最后可以產生的新矩陣符合2018年觀測到的居住地和工作地的總數。
其中涉及兩個具體的操作問題。第一,對于“在家辦公”和“無固定工作地”的處理。在家辦公的人群可以假設是在居住地上班。沒有固定工作崗位的人,可以計入居住地這一端,按照概率分布的形式假設在所有地方都有一定概率就業。這樣可以避免低估交通出行需求。
第二,通勤矩陣是典型的稀疏矩陣,其中有很多工作地和居住地之間沒有觀測值,這給IPF方法造成困難,我們提出可以把城市大數據和城市模型相結合。現有大量的研究利用手機信令、LBS數據等合成通勤矩陣。
我們發現利用大數據推測出來的通勤矩陣總體上是可靠的,但往往伴隨各種隱性誤差,其中就業地識別和捕捉短距離通勤誤差較為顯著。利用大數據與城市模型相結合的方法可以修正誤差。
具體方法可參見論文Wan,Li et al.(2017). Big data and urban system model - Substitutes or complements? A case study of modelling commuting patterns in Beijing. Computers, Environment and Urban Systems
第二個案例是我們希望利用歷史交通大數據對疫情后的交通需求做評估。疫情之后,影響交通需求的因素主要有三個。第一個因素是按照行業和技能水平劃分的復工率。例如中、高技能崗位可能會持續性遠程辦公,而中、低技能崗位特別是需要使用機械的崗位可能會率先復工。
第二個因素是出行方式的轉變,之前通勤出行方式主要是公交車的人群,可能在疫情后轉向私人汽車。第三個因素是工作方式的轉變,通過疫情防控期間的封鎖,人們被迫適應了新的工作方式,而更加靈活的工作方式對交通需求的影響尚不確定。
通過研究歷史交通大數據,我們可以分析出不同類型工作者的汽車使用模式,有助于預測和管理疫情后的交通需求。比如,城市里是否應該增加停車位,一方面要考慮刺激消費,特別是餐飲業服務業的消費,一方面要減少擁堵和排放,這樣的決策需要更多個體尺度的行為數據。
最后是關于大數據研究的三點反思。一是大數據研究通常是以相關性為出發點,但是從相關性轉移到因果性是有必要的且亟需的。二是需要從數據驅動問題向問題驅動數據轉變,現在大數據研究大部分是數據驅動的探索性研究,研究結果未知。應該首先明確研究問題,基于問題導向來收集、分析數據,優化未來的數據收集。
三是什么是規劃師職業所屬的核心問題/數據集?清華大學龍瀛老師在建筑學報的一篇新文章上列舉各種類型城市數據集,很難說規劃師對所有數據集都擅長,針對具體問題、選擇合適的數據源和分析方法,是值得進一步探討的。