城市治理大數據落地的生態賦能

數據對企業的生產管理產生作用的過程涉及很多環節,包括數據的採集、存儲、對數據和業務的理解、算法的選擇、模型的構建,最後到可視化。大數據不僅具有物理屬性,更包含深刻而複雜的社會和人文屬性,數據專家與業務專家結合,才能做好真正的大數據分析與應用。

北京市政交通一卡通有限公司是一家以智能卡為交易載體、全面應用於城市市政公共交通及小額支付交易領域的高新技術企業。公司是經營“北京市政交通一卡通”智能卡的製作、發售、應用、結算並負責系統投資和管理的企業,擁有北京市城市建設事業IC卡密鑰的管理和使用權。從2000年成立至今,北京市政交通一卡通累積髮卡超過1.4億張,在北京市政交通領域全覆蓋,市政服務領域涵蓋了老年卡、學生卡、殘疾卡、公園卡等。並且正在從實體卡逐步走向異形化和實名化,目前手機刷卡量達500萬,2019年的目標是達到1000萬左右,基本上高強度用戶都轉向無卡化。累積髮卡量1.4億張,保有量1.12億張,積累量經過清洗後、能納入數據平臺參與計算的城市市政行為及交通軌跡數據560億筆,日均新增3000萬筆。

12月11日,在2018年第七屆中關村大數據日平行論壇“大數據落地的生態賦能”上,北京市政交通一卡通公司數據總監、大數據分析技術創新中心副主任張翔發表演講,以“生態賦能”為切入點,介紹基於北京市政交通一卡通數據的創新服務、工程實踐和產業賦能。

城市治理大數據落地的生態賦能

4

數據驅動決策的創新服務

根據張翔介紹,北京市政交通一卡通基於大數據的創新服務主要包括四個方面:政策評估、規劃支撐、交通優化和人群分析。

首先是評估領域的創新應用——北京市票改效果分析,這是國內市政領域第一個億級大數據案例,通過10.36億筆交通軌跡數據分析票改的效果。具體內容包括宏觀總量減少和人群結構變化,微觀識別哪些人的交通方式發生了什麼變化。通過分析數據發現,受票改影響人群有149萬,其中20萬人永久地改變了出行結構,這也是北京二次票改的重點關注人群。

第二個是數字規劃領域的創新應用,受國家發改委委託,對通州的職住人群、旅遊人群等進行研究,基於數據從多維度理解通州。第一個維度是在通州居住、外區工作的人口分佈,第二個是在通州工作、外區居住的人口分佈,第三個是在通州工作、本地居住,分析這些人群的空間密度。此外,為了解2014-2016年通州發生的變化,把通州網格化和差值處理,反映每個網格中歷年數據變化,並且網格可以進行五層細化,逐步看到每個街道、每棟樓甚至每個窗子的數據,通過空間剖分網格技術,為未來無人機投遞做準備,讓數據驅動規劃。

第三個案例是特定人群分析。首先定義特定人群,然後找出特定人群的時空分佈,最後通過一定的驗證識別進行管理。以抓小偷,縮小小偷識別範圍為例,通過數據先識別出小偷的出行特徵,包括偏離正常出行規律、偏好短程、頻繁換乘、隨機停留、無目的地,喜歡在商業、旅遊和公聯樞紐停留等,然後警方在篩選完的範圍內定點識別。以抓到一個小偷的成本來看,大約能節約90%-95%的成本。

第四個案例是北京疏解人口政策的評估,主要是對人口存量研究。通過公交軌跡、移動信令、App等數據對人口數量進行預測,目前對區域人口數量在一個月內的預測準確度達到99%左右。擴展到全北京範圍內,將時間關聯模型、空間關聯模型、變化關聯模型和機器學習相融合,形成時空及變動綜合模型,得出基於天的預測使用基於LSTM的多元人口預測模型準確率較高,基於月的預測使用高斯預測過程模型準確率較高。

工程實踐和產業賦能

工程實踐部分最重要的成果是數據治理。基於專家理論和實踐,整理出一套相對規範的、可操作的數據治理流程,包括組織架構、制度與流程、數據資產管理體系等。

張翔認為,影響數據質量的因素主要有四個方面,即信息、流程、技術和管理,應通過治理工作逐步提升質量以滿足各類運營分析使用要求。其中的典型應用是標籤畫像體系,在預測維度,可以預測一個非實名卡用戶一個月之後的某一天會在哪裡出現的概率,為政府工作和商業應用提供支撐,在此過程中,使用的數據源包括一卡通數據、政府市政服務數據和外源數據,包括信令數據、電力數據、互聯網數據、垃圾排放數據等。在可視化表達方面,開發了一個變形的和絃圖,可以動態展示不同區的人口流動情況。此外還進行了特定區域職住平衡分析,能夠展示特定區域在不同時間的交通人口潮汐現象。

在實踐過程中,切實幫助了一些政府部門、企業等更好決策。比如,在公共交通領域建立了四層挖掘結構,依次是路網、線路、站點和個人軌跡,實現對軌道交通路網總體客流、地鐵線路客流、地鐵站點客流分別預測。同時還研究了北京市老年人和服務網點之間的關係,以幫助北京市合理規劃、佈局養老服務網點,縮短網點與居住的服務半徑,提升養老服務水平。

並且,在大數據培育層面,以北京市政交通一卡通為例,作為一種新的社會組織結構,如何才能進行標準化管理促進數據的互聯互通。其實現在對大數據應用界定不清晰,在實踐過程中,經常使用一些傳統的統計分析方法,但是基於大量數據的分析,這是否就不是大數據呢?是否用關聯性進行的分析才是大數據?用傳統方法進行的分析就不是大數據呢?

其實大數據對社會的作用體現在三個方面,第一是增加決策洞察性,第二是提高生產的效率和效果,第三是降低成本,產生這些效果的才是大數據。

大數據是新興學科,是基於應用和實踐的學科,目前更多還是在探索階段。張翔認為,在垂直行業領域,由實踐中產生標準,逐漸生長為更大範圍的標準,最後上升為行標、國標,這可能是更好的標準產生方式。因為每個行業、每個部門的數據都是複雜的,既有物理屬性,又有其產生的社會屬性和人文屬性,缺少共性,需要數據專家和業務專家合作研究。先在野蠻生長的環境中實踐,在實踐中可能就會有對業務的提煉、泛化,最終成為標準,所以大數據的應用應當不為標準所束縛,服務於社會生產和需求的升級。

相關推薦

推薦中...