摘 要:通過分析信息化建設脈絡中高速公路數據的海量產生,結構復雜的海量數據存儲及處理,闡述大數據平臺在智慧高速建設中的作用,總結大數據在智慧高速中的客戶服務、運營優化、稽查分析、應急資源調度、預測預警等方面的具體應用,對交通指揮中心工作提供支持。
關鍵詞:智慧高速 分布式數據處理 數據挖掘 客戶服務 優化運營 預測預警
Abstract:This paper analyzes the effect of big data platform in the construction of expressway construction by analyzing the mass production of expressway data and the complicated data storage and processing in the context of information construction, summarizes the customer service and operation optimization of big data in expressway, inspection and analysis, emergency resource scheduling, forecasting and early warning of specific applications, so as to provide support for the traffic command center.
Key words:intelligence expressway; distributed data processing; data mining; customer service; operation optimization; forecasting early warning
引言
隨著經濟社會的發展,城市人口持續增長,數量持續增長的車輛給交通基礎設施通行能力帶來極大壓力。交通擁堵、交通事故、環境污染及能源短缺已成為目前面臨的重要問題,尤其在高速公路交通管理尤其變得更加明顯。如何有效利用傳統的高速公路數據與設備,提高交通運輸效率、安全性、整體效益,提高交通的科學管理和組織服務水平是管理者迫切需要解決的問題。
車輛在高速公路上,本身的動作及設備會產生海量數據,在沒有大數據平臺之前,高速公路上產生的數據分門別類的分布在Oracle、MySQL等數據庫中,因為各自處理語言不同,在剛使用時分析速度尚且可以,但隨著數據量越來越多,查詢調用越來越頻繁,速度變得越來越慢,無法滿足高速管理需求。
高速公路的信息化建設包含從基建到信息記錄等多個層面。所有的環節都在不停地產生數據,成為智慧高速中的海量數據來源。首先是高速公路的硬件和基礎設施,當一輛車開進收費站,先經過地下預埋的地感線圈,經過地板線圈進行切割磁力線,產生很弱的電流,車輛開進來會由定焦在地感線圈的攝像機拍一張圖片,產生車輛進入收費站的第一個數據。繼而遞交收費卡、讀卡、寫卡,寫卡的同時計算從A點到B點的費用,每一個動作都在產生數據。高速公路收費還涉及更加復雜的情況,如起點A到終點B,中間經過三段高速公路,三段的收費主體不同,需要在收費的金額上進行三個收費主體的拆分,這涉及到后臺的數據計算。所以一輛車從進入收費口到駛離收費口,至少會產生兩張圖片,十余條流水數據,同時還會產生車道攝像和停位攝像等大量的視頻信息。
產生大量車輛數據的同時,收費員的動作,如按抬桿鍵、放行鍵、軍車鍵等,也會產生數據記錄,方便后續稽查時的圖片分析,避免逃費等行為。設備本身也會產生大量數據,比如抬桿、打票、紅綠燈轉換,全部都會產生日志信息進入數據庫,這還只是收費相關的數據信息。在看不到的地面上,還會存在很多信息采集系統,比如地磁式傳感器、攝像頭,檢測車輛通過時的平均速度、平均車間距和平均占有率等等信息,大量數據都會進入數據庫,進行后續的存儲分析。一輛車在駛離高速公路時,已經產生了大量的數據信息,其中包含結構化和非結構化數據、流數據等多種數據形式。
高速公路上產生的海量數據,需要一個企業級的大數據平臺,對數據進行分門別類的存儲管理,TDH企業級一站式大數據平臺,以分布式架構對數據進行存儲和計算,并在此基礎上進行數據處理和應用。
大數據平臺架構設計
數據進入大數據平臺,上游業務系統中的數據,通過文件交換或Sqoop方式同步到大數據平臺的貼源層,然后經過批處理加工后,形成明細層、匯總層和模型層。對于歷史數據,比如收費站入口流水表和出口流水表,選擇存儲在Search引擎中,可以進行快速的歷史數據檢索。對于非結構化數據,例如圖片和視頻影像,選擇存儲在Hyperbase引擎中。同時,為了提高大數據平臺的數據質量,使用Governor管理元數據(包括表和存儲過程),監控所有數據的更改歷史,進行數據血緣分析和影響分析。對上層的基于大數據平臺的應用,可以使用標準的JDBC或ODBC與大數據平臺進行連接,對數據挖掘需求,如節假日車流量預測、高速路擁堵程度預測等,可以圖形化拖拽機器學習平臺Sophon組件進行預測,如圖1所示。
▲圖1大數據平臺架構