古人逐水而居,今人逐數興業。在數字時代大潮的裹挾下,數據已經成為最重要的戰略資產。2020年,中央發布了首份關于要素市場化配置的文件,明確提出,數據成為生產要素。這可謂是一個標志性事件,表明數據將會是未來社會數字化、信息化發展的重要基礎。
“如果我們把數據比喻成水,聚水成湖,構建數字底座。”近日,北京易華錄(300212)信息技術股份有限公司高級副總裁宋征在2021全球數字經濟大會——數字基建與生態發展論壇上表示,我們將這個“湖”稱為“數據湖”,但這片“湖”只裝數據不裝水,可基于這個“數據湖”構建未來城市、未來社會,而這正是我們的愿景。
何為“數據湖”?
“數據湖”是什么?宋征表示,我們定義它為新一代綠色低碳數字經濟基礎設施。他從五方面對“數據湖”做了一個詳細介紹。一是它是一個綠色安全的數據中心;二是它由易華錄和政府共建,是地方政府數據要素一級開發和整理的平臺,也是當地政府搞數據的一個抓手;三是它是以數據治理和開發作為數據開發的終極目標;四是進入數據湖,可通過數據銀行平臺,進行數據眾籌、文化眾治、應用眾包、產業眾創,以此推動數據要素的統籌和交易;五是基于數據湖,站群服務器,構建數據經濟產業園,不僅可以通過數據來招商,也能帶動當地數字經濟發展。
“我們構建的數據湖可以有效解決當前數據面臨的‘存不起、得不到、不會用’現實問題。”宋征表示,一是易華錄以藍光存儲技術為代表的新型存儲技術,大大降低存儲能耗與存儲成本,數據一旦寫入,50年都不會丟失、不會壞,這樣就使得數據存的起;二是在合法合規的前提下,通過“數據銀行”,在政府監管下開放一切公共數據,這樣數據就能得的到;三是數據存到數據湖之后,提供全面的數據應用場景和技術支撐,這樣數據就能用得好。
總的來說,數據湖作為海量數據(603138)的存儲和傳輸載體,不僅能降低全社會存儲數據的能耗成本,還能幫助實現數據資源的產業化。宋征表示,經過“十三五”期間的努力,目前,易華錄已經建設36個“數據湖”,和當地政府一對一進行溝通,共同共建、落地,運營。與此同時,生態建設合作伙伴400多家,共同來推進數據湖、數據基建的建設,以此推動數字經濟的發展。
如何引“水”入“湖”?
據記者了解,數據湖建設可分為三個階段,建湖、引水、水資源開發利用。那么數據湖建成之后,如何引“水”入“湖”?宋征表示,數據不會平白無故地跳到數據湖內,因此我們提供一系列數據入湖的解決方案。
第一,以場景方案、創城項目匯聚數據。我們提供政府全域數據一攬子的治理、管理、應用場景,包括最新的科技創城,把政府數據引入到數據湖里,這一方案得到多地政府認可。第二,搭建超級存儲云平臺。該存儲平臺是云化的,全國統一門戶,方便用戶使用存儲服務。第三,與運營商緊密合作。目前易華錄與運營商簽署戰略合作伙伴協議,把藍光存儲技術完美融入運營商的云上,并提供光磁電一體化的冷數據、海量數據存儲的基礎方案。第四,每個數據湖都有專門項目公司負責運營。將易華錄的運營能力注入到數據公司,幫助當地政府做好相應引“水”、運營工作。
我們知道,一個成熟的數據湖體系具備大數據存儲、大數據處理、機器學習、大數據分析等能力。
宋征表示,存儲作為數據湖構建的關鍵一環,能源耗電是非常驚人的。當前,數據中心占整個社會耗電的3%,云主機,到2025年將達到4.1%,而存儲在數據中心當中,耗電占35%。有機構分析,到2025年,全球數據量將達到175ZB,5年年均復合增長率31.8%。龐大的數據量對作為數字技術底層支撐的數據中心提出了更高要求,數據存儲面臨著前所未有的壓力。
對此,宋征指出,易華錄的藍光存儲技術、光磁融合一體技術能有效降低IT設備用電量,可綜合降低我們整體數據存儲的能耗。
值得一提的是,隨著數據時代進程的加快,也促進了數據的指數級增長。但數據湖內大量數據之間的資源互通、共享和協作訴求愈發強烈,而實現此目標的核心是數據的理解與分析。如在企業生產經營過程中,由機器產生的海量數據經過解析后形成統一的標準、數據格式和表達方式,但現實卻是,工業互聯網數據仍然面臨信息孤島、數據兼容、數據挖掘不足等眾多問題,而工業互聯網標識解析體系是解決上述問題的關鍵。