我國的工業(yè)互聯(lián)網(wǎng)發(fā)展正在從概念的普及進入實踐的生根階段,在這一進程中,數(shù)據(jù)成為重要的基礎(chǔ)性戰(zhàn)略資源。大數(shù)據(jù)的充分挖掘和利用,極大促進了全社會要素資源的網(wǎng)絡(luò)化共享、集約化整合、協(xié)作化開發(fā)、高效化利用,推動了中國工業(yè)發(fā)生重大而深刻的變革,一個全新的大數(shù)據(jù)時代正在向我們大踏步地走來。
工業(yè)數(shù)據(jù)量激增背景下的數(shù)據(jù)處理
目前,大數(shù)據(jù)正處于融合發(fā)展和變革創(chuàng)新的重要關(guān)口:工業(yè)數(shù)據(jù)量激增,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)三大生態(tài)順次發(fā)展,使得全球數(shù)據(jù)總量爆發(fā)性增長。到2020年,數(shù)據(jù)總量將達到44ZB(萬億GB),其中工業(yè)數(shù)據(jù)增速將是其它大數(shù)據(jù)領(lǐng)域的兩倍;軟件、網(wǎng)絡(luò)、裝備等各領(lǐng)域間技術(shù)頻繁發(fā)生跨界耦合交融,依托數(shù)據(jù)的整合作用,推動產(chǎn)品與服務(wù)、硬件與軟件、應(yīng)用與平臺趨向交融;全球產(chǎn)業(yè)格局面臨重塑,傳統(tǒng)大數(shù)據(jù)IT企業(yè)、自動化企業(yè)、制造企業(yè)正在成為工業(yè)大數(shù)據(jù)這一新興領(lǐng)域的領(lǐng)導(dǎo)力量,以融合性技術(shù)創(chuàng)新和新興產(chǎn)業(yè)生態(tài)體系為標志的產(chǎn)業(yè)新格局正在形成中。
工業(yè)大數(shù)據(jù)從來源上主要分為信息管理系統(tǒng)數(shù)據(jù)、機器設(shè)備數(shù)據(jù)和外部數(shù)據(jù)。信息管理系統(tǒng)數(shù)據(jù)是指傳統(tǒng)工業(yè)自動控制與信息系統(tǒng)中產(chǎn)生的數(shù)據(jù),如CRM、ERP、MES等。機器設(shè)備數(shù)據(jù)是來源于工業(yè)生產(chǎn)線設(shè)備、機器、產(chǎn)品等方面的數(shù)據(jù),多由傳感器、設(shè)備儀器儀表進行采集產(chǎn)生。外部數(shù)據(jù)是指來源于工廠外部的數(shù)據(jù),主要包括來自互聯(lián)網(wǎng)的市場、環(huán)境、客戶、政府、供應(yīng)鏈等外部環(huán)境的信息和數(shù)據(jù)。
工業(yè)大數(shù)據(jù)的實踐落地高度依賴行業(yè)經(jīng)驗與人工智能等數(shù)據(jù)科學(xué)的融合,通過將行業(yè)知識、經(jīng)驗固化到軟件中,實現(xiàn)對工業(yè)場景中面臨的不確定性實現(xiàn)更加有效地管理,形成數(shù)據(jù)驅(qū)動、快速迭代、持續(xù)優(yōu)化的工業(yè)智能系統(tǒng)。
工業(yè)智能技術(shù)實現(xiàn)的關(guān)鍵步驟
在2015 年通用電氣(General Electric)推出GE Digital 時,GE Digital 的CTO Harel Kodesh 就提出過:工業(yè)數(shù)據(jù)不準確、工業(yè)智能對風(fēng)險控制和響應(yīng)能力的高要求、終端處理能力的限制、復(fù)雜模型必須被解釋等導(dǎo)致了在數(shù)據(jù)、算法和模型訓(xùn)練上工業(yè)智能所要開辟的一些「新領(lǐng)域」。
天澤智云首席架構(gòu)師朱武曾在InfoQ刊發(fā)過的《海闊憑魚躍:記一場工業(yè)場景下的AI技術(shù)實踐》一文采訪中提到,工業(yè)數(shù)據(jù)的多源性、復(fù)雜性和動態(tài)性強,比如柴油機氣缸排氣溫度,取決于燃油、燃燒、進氣溫度、封閉性等等原因,導(dǎo)致工業(yè)智能背后數(shù)據(jù)特征提取、建模等層面的技術(shù)挑戰(zhàn)。因此,特征提取要求在高背景噪聲下必須實現(xiàn)準確且快速的降維。另外,在數(shù)據(jù)建模及訓(xùn)練層面,工業(yè)應(yīng)用的碎片化、個性化以及結(jié)果的專業(yè)性,需要建模及訓(xùn)練在整體和個體、通用性和個性化之間取得均衡。
從工程實現(xiàn)的角度,工業(yè)智能實現(xiàn)的關(guān)鍵有如下幾步:
1. 定義工業(yè)場景:正如上文所提及,問題域所涉及工業(yè)場景定義的準確性和完備性決定了該問題在多大程度上被解決的可能性;
2. 數(shù)據(jù)的完備性和質(zhì)量:工業(yè)現(xiàn)場數(shù)據(jù)一般帶有很多噪聲,而數(shù)據(jù)范圍和質(zhì)量決定了后續(xù)處理的難易程度和最終結(jié)果的準確性;
3. 智能應(yīng)用支撐環(huán)境:工業(yè)智能應(yīng)用本身就具備碎片化、個性化、專業(yè)化的特點,如何提供快速有效的應(yīng)用實施環(huán)境,包括數(shù)據(jù)環(huán)境、模型研發(fā)實驗環(huán)境、應(yīng)用部署環(huán)境等,決定了工業(yè)智能應(yīng)用的推廣和客戶接受速度。
依照美國NSF 智能維護系統(tǒng)中心創(chuàng)始主任李杰教授、天澤智云CTO 劉宗長共同發(fā)表的《工業(yè)大數(shù)據(jù):挖掘“不可見世界”中的價值》一文中的闡述,CPS 是一個具有清晰架構(gòu)和使用流程的技術(shù)體系,針對工業(yè)大數(shù)據(jù)的特點和分析要求所構(gòu)擬的技術(shù)體系,國內(nèi)服務(wù)器租用 服務(wù)器托管,其能夠?qū)崿F(xiàn)對數(shù)據(jù)進行收集、匯總、解析、排序、分析等全套處理流程,實現(xiàn)對工業(yè)數(shù)據(jù)進行流水線式的實時分析能力,并在分析過程中充分考慮機理邏輯、流程關(guān)系、活動目標、商業(yè)活動等特征和要求。因此可作為工業(yè)大數(shù)據(jù)分析中的智能化體系的核心。
CPS 的5C 架構(gòu)
工業(yè)大數(shù)據(jù)正是以行業(yè)模型為前提,將面向不同行業(yè)、不同場景、不同學(xué)科中的工業(yè)機理、專家經(jīng)驗、行業(yè)知識和最佳實踐固化成為數(shù)據(jù)統(tǒng)計、挖掘和分析模型,將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)可解的問題;以數(shù)據(jù)科學(xué)為基礎(chǔ),使得深度學(xué)習(xí)、遷移學(xué)習(xí)、強化學(xué)習(xí)等為代表的人工智能算法成為解決工業(yè)大數(shù)據(jù)領(lǐng)域診斷、預(yù)測與優(yōu)化問題的得力工具;以軟件服務(wù)為目的,形成可落地執(zhí)行的工業(yè)大數(shù)據(jù)解決方案。