2019(第二屆)中國金融科技產業峰會于10月31日在北京國際會議中心正式開幕。星環信息科技(上海)有限公司創始人 、CEO孫元浩在會上做專題發言。
前面幾位嘉賓更多的從金融的角度來闡述了金融科技的一些現狀和未來的發展趨勢。我就從技術角度,因為星環科技是技術公司,從技術角度分析一下新的技術在金融行業的一個應用現狀。
首先介紹一下星環科技,我們是一家創業公司,2013年成立,專注做大數據的核心計算引擎、存儲引擎以及AI的分析工具,包括容器化的云的基礎設施這一塊,這三大產品已經在20多個行業已經有1600多個客戶在使用了。
大數據技術的話,是在去年的時候,美國一個知名分析機構把它分成三代,它是從兩個維度分析的,第一個維度是從開發的容易程度,從早期大數據、人工智能技術最早在互聯網公司、在大型科技公司他們有比較大的IT合作研發團隊,作為一個技術還不是作為一個產品在使用,它的管理也是非常復雜的,通常規模也是比較大,服務器租用,幾千臺到上萬臺的規模。到了2.0的時代這個技術逐漸開始產品化,開始有更多的企業在使用了,特別是500強企業在使用這個技術了。但是這個技術仍然過于復雜,對客戶的要求非常高。到了3.0的時代,這個也是市場的一個需求,大家希望這個技術能夠開發越來越容易,甚至業務人員不是IT人員都能使用大數據和人工智能的技術,可以通過微服務和通過云的方式對外提供,從這個意義上來說,從運維和開發的難易程度來看國外的分析機構把大數據分成了這三代。今天我們正處在第三代的過程中,技術越來越成熟,產品的應用型也越來越強。
我們還是從開發和使用的角度來看,從技術本身來看,我們認為它已經引進了下一代了,同樣的一個特點是讓我們要讓這個技術更容易使用,讓更多人使用這個技術。我們如果去分析這個數據處理它的應用場景的話,我們分為兩大類,一類是交易型、一類是分析型,總共有九類應用場景,從在線交易、實時計算、在線分析、數據倉庫、數據集市、NoSQL分析、預測性分析、視頻語音文本分析、數據探索。面臨這不同的應用場景我們認為應該有統一的數據操作語言和查詢語言,今天主要是SQL。同時在SQL當中也增加了機器學習。今天用機器學習的還有R/Python語言等等語言進行機器學習和深度學習,未來可能會有融合的語言出現,語言統一的話可以迅速標準化,能夠讓更多人使用。
同時我們認為計算引擎也在進行融合,未來也會出現統一的計算引擎。今天分成兩大類,一大類是數據計算引擎,主要做統計分析,做數據相關的操作,另外是深度學習引擎,主要是用于視頻、圖象、文本的分析,未來有可能兩者會統一。統一資料引擎已經把各類數據庫囊括在里面,包括實時處理和圖文計算都統一掉了,未來有可能其他方面也會被統一掉。
下面一層會有不同的存儲機構體現在不同的數據庫,只不過他們存儲引擎不同、存儲模式不同,但是計算引擎是相同的。我們這里列出了有七種不同的數據結構,未來很長一段時間內隨著發展它們不大會被統一,因為受制于現代硬件和未來硬件的發展的局限性。但是下面我們認為應該有一個統一的分布式存儲管理系統,同時資源調度、CPU內存、網絡、I/O的操作調度也應該被統一掉。我們認為未來數據處理的技術特征應該是有四成是被統一掉的,只有存儲層是不同的,這樣使得整個的數據的開發和使用都會極大的簡化。
這里簡單介紹一下從大數據技術來說、從星環自身角度來看,我們過去也是在改造這個開源技術的,從2013開始到2015年我們都在改造這個開源技術,2014年底,我們發現金融客戶的需求越來越高,比如需要數據的一致性,對數據數據一致性要求非常高,高于任何其他行業,同時對實時處理要求越來越高,需要做實時風控、實時營銷、實時定價等,數據量比較大,因為中國金融企業面向的客戶都是C端的客戶,美國站群服務器,數據量非常龐大,一家銀行一家股份銀行城商行的用戶超過美國全國的用戶。對大數據的處理需求非常迫切,使得星環不停地在重構整個軟件站,今天我們在存儲引擎層、計算引擎層,在編譯器層實現了統一,都完成了重構,國內一些需求使得我們開始領先美國同類廠商一到兩年的時間。
我們回過頭來看金融行業大數據的分析,我們今天大概有200多家金融客戶,把他們分析下來,基本上按照使用技術階段分成五個階段:第一階段,大家先開始用數據平臺存儲、收集各種類型的數據,匯集各種業務的數據,提供數據的查詢服務,這是第一步。第二步開始利用新的技術來做統計分析,來做數據探索,這步主要可能應用的場景一個是運營分析、一個是監管報錯,同時外部數據進來以后可以做一些數據探索,能夠對風險、對客戶的畫像更加精準。第三步有部分金融機構開始利用分析結果來預測業務,比如說獲取更多的客戶、制定貸款的價格,第三步已經開始進入到業務中去了,但是依然是離線過程、輔助決策過程。第四步有些金融公司利用分析結果實時切入到核心交易系統中去用來做實時風險定價,甚至直接利用基礎的分布式交易系統,這一步業務開始使用新技術,切入到核心交易系統中。今天我們看到有不少金融機構的開戶、消費貸款業務、實時的推送都已經在使用這個新的技術了。到第五步的時候我們看到隨著深度學習技術的發展,在智能客服、在智能營銷、在智能化風險這塊也開始嘗試新技術了,這部分我們看到有一些少量嘗試,但是不是還很普遍,我們大致把應用過程分成這五個階段,基本上現在客戶使用新技術走了這樣五步過程,處理從P處理慢慢走到了實時。