A 具有四大基本特征
金融業(yè)基本是全世界各個行業(yè)中最依賴于數(shù)據(jù)的,而且最容易實現(xiàn)數(shù)據(jù)的變現(xiàn)。全球最大的金融數(shù)據(jù)公司Bloomberg在1981年成立時“大數(shù)據(jù)”概念還沒有出現(xiàn)。Bloomberg的最初產品是投資市場系統(tǒng)(IMS),主要向各類投資者提供實時數(shù)據(jù)、財務分析等。
隨著信息時代降臨,1983年估值僅1億美元的Bloomberg以30%股份的代價換取美林3000萬美元投資,先后推出Bloomberg Terminal、News、Radio、TV等各類產品。1996年Bloomberg身價已達20億美元,并以2億美元從美林回購了10%的股份。2004年Bloomberg在紐約曼哈頓中心建成246米摩天高樓。到2008年次貸危機,新加坡云主機 香港云主機,美林面臨崩盤,其剩余20%的Bloomberg股份成為救命稻草。Bloomberg趁美林之危贖回所有股份,估值躍升至225億美元。2016年Bloomberg全球布局192個辦公室,擁有1.5萬名員工,年收入約100億美元,估值約1000億美元,超過同年市值為650億美元的華爾街標桿高盛。
大數(shù)據(jù)概念形成于2000年前后,最初被定義為海量數(shù)據(jù)的集合。2011年,美國麥肯錫公司在《大數(shù)據(jù)的下一個前沿:創(chuàng)新、競爭和生產力》報告中最早提出:大數(shù)據(jù)指大小超出典型數(shù)據(jù)庫軟件工具收集、存儲、管理和分析能力的數(shù)據(jù)集。
具體來說,大數(shù)據(jù)具有四大基本特征:
一是數(shù)據(jù)體量大,指代大型數(shù)據(jù)集,一般在10TB規(guī)模左右,但在實際應用中,很多企業(yè)用戶把多個數(shù)據(jù)集放在一起,已經形成了PB級的數(shù)據(jù)量。
二是數(shù)據(jù)類別大,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結構化數(shù)據(jù)范疇,囊括了半結構化和非結構化數(shù)據(jù)。現(xiàn)在的數(shù)據(jù)類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數(shù)據(jù)。
三是處理速度快,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實時處理。數(shù)據(jù)處理遵循“1秒定律”,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息。
四是數(shù)據(jù)的真實性高,隨著社交數(shù)據(jù)、企業(yè)內容、交易與應用數(shù)據(jù)等新數(shù)據(jù)源的興起,傳統(tǒng)數(shù)據(jù)源的局限被打破,信息的真實性和安全性顯得極其重要。
而相比其他行業(yè),金融數(shù)據(jù)邏輯關系緊密,安全性、穩(wěn)定性和實時性要求更高,通常包含以下關鍵技術:數(shù)據(jù)分析,包括數(shù)據(jù)挖掘、機器學習、人工智能等,主要用于客戶信用、聚類、特征、營銷、產品關聯(lián)分析等;數(shù)據(jù)管理,包括關系型和非關系型數(shù)據(jù)、融合集成、數(shù)據(jù)抽取、數(shù)據(jù)清洗和轉換等;數(shù)據(jù)使用,包括分布式計算、內存計算、云計算、流處理、任務配置等;數(shù)據(jù)展示,包括可視化、歷史流及空間信息流展示等,主要應用于對金融產品健康度、產品發(fā)展趨勢、客戶價值變化、反洗錢反欺詐等監(jiān)控和預警。
“互聯(lián)網(wǎng)+”之后,隨著世界正快速興起“大數(shù)據(jù)+”,金融行業(yè)悄然出現(xiàn)以下變化:
大數(shù)據(jù)特征從傳統(tǒng)數(shù)據(jù)的“3個V”增加到“5個V”。在數(shù)量(Volume)、速度(Velocity)、種類(Variety)基礎上,進一步完善了價值(Value)和真實性(Veracity),真實性包括數(shù)據(jù)的可信性、來源和信譽、有效性和可審計性等。
金融業(yè)按經營產品分類變?yōu)榘催\營模式分類。傳統(tǒng)金融業(yè)按經營產品劃分為銀行、證券、期貨、保險、基金五類,隨著大數(shù)據(jù)產業(yè)興起和混業(yè)經營的發(fā)展,現(xiàn)代金融業(yè)按運營模式劃分為存貸款類、投資類、保險類三大類別。
大數(shù)據(jù)市場從壟斷演變?yōu)槌浞质袌龈偁帯H虼髷?shù)據(jù)市場企業(yè)數(shù)量迅速增多,產品和服務的差異增大,技術門檻逐步降低,市場競爭日益激烈。行業(yè)解決方案、計算分析服務、存儲服務、數(shù)據(jù)庫服務和大數(shù)據(jù)應用成為市場份額排名最靠前的五大細分市場。
大數(shù)據(jù)形成新的經濟增長點。Wikibon數(shù)據(jù)顯示,2016年,全球大數(shù)據(jù)硬件、軟件和服務整體市場增長22%達到281億美元,預計到2027年,全球在大數(shù)據(jù)硬件、軟件和服務上的整體開支的復合年增長率為12%,將達到大約970億美元。
數(shù)據(jù)和IT技術替代“重復性”業(yè)務崗位。數(shù)據(jù)服務公司Eurekahedge通過追蹤23家對沖基金,發(fā)現(xiàn)5位對沖基金經理薪金總額為10億美元甚至更高。過去10年,靠數(shù)學模型分析金融市場的物理學家和數(shù)學家“寬客”一直是對沖基金的寵兒,其實大數(shù)據(jù)+人工智能更精于此道。高盛的紐約股票現(xiàn)金交易部門2000年有600名交易員而如今只剩兩人,其任務全由機器包辦,專家稱10年后高盛員工肯定比今天還要少。