欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

歡迎來到云服務(wù)器

云資訊

黃文堅(jiān):人工智能在fintech的應(yīng)用

中國IDC圈7月20日?qǐng)?bào)道,7月20日,“2017中國行業(yè)云計(jì)算峰會(huì)—金融云”(C9峰會(huì))在北京國貿(mào)大酒店(國貿(mào)三期)隆重召開。本次大會(huì)由中國信息通信研究院指導(dǎo),云計(jì)算發(fā)展與政策論壇、數(shù)據(jù)中心聯(lián)盟、云計(jì)算開源產(chǎn)業(yè)聯(lián)盟主辦,云計(jì)算發(fā)展與政策論壇用戶委員會(huì)承辦、CloudBest、中國IDC圈、網(wǎng)貸之家協(xié)辦,并受到諸多媒體的大力支持。

2017中國行業(yè)云計(jì)算峰會(huì)—金融云”作為國內(nèi)金融與云計(jì)算領(lǐng)域最具影響力的大會(huì),引來現(xiàn)場(chǎng)人員爆滿,大會(huì)全面覆蓋云計(jì)算、金融、人工智能區(qū)塊鏈、大數(shù)據(jù)等多個(gè)領(lǐng)域。

會(huì)上,PPmoney萬惠集團(tuán)大數(shù)據(jù)算法總監(jiān)黃文堅(jiān)出席本次大會(huì)并發(fā)表主題為《人工智能在fintech的應(yīng)用》的演講。

黃文堅(jiān):人工智能在fintech的應(yīng)用

PPmoney萬惠集團(tuán)大數(shù)據(jù)算法總監(jiān)  黃文堅(jiān)

以下是演講實(shí)錄:

大家好,今天我給大家講人工智能,尤其深度學(xué)習(xí)和TensorFlow在fintech中的應(yīng)用。我們公司叫PPmoney,是國內(nèi)最早一批將人工智能應(yīng)用在金融科技領(lǐng)域的企業(yè),現(xiàn)在非常流行現(xiàn)金貸的產(chǎn)品業(yè)務(wù),國內(nèi)可能有上千家,大家競(jìng)爭的點(diǎn)比較趨同,最核心的競(jìng)爭力還在風(fēng)控這塊。現(xiàn)在使用傳統(tǒng)的人工審核或者專家做一些專家規(guī)則的方式已經(jīng)不行了,目前業(yè)內(nèi)做得比較好的幾家,像量化派都是使用人工智能的風(fēng)控模型來做的,非常適合在風(fēng)控上有一個(gè)發(fā)展。PPmoney的理財(cái)平臺(tái)每年可以募集資金300億左右,現(xiàn)金貸的產(chǎn)品、PPmoney理財(cái)、挖牛等。
      為什么要在金融科技中使用深度學(xué)習(xí)?金融數(shù)據(jù)中很多是交易日志或者銀行流水、股票K線數(shù)據(jù),這種數(shù)據(jù)叫時(shí)間序列數(shù)據(jù),跟傳統(tǒng)的做機(jī)器學(xué)習(xí)問題的靜態(tài)信息的數(shù)據(jù)不太一樣,這種時(shí)間序列的數(shù)據(jù)特別適合使用深度學(xué)習(xí),尤其是卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)來處理。我們傳統(tǒng)做的一些專家規(guī)則和行業(yè)分析,對(duì)這么大量的數(shù)據(jù)找到規(guī)律這是不容易實(shí)現(xiàn)、很難做到的。金融數(shù)據(jù)中很多非結(jié)構(gòu)化的數(shù)據(jù),比如我們有很多文本的數(shù)據(jù),財(cái)經(jīng)新聞中對(duì)某公司的點(diǎn)評(píng),不管對(duì)銀行放貸還是對(duì)個(gè)人征信、預(yù)測(cè)股票漲跌都非常有用。使用傳統(tǒng)方法是很難做這個(gè)問題的,人工智能深度學(xué)習(xí)可以很好的把這塊數(shù)據(jù)利用起來。LSTM和Word2Vec最適合處理文本數(shù)據(jù),后面會(huì)簡單說一下它的應(yīng)用。
      金融數(shù)據(jù)很多很復(fù)雜的業(yè)務(wù)邏輯,比如我們?cè)阢y行貸款的業(yè)務(wù)中,怎么評(píng)價(jià)貸款的客戶是不是有比較強(qiáng)的償還能力,有沒有欺詐的風(fēng)險(xiǎn),需要業(yè)內(nèi)專家來分析的話非常困難,而且要總結(jié)出很多經(jīng)驗(yàn)規(guī)律,最后效果也不一定很準(zhǔn)。很抽象的邏輯概念和經(jīng)驗(yàn)對(duì)使用人工智能來說是不需要的,我們都是從數(shù)據(jù)中進(jìn)行學(xué)習(xí),所以你只要給我足夠多的數(shù)據(jù)我們可以很大程度的減少對(duì)業(yè)務(wù)專家的需求。第四,大數(shù)據(jù)的應(yīng)用效率比較高,當(dāng)前這個(gè)環(huán)境下數(shù)據(jù)的積累量越來越多,我們最近兩年積累了之前所有數(shù)據(jù)80%的量,是最近兩年產(chǎn)生的,后面的數(shù)字會(huì)越來越多。現(xiàn)在是任何一個(gè)行為操作或者記錄都會(huì)被數(shù)據(jù)記錄下來的時(shí)代,對(duì)大量數(shù)據(jù)的挖掘和應(yīng)用是未來一個(gè)勢(shì)。深度學(xué)習(xí)這個(gè)模型對(duì)數(shù)據(jù)的利用率很高,比如傳統(tǒng)機(jī)器學(xué)習(xí)的算法,像國際回歸等傳統(tǒng)金融中使用的模型,當(dāng)你有幾百萬條樣本的時(shí)候模型擬合能力就達(dá)到上線了,提供更多的樣本并不會(huì)產(chǎn)生很好的表現(xiàn),但對(duì)深度學(xué)習(xí)來說從幾百萬樣本一直提升到幾億、幾十億的樣本量都有持續(xù)的提升過程。對(duì)銀行、金融機(jī)構(gòu)、保險(xiǎn)、券商、理財(cái)平臺(tái)來說,大量的數(shù)據(jù)就是它至關(guān)重要的財(cái)富,把這些利用起來就能產(chǎn)生很高的價(jià)值。
      目前人工智能最好的實(shí)踐是谷歌在兩年前開源的TensorFlow,阿爾法狗底層的平臺(tái)是TensorFlow,目前美國大量公司使用的框架是TensorFlow,它是目前排名第一的框架,同時(shí)有谷歌200多人的研發(fā)團(tuán)隊(duì),產(chǎn)品質(zhì)量和代碼質(zhì)量都非常高,支持的功能極其豐富,是目前最好的選擇。我本人也是TensorFlow的開發(fā)者之一,今年初出版了一本書叫《TensorFlow實(shí)戰(zhàn)》,出版之后一個(gè)月內(nèi)是計(jì)算機(jī)類數(shù)據(jù)銷量榜第一名,可見人工智能和TensorFlow是目前業(yè)界非常火的領(lǐng)域。
      深度學(xué)習(xí)和TensorFlow怎么應(yīng)用到金融的具體問題中。先看一下金融預(yù)測(cè)的模型,我們可以使用人工智能來解決信貸審批或者風(fēng)控的問題。在傳統(tǒng)的金融問題中,如果放貸金額特別大,幾千萬以上、幾萬或者幾千的量,很難讓金融專家一條一條審核,因?yàn)榱繉?shí)在太多了,目前一些小的現(xiàn)金貸一天會(huì)有幾千幾萬的量,他們做的效果也不如機(jī)器自動(dòng)化的水平。人工經(jīng)驗(yàn)沒有一個(gè)數(shù)據(jù)的佐證的支持很難判斷每條規(guī)則的有效性,同時(shí)多條規(guī)則之間怎么組合才能最大化效果。使用機(jī)器學(xué)習(xí),全自動(dòng),節(jié)約大量的人工成本,不再需要普通的信審員節(jié)約幾千幾百個(gè)崗位,準(zhǔn)確率比較高,我們也做了測(cè)試,相比使用人工來做準(zhǔn)確率的提升幅度很大,后面會(huì)有一些具體的數(shù)字。
     金融這個(gè)行業(yè)變化比較快,不同時(shí)間周期內(nèi)的規(guī)律非常不明顯,每當(dāng)有新的現(xiàn)象新的規(guī)律發(fā)生的時(shí)候,人工可能很難跟上,但機(jī)器通過最新的樣本很快識(shí)別到這些形態(tài)和樣式進(jìn)行自適應(yīng)。我們也不需要像人工專家規(guī)則去構(gòu)思很多條件,如果我的客戶有夜間通話或者最近流水額比較低,我認(rèn)為他償還能力不夠,可以避免人工構(gòu)思的情況。看一個(gè)具體的例子,五大行之一總行有一個(gè)POS貸的業(yè)務(wù),針對(duì)一個(gè)商戶的POS機(jī)的流水作為授信額度的主要考核依據(jù)。這個(gè)貸款業(yè)務(wù)剛上線的時(shí)候沒有經(jīng)過任何風(fēng)控模型,原始不良率4%,銀行不能接受,銀行要求2%左右,請(qǐng)了專家篩選把不良率降到2%,但通過的審核率只有26%,有將近3/4的客戶被篩掉了,如果使用深度學(xué)習(xí)的方法的話,我們可以做到將不良率降到2%的同時(shí),審核通過率還有77%,我們篩掉的20%多的客戶里最壞的這批客戶,篩掉他們之后不良率的下降非常明顯,精準(zhǔn)的將不良客戶識(shí)別出來。
    審批率通過了,放款業(yè)務(wù)量增大3倍,這個(gè)業(yè)務(wù)的營收額和收益都相應(yīng)的增大3倍。對(duì)于這種貸款問題,最大的核心就是要積累足夠的樣本量,需要足夠多的字段,銀行可以通過銀聯(lián)拿到商戶的交易流水信息和運(yùn)營商授權(quán)的通話信息、過往的銀行的流水、貸款的記錄,所有這些特征會(huì)有幾百個(gè),我們使用深度學(xué)習(xí)的算法將它衍生到幾千甚至幾萬的特征,自動(dòng)讓模型算法做化,識(shí)別哪些條件和哪些條件組合的時(shí)候會(huì)有比較明顯的逾期現(xiàn)象,通過這樣的算法自動(dòng)能實(shí)現(xiàn)很好的預(yù)測(cè)精度。
      我們算法中心也會(huì)做AB Test,當(dāng)有新的數(shù)據(jù)過來我們訓(xùn)練新的模型的時(shí)候,新的特征過來我們訓(xùn)練新的模型的時(shí)候,我們可以對(duì)比確定新改進(jìn)的方法有沒有效果,不像傳統(tǒng)的規(guī)則篩選之后并不知道哪條規(guī)則比較有效,這些規(guī)則哪些是正向的,哪些是負(fù)向的,這些都搞不清楚,這樣問題就很大。使用自動(dòng)化的人工智能的模型來解決這個(gè)問題效果就非常好。
     另外一個(gè)例子是保險(xiǎn)復(fù)購的預(yù)測(cè),很多保險(xiǎn)公司比如中國人保、泰康人壽,他們對(duì)復(fù)購客戶的依賴是很大的,平常會(huì)有3%的客戶進(jìn)行復(fù)購,這些客戶是推廣運(yùn)營商成本比較低的,相對(duì)來說比較優(yōu)質(zhì)。這里的復(fù)購一般指他給自己購買保險(xiǎn)之后給他的親屬或者關(guān)系很緊密的人再購買第二份保險(xiǎn),我們這邊做的模型是預(yù)測(cè)哪些現(xiàn)有客戶他在第二年會(huì)進(jìn)行一個(gè)復(fù)購。最后做到的效果,預(yù)測(cè)出來的名單里有50%的人都進(jìn)行了復(fù)購,相對(duì)原始只有3%的復(fù)購率,提升是非常明顯的。使用的信息,用戶的靜態(tài)信息,比如收入、年齡、職業(yè)、家庭住址、險(xiǎn)種信息。還有時(shí)間序列的數(shù)據(jù),像交易的行為、保全行為、會(huì)員行為等等。關(guān)系的信息,他跟其他親戚朋友是怎樣一個(gè)關(guān)聯(lián),他有沒有其他的親戚有購買保險(xiǎn)的行為,有沒有團(tuán)單的行為。
      這幾部分不同的數(shù)據(jù)我們會(huì)使用不同的方法進(jìn)行處理,比如靜態(tài)信息和關(guān)系信息,這些我們會(huì)使用全鏈接的網(wǎng)絡(luò)進(jìn)行處理,時(shí)間序列的信息我們會(huì)使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行處理。復(fù)購的主要預(yù)測(cè)目標(biāo)是個(gè)人和家族在下一個(gè)時(shí)間節(jié)點(diǎn)復(fù)購概率,目標(biāo)是定向,向有高價(jià)值的潛在客戶營銷,比如我們給出來的名單中可能有一半都會(huì)進(jìn)行復(fù)購的預(yù)測(cè),如果定點(diǎn)向這些人營銷能取得非常好的效果,可以大量節(jié)約業(yè)務(wù)人員的工作時(shí)間,提高效率。
      我們有不同種類的信息,普通靜態(tài)的信息我們使用全連接的方式連接,時(shí)間序列我們采用單獨(dú)的方式連接,韓國云服務(wù)器 美國云主機(jī),把這兩個(gè)信息連接在一起做分類和回歸的預(yù)測(cè),輸出客戶下一個(gè)時(shí)間節(jié)點(diǎn)復(fù)購概率的高低。
     基金公司,我們?cè)诩訒r(shí)基金那邊有一個(gè)項(xiàng)目,加時(shí)基金是管理3千億資產(chǎn)規(guī)模的基金公司,其中有很多大客戶,公募主要是收取管理費(fèi),對(duì)他管理的資產(chǎn)規(guī)模非常敏感,他想提前知道客戶的申購和贖回的行為并采取一些應(yīng)對(duì)措施。如果有上億資產(chǎn)規(guī)模的大客戶要贖回的話,對(duì)他收益會(huì)有一個(gè)非常大的影響。我們的大客戶做了這樣一個(gè)預(yù)測(cè),分為兩種,一種是貨幣基金,申購和贖回的現(xiàn)象比較頻繁,對(duì)這種問題我們能做到基準(zhǔn)的準(zhǔn)確率的3-4倍的效率。比如他每個(gè)季度會(huì)有10%的人產(chǎn)生贖回的行為,我們給出來的名單預(yù)測(cè)出來有40%的人會(huì)產(chǎn)生贖回。另外部分是比較關(guān)鍵的普通基金非貨幣基金,股票型、債券型持有期限比較長,一旦贖回就不會(huì)再次回到這里,這樣管理費(fèi)的贖回就會(huì)有很大的問題。對(duì)這種基金我們可以做到20-30倍的漁村準(zhǔn)確率。基金在每個(gè)季度會(huì)有3-5%的贖回率,預(yù)測(cè)出來的結(jié)果會(huì)到30-40%。這些人群就是高危人群,其中大的客戶需要重點(diǎn)關(guān)注,我們將這些客戶的意圖識(shí)別出來,提前給他一些優(yōu)惠或者工作,可以盡量避免這部分資金的流失。我們使用到的數(shù)據(jù)量比較多,歷史申購贖回的交易記錄、客戶的信息、對(duì)基金APP的使用,最近購買基金的表現(xiàn),會(huì)提取出5000多個(gè)特征,靜態(tài)信息使用全連接的處理,時(shí)間序列信息使用循環(huán)神經(jīng)網(wǎng)絡(luò)的處理,最后取得了非常良好的效果。
     通過TensorFlow實(shí)現(xiàn)全連接的神經(jīng)網(wǎng)絡(luò),7行代碼,在金融的問題中對(duì)數(shù)值型和種類型清楚的數(shù)據(jù)使用全連接的神經(jīng)網(wǎng)絡(luò)。輿情分析在很多地方都會(huì)使用到,尤其一些大型的金融機(jī)構(gòu),銀行給大型的客戶貸款之前,客戶可能有幾千萬或者幾億的授信額度,要對(duì)企業(yè)綜合考量,看最近有沒有負(fù)面新聞或者法院判決不力的信息,如果從網(wǎng)上人工搜集信息是不太全面,不太準(zhǔn)確的,同時(shí)速度很慢。如果將它做成自動(dòng)化的效果,我們會(huì)從全網(wǎng)抓取所有的跟這些公司相關(guān)的新聞,一個(gè)公司會(huì)出來幾千甚至上萬條的新聞,我們?cè)賹?duì)中間每一條新聞做一個(gè)正面負(fù)面中性的輿情分類,有了這個(gè)分類之后我們可以對(duì)這個(gè)公司整體的發(fā)展?fàn)顩r做一個(gè)評(píng)估,directadmin安裝 directadmin漢化,如果它的負(fù)面新聞的比例過高超過15%或者是多少,這個(gè)風(fēng)險(xiǎn)就比較大。如果他負(fù)面新聞很少正面新聞很多的話,那是比較放心的企業(yè)。
      中文分詞之后做Word2Vec、RNN(LSTM、GRU)、輿情分類。我們有很多券商的分析員對(duì)公司的研究報(bào)告,之前要讀大量的關(guān)于公司的新聞,除了做輿情分析,估計(jì)公司整體的輿情現(xiàn)象,同時(shí)還要對(duì)比較關(guān)鍵的新聞進(jìn)行閱讀,怎么一開始就把幾萬字的報(bào)告濃縮成幾段話的文章,讓分析員判斷文章的主旨思想,這邊有一個(gè)概要生成的算法。概要生成的算法在傳統(tǒng)實(shí)踐中有抽取的方式,它會(huì)對(duì)很長的文章抽取其中最重要的幾個(gè)句子,5-10句,在文章中做了一個(gè)page 1,類似谷歌搜索,再將這十句話進(jìn)行總結(jié),都是原文中出現(xiàn)的一模一樣的句子只是對(duì)重要性進(jìn)行提取。
     使用深度學(xué)習(xí)完全抽象生成的方法,它會(huì)嘗試?yán)斫庹恼碌暮x,將每段每個(gè)大篇章轉(zhuǎn)換成1-2句的總結(jié),這個(gè)算法主要是基于谷歌的開源的算法,基于注意力模型的抽象語句的總結(jié)。這個(gè)算法在前端有一個(gè)encoder后端有一個(gè)decoder,encoder做的是語言模型,將很長的文章轉(zhuǎn)化成很短的文章,訓(xùn)練用到的語料是網(wǎng)上大量新聞以及人工手寫的摘要或者標(biāo)題,使用這些數(shù)據(jù)來看人是怎么總結(jié)長篇文章變成幾句話的短的概要,通過學(xué)習(xí)轉(zhuǎn)化的過程構(gòu)建了一個(gè)轉(zhuǎn)換的語言模型,后端的decoder會(huì)嘗試解析原文,將原文使用語言模型轉(zhuǎn)化成簡短的總結(jié)。概要生成對(duì)英文的文章來說已經(jīng)能做到很不錯(cuò)的效果,中文文章中目前效果可以令人滿意,可以再逐步提高一些。
     研究報(bào)告的自動(dòng)生成,前面我們提到了我們可以分析大量的文本輿情,同時(shí)還可以對(duì)某一些重要新聞做一個(gè)總結(jié)性的概要,我們有沒有可能直接把所有關(guān)于這個(gè)公司的新聞匯總到自動(dòng)生成報(bào)告,其實(shí)目前是有的,而且在美國歐洲已經(jīng)有好幾家公司提供自動(dòng)報(bào)告生成的服務(wù),很多比較初級(jí)的信息整理或搜集的業(yè)務(wù)就不再需要入門級(jí)的分析員研究員,人類可以得到一定程度的解放,可以做一些目前還做不了的更抽象的分析任務(wù),對(duì)公司戰(zhàn)略或者其他層面的考量分析。這塊也會(huì)使用到很多人工智能的算法,它首先要有自然語言理解,這是對(duì)所有公司相關(guān)新聞或者報(bào)告內(nèi)容的抽取、語義的解析,同時(shí)還需要自然語言生成的算法。這幾個(gè)算法在TensorFlow中都有相應(yīng)的實(shí)現(xiàn)。目前自動(dòng)報(bào)告的生成大部分是基于模板,會(huì)有一個(gè)特定的格式,將網(wǎng)上爬取到的信息使用人工智能的方法分析之后,按模板填充起來最后生成這樣一個(gè)報(bào)告。這幾個(gè)例子是在TensorFlow中實(shí)現(xiàn)NLP常用的自然語言處理算法的例子,比較簡單,雖然人工智能在其他領(lǐng)域的應(yīng)用還有一點(diǎn)距離,但是在金融領(lǐng)域是第一個(gè)落地的,正好適合在金融有大量數(shù)據(jù)同時(shí)對(duì)結(jié)果非常敏感,比如在貸款業(yè)務(wù)中我的盈利空間只有3-4%,我的逾期壞賬率降低1%那就很好,使用深度學(xué)習(xí)方法可以節(jié)約大量分析員的人力。
      目前來看人工智能非常適合在金融科技中應(yīng)用,已經(jīng)在很多領(lǐng)域都發(fā)生了很重要的改變,前段時(shí)間高盛將600多名交易員全部換成了機(jī)器自動(dòng)交易的算法,未來會(huì)有更多金融相關(guān)領(lǐng)域可以被算法以及模型自動(dòng)化的替代,降低成本,提高工作的效率,比如對(duì)貸款逾期預(yù)測(cè)得更準(zhǔn)。


今天我的演講就到這里,謝謝大家。

騰訊云代理

Copyright © 2003-2021 MFISP.COM. 國外vps服務(wù)器租用 夢(mèng)飛云服務(wù)器租用 版權(quán)所有 ? 粵ICP備11019662號(hào)

主站蜘蛛池模板: 巩留县| 蕉岭县| 察哈| 霍林郭勒市| 土默特右旗| 武威市| 涡阳县| 方山县| 凤山市| 缙云县| 保康县| 炎陵县| 民县| 常德市| 定西市| 嘉鱼县| 旺苍县| 申扎县| 安远县| 东台市| 正宁县| 罗定市| 莱州市| 邳州市| 佛教| 勐海县| 通化县| 社旗县| 崇左市| 浪卡子县| 淅川县| 江门市| 沂南县| 海淀区| 黑山县| 宜春市| 镇坪县| 孙吴县| 郸城县| 上犹县| 定州市|