騰訊開源再次迎來重磅項目,14日,騰訊正式宣布開源高性能圖計算框架Plato,這是在短短一周之內(nèi),開源的第五個重大項目。
相對于目前全球范圍內(nèi)其它的圖計算框架,Plato可滿足十億級節(jié)點的超大規(guī)模圖計算需求,將算法計算時間從天級縮短到分鐘級,性能全面領(lǐng)先領(lǐng)先于其它主流分布式圖計算框架,并且打破了原本動輒需要數(shù)百臺服務(wù)器的資源瓶頸,現(xiàn)在,最少只需要十臺服務(wù)器即可完成計算。
騰訊Plato團隊負責(zé)人于東海表示:“Plato已經(jīng)支持騰訊內(nèi)部包括微信在內(nèi)的眾多核心業(yè)務(wù),尤其是為騰訊超大規(guī)模社交網(wǎng)絡(luò)圖數(shù)據(jù)的各類計算提供支撐,解決了現(xiàn)有其他計算框架無法在有限資源和有限時間內(nèi)完成計算的難點。Plato不僅為騰訊創(chuàng)造了巨大的業(yè)務(wù)價值,開源后還將持續(xù)推動圖計算技術(shù)和行業(yè)的協(xié)同發(fā)展,加速創(chuàng)新。”
實際上,圖計算的“圖”并不是指普通的圖像和照片,而是用于表示對象之間關(guān)聯(lián)關(guān)系的一種抽象數(shù)據(jù)結(jié)構(gòu),圖計算就是以圖作為數(shù)據(jù)模型來表達問題并予以解決的過程。圖計算可以將不同來源、不同類型的數(shù)據(jù)融合到同一個圖里進行分析,得到原本獨立分析難以發(fā)現(xiàn)的結(jié)果,因此成為社交網(wǎng)絡(luò)、推薦系統(tǒng)、網(wǎng)絡(luò)安全、文本檢索和生物醫(yī)療等領(lǐng)域至關(guān)重要的數(shù)據(jù)分析和挖掘工具。
Plato是騰訊內(nèi)部圖計算TGraph團隊整合內(nèi)部資源自主研發(fā)的一款高性能圖計算框架,取名Plato是為了致敬偉大的數(shù)學(xué)家柏拉圖,目前騰訊云大數(shù)據(jù)團隊正在封裝Plato,即將對所有開發(fā)者開放使用。
據(jù)了解,Plato的計算性能方面極其強悍,比目前市場上最為領(lǐng)先的圖計算框架Spark GraphX還高出1-2個數(shù)量級,它將算法計算時間從天級縮短到分鐘級,性能提升數(shù)十倍,也標志著圖計算全面進入分鐘級時代;另外一個巨大優(yōu)勢是,Plato在內(nèi)存消耗方面遠小于主流的圖計算框架,比Spark GraphX減少1-2個數(shù)量級,僅需10臺服務(wù)器左右的中小規(guī)模集群,即可完成超大規(guī)模圖計算,相比此前動輒需要數(shù)百臺服務(wù)器的限制,資源壓力和計算成本都得到了極大降低。
目前,歐洲服務(wù)器,Plato主要提供兩大核心能力:騰訊數(shù)據(jù)量級下的離線圖計算和騰訊數(shù)據(jù)量級下的圖表示學(xué)習(xí)。同時Plato天然適配Kubernetes、YARN等資源調(diào)度平臺,并提供支持主流文件系統(tǒng)的多種接口,能為開發(fā)者提供更友好的運行環(huán)境。
架構(gòu)設(shè)計上,Plato框架的核心是自適應(yīng)圖計算引擎,它能夠根據(jù)不同類型的圖算法,提供多種計算模式供開發(fā)者靈活選擇,包括自適應(yīng)計算模式、共享內(nèi)存計算模式和流水線計算模式等。另外,directadmin授權(quán),還設(shè)計了良好的接口支持接入新的計算通信模式。
Plato整體架構(gòu)圖
在計算引擎之上,Plato為算法設(shè)計者或具體的業(yè)務(wù)提供多層次接口:從底層的API,到圖算法庫,再到為具體業(yè)務(wù)量身打造的“解決方案”——圖工具集。通過這些應(yīng)用層的接口和工具,Plato還可以把離線計算結(jié)果與其他機器學(xué)習(xí)算法相結(jié)合,共同支撐頂層的不同業(yè)務(wù)。
值得一提的是,目前Plato的算法庫中的圖特征、節(jié)點中心性指標、連通圖和社團識別等多種算法都已經(jīng)開源,未來還將進一步開源更多的算法。
Plato高性能、可擴展、易插拔的特性在社交網(wǎng)絡(luò)、推薦系統(tǒng)、生物醫(yī)療等領(lǐng)域應(yīng)用前景廣闊,例如定期對網(wǎng)頁進行影響力排序以提升用戶的搜索體驗、分析龐大的社交網(wǎng)絡(luò)結(jié)構(gòu)以便精準地為用戶推薦服務(wù)、通過子圖匹配等方式了解蛋白質(zhì)間的相互作用從而研制更有效的臨床醫(yī)藥等。
自去年930架構(gòu)調(diào)整以來,開源協(xié)同成為騰訊技術(shù)發(fā)展的重要戰(zhàn)略之一,并帶動了重磅項目密集對外開源。就在上周的Techo開發(fā)者大會上,騰訊正式宣布TubeMQ、Tencent Kona JDK、TBase、TKEStack四大重點項目開源。隨著Plato的開源,騰訊在開源領(lǐng)域又添大動作。據(jù)悉,騰訊已經(jīng)在Github上已經(jīng)開源了89個項目,超過1000個貢獻者參與了開源貢獻,擁有超過26萬個Star數(shù),在Github全球公司貢獻榜上居于前列。
【凡本網(wǎng)注明來源非中國IDC圈的作品,均轉(zhuǎn)載自其它媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。】