11月6日,騰訊Techo開發者大會在北京召開。會上,騰訊云副總裁、云架構平臺部總經理謝明首次對外披露了騰訊基礎設施演進與創新歷程。他介紹,在微信、QQ等國民級業務不斷發展的背后,包括服務器、網絡、IDC、計算、存儲、數據庫等在內的基礎設施和技術架構一直在不斷進化,目前已經進入“生而為云”的新階段。
騰訊今年在基礎設施建設方面迎來了重要里程碑。其中,騰訊全網服務器總量超過100萬臺,是中國首家服務器總量超過百萬的公司,也是全球五家服務器數量過百萬的公司之一。騰訊網絡帶寬峰值也突破100T,是中國第一家達到100T的公司。
謝明表示,在云時代,騰訊基礎架構還將繼續通過自研、定制化等手段,向極致彈性和智能化的方向進化。
基礎架構升級演進,實現降本增效
隨著騰訊業務發展,服務器、網絡、IDC、計算、存儲、數據庫等基礎架構也在不斷演化。
在服務器方面,騰訊走過了早年使用通用服務器到定制服務器,再到目前推出自研服務器的路徑。謝明介紹,出于對服務器性能、成本、安全性等方面更高的需求,騰訊云啟動了自研服務器的進程。騰訊自研服務器星星海采用可信鏈傳遞的硬件防篡改能力、先進的熱虹吸管散熱技術以及精細化的風道設計和風扇控制,實現了TCO降低30%、負載能效提升50%、實例綜合性能提升35%。
騰訊數據中心則在高速化、規模化、集約化、智能化方面不斷取得突破。謝明提到,騰訊云第四代數據中心T-Block按照搭積木的方式,美國服務器租用,實現了全數據中心的模塊化配置及快速建設,相比于傳統大規模數據中心,現場施工周期縮短一半,自然冷卻技術可以將PUE降低至業界領先的1.2以下。采用T-Block方案,一個擁有30萬臺服務器的園區一年可節省2.5億度電。
隨著全球化業務的快速發展,騰訊也在網絡層面不斷精進。目前,騰訊已經與全球超過800家運營商建立了網絡互連。同時,騰訊還基于SDN和NFV自研分布式路由器集群替換傳統商業大型路由器,實現全網所有的軟件路由器的集中管控,能做到根據目的IP做單個用戶的流量調度;通過構建開放光網絡,基于SONiC自研交換機等,將網絡設備TCO下降20%+。
針對云上用戶計算資源獲取需求,騰訊云云計算操作系統VStation目前做到了每分鐘交付千臺虛擬機的能力,使得一個中等規模公司的計算需求可以快速得到滿足。同時,騰訊通過DPDK、智能網卡等軟硬件方案,將網絡、存儲等IO消耗卸載到硬件上,實現了虛擬機零損耗和虛擬機之間的零干擾。
在存儲方面,騰訊早在2006年便針對Q-zone相冊業務場景自研了分布式存儲TFS,支持了Qzone相冊每天億級別的圖片上傳。目前,騰訊云對象存儲COS實現了集群全體節點參與系統吞吐,磁盤利用率達到90%以上,同時系統的完全自治也大幅降低了運維的人工投入。
數據庫的演進也與騰訊業務發展節奏一脈相承。從最早的MySQL開始,經歷QQ、Q-zone等業務爆發增長的騰訊逐漸選擇了數據庫自研路線。目前,騰訊云也通過開源托管、商業合作、自主研發三管齊下,提供了接近20種數據庫產品,讓用戶從選云、上云、用云全流程暢通無阻,獲取最佳體驗。
追求極致彈性,智能化實現技術普惠
隨著云計算的快速發展,云計算用戶對對資源管理粒度、資源調度和隔離能力以及計算/存儲解耦的技術架構都提出了更高的要求。謝明將這種更高的要求稱之為“極致彈性”。
謝明認為,極致彈性首先是性能和容量要既能幫助大客戶扛住業務洪峰,又能讓小客戶不浪費一分錢,需要對計算、存儲、網絡資源進行細粒度的劃分。其次,需要通過提升庫存管理和調度能力以及相應的產品能力,真正做到按使用量計費。最后是快速的交付能力,需要計算、存儲等各類資源能夠充分解耦,滿足秒升秒降、快上快下的要求。
騰訊云的基礎產品也在朝極致的彈性方向努力。其中,騰訊云打造的第三代通用計算平臺無服務函數計算能夠提供更好的彈性能力,真正意義上做到資源使用率100%,用戶相應成本下降50%以上。值得一提的是,騰訊云通過函數并發監控數據實時計算,提前擴容,使函數冷啟動率降低到萬分之一以內。而自研的輕量級虛擬化技術,能在35ms內啟動一臺虛擬機,創造了業界目前能最快啟動一臺虛擬機的記錄,這一技術還被穩定應用于“小程序·云開發”。