9月27日,由開放數據中心委員會主辦,百度、騰訊、阿里巴巴、中國電信、中國移動、中國信息通信研究院、英特爾承辦的“2016ODCC開放數據中心峰會”在京謹慎召開。在下午的處事器分會場上,騰訊處事器事情組長曹潯峰頒發了題為“天蝎3.0 整機柜處事器設計方案與實踐”的演講。以下是演講全文:
騰訊處事器事情組長 曹潯峰
各人下午好!我叫曹潯峰,來自騰訊。原來這個章節是由天蝎3.0項目組的組長跟各人分享,正好出差了,我是他的同事,我代表他來分享。
適才我看到唐總實際上已經根基上把模塊化的這樣一個理念領略的很是很是深入了。適才主持人也說了一個預言,大概這個原理是有因才有果。我們講天蝎3.0今朝狀態和將來籌劃之前,再回首一下為什么要搞天蝎3.0,騰訊是天蝎1.0,2.0,跟百度、家軍等一起做的這個項目,做到本日,回首過來說3.0才是我們此刻騰訊面對的最大的挑戰。
為什么要做呢?總結下來有這么幾個原因。第一,先看一下此刻的處事器交付,就是此刻3.0還沒有安詳落地,照舊以尺度的1U,2U處事器這種形態的。對付騰訊來講,我們有數百個業務模塊,顛末十幾年的的運營沉淀,通過差不多20個套餐,可是去年開始騰訊云的局限泛起快速的發作式增長,假如憑據套餐這種模式去做,大概有高出500靠近1000個套餐,這種套餐的模子在交付運營方面是沒有步伐完成的,這個壓力長短常大的。
第二,云的業務面對的客戶的多種多樣,許多業務對設備的靠得住性,可能說可維護性要求很是,固然是云業務,甚至一些海量業務。所以,要把監控、運營的手段深入到每個部件里。不單對監控有要求,并且要提前預警,同時設備交付給業務今后,大概業務常常有一些厘革。所以,此刻尺度的機型可能套餐的盲時已經沒有步伐滿意,這是一個很擔的挑戰。第二個挑戰來自于本錢,騰訊從2007、2008年跟我們的供給商做替代尺度可能專業存儲的折算一些存儲處事器,2U12,2U13辦理本錢問題。可是,到本日我們看到用一個主辦可能一個節點拖十幾個這種方法已經不能滿意大局限的冷數據存儲的要求。并且許多業務是很巨大的,用戶需求也是不絕改觀的。假如用簡樸的套餐模子,可能說此刻的這種架構實際上是沒有步伐滿意的,層本上要求很是高。
所以,基于這兩個理念,我們以為池化要求很是高,我們把電、熱、打點池化了,這些池化對業務本錢的縮減和對彈性的交付也是沒有步伐完全的滿意。所以,基于這幾個思量,3.0從計較、存儲、傳輸這樣的三個大的業務最敏感的需求來做池化才是真正的此刻辦理騰訊基礎問題的一個辦理要領。適才說了整個大的偏向。
從業務的偏歷來看,業務種類很是多,有郵件業務,有即時通訊的業務,有一些高機能計較的業務,像這些業務對整個縱向的技能維度來講,它的需求和迭代的變革有什么紛歧樣?假如說純真的簡樸來說,用尺度設備來辦理,可能不作為池化可能云化的方法辦理,大概涉及到改革的本錢,可能彈性的這樣一些本錢,實際上長短常很是大的。
舉個簡樸的例子,我們本來的設備都是千兆的網卡,假如哪一天需要萬兆的網卡,就要把這個設備換掉,假如不換插一塊網卡是不是能辦理呢?其實我們尚有一些管控的成果。所以,整個從單向這樣的技能維度來講,我們但愿可以或許把計較、存儲、傳輸業務感知的模塊可以或許剝離出來。1.0、2.0已經把供電、散熱剝離出來,3.0就是要把計較、存儲、傳輸這三個模塊剝離出來。
為什么要做天蝎3.0,天蝎3.0到底怎么做呢?上一次峰會上家軍組長已經跟各人大抵講了這個觀念,本日我們看一下。實際上天蝎3.0就是把模塊化做的更深入一些。總體來講把天蝎3.0分兩個部門,機柜內部通過SAS互換,PCIe的互換辦理機柜內的數據和信號傳輸的問題。機柜外部,在數據中心外部,機柜和機柜節點之間,通過10G,25G,可能50G,100G做第二階段,這樣通過這兩層自由的組合,假如是冷數據,大概用SAS做一級,把大量的SATAs組合起來,假如對付溫熱的數據鏈也可以通過SAS,對付熱數據,大概做一個遷移。整體的理念首先是模塊化,只不外比本來的1.0、2.0的基本架構的模塊越發深入一層,計較存儲這一塊,傳輸這一塊。下面基于我們的幾種理念,今朝BAT,可能天蝎,ODCC內部的幾個成員單元的一些今朝的狀態和將來的籌劃做一個分享。首先,基于SAS互換的冷數據的資源池化。我們通過SAS互換機今朝可以級聯17個存儲布局,這樣可以很是機動按照應用的需要,可以說可以像本來那樣接12個盤,照舊接幾十個盤,甚至幾百個盤,按照業務的要求可以做一些機動設置。今朝來看騰訊在這一塊有一個較量明晰的籌劃,是本年的年底前大概就會上線去陳設這樣的一個設備在實際的業務情況傍邊,此刻在嘗試室已經把產物化的籌備事情做的七七八八,后頭尚有一些收尾和交代的事情。