這是系統邏輯框圖,基于PCIe switch的框圖,前中后,前面是兩種背板,這是32個Ruler SSD,中間是PCIe交換單元,中間虛擬都是table,兩個switch之間的互連或者向后去連PCIe或者向前連NVMe背板,都可以通過配置來實現。下面按照這個框圖給大家介紹每個單元里,框圖本身通過一些PCIe table的連接方式,我可以接一個SOC卡,第一種方式,當你的業務希望的性能稍微低一點,有一點的收斂比。如果你覺得對業務的性能更高,用中間的性能方式,只需要改變table,多插一張卡就實現了。如果想要是裸盤交付的方式,不用插任何卡下面是AI計算Server的連接方式,可以把兩個box同時掛給一臺服務器CPU,實現業務的要求。
PCIe switch目前我們選擇的是Microsemi,兩個96 lane的PCIe switch,PCIe交換模塊采用的是模塊化的。這種設計能讓我們設計在第一張框圖里table之間靈活的配置。如果需要降成本,你設計一個系統,如果我需要四個PCIe switch做擴展做節點,連就好了。向上可以擴展4個,向下去掉一個。兩個盒子之間級聯或者T-Flex去連,用外部table,內部table是x8的。內部互聯有了每一對,是不是包括PCIe標準型號的,包括USB、串口等,這些都是可以支持Micron Server的。包括一些Micron Server Control。
Riser卡,B和C都是采用Flex定義,從switch板過來的可以直接連到Riser上,下面的T-Flex Standard Riser,按照T-Flex Riser卡定義的Micron Server去實現自定義。這個是兩種背板,怎么來實現U.2背板和EDSFF背板,背板位置不一樣,U.2背板是在前面,EDSFF背板是在上面的空間。
簡單介紹幾個應用場景,第一個是SSD池化,T-Flex,第一個應里是沒有任何計算節點的是,是純SSD,實現硬盤SSD資源的存儲池化功能。這個是異構計算,T-Flex通過每一個Flex里接一些GPU設備,服務器租用 免備案服務器,最多可以實現16卡的AI計算的功能。
最后看一下我們貢獻什么,在ODCC上我們會把整個T-Flex的所有設計貢獻給ODCC,包括整個系統的結構設計等,后面我會把所有的設計打包放在ODCC組織里,大家需要可以后續去ODCC獲取。
首先看一下T-Flex系統,介紹一下實現這個系統的關鍵部件及設計,接下來挑幾個典型應用場景介紹一下,后面是今天比較重要的部分,我們決定把T-Flex設計貢獻給ODCC,給大家講一下具體有哪些內容,開源的,大家可以直接用。
劉超:大家好,我是劉超,來自于騰訊,目前在騰訊負責服務器硬件構架設計。今天給大家介紹一下目前在騰訊批量部署的IO資源池化系統T-Flex。
天蝎3.0的主要工作方向是資源池化,在此之前,基于SAS switch的已經在騰訊部署了,SAS switch解決的是將應用資源和計算資源解耦,實現硬盤資源池化。主要面向的業務需求是在冷存儲,也有一定的溫存儲。業務本身對于高性能的IO或者異構計算,或者是高性能的存儲有強烈的需求。我們面臨的第一個問題是需求多樣化的問題,不同的業務對硬件IO性能要求,包括對設備配置配比要求不一樣。我們要求我們硬件設備有頂層的配置可編程能力,這樣才能滿足多元化資源的敏捷交付。這是2U通用服務器的形態。T-Flex在大多數的配置情況下是一個box,云主機租用,里面不含計算資源,但是有些可以獨立加上資源成為一個系統。前窗,一種是比較常見的24個U.2的,第二種是Ruler SSD,單條最大是32T,兩個前窗之間可以非常靈活的轉換,本身在系統級配置有比較強的擴展能力,Flex,系統相對來說比較靈活。我們現在給大家展示的機柜上的配置裝置,首先說明的這種配置方式里面沒有計算資源,一個單獨的T-Flex可以支持16個節點,如果一臺服務器配多個T-Flex,一臺服務器最多接4個box。T-Flex剛才我們看到第一頁支持的是標準的PCI-E,當有些情況下我們需要在box內部配置一個Micro Server的時候配一個這種后窗,可以通過非常方便的方式,這個后窗可以支持幾種Micro Server,第一種是OCP,T-Flex后窗可以支持這兩種Micron Server。
10月17日,2018年開放數據峰會(Open Data Center Summit 2018)于上午在北京國際會議中心開幕。作為數據中心行業的一大盛事,ODCC每年都將匯聚數千名數據中心專家與幾十名主流媒體。本屆峰會時間為16日-17日,ODCC將發布最新研究成果,碰撞尖端熱點技術,分享國際技術進展,展示主流產品應用。
今天我的介紹就這么多。