9月27日,由云計較成長與政策論壇、數據中心同盟指導,開放數據中心委員會主辦,百度、騰訊、阿里巴巴、中國電信、中國移動、中國信息通信研究院、英特爾承辦的“2016 ODCC開放數據中心峰會”在京謹慎召開。在下午“數據中心網絡”的分論壇上騰訊高級網絡架構師陸素建頒發了題為“騰訊Internet 出口網絡SDN 運營實踐”的演講。以下為演講全文:
騰訊高級網絡架構師 陸素建
本日我分享主題就是騰訊internet出口網絡SDN運營實踐,騰訊從2012年開始做SDN研究,最近我們internet出口SDN方案已經在線網落地運營,本日很僥幸在這里跟各人一起分享一下這套方案落地運營的環境以及在期間碰著的挑戰。開始講這套方案之前簡樸看一下騰訊網絡歸納綜合,我們全球各大洲陳設了網絡結點,當前外洋接入了一百多家運營商,總出口快要一個T,同時努力跟當地舉辦對接。海內部門我們分為三大華東華南華北,來歲也會擴展西部。當前三大接入運營商主力高出兩個T的帶寬,同時我們在海內努力跟中小運營商舉辦對接,我們已經接了快要30家中小運營商,可以看到騰訊internet出口帶寬資源很是富厚,我們僅僅要打點好這么多出口資源自己就是很巨大的事情,我們要界說許多路由計策讓差異出口選擇差異路徑。
在實際運營進程中我們還碰著更多的挑戰,上面這兩個圖,上面場景在線網運營中非經常見,呈現這兩個問題的最基礎原因就是當前BGP沒有思量網絡實際環境,沒有思量質量環境,沒有思量擁塞的環境。我們想到SDN辦理方案,業界通用我們需要把網絡中的數據信息上送到節制器,由節制器會合計較,具體看一下騰訊怎么做的?我們通過BMP收羅路由,收羅出口與網絡流量,網管收羅出口網管的質量信息,外部導入AS以及IP對應干系,我這套節制器需要計較的所有信息已經得到,這時候共同騰訊定制的路由計較算法完成會合的計較,然后通過BGP實現正確的路由選路。這個方案整體看起來很是簡樸,我們看一下實際運營結果怎么樣?首先看一個最簡樸的例子,SDN方案帶來的收益。傳統封堵會通知網管我IP受到進攻,網管行動網絡設備下設置,這種方法有很大的缺點,首先效率很是低,我們受進攻的時候但愿毫秒級完成封堵,因為當我受到進攻頻繁變革的時候需要頻繁登錄網絡設備,有大概對設備不變性造成影響,我尚有其他的運維人員需要操縱這臺設備。我們通過SDN辦理方案,當我檢測到受進攻IP的時候通過北向接口通知給節制器,偽造一套路由,目標地點就是受進攻IP,我們轉發設備預先設備好的指向的路由,當路由下發到轉發路由通過路由迭代就實現封堵,線網運營的時候晉升的一百倍,而且封堵樂成率晉升到百分之百,同步BGP尺度協議下發不需要頻繁對網絡設置舉辦修改,也晉升了網絡的不變運營。
我們看別的一個收益,出口調治,運營商的網絡質量和出口妨礙可能舉辦改觀,好比左邊出口切換到右邊出口,好比華東切到華南,以前做法需要運維人員隨著網絡設備改設置做接口切換,這些效率低,靠得住性較量低。本來為了淘汰改的設置量,所以出口切換基于整個出口切換,所以不能做到基于網站去做,通過我們SDN方案,我們需要做出口切換的時候可以登錄前臺打點頁面,運維人員直接輸入須要的要害信息,輸入之后由節制器完成計較,最后轉換成IP路由,這個效率也長短常之高,并且靠得住性很高,我不再需要運維人員說本身改設置。同時對騰訊線網出口設備多個廠商,以前改設置的時候需要差異廠商下發差異設置,后頭就改成尺度通道,最要害的可以實現基于網絡的調治,可以做更風雅化的調治。
另一個對業務最大的收獲就是網絡質量的晉升,可以做到自動優化。我們騰訊網絡出口很是多,有十幾條路達到用戶,以前做法都是本身選,此刻不了質量探測處事器,我們舉辦周期性計較下發給轉發設備,轉發設備引導流量走勢。我們得到的收益這整套系統都是自動化收羅,自動計較,自動下發,對業務而言可以得到更好的處事質量,對付網絡運維而言,這個算法是定制化,此刻可以按照質量做路由計較,今后可以插手本錢因素,可以在滿意網絡質量前提下,我選擇一個越發低廉的本錢出口,也可以讓我們獲得本錢的節減。
在這套方案落地進程中是否是一帆風順呢?我們也有許多挑戰,首先這個圖是最早期的internet出口陳設方案,每臺轉發設備旁邊都陳設BGP與運營商設備成立EBGP,通過BMP將路由上送節制器。節制器完成會合計較后通過IBGP下發給BGP Agnet,BGP Agnet通過I2RS將路由下發給出口設備。我們在落地進程中碰著別的一個挑戰,早期時候在路由節制器跟轉發設備交互最早選擇I2RS協議,聽名稱知道這個協議開拓出來就是為了在路由器上面開一個接口,讓節制器去調,天生為SDN籌備的,當初也選擇了這么一套交互協議。可是我們在落地進程中碰著一些問題,這個協議很新,不是所有供給商都愿意轉發設備支持這個協議,因為太新縱然供給商都愿意做,各人對這個的領略紛歧樣,最終領略千差萬別,所以不能彼此兼容。尚有效率太低,這個協議頂層傳輸通道效率很低,我們測的進程中發明最大的效率到達1500每秒,對付互聯網已經高出60萬路而言,這個效率太低。后頭實驗選擇其他交互協議,選擇了BGP通道,這個成長幾十年,各人都支持,所有路由器廠商可能互換器廠商對這個協議支持都很好,沒有兼容問題,其實效率很高,我們到達15到20K每秒,根基能滿意所有需求。這里大概有人疑問,既然BGP這么好為什么一開始選擇I2RS?實際通過BGP通道下發路由會改變轉發設備原有路由表,什么意思?左邊的圖跟運營商對接轉發設備收到運營商路由之后通過R反射到全網,路由節制器下發的路由但愿只對節制舉辦路由,所以我們對路由節制器BGP路由做了限制,不讓向外宣布。我們節制器下路由指導流量轉發,所以我們優先級比原有轉發設備從運營商的要高,這樣一來呈現一個問題,我們路由節制器下發路由包圍原有轉發設備從運營商的路由的時候,這個路由釀成黑洞,只有在這臺設備有,其他設備就沒有,進而改變整個BGP路由表,這個是我們不肯意看到的,大概引起其他路由黑洞和滑落問題。這個和許多廠商相同過,各人都以為這是一個棘手的問題,有些供給商和廠商最終接頭來接頭去最終辦理方案在轉發設備再開一張表,此刻轉發這個設備各人知道有路由表跟轉頒發,他們說再開一張表,這樣做對騰訊用戶而言時間太久了,首先不是所有的供給商都愿意這么干,在我路由器下面開放第三張表,縱然做了不會那么快的實現,需要硬件做改變。所以我們后頭在思考有沒有其他更好的適合騰訊的辦理方案,最終我們選擇了對網絡設備做分級。思路是說對設備疏散,部門設備只接運營商,運營商設備和IDC設備,IDC設備不陳設路由節制器的時候我通過RR反射給他,他沒有出口,他不需要引導其他流量轉發出去,我路由節制下的路由縱然包圍從RR的路由,我發出去不會有任何影響,這樣很好辦理了BGP下一個路由之后改變路由將來得環境。這種改變方法得到了別的一個收益,IDC不接運營商,我們可以用互換機替代,不需要用傳統的路由器,這個此刻已經在線網做試點陳設了。