2020年,伴隨著新基建政策的出臺,以數(shù)據(jù)中心為代表的算力基礎(chǔ)設(shè)施進入加速發(fā)展軌道,其重要性日漸提升。在政策指引下,全國各地區(qū)開啟了新一輪的數(shù)據(jù)中心建設(shè)熱潮。9月15-16日,ODCC 2020開放數(shù)據(jù)中心峰會—"數(shù)據(jù)中心新基建、星辰大海新征程"即將在京拉開帷幕。本屆大會由開放數(shù)據(jù)中心委員會(ODCC)主辦,百度、騰訊、阿里巴巴、中國電信、中國移動、中國信息通信研究院、英特爾承辦,北京榮諾咨詢服務(wù)有限公司、中國IDC圈承辦。大會將就數(shù)據(jù)中心熱點話題、先進技術(shù)、最新研究成果等課題和業(yè)界專家學(xué)者展開深入地探討和交流。
以40G/100G為代表的第一代數(shù)據(jù)中心大規(guī)模應(yīng)用的光模塊,在故障預(yù)測上存在著許多“缺陷”,單純以光功率作為監(jiān)控指標(biāo)的監(jiān)控方案,無法真實反饋光模塊的運行狀態(tài)和網(wǎng)絡(luò)的穩(wěn)定性。同時,實際上在40G/100G光模塊方案越來越成熟的今天,云服務(wù)器,光模塊長期可靠性問題,已經(jīng)不是光模塊運行的主要問題。根據(jù)百萬級以上光模塊運營的經(jīng)驗,數(shù)據(jù)中心光模塊還有適配性問題,零星網(wǎng)絡(luò)抖動性問題等全生命周期的故障問題。然而,免備案主機,當(dāng)前光模塊故障分析,預(yù)測與運營管理,在數(shù)據(jù)中心領(lǐng)域一直都是處于手動操作模式,一旦遇到問題需要投入大量的人力物力資源進行分析。
針對上述問題,ODCC網(wǎng)絡(luò)工作組成立項目組,進行下一代光模塊智能監(jiān)控系統(tǒng)的研究。下一代光模塊硬件技術(shù)能夠加入更多的信息提取窗口,如誤碼率監(jiān)控,光模塊上下電信息,更多溫度反饋等,使光模塊的工作狀態(tài)信息更為精細(xì)化。同時,自研交換機也能夠支持存儲即時的故障信息日志,用于分析即時鏈路工作狀態(tài)。項目組在此基礎(chǔ)之上,結(jié)合40G/100G光模塊的管理經(jīng)驗,融入自動化系統(tǒng)網(wǎng)絡(luò)管理平臺和代碼化故障分析邏輯,實現(xiàn)智能光模塊監(jiān)控。項目組已經(jīng)形成下一代光模塊智能監(jiān)控系統(tǒng)相關(guān)的技術(shù)規(guī)格書。
本技術(shù)規(guī)格書將于2020 ODCC開放數(shù)據(jù)中心峰會進行發(fā)布,歡迎業(yè)界專家持續(xù)關(guān)注峰會最新動態(tài)。
項目經(jīng)理: 程傳勝
騰訊科技(北京)有限公司架構(gòu)工程師
2020年9月15-16日,ODCC 2020開放數(shù)據(jù)中心峰會—數(shù)據(jù)中心新基建、星辰大海新征程,我們在北京國際會議中心期待您的到來!