如今,數(shù)據(jù)中心越來越趨于自動(dòng)化,并已成為數(shù)據(jù)中心精采運(yùn)營(yíng)的強(qiáng)大力大舉量。以下列出在數(shù)據(jù)中心監(jiān)控自動(dòng)化中常常呈現(xiàn)的兩個(gè)主要問題。
問題1:房間里的大象
“房間里的大象”是指人們私密糊口和民眾糊口中對(duì)付某些顯而易見的事實(shí),集團(tuán)保持沉默沉靜的社會(huì)現(xiàn)象。人們?cè)谶M(jìn)一步深入自動(dòng)化之前,無論是自動(dòng)發(fā)明,陳訴交付或警報(bào)觸發(fā)操縱,必需做出一個(gè)要害點(diǎn):在某些方面,它被稱為DPR周期。DPR代表檢測(cè),防范和響應(yīng)。
警報(bào)是事戀人員在產(chǎn)生錯(cuò)誤時(shí)捕捉錯(cuò)誤的方法,可是由數(shù)據(jù)中苦衷戀人員來抉擇它們產(chǎn)生的原因,并找到一種防備錯(cuò)誤再次產(chǎn)生的要領(lǐng)。當(dāng)構(gòu)建一個(gè)辦理方案以自動(dòng)響應(yīng)警報(bào)并舉辦修復(fù)時(shí),作為認(rèn)真任的數(shù)據(jù)中心專業(yè)人員,還應(yīng)該致力于闡明環(huán)境的費(fèi)力事情,以找到模式和基礎(chǔ)原因。然后需要辦理基礎(chǔ)原因,并建設(shè)查抄,以便知道是否再次呈現(xiàn)問題。
對(duì)警報(bào)的自動(dòng)響應(yīng)保持企業(yè)的業(yè)務(wù)在所有的時(shí)間運(yùn)行,并輔佐確保知道你需要的時(shí)間,事戀人員必需可以或許看到產(chǎn)生了什么,做的事情出來為什么會(huì)產(chǎn)生,所以可以防備它在未來產(chǎn)生。這樣才不會(huì)呈現(xiàn)“房間里的大象”問題。
問題2:心田驚駭
許大都據(jù)中心專業(yè)人員在第一次提出自動(dòng)響應(yīng)警報(bào)的想法時(shí)感想擔(dān)憂。而具有一個(gè)真正有活力的大腦的人會(huì)對(duì)這些警報(bào)舉辦仔細(xì)思考,然后審慎采納動(dòng)作。這種想法就像站在“自動(dòng)化”海洋的邊沿。有點(diǎn)令人望而生畏。但你必需相信不會(huì)被海水淹死,而且有本領(lǐng)一步步地實(shí)驗(yàn)。這并不是一個(gè)全有或全無的命題,其風(fēng)險(xiǎn)也將會(huì)從零到全部。
與任何IT事情一樣,有實(shí)施打算有時(shí)比實(shí)施(或在這種環(huán)境下是自動(dòng)化)自己更重要。所以可以再談?wù)勥@個(gè)實(shí)施打算:
首先識(shí)別測(cè)試呆板。無論是為這些目標(biāo)而陳設(shè)的嘗試室設(shè)備照舊那些不太重要的志愿者,請(qǐng)配置警報(bào),以便觸發(fā)這些呆板。
進(jìn)修利用反向閾值。固然企業(yè)的最終警報(bào)將查抄CPU的事情負(fù)載量大于90%,事戀人員大概但愿制止重復(fù)測(cè)試。而CPU的事情負(fù)載量小于90%將觸發(fā)更多的靠得住性,至少事戀人員但愿如此。
查找復(fù)位選項(xiàng)。與上面密切相關(guān),相識(shí)數(shù)據(jù)中心監(jiān)控東西如何重置警報(bào),以便再次觸發(fā)。也許很大概會(huì)許多利用誰人成果。
具體環(huán)境。數(shù)據(jù)中苦衷戀人員想要相識(shí)產(chǎn)生什么和什么時(shí)候大概產(chǎn)生。假如數(shù)據(jù)中心的東西支持本身的日志記錄,美國(guó)抗攻擊服務(wù)器 亞洲服務(wù)器,請(qǐng)將其打開。在自動(dòng)化中大量插入“我此刻開始XYZ步調(diào)”動(dòng)靜。固然很乏味,但你會(huì)很興奮所做到的工作。
本身處理懲罰警報(bào)。假如你認(rèn)為會(huì)通過發(fā)送這些警報(bào)隨處事器團(tuán)隊(duì)舉辦測(cè)試,事實(shí)上,你并不會(huì)把它發(fā)送到任何團(tuán)隊(duì),而會(huì)認(rèn)為本身可以處理懲罰這些警報(bào)。
你真的不需要通過電子郵件觸發(fā)那些警報(bào)。所有這一切都是在基本設(shè)施上造成特另外延遲和壓力,以及假如你的警報(bào)同時(shí)啟動(dòng)多個(gè)動(dòng)靜,大概會(huì)發(fā)生其他問題,會(huì)將動(dòng)靜發(fā)送到當(dāng)?shù)厝罩疚募惋@示屏。
分享警報(bào)提醒。此刻,你可以通過對(duì)話與小組的其他人分享警報(bào)提醒。
回收對(duì)話。這個(gè)進(jìn)程將涉及與其他人攀談。配置自動(dòng)化是協(xié)作的,因?yàn)槟愫湍切┨焯於荚谝黄鹗虑榈娜硕紤?yīng)該同意從根基成果到動(dòng)靜名目標(biāo)一切。
將相位器配置為滿。一旦自動(dòng)化在企業(yè)的測(cè)試系統(tǒng)上事情,打算通過度階段的要領(lǐng)實(shí)施。利用溝通的機(jī)制,你用來限制幾個(gè)警報(bào),你向網(wǎng)絡(luò)擴(kuò)展,也許10-20個(gè)系統(tǒng)。而且你再次測(cè)試調(diào)查功效。然后你擴(kuò)大到50個(gè)閣下。確保你和收件人都很滿足所看到的功效。記著,在這一點(diǎn)上,團(tuán)隊(duì)正在吸收通例警報(bào),但你仍然應(yīng)該看到之前提到的具體動(dòng)靜。你應(yīng)該與團(tuán)隊(duì)舉辦審查,以確保你認(rèn)為產(chǎn)生的是真正產(chǎn)生的工作。
遵循這些指南,任何自動(dòng)響應(yīng)應(yīng)該有很高的樂成機(jī)率,可能至少你會(huì)制止陷入糟糕的自動(dòng)化,不會(huì)發(fā)生太多的損害。回收自動(dòng)化的一個(gè)很好的履歷法例是用最小的盡力得到最大的回報(bào)。無論你此刻看到的是什么基于系統(tǒng)的事件,這大概是你可以得到的最大影響。另一個(gè)找到自動(dòng)化想法的步伐就是凝聽團(tuán)隊(duì)的想法,思量是否有哪些用戶投訴是由系統(tǒng)妨礙驅(qū)動(dòng)的。假如是這樣,它大概是辦理自動(dòng)化呈現(xiàn)問題的時(shí)機(jī)。最后,不要打算得太遠(yuǎn)。你大概此刻感想擔(dān)憂在得到一兩個(gè)樂成之后,你會(huì)發(fā)明團(tuán)隊(duì)正在尋求你的發(fā)起,以你的方法得到輔佐。