2018年6月27日,某云數(shù)據(jù)庫故障,起因:運維操作失誤觸發(fā)未知bug;
2018年7月17日,某云管理控制臺間歇性失靈;
2018年7月18日,某云平臺全局負(fù)載均衡服務(wù)發(fā)生中斷;
2018年7月20日,某云北京三區(qū)云硬盤IO異常,某創(chuàng)業(yè)公司數(shù)據(jù)全部丟失且無法恢復(fù)。
2018年7月24日,某云廣州一區(qū)主備兩條網(wǎng)絡(luò)鏈路同時中斷。
最近各大公有云故障頻發(fā),朋友圈又是哀嚎一片。面對宣傳時說“提供達(dá)99.95%的服務(wù)可用性和99.9999999%的數(shù)據(jù)可靠性”,出現(xiàn)故障時,我們就是那0.0000001%?
這些事故告訴了我們一個幾乎無法規(guī)避的現(xiàn)實,那就是最優(yōu)秀的云也會宕機,也會丟失數(shù)據(jù)。雖然云計算提供了各種數(shù)據(jù)保護(hù)措施,但是依舊面臨諸多挑戰(zhàn):數(shù)據(jù)安全、網(wǎng)絡(luò)連接以及數(shù)據(jù)備份等。讓我們不得不去反思面對這樣的不確定,我們應(yīng)該怎么辦?
1、對于普通業(yè)務(wù),進(jìn)行最低級別保護(hù)
采用云主機快照+數(shù)據(jù)庫主從配置+數(shù)據(jù)庫異地備份的方式,保障核心數(shù)據(jù)。
(1)云主機快照功能,對塊存儲的數(shù)據(jù)備份,當(dāng)磁盤數(shù)據(jù)出現(xiàn)問題時,可以快速回滾。
(2)數(shù)據(jù)庫主從配置,解決單點問題,當(dāng)主庫不可以用時,從庫接管服務(wù)。
(3)數(shù)據(jù)庫異地備份,通過互聯(lián)通云專線將數(shù)據(jù)庫數(shù)據(jù)備份到異地數(shù)據(jù)中心,解決邏輯或者公有云其他因素導(dǎo)致的數(shù)據(jù)丟失等風(fēng)險。
2、對于高可靠業(yè)務(wù),進(jìn)行高可用部署
將業(yè)務(wù)分別部署在同城不同數(shù)據(jù)中心。采用跨可用區(qū)的應(yīng)用架構(gòu)設(shè)計,讓應(yīng)用服務(wù)輕松具備同城容災(zāi)能力。
(1)當(dāng)公有云故障時,云主機,利用DNS進(jìn)行域名的快速切換,將業(yè)務(wù)流量導(dǎo)向災(zāi)備中心,確保業(yè)務(wù)的可持續(xù)性
(2)將數(shù)據(jù)庫的主庫和從庫分別部署。當(dāng)主庫所在公有云不可用時,香港服務(wù)器租用,可以快速切換到從庫所在災(zāi)備數(shù)據(jù)中心,確保數(shù)據(jù)庫持續(xù)可用。
(3)利用互聯(lián)通云專線,可以將公有云和容災(zāi)數(shù)據(jù)中心實現(xiàn)私網(wǎng)IP互通,形成一張邏輯二層網(wǎng),進(jìn)行統(tǒng)一管理。
互聯(lián)通云專線服務(wù),是通過建立IDC與公有云之間的高速傳輸通道,為客戶提供高速、穩(wěn)定、安全的云專線接入,構(gòu)建云網(wǎng)一體化。
【中國IDC圈原創(chuàng) 未經(jīng)授權(quán)禁止轉(zhuǎn)載】