2018年6月27日,某云數(shù)據(jù)庫(kù)故障,起因:運(yùn)維操作失誤觸發(fā)未知bug;
2018年7月17日,某云管理控制臺(tái)間歇性失靈;
2018年7月18日,某云平臺(tái)全局負(fù)載均衡服務(wù)發(fā)生中斷;
2018年7月20日,某云北京三區(qū)云硬盤IO異常,某創(chuàng)業(yè)公司數(shù)據(jù)全部丟失且無法恢復(fù)。
2018年7月24日,某云廣州一區(qū)主備兩條網(wǎng)絡(luò)鏈路同時(shí)中斷。
最近各大公有云故障頻發(fā),朋友圈又是哀嚎一片。面對(duì)宣傳時(shí)說“提供達(dá)99.95%的服務(wù)可用性和99.9999999%的數(shù)據(jù)可靠性”,出現(xiàn)故障時(shí),我們就是那0.0000001%?
這些事故告訴了我們一個(gè)幾乎無法規(guī)避的現(xiàn)實(shí),那就是最優(yōu)秀的云也會(huì)宕機(jī),也會(huì)丟失數(shù)據(jù)。雖然云計(jì)算提供了各種數(shù)據(jù)保護(hù)措施,但是依舊面臨諸多挑戰(zhàn):數(shù)據(jù)安全、網(wǎng)絡(luò)連接以及數(shù)據(jù)備份等。讓我們不得不去反思面對(duì)這樣的不確定,我們應(yīng)該怎么辦?
1、對(duì)于普通業(yè)務(wù),進(jìn)行最低級(jí)別保護(hù)
采用云主機(jī)快照+數(shù)據(jù)庫(kù)主從配置+數(shù)據(jù)庫(kù)異地備份的方式,保障核心數(shù)據(jù)。
(1)云主機(jī)快照功能,對(duì)塊存儲(chǔ)的數(shù)據(jù)備份,當(dāng)磁盤數(shù)據(jù)出現(xiàn)問題時(shí),可以快速回滾。
(2)數(shù)據(jù)庫(kù)主從配置,解決單點(diǎn)問題,當(dāng)主庫(kù)不可以用時(shí),從庫(kù)接管服務(wù)。
(3)數(shù)據(jù)庫(kù)異地備份,通過互聯(lián)通云專線將數(shù)據(jù)庫(kù)數(shù)據(jù)備份到異地數(shù)據(jù)中心,解決邏輯或者公有云其他因素導(dǎo)致的數(shù)據(jù)丟失等風(fēng)險(xiǎn)。
2、對(duì)于高可靠業(yè)務(wù),進(jìn)行高可用部署
將業(yè)務(wù)分別部署在同城不同數(shù)據(jù)中心。采用跨可用區(qū)的應(yīng)用架構(gòu)設(shè)計(jì),讓應(yīng)用服務(wù)輕松具備同城容災(zāi)能力。
(1)當(dāng)公有云故障時(shí),云主機(jī),利用DNS進(jìn)行域名的快速切換,將業(yè)務(wù)流量導(dǎo)向?yàn)?zāi)備中心,確保業(yè)務(wù)的可持續(xù)性
(2)將數(shù)據(jù)庫(kù)的主庫(kù)和從庫(kù)分別部署。當(dāng)主庫(kù)所在公有云不可用時(shí),香港服務(wù)器租用,可以快速切換到從庫(kù)所在災(zāi)備數(shù)據(jù)中心,確保數(shù)據(jù)庫(kù)持續(xù)可用。
(3)利用互聯(lián)通云專線,可以將公有云和容災(zāi)數(shù)據(jù)中心實(shí)現(xiàn)私網(wǎng)IP互通,形成一張邏輯二層網(wǎng),進(jìn)行統(tǒng)一管理。
互聯(lián)通云專線服務(wù),是通過建立IDC與公有云之間的高速傳輸通道,為客戶提供高速、穩(wěn)定、安全的云專線接入,構(gòu)建云網(wǎng)一體化。
【中國(guó)IDC圈原創(chuàng) 未經(jīng)授權(quán)禁止轉(zhuǎn)載】