本周二,亞馬遜AWS位于弗吉尼亞州的數據中心呈現妨礙,影響數千個在線處事,Netflix、Airbnb、Slack、Spotify、雅虎網絡郵箱等互聯網處事受到明明影響。亞馬遜AWS陳訴稱,云存儲處事S3呈現了“高錯誤率”。亞馬遜將S3定位為“簡樸存儲辦理方案”,數據顯示,S3被近15萬家網站利用,此次妨礙影響范疇極廣。
可是盡量如此,就像人會生病一樣,盡量采納了各類防范法子,人照舊會生病一樣,此次S3呈現的問題其實也不外是曲折中前進必需經驗的步調,對此,騰訊云工具存儲COS團隊也從專業的角度給出了專業闡明。
騰訊云是海內最大的云存儲處事提供商之一,騰訊云的工具存儲COS,為“微信伴侶圈”等海量業務提供云存儲處事,騰訊云有什么樣的對策?
騰訊云工具存儲COS團隊認為,本次變亂是亞馬遜的一個數據中心呈現了變亂,激發了云存儲處事的間斷,變亂是一個功效,問題大概呈此刻任何一個方面,“而容災是應對這類問題的辦理方案,磁盤級別容災,處事器級別容災,集群級別容災可以在數據中心的變亂產生前制止問題,而機房級別容災和跨地區容災則在機房變亂產生后辦理問題”。
針對雷同事件,騰訊云可以提供上述5大容災處事,別離從磁盤、處事器、集群、機房、跨地區等五個方面,為云存儲提供全方位的可用性保障:
磁盤級別容災:多備份數據冗余
對付生存在騰訊云存儲處事中的每個數據塊,都實現了“RAID”備份,即一份數據會存在多個副本可能校驗碼。同時操作底層磁盤的接口將其每個磁盤且分為多個扇區,并監控各個扇區的環境。
一旦檢測出磁盤部門扇區產生異常,會遏制針對該扇區的寫入和讀取,然后操作冗余數據對原有的扇區舉辦修復。在這個修復進程頂用戶仍然可以讀取冗余數據,處事一連可用。
處事器級別容災:條帶化打散數據
騰訊云操作“條帶化”技能,將多備份的用戶數據解析成多個數據塊勻稱安排在差異處事器之間。一旦檢測出單臺處事器呈現異常,會遏制對整個集群的數據寫入,將數據寫入遷移到同機房的其他集群中,隨后集群內部針對異常處事器啟動壞盤修復。
假如修復失敗,7*24值班的運維人員將人工參與,改換壞盤。在修復進程中,用戶可以從異常集群中康健的處事器中一連獲取數據,處事一連可用。
集群級別容災:差異集群互為主備
騰訊云在每一個機房中會配備多個集群,每個集群可以提供完整處事,用戶的數據塊被漫衍在差異集群的差異處事器中。假如某個特定集群失去處事本領,修復方法如同處事器異常。該集群整體暫停數據的寫入和讀取,保存異常現場,將數據寫入遷移到同機房的其他集群中,集群內部開始自動修復邏輯模塊可能存儲模塊。在修復進程中,用戶可以從其他康健集群中一連獲取數據,處事一連可用。
機房級別容災:可用區物理斷絕
騰訊云今朝在每個存儲大區配備了多個可用區,每個可用區之內配備多個機房。每個可用區擔保必然物理間隔,當產生爆炸,大水等惡劣的物理環境可能小局限運營商網絡癱瘓,騰訊云將自動調治數據的寫入和讀取,暫停劫難熬影響區域的機房利用,保存存量數據不改變。
在災惆悵程中新的數據寫入和讀取,香港云服務器 美國云主機,將遷移到同城的其他機房可能鄰近都市的機房,整體存儲大區的處事不間斷。同時騰訊云提供跨機房跨可用區的數據冗余備份本領。
跨地區級別容災:跨地區自動備份
騰訊云已經在華北大區,華南大區,華東大區,西南大區和東南亞大區提供了數據存儲處事,而且提供“主備數據中心”的辦理方案,用戶可以選擇將主站的數據處事保存在某一區域,同時在上千公里之外保存備份數據,騰訊云將取代客戶將主數據中心的數據在短時間內自動搬家到備份數據中心。
當產生運營商網絡大局限癱瘓可能大面積劫難光降,用戶可以將處事指向備份數據中心存儲區域,應對異常問題。
用戶將來還可以選擇騰訊云即將推出的離線存儲處事,以極低的本錢享受到災備數據的掩護。
今朝,騰訊云已經向公共點評,廣東氣象局、芒果TV、CNTV等多家企業提供靠得住不變的處事。