隨著互聯網的飛速發(fā)展,不僅是走在技術前沿的科技公司互聯網化,就連業(yè)務體系笨重的傳統企業(yè)都爭向互聯網轉型。低成本、可隨時隨地的訪問、可靈活擴展IT的需求、數據安全性高等特點使得企業(yè)上云將會是未來企業(yè)常態(tài)。
云計算成為企業(yè)數字化轉型的關鍵,企業(yè)了解云計算帶來的優(yōu)勢,但由于缺乏云運維經驗,經常采“坑”,導致運維工程師背鍋累累,企業(yè)損失慘重。
今天跟大家分享一些云上常見的錯誤,以下案例以阿里云為主:
案例一
企業(yè)互聯網業(yè)務突然宕機,工程師們來不及反思數據損壞發(fā)生的原因,第一時間著手進行搶修——重啟數據庫并且嘗試數據恢復。但不幸的是,云上業(yè)務并未做備份,企業(yè)損失較大。
原因:數據沒有及時做備份造成數據的丟失
避免方法:
阿里云服務器ECS、數據庫RDS、Redis均支持自動快照備份策略,在開啟正式使用時,建議開啟自動快照備份
案例二
企業(yè)在云上部署電商網站,測試時打開網站正常,業(yè)務正式上線做促銷活動時,用戶訪問網站,頁面打開速度比較慢,尤其是圖片的加載,客戶體驗很不好。導致電商促銷效果很差,老板大發(fā)雷霆!
原因:測試環(huán)境訪問網頁,由于是本地訪問,圖片加載速度很快,忽略了業(yè)務上線后是針對全國用戶,圖片數據均需要從本地調取,網頁圖片較多,導致加載速度較慢。
避免方法:
阿里云除了提供海量、安全、低成本、高可靠的云存儲服務OSS。還提供一項對于靜態(tài)文件加速的產品CDN。能夠將OSS的bucket作為源站,將源內容發(fā)布到邊緣節(jié)點,將用戶的請求分配至最近的節(jié)點,使終端用戶以最快的速度讀取到所需的內容,提高用戶訪問的響應速度。
案例三
某日,正在查看服務器日志,directadmin授權,收到一條1100人民幣的云服務器扣費通知,震驚!不知所措!回憶業(yè)務使用的這批機器之前采購是按年配置的,才3個月,站群服務器,怎么又扣費了呢?后臺查看云商資源,發(fā)現當時測試環(huán)境的機器沒有及時釋放,到期自動續(xù)費了!人在家中坐,賬單天上來!
原因:有閑置的云資源被持續(xù)扣費,造成資金浪費
避免方法:定期查看云資源使用情況,存在閑置的云資源,及時處理或者釋放。
案例四
云上業(yè)務遭受黑客攻擊,企業(yè)商城突然訪問不了,門店大量投訴,損失慘重。
原因:工程師防火墻規(guī)則時規(guī)則設置不得當,導致黑客有機可乘,通過端口進行業(yè)務攻擊
避免方法:
只打開需要使用的端口,云上常用端口:
· TCP(SSH),打開22端口· TCP(RDP),打開3389端口· TCP(HTTP),打開80端口· TCP(HTTPS),打開443端口
云上運維“坑點”特別多!小白的云運維工程師,即使看了很多攻略,經驗分享還是有會遺漏,導致業(yè)務出現故障,造成企業(yè)損失。最好的方式就是能在問題發(fā)生前及時發(fā)現問題,并且解決掉。
今天和大家分享一個好用的小工具——王教授,我個人理解他更像是一個“監(jiān)控”工具,可以幫助我們察覺云端業(yè)務的一系列異常和改動,并且及時給予提醒。比如:
1.存在即將到期的ECS/RDS/SSL證書/其他資源包,他會在到期的前7天給出提示,直至這個告警被處理完成,幫助避免購買的云資源沒有及時續(xù)費造成業(yè)務的中斷。
2.新配置的云資源ECS/RDS/Redis等未開啟自動備份,他也會檢測到發(fā)出報警,避免未備份造成數據的丟失。
3.在資源使用率上,可以幫我們監(jiān)控出閑置的云資源被持續(xù)扣費的情況(空閑的ECS、未掛載的磁盤、未使用的NAT網關等),減少企業(yè)資源浪費。