
冗余:指重復(fù)配置系統(tǒng)的某些組件。當(dāng)系統(tǒng)發(fā)生故障時(shí),冗余配置的組件介入并承擔(dān)故障組件的工作,從而減少系統(tǒng)的故障時(shí)間。通常指通過(guò)多次備份增加系統(tǒng)的可靠性。
容錯(cuò)主要靠冗余設(shè)計(jì),增加資源換取可靠性。由于資源不同,冗余技術(shù)分為硬件冗余、軟件冗余、時(shí)間冗余和信息冗余。硬件冗余是通過(guò)重復(fù)使用硬件來(lái)獲得容錯(cuò)能力。軟件冗余的基本思想是使用多個(gè)不同的軟件來(lái)執(zhí)行相同的功能,利用軟件設(shè)計(jì)差異來(lái)實(shí)現(xiàn)容錯(cuò)。信息冗余是利用添加到數(shù)據(jù)中的一部分信息比特來(lái)檢測(cè)或糾正操作或傳輸中的錯(cuò)誤,從而達(dá)到容錯(cuò)的目的。在通信和計(jì)算機(jī)系統(tǒng)中,常用的可靠性碼包括奇偶校驗(yàn)碼、循環(huán)冗余碼、漢明碼等。

1.在標(biāo)準(zhǔn)IA64架構(gòu)下構(gòu)建的容錯(cuò)系統(tǒng)
兩個(gè)標(biāo)準(zhǔn)IA64架構(gòu)主機(jī)模塊集成到一個(gè)環(huán)境中,并作為容錯(cuò)服務(wù)器運(yùn)行。系統(tǒng)平臺(tái)自動(dòng)檢測(cè)故障跡象并實(shí)時(shí)重定向I/O,無(wú)需任何人工干預(yù)。系統(tǒng)應(yīng)用程序保持不間斷運(yùn)行。與傳統(tǒng)的集群和熱備份系統(tǒng)相比,在可靠性和可用性方面具有優(yōu)勢(shì)。它不再是應(yīng)用層的交換關(guān)系,而是直接從硬件虛擬化層封裝服務(wù)器容錯(cuò)系統(tǒng)。這種高可靠性設(shè)計(jì)可以支持幾乎所有開(kāi)放的應(yīng)用系統(tǒng),不需要修改操作系統(tǒng)或應(yīng)用軟件環(huán)境,直接部署后立即實(shí)現(xiàn)持續(xù)可用性。
2.確保業(yè)務(wù)連續(xù)性的關(guān)鍵技術(shù)
動(dòng)態(tài)遷移技術(shù)
容錯(cuò)服務(wù)器主機(jī)處于活動(dòng)狀態(tài),客戶端系統(tǒng)和應(yīng)用程序在主節(jié)點(diǎn)上運(yùn)行和訪問(wèn)。當(dāng)檢測(cè)到任何故障癥狀時(shí),系統(tǒng)將主動(dòng)隔離并發(fā)出警報(bào),客戶端系統(tǒng)和應(yīng)用程序?qū)⒃诰€遷移到備份節(jié)點(diǎn)運(yùn)行并被訪問(wèn)。在此期間,業(yè)務(wù)系統(tǒng)持續(xù)運(yùn)行,實(shí)現(xiàn)零時(shí)間切換。

容錯(cuò)服務(wù)器開(kāi)機(jī)后,會(huì)立即進(jìn)入容錯(cuò)運(yùn)行狀態(tài),持續(xù)監(jiān)控服務(wù)器硬件和系統(tǒng)軟件的工作狀態(tài),檢測(cè)故障癥狀并報(bào)警。有數(shù)百個(gè)以上的錯(cuò)誤功能可以主動(dòng)修復(fù)或自動(dòng)隔離。主動(dòng)服務(wù)系統(tǒng)可以通過(guò)電子郵件(SMTP)自動(dòng)向管理員發(fā)送運(yùn)行狀態(tài)報(bào)告,并向網(wǎng)絡(luò)管理系統(tǒng)(SNMP)發(fā)送通知。
虛擬化技術(shù)
系統(tǒng)集成了虛擬化功能,可以同時(shí)部署多個(gè)操作系統(tǒng)和應(yīng)用,實(shí)現(xiàn)服務(wù)器資源的高效整合,支持硬件資源的在線擴(kuò)展。簡(jiǎn)單維護(hù)單一的WEB界面,實(shí)現(xiàn)整個(gè)系統(tǒng)的輕松管理,支持P2V、V2V等方式的系統(tǒng)備份、恢復(fù)和遷移技術(shù)。
3.更多優(yōu)勢(shì)和增值服務(wù)
快速部署和易于維護(hù)

對(duì)于熟悉標(biāo)準(zhǔn)X86服務(wù)器的維護(hù)人員來(lái)說(shuō),可以快速部署云海容錯(cuò)服務(wù)器系統(tǒng),只需開(kāi)機(jī)啟動(dòng)就可以保證系統(tǒng)的持續(xù)運(yùn)行和數(shù)據(jù)安全保護(hù)。換錯(cuò)部件也很簡(jiǎn)單,任何沒(méi)有IT經(jīng)驗(yàn)的客戶都可以操作。因?yàn)樯婕暗礁鼡Q壞件,系統(tǒng)會(huì)自動(dòng)同步新件,恢復(fù)到原來(lái)的容錯(cuò)狀態(tài),不需要任何額外的軟件配置。
異地災(zāi)難恢復(fù)方案
容錯(cuò)服務(wù)器系統(tǒng)支持分開(kāi)(異地)部署,兩個(gè)主機(jī)節(jié)點(diǎn)可以分布在不同的機(jī)房,可以相隔5公里以上。為避免人為因素或自然災(zāi)害造成的業(yè)務(wù)系統(tǒng)癱瘓,這與傳統(tǒng)的災(zāi)難恢復(fù)方案完全不同,只能實(shí)現(xiàn)異步數(shù)據(jù)備份,而云海容錯(cuò)服務(wù)器系統(tǒng)實(shí)現(xiàn)了兩個(gè)不同站點(diǎn)業(yè)務(wù)系統(tǒng)的實(shí)時(shí)同步備份。
處理器負(fù)載平衡技術(shù)
容錯(cuò)服務(wù)器處理器的負(fù)載均衡技術(shù)啟用后,冗余主機(jī)的所有處理器單元都進(jìn)入計(jì)算狀態(tài),整體計(jì)算性能可以翻倍。比如H2310-2C可以達(dá)到四通道十核(80 VCPU)的計(jì)算能力。

如果機(jī)房部署多套容錯(cuò)服務(wù)器,可以選擇One-View進(jìn)行統(tǒng)一的界面管理和維護(hù),包括對(duì)主機(jī)硬件和虛擬機(jī)運(yùn)行狀態(tài)的監(jiān)控和管理。有不懂的請(qǐng)咨詢夢(mèng)飛服務(wù)器了解。