服務器集群是指一組服務器在一個系統上協同工作,為用戶提供更高的可用性。這些集群用于通過允許另一臺服務器在中斷事件中接管來減少停機時間和中斷。這是它的工作原理。一組服務器連接到一個系統。
當其中一個服務器遇到服務中斷時,工作負載會在客戶端遇到任何停機之前重新分配到另一臺服務器。集群服務器通常用于數據更新頻繁的應用程序,其中文件、打印、數據庫和消息服務器是最常用的集群。總體而言,集群服務器為客戶端提供了比任何一臺服務器都可能提供的更高級別的可用性、可靠性和可擴展性。
在集群服務器環境中,每臺服務器負責自己的每臺設備的所有權和管理,并擁有用于運行集群中其他服務器的操作系統(以及任何應用程序或服務)的副本。集群中的服務器被編程為協同工作,以增加對數據的保護并隨著時間的推移保持集群配置的一致性。
針對故障和中斷的集群保護
服務器集群的主要原理是防止中斷和停機。如上所述,集群服務器提供了增強的保護,防止在電源故障期間整個網絡變黑。集群服務器可防止三種主要類型的中斷。
我們將在以下部分詳細探討這些類型的中斷,但簡而言之,服務器集群有助于防止由于軟件故障而發生的中斷、由于硬件故障而發生的中斷以及由于以下原因而發生的中斷外部事件作用于物理服務器站點的結果。
應用程序/服務失敗
應用程序/服務故障事件包括由于涉及對服務器或數據中心的運行至關重要的軟件或服務的嚴重錯誤而發生的任何中斷。這些故障可能是由多種因素引起的,其中許多因素在很大程度上是不可避免的。盡管大多數服務器都實施了冗余措施來防止此類故障,但應用程序/服務故障本質上很難預測和準備。
由于服務器監控數據的復雜性、密集性,服務器管理員可能很難在潛在問題導致中斷之前查明并解決它們。雖然警惕、知識淵博和積極主動的服務器管理員可以在問題出現之前識別并解決這些問題,但沒有服務器管理員能夠針對此類故障提供全面的保護。
系統/硬件故障
這種類型的中斷是由于運行服務器的物理硬件出現故障而發生的。這些中斷可能由多種因素引起,并且可能由對服務器或數據中心的功能至關重要的幾乎所有不同類型的組件引起和影響。
雖然服務器組件在可靠性和功能方面正在穩步提高,但沒有任何組件可以避免故障。此故障可能是由于過熱、優化不佳或僅僅是組件達到其產品壽命終點而發生的。處理器、物理內存和硬盤都是最容易發生故障的組件,因為它們對于保持服務器運行很重要。
站點故障
站點故障通常是由數據中心環境之外發生的事件引起的。雖然從理論上講,導致站點故障的事件是多方面的,但最常導致站點故障的事件是導致大范圍斷電的自然災害,以及能夠損壞數據中心內硬件的事件。
雖然自然災害的一些影響不能通過任何不明智的地點選擇來消除,但那些由停電及其相關并發癥引起的影響可以通過使用冗余措施(如服務器集群)來做好準備。對于位于易受自然災害地區的數據中心來說,這些冗余措施至關重要。
盡管可以識別和解決可能導致這三種不同類型故障的問題,但服務器集群等冗余措施是確保近乎完全可靠性的唯一方法。對于需要在一年中每一天的每一分鐘都保持不間斷性能的數據中心,服務器集群是確保這一點的絕佳方式。
三種類型的集群服務器
根據集群系統(稱為節點)與負責存儲配置數據的設備的連接方式,服務器集群分為三種類型。這三種類型包括單個(或標準)仲裁集群、多數節點集集群和單節點集群,下面將詳細介紹。
單一(或標準)仲裁集群
最常用的是,該集群由多個節點組成,這些節點具有一個或多個集群磁盤陣列,這些磁盤陣列利用單個連接設備(稱為總線)。一臺服務器管理并擁有集群中的每個單獨的集群磁盤陣列。名義上的法定人數是指用于確定每個單獨的集群是否在線且不受影響的系統。
單個仲裁集群在實踐中非常簡單。每個節點都有一個“投票”,通過它與中央總線通信,它是在線的并且可以正常工作。只要單個仲裁集群中超過 50% 的節點在線,該集群就會保持正常運行。如果集群中超過 50% 的節點無響應,則集群將停止運行,直到各個節點的問題得到解決。
多數節點集集群
與上述集群一樣,該模型的不同之處在于每個節點都擁有自己的集群配置數據副本,并且該數據在所有節點之間是一致的。此模型最適用于具有位于不同地理位置的單個服務器的集群。
雖然多數節點集集群的功能與單個仲裁集群的功能有相似之處,但前者的不同之處在于它不需要共享存儲總線來運行,因為每個節點都在本地存儲仲裁數據的副本。雖然這并沒有完全消除共享總線的實用性,但它在配置遠程服務器時提供了更大的靈活性。
單節點集群
最常用于測試目的,此模型包含單個節點。單節點集群經常被用作集群應用程序開發和研究的工具,但由于缺乏故障轉移,它們的實用性受到嚴重限制。由于它們僅由單個節點組成,因此單個節點的故障會導致所有集群組不可用。
本地數據中心或網絡托管服務提供商的客戶服務代表可以更詳細地解釋這三種模式之間的區別,并幫助確定哪種模式最適合您的業務。一般來說,除非您有特殊需求(或位于多個地理位置分散的位置),否則標準 Quorum 集群是您的最佳選擇。
為什么要集群您的服務器?
受保護的 IT 基礎架構的關鍵在于冗余。在單個網絡上創建服務器集群可提供終極冗余,并確保單個錯誤不會關閉您的整個網絡、使您的服務無法訪問并使您的業務失去重要收入。與當地網絡托管服務提供商的客戶服務代表交談,了解更多關于集群的好處以及如何開始的信息。