一些客戶認為大數據從根本上與云息息相關。事實上,大數據通常作為云的殺手級應用程序出售。大數據領域顯然非常龐大,包括驚人的計算速度和海量信息。公共云平臺提供了巨大的資源靈活性,這使得處理如此海量的信息變得高效且經濟。雖然一般公共云在涉及大數據的地方有幾個積極的優勢,但不能打折像專用服務器集群這樣的裸機基礎設施。
什么構建了一個好的大數據平臺?
當然是可衡量性。然而,這不是唯一的必要。經濟的大數據處理依賴于快速處理大量信息的靈活性。如果大數據應用程序受到“緩慢的輸入/輸出”的瓶頸,那么它們將無法以理想的方式完成所需的任務。更準確地說,大數據應用程序應該準備好訪問物理服務器將提供的所有設施。
減少替代應用程序(包括虛擬機管理程序和各種來賓操作系統)的開銷有助于最大限度地減少基礎設施投資,而基礎設施投資幾乎是高效大數據處理所必需的。為此,Spark 和 Hadoop 等應用程序可以使用提供給它們的所有處理能力和專用內存,從而減少開銷。
裸機服務器方法是應對大數據挑戰的答案,大數據需要頻繁導入大量信息、應用插入和對信息進行各種更新,并執行快速分析并近乎即時地導出結果,例如檢查可行性跨社交網絡平臺或大型電子商務網站的任務。簡而言之,裸機服務器在依賴大量輸入或輸出的大數據活動中大放異彩。
當然,在測量數據輸入/輸出速率的任何地方,現代云平臺都不會懈怠。他們會將信息從一個空間快速傳輸到另一個空間,但即使在這種情況下,由于專用硬件,使用裸機服務器框架實現的速度似乎更快。
裸機勝過云——尤其是對于大數據
更清楚地說,我并不是說云是分析和處理大數據工作負載的糟糕選擇。通用公共云將為大數據分析帶來的可衡量優勢有很多值得贊賞的地方。但是,我確實認為,一旦組織開始考慮為各種大數據應用程序部署 Bare Metal Server 框架,各種公共云托管平臺將不會是唯一的選擇。
企業應該考慮每個用例的相對好處。您的特定應用程序是否會從公共云中獲益,或者從專用裸機服務器的更低延遲和更高服務器效率中獲益?
值得一提的是,現代Bare Metal 或專用服務器集群平臺雖然不像云平臺那樣具有彈性,但通常被設計為可以快速擴展或縮減。如果企業需要維持長期的大數據應用,部署專用裸機服務器作為主要硬件將是一種有效的策略。