大數據的最底層的內容就是存儲,只有把數據存在能高效訪問的分布式系統下才能提升工作效率。小編帶大家來盤點一下這些常見的分布式文件系統:
Lustre
Lustre是一個非常安全,規模很大的分布式文件系統,最早由CFS(Cluster File System Inc.)公司研發,最后由CFS、惠普和因特爾三家公司一起與2003年推出第一版發布版,發展到現在已經非常成熟。其存儲量通常以PB起步,節點支持數也能打到萬級。但是其對設備有特殊要求。
HDFS
HDFS是Hadoop內置的分布式文件系統,之前也有過介紹。HDFS最大的優勢就是價格低廉,因此也使用極為廣泛。并且其高可靠性,高容錯性也讓使用者非常信賴。雖然HDFS的存儲級別也在PB以上,但是對于小文件過多的情況HDFS不能很好的支持。
QFS
QFS和HDFS類似,都是為了解決高效順序讀寫大量數據的問題。但是QFS在性能上優于HDFS,讀寫效率提升綜合越60%。現在QFS還比較小眾,沒有經過大量的使用測試,因此還不能用于大規模的生產環境。
GlusterFS
GlusterFS也是一個PB級別的集群文件系統,其思想是將集群內所有服務器的存儲空間匯到一個大的網絡系統上。這樣做最大的特點就是無中心,不會有單點故障。
Alluxio
Alluxio是第一個基于內存的分布式文件系統,因此其相應速度也會超出普通的分布式文件系統很多,例如HDFS就比它慢數百倍。并且Alluxio和Spark也有良好的交互。最重要的是Alluxio中國人開發的,美國服務器租用,文檔都是中文的,對于被英文文檔困擾很久的小伙伴絕對是福音。
Ceph
Ceph也是一個沒有單點故障的分布式文件系統,Ceph的每個節點上都有一小部分資源用于計算節點的數據信息,從而非常優秀的實現負載均衡。
PVFS
PVFS是一個并行虛擬文件系統,服務器租用 免備案服務器,他能很好的支持linux上的原聲命令和工具,例如rm、dd、cat等。但是PSFS是單管理節點的,因此存在單點故障,并且在啟動后無法靈活的修改。