第三方發(fā)行版(如:CDH,HDP等)
1)優(yōu)點:
i)基于Apache協(xié)議,100%開源。
ii)版本管理簡單清晰:像Cloudera的CDH4.1.0 patch level 923.142,表示在原生態(tài)Apache Hadoop 0.20.2基礎(chǔ)上添加了1065個patch。
iii)兼容性、安全性、穩(wěn)定性強:第三方發(fā)行版通常基于穩(wěn)定版的Apache Hadoop,并應(yīng)用最新的補丁。同時,這些版本都經(jīng)過了大量的測試驗證,有眾多的實際部署,且大量部署于各種生產(chǎn)環(huán)境,因此,比原生態(tài)Apache Hadoop擁有更好的兼容性、安全性和穩(wěn)定性。
iv)版本更新快:例如:通常,CDH每季度會發(fā)布一個update,每年會發(fā)布一個release。
v)提供部署、安裝和配置工具:第三方發(fā)行版會提供方便易用的安裝部署和管理工具,這將不但大大提高集群部署的效率,同時后期管理和維護(hù)也會非常方便和高效。
2)缺點:
i)因為有些第三方版本會收費,這將會提高開發(fā)和運營成本。
ii)后期管理和運維都會涉及廠商鎖定問題。
三、第三方發(fā)行版間比較
1.Cloudera:目前發(fā)布最成熟的發(fā)行版本,擁有最多的部署案例,提供簡單、易用、方便、強大的部署、管理和運維工具,同時,Cloudera公司還開發(fā)并貢獻(xiàn)了可實時處理大數(shù)據(jù)的Impala項目。
2.Hortonworks:為使用100%開源Apache Hadoop的唯一提供商,Hortonworks首次使用Apache HCatalog的元數(shù)據(jù)服務(wù)特性,同時,其Stinger開創(chuàng)性、極大程度的優(yōu)化了Hive項目。Hortonworks為使用者提供了一個友好、方便、易用、入門級的的沙盒工具。Hortonworks開發(fā)了很多hadoop增強特性并提交至核心主干,從而使得Apache Hadoop在Windows Server和Windows Azure等在內(nèi)的Microsft Windows平臺上平穩(wěn)高效的運行。