(1) CDH對Hadoop版本的劃分非常清晰,只有兩個系列的版本,分別是CDH3和CDH4,分別對應Hadoop 1.0和Hadoop 2.0。相比而言,Apache版本則混亂得多。
? ? ?
? (2) CDH比Apache在兼容性,安全性,穩定性上有增強。
? ? ?
? (3) CDH3版本是基于Apache ?Hadoop ?0.20.2改進的,并融入了最新的patch,CDH4版本是基于Apache Hadoop 2.X改進的,CDH總是并應用了最新Bug修復或者Feature的Patch,并比Apache hadoop同功能版本提早發布,更新速度比Apache官方快。
? ??
? ? ?(4)CDH支持Kerberos安全認證,Apache則使用簡陋的用戶名匹配認證.
? ??
? ? ?(5) CDH文檔清晰,很多采用Apache版本的用戶都會閱讀CDH提供的文檔,包括安裝文檔、升級文檔等。
? ??
? ? ?(6) CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四種方式安裝,Apache 只支持Tar包安裝。
?
注:CDH使用推薦的Yum/Apt包安裝時,有以下幾個好處:
1、聯網安裝、升級,非常方便
2、自動下載依賴軟件包
3、Hadoop生態系統包自動匹配,不需要你尋找與當前Hadoop匹配的Hbase,Flume,Hive等軟件,Yum/Apt會根據當前安裝Hadoop版本自動尋找匹配版本的軟件包,并保證兼容性。
4、自動創建相關目錄并軟鏈到合適的地方(如conf和logs等目錄);自動創建hdfs, mapred用戶,hdfs用戶是HDFS的最高權限用戶,mapred用戶則負責mapreduce執行過程中相關目錄的權限。