如今,開源分析已牢固地成為企業軟件堆棧的一部分,“大數據”一詞似乎已經過時,并且Hadoop已成為死法已成為人們公認的民間傳說。不過,這太夸張了;盡管Hadoop不再炙手可熱,但它仍然是一個重要因素。那是因為它定義了一個附屬項目的生態系統,該項目支持數據庫,免備案服務器,數據湖,流數據和數據工程功能。這就是為什么基于Hadoop的云服務(如Amazon的EMR和Google Cloud的Dataproc)仍然至關重要且有用的原因。
微軟的云Hadoop服務Azure HDInsight是Hadoop實用程序的一個很好的例子,因為即使Microsoft推出了其他與之競爭的產品,該服務仍然存在。例如,微軟與由Apache Spark的創建者創立的Databricks合作,美國站群服務器,提供并直接支持該公司同名服務的版本。此外,Microsoft將其Azure SQL數據倉庫服務演化為Azure Synapse Analytics(Azure Synapse Analytics),該服務現在提供按需Spark池以支持完整的數據湖功能,作為公共預覽功能。但是,HDInsight是微軟于2013年首次推出的Hadoop服務,目前仍在發展。