欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

歡迎來到云服務器

大數據資訊

解疑:Hadoop+數據倉庫到底是夢幻組合還是命中的宿敵?

想一想數據管理世界中的那個偉大的存在–數據倉庫吧。在過去的二十年中,盡管其他的系統和軟件在許許多多的迭代、變革中演進,甚至完全被新模型所拋棄,數據倉庫這個老骨干卻安然屹立。她可能會偷偷地給自己的面頰,皺紋整容,也可能會激起一些不那么令人深刻的模仿,但是沒有什么能長期的吸引她的注意力。

直到現在。自從Hadoop出現在舞臺上之后,一直有人嘀咕說,這個閃亮的新星正在為一些最好的數據管理角色提供服務–這些角色就是,在幾年前,數據倉庫已穩操勝券。

但是現在真的到了數據倉庫要退休的時候了嗎 Hadoop甚至想要進入她的鞋子里嗎 還有誰在后面等著呢 

讓我們仔細看看這些據報道的競爭對手的全部本領。

數據倉庫持久吸引力的背后是什么 

簡單地說,數據倉庫意味著將不同來源的數據聚合為一個用于報告和分析的中央存儲庫。它長期成為實際解決方案的原因如下:因為這些數據是被聚合的,在經歷抽取,轉換,加載過程后,協調成為“真理的唯一版本”,緩和矛盾,重構數據格式化的方式,從而適應預定的模式。

結果是一個完整的、可靠的,馬來西亞主機 日本服務器,一致的數據來源,這些數據可用于商業智能軟件查詢。

Hadoop究竟是什么 

對于需要處理海量數據集的用戶來說,這是一個開源的編程框架。使用分布式存儲系統,它給用戶一種存儲、清理和處理大量數據的方法。

為了使數據達到千兆兆字節的傳輸速度,Hadoop分布式文件系統(HDFS)沿著成千上萬的硬件節點讀取數據。即使許多節點由于技術故障而停止工作,系統仍能保持正常運行。這意味著存在低風險的數據丟失–對于那些使用大量數據進行非常復雜的分析的企業來說,這是一種真正的恐懼。

難怪Hadoop正在轉向一個尋求可靠的方法來運行大數據處理任務的行業。

另外,它是開源的–這是一個巨大的吸引力。它具有無限的可伸縮性和無限的可定制性。包含定制應用程序、查詢和方法的范圍是無限的。數據挖掘的復雜性可以隨著數據的復雜性和數據的數量而增長。

它哪里比數據倉庫更出色 

大數據正變得越來越大,許多大型數據倉庫都試圖采取定制的多處理器設備來應對不斷飆升的存儲需求。但是除了最大的組織外,所有這些都需要付費。

與此同時,Hadoop可以靈活地處理滾雪球般的數據。然后用戶可以將它與數據倉庫層或頂部構建的服務相結合,無論是像Presto的SQL軟件,或者用相似方式工作的Hive,或者像HBase類的NoSQL。

但這并不意味著Hadoop將取關系型數據庫或者數據倉庫。事實上,我們馬上就會看到,這很可能是最好的支持,而不是取代。

那么他們是競爭對手嗎 

完全不是。簡單地說,他們沒有扮演相同的角色。

數據專家趨向于把Hadoop看作現有數據倉庫架構的一個補充,并且可以為他們節省大量現金。通過把數據塊遷移到Hadoop,可以減少關系型數據庫的壓力,從而使數據倉庫平臺更便宜,并且可以在不增加語速那的情況下進行擴展。

用這種方式,Hadoop可以降低數據倉庫的總成本,而不是取代它的某些東西。

它如何使數據倉庫的性能更好 

數據倉庫的構建成本很高,德國機房主機 波蘭服務器,運行成本和增長成本昂貴。隨著收集的數據量的增長,存儲需求和花費也會呈指數級增長。

此外,這些龐大的數據集合意味著用戶每次運行查詢的時候,不能進入數據倉庫的全部范圍–而且他們的硬件也無法處理這個問題。這意味著使用分析數據集來給業務中的各個部門訪問數據倉庫特定區域的數據。

它是一個不完美的系統。不僅限制了用戶在數據上執行分析的范圍,也是一個定時炸彈。

隨著越來越多的數據涌入倉庫,每個數據集都可能變得如此不堪重負,以致難以使用。你可以通過限制訪問來減輕硬件壓力,但是那意味著給各個部門越來越窄的數據分析選擇。對于嚴格的商業智能來說,這樣的做法并不夠好。

Hadoop并沒有遭受這些挫折。進入門檻很低,而且對增量投資是開源的。它可以隨著時間的推移而建立起來,你可以不斷增大數據量而不需要花大量的成本來匹配。

對于那些剛剛進入數據行業的公司--沒有對大型機或者基于Unix的數據倉庫的投資–這種可擴展的、增量式的框架是非常吸引人的。但是Hadop是一個框架,而不是一個完美的解決方案。它在處理巨大數據集方面很出色,但是它從來沒有打算要替代數據倉庫。

那么Hadoop和數據倉庫是最終的BI夢想團隊嗎 

哇哦,請等一下。使用Hadoop與數據倉庫處理了數據存儲問題。但是存儲數據只是商業智能的一個要素。

廣義上說,一個功能性的、可用的BI系統應該由五個部分組成:

在某個地方幾種存儲數據。

劃分這些數據的工具,如:地理,操作或者其他業務需要的工具。

為數據分析準備工具。

幫助您快速處理此數據的ETL數據引擎。

顯示所有這些數據的前端(通常是某種儀表盤)。

騰訊云代理

Copyright © 2003-2021 MFISP.COM. 國外vps服務器租用 夢飛云服務器租用 版權所有 ? 粵ICP備11019662號

主站蜘蛛池模板: 南澳县| 湄潭县| 岳普湖县| 年辖:市辖区| 醴陵市| 喜德县| 湘潭县| 虹口区| 秀山| 德钦县| 临海市| 六盘水市| 秭归县| 元朗区| 湖南省| 花莲县| 舞钢市| 荥经县| 岐山县| 锡林浩特市| 迭部县| 温泉县| 盘锦市| 永泰县| 秭归县| 荥阳市| 新密市| 安丘市| 建平县| 定兴县| 沙雅县| 关岭| 乐都县| 罗甸县| 商水县| 乌拉特中旗| 康保县| 富宁县| 仁化县| 崇文区| 英德市|