欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

歡迎來到云服務器

云資訊

云數據倉庫是什么樣子的?

當數據倉庫可以處理非結構化數據,而數據湖可以運行分析時,組織如何決定使用哪種方法?這取決于其需要采用數據回答新問題的頻率。

傳統上,數據倉庫收集來自組織業務的所有結構化數據,因此組織可以將其集成到單個數據模型中,運行分析并獲取商業智能,無論是用于開發新產品還是向客戶營銷現有服務。這曾經被稱為“大數據”,但現在所有組織都擁有來自電子商務網站、物聯網設備和傳感器等來源的大量數據,因此現代數據倉庫需要處理結構化、非結構化和流媒體數據,并提供實時數據分析以及商業智能和報告。  

越來越多的組織在云中實現這一目標,以實現更高的速度和更低的成本。微軟Azure公司副總裁Julia White指出,越來越多的數據可能已經存在于云中,以及組織想要使用這些數據的服務。White說,“隨著數據越來越多地遷移到云端,無論是來自SaaS應用程序還是只遷移到云端的應用程序;運營數據就在云端,客戶在詢問‘為什么我要將運營數據從云端遷回到內部部署數據中心進行分析?它沒有意義。’”他指出,盡管組織內部仍然有大量的數據,而且隨著邊緣計算的發展,還會有更多的數據,但許多客戶還是會將部分或全部數據轉移到云平臺上,這取決于法規遵從性問題。  

White指出,“每個企業都在研究人工智能。他們很快意識到分析是其基礎,他們開始問‘我的分析和我的數據倉庫的狀態是什么?’,而且往往不夠好。”   Power BI的普及也推動了更多的微軟客戶進行云計算分析。White說,“當他們有了這些強大的數據可視化功能后,他們開始質疑自己的分析能力——‘我想知道數據可視化背后發生了什么:我喜歡Power BI,我希望我的分析更有趣。”  

更復雜的客戶希望分析他們自己的Office Graph數據(組織可以使用Azure Data Factory將其復制到Azure Data Lake)或利用Microsoft、Adobe和SAP(基于Azure Data構建的)之間的開放數據計劃(ODI)數據湖并將最終整合來自更多軟件供應商的數據。White說,“Azure Data Lake與Azure數據倉庫緊密結合,客戶正在使用Azure數據倉庫獲取更多見解,并在其上構建現代數據倉庫。”  

采用哪種數據服務?   微軟公司擁有一系列看起來有點像數據倉庫的云計算服務,最明顯的是Azure SQL數據倉庫或微軟經常稱之為的“DW”,但也有Azure數據工廠、Azure數據湖、Azure數據庫、Power BI和Azure機器學習,以及更多打包服務,如Dynamics 365中的人工智能銷售工具。  

理解它們的方法不僅僅是關注它們提供的工具,還要關注它們所服務的用戶以及它們如何協同工作。這是因為企業通常擁有的數據在多個數據存儲中分散,創建現代數據倉庫的第一步是整合所有這些孤島。微軟Azure上的這些不同數據存儲越多,連接就越容易——這也是微軟Azure提供如此多不同數據服務的原因之一。White表示,“另一方面,客戶并不是在尋找可以做任何事情的單一工具,有一系列細微差別的選擇,如果真的要挑選,并優化自己的場景使用的工具。”   Azure DW適用于處理策劃數據的數據工程師。這可能是來自SQL Server數據庫的數據,但它也可能是來自這些數據工程師使用Databricks或Spark和.NET從Azure HDInsight等源準備數據的管道構建的數據。  

Azure數據工廠是數據工程師進行數據ETL(提取、轉換、加載)的另一項服務。組織可以將其視為云計算層級ETL工具,國內服務器租用服務器托管,組織可以通過拖放界面(實際上是Logic Apps)或使用Python、Java或.NET SDK(如果組織更喜歡編寫代碼來執行)來使用數據轉換和管理數據管道的不同步驟,通過Databricks或HDInsight、Azure Data Lake或Power BI。  

Power BI還可以使用Dataflows(也是免代碼)進行數據轉換,但這是為業務分析師提供的自助服務功能。數據工程師或全職商業智能分析師可能會使業務用戶使用這些語義模型,而微軟公司正在將更多與Azure DW的集成添加到Power BI中。  

Power BI用戶可以在其可視化和報告中添加人工智能。其中一些可能是使用微軟公司預先構建的認知服務來進行圖像識別和情感分析。但他們也可能正在使用數據工程師在Azure機器學習服務中為他們構建的自定義人工智能模型,并使用所有企業數據。  

現代數據倉庫匯集了任何規模的數據,通過分析儀表板、運營報告或高級分析提供洞察力。  

數據湖附近的倉庫   這些場景的復雜性就是數據倉庫和數據湖之間的界限開始在云中看起來有些混亂的原因。傳統的數據倉庫允許企業從多個來源獲取數據,并使用ETL轉換將該數據放入單個模式和單個數據模型中,該軟件旨在回答組織計劃一遍又一遍地提出的問題。  

騰訊云代理

Copyright © 2003-2021 MFISP.COM. 國外vps服務器租用 夢飛云服務器租用 版權所有 ? 粵ICP備11019662號

主站蜘蛛池模板: 望都县| 广昌县| 剑河县| 五河县| 东兴市| 驻马店市| 大足县| 古交市| 蒲江县| 邵阳县| 浮梁县| 新巴尔虎左旗| 凯里市| 茶陵县| 沿河| 平武县| 田东县| 武宁县| 东方市| 普陀区| 琼海市| 台东县| 桐城市| 武宁县| 资阳市| 塘沽区| 冷水江市| 玉树县| 津南区| 鹿泉市| 福海县| 高安市| 汉寿县| 金门县| 潍坊市| 房山区| 苗栗市| 砚山县| 邳州市| 大兴区| 崇州市|