欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

歡迎來(lái)到云服務(wù)器

大數(shù)據(jù)資訊

為什么你的大數(shù)據(jù)項(xiàng)目瞬間就”涼”了?

企業(yè)正努力在產(chǎn)品中部署大數(shù)據(jù),這一點(diǎn)是毋庸置疑的。但是,歐洲服務(wù)器租用 云服務(wù)器,根據(jù)Gartner在2016年下半年發(fā)布的新聞稿:只有15%的企業(yè)將其大數(shù)據(jù)項(xiàng)目部署到生產(chǎn)中。“Gartner在選詞時(shí)非常謹(jǐn)慎,這并不意味著剩下的企業(yè)沒(méi)有實(shí)踐,或者數(shù)據(jù)科學(xué)家沒(méi)有發(fā)現(xiàn)使用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),只是剩下的85%的項(xiàng)目并沒(méi)有真正投入生產(chǎn)。

為什么你的大數(shù)據(jù)項(xiàng)目瞬間就”涼”了?

問(wèn)題不在于缺少大數(shù)據(jù)分析或者是大量的數(shù)據(jù)科學(xué)實(shí)驗(yàn)。真正的挑戰(zhàn)是缺乏大數(shù)據(jù)自動(dòng)化能力,以便將實(shí)驗(yàn)版本從沙箱推入功能齊全的生產(chǎn)環(huán)境中。

大多數(shù)人認(rèn)為分析生產(chǎn)就是調(diào)整集群。當(dāng)然,可以編寫(xiě)一個(gè)sqoop腳本并將表格放入一次。但是,在不影響源系統(tǒng)的情況下多次實(shí)現(xiàn)則是一個(gè)挑戰(zhàn)。然后,必須確保構(gòu)建的數(shù)據(jù)管道在由服務(wù)級(jí)別協(xié)議(SLA)設(shè)置的時(shí)間范圍內(nèi)提供數(shù)據(jù)。此外,數(shù)據(jù)模型需要針對(duì)用戶當(dāng)前正在使用的工具(如Tableau,Qlik等)進(jìn)行優(yōu)化,以達(dá)到用戶所期望的響應(yīng)能力。

在Hadoop和Spark之上使用工具進(jìn)行大量的努力和改進(jìn)以對(duì)大型數(shù)據(jù)集進(jìn)行快速原型設(shè)計(jì)。但原型是一回事,創(chuàng)建每天運(yùn)行而不發(fā)生故障的數(shù)據(jù)工作流程,或者在數(shù)據(jù)流作業(yè)失敗時(shí)自動(dòng)啟用恢復(fù),又是另外一回事。

本文作者分析了五大大數(shù)據(jù)項(xiàng)目夭折最常見(jiàn)的技術(shù)原因:

1、無(wú)法快速加載數(shù)據(jù)以滿足SLA

雖然像sqoop這樣的工具支持數(shù)據(jù)讀取的并行化以從傳統(tǒng)數(shù)據(jù)源獲取數(shù)據(jù)數(shù)據(jù)湖,但需要專(zhuān)家來(lái)使其正常工作。如何劃分數(shù)據(jù)?要運(yùn)行多少個(gè)容器等問(wèn)題都需要專(zhuān)家給出合適的解決方案。如果無(wú)法正確處理并行數(shù)據(jù)的讀取,則一個(gè)小時(shí)就可完成的任務(wù)甚至需要10到20倍的時(shí)間,因?yàn)榇蠖鄶?shù)人不知道如何正確調(diào)整。

2、不能逐步加載數(shù)據(jù)以滿足SLA

大多數(shù)企業(yè)并未將整個(gè)操作轉(zhuǎn)移到大數(shù)據(jù)環(huán)境中。他們從現(xiàn)有的操作系統(tǒng)移動(dòng)數(shù)據(jù)以執(zhí)行新的分析或機(jī)器學(xué)習(xí),這意味著需要在新數(shù)據(jù)到達(dá)時(shí)繼續(xù)加載。問(wèn)題是這些環(huán)境不支持添加,刪除或插入的概念,這意味著必須重新加載整個(gè)數(shù)據(jù)集(請(qǐng)參閱上面的第1點(diǎn)),否則必須圍繞一次更改捕獲問(wèn)題編寫(xiě)代碼。

3、不能以交互方式提供對(duì)數(shù)據(jù)報(bào)告的訪問(wèn)權(quán)限

想象一下,如果有1000位商業(yè)智能分析師,他們都不想使用您的數(shù)據(jù)模型,因?yàn)樗麄冃枰荛L(zhǎng)時(shí)間才能查詢。這是Hadoop的一個(gè)經(jīng)典問(wèn)題,也是許多公司僅使用Hadoop進(jìn)行預(yù)處理和應(yīng)用特定機(jī)器學(xué)習(xí)算法,但隨后將最終數(shù)據(jù)集移回傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)以供BI工具使用的原因。無(wú)論如何,美國(guó)服務(wù)器租用,這個(gè)過(guò)程又為成功完成大數(shù)據(jù)項(xiàng)目增加了難度。

4、不能從測(cè)試遷移到生產(chǎn)

許多企業(yè)能夠確定沙箱環(huán)境中數(shù)據(jù)科學(xué)家的新見(jiàn)解的潛力。一旦他們確定采納新的分析方法,就需要從沙盒轉(zhuǎn)移到生產(chǎn)環(huán)境。從開(kāi)發(fā)轉(zhuǎn)移到生產(chǎn)是一個(gè)完整的升降和換擋操作,通常是手動(dòng)完成的。雖然它在開(kāi)發(fā)集群上運(yùn)行良好,但現(xiàn)在相同的數(shù)據(jù)管道必須在生產(chǎn)集群上重新優(yōu)化。這種調(diào)整往往需要大量的返工才能有效執(zhí)行。如果開(kāi)發(fā)環(huán)境與生產(chǎn)環(huán)境有任何不同,則情況尤其復(fù)雜。

5、不能管理端到端的生產(chǎn)工作量

大多數(shù)企業(yè)都將注意力集中在工具上,因此他們的數(shù)據(jù)分析師和科學(xué)家可以更輕松地識(shí)別新的方法。但是,他們沒(méi)有投資類(lèi)似的工具來(lái)運(yùn)行生產(chǎn)環(huán)境中的數(shù)據(jù)工作流程,因此不得不擔(dān)心啟動(dòng)、暫停和重新啟動(dòng)過(guò)程,還必須擔(dān)心確保作業(yè)的容錯(cuò)性,處理通知以及協(xié)調(diào)多個(gè)工作流以避免“沖突”。

因?yàn)樯鲜鑫宕蠹夹g(shù)原因,導(dǎo)致很多大數(shù)據(jù)項(xiàng)目并沒(méi)有如期與我們見(jiàn)面。

騰訊云代理

Copyright © 2003-2021 MFISP.COM. 國(guó)外vps服務(wù)器租用 夢(mèng)飛云服務(wù)器租用 版權(quán)所有 ? 粵ICP備11019662號(hào)

主站蜘蛛池模板: 昔阳县| 上虞市| 佛教| 拜城县| 根河市| 扬州市| 蒲江县| 绩溪县| 天镇县| 定西市| 武冈市| 盖州市| 边坝县| 富裕县| 庆云县| 景洪市| 二连浩特市| 崇明县| 新余市| 蕲春县| 田东县| 察隅县| 恭城| 房产| 平谷区| 广西| 长白| 乐至县| 新兴县| 乐业县| 济南市| 绩溪县| 长白| 桂阳县| 稻城县| 资溪县| 运城市| 桃源县| 安达市| 玉门市| 临桂县|