人腦平均消耗不到 20W 的功率,并擁有超過 2 PB 的存儲空間。如果我們能制造那么大的計算機,它就需要像太陽一樣大的電源。即使是超級計算機也會散發出大量的熱量并消耗同樣多的電量,而提供給您家中的標準 220V 電??源根本不足以運行高端計算機。如果連接了像超級計算機這樣大而強大的東西,我們家里的電表會因為過熱而燒毀,這些電表會測量我們在一個賬單周期中使用了多少能源。
在家工作的開發人員和數據分析師,尤其是處理大數據的人員,依賴于遠程桌面或云計算,因為運行兼容計算機所需的功能并非隨處可用。簡而言之,云計算在機器學習和云計算中的作用與大數據一樣大。讓我們看看如何
它提供了強大的平臺來得出有意義的結論
我們的大腦經過訓練可以毫不費力地理解和理解我們周圍發生的事情。這是因為人類擁有高度發達和復雜的大腦。另一方面,計算機離我們還差得很遠,而且至少在接下來的五十年左右也不會。我們天生就有從一兩次事件中吸取教訓的能力,而即使是最平凡的任務,計算機也需要接受一千種可能性的訓練。
大數據涉及從看似隨機的一組數據集中得出結論。這些數據通常是無序的、雜亂無章的,需要在您推斷出任何內容之前進行過濾。考慮到您通常使用的數據量,應用程序通常會轉移到更強大的計算平臺,通常是云。將您的應用程序遷移到云端還會帶來一些額外的優勢。首先,可以從任何計算機處理信息,無論它是否滿足兼容性要求。其次,您的數據集可以被遠程監控和使用,即您不再需要堅持使用一個系統來完成您的工作。
它使您當前的系統負載為零
由于整個大數據都托管在云中,您的系統本身幾乎沒有作用。盡管擁有先進的高端系統總能帶來更好的應用程序性能,但中端計算機同樣可以正常工作,因為工作負載完全在云端。這意味著您可以使用更實惠的中檔筆記本電腦和計算機來處理大數據,而無需進行極其昂貴的配置。
云計算促進共享與協作
大數據分析師很少單獨工作。事實上,在更大的組織中,可能有超過 20-30 人一起處理同一個數據集。在傳統的設置中,個人在本地而不是云上工作,在得出任何有意義的結論之前,必須將查詢匯集在一起??。這是因為每個成員都有他/他自己的數據可以使用,并且對一個數據庫所做的更改不會反映在任何其他數據上,直到有人對所有數據實例手動完成相同的操作。相反,在云中,每個成員都可以處理父數據本身(或它的云備份),更改幾乎立即反映在原始數據庫上。
結果
大數據是人工智能和機器學習的重要佐料,沒有大數據的手段,人工智能只能是紙上談兵。大數據本身可能是一門很難掌握的藝術,但更棘手的是建立正確的平臺和生態系統,以處理回歸、矩陣代數和其他有助于從數據中獲得洞察力的排序技術。