行業(yè)專家稱,“藏在大量數(shù)據(jù)中的知識就是可以改變世界。”
人們目前生活在一個后現(xiàn)代世界,在這個時代,技術(shù)、數(shù)據(jù)和信息統(tǒng)治著世界。因此,人們很容易相信大數(shù)據(jù)概念是一個獨特的現(xiàn)象,從2012年開始,當(dāng)時的美國總統(tǒng)奧巴馬政府宣布了大數(shù)據(jù)研究和開發(fā)計劃。
然而,自1991年互聯(lián)網(wǎng)得到迅速發(fā)展以來,大量的數(shù)據(jù)一直存在。當(dāng)時與現(xiàn)在的根本區(qū)別是,人們解析這些數(shù)據(jù)量的能力已經(jīng)發(fā)展到現(xiàn)在可以將這些數(shù)據(jù)作為人們的業(yè)務(wù)決策過程的一部分。
大數(shù)據(jù)和數(shù)據(jù)挖掘:收集正確的數(shù)據(jù)
當(dāng)焦點首先從數(shù)據(jù)存儲轉(zhuǎn)移到大數(shù)據(jù)的價值時,很容易收集和存儲盡可能多的數(shù)據(jù),以便盡可能在將來某個時候使用該業(yè)務(wù)。
然而,這一焦點現(xiàn)在已經(jīng)從簡單的數(shù)據(jù)收集轉(zhuǎn)移到相關(guān)數(shù)據(jù)的收集;為業(yè)務(wù)增加價值的數(shù)據(jù)。只有收集大量的數(shù)據(jù)是不夠的。大規(guī)模地收集數(shù)據(jù)會給人們帶來大量數(shù)據(jù);因此,有大量的數(shù)據(jù);但這并不一定意味著擁有有價值的數(shù)據(jù)。
有用的數(shù)據(jù)不僅需要大數(shù)據(jù),還需要高質(zhì)量,實用的信息。換句話說,企業(yè)需要收集關(guān)于每個主題的數(shù)據(jù),這些數(shù)據(jù)足夠詳細(xì),以便分析工具和模型可以根據(jù)需要深入細(xì)節(jié)。
這是數(shù)據(jù)挖掘的地方。本質(zhì)上,數(shù)據(jù)挖掘是用于對大型數(shù)據(jù)集進(jìn)行排序以識別模式和關(guān)系的方法。然后將這些模式和關(guān)系用于解決問題并預(yù)測未來趨勢。
一旦原始數(shù)據(jù)被提取,轉(zhuǎn)換和加載到數(shù)據(jù)倉庫中,才執(zhí)行數(shù)據(jù)挖掘方法。
數(shù)據(jù)挖掘和機器學(xué)習(xí):構(gòu)建預(yù)測模型
WhatIs.com的Margaret Rouse將機器學(xué)習(xí)定義為“人工智能(AI)”,允許軟件應(yīng)用程序在未明確編程的情況下更準(zhǔn)確地預(yù)測結(jié)果。
其主要宗旨是基于可以查看輸入數(shù)據(jù)并使用統(tǒng)計分析來根據(jù)輸入數(shù)據(jù)預(yù)測趨勢和值的算法。機器學(xué)習(xí)模型是關(guān)于邏輯和我們做事情的方式。
推薦引擎
最簡單的機器學(xué)習(xí)模型之一是推薦引擎。然而,在我們看看推薦引擎的工作原理及其作為業(yè)務(wù)預(yù)測模型一部分的有效性之前,我們來看看什么是機器學(xué)習(xí)。
如上所述,域名注冊,推薦引擎是一種簡單的預(yù)測軟件模型,其嘗試預(yù)測用戶將給予項目的評級。推薦引擎最知名和最實用的用途之一是將其并入電子商務(wù)購物平臺。
例如,如果戶外裝備網(wǎng)站的訪問者點擊一條徒步旅行褲,推薦引擎將推薦可以與所選擇的徒步旅行褲一起佩戴的其他裝備和服裝。
推薦引擎如何知道要選擇什么?嗯,可以查看客人所看的褲子的款式,預(yù)測網(wǎng)站用戶會購買的衣服的樣式,并顯示一個徒步旅行褲相匹配。
提出的問題是,推薦引擎如何知道提供額外的服裝?答案是既簡單又復(fù)雜。從本質(zhì)上講,預(yù)測模型是合乎邏輯的;因此,它使用統(tǒng)計分析來建立用戶角色模型,包括每個訪問者對網(wǎng)站的服裝風(fēng)格和顏色的喜好。
結(jié)語
大數(shù)據(jù)(及其相關(guān)的方法)目前正在并將繼續(xù)發(fā)揮作用,在預(yù)測和預(yù)測趨勢方面發(fā)揮越來越重要的作用。因此,企業(yè)利用其決策權(quán)在消費者購買浪潮的最前沿獲得最佳機會。
,新加坡主機 免備案服務(wù)器