數據挖掘涉及“處理數據和識別信息中的模式和趨勢”,根據IBM所說,directadmin安裝,“數據挖掘原理已經存在了許多年,但是隨著大數據的出現,它更為流行了。”
IBM估計,僅過去的兩年就產生了世界上百分之九十的數據。每天人們產生2.5兆字節的數據,足以填滿1000萬個藍光光盤。
數據挖掘技術幫助專業人員了解可用數據集。這些技術可以為企業和其他組織提供描述性和預測性的能力。
01關聯規則
關聯規則使兩個或多個項之間的關聯以確定它們之間的模式。例如,超市可以確定顧客在買草莓時也常買鮮奶油,反之亦然。關聯通常用于銷售點系統,以確定產品之間的共同趨勢。
“這是一個非常簡單的方法,但你會驚訝與其中有多少智慧和洞察,它可以提供許多企業的日常使用的信息,域名購買 directadmin購買,來提高效率和增加收入,根據科技公司Galvanize的說法。應用領域包括物品的實物擺放組織、市場營銷和產品的交叉銷售和上銷。
02分類
我們可以使用多個屬性來標記特定類別的項。分類將項目分配到目標類別或類中,以便準確地預測該類內部會發生什么。
某些行業會將客戶進行分類。例如,一家信貸公司可以使用分類模型來確定貸款申請人的低、中或高信用風險。其他組織將當前和目標受眾分為不同年齡和社會團體進行營銷活動。
03聚類
“聚類是將數據記錄組合在一起的方法”根據Alex Berson、Stephen Smith和Kurt Thearling在Building Data Mining Applications for CRM這本書中所說。“通常這樣做是為了讓最終用戶對數據庫中發生的事情有一個高層次的認識。”
查看對象分組情況可以幫助市場細分領域的企業。在這個例子中可以使用聚類將市場細分為客戶子集。然后,每個子集可以根據簇的屬性來制定特定的營銷策略,例如在一個簇中與另一個簇中的客戶的購買模式的對比。
04決策樹
決策樹用于分類或預測數據。決策樹從一個簡單的問題開始,它有兩個或多個的答案。每個答案將會引出進一步的問題,該問題又可被用于分類或識別可被進一步分類的數據,或者可以基于每個答案進行預測。
應用決策樹圖分析手機供應商如何分類流失的客戶,或不更新手機的客戶。Building Data Mining Applications for CRM的作者為決策樹圖的構建提供了一些有趣的值得借鑒的東西。
將數據分成多個葉結點,所有葉結點的數據記錄數的加和等于輸入數據的記錄總數。例如,父結點中的數據記錄總數等于其兩個子結點中包含的記錄總和。
當在決策樹上上下移動時,流失前和流失后的客戶數量是需要存儲的。
能夠很容易的理解模型的構建。
如果你需要針對可能流失的客戶提供一份市場營銷方案,則該模型非常易于使用。
公司可以發展對其客戶群的直覺;例如,可以得出這樣的結論,那些多年一直在供應商身邊客戶和擁有手機的客戶往往是忠誠的。
05序列模式
序列模式識別相似事件的趨勢或通常情況發生的可能。這種數據挖掘技術經常被用來助于理解用戶購買行為。許多零售商通過數據和序列模式來決定他們用于展示的產品。
“根據客戶數據,您可以識別客戶在一年中不同時間購買的特定的商品集合,”根據IBM所說,“在購物籃應用中,你可以使用這些信息自動地根據瀏覽頻率和過去的購買歷史記錄來預測某些商品會被添加到購物籃中。”