大數據的呈現帶來了很多新的術語,但這些術語往往較量難以領略。因此,我們通過本文給出一個常用的大數據術語表,拋磚引玉,供各人深入相識。個中部門界說參考了相應的博客文章。雖然,這份術語表并沒有100%包括所有的術語,假如你認為有任何漏掉之處,請奉告我們。
A
聚合(Aggregation) – 搜索、歸并、顯示數據的進程
算法(Algorithms) – 可以完成某種數據闡明的數學公式
闡明法(Analytics) – 用于發明數據的內涵涵義
異常檢測(Anomaly detection) – 在數據會合搜索與預期模式或行為不匹配的數據項。除了“Anomalies”,用來暗示異常的詞有以下幾種:outliers, exceptions, surprises, contaminants.他們凡是可提供要害的可執行信息
匿名化(Anonymization) – 使數據匿名,即移除所有與小我私家隱私相關的數據
應用(Application) – 實現某種特定成果的計較機軟件
人工智能(Artificial Intelligence) – 研發智能呆板和智能軟件,這些智能設備可以或許感知方圓的情況,并按照要求作出相應的回響,甚至能自我進修
B
行為闡明法(Behavioural Analytics) – 這種闡明法是按照用戶的行為如“怎么做”,“為什么這么做”,以及“做了什么”來得出結論,而不是僅僅針對人物和時間的一門闡明學科,它著眼于數據中的人性化模式
大數據科學家(Big Data Scientist) – 可以或許設計大數據算法使得大數據變得有用的人
大數據創業公司(Big data startup) – 指研發最新大數據技能的新興公司
生物測定術(Biometrics) – 按照小我私家的特征舉辦身份識別
B字節 (BB: Brontobytes) – 約便是1000 YB(Yottabytes),相當于將來數字化宇宙的巨細。1 B字節包括了27個0!
貿易智能(Business Intelligence) – 是一系列理論、要領學和進程,使得數據更容易被領略
C
分類闡明(Classification analysis) – 從數據中得到重要的相關性信息的系統化進程; 這類數據也被稱為元數據(meta data),是描寫數據的數據
云計較(Cloud computing) – 構建在網絡上的漫衍式計較系統,數據是存儲于機房外的(即云端)
聚類闡明(Clustering analysis) – 它是將相似的工具聚合在一起,每類相似的工具組合成一個聚類(也叫作簇)的進程。這種闡明要領的目標在于闡明數據間的差別和相似性
冷數據存儲(Cold data storage) – 在低功耗處事器上存儲那些險些不被利用的舊數據。但這些數據檢索起來將會很耗時
比擬闡明(Comparative analysis) – 在很是大的數據會合舉辦模式匹配時,舉辦一步步的比擬和計較進程獲得闡明功效
巨大布局的數據(Complex structured data) – 由兩個或多個巨大而彼此關聯部門構成的數據,這類數據不能簡樸地由布局化查詢語言或東西(SQL)理會
計較機發生的數據(Computer generated data) – 如日志文件這類由計較機生成的數據
并發(Concurrency) – 同時執行多個任務或運行多個歷程
相關性闡明(Correlation analysis) – 是一種數據闡明要領,用于闡明變量之間是否存在正相關,可能負相關
客戶干系打點(CRM: Customer Relationship Management) – 用于打點銷售、業務進程的一種技能,大數據將影響公司的客戶干系打點的計策
D
儀表板(Dashboard) – 利用算法闡明數據,并將功效用圖表方法顯示于儀表板中
數據聚合東西(Data aggregation tools) – 將分手于眾大都據源的數據轉化成一個全新數據源的進程
數據闡明師(Data analyst) – 從事數據闡明、建模、清理、處理懲罰的專業人員
數據庫(Database) – 一個以某種特定的技能來存儲數據薈萃的客棧
數據庫即處事(Database-as-a-Service) – 陳設在云端的數據庫,即用即付,譬喻亞馬遜云處事(AWS: Amazon Web Services)
數據庫打點系統(DBMS: Database Management System) – 收集、存儲數據,并提供數據的會見
數據中心(Data centre) – 一個實體所在,安排了用來存儲數據的處事器
數據清洗(Data cleansing) – 對數據舉辦從頭審查和校驗的進程,目標在于刪除反復信息、更正存在的錯誤,并提供數據一致性
數據打點員(Data custodian) – 認真維護數據存儲所需技能情況的專業技能人員
數據道德準則(Data ethical guidelines) – 這些準則有助于組織機構使其數據透明化,擔保數據的簡捷、安詳及隱私
數據訂閱(Data feed) – 一種數據流,東亞服務器 臺灣服務器,譬喻Twitter訂閱和RSS
數據集市(Data marketplace) – 舉辦數據集交易的在線生意業務場合
數據挖掘(Data mining) – 從數據會合掘客特定模式或信息的進程
數據建模(Data modelling) – 利用數據建模技能來闡明數據工具,以此洞悉數據的內涵涵義
數據集(Data set) – 大量數據的薈萃