過去,檔案被嚴格地認為是不經常訪問的數據的長期存儲庫——想想冷存儲——因此沒有太多考慮智能地管理這些數據。希望您的檔案就像您永遠不需要使用的保險單。
隨著云的出現及其利用率的提高,組織已經開始發現,除了通過利用云經濟實現巨大的成本節約之外,存檔數據本身還具有內在價值。為了充分利用這一價值,歸檔數據必須有組織、可訪問、可檢索和智能保留。簡而言之,一個“活動”檔案。
非結構化數據,例如辦公文檔、視頻、音頻文件、圖像、.pdf 以及任何不在數據庫中的數據,現在已成為大多數組織的命脈。長期智能地存儲這些數據不僅對于合規性和組織歷史至關重要,而且對于商業智能、分析、數據挖掘和其他目的也越來越重要。
隨著整體數據年復一年地以驚人的速度持續增長,非結構化數據以 60% 或更高的速度增長(預計在短短幾年內攀升至所有數據的 90% 或更多),對使用公共云、私有云或混合云的任意組合以及隨時移動數據的輕松能力的主動歸檔的需求一直存在。為了在多云基礎架構中最好地管理這些數據,組織需要遵守以下主動歸檔的基本租戶:
應該組織數據
非結構化數據往往是混亂的——一個典型的組織可以擁有數百萬個不一定以任何特定方式組織的文件。有些可能存儲在私有云上,有些可能存儲在公共云上。為了理解這一點,能夠根據內部和外部重要的類別對數據進行分類和標記是很有幫助的。將“機密”或“合法”視為在審計或 PII 和類似的合規性事件中檢索數據的能力的有用標志。但更重要的是,所有銷售數據、所有財務數據等都可以分類,以便快速輕松地檢索以備將來使用。
數據應該是可訪問的
您需要能夠將數據存儲在您想要的位置,并輕松獲取。這可能意味著在私有云、公共云甚至跨云中進行本地部署。我們開始看到云供應商之間的競爭越來越激烈,能夠利用不斷變化的云經濟是非常有價值的。應該支持本地和真正的多云,能夠隨意跨云目的地動態遷移數據,并且不需要管理員記住數據的位置。
數據應該是可檢索的
與分類和標記相輔相成的是全內容搜索。想象一下,能夠使用單詞、短語或其元數據快速輕松地搜索 PB 級數據和數百萬(或數十億)個文件,從而在大海撈針中找到您正在尋找的那根針,而不必知道在哪里或保存文件時(想想谷歌搜索)。這將實際上不可用的數據的黑洞打開到可用的存儲庫中。能夠在云存儲庫中定位存檔數據并輕松對其進行重新水化,使其成為活動數據集的一部分,從而充分利用了該信息的價值。
數據應該被智能保留
如果您詢問 IT 管理員的聽眾,他們在數據保留方面的公司政策是什么,他們中的絕大多數人會告訴您,他們會永遠保留所有內容。數據治理是一個巨大的話題,我們無法進入這篇文章,但可以說最佳實踐并不是永遠保留所有內容,而是智能地修剪不再需要的數據,因為法律、空間、成本,等原因。尤其是生活在多云環境中的存檔,可以幫助管理員設置策略,以智能修剪不再需要保留的數據,從而釋放空間并降低存儲成本,避免不必要的和不需要的容量費用。