云計(jì)算、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈、邊緣計(jì)算……近年來(lái),科技圈雨后春筍般的涌現(xiàn)出很多新概念,而所有這些概念,都離不開(kāi)一個(gè)基本元素----數(shù)據(jù)。
馬云說(shuō)過(guò),未來(lái),數(shù)據(jù)是生產(chǎn)資料,計(jì)算是生產(chǎn)力。數(shù)字設(shè)備的爆炸式增長(zhǎng),數(shù)字科技和實(shí)體經(jīng)濟(jì)的不斷融合,使得數(shù)據(jù)總量正在發(fā)生指數(shù)級(jí)的增長(zhǎng)。IDC 預(yù)測(cè),全球數(shù)據(jù)圈(以數(shù)據(jù)圈代表每年被創(chuàng)建、采集或是復(fù)制的數(shù)據(jù)集合)將從 2018 年的 32ZB,增至 2025 年的175ZB,增幅超過(guò) 5 倍。 其中,中國(guó)數(shù)據(jù)圈到2025年將增至48.6ZB,將占全球27.8%,成為最大數(shù)據(jù)圈。
迅速膨脹的數(shù)據(jù),勢(shì)必需要越來(lái)越多的存儲(chǔ)設(shè)備來(lái)承載,用目前磁、電等為主的存儲(chǔ)解決方案,會(huì)消耗大量的電量。有預(yù)測(cè)表明,到2025年,全球數(shù)據(jù)存儲(chǔ)消耗的電量大概相當(dāng)于全球全年石油的發(fā)電總量。如果存儲(chǔ)方案不進(jìn)行改進(jìn),能耗將成為數(shù)據(jù)爆炸時(shí)代的“頭號(hào)敵人”。
數(shù)據(jù)也有“熱冷”之分
我們?cè)谑褂秒娔X、手機(jī)中,一定會(huì)有這樣的感受:有些數(shù)據(jù)屬于頻繁訪問(wèn)型,比如辦公文檔、剛拍的視頻、照片,有些數(shù)據(jù)屬于存檔、備份型,可能幾個(gè)月、甚至幾年才訪問(wèn)一次,但卻不能隨意刪除,靜靜的躺在那里,占據(jù)著你寶貴的硬盤(pán)空間。
對(duì)于數(shù)據(jù)中心更是如此,數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)的同時(shí),也呈現(xiàn)出分層特征。按照數(shù)據(jù)被訪問(wèn)頻率從高到低進(jìn)行分類,可以將數(shù)據(jù)分為熱數(shù)據(jù)、溫?cái)?shù)據(jù)、冷數(shù)據(jù):經(jīng)常被訪問(wèn)的數(shù)據(jù)稱為熱數(shù)據(jù),而較少被訪問(wèn)的數(shù)據(jù)稱為冷數(shù)據(jù),處于中間狀態(tài)的稱為溫?cái)?shù)據(jù)。
隨著數(shù)據(jù)量的飛速增長(zhǎng),數(shù)據(jù)由“熱”變“冷”的現(xiàn)象也日益凸顯,按照“二八定律”,經(jīng)過(guò)一段時(shí)間的使用,80%的數(shù)據(jù)都會(huì)變?yōu)槔鋽?shù)據(jù)。如下圖所示:
在冷溫?zé)岣鲗哟螖?shù)據(jù)的存儲(chǔ)需求中,存在不同特征,根據(jù) IBM 2018 年度發(fā)布的《企業(yè)級(jí)存儲(chǔ) 2025》研究顯示,熱數(shù)據(jù)的讀取頻率大,對(duì)讀取速度的要求快,但讀取文件的大小相對(duì)較小,云主機(jī),相反冷數(shù)據(jù)的讀取頻率較低,對(duì)讀取速度的容忍度高,但讀取文件的大小相對(duì)較大。不同層次數(shù)據(jù)在讀取頻率、讀取速度要求以及單次讀取文件大小方面存在不同特征,使得數(shù)據(jù)存儲(chǔ)需求相應(yīng)不同。
將數(shù)據(jù)分為熱、溫、冷的方法,給更科學(xué)的存儲(chǔ)方案,提供了很好的思路。
存儲(chǔ)三大介質(zhì) 磁、電速度快 光存儲(chǔ)壽命長(zhǎng)
和數(shù)據(jù)有熱冷之分一樣,存儲(chǔ)也有不同類型的物理介質(zhì)。目前,底層物理存儲(chǔ)介質(zhì)有光、磁、電三種,對(duì)應(yīng)的用于企業(yè)級(jí)存儲(chǔ)市場(chǎng)主要產(chǎn)品類型有藍(lán)光存儲(chǔ)、磁帶、機(jī)械硬盤(pán)、固態(tài)硬盤(pán)。其中藍(lán)光存儲(chǔ)屬于光介質(zhì),磁帶、機(jī)械硬盤(pán)屬于磁介質(zhì),固態(tài)硬盤(pán)屬于電介質(zhì)。
三種存儲(chǔ)技術(shù)的讀取原理不同,性能存在優(yōu)劣勢(shì)。磁、電存儲(chǔ)的優(yōu)勢(shì)在于讀取速度快,但在超高密度狀態(tài)下,存在著一定的記錄密度極限,超過(guò)極限會(huì)導(dǎo)致出現(xiàn)信息丟失的現(xiàn)象。另外,磁、電存儲(chǔ)的能耗非常大,并且硬盤(pán)和磁帶的可靠壽命只有5-10年,為防止設(shè)備老化損壞造成數(shù)據(jù)丟失,每3-5年就需要進(jìn)行一次數(shù)據(jù)轉(zhuǎn)存。
光存儲(chǔ)在讀取速度及使用便利性方面存在劣勢(shì),但在數(shù)據(jù)保存壽命、安全性、能耗等方面具有明顯優(yōu)勢(shì),因此可以與其他兩種存儲(chǔ)技術(shù)形成互補(bǔ)?,F(xiàn)實(shí)情況來(lái)看,目前還不存在同時(shí)具備大容量、低延遲、低成本、長(zhǎng)壽命、高安全可靠性等性能的存儲(chǔ)技術(shù)。
可見(jiàn),磁、電、光這三大類存儲(chǔ)介質(zhì)的各自優(yōu)劣勢(shì),恰好可以對(duì)應(yīng)給熱冷數(shù)據(jù)的不同存儲(chǔ)方式。因此,圍繞數(shù)據(jù)生命周期管理的冷熱分層存儲(chǔ)應(yīng)運(yùn)而生,它可以根據(jù)數(shù)據(jù)的使用頻率、文件大小、文件類型等特征將數(shù)據(jù)進(jìn)行冷熱分層后,再采用相應(yīng)適配的物理存儲(chǔ)介質(zhì)進(jìn)行存儲(chǔ),并通過(guò)不同存儲(chǔ)介質(zhì)之間優(yōu)勢(shì)互補(bǔ),達(dá)到延長(zhǎng)保存期限、降低存儲(chǔ)成本、提高節(jié)能效果、增進(jìn)安全可靠性的海量數(shù)據(jù)存儲(chǔ)要求。
光存儲(chǔ) 為溫冷數(shù)據(jù)存儲(chǔ)提供最佳方案
隨著數(shù)據(jù)中心走向成熟,備份、歸檔型的數(shù)據(jù)比例越來(lái)越高,最適合溫、冷數(shù)據(jù)的光存儲(chǔ)技術(shù),近年來(lái)受到越來(lái)越多的關(guān)注。
按照技術(shù)迭代,光存儲(chǔ)介質(zhì)可以分為 CD、DVD、BD 以及下一代全息光存儲(chǔ),按照讀寫(xiě)性能可以分為只讀型和可記錄型,其中可記錄型又分為一次記錄和可重復(fù)擦寫(xiě)。目前國(guó)內(nèi)該行業(yè)的代表企業(yè)紫光存儲(chǔ),所專注的光存儲(chǔ)介質(zhì)技術(shù)為一次性記錄藍(lán)光存儲(chǔ)(Blu-ray Disc Recordable,簡(jiǎn)稱BD-R),同時(shí)正在開(kāi)展下一代全息光存儲(chǔ)技術(shù)產(chǎn)業(yè)化應(yīng)用研究。
相對(duì)于CD、DVD等其他介質(zhì),藍(lán)光存儲(chǔ)介質(zhì)的刻錄采用的激光波長(zhǎng)更短,因此記錄密度更高,容量更大,數(shù)據(jù)傳輸速率也大幅提升。