為數據中心應用加速,新一代存儲系統技術、應用全解析

·隨著網絡帶寬的高速擴展,各種PC、智能設備和移動計算終端幫助個人、組織和企業創造了海量的數據。根據國際數據公司IDC的預測:到2025年人類創造的數據總量將達到163ZB,將比2016年創造出的數據總量增加十倍。其中,企業端數據的存儲量將從之前的30%提升到50%以上。

在這些海量數據中,有的數據價值千金,也有很多數據存儲起來就好。那麼我們應該如何高效地利用好這些數字財富呢?數據分層是一個必然的選項。和10年前傳統的“冷、熱”數據分層不同,今天大數據時代的用戶應用需求已經將數據本身的熱度進一步細化。其中包括:需要實時處理、對訪問延遲有嚴苛要求的“熱數據”;需要經常訪問,對存儲系統讀寫性能要求較高的“溫數據”;以及只需進行備份、訪問頻率很低的“冷數據”。這同時也帶來了更加細分的硬件需求。

在最近10年裡,以英特爾為代表的存儲業界廠商陸續發佈了3D NAND和3D XPoint兩項革命性的存儲技術,衍生出了傲騰數據中心級持久內存(Optane DC Persistent Memory)、傲騰數據中心固態盤(Optane DC SSD)和QLC 3D NAND SSD三大類新品。無論是讀寫性能、耐用性還是使用成本,它們相對於以往的存儲產品都有很大的提升。接下來,就請大家和我們一起來了解它們將如何改變“存儲的世界”,如何滿足應用帶來的全新需求。

為數據中心應用加速,新一代存儲系統技術、應用全解析

從紙帶到異構存儲

看存儲設備發展的過去與未來

自計算機體系結構確立後,其存儲能力就被提到了一個非常高的地位上。不過問題在於:受制於工程、技術和製造等各方面的難題,早期的存儲設備發展並不順利,讀寫速度也非常慢,並且容量更是小到我們今天難以想象的程度。

“上古時期”的計算機都配備了一條條長長的紙帶,紙帶上打滿了孔,或者是一些打了孔的卡片—沒錯,那就是早期的計算機輸入輸出設備。由於缺乏可靠、方便的存儲和輸入、輸出設備,人們只好將命令翻譯成1010101指令,通過打孔器寫在紙帶或者卡片上,計算機將一條條指令讀入,計算完成後再通過在紙帶上打出的孔洞將結果輸出,最後再由轉譯人員翻譯出來計算結果。

到後期存儲器則進化為和紙帶有些類似的磁帶,當然後者存儲密度大得多。磁帶存儲數據的優點在於容量較大,但問題在於磁帶並非隨機讀寫設備。受制於磁帶本身的物理結構構造,如果需要找到一定的數據,機器甚至需要讀取完整個磁帶。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲常見的數據中心使用的PB級別磁帶存儲庫,其存儲材料都為磁介質。

很顯然,磁帶這樣的設備因為順序讀寫的限制,在速度上完全滿足不了快速發展的計算機需求。因此,人們考慮加快存儲設備的速度,尤其是增加隨機讀取特性,而這樣的需求就帶來了“溫徹斯特存儲架構”。所謂溫徹斯特存儲架構,是指通過可移動的磁頭臂在旋轉的盤片上不同位置(磁道)使用磁感應的方式存儲數據,這也是當今機械硬盤的主要工作原理。

雖然機械硬盤找尋數據的速度比磁帶快了很多,但它仍存在先天不足—假如需要讀取3個數據,分別存放在磁盤的最內圈、中間圈和最外圈,機械硬盤需要移動3次磁頭,並等到盤片旋轉至相應的位置,才能將數據讀取出來,這個過程被稱為尋道,所耗費的時間被稱作尋道時間。假設每次移動磁頭需要10毫秒,那麼10次就是100毫秒—如此長的時間嚴重影響了硬盤的隨機性能,如何解決這個問題?最終經過多年的研究與積累,科學家在非機械結構的NAND芯片上找到了答案。

打破溫徹斯特架構的侷限性

SSD問世

機械部件再快也存在延遲,無法和迅如閃電的電信號相比。那麼,怎麼使用電信號存儲數據呢?為了解決這個問題,技術人員們發明了NAND結構並將其實物化為NAND閃存芯片。在1992年,英特爾就製造出了12MB的NAND存儲產品,不過當時閃存芯片成本極高,12MB的存儲設備需要多塊芯片支持,因此在早期這樣的產品往往只用在特殊領域。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲英特爾在1992年就推出了容量為12MB、基於NAND閃存芯片的存儲設備,在2014年英特爾更打造出了存儲容量達2TB的固態盤。

近年來隨著技術的發展,NAND閃存芯片成本大幅下降,最終其實用化的產品上市,這就是大名鼎鼎的固態盤即SSD—由多顆NAND閃存芯片組成的大容量存儲設備。

固態盤一上市,就以超越機械硬盤數十倍的隨機讀寫速度、革命性的使用感受征服了無數用戶。在使用了固態盤後,操作系統啟動時的隨機小文件加載速度得到了大幅提升,操作系統本身的啟動甚至可以在數秒內完成。

不僅如此,之前機械硬盤的一些“老大難”問題:比如大量工作碎片文件存儲讀取、大容量數據轉移等,在固態盤出現後都得了根本性改善。同時固態盤也得到了消費者很高的接受度,自2008年英特爾首次推出兩款主流SSD:X18-M與X25-M後,其SSD產品與其CPU產品一樣得到了高速的發展。

當然像所有產品一樣,固態盤也有自己的不足。首先在性能上,固態盤與計算機中的上一級存儲設備:內存仍存在很大的差距,內存的訪問延遲小於0.1微秒,傳輸帶寬也可輕鬆達到每秒幾十GB,而傳統固態盤的訪問延遲一般還是會接近上百微秒左右,並且單塊固態盤的最高傳輸速度、隨機讀寫性能與內存相比還是相距甚遠。同時由於NAND閃存先天的設計機制,很多SSD還存在使用得越久、性能就越差的問題。

各有分工

三級異構存儲架構初顯形

企業的數據存儲主要分為熱數據、溫數據和冷數據這3個層次。熱數據即需要立即進行處理的數據,例如銀行收到的轉賬請求,即時的地理位置等。溫數據是非即時的狀態和行為數據,例如用戶近期感興趣的話題,或用戶最近去過的地方等。冷數據則是不經常訪問的數據,例如企業備份數據、業務與操作日誌數據、話單與統計數據等。

在硬盤問世之初,根據不同層次的數據存儲在不同設備上的異構存儲雛形就已顯現—溫數據主要存儲在機械硬盤上,熱數據則主要由內存處理,但由於內存容量較小,還會使用部分硬盤容量作為虛擬內存存儲熱數據,幾乎很少用到的冷數據則存儲在磁帶機上。這樣存儲數據的問題也很明顯,不論是機械硬盤還是磁帶機的性能都非常低,經常可以看到硬盤燈狂閃,程序應用卻遲遲沒能啟動或數據傳輸時間過長的狀況。而隨著SSD的問世,為了更加高效地存儲海量數據,各層次數據的存儲方式又有了一些改變。

為了合理分配預算,現階段企業常見的數據存儲方式是熱數據使用內存進行處理,溫數據大多存儲在SSD裡,冷數據則保存在機械硬盤裡。不過這裡存在的問題就如前面所說—三個級別的存儲設備性能差異太大,訪問延遲不到0.1微秒的內存還是要“耐心”等待近百微秒級SSD在數據上的傳輸,而且其傳輸的數據量遠遠跟不上內存的傳輸能力;其次由於內存價格偏高,因此內存的容量也無法同SSD、硬盤相比,易出現存儲熱數據時容量不足,從而造成處理器處理數據必須直接從SSD或機械硬盤等低速設備中讀寫數據,降低整體處理速度。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傳統的三級異構存儲架構存在較大的性能與容量鴻溝。

而冷數據僅僅只使用機械硬盤或磁帶機顯然也會帶來很低的效率。就拿機械硬盤為例,其訪問延遲是10毫秒級別,也就是說在10000微秒左右,單塊機械硬盤的連續讀取速度難以突破300MB/s,在QD32下的隨機4KB IOPS也很難達到1000,與QD1下就能輕鬆實現5000 IOPS的SSD相比完全是天壤之別。那麼對於企業級用戶來說,應該如何解決這些問題呢?

構建多級異構存儲

對於這些問題,英特爾給出的解決方案就是在原有存儲體系中加入傲騰數據中心級持久內存、傲騰DC固態盤、英特爾QLC 3D NAND SSD這三類產品,打造多級異構存儲架構。其中傲騰數據中心級持久內存、傲騰DC固態盤都使用相同的存儲介質—3D XPoint,但兩者的設計、作用又有所不同。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲加入傲騰數據中心級持久內存、傲騰DC固態盤、英特爾QLC 3D NAND SSD這三類產品可以提升整個存儲系統的容量、性能、效率。

熱數據加速器

傲騰數據中心級持久內存

傲騰數據中心級持久內存即Optane DC Persistent Memory,也被簡稱為傲騰DCPMM。它採用了DDR4內存的外形設計,可以與英特爾Cascade Lake至強可擴展處理器搭配使用,其最主要的特性是通過使用DDR4接口,使得它具備1微秒以內的訪問延遲,以及極高的存儲密度,能夠在系統中提供略低於內存的性能,但大得多的熱數據存儲容量,其雙插槽平臺最高可使用高達6TB的DCPMM。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傲騰數據中心級持久內存擁有接近傳統DRAM內存的性能,但又具有非易失性,容量遠超DRAM內存的特性,能夠大幅提升數據中心應用效率。

在工作方式上,傲騰DCPMM有兩種模式,一種被稱為Memory Mode,另一種是APP Direct Mode。Memory Mode是指將傲騰DCPMM看作DRAM,以內存方式運行。在這種情況下,系統將向傲騰DCPMM給出大量的DRAM分配,使用傲騰DCPMM作為主存儲器,DDR4作為緩衝器。

如果緩衝區數據包含直接需要的數據,那麼將啟用標準的DRAM快速讀/寫功能,而如果數據在傲騰中則會相對稍慢一些,但比讀取傳統SSD固態盤快得多,達到更高的效率。在這種模式下,數據是易失性的,一旦斷電就會消失。

在APP Direct模式中,應用程序可以直接連接到內存部分,選擇直接載入(Direct load)或者內存存儲(Store Memory)模式,根據需要判斷哪些數據適合在DRAM上存放,哪些適合在傲騰DCPMM中。一般來說,對延遲敏感且不需要長時間存儲的數據可以交由DRAM負責,另外大部分數據則交給傲騰DCPMM,包括內存數據庫、內存分析框架等都適合APP Direct模式。在這種模式下,數據是非易失性存放的,即使斷電也不會影響到數據的安全性,可以快速重啟系統,充分使用了傲騰DCPMM的非易失性特性。

總體來看,傲騰DCPMM是一項創新的內存技術,可以有效彌補DRAM內存容量不足、數據易失性的缺點,加速更多熱數據的訪問速度,減小訪問延遲,幫助企業更快地從他們的數據密集型應用中獲得深入洞察,並藉助更高的虛擬機和容器密度提供不斷改進的服務,以及可擴展性優勢,縮短從系統存儲中提取大型數據集關聯的等待時間。

異構存儲中堅力量

傲騰DC固態盤

傲騰DC固態盤雖然使用同樣都的存儲介質,但它的外形、接口卻較傲騰DCPMM有很大的改變—其外形不再是內存DIMM形式,而是設計成了AIC插卡式,以及U.2 2.5英寸外形,接口也變為了PCIe 3.0 x2~PCIe 3.0 x4。它主要用來加快部分熱數據與溫數據的數據傳輸,既可以用於整個存儲系統中的緩存,也可以用來保存各類持久性數據。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傲騰數據中心固態盤的代表產品:DC P4800X,擁有很高的性能,可幫助消除數據中心存儲瓶頸。

總體來說英特爾傲騰數據中心固態盤將內存和存儲的屬性與高吞吐量、低延遲、高服務質量 (QoS) 和高耐久性完美結合,其架構設計可在位級別執行寫入操作,從而獲得更快、更可預測的性能和更均衡的讀寫性能。

相對於SATA SSD,當前通過NVMe、PCIe接口設計的SSD就好比我們拓寬了道路的寬度,但在這條道路上,人們還需要更快的交通工具。就像北京到上海,無論把路修多寬,只要上面跑的是汽車,就都會有極限,因為汽車速度是有限的。而傲騰改變的是將路上跑的交通工具從汽車升級到更高級別的黑科技,跑的是另外一種交通工具,所以它能極大地縮短北京到上海的耗時,這就是傲騰的第一大意義—大幅降低訪問延遲。相比傳統NAND閃存,傲騰固態盤在性能上有質的提升。

延遲方面,它最高可以做到10~1微秒級別,雖然和內存DRAM的不到0.1微秒相比還是存在一定的差距,但是已遠遠好於NAND閃存的近百微秒的水平。英特爾數據顯示傲騰DC固態盤的訪問延遲不僅較傳統HDD、SATA SSD大幅降低,即便與同樣採用NVMe技術的NVMe NAND SSD相比,其優勢也是非常大的——與採用3D NAND顆粒的英特爾DC P4600 SSD相比,傲騰固態盤DC P4800X的讀取延遲在不同隊列深度下,低了8~63倍。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傲騰DC固態盤擁有很低的訪問延遲,相對於NVMe SSD也擁有明顯優勢。

同時傲騰DC固態盤還帶來了強大的耐用性,之前英特爾的P4600企業級SSD已經擁有不錯的表現,每天可全盤擦寫3次。而傲騰DC固態盤每天可以全盤擦寫60次,壽命是普通閃存產品的20倍。更值得一提的是,傲騰DC固態盤擁有非常優秀的性能一致性表現。這是因為傲騰固態盤的寫入方式與基於閃存的SSD完全不一樣—普通閃存在寫入數據時,需要進行BLOCK塊(一個塊一般可存儲30000多bit數據)級別的操作。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲得益於3D XPoint介質,傲騰DC固態盤寫入數據前不需要進行塊擦除,可以直接寫入數據,因此不存在後期性能衰減的問題。

簡單地說如寫入1bit數據這樣的最小單位,在SSD為空白盤,各個BLOCK塊都沒有數據時,SSD可以直接寫入。但如果預計寫入的塊上已經寫有數據,就需要SSD先將整個塊上的數據存入內存,再擦除整個BLOCK塊,然後將原有數據與新的1bit數據寫入到塊上。這不僅大大消耗了閃存的寫入壽命(實際寫入數據=原有數據+新的1bit數據),更增加了寫入流程,明顯會降低寫入速度。尤其是在SSD固態盤長時間使用後,各個塊很可能都有數據存在的時候,再寫入新的數據將不可避免地執行這繁瑣的寫入流程,導致寫入性能遠不如SSD在空白盤時的狀態。

而傲騰固態盤是以bit這一最小單位為基礎訪問單位的,也就是說不管用戶是在固態盤初始狀態,還是在已經長時間使用後的狀態,都是直接寫入這1bit數據,不會有額外的寫入放大,傲騰DC固態盤的性能不會有任何改變,性能一致性堪稱完美。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傲騰DC固態盤的三大主要優勢—更低延時、更高耐用性、更高效率。

同時基於傲騰技術的產品也在多個實際領域得到應用,如IBM雲的裸金屬服務器在採用英特爾傲騰DC固態盤之後,性能提升了7.5倍;比薩大學利用英特爾傲騰技術,將核磁共振成像 (MRI) 的掃描時間從42分鐘縮短到4分鐘。

替換機械硬盤的主力

QLC 3D NAND SSD

對於溫數據層的存儲介質,英特爾更看好採用QLC顆粒的新款SSD。相比TLC閃存顆粒,QLC顆粒一個單元可以存儲4bit數據,TLC顆粒只能存儲3bit,因此在使用相同數量晶圓的情況下,QLC SSD的存儲容量比TLC SSD提高了33%,性價比更高。同時QLC顆粒還可以藉助英特爾的3D NAND堆疊技術,不斷地往上堆疊,從32層到64層,到96層、128層,提升單顆芯片的存儲容量。這會帶來怎樣的改變呢?

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲與TLC閃存顆粒相比,QLC顆粒每個單元可以多存儲33%的數據。

從前我們說到SSD的時候,我們認為它的容量一般就是從幾百個GB到1TB、2TB,一般不會超過4TB,但是QLC SSD的容量可以輕鬆做到4TB到32TB。在數據中心領域,英特爾提供的QLC SSD就是其全新的D5系列,該系列除了傳統的U.2接口,2.5英寸設計外,還有采用EDSFF直尺外形的產品,因此被英特爾稱作‘Ruler’,即直尺的英文。

為數據中心應用加速,新一代存儲系統技術、應用全解析


為數據中心應用加速,新一代存儲系統技術、應用全解析

▲除了傳統2.5 英寸SSD,Ruler SSD 佔用空間更小、散熱性能更好。

Ruler有三種,有短的Ruler,有長的,還有帶散熱片的。短的功率會比較小,其次是長的帶散熱片的長Ruler,1U的服務器可以裝32塊,再加上每塊Ruler SSD的最大容量可以達到32TB,所以算起來是一臺1U服務器裡的存儲容量就能達到1PB,比起傳統的U.2這種架構,Ruler這種外形所需的散熱氣流可以減少一半。

而在使用機械硬盤的時候,服務器一般採用4TB的機械硬盤,需要256塊機械硬盤才能實現1PB容量,需要佔用整個機櫃,如果採用QLC SSD現在只需要佔用1U的空間。同時QLC SSD在功耗上也擁有很大的優勢—相比機械硬盤,QLC SSD的功耗降低了64%,散熱效率提高了2.8倍。在故障率上,機械硬盤的故障率大概在2%左右,而QLC SSD的故障率僅為0.4%。

性能方面,英特爾為QLC SSD配備了NVMe接口,可以保證SSD的傳輸帶寬,降低訪問延遲。而針對QLC顆粒寫入性能下降的問題,在企業級QLC SSD方面,英特爾的解決方案是讓其擁有更高級的緩存—Write Buffer,即使用專門的傲騰DC固態盤來為QLC SSD做緩存,對工作負載進行整合。

目前微軟、亞馬遜、阿里巴巴等行業領導者都在開發整合工作負載的軟件,將不同類型的負載,包括隨機訪問都整合成順序寫入,這樣QLC隨機寫入性能欠缺的問題在Write Buffer的幫助下就得以削弱,同時QLC顆粒的壽命也會得到延長。

傲騰+QLC將打造高性能、低成本存儲系統

不難看出,不論是傲騰DC固態盤還是3D NAND QLC固態盤,它們都有非常不錯的性能。而更加值得一提的是,它們還可以降低企業存儲系統的使用成本。

為數據中心應用加速,新一代存儲系統技術、應用全解析

▲傲騰DC固態盤與QLC 3D NAND SSD的聯手能夠為Ceph對象存儲進程的數據層帶來更低的硬件成本,更大的存儲容量和更高的系統性能。

雖然從表面看,同容量的傲騰DC固態盤比NAND SSD貴,但其大幅提升的壽命,以及低延遲帶來的更強性能可以讓用戶完全不需要以用同樣容量的傲騰DC固態盤去代替基於普通閃存的SSD。舉例來說,國內某領先廣電企業在使用傲騰解決方案後,新服務器整體價格僅比舊服務器高10%左右,但因為性能提升和內存的擴增減少的硬件投入成本,卻使得整體方案成本降低了約44%,算下來能節省幾十萬、上百萬的資金投入。

同樣的道理也適用於3D NAND QLC SSD。如果企業準備用它來替代之前的TLC SSD,那麼在達到相同容量的目的下,它可以少用33%的晶圓,同容量下QLC 3D NAND SSD的價格自然會比TLC SSD便宜不少,組建成本就能得到有效的降低。如果用它來替換機械硬盤,雖然現在同容量的固態盤價格還比機械硬盤貴一些。但就像前面所說,它不僅在性能上會帶來較機械硬盤質的提升,像Ruler這樣的高密度QLC SSD更可以大幅降低服務器的使用數量、佔地面積、對散熱設備的需求,以及功耗,即降低存儲系統的運營成本 。

從英特爾傲騰技術開始研發,到第一款採用該技術的傲騰加速盤誕生,再到傲騰固態盤和傲騰數據中心級持久內存的問世,英特爾傲騰產品線越來越豐富,技術也日益成熟。傲騰在穩步發展的過程中獲得了越來越多行業用戶的認可,向我們證明了它的確擁有非常大的潛力。

而憑藉更大的存儲容量和更低的存儲成本,英特爾QLC 3D NAND也將使低成本的全閃存陣列取代HDD陣列成為可能。不得不說,傲騰技術與QLC 3D NAND技術的結合,將幫助企業打造更高性能和更低成本的軟件定義存儲解決方案,並在開源技術的幫助下,充分發揮英特爾存儲技術的優勢,為用戶提供兼得性能與容量的解決方案,它們也將成為存儲技術未來的重點發展方向。

相關推薦

推薦中...