Dell EMC透露NVMe戰略,為什麼陣列還要等半年?

EMC 戴爾 固態硬盤 軟件 企業存儲技術 2017-06-19

本文內容非商業用途可無需授權轉載,請務必註明作者、微博ID:唐僧_huangliang,以便更好地與讀者互動。

週末看到個消息,覺得有點價值跟大家分享下。

這是一篇來自Dell EMC英文博客的文章,標題為《NVMe – the Yellow BrickRoad to New Levels of Performance》,裡面有一張圖:

Dell EMC透露NVMe戰略,為什麼陣列還要等半年?

這裡提到的3個要點是

-靈活:跨不同存儲產品形態——陣列、融合(包括超融合)和軟件定義;

-敏捷:基於行業標準技術構建;

-可靠:由Dell EMC設計和測試。

EMC從收購XtremIO併發布第一代產品開始就採用標準尺寸SAS SSD驅動器,看來NVMe仍然延續該風格。

EMC這篇博客中也不避諱提到了最近大力宣傳NVMe的Pure Storage:

“那個來自Pure Storage時髦的新品“100%NVMe”陣列怎麼樣呢?他們為這個新的陣列打造了自己專有的“NVMe驅動器”(被稱為“Flash模塊”),這是昂貴的,客戶將不得不付出代價。迄今為止,還沒有發佈新的FlashArray //X的性能基準(還注意到PureStorage的FlashArray //M的現有性能指標也已從其網站上刪除)。這些會你想懷疑...”

EMC也提到Violin Memory使用專有閃存模塊失敗的例子,對友商的評價大家看看就好,考慮到國內存儲廠商也有人撰寫類似的文字,所以我也沒啥可說的。畢竟大家都有自己的判斷力:)

NVMe SSD真的會使陣列更快嗎?

我想跟大家聊的,主要是上面的路線圖。

今年最早發生的是SDS——新版本ScaleIO 3.0針對NVMe和NVDIMM的優化,接下來會有Dell PowerEdge 14G服務器的Ready Node,這些我在《Dell EMC World 2017(1):25GE、FC多協議交換機和SC5020》一文中已經提到過。

然後是VxRack和VxRail超融合,這裡面的主角是VMware vSAN,新版本6.6加入對Intel Optane SSD P4800X(3D XPoint Memory)的支持,用於寫緩存層並且採用NVMe接口。當然普通NVMe SSD也可以用於Cache或者容量層。

大約在2017年底-2018年初,推出基於NVMe的陣列,我最感興趣的是這個。

在《NVMeF的另一種用法:連接AFA控制器和JBOF》中我就提到,短時間內NVMe over Fabric用於存儲系統的主機連接還不成熟;將NVMe/F用於控制器機箱與SHELF的連接,指望50Gb RoCE以太網後端的NVMe SSD性能充分發揮也不現實。那麼還有一個問題,SAS SSD已經拖全閃存陣列的後腿了嗎?

一個PCIe SSD在服務器本地跑到幾十萬、甚至上百萬IOPS今天已經不是新聞;而雙控AFA也就幾十萬IOPS的性能,裡面至少會有十塊以上的SAS SSD。為了實現共享存儲、冗餘高可用、快照、重刪/壓縮等各種數據服務,全閃存陣列的瓶頸一般不在盤上,而且包括Oracle等數據庫在內的主流應用絕大多數時候都能勝任。

從《技術市場分析:閃存陣列中默默服務的SASSSD》裡面大家可以參考我列出的,目前主流SAS SSD能跑多快,還沒算最新推出一代就有讀寫都達到10萬IOPS的。這個水平用在陣列中不夠嗎?NVMe SSD的延時可以更短(確切的說是寫延時,除非你用Optane),而在陣列中還有大容量DRAM Cache、RAID處理啥的,底層介質100μs也不見得成為瓶頸。

所以我真正關心的,是NVMe怎麼給陣列帶來質變?可以想到的一個方向是3D XPoint Memory對分層存儲的重新定義。現在的AFA可以用不同類型SSD分層,但引入更快的SCM介質意義應該更大。不知即將發佈的U.2 Optane SSD會不會有雙端口?而在Server SAN/超融合中現在就可以用P4800X做為寫緩存,或者放置需要最高性能的元數據了。

Dell EMC透露NVMe戰略,為什麼陣列還要等半年?

Intel介紹了一個8節點Ceph集群,使用了BlueStore存儲引擎,將WAL和DB放在一個Optane P4800 SSD上。我們暫且先不討論該配置在今天的實用性達到什麼程度,下面先看看性能。

另一個話題就是存儲軟件的效率,現有的Server SAN平均每節點IOPS表現不錯的也就10幾萬(參見《溫故知新:ScaleIO Oracle性能測試解析》),網絡已經用了40Gb甚至更高,具體配幾個SAS還是NVMe SSD似乎也不是太關鍵的問題?當然,我也一直在等待最新的測試數字。

Dell EMC透露NVMe戰略,為什麼陣列還要等半年?

8個節點跑到280萬隨機讀IOPS,每節點超過30萬了,每節點寫IOPS也達到7萬。按照我們的經驗Ceph對CPU資源開銷屬於分佈式存儲軟件中比較大的,能測出上面的水平,我想各家商業SDS在性能優化上可能會有點壓力。

無論分佈式還是集中存儲,如何更好發揮NVMe SSD的性能都是一個要考慮的問題。兩個存儲控制器之間的NTB通道,如果用PCIe 3.0 x8其寫帶寬不到8GB/s,而它還沒有成為幾十萬IOPS(往往是混合讀寫)的瓶頸。那麼,存儲軟件的效率能否有所突破,我認為這才是對NVMe最關鍵的。

最後再推薦下我寫的評測,也希望大家多瞭解3D XPoint Memory和Optane。

《IntelOptane P4800X評測(序):不用緩存和電容保護的SSD?》

《IntelOptane P4800X評測(1):好鋼如何用在刀刃上?》

《OptaneP4800X評測(2):Oracle 170萬TPM意味著什麼?》

《IntelOptane P4800X評測(3):Windows綁核優化篇》

參考資料

https://blog.dellemc.com/en-us/nvme-the-yellow-brick-road-to-new-levels-of-performance/

注:本文只代表作者個人觀點,與任何組織機構無關,如有錯誤和不足之處歡迎在留言中批評指正。進一步交流技術,可以加我的QQ/微信:490834312。如果您想在這個公眾號上分享自己的技術乾貨,也歡迎聯繫我:)

尊重知識,轉載時請保留全文。感謝您的閱讀和支持!《企業存儲技術》微信公眾號:huangliang_storage

原文鏈接:https://mp.weixin.qq.com/s?__biz=MzAwODExNjI3NA==&mid=2649776078&idx=1&sn=a3a281e26017f46fe94d59eecf3458ba&chksm=83773e93b400b785a8b56531500a0d3e26a6ef099131777efaf0d54d8cbe6a070bc3d909ade1#rd

相關推薦

推薦中...