和今年7月份在存儲(chǔ)重鎮(zhèn)武漢召開(kāi)的存儲(chǔ)半導(dǎo)體峰會(huì)一樣,Open Channel SSD在FMS2018 的眾多話(huà)題中的分量很足。在架構(gòu)相關(guān)的議題中占了半壁江山。從目前看到的方案來(lái)看,大家的目的都類(lèi)似,主要解決問(wèn)題是:
1. I/O 的隔離
2. 實(shí)現(xiàn)可以預(yù)期的延時(shí)
3. 將底層的NAND的Channel暴露到上層來(lái)實(shí)現(xiàn)更好的I/O并行處理和調(diào)度
目前主要實(shí)現(xiàn)的方案有三種,Alibaba AOC, Facebook I/O Determinism 以及Open Channel的創(chuàng)始公司CNEXLabs (Microsoft 投資的公司)。 在本次的FMS上三家都有講各自的方案,但是各自方案在自己公司的進(jìn)展確實(shí)一個(gè)比較敏感的話(huà)題。先來(lái)看看各家的方面的陣營(yíng)吧。
Alibaba AOC放出可他們的生態(tài)陣營(yíng)如下:
Intel的加入對(duì)于整個(gè)生態(tài)的促進(jìn)的確很大。CNEXLabs的存在說(shuō)明Alibaba這個(gè)方案和標(biāo)準(zhǔn)的Open Channel還是有一定的聯(lián)系的。
但是從目前的資料來(lái)看,Alibaba 的AOC在架構(gòu)上和之前OC 還是有很大不同,可以看到的不同點(diǎn)在于:
l 提供了兩種模式,標(biāo)準(zhǔn)的NVMe 和AOC 模式。
l 對(duì)于主機(jī)的接口方案,提供了內(nèi)核+Block 塊設(shè)備和用戶(hù)態(tài)NVMe兩種接口。
l 基于優(yōu)先級(jí)的I/O調(diào)度,實(shí)現(xiàn)了 PU-based Read I/O Scheduling (PRS)/PU-based Read Throttling PRT/Priority-based Write Scheduling (PWS) /Adaptive Write Throttling (AWT)四種機(jī)制。
比較有意思的是在Shannon-System的母公司的SMI的展臺(tái)上有一顆2270的SSD控制器。
這個(gè)2270控制從date sheet上看是由兩個(gè)2262在后端堆疊起來(lái)的。
而且已經(jīng)點(diǎn)名了可以支持OC SSDs,看起來(lái)和Alibaba的AOC應(yīng)該是比較match。因此想到Intel會(huì)不會(huì)也是用這個(gè)來(lái)做AOC SSD呢?
畢竟Intel在今年五月的SPDK的summit上討論的open channel SSD的也討論了雙模的支持,以及對(duì)于SPDK的支持。
對(duì)于Facebook的I/O Determinism, 他們可能因?yàn)楹虸ntel的關(guān)系比較密切,因此選擇了加入NVMe標(biāo)準(zhǔn)的道路。大家可以在之前的OCP和FMS看到Facebook在定制SSD的I/O Determinism的進(jìn)展。2017年的FMS和2018的OCP上,可以看到Seagate 的Nytro部門(mén)和Facebook走的很近,但是隨著Facebook主導(dǎo)的各種TP在NVMe協(xié)議組織里面出現(xiàn),現(xiàn)在很難看出facebook會(huì)使用哪一家的硬件。在FMS2018上的Facebook的Topic中,他們提出了目前實(shí)現(xiàn)的局限性:
同時(shí)Facebook又挖了一個(gè)大坑:
比較有意思的,的確有一家不透露名字的startup在follow up facebook的需求。具有的信息,我就不放上來(lái)了。他們認(rèn)為需要根據(jù)Facebook的需求重新定義SSD的架構(gòu)。需要根據(jù)NVM Set的概念,在SSD的控制器的相關(guān)資源中進(jìn)行分割,實(shí)現(xiàn)多個(gè)sub system的device。因?yàn)镕acebook的提議都在NVMe的協(xié)議組織中,但是大部分應(yīng)該都是option的,如果真的有人愿意根據(jù)Facebook的幾個(gè)大坑來(lái)定義自己的SSD控制器,我只能說(shuō)祝你好運(yùn)了。
最后來(lái)講講CNEXLabs的正宗open channel SSD,這個(gè)概念已經(jīng)和Microsoft的Denali Porject緊密結(jié)合。目前不僅CNEXLabs,連Marvell,SMI都宣布自己加入Denali project了,目前來(lái)看Microsoft的江湖地位還是高。
對(duì)于Open Channel SSD的定義的技術(shù)細(xì)節(jié),在lightnvm.io上大家都可以看到,就不在這里贅述了。就講講今年CNexlabs的update吧。
l Cnextlabs的那個(gè)主導(dǎo)Open Channel SSD的哥們?nèi)チ薟D,但是還在講這個(gè),對(duì)OC 應(yīng)該是件好事,多了一個(gè)大客支持。
l Device的保修問(wèn)題。這個(gè)問(wèn)題也是筆者一直和CNexlab的大佬有疑問(wèn)的地方。因?yàn)镠ost is King,如果來(lái)一個(gè)不靠譜的程序員來(lái)用OC SSD,可能在幾分鐘內(nèi)把一個(gè)OC SSD一部分NAND寫(xiě)穿。連我們Xilinx做OC SSD的開(kāi)發(fā)平臺(tái)的時(shí)候,都考慮使用SODIMM的NAND 模塊可以拆卸,而不是直接NAND Down。
l 不管OC 如何開(kāi)放,因?yàn)閴膲K管理的需求,以及IO隔離,因此肯定要有一部分的保留區(qū)域,可能沒(méi)有傳統(tǒng)的OP那么大。在多用戶(hù)的場(chǎng)景下,如何在壽命和IO隔離之間平衡也是一個(gè)問(wèn)題。
l CNexlabs在Denali的基礎(chǔ)上做了over Fabric的嘗試,這個(gè)基本上是利用NVMe over Fabric在遠(yuǎn)端和本地的NVMe訪問(wèn)的透明做一些有益的應(yīng)用探索。
總之,可以看出,目前這種基于Open Channel 思想的SSD架構(gòu)的本質(zhì)上需要有壕客支持,底層的設(shè)計(jì)和上層的應(yīng)用緊密結(jié)合,注定是幾個(gè)客戶(hù)才用得上的產(chǎn)品。大部分吃瓜群眾在學(xué)術(shù)上面作圍觀就行了。作為前Host FTL的代表Fusionio的前員工,我對(duì)Open Channel有著深深的敬意,因?yàn)镺pen Channel的思想本質(zhì)上是如何使用SSD構(gòu)建一個(gè)高效,穩(wěn)定的存儲(chǔ)系統(tǒng)的積極探索,那些做全閃陣列的廠家,可能不會(huì)使用Open Channel SSD本身的標(biāo)準(zhǔn),但是盤(pán)控聯(lián)動(dòng)肯定是不可缺少的。目前如何控制底層SSD的GC對(duì)存儲(chǔ)系統(tǒng)的影響還是一個(gè)艱難的topic。
-
SSD
+關(guān)注
關(guān)注
21文章
2951瀏覽量
119109 -
Facebook
+關(guān)注
關(guān)注
3文章
1432瀏覽量
56183
原文標(biāo)題:FMS 2018 (5):Open Channel SSD占據(jù)半壁江山
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
27MHz HCSL 差分晶體振蕩器在數(shù)據(jù)中心網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)中的應(yīng)用方案
高速ssd存儲(chǔ)系統(tǒng)中數(shù)據(jù)緩存控制器流程控制設(shè)計(jì)

科達(dá)KCloudStor云存儲(chǔ)系統(tǒng)與鯤鵬攜手推進(jìn)原生開(kāi)發(fā)技術(shù)創(chuàng)新
電腦云存儲(chǔ)系統(tǒng),電腦云存儲(chǔ)系統(tǒng)的教程,個(gè)人云電腦是什么以及怎么連接

如何配置 RAID 5 存儲(chǔ)系統(tǒng)
WDS分布式存儲(chǔ)系統(tǒng)軟件助力電信工程海量數(shù)據(jù)存儲(chǔ)項(xiàng)目

emc企業(yè)級(jí)存儲(chǔ)系統(tǒng)的特點(diǎn)
計(jì)算機(jī)存儲(chǔ)系統(tǒng)的工作原理和功能
計(jì)算機(jī)存儲(chǔ)系統(tǒng)的構(gòu)成
基于分布式存儲(chǔ)系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲(chǔ)解決方案

基于CSS融合存儲(chǔ)系統(tǒng)的自動(dòng)化制造服務(wù)平臺(tái)存儲(chǔ)解決方案

評(píng)論