SSD(固態(tài)硬盤)的壽命問題是用戶使用全閃陣列時關(guān)注的焦點。如何能夠讓用戶放心使用全閃陣列,保障在5年內(nèi)存儲系統(tǒng)不會因為SSD壽命耗盡而出現(xiàn)問題,是全閃陣列廠商面臨的挑戰(zhàn)。浪潮存儲通過優(yōu)化智能全閃G2-F的軟件棧,實現(xiàn)了SSD介質(zhì)的磨損均衡,使得智能全閃G2-F可以在長達(dá)5-10年的全生命周期內(nèi),給閃存介質(zhì)上的數(shù)據(jù)提供安全保障。
HDD和SSD可靠性上存在天然差異
HDD(硬盤驅(qū)動器)是通過機械旋轉(zhuǎn)加磁介質(zhì)記錄數(shù)據(jù)的,而SSD則通過硅晶半導(dǎo)體記錄數(shù)據(jù)。二者記錄數(shù)據(jù)方式的差異決定了兩種類型的盤在存取速度和可靠性方面具有本質(zhì)差異。
HDD由磁頭和盤片組成,數(shù)據(jù)存放在盤片上的某個位置,當(dāng)對數(shù)據(jù)進(jìn)行讀寫,需要將磁頭移動到磁道上,盤片轉(zhuǎn)動到指定的位置。所以HDD是一個機械設(shè)備,只要加電,磁盤就處于高速旋轉(zhuǎn)工作狀態(tài)。磁介質(zhì)本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數(shù)據(jù)量,而取決于磁盤的上電時間。不過,磁盤的壽命跟工作環(huán)境有很大的關(guān)系,比如震動對磁盤的壽命影響就非常大。
兩種存儲介質(zhì)
而NAND的存儲單元為三端器件,與場效應(yīng)管有相同的名稱:源極、漏極和柵極。如下圖所示,浮柵極是用來保存電荷的的,浮柵極與硅襯底之間是隧道氧化層,與控制柵極間也有一層絕緣層,上下兩層絕緣層保護(hù)浮柵極中的電荷不會泄漏。采用這種結(jié)構(gòu),使得存儲單元具有了電荷保持能力,通過讓絕緣浮置柵極捕獲不同數(shù)量的電子以實現(xiàn)bit值定義。就像是裝進(jìn)瓶子里的水,當(dāng)你倒入水后,水位就一直保持在那里,直到你再次倒入或倒出,所以閃存具有記憶能力。
NAND Flash原理示意圖
而對浮柵極的充放電,是利用量子隧道效應(yīng)實現(xiàn)的。當(dāng)我們要對FLASH進(jìn)行寫入操作的時候,在控制柵極上加高電壓,源極和漏極接地,使電子穿越隧道氧化層到達(dá)浮柵極,并聚集在浮柵上保持,形成電壓,用來存儲信息。進(jìn)行擦除時仍利用隧道效應(yīng),把電壓反過來加,從而消除浮柵上的電子,達(dá)到清除信息的結(jié)果。
由于在寫入和擦除的操作過程中,電子反復(fù)來回穿越隧道氧化層會損壞隧道氧化層,當(dāng)絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導(dǎo)致存儲單元物理損壞。這就是NAND Flash會有寫入次數(shù)限制的原因。
由于在寫入和擦除的操作過程中,電子反復(fù)來回穿越隧道氧化層會損壞隧道氧化層,當(dāng)絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導(dǎo)致存儲單元物理損壞。這就是NAND Flash會有寫入次數(shù)限制的原因。
HDD的實現(xiàn)原理和Flash完全不一樣,HDD由磁頭和盤片組成,數(shù)據(jù)存放在盤片上的某個位置,當(dāng)對數(shù)據(jù)進(jìn)行讀寫,需要將磁頭移動到磁道上,盤片轉(zhuǎn)動到指定的位置。所以HDD是一個機械設(shè)備,只要加電,磁盤就處于高速旋轉(zhuǎn)工作狀態(tài)。磁介質(zhì)本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數(shù)據(jù)量,而取決于磁盤的上電時間。不過,磁盤的壽命跟工作環(huán)境有很大的關(guān)系,比如震動對磁盤的壽命影響就非常大。
通過對比SSD和HDD的工作原理,你會發(fā)現(xiàn)二者的故障模式有非常大的差異。傳統(tǒng)的磁盤軟壽命限制,因此需要對SSD的壽命管理進(jìn)行精細(xì)設(shè)計,以此實現(xiàn)全閃存儲介質(zhì)的生命周期管理。
浪潮智能全閃:六招實現(xiàn)SSD介質(zhì)全生命周期管理
下面讓我們來看看浪潮智能全閃G2-F都有哪些大招,來實現(xiàn)SSD全生命周期精細(xì)管理以應(yīng)對SSD的壽命挑戰(zhàn)。
招數(shù)1:T10 DIF杜絕靜默數(shù)據(jù)損壞
出了問題,首先要檢測到,防止靜默數(shù)據(jù)損壞。未被檢測到的靜默數(shù)據(jù)損壞會導(dǎo)致業(yè)務(wù)系統(tǒng)的嚴(yán)重后果。
T10 DIF(Data Integrity Field,數(shù)據(jù)完整性域)是用戶數(shù)據(jù)的一種端到端的保護(hù)機制,寫入數(shù)據(jù)的時候在數(shù)據(jù)塊末尾加入PI(Protection Information,保護(hù)信息)字段,存放數(shù)據(jù)的校驗信息。當(dāng)存儲端接收到帶有PI的數(shù)據(jù)之后,會將PI信息保存起來,這樣在讀取的時候會重新計算,使得掉電,硬重啟,卷重啟,鏈路丟失等都不會導(dǎo)致PI數(shù)據(jù)的丟失。浪潮智能全閃G2-F全系列通過支持T10 DIF檢測,杜絕了靜默數(shù)據(jù)損壞。
招數(shù)2:SSD壽命預(yù)測提供事先警告
既然SSD壽命有限,SSD什么時候臨近壽命終點、什么時候需要更換,就成為用戶和存儲系統(tǒng)管理員最關(guān)心的事情。全閃存儲系統(tǒng)需要在SSD臨近壽命極限時對用戶進(jìn)行預(yù)警,給用戶預(yù)留更換乃至采購替代品的時間。同時,如果用戶的業(yè)務(wù)模型、業(yè)務(wù)流量和初始設(shè)計時發(fā)生了巨大變化,存儲系統(tǒng)也需要給出預(yù)警信息,讓用戶采取措施調(diào)整業(yè)務(wù)模型或者數(shù)據(jù)布局,將大流量的數(shù)據(jù)寫入業(yè)務(wù)遷移到其他存儲上。這些必要的功能在浪潮智能全閃G2-F系列產(chǎn)品上進(jìn)行了全面配備,其中包括:
監(jiān)測壽命衰減速度:浪潮智能全閃G2-F定時檢查SSD使用壽命百分比,壽命衰減速度過快時會上報并告警,提醒用戶SSD盤異常,建議更換或者改變業(yè)務(wù)模型。
實時監(jiān)測使用壽命:當(dāng)SSD盤使用壽命達(dá)到97%,系統(tǒng)會建議用戶更換SSD盤;達(dá)到99%,會警告用戶及時更換SSD盤
智能剩余生命周期預(yù)測:浪潮智能全閃G2-F會根據(jù)用戶業(yè)務(wù)歷史流量及模型,對SSD可使用時間進(jìn)行預(yù)測,并根據(jù)用戶業(yè)務(wù)模型的變化,實時調(diào)整預(yù)測周期。當(dāng)預(yù)測到SSD剩余壽命大概為6個月時,會產(chǎn)生告警,提醒用戶關(guān)注SSD壽命。
招數(shù)3:RAID壽命預(yù)測與自動化功能凸顯神通
當(dāng)RAID成員盤的壽命臨近極限時,系統(tǒng)會發(fā)出告警,使用CLI命令或GUI界面,檢查每個成員盤的“更換日期”字段,來確定需要更換的成員盤。如果RAID個別成員盤臨近壽命極限,只需更換個別成員盤,利用RAID冗余數(shù)據(jù)重建,更換盤后,RAID自動重建該成員盤。
當(dāng)RAID多個成員盤臨近壽命時,系統(tǒng)自動更換RAID Group。浪潮智能全閃G2-F可以利用數(shù)據(jù)遷移功能自動將該RAID中的數(shù)據(jù)在線遷移出來,方法是直接刪除該RAID——數(shù)據(jù)遷移功能會先將該RAID上的數(shù)據(jù)遷移到存儲池的其他RAID上,然后再刪除。如果存儲池其他RAID上沒有足夠的空間,刪除會失敗,需要先向存儲池添加新RAID后再刪除。
-
閃存
+關(guān)注
關(guān)注
16文章
1833瀏覽量
115687 -
SSD
+關(guān)注
關(guān)注
21文章
2944瀏覽量
119050 -
HDD
+關(guān)注
關(guān)注
0文章
151瀏覽量
27804
原文標(biāo)題:破解全閃存存儲介質(zhì)壽命難題的六大招數(shù)
文章出處:【微信號:Anxin-360ic,微信公眾號:芯師爺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
破解全閃存存儲介質(zhì)壽命難題的六大招數(shù)
拯救NAND/eMMC:延長閃存壽命

全閃存存儲的VDI場景應(yīng)用
sd可以實現(xiàn)六個面對應(yīng)六個不同文件夾sd音樂嗎?
六個子目錄的作用
六個有關(guān)RoHS的檢測方法標(biāo)準(zhǔn)
熱能的應(yīng)用 大幅度延長閃存壽命周期
在全閃存陣列購買決策中應(yīng)用的六個最佳實踐
破解全閃存存儲介質(zhì)壽命問題的方法?

探討閃存特點及作為存儲介質(zhì)面臨的挑戰(zhàn)

評論