我們?cè)鯓哟鎯?chǔ)信息?
寫下來(lái)的紙張會(huì)被焚毀,電腦可能會(huì)被黑,DVD可能會(huì)無(wú)法讀取。威脅無(wú)處不在,從簡(jiǎn)單的一盆水到復(fù)雜的網(wǎng)絡(luò)攻擊,都有可能讓我們的記錄化為烏有。
信息爆炸,數(shù)據(jù)井噴,可能未來(lái)連云存儲(chǔ)也無(wú)法承載,而且它無(wú)法阻擋住所有黑客,還會(huì)持續(xù)消耗能量。據(jù)估計(jì),到2020年,全球數(shù)字化檔案估計(jì)將達(dá)到44萬(wàn)億Gb,數(shù)字化海嘯馬上就要席卷而來(lái),浪潮之下,我們應(yīng)該如何面對(duì)海量信息?
哈佛信息服務(wù)中心的計(jì)算機(jī)存儲(chǔ)架與笨拙的數(shù)據(jù)線
現(xiàn)在,有一種存儲(chǔ)信息的新方法可以穩(wěn)定地存儲(chǔ)數(shù)百萬(wàn)年的數(shù)據(jù),并且不受到黑客的威脅。
它的占用空間非常小,想象一下用一勺蛋白質(zhì)就可以保存整個(gè)紐約市公共圖書(shū)館的資料,一鍋蛋白質(zhì)就可以容納所有地球往事。并且一旦編寫,就不會(huì)再消耗能量。所需要的只有一個(gè)化學(xué)家,一些易得的分子和需要存儲(chǔ)的信息。
這是哈佛大學(xué)與西北大學(xué)合作開(kāi)發(fā)的一個(gè)項(xiàng)目,研究結(jié)果已經(jīng)在國(guó)際學(xué)術(shù)期刊ACS Central Science發(fā)表。該項(xiàng)目提出并實(shí)現(xiàn)了利用易獲得、低能耗、穩(wěn)定且能超長(zhǎng)時(shí)間保存的寡肽分子存儲(chǔ)數(shù)據(jù)(以二進(jìn)制形式),數(shù)據(jù)檢索準(zhǔn)確率超過(guò)99%。
從生物學(xué)到有機(jī)化學(xué):數(shù)據(jù)存儲(chǔ)的靈感
利用生物存儲(chǔ)能力來(lái)存儲(chǔ)數(shù)據(jù)的想法早已有之,并且已經(jīng)有了一定的進(jìn)展。比如,目前我們已經(jīng)可以通過(guò)合成DNA鏈來(lái)記錄信息,記錄的信息可以從美食照片,烹飪教程一直到擼貓視頻。
但是雖然DNA與計(jì)算機(jī)芯片相比較小,但還是屬于大分子。并且,DNA的合成需要大量重復(fù)的勞動(dòng)。如果每條消息都需要從頭開(kāi)始設(shè)計(jì)編譯,那么大分子存儲(chǔ)可能會(huì)因?yàn)檫^(guò)于昂貴耗時(shí)而無(wú)法實(shí)現(xiàn)。
Brian Cafferty
Brian Cafferty,該研發(fā)團(tuán)隊(duì)的成員之一,也是論文的第一作者介紹說(shuō),于是他們的研究團(tuán)隊(duì)從生物學(xué)轉(zhuǎn)向有機(jī)和分析化學(xué)尋求靈感,開(kāi)發(fā)使用一種更小、更低分子量的分子來(lái)編碼信息的方法。
這種存儲(chǔ)方式只需一次合成就可以生成足夠的小分子,用以編碼多個(gè)視頻,使這種方法無(wú)疑比基于DNA的方法更省力也更便宜。
用分子實(shí)現(xiàn)聽(tīng)說(shuō)讀寫畫(huà)
該團(tuán)隊(duì)選擇的低分子量分子是寡肽(兩個(gè)或多個(gè)結(jié)合在一起的肽),這些肽常見(jiàn)而穩(wěn)定,并且比DNA,RNA或蛋白質(zhì)分子量都要小。
而且由于組成寡肽的氨基酸數(shù)量和類型不同,它們的分子質(zhì)量是有差異的。當(dāng)不同的寡肽分子混合在一起時(shí),這種差異可以實(shí)現(xiàn)相互區(qū)分,不同質(zhì)量的分子就像字母表中的不同字母一樣。
將這些“字母”組成單詞會(huì)有點(diǎn)復(fù)雜,該團(tuán)隊(duì)將不同質(zhì)量的寡肽存儲(chǔ)在384個(gè)不同的“微孔”中,然后將寡肽混合物放置在金屬板的表面上,就像將墨水印在書(shū)頁(yè)上一樣。如果想要讀取“寫下”的內(nèi)容,可以通過(guò)質(zhì)譜儀按質(zhì)量對(duì)微孔中的分子進(jìn)行分類,查看這個(gè)孔中存在哪些寡肽、不存在哪些寡肽,由此讀取內(nèi)容。
然后團(tuán)隊(duì)使用二進(jìn)制編碼將混亂的分子翻譯成字母和單詞。例如,字母“K”在ASCII(美國(guó)信息交換標(biāo)準(zhǔn)代碼)中被寫作01001011,就可以通過(guò)使用八種不同質(zhì)量的寡肽存儲(chǔ)“K”。將微孔中存在的四種寡肽讀取為“1”,而缺失的四種讀取為“0”(如下表)。這些分子二進(jìn)制代碼指向相應(yīng)的字母;如果存儲(chǔ)的信息是圖像,則指向相應(yīng)的像素。使用這種方法,八種寡肽的混合物可以存儲(chǔ)一個(gè)字節(jié)的信息; 32種寡肽的混合物可以存儲(chǔ)四個(gè)字節(jié),以此類推。
更快,更便捷,更安全
到目前為止,Cafferty和他的團(tuán)隊(duì)已經(jīng)用這種方法記錄、存儲(chǔ)并“閱讀”了物理學(xué)家Richard Feynman的著名演講、Claude Shannon(他被稱為“信息理論之父”)的相片和葛飾北齋的畫(huà)作《神奈川沖浪里》。
名畫(huà)《神奈川沖浪里》
經(jīng)檢驗(yàn),這種存儲(chǔ)方式的檢索準(zhǔn)確率為99.9%。平均“寫入”速度為每秒8bits,“讀取”速度每秒20 bits。雖然目前還比大多數(shù)數(shù)據(jù)存儲(chǔ)設(shè)備要慢,但隨著技術(shù)的繼續(xù)發(fā)展,速度肯定還會(huì)提升。例如,如果噴墨打印機(jī)可以以每秒1,000次的速率產(chǎn)生液滴,就能將更多信息塞入更小的區(qū)域,或者再加以改進(jìn)質(zhì)譜儀使之可以同時(shí)獲取更多信息。
未來(lái),還可以通過(guò)引入不同類別的分子,提高存儲(chǔ)的穩(wěn)定性和容量,并降低成本。實(shí)驗(yàn)中使用寡肽是定制的,因此價(jià)格較貴。但未來(lái)還可以考慮可以購(gòu)買更便宜的分子(如烷硫醇),實(shí)現(xiàn)花1美分就可以記錄1億比特的信息。
“目前,這種方法還不會(huì)取代現(xiàn)有的數(shù)據(jù)存儲(chǔ)方法,”Cafferty說(shuō),“我們認(rèn)為它是對(duì)現(xiàn)有技術(shù)的補(bǔ)充,非常適合長(zhǎng)期存檔數(shù)據(jù)存儲(chǔ)。”Cafferty團(tuán)隊(duì)提出的分子存儲(chǔ)方法是一種穩(wěn)定的、零能耗、抗腐蝕的存儲(chǔ)可選方案。
寡肽等分子具備復(fù)原能力,可以在數(shù)百年甚至數(shù)千年的時(shí)間內(nèi)保持穩(wěn)定性。在高溫和干旱的情況下,這些分子可以在沒(méi)有光或氧的情況下存活下來(lái)。而且,黑客無(wú)法像攻破云存儲(chǔ)那樣竊取分子存儲(chǔ)的內(nèi)容,分子存儲(chǔ)只能通過(guò)人工訪問(wèn)。即使被發(fā)現(xiàn)藏匿的數(shù)據(jù),小偷也需要擁有足夠的化學(xué)知識(shí)才能實(shí)現(xiàn)代碼檢索。
所以未來(lái),即使所有的書(shū)都付之一炬,所有的計(jì)算機(jī)都被黑了,所有DVD都被毀壞,這些分子可能還會(huì)繼續(xù)存在,提醒未來(lái)的人類,我們?cè)?jīng)是多么喜歡那些萌萌的貓咪視頻。
-
數(shù)據(jù)存儲(chǔ)
+關(guān)注
關(guān)注
5文章
997瀏覽量
51728 -
生物學(xué)
+關(guān)注
關(guān)注
0文章
26瀏覽量
13077
原文標(biāo)題:超越云存儲(chǔ),用一勺蛋白質(zhì)保存整個(gè)圖書(shū)館
文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
有機(jī)化工廠引入人員定位系統(tǒng)的必要性

VNF9D1M5QTR芯片用什么硬件讀寫工具?讀寫軟件怎么實(shí)現(xiàn)?
潛力巨大的有機(jī)液流電池
童利民、郭欣研究團(tuán)隊(duì)發(fā)文報(bào)道有機(jī)小分子冰微納光纖

生物傳感器的主要組成包括_生物傳感器的分類
VirtualLab Fusion案例:?jiǎn)?b class='flag-5'>分子顯微鏡高NA成像系統(tǒng)的建模
SATA硬盤與SSD的區(qū)別 SATA硬盤的讀寫速度分析
微流控技術(shù)的生物學(xué)應(yīng)用
高分子半導(dǎo)體的特性與創(chuàng)新應(yīng)用探索

生物傳感器:科技前沿的生物監(jiān)測(cè)利器
EEPROM輕量級(jí)的簡(jiǎn)易類文件的數(shù)據(jù)讀寫庫(kù):EEPROMFS

Verilog vhdl fpga
閃存隨機(jī)讀寫與連續(xù)讀寫哪個(gè)重要
eeprom存儲(chǔ)原理、存儲(chǔ)結(jié)構(gòu)及讀寫操作
AFE4460光學(xué)生物檢測(cè)用超小型集成式AFE數(shù)據(jù)表

評(píng)論