目前我們正處于數(shù)據(jù)爆炸增長的時代,像硬盤、內(nèi)存芯片等數(shù)據(jù)存儲容器已經(jīng)出現(xiàn)“負(fù)荷過重”的跡象?,F(xiàn)今看來,要想將全球數(shù)據(jù)存儲起來似乎技術(shù)還遠(yuǎn)遠(yuǎn)沒達到這個水平。但是,最近有研究發(fā)現(xiàn)一種新的數(shù)據(jù)存儲方式——DNA 數(shù)據(jù)存儲。
其實,這種存儲方式的研究早已進行中了。
去年年底,法國一位16歲高中生Locatelli將《古蘭經(jīng)》和《圣經(jīng)》中的部分內(nèi)容存儲到DNA中并注入到自己的體內(nèi)。他把希伯來語和阿拉伯語的字符轉(zhuǎn)換成DNA堿基的特定組合,將轉(zhuǎn)換后的DNA鏈移接到購買的病毒上,最后用注射器將病毒注入自己的大腿 。
從邏輯上來講,實現(xiàn)這項目標(biāo)并不難。Locatelli 首先用一個基本的系統(tǒng)將文本翻譯為構(gòu)成 DNA 的核酸。
在圣經(jīng)《創(chuàng)世紀(jì)》中,他將22個希伯來字母轉(zhuǎn)換成四種可能的核酸:胞嘧啶、胸腺嘧啶、鳥嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分別代表五個字母,鳥嘌呤和腺嘌呤分別代表六個字母。
在阿拉伯語文本中,Locatelli 去掉了 28 個字母中的 5 個,并給了其中 3 個獨特的核酸,允許 Ra 和 Sad 共享胸腺嘧啶。在這兩種情況下,Locatelli 都忽略空格、標(biāo)點符號和變音符號。
然后,他分別從VectorBuilder和ProteoGenix公司購買了定制的DNA鏈,以及用于將新DNA插入細(xì)胞的良性病毒。他買了一些生理鹽水和注射器就出發(fā)去參加了比賽。注射后,他只出現(xiàn)了輕微的過敏反應(yīng)。
但是,加州大學(xué)洛杉磯分校的生物化學(xué)家Sriram Kosuri表示,他不能確定Locatelli的方法是否真的有效; 也無法評估病毒載體是否成功地將合成的DNA導(dǎo)入Locatelli細(xì)胞。
除了這位高中生的研究成果外之外,最近,一家位于波士頓的初創(chuàng)公司Catalog宣布,他們成功將維基百科英文版一共16G的文本內(nèi)容存儲在了一個DNA分子上!
一個DNA分子即可輕松存儲16g內(nèi)容
計算機存儲容器已經(jīng)從帶磁鐵的電線變成硬盤,如今發(fā)展到3D存儲芯片。為了追求更小占用空間卻有更多的存儲空間,下一代存儲容器也許會回溯到與地球上的生命一樣古老的方法:DNA。
企業(yè)Catalog近日宣布,他們將維基百科英文版的所有文本一共16G的內(nèi)容存儲在了一個DNA分子上!
Catalog用它的第一個DNA書寫器完成了這項壯舉。
這個DNA書寫器有多大呢?大小大概與一輛現(xiàn)代 SUV 差不多。盡管它目前看起來不太可能可以有機會打倒手機的存儲芯片,但Catalog認(rèn)為,它對一些需要將數(shù)據(jù)存檔的客戶來說已經(jīng)很有用了。
DNA鏈雖然很小,也很難管理,但是生物分子可以存儲在除了控制細(xì)胞如何發(fā)芽或為什么猩猩會是猩猩的基因外的其他DNA區(qū)域。Catalog使用了比人類DNA短但更多的預(yù)制合成DNA鏈,因此它可以存儲更多的數(shù)據(jù)。
可能聽起來像是倒退,但DNA是緊密的,在化學(xué)上以穩(wěn)定的形式存在,同時由于它是地球生物學(xué)的基礎(chǔ),可能不會像硬盤驅(qū)動器或CD那樣過時,也不會像軟盤驅(qū)動器那樣被市場淘汰而消失。
由于傳統(tǒng)的DNA測序產(chǎn)品已經(jīng)在生物技術(shù)市場上銷售,可以以此讀取DNA數(shù)據(jù)。研究人員認(rèn)為“這一全新的序列技術(shù)用例將有助于(大大)降低成本”,Catalog認(rèn)為DNA存儲方式在計算業(yè)務(wù)中潛在一個巨大市場。
Catalog也使用了尋址系統(tǒng),這意味著當(dāng)DNA以長序列存儲數(shù)據(jù)時,也可以使用分子探針讀取存儲在任何地方的信息。就是一種硬盤一樣的隨機存取存儲器,而不是像半個世紀(jì)前大型計算機鼎盛時期的磁帶盤那樣的順序存取。
有人會認(rèn)為DNA會被射線破壞,但 Catalog 認(rèn)為它是一種比其他方法更穩(wěn)定的介質(zhì)。畢竟幾千年前滅絕動物依然能發(fā)現(xiàn)其DNA。
DNA存儲數(shù)據(jù)有什么意義?
《科學(xué)美國人》與世界經(jīng)濟論壇聯(lián)合發(fā)布了 2019 年全球十大新興技術(shù),其中一項就是用 DNA 儲存數(shù)據(jù)。那么,DNA存儲數(shù)據(jù)的意義何在呢?
據(jù)軟件公司Domo稱,在2018 年,谷歌每分鐘都有388 萬次搜索、YouTube被觀看的視頻有433萬個、有159362760封電子郵件被發(fā)送、推特有47.3萬條,在 Instagram上也發(fā)布了49000張照片。
預(yù)計到2020年,全球人均每秒將產(chǎn)生大約1.7兆字節(jié)的數(shù)據(jù),假設(shè)世界人口為78億,一年就會產(chǎn)生約418個 zettabytes。如果放在容量為1TB的硬盤上,則需要4180億個!
這種情況下,目前的數(shù)據(jù)存儲系統(tǒng)根本撐不過一個世紀(jì)。此外,運行這些數(shù)據(jù)也需要消耗大量的能量。因此,我們將面臨一個嚴(yán)重的數(shù)據(jù)存儲問題,并且隨著時間的推移,這個問題只會變得越來越嚴(yán)重!
所以硬盤存儲的一種替代方案——基于DNA的數(shù)據(jù)存儲才顯得尤為重要。由核苷酸A,T,C和G的長鏈組成的DNA 序列是生命的信息存儲材料。數(shù)據(jù)可以按照這些字母的順序存儲,從而將DNA轉(zhuǎn)變?yōu)橐环N新的信息技術(shù)形式。
目前DNA已經(jīng)可以常規(guī)排序(讀?。?,合成(寫入)并且可以輕松準(zhǔn)確地復(fù)制。DNA本身結(jié)構(gòu)也是非常穩(wěn)定的,正如生活在50多萬年前的化石馬的完整基因組測序所證明的那樣,存儲它不需要太多能量。
另外,DNA的存儲容量是讓人驚訝的。DNA可以以遠(yuǎn)超過電子設(shè)備的密度精確存儲大量數(shù)據(jù)。例如,根據(jù)哈佛大學(xué)George Church及其同事2016年發(fā)表在“Nature Materials”雜志上的計算,簡單的大腸桿菌的存儲密度約為每立方厘米1019比特。
在這樣的密度下,僅僅需要一個邊長約一米的DNA立方體便可很好地滿足全世界一年的數(shù)據(jù)儲存需要,簡單來說就是1kg DNA就能儲存全球數(shù)據(jù)。
DNA 數(shù)據(jù)存儲的前景不僅僅是理論上的。例如,2017 年,哈佛大學(xué)的Church小組采用CRISPR DNA編輯技術(shù),將人手的圖像記錄到大腸桿菌的基因組中,并以高于90%的準(zhǔn)確率讀出。華盛頓大學(xué)和微軟研究院的研究人員已經(jīng)開發(fā)出一個完全自動化的系統(tǒng),用于編寫、存儲和讀取 DNA 編碼的數(shù)據(jù)。包括微軟和Twist Bioscience在內(nèi)的一些公司正在致力于推進 DNA 存儲技術(shù)。
與此同時,DNA已經(jīng)被研究人員用來以不同的方式管理數(shù)據(jù),這些研究人員努力處理海量的數(shù)據(jù)。新一代測序技術(shù)的最新進展使得數(shù)十億個DNA序列可以輕松同時讀取。有了這種能力,研究人員可以使用 DNA 序列的條形碼作為分子識別“標(biāo)簽”,以跟蹤實驗結(jié)果。另外DNA條形碼正被用于大大加快化學(xué)工程、材料科學(xué)和納米技術(shù)等領(lǐng)域的研究步伐。例如,在佐治亞理工學(xué)院,James E. Dahlman的實驗室正在迅速確定更安全的基因療法;其他人正在研究如何對抗耐藥性和防止癌癥轉(zhuǎn)移。
不過目前阻礙DNA數(shù)據(jù)存儲方式普及的原因之一便是讀取和寫入DNA的成本太高、速度還不夠快,要與電子存儲競爭,就必須進一步降低這些成本和提高速度。
-
存儲器
+關(guān)注
關(guān)注
38文章
7484瀏覽量
163761 -
硬盤
+關(guān)注
關(guān)注
3文章
1308瀏覽量
57282 -
內(nèi)存芯片
+關(guān)注
關(guān)注
0文章
126瀏覽量
21861 -
數(shù)據(jù)存儲
+關(guān)注
關(guān)注
5文章
970瀏覽量
50894
原文標(biāo)題:將數(shù)據(jù)存儲到身體?下一代的存儲容器也許會是DNA。
文章出處:【微信號:luomajqrxt,微信公眾號:機器人學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論