微軟正研發個設備,要用 DNA 來存儲數據,這是個什麼東西?|潮科技

數據噴井,原有存儲技術卡在瓶頸時,微軟相信使得你成為你存在的那部分——DNA,會讓問題迎刃而解。

麻省理工評論報道稱,基於先前對 DNA 存儲電影、文件的研究,微軟正開發一種使用生物學替代磁帶驅動器( tape drives)的設備。

微軟研究院的計算機架構師表示,他們定下了個“小目標”:近十年內,建立在數據中心內基於 DNA 運轉的運營存儲系統。按照微軟的構想,“三年內,原型商業化系統要能以 DNA 存儲我們一個數據中心一定量的數據。”最終設備的模樣,可能與20 世紀 70 年代 Xerox 複印機尺寸相當。

事實上,微軟的目標遠更雄心勃勃,微軟研究院合夥架構師 Doug Carmean 表示,希望有朝一日,能直接標榜為“用 DNA 存儲 ”(Your Storage with DNA)。這意味著,過去用以存檔信息的常用方式——磁帶驅動( tape drives)將落下帷幕。

讓微軟惦念著的,正是 DNA 存儲技術。

DNA 是絕大部分生物體內有的遺傳基因,學術上稱為核糖核苷酸,由腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)四對鹼基對組成。別看僅有四對鹼基,世界約 75 億人模樣等各異,起決定性作用的便是 DNA。這同時說明, DNA 其背後蘊藏著的整套遺傳編碼機制,能寫入信息量之龐大。

知乎網友 talich以莫爾斯電碼能發的信息做類比,他稱只要有時間空間,DNA 能寫入的信息想要多少有多少。有研究人員表示,1 克 DNA 能容納455 EB(艾字節)數據,相當於 4550 億 GB 字節的數據,而 5EB 就相當於至今全世界人類所講過的話語,能存儲的數據容量相當恐怖

何況,DNA 存儲數千年後,若保存完整,提取出來後依然能讀取。因此你會看到,很多科學家孜孜不倦想從“古人”身上“挖”些什麼,DNA 是揭密一切的關鍵。

反觀市面在賣的臺式機硬盤,6 TB 已是比較強大的存儲容量,由於化學降解,數據能保存的時間 50 年基本是極限。且隨著存儲信息呈指數增長,用來存儲的數據中心恐怕也得翻倍。

IDC 預計,今年全球範圍內保存的數字化數據將達到 16 萬億 GB ,這些將存儲在數據中心,未來,微軟首席研究員卡林-施特勞斯指出,或許一個鞋盒大小的 DNA 存儲介質,就能相當 100 個大型數據中心存儲數據的能力。

正因 DNA 有高密度,每立方毫米能保存 1,000,000,000,000,000,000 字節的信息,及高效、存儲量大、存儲時間長、易獲取且免維護等優點,才會有微軟等科技公司都相聚該技術的前沿。

在微軟看來,DNA 是長期存儲數據的最佳介質。去年他們宣佈贏得突破,還僅利用 DNA 存儲技術完成約 100 部經典文學作品約 200MB 的數據保存工作,但這數字距離先前描繪的美好景象仍差距不小

成本問題很實際,將數字位轉化為 DNA 代碼(A、G、C、T),製造 DNA 鏈的化學過程費時費力。麻省理工評論稱,微軟示範的項目中,使用了 13,448,372 個獨特的DNA片段。專家說,在公開市場上購買這麼多材料將花費 80 萬美元。

要想廣泛應用,微軟表示至少得把成本降低 1 萬倍,這在許多專家來看很難實現,不過微軟相信,等計算機行業需求到了,自然就會發生。

目前將數據自動寫入 DNA 的水平還有限,依據實驗數據,速率大概僅有 400 字節/秒。因此,早期的存儲技術更可能侷限於特殊情況使用,包括需要根據法律或法規原因存檔的數據,例如警察機構視頻或醫療記錄。未來,微軟表示需要將寫入水平提高至 100 M字節/秒。

此外,該技術中用的 DNA 是人工合成的,這方面,微軟與 DNA 製造商 Twist Bioscience 達成合作,後者主要做提高 DNA 產量的活。

儘管,微軟未給出詳盡的產品細節計劃,但至少看得出,DNA 存儲作為來自未來的技術,給今後巨量的數據存儲以想象空間,同時也為微軟帶來更多進展的可能。

畢竟微軟是雲計算領域的老二,前有亞馬遜以絕對領先的市場份額優勢“傲視群雄”,後有各類科技巨頭窮追不捨。微軟至少得要在保住市場地位的情況下,再談搶亞馬遜的“盤中食”。最近微軟都把數據中心開到非洲去了,當數據中心愈積累愈多,如何提升數據存儲的效率,利用最小的空間,幹更多的事,DNA 存儲技術說不定能帶來革命性變化。

微軟未雨綢繆,結果究竟會怎樣,還挺讓人期待。

相關推薦

推薦中...