達令觀察|去中心化互聯網的未來——存儲才是關鍵

​此文主要描述了基於區塊鏈技術的文件存儲系統的出現,以及它對於整個體系的影響。基於區塊鏈的文件存儲(BFS)是除了中心化存儲和無激勵模式的P2P文件系統之外,另一種更有前景的備選方案。如果BFS可以解決其中的使用以及技術難題,那麼它就有可能成為全新的存儲架構,從而促進去中心化互聯網的形成。


簡介


最近,很多人開始關注去中心化系統,因為這可以去除中介化,創建全新的經濟規模,並且為用戶提供前所未有的數據掌控能力。智能合約功能可以讓用戶能夠創建擁有這些優勢的應用。通過這些工具,用戶可以快速獲得被稱為去中心化網絡(或者web3)的全新互聯網體系,其中所有的應用都會比現在更加強大,而且去中心化的應用會基於經濟且安全的區塊鏈系統開發。

但是,很快我們就發現,作為“去中心化操作系統”,如果在不進行性能優化之前,區塊鏈還不能運行類似加密貓這類對資源和效率需求很高的應用。這類事件讓更多人關注,並且在現有的底層基礎上,去嘗試進行性能創新以及提升,從而保證可以生產出有用的去中心化應用。

例如,區塊鏈本身是一個非常差勁的存儲裝置,我們需要知道一個非常重要的事實, 區塊鏈存儲文件的性價比很低。事實上,一個由數千個用戶共享的賬本,其中每個用戶之間都需要複製每一段數據,這會導致區塊鏈不能夠承載超過兆字節的數據。

因此,對於去中心化系統的很多重要技術開發都應該在區塊鏈之外- 例如第二層解決方案,私有P2P網絡解決方案,存儲文件等等。實際的區塊鏈和其他獨立部分會組成起來,共同構建這個去中心化互聯網。


達令觀察|去中心化互聯網的未來——存儲才是關鍵

Web3堆棧


雖說去中心化系統具有劃時代的意義,但是如果底層技術擁堵,並不會有很多人願意加入去中心化互聯網,這也意味著去中心化的技術堆棧(除了去中心化資產)比起現有的不能太差。

目前,堆棧的任何部分都不完整,DNS、存儲和計算層的開發處於特別早期。我們都知道的典型口號是:“我們將利用區塊鏈不可篡改等優勢,去構建一個DAPP,就算需要將文件存儲在中心化的地方,也沒有關係。

我想說,就算基於區塊鏈,我們可以打造所謂的應用,可以得到應用,但是這些應用也並不是“去中心化應用”,因為其中的數據並沒有通過可信的、去中心化的方式來進行存儲和交易。換句話說,雖然這些應用程序在其他方面有很多優勢,但是並不一定是因為它們是完全去中心化的。

這就帶出了我的核心觀點:

基於區塊鏈的文件存儲系統 -> 去中心化數據 ->去中心化互聯網


BFS將會是支持web3架構的支柱,BFS會通過去中心化數據去促進去中心化的互聯網體系。因為沒有真正的去中心化數據,就不會有真正的去中心化應用,也不會有真正的去中心化互聯網體系。

和其他存儲解決方案相比,安全、公平且經濟的BFS系統對於通用系統以及web3架構來說,都有很多好處和優勢。隨著BFS的知名度逐漸增大,我也會分析其中可持續發展的技術和商務壁壘。

一、中心化雲存儲開始主導市場(20世紀90年代-現在)

20世紀90年代,文件都是存儲在不同的服務器中,而且用戶可以直接從計算機中調取數據。雖然用戶能夠自主完全地控制文件,但是設置這些服務器卻需要豐富的互聯網和加密方面的經驗,以及很多時間。

最初,這看似並沒有什麼問題,因為在1997年,整個互聯網也就1.5TB的數據,而且當時互聯網的綜合價值也不像現在這麼巨大。當時非常著名的計算機專家總結地很好:“現在,所有的信息加起來可能也就幾千兆字節;到2000年,磁帶和磁盤的生產將達到這個水平。”

這種情況在近些年逐漸改變,因為目前計算機到計算機的交互會產生比人類本身更多的數據,而且這些數據對於用戶和企業都很重要,因為這會讓他們找到全新的方式來從數據中獲得相關結論,例如人工智能、超高清視頻以及金融模型。

用戶對於存儲、持有以及分析這些數據的需求變得越來越多,並且他們自己也很難去掌控這些數據。2018年,現在已經有大約32ZB(也就是32,000,000,000 TB)的數據。

這是亞馬遜的切入點,因為亞馬遜把自己打造成為了電商行業的重要玩家,他們需要開發很多的內部API和底層設施,從而掌控和他們業務相關的海量數據。現在,亞馬遜團隊打造了完整的內部軟件集合,從而幫助他們很多部門節省了很多時間,因為這不需要擔憂基礎設施。

其中,2006年,亞馬遜S3和EC2發佈,預示著中心化雲時代來臨。

雲服務讓用戶能夠很容易地進入到亞馬遜各類強大的工具,並且由於使用起來非常簡單,這可以滿足很多企業的存儲需求。亞馬遜(在微軟、谷歌和類似Facebook的私有云之後),逐漸獲得了更多的互聯網數據。

個人用戶會丟失對他們數據的主權和控制能力,而且如果有1個故障點,大量的數據持有者會成為數據破壞、數據丟失以及服務器宕機等問題的受害者,從而導致了幾十億美金,以及人類知識和文化的損失。這些問題,包括越來越多的人瞭解到大型中心化雲端服務器可能會破壞個人以及企業的隱私,在思想上和實際上都推動了反對數據集中的運動。

作為去中心化互聯網的一部分,亞馬遜S3由於簡單好用成為了很多人的選擇。大量的DApp目前都在使用亞馬遜的服務,來啟動他們的產品,承諾去中心化數據的未來,又或者是告訴別人,就算沒有去中心化的數據,你依舊可以獲得去中心化應用。

但是,數據集中是一個根本性的嚴重問題,它使託管在集中雲上的應用程序或基礎設施並沒有去中心化。這個互聯網只是一堆互相傳送文件的計算機,中心化的存儲導致中心化數據,從而導致中心化網絡。


因此可以推論,好的去中心化存儲方案解決了去中心化網絡的遺留問題。儘管web3很多其他的組成部分被攻擊了,數據最終都能夠通過可信的方式被提取。儘管公鏈本身在沒有去中心化存儲的情況下,並沒有完全去中心化,因為這就好像大多數的區塊鏈主節點是使用中心化雲端存儲解決方案。

去中心化存儲打造去中心化數據


二、挑戰出現:點對點的文件存儲系統(2001年-至今)

點對點的文件存儲系統作為中心化雲服務器的替代品出現,並且還沒有中心化的風險。亞馬遜S3出現的5年前,BitTorrent已經讓文件在用戶之間有效地傳輸。2009年,點對點的應用佔據了50%的互聯網流量。雖然BitTorrent可以讓用戶能夠互相分享文件,但是這不能像亞馬遜S3或者Dropbox那樣,讓你存儲和尋找文件;因此這並不是文件存儲的解決方案。

IPFS想在BitTorrent的基礎上,打造真正的點對點、去中心化的文件存儲系統。在IPFS中,所有的文件都會集中起來,其中會有通用的語言,並且所有的用戶都會在整個系統中共享,這可以讓他們尋找並且互相轉移文件。

例如 Internet Archive的企業以及很多DApp都開始嘗試使用IPFS來進行文件存儲,並且宣傳說它們的架構是去中心化的。對於很多最初的案例來說,IPFS是絕對足夠了。

因為IPFS把用戶都集中在一個系統(其中各個用戶可以通過去中心化哈希表格(DHT)來尋找對方),所以通過IPFS協議會產生通用的溝通語言,並且不會存在單點損壞,IPFS對於全新的去中心化互聯網來說,確實是去中心化存儲的基礎。顯然易見,很多知名的DApp例如OpenBazaar 和Augur都在使用IPFS。

但是,非常不幸,對於社區項目以及開源熱愛者來說,IPFS的快速擴展還存在一些底層方面的問題。以下是最主要的一些問題:

1. IPFS中的文件會被分發到更多節點,但是由於這些節點並沒有特別多的激勵去持有這些文件,因此訪問量很少的文件逐漸就會消失。這就會導致很多商業應用,例如需要長期保留的視頻,或者是以前的區塊鏈無法使用。

2.雖然DHT讓用戶能夠在IPFS中很快地檢索到對方,並且找到文件,但是對於文件檢索來說,DHT並不安全。這意味著,惡意的攻擊者只需要花費很少的成本,就可以讓你找不到特定的文件。

許多項目通過將文件存儲在中心化Amazon S3計算機託管的IPFS節點上,從而修補了第一個問題。這意味著,你會自己持有幾個亞馬遜S3節點,從而保證你的文件會一直在IPFS網絡(主要亞馬遜節點仍在工作)。但是,中心化的問題再次出現,這影響了使用IPFS的意義。為了讓去中心化數據更好,我們需要地是從這些系統中汲取靈感,但是增加一個激勵層,同時也有更加強大的安全保障,最終打造出和中心化數據有著同樣擴容能力的去中心化數據。

三、基於區塊鏈的文件存儲系統(2020年後)

公鏈使用加密激勵和懲罰制度,從而引導不受信任的用戶行為達到期望的共識。因此,帶有強大加密激勵系統的BFS由去中心化技術堆棧的其他部分所支撐,例如安全的DHT替代方案,這樣就可以保證IPFS是事實上的去中心化互聯網基礎設施。

對於去中心化互聯網,理想的文件存儲解決方案需要比中心化方案更好,那就是去中心化解決方案。

在一個良好的應用場景中,網絡中每個存儲供應商都有大量的存儲空間,並且這些存儲和帶寬能夠有效地進行加密保障。BFS具有創新以及技術的全新應用,例如糾錯編碼,存儲證明以及空間證明。很多充滿創新的玩家進入到大家的視野,同時也有幾十個項目通過各種方法在技術和產品端進行創新。

遵守區塊鏈規則的個人和參與的專業存儲提供商的集合可能會削弱任何集中化公司的影響力,甚至是類似亞馬遜這樣的巨頭。除了去除中介的數據交易,基於區塊鏈的解決方案會有以下優勢:

1. 可以讓你控制自己的數據,並且可以防止審核

通過加密激勵,如果節點沒有存儲和服務數據,那麼就會受到經濟上的懲罰。當數據文件有非常高的容錯率時,企業甚至政府機構會發現很難去記錄它們。由於去中心化,其中不會有中介(例如谷歌/AWS)去代替你管理數據。

2. 對嚴重的黑天鵝事件和網絡宕機有很強的抵抗力

通過傳統分片或者是糾錯代碼的方式,文件可以進行分片,讓很多人共同持有。如果有足夠的節點,那麼自然災害、人類/計算機錯誤、以及其他的任務都會難去影響這個系統。

3. 和中心化系統相比,擁有很大的優勢

由於很多節點存儲了文件的不同部分,因為下載文件是可以同步進行的。正如在BitTorrent中,同步下載會比中心化雲服務器要快速很多。

4. 大概率價格很低,可以創建新的經濟模式

存儲和數據已經被很多人認為是價值,並且很多的硬盤空間都是空置的。存儲提供方可以利用這些硬盤資產變現。由於存儲文件的成本會比硬盤本身低很多,因此存儲只需要很少的成本,也就是說,存儲服務提供商可以保證純利潤。現在的解決方案已經向用戶展示了成本大量節省:Sia成本大約小於2美金/TB/月,而S3的標準服務成本是23美金/TB/月。

對於去中心化互聯網,理想的文件存儲解決方案應該比中心化的要更好,也就是去中心化的存儲方案。BFS可以獲得中心化的用戶體驗,同時還有IPFS的去中心化服務。中心化的主要問題在於,他們是屬於中心化的。換句話說,完美的BFS是完美的文件存儲解決方案;它需要使用去中心化數據把關注去中心化的用戶人群從中心化解決方案轉移過去,因為這種轉移只需要有相對很小的損失。

四、基於區塊鏈的存儲系統還有很多問題需要解決

關於BFS相對於IPFS和中心化解決方案的好處,在之前的章節中都有提到。事實上,這兩個最著名的生產級存儲項目在2018年的實際存儲量比大型雲提供商在2016年少數千倍,預計未來幾年,雲存儲的總存儲容量將大幅增長。和很多區塊鏈用戶以及傳統企業溝通後,得出一個結論:在去中心化互聯網顛覆中心化解決方案之前,還有很多需要去做。亞馬遜S3和其他都有功能和優化,以及目前無法和基於區塊鏈解決方案或者IPFS匹配的使用方案。大量實踐均面臨著需要檢測技術和使用性問題。


達令觀察|去中心化互聯網的未來——存儲才是關鍵



基於區塊鏈的內容存儲系統依舊非常年輕

達令觀察|去中心化互聯網的未來——存儲才是關鍵



1. 技術方面

亞馬遜S3目前在上傳和下載方面有著巨大的優勢,同時也有範圍更大的功能應用。

從文件上傳角度來看,去中心化解決方案和中心化相比,效率會更低。總體來看,視頻上傳是通過去中心化市場進行,其中文件存儲供應商以及存儲“購買方”需要相對符合。這種撮合和溝通的過程,以及個人節點處理速度比企業級中心化電腦要低很多,都是去中心化文件上傳的瓶頸。當上傳資料給某個人(通過鏈上驗證存儲合約),系統需要很長的首次啟動時間(上傳延時);又或是首先上傳,然後讓文件上傳交易(其中買賣雙方撮合成功)會存儲在認證的區塊中,整個過程需要幾秒到幾分鐘時間。

例如同步上傳等解決方案,其中不同的分片或者文件部分可以同時上傳到不同的節點,從而最大化利用連接帶寬,長期的購買方-提供方合約,批量鏈下買/賣方匹配,同時存儲內容協商可以通過鏈上(第二層解決方案)解決,並且更快的共識/共有效的區塊傳播技術正在開發。

擴容困難也是影響區塊鏈性能的主要問題,如果每個Tx指定要存儲的50MB文件,並且每個塊有25個存儲交易,每30秒會出新塊,那麼整個系統每年可以存儲大約1.3EB的數據,與大型雲提供商目前存儲的內容相比,這相形見絀。除此之外,現在還有很多瓶頸,例如存儲證明機制速度還很慢,因此係統無法獲得最大的使用能力。第2層解決方案和其他擴容方案可以解決這個問題,但是加密證明算法也需要更加有效。

下載速度和上傳一樣,也會遇到相同的問題,其中下載速度以及延遲問題會因為購買者/提供者的撮合和溝通而導致,同時個人節點的運轉速度也是問題。下載方可以提前支付下載需求(Sia,Stroj),或者根據需求支付,例如提前下載(Filecoin)。通過提前下載的方式可以每次都使用購買方-提供方撮合以及支付的方式,如此儘管運算是在鏈下完成,所需要花費的時間也比中心化解決方案高很多。這些問題的解決方案和上傳功能所需要的類似。

因此,基於區塊鏈的解決方案還有很多功能不能實現。

例如,就目前的解決方案而看,每個下載者都必須要在區塊鏈上是註冊用戶,並且擁有通證,但是在中心化雲服務中,每個人都可以在自己的瀏覽器或者app上瀏覽內容,並且不需要任何基本知識(當然,這其實是使用上的問題)。目前的解決方案給予用戶加密文件,但是由於交易信息是公開的,其他人也可以看到用戶在將特定的文件哈希轉移給別人。這對於很多企業來說是非常嚴重的問題,例如基因公司是不想讓別人知道傳輸了哪些信息,也不想讓這些數據公開(甚至是哈希值也不想公開)。

同時,設計有效的證明機制也非常困難(例如存儲證明),同時也很難保證上傳對應的文件(上傳證明)。另外,對於企業來說,他們希望所有的服務都夠專業並且有保障。服務級協議(SLAs)以及文件權限許可(誰可以查看文件)是很難實施的,目前大多數功能還處於非常早期的開發階段(我們現在只達到了中心化系統20%的水平)

2. 可用性

BFS和區塊鏈本身的可用性是另外一個很大的問題。

區塊鏈缺少和更多支付方式的結合是個大問題。BFS通常脫離DAPP用戶的公鏈選擇。例如,Filecoin、0Chain和Sia都有他們自己的區塊鏈體系。DApp用戶不會想去學習非常複雜的全新公鏈,以及如果去上傳文件。跨鏈整合以及跨鏈支付可以讓整個系統的使用變得更加容易。例如,NEO DApp的用戶(也許有一些NEO和GAS通證)可以使用Gas通證,通過簡單的API接口,就可以去上傳文件。這樣地化,BFS就無所謂是NEO本身,或者是跨鏈對接。理想情況下,所有通證支付的動態都需要儘可能直觀。

其次,當用戶想使用文件的時候,體驗也很差。例如,無論你是上傳者還是下載者,在Filecoin和Sia體系中,你必須下載整個區塊鏈數據,這需要幾個小時。然後,你需要在交易所創建賬戶,同時要能夠理解加密貨幣以及錢包等。這和亞馬遜S3是相反的,因為你可以通過網頁界面管理所有的上傳文件,並且所有的下載都是從用戶終端那裡抽象出來的,因此用戶甚至都不知道文件來自瀏覽器何處,直到亞馬遜垮了,並且記錄了facebook和其他互聯網部分的大量數據。顯然,區塊鏈和數字貨幣的用戶體驗提高還需要很長的時間,其中一個解決方案是把這些複雜的流程放到上傳端,從而下載端可以通過簡單的JS模塊,無需安裝就可以從瀏覽器使用。

五、基於區塊鏈的文件存儲與去中心化互聯網的良性循環

去中心化網絡可以打造無需中介的數據交換系統。這可以讓互聯網應用的新用戶能獲得到前所未有體驗。正如Polychain資本的Olaf Carlson-Wee所說:“我認為我們將會比較web2和web3,但是隨著時間發展,我們會發現這些web3聽起來都很科幻,而且我認為現在對於web3的發展還很模糊”。不論對於區塊鏈數據、前端數據、元數據或者大型多媒體文件來說,存儲和分享這些數據的工具對於這類數據交易以及實現去中心化都很重要。雖然BFS系統仍然在推進,但是我們可以更多關注,並且努力完成這項技術。基於區塊鏈的文件存儲系統並不只是概念,而代表了現在急於解決的問題。這樣做,我們可以享受到來自去中心化解決方案的便利,同時也能獲得中心化系統的快速和簡易。

六、基於區塊鏈的文件存儲系統,促進了去中心化的互聯網

去中心化數據造就了去中心化互聯網。根據之前所描述,互聯網其實就是由很多用於存儲和轉移數據的電腦,通過一系列通信協議相互連接形成的。去中心化數據是無需信任的,並且會通過去中心化的方式存儲和分享數據。正如本文所寫,現在有3200萬個區塊鏈錢包;現在已經有百萬級用戶享受到去中心化通信協議的便利(例如gossip協議、Tor等等),並且可以通過無需信任的方式驗證數據(區塊兩本身的性質)。但是,這些還並沒有應用到真正運作的去中心化app,因為強有力的數據存儲層目前仍然缺失。

去中心化互聯網是否會完全取代中心化互聯網,這取決於BFS是否能夠戰勝中心化服務,這還有待觀察。隨著去中心化存儲應用的參與者越來越多,這也就為去中心化互聯網帶來了更多用戶。希望此文能夠為大家介紹基於區塊鏈的文件存儲系統以及它的重要性。

作者:Eric Wang是Archon Cloud的聯合創始人,這個系統是基於區塊鏈的文件存儲系統,其中Eric主導了研發和其他相關工作。

譯者:Alex

未經允許,禁止轉載。如需閱讀原文,請搜索公眾號:DalingRe-DR,關注公眾號,點擊本文底部鏈接即可。


相關推薦

推薦中...