雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

區塊鏈 數據 存儲 DxChain 2018-07-24

編者按:6月27日,中國科技媒體雷鋒網刊登了DxChain創始人張亮(Allan Zhang)專訪內容,介紹了張亮創辦DxChain的初衷,以及DxChain的技術構想。請參考下面的採訪內容。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

6月27日雷鋒網發佈專訪內容

「真正的數據和計算上鍊,這兩個目標,任何一個都將對區塊鏈世界產生巨大的貢獻。」

數據是一切業務的核心,數據正在承載太多的價值。

    站在互聯網的下半場,面對狂湧而至的區塊鏈浪潮,數據正成為各企業的核心競爭力。不僅BAT、亞馬遜、微軟等國內外巨頭在此廝殺,一些區塊鏈團隊也將目光轉向數據上鍊帶來的盈利前景。

    來自硅谷且成立不久的 DxChain,就是這樣一個區塊鏈初創團隊。DxChain 瞄準數據的存儲、計算和隱私需求,力圖打造一個分佈式的大數據存儲和機器學習網絡。在 DxChain 創始人張亮看來,DxChain的使命就是要讓一切數據價值化,一切數據貨幣化。

緣起

    五年前,張亮在海外創建了一家移動安全公司 Trustlook(具體可參見雷鋒網去年專訪張亮的報道)。據張亮介紹,目前共有將近 5 億多移動端用戶使用 Trustlook 殺毒引擎。2016年,隨著公司的持續擴展,張亮試圖接入 AI 技術來做殺毒引擎,以便獲取更多的可能性。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

DxChain創始人張亮

    幸運的是,從2016年下半年開始湧現的 AI 熱潮,讓張亮和他的 Trustlook 對接入這條新軌充滿了信心。然而作為一家 AI 技術驅動的安全公司,Trustlook 的惡意軟件和勒索軟件檢測引擎的質量嚴重依賴於從其客戶和合作夥伴收集的樣本數據。這樣會帶來兩個問題:

  • 高質量的樣本數據很難獲得。如要得到病人的 DNA 數據,像 Trustlook 這樣的初創公司需要從 Mcafee、賽門鐵克和谷歌這樣的大型安全廠商購買或交換,這個過程需要支付額外的訂閱費。

  • 維護大型機器學習集群和數據中心存儲的成本很高。經張亮介紹,Trustlook 收集的移動樣本數據很大,超過好幾個 PB(1PB:Petabyte 千萬億字節 拍字節=1024TB)。這些大的數據集聚在後端,需要巨大的預算和資源來維護。

    「所以,我們一直在想,能否有一種方案,可把 Trustlook 的資源成本節省出來,降低存儲和商業智能分析計算的費用。可能只要降低3%-5%的成本,Trustlook 就會變成一個非常賺錢的企業。」張亮直言。

    或許正如張亮所言,自己是一個靠嗅覺吃飯的人。在 Trustlook 遇數據存儲難題求變之際,區塊鏈恰如其分的出現了。這個分佈式的記賬網絡,因具備分佈式、多節點、分佈式存儲的特點,不僅可以降低存儲提取成本,同時也能保證數據不被篡改或丟失。通過區塊鏈技術,集合機器學習算法和大數據分析,或能幫助 Trustlook 實現「求變」。

    由此,DxChain 項目作為張亮創辦的另一家公司,應運而生。

鏈上鍊+大數據分析+機器學習

    根據白皮書顯示,DxChain 是一個由以計算為中心的區塊鏈及其一個內在通證協議驅動的大數據分析和機器學習網絡。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

    在這個網絡裡,包含四點創新:一個新的分佈式計算框架;一個新的鏈上鍊設計,包含一條主鏈和兩個側鏈;在 DxChain 引入 Hadoop,以促進大數據處理和機器學習;專為支持大多數的業務數據交換和數據分析需求設計。

    張亮認為,不管是處於互聯網前期的移動互聯網,還是現在正慢慢侵入的物聯網,其基礎都是關於大數據和基於大數據的計算。在區塊鏈技術的驅動下,未來將是價值互聯網的世界,它需要存儲足夠多的數據,並具備計算這些數據的能力。「然而,區塊鏈本身存儲空間有限,還處於一個非常初級的階段,這在一定程度上限制了價值互聯網未來的發展。」張亮告訴雷鋒網(公眾號:雷鋒網)AI金融評論。

    為此,DxChain 在創立之初,提出了三鏈合一的架構體系——一條主鏈及兩條分別處理數據存儲和計算問題的側鏈。這點即為 DxChain 的一大創新之一。具體來說,在“數據存儲”的側鏈上,只存儲有用的、有價值的數據,並可以無窮無盡的拓展存儲空間,從而解決區塊鏈的存儲侷限;在“計算”側鏈上,可支持在海量的數據中實現快速的搜索和並行計算;主鏈則負責提供交易相關操作,並同時協調存儲側鏈和計算側鏈。

    為了更好地理解機器學習、大數據分析與區塊鏈是如何結合來實現鏈上的計算和存儲這一問題,張亮以歌曲的場景舉了個例子。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

    比如,有海量歌曲存儲在鏈上,這些歌曲分佈在每一個礦工手中。在統計這些歌曲的數量、平均歌曲的長度、歌手等信息時,DxChain 通過 Map-reduce 的分佈式計算邏輯,可實現任務的拆解。在 Map-reduce 的運行邏輯下,第一步可能會先按照區域、歌手等標籤拆分數據,接續再以區域與區域之間進行合併統計,最後拆解完整個歌曲存儲和計算的任務。在這個過程中,將數據打散,並分佈到每一片數據上,並在相鄰的兩個節點或多個節點裡再做聚合,聚合的過程稱為「reduce」,而再打散、再運算的過程則稱為「map」。這樣一來,任何一個複雜的計算都可以被拆解,計算效能得以線性增長。

    然而,如果要對海量(足夠大)的歌曲進行統計,個人電腦基本不可能完成。個人只能在鏈上發佈一個統計任務,對所有歌曲做一次運算,運算的過程則由鏈上存儲這些歌曲的每一位礦工共同參與完成。而這個過程,不可避免會涉及不同機構的參與方,那麼,信任問題該如何解決?

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

    據張亮介紹,DxChain 借鑑並推整了 Hadoop 系統,並將 Map-reduce 的任務搬到鏈上。通過 Map-reduce 的分佈式設計系統,來管理節點中的任務,同時還與 Hadoop 的作業跟蹤器通信。從而結合兩個系統的優勢,實現跨企業、跨行業的巨大數據量之間的分佈式計算。

數據上鍊or計算上鍊,區塊鏈世界或大有不同

    然而,任何一項新技術,都需要商業場景的驅動,否則將不具備任何價值。張亮對這點想得很明白。所以,在創立之初張亮對 DxChian 的定位就在於利用 Trustlook 積累的數據資源,解決區塊鏈網絡的存儲和計算難題,讓 Trustlook 成為 DxChain 首家數據上鍊的公司。

    據張亮介紹,除5億多的移動端用戶外,Trustlook 的服務器每個月還有接近30億次的API請求。這麼多的終端,每臺終端又有這麼多的數據。如果用戶在合理價格的智能合約內願意貢獻或出讓自己的數據到鏈上,買家或企業則基於智能合約在鏈上進行併購或購買數據,雙方達成交易。DxChain 作為平臺方,在其中抽取一部分收益,這將是一件多方互利共贏的事情。

    轉換一個場景來說,國外的 DNA 數據非常寶貴。很多科學家雖然具備專業的知識,但因缺少數據樣本、研究進程受阻。如果這個場景能夠依靠數據上鍊實現交易,就能擁有遠大的應用潛能。

    張亮列舉了一個場景,如果一位病人願意出讓自身的醫療數據給到科學家,或者數據研究公司,或者其他對該份數據有需求的機構。同樣一份數據,上鍊之後,就能同時轉讓給鏈上的多方機構。這樣一來,不僅病人能收穫一筆不菲的收入(抵消看病支出),賣方也能進一步降低成本,實現交易的分佈式。

    不過,場景預設是一回事,實際的推進則是另一回事。對任何一條鏈來說,其共識機制往往是最難驗證的,也是開發鏈都避不開的一大難點。做好一條鏈已經很難很難,更毋論 DxChain 這種三鏈合一的結構,甚至是在其之上搭建應用場景。「DxChain 沒法一步到位實現這個目標,必須一步一步來。」張亮說,「我們得先把主鏈穩定,再穩定第一條側鏈,在這兩條鍊形成二鏈合一的結構且能穩定運行之後,我們才會加入第三條鏈。」

    事實上,市面上瞄準分佈式存儲前景的,並非 DxChain 一個,IPFS、Storj、SiaCoin、Lisk(應用鏈)也在此列。如 Lisk 項目,其也採用主鏈+側鏈的結構來處理擴容和速度的問題。不同的在於,DxChain 拓展的是數據本身,Lisk 拓展的則是基於賬本和交易的分佈式計算。

    在張亮看來,DxChain 承載的不是拓展賬本的能力,或者交易速度的 tps,而是要將區塊鏈拉到和現在的互聯網平起平坐的位置。「我們的目標是實現數據上鍊。真正的數據和計算上鍊,這兩個目標,任何一個都將對區塊鏈世界產生巨大的貢獻。」

    為了實現這個目標,DxChain 預計今年6月底將上線第一版產品 demo。張亮告訴雷鋒網AI金融評論,「我們會在主鏈準備上鍊的時候再開源,並在此階段發佈一些產品 demo,以觀察內部的測試網絡可拓展的數據及存儲穩定程度。」

結語

    一席交流下來,可以感覺到張亮對未來的區塊鏈世界懷有一種豪情。他個人有句話,叫:

一幣一世界,一鏈一乾坤。

    張亮說,現階段感覺每條公鏈都是一個「小世界」,每條鏈都是一個「小乾坤」,但最後的結果應該是「世界」和「世界」之間、「乾坤」和「乾坤」之間要相互打通。

    張亮指出一種現象,現在很多鏈連自己的數據都存不下,但這些數據存儲在 AWS或百度雲這種中心化的機構或企業裡,顯然又不合適。基於此,張亮希望 DxChain 能成為未來區塊鏈世界中的一個分佈式的存儲中心,「任何一條鏈的數據存儲不了時,都可以放在 DxChain 鏈上。」

    未來,可能將是幾千條鏈變得互聯互通,共同打造的一個和諧共通的新世界。隨之而來可能還會出現很多問題,諸如安全、計算、交易等等。但是,分佈式的問題就應該用分佈式的方法去解決。「我們可以一個點一個點,一個問題一個問題去急迫,將這些中心華化的東西慢慢變成分佈式。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化

關於DxChain:DxChain是一個分佈式的大數據存儲和計算網絡,是一個將區塊鏈的分佈式特性運用到存儲和計算領域的開放性公鏈。

雷鋒網:瞄準數據上鍊,DxChain打造“鏈上鍊”,讓一切數據貨幣化
本文來源: 雷鋒網 文章作者: DxChain 我要糾錯
聲明:本文由入駐金色財經的作者撰寫,觀點僅代表作者本人,絕不代表金色財經贊同其觀點或證實其描述。
比特幣實時價格 ¥55764.04(數據來源:火幣Pro)

相關推薦

推薦中...