'區塊鏈與分佈式機器學習(DML)關係淺談'

"

分佈式協作是未來的方向,其基礎是分佈式業務共識。分佈式業務共識實質上是,在共識算法的支配下藉助分佈式智能系統來完成每個節點特定的任務。虛擬機(VM)就是一個典型的分佈式智能系統,或...


"

分佈式協作是未來的方向,其基礎是分佈式業務共識。分佈式業務共識實質上是,在共識算法的支配下藉助分佈式智能系統來完成每個節點特定的任務。虛擬機(VM)就是一個典型的分佈式智能系統,或...


區塊鏈與分佈式機器學習(DML)關係淺談


分佈式協作是未來的方向,其基礎是分佈式業務共識。分佈式業務共識實質上是,在共識算法的支配下藉助分佈式智能系統來完成每個節點特定的任務。虛擬機(VM)就是一個典型的分佈式智能系統,或者說是分佈式AI的低級形式。分佈在全網上的各個節點通過與VM的直接交互,來達到交易的目的。VM執行交易的機制是預先得到全網共識的智能合約(代碼庫),這是在一個行業生態中較為簡單的業務共識。VM運行的方式是通過執行一套對應的算法,完成具體的鏈上交易任務。但是,EVM(以太坊虛擬機)目前還不能做到專家系統,如不能夠給出股票投資策略專家級建議,只能夠完成股票交易操作指令的執行,因此是不具備智能形態的。目前區塊鏈所起的作用是通過業務共識來達成自動交易,並同步交易信息,節約交易者時間,數據不可篡改,具有抗抵賴性和方便追責,同時降低資本市場穿透式監管的成本。但是區塊鏈有以下缺陷:(1)數據來源的真實性依然要藉助於中心化的平臺進行背書,例如股票交易數據的真實性依然要藉助中心化的傳統證交所,所以並不能徹底解決節點間的信任問題;(2)僅僅能夠做數據留痕,不能利用數據進行系統訓練,以更好地改進業務質量。有鑑於此我們認為區塊鏈未來的技術方向是跟AI技術相結合,其中最典型的是區塊鏈+分佈式機器學習的綜合技術模式。

訓練專家系統是機器學習(ML)的任務,簡單來說,ML工作所需數據是真實訓練數據和最新預測數據,通過這些數據的對比不斷調整權值向量和學習參數,以提高ML預測的精度。這些訓練數據並不是全都有用,AI需要從中挖掘出有價值的數據,並發現這些數據之間的關聯性,因此數據挖掘技術和ML是一體兩翼。進入到金融大數據時代,每秒鐘產生的數據量在傳統基礎上暴增,並且所構建的模型需求也相對傳統有了質的提升,比如微軟公司在2015年訓練出的AI模型LightLDV,擁有多達200億個參數。數據的量越來越大,關係越來越複雜,也對模型的複雜度提出了超高要求,這使得單機進行ML訓練的效率無法跟上,因此未來分佈式機器學習(DML)就成為了趨勢。

DML需要藉助雲計算、大數據挖掘、機器學習等技術作為支撐,同時區塊鏈技術在其中也扮演著重要角色。舉例:股票市場的投資者的基本訴求是在控制風險的基礎上,儘可能多地增加收益。那麼如果有這麼一個專家系統,經過訓練,可以對未來的收益和風險進行較準確的預測,股民就可以根據專家系統的建議,靈活選擇不同的投資品種進行組合。而訓練專家系統的數據來自股民自己的歷史數據,和真實的預測數據。因為可以對AI進行訓練,因此這些數據都是有價值的。可以設計一套機制,股民貢獻自己的數據上鍊,可根據數據的價值給與股民節點相應的token獎勵。分佈式專家系統(或者AI投顧系統)的初衷是幫助大部分節點獲益,因此token可以與系統總的盈利能力的改進相綁定。DML在每個節點處都有最新的備份,且永久存在鏈上。只有區塊鏈能夠實現這一套激勵機制,這就大大加快了AI專家系統學習的步伐跟效率。

有兩點機制可以確保原始數據是真實的:(1)從利益角度出發,每個節點都想減少風險和提高系統預測能力,因此會貢獻出真實數據以幫助DML能力的快速提升;(2)真實數據是完全隨機性的,而造假的數據或多或少有一些非隨機的痕跡,這一點可以核實出來,系統自動捨棄掉非隨機的成分,因此使得造假的部分不能作為訓練數據。

區塊鏈創立的初衷是節點間的民主、共責、共識、信任,其實還應該在這些基礎上加上“激勵”。激勵必然跟錢掛鉤,而區塊鏈的特性已經解決了雙花問題,這使得去中心化的激勵機制是可行的。區塊鏈網絡共同維護的是一個虛擬的分佈式機器,是信任的機器。區塊鏈+DML的模式在資本市場上的成功也必然延伸到其他場景,代表了區塊鏈的真正價值——即“實現高效有序的大規模分佈式協作”。

文章來源:區塊鏈兄弟

"

相關推薦

推薦中...