COVA:用區塊鏈解決數據“歸屬權”問題,打破人工智能發展瓶頸

文/墨菲

來源/31QU

2016年,第三次人工智能浪潮席捲而來。從無人駕駛到智能家電,從深度學習到語音識別,人工智能概念開始出現在金融、醫療、交通、家居等多個領域。

而人工智能也是目前最火的創業領域,吸金能力無可比擬。

據CB Insights統計,2017年,全球人工智能創業公司的融資額達到了152億美元,其中,中國企業佔48%。

但在破紀錄的融資額背後,不容忽視的是,自從2016年3月AlphaGo驚豔亮相後,經過兩年多發展的人工智能也遭遇了一些挑戰。

“如果你做人工智能領域的研究,你就會發現,最大的瓶頸不是算法,也不是算力,而是數據。”COVA聯合創始人Vincent Li告訴31QU。

“(人工智能)算法已經到了一個很高的水平,而且都是開源的,想再有一個跨越性的進步是很難的;算力如果是雲算力也特別便宜。”Vincent進一步解釋道,在人工智能的三大支柱中,數據存在太對亟待解決的問題。

儘管“大數據”也是被熱炒的概念,但如今數據孤島問題依然嚴重,數據安全問題時有發生,數據的採集使用和個人隱私保護的衝突也愈演愈烈。

而區塊鏈技術,能否解決數據領域的問題,進而推動人工智能的進一步發展?

“數據石油”的落地

早在2013年,世界經濟論壇研究報告就稱:“大數據是新財富,價值堪比石油。”而“數字石油”的叫法,也就此在業內傳開。

“但數據和石油是有很大區別的。”Vincent稱。


COVA:用區塊鏈解決數據“歸屬權”問題,打破人工智能發展瓶頸

COVA聯合創始人Vincent Li

石油是一個實物,產權明確,“誰挖出來就是誰的”;石油的交易過程清晰,“從一個人到另一個人手上”;石油一旦交易就能產生價值,“比如我給你一桶石油,就相當於給了你60美金”。

但在數據領域,狀況就完全不一樣了。

一個數據要如何定價?“看過或複製就能擁有”的數據到底屬於誰?和石油相比,數據的所有權、處置權和交易權等都不清晰。

“這個問題在醫療領域非常明顯。”Vincent舉例,“醫療數據應該歸病人還是醫院,還是研究的醫生?”

目前,數據歸屬權的確定方式,還依賴於違規後的處罰,不僅滯後,而且導致真正有價值的數據沒有辦法正常流通。

“因為數據的產權定義不清晰,導致後面的數據交易、使用等環節都難以推進。”Vincent認為。

因此,目前數據領域最難也是最重要的任務,就是解決數據的“歸屬權”問題。

“我們在COVA網絡內,就能把數據產權定義的非常清晰。”Vincent對31QU表示。

首先,搭建在區塊鏈網絡上的COVA是去中心化,沒有人可以控制這個網絡;其次,在網絡中的數據就屬於上傳的用戶,用戶可以用智能合約的方式,決定自己的數據被誰使用、如何使用。

數據生態

在數據產權確認後,整個數據鏈條才能正常運轉下去。

而在COVA生態網絡中,主要有數據提供方、數據使用方、系統維護者三個主要角色。

我們來逐一解讀:

數據提供者有兩類,一類是個人,一類是機構。

對於個人用戶而言,一旦個人可以將自己的購物數據、財務數據等上傳到網絡,這個數據的歸屬權就屬於上傳的用戶。

而用戶可以通過智能合約來保護和使用自己的數據。

比如,如果追求強隱私性,用戶就可以設置,在服務結束後,在App關閉的一瞬間,必須銷燬相關的數據。

如果追求流動性,用戶可以設置其他的規則,比如讓對方使用三個月再銷燬等。而一旦對方使用了用戶的數據,就需要支付給用戶一定的費用——這也是COVA Token一部分價值的體現。

對於機構而言,除了提供直接的數據,他們更有價值的,是提供“數據標註”。

簡單的解釋“數據標註”,就是將海量數據分類、貼上標籤,來幫助人工智能學習。

“數據的標註成本是非常高的。”Vincent稱,“一個有用的數據標註成本可能是在百萬和千萬級的。”

但這些花費了大價錢標註的數據,往往因為沒有靠譜的銷售和使用方式,導致在黑市之外,幾乎沒有任何流動性。

COVA:用區塊鏈解決數據“歸屬權”問題,打破人工智能發展瓶頸


數據使用方,是COVA生態網絡的第二類參與方。

“一些高科技公司對數據的需求是非常大的。”Vincent表示,“現在很多AI公司發展受阻,唯一原因就是他們沒有辦法獲取大量的數據。”

有個極端的案例是,一家AI公司融資了1億人民幣,其中5、6000萬都用來購買數據和數據標註。

而COVA提供了一個渠道,能讓數據使用者找到自己真正需要的數據類別。

最後,使系統維護者,也就是我們常說的“礦工”的概念。

礦工可以通過挖礦,比如進行數據傳輸、數據計算等運作,來獲得COVA獎勵。

三種角色,構成了COVA整個生態系統。

數據隱私保護

在解決了數據歸屬權、建立了數據生態後,“區塊鏈+數據”的探索,依然要面臨其他挑戰。

首先,在目前區塊鏈技術下,如何進行海量的數據處理?

“我們的分散機制像POW,但是我們有有類似DPOS的地方。” Vincent進一步解釋,“祕鑰等需要保密的東西,採用POW的形式,把隱私性提高;其他可以採用分散方式,將效率提高。”

其次,如何讓更多的人來進入這個全新的生態?

“儘量讓用戶的使用方式和之前一樣。”Vincent介紹,比如採用數據分析從業者更熟悉的Python語言,在UI、US上下功夫等。

並且,數據的交易並不強制使用COVA的Token,COVA更多是起到平臺的作用。

最後,還是要回到關鍵的數據隱私保護上。

即便在區塊鏈生態內解決了數據歸屬、數據保護問題,依然難以約束數據適用方將數據複製、加工,賣到區塊鏈生態之外。

“這個問題已經有理論能解決。”Vincent表示,有一種理論是,數據使用方可以在數據上跑算法,但卻不能直接“看”到數據,沿著這個邏輯嘗試,已經找到了解決辦法。

事實上,在大數據領域,數據隱私是一個冷門、甚至是被故意忽略的領域。

“如果用隱私來交換便捷性或者是效率的話,很多情況下,他們(中國人)是願意這麼做的。”年初,百度李彥宏的這番話引起了激烈爭論,卻也表明了在數據領域,對流動性的重視一度高於隱私性的狀況。

如今,數據的“流動性”已經遇到瓶頸,而解決了數據隱私保護的問題,才能讓數據交易變得健康而順利。

目前,已經有不少創業團隊,在嘗試將區塊鏈技術與數據領域結合。

Vincent表示,數據歸屬權是最基礎最重要的工作,“我們希望有更多的技術專家、工程師入場”。

相關推薦

推薦中...