知識圖譜作投資決策,為何比深度學習更靠譜

深度學習 投資 Google 機器學習 烏鎮智庫 2017-04-07

先設想這樣一個場景,平靜的水面上漂著一片樹葉,一個小孩往水裡扔了一個石子,激起的漣漪一圈一圈地散開,最後都聚集到葉子的周圍,因為水波的能量被阻斷而無處擴散。

水面的各個部分是相互連接的,就像一個圖譜,葉子就是其中的一個異常點。當圖譜中發生一個事件時,能量或破壞力一定會體現在異樣的地方。這種破壞力,可能發生在近鄰,也可能發生在遠鄰,甚至可能是發生在千里之外的蝴蝶效應,因為世界是相互連接的,而圖譜能夠描述和表示這種世界的抽象和連接。

AlphaGo顛覆的不是圍棋世界

AlphaGo在圍棋比賽中完勝人類,顛覆了人類對圍棋的認識,實際上是顛覆了人類對自己思維方式的認識。由於大腦的容量和計算能力是有限的,人類的思維受深度和廣度的限制,所以,只好用一些定式來減少思考的深度和廣度。

比如,看到某個定式時,人類對於這一著棋就不用再往下想了。因為按照定式、按照經驗、按照棋手們的共識,大家應該這麼走。同時,對於某些可能的廣度搜索,有些棋子,至少對當前的棋局影響不大,至少對於人類棋手能預料的短期來看影響不大,所以也不用浪費帶寬思考。而電腦,也就是AlphaGo,只要有計算能力和計算時間,完全可以大幅度地擺脫這種限制,能有更深的深度和更廣的廣度。

更甚的是,AlphaGo可以在人類休息時,通過自己和自己對弈,提前探索更多的搜索空間,這也就是現在很火的強化學習。那麼,在天生不平衡的情況下,如何能擴大人類的聯想?知識圖譜就能完成這一使命。先看看Google的PageRank模型。

知識圖譜作投資決策,為何比深度學習更靠譜

由於網頁是相互鏈接的,一個高能量的網頁會將能量順著鏈接,傳播到其他的網頁,最後,能量會聚集到真正有價值的頁面上。這也是圖譜的一種表現形式,只是在這裡,節點是一個個的網頁,邊是網頁之間的鏈接。別小看這些鏈接,它們是人類智慧的結晶。只有當人覺得這兩個網頁相關或重要時,它們才會給出一個鏈接。

谷歌PageRank是怎樣挖掘人類智慧

PageRank正是挖掘了人類智慧,通過隨機行走模型和算法,讓所有的網頁有了自己的重要性指標,讓它們有序。有序之後,很多任務就好辦多了。比如,抓取網頁知道先抓誰,索引時知道誰先處理,搜索結果排序時知道誰在前,等等。之後,Google進一步將PageRank算法進化成BrainRank,考慮了更多的特徵和關係。有了圖譜,加上先進的算法,將知識圖譜中的節點和關係有序化,人類能夠做很多的事情。

簡單來講,知識圖譜,就是一張由知識點相互連接而成的語義網絡。它是一種人工智能技術,是基於現有數據的再加工、結構化,再通過各種數據挖掘、信息抽取和知識融合技術形成一個統一的、邏輯上全局的知識庫。一個知識圖譜描述了世界裡概念和概念之間的關係。

一般圖譜中有實體、事件和關係。這些因素都有很多屬性。實體一般是“物”,在語言中一般以名詞形式出現,比如人、車、地點等。事件一般是在某個時間發生的行動,在語言中一般體現為動詞,比如招聘、收購、發財報等。屬性一般包括名字、標籤、重量、高度、價格、時間、地點等,能以數字或具體值標識。關係表示了實體和實體、實體和事件之間的聯繫。

知識圖譜作投資決策,為何比深度學習更靠譜

來看一個具體的例子:“2016年6月22日,騰訊86億美元收購芬蘭手遊公司Supercell。”

實體:騰訊公司(名字:騰訊;營業地點:中國;主營業務:娛樂),Supercell公司(名字:Supercell;營業地點:芬蘭;主營業務:手遊)。事件:公司收購(名字:騰訊收購Supercell;收購時間:2016年6月22日;收購價格:86億美元)。關係:(A)收購了(B),(B)被(A)收購了。屬性:名字(標籤)。收購時間,收購價格,主營業務,營業地點。

對於投資,各個股票、公司、事件等之間是相互連接和影響的。一個事件的發生會影響與它直接相關或間接相關的方面。比如,一款新電池進入市場,會影響它的上游,比如原材料、原材料廠商;也會影響它的下游,使用電池的商家,比如電動汽車、手機。而且還會影響與它相關的間接行業,比如通信、運營商,甚至電商、內容提供商等。

知識圖譜作投資決策,為何比深度學習更靠譜

當Netflix超出盈利預期,Amazon明天表現如何

現在,我們來看兩個將知識圖譜用於投資分析決策的成功案例。

Kensho是一個市場數據分析系統,它能掃描90000多個可用戶定製的行為,然後回答6500萬個以上投資相關的問題。那些行為包括財報發佈、全球數據環境、經濟報告、公司產品發佈、FDA藥品批准,等等,也能監控股票價格變動,比如一個股票上漲了10%,明天將會怎樣。來看看一些實際操作中的問題:

  • 當Netflix超出盈利預期,Amazon明天表現將如何?

  • Apple發佈新產品前後的股票交易如何?

  • 美聯儲發佈stress test結果後,大銀行的股票交易會怎樣?

  • 在過去十年,從感恩節到年底,哪些零售股票表現最好?

知識圖譜作投資決策,為何比深度學習更靠譜

Kensho系統中,對於事件的抽取和表示,充分利用了知識圖譜。它們有實體,主要是公司與公司相關的股票信息;有事件,這些是有可能影響股票交易價格的行為,比如管理層的變動、新品的發佈等。然後,這些實體和事件通過關係連接起來,任何一個事件的影響都可能是連鎖反應。分析師和交易員可以通過它們來驗證假設或是警示風險。

PalantirMetropolis平臺非常適合大規模的量化數據分析和調研。它整合了多個數據源,將不同的信息統一到一個量化分析環境中。至今,它部分解決了跟蹤和分析保險賠付數據、網絡流量分析和金融財務交易模式分析。通過Metropolis提供的豐富的統計和數學操作模塊,分析師可以在模型上建立和執行計算來加深理解他們所擁有的數據。

知識圖譜,讓計算機學會思考

簡單的模型可以作為複雜模型的構建模塊,從而使複雜高深的分析變成流線化、模塊化的處理過程。任何分析師能想象的分析都能夠容易和迅速地表達。

Palantir投入了很大的精力去開發系統創建和管理知識圖譜,它們甚至有一個自己的名字叫動態知識圖譜。基本上它只定義了一個知識圖譜的框架,類似於編程中的interface或是virutual,然後不同的應用,可以在這個框架下創建自己特有的圖譜。

知識圖譜作投資決策,為何比深度學習更靠譜

這樣做的好處是可以開發大量不依賴於領域的算法、模塊、工具和應用。比如,對於金融投資分析,它們在大的動態知識圖譜的框架之下,定義了通用的金融股市相關領域的框架,然後框架上定義和實現了很多的分析模塊。之後,對於特定的公司、特定的股票,只要按照這個領域框架實例化,那些通用的、在大的和領域實現的模塊就可以隨便使用了,不用再從頭實現。

“人類失去聯想,世界將會怎樣。”知識圖譜的發明和壯大,在某種程度上就是解決人類的聯想,同時也讓世界有機地數字化,讓計算機能夠思考,讓人類能夠快速全面地聯想,而且是因果關係的、可解釋性的聯想。

有別於現在大數據很大程度上強調相關性,深度學習很大程度上強調難以解釋的結果。尤其在投資決策領域,沒有因果關係,不可理解的投資,那叫投機,不可持續。

作者簡介:

尼克:烏鎮智庫理事長;

陳利人:烏鎮智庫首席科學家

本文為作者應博鰲亞洲論壇邀請,為其年度報告《互聯網金融報告2017》所寫

相關推薦

推薦中...