使用圖神經網絡做基於會話的推薦

人工智能虛擬機機器不學習 2019-06-20

1、背景介紹

現有基於會話的推薦，方法主要集中於循環神經網絡和馬爾可夫鏈，論文提出了現有方法的兩個缺陷：

1）當一個會話中用戶的行為數量十分有限時，這些方法難以獲取準確的用戶行為表示。如當使用RNN模型時，用戶行為的表示即最後一個單元的輸出，作者認為只有這樣並非十分準確。

2）根據先前的工作發現，物品之間的轉移模式在會話推薦中是十分重要的特徵，但RNN和馬爾可夫過程只對相鄰的兩個物品的單向轉移關係進行建模，而忽略了會話中其他的物品。

針對上面的問題，作者提出使用圖網絡來做基於會話的推薦，其整個模型的框架如下圖所示：

接下來，我們就來介紹一下這個流程吧。

2、模型介紹

2.1 符號定義

V={v1,v2,...,vm} 代表所有的物品。s=[vs,1,vs,2,...,vs,n]代表一個session中按照時間先後排序的用戶點擊序列，我們的目標是預測用戶下一個要點擊的物品vs,n+1

2.2 子圖構建

我們為每一個Session構建一個子圖，並獲得它對應的出度和入度矩陣。

假設一個點擊序列是v1->v2->v4->v3，那麼它得到的子圖如下圖中紅色部分所示：

再假設一個點擊序列是v1->v2->v3->v2->v4，那麼它得到的子圖如下：

同時，我們會為每一個子圖構建一個出度和入度矩陣，並對出度和入度矩陣的每一行進行歸一化，如我們序列v1->v2->v3->v2->v4對應的矩陣如下：

上圖中，左邊的矩陣是出度矩陣，右邊的矩陣是入度矩陣，如果同時考慮出度和入度，模型學習的就不是簡單的單向轉移關係了，而是更加豐富的雙向關係。

2.3 基於Graph學習物品嵌入向量

基於Graph學習物品的嵌入向量，作者借鑑的下面這篇文章《GATED GRAPH SEQUENCE NEURAL NETWORKS》（地址：https://arxiv.org/pdf/1511.05493v3.pdf）的做法，其實就是一個GRU單元，不過在輸入時，模型做了一定的改進。

模型的輸入計算公式如下：

我們還是使用剛才的序列v1->v2->v3->v2->v4來一點點分析輸入的過程。

1）ats,i是t時刻，會話s中第i個點擊對應的輸入

2）As,i:代表的是一個分塊矩陣，它是1*2n的，n代表序列中不同物品的數量，而非序列的長度，此處是4，而非5。舉例來說，假設我們當前的i=2，那麼其對應的As,2:=[0,0,1/2,1/2 | 1/2,0,1/2,0]。我們可以把As,i:拆解為[As,i:,in,As,i:,out]

3）vt-1i可以理解為序列中第i個物品，在訓練過程中對應的嵌入向量，這個向量隨著模型的訓練不斷變化，可以理解為隱藏層的狀態，是一個d維向量。

4）H是d*2d的權重向量，也可以看作是一個分塊的矩陣，可以理解為H=[Hin|Hout]，每一塊都是d*d的向量。

那麼我們來看看計算過程：

1）[vt-11,...,vt-1n] ，結果是d * n的矩陣，轉置之後是n*d的矩陣，計作vt-1

2）As,i:vt-1H相當於[As,i:,invt-1Hin , As,i:,outvt-1Hout]，即拆開之後相乘再拼接，因此結果是一個1 * 2d的向量。

上面的過程，相當於分別對一個節點的出度和入度進行處理，再進行合併。該過程是我通過代碼慢慢理解的，代碼如下：

fin_state = tf.reshape(fin_state, [self.batch_size, -1, self.out_size])
fin_state_in = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),
 self.W_in) + self.b_in, [self.batch_size, -1, self.out_size])
fin_state_out = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),
 self.W_out) + self.b_out, [self.batch_size, -1, self.out_size])
av = tf.concat([tf.matmul(self.adj_in, fin_state_in),
 tf.matmul(self.adj_out, fin_state_out)], axis=-1)

上面的代碼中，fin_state相當於保存的是我們的vt-1，self.W_in相當於我們的Hin， self.W_out相當於我們的Hout，self.adj_in相當於As,i:,in，self.adj_out相當於As,i:,out。

有一丟丟的複雜，上面是我個人的理解的計算過程，大家可以作為參考。

上面的輸入，我們充分考慮了圖的信息，接下來，就是GRU單元了，這裡的GRU單元沒有太多變化，公式如下：

由上面的公式，整個學習的過程就是每個物品的向量獨自進行循環，但是在每次輸入的時候，會充分考慮圖中的信息，簡單化一下示意圖如下：

圖中我省略了一些不必要的線，不過我想你能夠理解。

2.4 生成Session對應的嵌入向量

好了，經過T輪的圖網絡，我們得到了一個session中每個點擊物品的向量，分別為[v1,v2,...,vn]，即下圖中紅色的部分我們已經獲得了：

接下來，我們要講解的是下圖中紅色的部分：

我們認為，當前序列中最後一個物品是十分關鍵的，所以把這個信息單獨拎出來，令s1 = vn。但是，我們已不能捨棄其他的信息，所以，模型中使用了一個attention的策略，分別計算前面的物品和最後一個點擊物品的相關性，並進行加權，得到sg：

最後，將兩部分進行橫向拼接，並進行線性變換，得到sh:

2.5 給出推薦結果及模型訓練

在最後的輸出層，使用sh和每個物品的embedding進行內積計算：

並通過一個softmax得到最終每個物品的點擊概率：

損失函數是交叉熵損失函數：

3、一點小疑問

在上面進行內積計算的過程中，所使用的vi，應該不是經過GNN中間輸出的vi，而是每個物品的初始embedding，這個初始的embedding，即我們GNN的初始的輸入v0，如下圖：

這個embedding在訓練過程中不斷的被更新。

個人感覺論文這裡符號有點混亂。

4、總結

本文使用圖網絡進行基於會話的推薦，效果還是不錯的，而且圖網絡逐漸成為現在人工智能領域的一大研究熱點。感興趣的小夥伴們，咱們又有好多知識要學習啦，你行動起來了麼？

原文發佈於微信公眾號 - 小小挖掘機（wAIsjwj）

相關推薦

'任正非如果大規模使用5G，中國人工智能可能會超越美國'

"任正非接納BBC故事工廠紀實片訪談，任正非再度提到了5g和人工智能技術：大夥兒瞭解，5G事實上是1個“兒科”的商品，5G是人工智能技術的支撐點系統軟件，由於它有低延遲的優勢。並且5G的上行帶寬十分寬，合適公司把統計數據送上雲去。4G下列是人和人之間在通訊，如今5G可以進行...

任正非我的第一部5G手機人工智能技術華為公司通信中央處理器電腦高通阿蘭·圖靈 B2B 法國超級計算機無人駕駛馮諾伊曼大數據原汁原味的德系SUV 丘吉爾兒科新聞 2019-09-15

'機器人正式登上手術檯，做的結直腸癌手術安全度高康復快，若你是病人會選機器人做嗎？'

"點右上角“關注”，給你更多復旦大學附屬腫瘤醫院結直腸外科主任許劍民教授隨著經濟發展，互聯網科技日新月異，前有阿爾法狗人工智能機器人戰勝世界圍棋冠軍，現有機器人開展手術，而且效果還很好，就問你驚訝不驚訝，佩服不佩服！復旦大學附屬腫瘤醫院結直腸外科主任許劍民教授介紹，自機器...

手術兩百年機器人復旦大學腫瘤人工智能經濟圍棋 2019-09-14

'蘋果為竊聽Siri對話道歉，同時承諾將會做出改變'

"週三，《CNN商業》的一篇報道稱，蘋果公司為允許承包商竊聽用戶對其語音助手Siri的聲音命令而道歉，蘋果公司現在已經承諾要對此進行改革。上個月《衛報》(Guardian)報道稱，蘋果公司的承包商可以聽到用戶與Siri的私人對話，此後這件事受到了人們的密切關注。蘋果最初的迴...

蘋果公司 Siri 人工智能跳槽那些事兒 Google Facebook 亞馬遜蒂姆·庫克 Alexa Internet 衛報人生第一份工作 2019-08-30

'誰說JAVA不適合做神經網絡，那來看看Encog這款框架吧'

"一提到深度學習，神經網絡等技術，大部分肯定會想到TensorFlow，Keras，Caffe，PyTorch等框架，而這些框架大部分都是使用Python來進行開發的，毫無疑問，在人工智能領域技術上比如神經網絡等Python是一種很不錯的選擇，但是作為一個java程序員，如...

Java 人工智能 Python 程序員技術網絡爬蟲 JavaScript 2019-08-30

'華為為什麼會做電視？'

"近年來，縱觀整個手機江湖，手機廠商去做電視，似乎已經成為一種趨勢。早在2013年，小米就發佈了第一代智能電視。隨後，大麥科技、聯想、PPTV、暴風科技紛紛入局，整個市場熱鬧異常。一加也在2018年宣佈將推出智能電視，再到最近榮耀發佈了“智慧屏”，華為也開始做電視了。然而，...

華為公司智能電視華為榮耀智能家居電視機智能手機我的第一部5G手機技術創新科技一加手機電腦音箱暴風科技中國移動物聯網平板電腦人工智能小米科技家用電器趙敏 2019-08-28

'使用Python進行機器學習，為人工智能時代做準備'

"IT行業飛速發展，除了水漲船高的薪資水平，還有不斷推陳出新的編程技術。不同的技術，應用在不同的領域。但對於小白來說，想要投身這個行業，我該從何學起？那些應用領域是未來的大趨勢？而我未來的學習方向又有哪些呢？PythonPython的確挺神的~但不是生來就那麼神。Pytho...

Python 人工智能算法電腦技術腳本語言集成開發環境程序員鳶尾 2019-08-20

'百度快手領投的知乎4.34億美元F輪戰略投資，加下來會做什麼？'

"如何看待百度快手領投的知乎4.34億美元F輪戰略投資？對於這個事情確實很好奇，知乎之前是被騰訊進行投資了，然後知乎也就加入了搜狗搜索，所以也讓知乎提升了很多層級，當時被投資的時候，也算是今日頭條旗下悟空問答也是正好很火的時候。對於知乎這兩年問答也是從開始的邀請制，到現在的...

百度知乎投資百度知道騰訊搜索引擎搜狗金融自媒體今日頭條人工智能滴滴打車 2019-08-17

'用騰訊優圖AI視覺模組做一個駕駛疲勞監測儀'

"道路千萬條，安全第一條，相信每個人都是牢記於心的，“喝酒不開車，開車不喝酒”其實不難，難的是防範始料未及的事件，疲倦就是眾多始料未及事件中，殺傷力穩居前排的，前一秒心裡還在想堅持堅持，下一秒可能就失去了意識。相信每個人都體會過，在瞌睡面前，我們是多麼無力，想著躺一會兒再起...

人工智能算法技術電腦騰訊 Free Pascal MP3 人臉識別硬件音箱酒語音識別技術 OpenCV Python 固態硬盤樹莓派 2019-08-16

'看了這8個PS摳圖方法，我奶奶都會自己換證件照背景了！你會了嗎'

"摳圖是一個無論在工作中，還是生活中都經常用的圖片處理技巧。想必每位設計師都接到過朋友的這種需求——幫我換一下證件照背景！但是很多初學者對摳圖卻非常苦惱，毛髮太多、場景太複雜。摳出的圖一點也不完美。今天小編就總結了一套摳圖大全，從最基礎的工具介紹開始到毛髮等複雜的摳圖技巧，...

設計平面設計設計師人工智能人生第一份工作 2019-08-13

'不足10萬小型SUV推薦，小而精緻，哪款會成為你的愛車'

"經過多年的經驗累積以及技術精進，自主品牌車企目前在硬件方面已經日漸成熟、穩定，毫不誇張的說可以並肩甚至是超越了許多合資品牌；並且隨著智能化的到來，各自主車企也都在爭相積極研發出用著更方便、全面且更人性化的中控系統，這也讓自主車更突顯出高性價比的優勢。今天我就為大家總結出幾...

原汁原味的德系SUV 長安CS35 設計長安汽車江淮瑞風長安騰訊技術人工智能硬件體育軟件 QQ音樂 iPad 音樂 2019-08-12

'一圖抵千言：帶你快速學會 GoogLeNet 神經網絡 | CSDN 博文精選'

"作者 | .NY&XX責編 | 屠敏出品 | CSDN 博客本文介紹的是著名的網絡結構GoogLeNet，目的是試圖領會其中結構設計思想。Inception，來源於論文Network in Network和電影Inception中的臺詞：we need to go...

人工智能 CSDN 盜夢空間 CNN 算法生物設計 2019-08-08

'代碼詳解：基於Python建立任意層數的深度神經網絡'

"全文共6359字，預計學習時長20分鐘或更長圖片來源：pexels.com/@divinetechygirl在這篇指南中，我們將建立起一個任意層數的深度神經網絡。這個神經網絡可以應用於二元分類的監督學習問題。圖1 神經網絡構造的例子（符號說明：上標[l]表示與第l層；上標...

人工智能 Python 深度學習機器學習算法數據庫 2019-08-03

'圖神經網絡火了？談下它的普適性與侷限性'

"選自arXiv作者：Andreas Loukas機器之心編譯參與：韓放、張倩圖神經網絡（GNN）是一類基於深度學習的圖域信息處理方法。由於具有較好的性能和可解釋性，GNN 已成為一種廣泛應用的圖分析方法。然而，再好的方法都存在一定的侷限。來自洛桑聯邦理工學院的研究者在 a...

人工智能算法深度學習阿蘭·圖靈機器學習分佈式計算設計技術洛桑聯邦理工學院 2019-07-31

'不常玩遊戲，手機選頂配處理器會浪費嗎？附手機推薦'

"歡迎轉載，請註明出處，抄襲必究！不怎麼玩遊戲，平時只刷刷新聞、看看微信、小視頻，有必要選擁有頂配處理器的手機嗎？如果經濟條件允許，教授會建議你用，為什麼呢？因為這不止關係到運行、流暢的問題。1.圖像處理能力更好像驍龍855、蘋果A12、麒麟980都屬於我們說的手機頂配處理...

圖像處理技術魅族科技 GPU iPhone 設計攝影人工智能聯想集團 iPhone 6s NFC 魯大師 OPPO 2019-07-25

'僅有20%用戶願意使用Libra；會讓Facebook對監管質疑做出迴應'

"天眼精選 Inner Eye政策推動大數據、人工智能、區塊鏈等現代科技與司法工作深度融合據中國新聞網消息，7月20日，全國法院貫徹落實政法領域全面深化改革推進會精神專題會議在四川成都召開。會議提出，要以強化信息技術深度應用為支撐，推動大數據、人工智能、區塊鏈等現代科技與司...

Facebook 區塊鏈技術比特幣銀行中國建設銀行大數據 eBay 黑客人工智能歐洲文章天眼投資證券投資基金中國人民銀行分析師波士頓成都勝利退出演藝圈 2019-07-22

'乾貨 I 使用Adobe Illustrator 做UI設計教程'

"我從 2012 年初開始嘗試使用 AI 來完成一些設計與創作，一直至今。個人感覺，AI 雖然有不少難用的地方，但是非常適合用於 UI 設計。甚至在很多方面，用 AI 來代替 PS 做設計更加高效、方便。主要原因是：AI 的強項在於對矢量圖的處理。先哲有云：「如果希望在計算...

Illustrator Adobe Systems 設計人工智能圖像處理電腦軟件設計師 MacBook Pro 知乎 2019-07-19

'八家世界級供應商為長城做智聯網，今秋的長城汽車會是啥樣？'

"7月15日，"G往開來，為AI出行"——長城汽車"GTO全域智慧生態戰略"在保定哈弗技術中心正式發佈。通過前瞻性技術的深度聚合，長城汽車宣佈攜手生態合作伙伴，共建全域智慧生態，打造長城汽車全域在線（GTO：GreatWall Totally Online）、不斷迭代升級的...

無人駕駛長城汽車華為公司技術人工智能騰訊百度中國移動中國聯通高通運營商機器人智能手機阿里巴巴集團 CES 大數據雲計算高德軟件物聯網中國電信長城哈弗通信上海車展操作系統 2019-07-16

代碼詳解：使用NumPy，教你9步從頭搭建神經網絡

全文共2875字，預計學習時長20分鐘或更長Photo by Alina Grubnyak on Unsplash如果你是個對神經網絡有所瞭解的初級數據科...

人工智能機器學習 Python 深度學習 2019-07-12

一種基於神經網絡的前所未有的方法可模擬量子系統

雷鋒網按：AI和量子計算都是前沿的研究，相比AI的規模化應用，量子計算還面臨諸多挑戰。近日，科學家們獨立開發出了一種前所未有的基於神經網絡的模擬開放量子系...

人工智能量子計算理論洛桑聯邦理工學院電腦技術超級計算機物理 2019-07-07

基於深度自編碼器神經網絡完成語音識別的預訓練方法

（此處已添加圈子卡片，請到今日頭條客戶端查看）深度自編碼器神經網深度自編碼器神經網也是一種無監督模型，其輸出向量與輸入向量同維，訓練的目標是使其目標值等於...

深度學習人工智能語音識別技術算法今日頭條 CNN 技術生物大數據 2019-07-05

推薦中...