深度學習模型-Convolutional_Seq2Seq

機器學習深度學習 Google翻譯英語深度學習與NLP 2017-05-15

Seq2seq是現在使用廣泛的一種序列到序列的深度學習算法，在圖像、語音和NLP，比如：機器翻譯、機器閱讀、語音識別、智能對話和文檔摘要生成等，都有廣泛的應用。Seq2Seq模由encoder和decoder兩個部分來構成，假設模型的訓練樣本為（X,Y），encoder負責把輸入X映射到隱向量Z，再由decoder把Z映射到輸出Y。現在大多數場景下使用的Seq2Seq模型基於RNN構成的，雖然取得了不錯的效果，但也有一些學者發現使用CNN來替換Seq2Seq中的encoder或decoder可以達到更好的效果。最近，FaceBook帆布一篇論文：《Convolutional Sequence to Sequence Learning》，提出了完全使用CNN來構成Seq2Seq模型，用於機器翻譯，超越了谷歌創造的基於LSTM機器翻譯的效果。

1、論文及代碼下載地址

論文下載地址：https://arxiv.org/abs/1705.03122

開源代碼github地址：https://github.com/facebookresearch/fairseq

2、Convolutional Seq2Seq中採用各種trick

FaceBook發佈的這篇文章的工作持續時間比較長了，依賴於《Language Modeling with Gated Convolutional Networks》文章中的工作。個人認為，FaceBook的Convolutional SeqSeq取得了超越Google翻譯的成果，重要原因在於採用了很多的trick，很多工作值得借鑑：

1、Position Embedding，在輸入信息中加入位置向量P=（p1,p2,....），把位置向量與詞向量W=（w1，w2,.....）求和構成向量E=(w1+p1,w2+p2)，做為網絡輸入，使由CNN構成的Encoder和Decoder也具備了RNN捕捉輸入Sequence中詞的位置信息的功能。

2、層疊CNN構成了hierarchical representation表示。層疊的CNN擁有3個優點：

（1）捕獲long-distance依賴關係。底層的CNN捕捉相聚較近的詞之間的依賴關係，高層CNN捕捉較遠詞之間的依賴關係。通過層次化的結構，實現了類似RNN（LSTM）捕捉長度在20個詞以上的Sequence的依賴關係的功能。

（2）效率高。假設一個sequence序列長度為n，採用RNN（LSTM）對其進行建模需要進行n次操作，時間複雜度O（n）。相比，採用層疊CNN只需要進行n/k次操作，時間複雜度O（n/k）,k為卷積窗口大小。

（3）可以並行化實現。RNN對sequence的建模依賴於序列的歷史信息，因此不能並行實現。相比，層疊CNN正個sequence進行卷積，不依賴序列歷史信息，可以並行實現，模型訓練更快，特別是在工業生產，面臨處理大數據量和實時要求比較高的情況下。

3、融合了Residual connection、liner mapping的多層attention。通過attention決定輸入的哪些信息是重要的，並逐步往下傳遞。把encoder的輸出和decoder的輸出做點乘（dot products），再歸一化，再乘以encoder的輸入X之後做為權重化後的結果加入到decoder中預測目標語言序列。

4、採用GLU做為gate mechanism。GLU單元激活方式如下公式所示：

深度學習模型-Convolutional_Seq2Seq

每一層的輸出都是一個線性映射X*W + b，被一個門gate：o（X*V+c）控制，通過做乘法來控制信息向下層流動的力度，o採用雙曲正切S型激活函數。這個機制類似LSTM中的gate mechanism，對於語言建模非常有效，使模型可以選擇那些詞或特徵對於預測下一個詞是真的有效的。

5、進行了梯度裁剪和精細的權重初始化，加速模型訓練和收斂。

3、完整的網絡結構分析

深度學習模型-Convolutional_Seq2Seq

Figure1是論文中給出的的Convolutional Seq2Seq的結構，看起來有點複雜，其實挺簡單的。下面簡要分析下是如何與上述5個trick結合起來的：

上左encoder部分：通過層疊的卷積抽取輸入源語言（英語）sequence的特徵，圖中直進行了一層卷積。卷積之後經過GLU激活做為encoder輸出。

下左decoder部分：採用層疊卷積抽取輸出目標語言（德語）sequence的特徵，經過GLU激活做為decoder輸出。

中左attention部分：把decoder和encoder的輸出做點乘，做為輸入源語言（英語）sequence中每個詞權重。

中右Residual connection：把attention計算的權重與輸入序列相乘，加入到decoder的輸出中輸出輸出序列。

4、最後實驗結論

在多個公開數據集上獲得了新的state-of-the-art的成績。在WMT-16、英語-羅馬尼亞語翻譯，高出以前方法1.8 BLEU；在WMT-14、英語-法語翻譯，比以前LSTM模型所取得的成績高出1.5 BLEU；在WMT-14、英語-德語翻譯，比以前方法高出0.5 BLEU。

5、總結

個人感覺本文采用了很多簡單且非常有效的trick，達到了基於LSTM的NMT方法更好的效果，正因為如此，並不能說，基於CNN seq2seq模型就一定比基於LSTM的Seq2Seq一定好。採用CNN的Seq2Seq最大的優點在於速度快，效率高，缺點就是需要調整的參數太多。上升到CNN和RNN用於NLP問題時，CNN也是可行的，且網絡結構搭建更加靈活，效率高，特別是在大數據集上，往往能取得比RNN更好的結果。

6、下期預告

下期將給大家帶來基於Convolutional Seq2Seq實戰，盡情期待。

相關推薦

'學習英語靠死記硬背單詞？來看看這些學習英語的方法'

"英語學習不可怕，只要掌握了其中的學習方法就可以學好，下面小編給大家分享一些英語方面的順口溜希望對大家有幫助：英語學習靠興趣，這樣學習英語孩子願意學，學得快，如果覺得覺得文章有用記得點個關注，以後會經常分享學習小技巧。"

英語文章不完美媽媽 2019-09-19

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'短視頻上點贊上20000＋英語小神童的學習祕訣'

"最近在各大短視頻上，有一個4歲的小孩，用流利的英語教授知識，語音語調都完勝大人，而且視頻的內容有些還很難，出現了一些比如綠葉素等非常專業的詞，一時間成了網絡紅人。還被一些知名的英語機構邀請做代言人。這位小神童的媽媽不禁讓人好奇，她是何方神聖，竟能教出如此優秀的孩子。大家都...

英語不完美媽媽讀書鄺凱亮 2019-09-19

'深度 | AI賦能醫療器械　5G支持應用創新——智能化醫療軟件發展趨勢分析'

"當前，以人工智能、雲計算、大數據、5G網絡、物聯網等為代表的新一代信息技術迅猛發展，並與醫療器械行業加速融合。可穿戴健康監測設備、人工智能輔助診斷系統等智能化醫療器械加速普及應用，改變傳統疾病預防、檢測、治療模式，為提高健康服務質量提供新手段。傳統醫療軟件主要依託於醫療器...

人工智能技術軟件雲計算大數據深度學習我的第一部5G手機手術兩百年機器人藥品物聯網算法語音識別技術自然語言處理護理數據庫肺癌腫瘤 2019-09-19

'高一到高三10點注意事項，附高中生必須糾正的12大學習問題'

"高中三年，學生生涯中至關重要的三年時光。每個人都希望用自己的努力和汗水換來一個美好的結果，進入一個理想的大學。但是，一些同學會在學習方法、學習目標以及同學關係、師生關係等方面會出現不同程度的問題。本篇為所有高一新生總結了以下十點，相信你看完一定會有所收穫的～高中課業學習...

大學英語語文數學高考音樂讓夢發生中考體育文學藝術 2019-09-19

'心理學技巧：讓孩子愛上自主學習，父母要學會用“鳥籠效應”'

"“本文由孕育島原創，歡迎個人轉發和分享”學習是個人的事，父母的督促只能發揮一時的效應。真正對孩子好的教育是，讓他學會自主學習。當孩子不用藉助外在力量推進學習時，才會變成一件美好的事。01讓孩子愛上自主學習的實例：小曾一直愁女兒學英語的事，自從上小學後，女兒的英語成績一直不...

不完美媽媽心理學卡爾森英語動畫傑羅姆·布魯納黃瓜音樂最in買手君大眾汽車 2019-09-18

'學習“疑問詞+不定式”結構的三點注意'

"點擊關注“零食英語”，獲取最實用的英語學習知識。一、句法功能“疑問詞+不定式”是英語中一個很有用的結構，尤其在口語中用得很經常。該結構在句子中主要用作賓語，有時也可用作主語或表語等。如：A traffic light tells us when to cross the ...

英語 Why Not? 不完美媽媽 2019-09-18

'10年英語學習規劃，寶媽堅持陪娃走完5年的經驗分享，值得借鑑'

"有的時候，有些家長在陪娃學習方面的毅力非常讓人欽佩，比如今天要給大家講的這位寶媽，從孩子三週歲開始便規劃了其十年的英語學習規劃，並堅持陪著走完了前五年，效果顯著，中間的經驗乾貨也是滿滿當當，值得借鑑！寶寶3週歲開始英語啟蒙，時間很好記剛好是上幼兒園的時間。現在是2年級了，...

英語雅思讀書 BBC 藝術鵝媽媽不完美媽媽動畫紀錄片 Word 文章超人 2019-09-18

'兒童英語學習難學嗎？這三個方法你得知道'

"作為一種國際語言，英語在生活中的應用越來越廣泛。專家研究表明，孩子越早學英語越好，12歲以下是學習英語的最佳階段。許多家長說，在這個階段，他們特別關注孩子的兒童英語學習，但大多數父母對兒童英語學習瞭解很少，不敢教孩子不正確。相反，他們對孩子有害。那麼你如何為12歲以下的孩...

英語不完美媽媽人生第一份工作 2019-09-18

'如何利用好Youtube，油管學習地道的英文？'

"互聯網時代的快捷，可以讓我們足不出戶的獲取你想要的任何優秀資源。學好英語，更是打開新世界的便利工具。現在免費的英語單詞打卡、堅持學習英語就返現的閱讀打卡活動層出不窮，但英語作為一種語言，一個傳播媒介，最重要的功能還是用來和別人交流。而Youtube 作為國外最大的視頻網站...

英語 YouTube 脫口秀 TED演講新聞託福創作者來直播英國讀書演講 BBC 艾美獎 2019-09-17

'英語學習方法有哪些？分享俞敏洪的獨家英語學習法'

"英語學習方法中記憶單詞的方法有很多種，聯想記憶、死記硬背都有自己的優點，我建議使用自己的英語學習方法，當然，英語學習方法中用電腦機記憶單詞也是一種很好的方法，這樣不僅可以掌握正確的單詞發音，而且對聽力也很有幫助。不過我想跟大家提一點，想要更有效率的學習英語，除了選對教材和...

英語俞敏洪不完美媽媽人生第一份工作文化收音機電腦聯想集團 2019-09-17

'日語學習：零基礎到底該如何學習？學習日語的小技巧'

"首先接觸的是50音圖也就是假名（相當於英語的ABCD，漢語裡的拼音）然後選本好點的教材，有新編，標日，新日語基礎，大家的日語等。日語專業的用新編（學校方面規定的）自學一般喜歡用標日（名聲很大但內容不如日本人編寫的教材）一般我給學生用的是大家的日語或新日語基礎（日本人編寫的...

日語日本讀書英語 2019-09-17

'不知道學習英語的正確思路？這些年你的英語就白學了'

"如果你知道以中國學校那種方式永遠也不可能學會英語，你是否還會繼續那樣學？如果你知道學不會英語並不是你的錯，你是否能重新建立自信心？英語是目前全球通用語言，無數人應用自如，三四歲小孩子能完全掌握好，它不可能有多難。事實上，學英語跟學任何語言一樣，小孩子可以輕鬆學會，成年人也...

英語防火牆讀書 2019-09-17

'她多項成績滿分，世界名牌爭著搶著要，她的學習方法有哪些祕訣？'

"相信各位朋友在讀書的時候，班級裡都會有一兩個非常出色的學霸。他們不僅每年的期末考試中能夠獲得很高的成績，而且在日常的課堂表現中也很活躍，能夠跟老師很好的互動，對於老師提出來的問題，他們也有著自己獨特的見解。大學以後這些學霸們似乎不僅僅限於學習，反而還能夠做到參加比賽和提高...

讀書高考英語不完美媽媽大學留學人生第一份工作美國電視劇託福中考 2019-09-17

'兒童英語學習網站有哪些？這些免費的趕緊記牢了'

"很多父母都會想辦法讓孩子在很小的時候接觸英語，畢竟，英語在社會中的應用越來越廣泛，早期接觸英語對孩子很有好處。像兒童英語學習網站就是一個很好的學習途徑，如果你是一個想幫助孩子學習英語但由於工作而沒有時間教孩子的父母，或者如果你的英語水平太差，不能親自教孩子，這裡有一些免費...

英語不完美媽媽數學人生第一份工作讀書 2019-09-17

'孩子做事三分鐘熱度？目標細分法則，幫孩子找到學習的樂趣'

"文/柚媽（原創文章，歡迎個人轉載分享）小宇是一個非常喜歡英語的孩子，於是小宇媽媽在暑假給孩子報了英語學習班，前幾堂課小宇上課表現的都十分積極，與老師互動的也很頻繁。但是在學習了一段時間之後，小宇媽媽卻發現，孩子的學習積極性明顯下降了，不光回到家裡不想完成老師佈置的作業，甚...

不完美媽媽英語小宇玩具跆拳道文章旋風少女萬達集團 2019-09-17

'職場上成長速度最快的人，往往都具有這項競爭力：功利性學習'

"5000字深度長文，閱讀需要10分鐘職場上，有一種競爭優勢叫做學習力。快速變化和發展的時代，掌握學習的底層邏輯，懂得高效學習，才能進入成長快車道，職場的路才越走越遠，越走越寬，對這樣的人來說，職場沒有中年危機。我從2015年開始意識到職場學習的重要性，也是從那時候開始讀書...

人生第一份工作讀書赫爾曼·艾賓浩斯跳槽那些事兒大象英語 2019-09-17

'日語學習：0到N1日語入門簡單，越學越難你是否也有這些奇怪想法'

"日語入門簡單，越學越難？你是否也有這些奇怪想法如果同學們感覺自己學習日語很努力，但是日語的水平還是得不到提升，那可能是你們在日語學習的過程中出現了誤區，下面我們就一起來看一下剛學日語的你是否也有這些奇怪想法。1.日語入門簡單，越學越難？小編一直非常懷疑大家真的覺得日語入門...

日語英語日本動漫大學日本電視劇演講 2019-09-17

'很多家長不知道，孩子英語學習很吃力，其實是開始的時間晚了'

"文|祕籍君我對樓上鄰居的教育方式抱怨已久，每天晚上九點多鐘，孩子總要在門外“咣咣”地砸門，以撕心裂肺的聲音喊著“媽媽，開門哪！我再也不偷懶了，你讓我背啥我都背，媽媽開門啊！”後來見到孩子媽媽，簡單一聊，原來孩子媽媽在為孩子學英語的事發愁。她家孩子七歲上一年級，因為上的是...

英語不完美媽媽動畫玩具 2019-09-17

'伴讀 |“我沒有時間老去！”（深度好文）'

"來源：詩詞天地（ID：shicitiandi）人生永遠沒有太晚的開始，難得活著，有想要見的人，有想看的美景，哪有工夫老去！人生一世，草木一秋，時間對每個人都是公平的。樂嘉問我：“明年你中歐畢業了做什麼？”我答：去學一年英語。他詫異地問：“你英語這麼好了為什麼還要學？”我答...

文章英語廣場舞讀書西塞羅不完美媽媽 2019-09-17

推薦中...