Facebook翻譯革命性突破:速度是谷歌的9倍,更準確

美國時間5月9日,Facebook 的人工智能(AI)研究團隊宣佈,已經開發出一項新的語言翻譯技術,翻譯速度及準確度均超越谷歌翻譯。這項技術再次印證了社交媒體的使命:讓世界更開放、更緊密。

語言成為了不同母語的人群間相互交流的障礙,所以突破這層阻攔是社交平臺完成使命的必經之路。此前,Facebook可以自動翻譯超過45國語言的狀態內容,但是Facebook的CEO扎克伯格稱“仍有進步空間”。

谷歌機器翻譯系統基於循環神經網絡(RNN),是老牌翻譯系統,已經處於領先地位。但是,微軟於2016年12月推出了最新技術,在翻譯複雜句型時可以較靈活調整語序,準確度較高。

Facebook的人工智能程師Michael Auli和David Grangier介紹,他們的翻譯技術突破在於發揮卷積神經網絡(CNN)獨特優勢,使其性能超越基於RNN的翻譯技術。谷歌機器翻譯系統是基於RNN,這意味著Facebook翻譯速度將是谷歌的9倍。

CNN和RNN是兩種神經網絡,被用以處理數據序列。RNN是循環分析數據,嚴格按照句子從左到右的順序一個字一個字進行翻譯。而CNN可以同時從不同角度捕捉數據,更好地契合機器圖形處理器(GPU)硬件系統,CNN的特性和GPU的並行計算功能相輔相成。

GPU是為處理視頻遊戲中的圖像而設計的。據彭博社報道,CNN與其的結合意味著用戶將有機會在Facebook查閱的每一項內容,都以用戶的習慣語言表述,不僅是狀態文字,還有視頻。

在翻譯技術突破方面,另一項傑出表現是使用多跳注意力(multi-hop attention)和門控(gating)來改善翻譯效果。注意力機制類似於人在翻譯時的斷句,系統在翻譯時會回看和多次看整個句子來選擇下一個翻譯的詞語,這樣更接近人類翻譯時的順序。而多跳注意力是其昇華版,利用網絡反覆回看,做出最符合的翻譯。

Facebook翻譯革命性突破:速度是谷歌的9倍,更準確

使用多跳注意力進行編碼到解碼的過程示意。

門控是用來控制神經網絡內的信息流動,決定某一特定信息是否可以通過並傳輸到下一個神經元。在選擇下一個翻譯的單詞時,神經網絡會考慮到目前為止所做的翻譯。門可以任意放大某一部分的翻譯或者整體的大意,以確保接下來選擇符合的語境。

目前這項技術還停留在研究階段,沒有完全開發並在Facebook產品上發佈。但是,該技術已經應用在翻譯狀態更新上。

Facebook稱已經公開這項翻譯資源的源代碼,大家可以利用該資源來滿足個人翻譯需求。除了翻譯,這項技術還可以被廣泛應用到其他語言類項目。

相關推薦

推薦中...