堪比同聲傳譯:Facebook人工智能翻譯新速度

2016年5月Facebook曾轉向人工智能領域,計劃推出一款基於人工神經網絡的全新翻譯系統。時隔一年後,說到做到的Facebook沒有食言。美國時間5月10日Facebook的人工智能研究團隊宣佈,已經開發出這項新的語言翻譯技術。而且,出乎意料的是他的翻譯速度是谷歌翻譯的9倍。

作為全球最大的社交網站,此前,Facebook可以自動翻譯超過45國語言的狀態內容,然而,要求完美的扎克伯格稱“仍有進步空間”。

堪比同聲傳譯:Facebook人工智能翻譯新速度

堪比同聲傳譯:Facebook人工智能翻譯新速度

根據Facebook的人工智能程師Michael Auli和David Grangier介紹,他們的翻譯技術突破在於發揮卷積神經網絡(CNN)獨特優勢,使其性能超越基於RNN的翻譯技術。(RNN)作為谷歌機器的老牌翻譯系統,這款曾處於領先地位的系統被後起之秀迅速超越,不過,看看Facebook在翻譯技術上的突破,不得不承認這確實是場革命性的變革。

在CNN系統中,研究團隊使用多跳注意力(multi-hop attention)和門控(gating)來改善翻譯效果。注意力機制類似於人在翻譯時的斷句,系統在翻譯時會回看和多次看整個句子來選擇下一個翻譯的詞語,這樣更接近人類翻譯時的順序。而多跳注意力是其昇華版,利用網絡反覆回看,做出最符合的翻譯。

門控是用來控制神經網絡內的信息流動,決定某一特定信息是否可以通過並傳輸到下一個神經元。在選擇下一個翻譯的單詞時,神經網絡會考慮到目前為止所做的翻譯。門可以任意放大某一部分的翻譯或者整體的大意,以確保接下來選擇符合的語境。整體來說,CNN向著人工智能更邁進了一步。

不過目前這項技術還停留在研究階段,沒有完全開發並在Facebook產品上發佈。但是,Grangier表示:“我們目前正在和產品團隊進行交流,從而希望將其融入到Facebook的環境中。將學術數據遷移到真實環境中還是存在巨大差別的。學術數據是新聞型的數據,而在Facebook上交流是非常口語化的。”由此看來,應該用不了多久我們將可以感受這款堪比同聲傳譯的翻譯系統了。

Facebook稱已經公開這項翻譯資源的源代碼,大家可以利用該資源來滿足個人翻譯需求。除了翻譯,這項技術還可以被廣泛應用到其他語言類項目。

相關推薦

推薦中...