'跨越千年的“終極之問”:翻譯困局何解?'

"

1969年7月20日,美國宇航員尼爾•阿姆斯特朗走出登月艙,標誌人類征服了地球引力,而與其同時啟動的“機器翻譯”計劃 ,50年過去了,仍然是一個世紀難題。 其實,從公元前5000新石器時代開始,人們一直在為跨語言的溝通和交流堅持不懈的努力,從人工翻譯到機器翻譯,到今天的人機結合,7000年左右時光中均未有實質性的進展和突破,那麼人類語言有什麼獨特之處,比登月還難的翻譯難究竟難在何處?人工智能驅動下翻譯難題如何破解?誰能回答這個終極之問?

人類語言的特點決定翻譯具有不可譯性

語言是人類後天文化、思維與社會環境等諸多因素作用的結果,不能離開人類大腦的分析而單獨存在,在多種因素的作用下,使得不同社會環境中的人群之間交流充滿障礙, 也使得不同語言間的轉換更為困難。

"

1969年7月20日,美國宇航員尼爾•阿姆斯特朗走出登月艙,標誌人類征服了地球引力,而與其同時啟動的“機器翻譯”計劃 ,50年過去了,仍然是一個世紀難題。 其實,從公元前5000新石器時代開始,人們一直在為跨語言的溝通和交流堅持不懈的努力,從人工翻譯到機器翻譯,到今天的人機結合,7000年左右時光中均未有實質性的進展和突破,那麼人類語言有什麼獨特之處,比登月還難的翻譯難究竟難在何處?人工智能驅動下翻譯難題如何破解?誰能回答這個終極之問?

人類語言的特點決定翻譯具有不可譯性

語言是人類後天文化、思維與社會環境等諸多因素作用的結果,不能離開人類大腦的分析而單獨存在,在多種因素的作用下,使得不同社會環境中的人群之間交流充滿障礙, 也使得不同語言間的轉換更為困難。

跨越千年的“終極之問”:翻譯困局何解?

Transn傳神董事長何恩培認為:“語言是人類大腦思維產生反應和工具,是眼、耳、鼻、口、舌六維通過口一維的表達方式,而且是人類必須使用的、無可選擇的溝通方式;而且同樣語言和詞彙,不同場景含義是不一樣的,要結合經歷、屬性等大腦產生反應進行分析定義,當語言發展到一個較為完備的狀態的時候,文字就順其自然的產生了,因此文字單獨存在沒有任何意義,文字要和大腦產生作用才能產生價值。”

在他看來,文字是文化的支撐,文化的形成是一個需要時間積累的緩慢過程,是一個群體的生活共識,當形成這個群體的共識文化之後,具有不可推論、不可預測和不可論證,比如一些文章文字順序對調或者沒有按照正常順序排列,並不影響人們正常閱讀。

例如下面這段話:

“研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。”

我們能夠看得懂是因為我們眼睛獲取的信息到達大腦經過分析,能夠獲取到正確的意思。

不可推論、不可預測體現在,對同樣事物的語言表達今天和明天表達語境、邏輯、心情等具有不一樣,無法整齊劃一的預測。

同時,由於語言內部詞彙、句法等結構的巨大差異,以及語言作為社會、文化等向外表達綜合體現, 不同群體間的語言無法在轉化中做到絕對的等值。

美國語言學家奈達在《對等的原則》中也指出:“在語言間不可能做到完全的對等, 因此也沒有完全準確的翻譯。譯文的總體影響只會接近原文, 而不可能在具體內容上一致”。

技術性本質決定機器翻譯具有天然的弊端

機器翻譯是通過計算機實現從一種自然語言文本到另一種或多種自然語言文本的翻譯,涉及到自然語言(Natural Language)的拆分、轉換、分析、組合,還要將語意和語境理解分析,將詞彙嵌入其中搭配組合,並且形成記錄不斷修正、糾錯,已涵蓋了自然語言處理的所有技術。

"

1969年7月20日,美國宇航員尼爾•阿姆斯特朗走出登月艙,標誌人類征服了地球引力,而與其同時啟動的“機器翻譯”計劃 ,50年過去了,仍然是一個世紀難題。 其實,從公元前5000新石器時代開始,人們一直在為跨語言的溝通和交流堅持不懈的努力,從人工翻譯到機器翻譯,到今天的人機結合,7000年左右時光中均未有實質性的進展和突破,那麼人類語言有什麼獨特之處,比登月還難的翻譯難究竟難在何處?人工智能驅動下翻譯難題如何破解?誰能回答這個終極之問?

人類語言的特點決定翻譯具有不可譯性

語言是人類後天文化、思維與社會環境等諸多因素作用的結果,不能離開人類大腦的分析而單獨存在,在多種因素的作用下,使得不同社會環境中的人群之間交流充滿障礙, 也使得不同語言間的轉換更為困難。

跨越千年的“終極之問”:翻譯困局何解?

Transn傳神董事長何恩培認為:“語言是人類大腦思維產生反應和工具,是眼、耳、鼻、口、舌六維通過口一維的表達方式,而且是人類必須使用的、無可選擇的溝通方式;而且同樣語言和詞彙,不同場景含義是不一樣的,要結合經歷、屬性等大腦產生反應進行分析定義,當語言發展到一個較為完備的狀態的時候,文字就順其自然的產生了,因此文字單獨存在沒有任何意義,文字要和大腦產生作用才能產生價值。”

在他看來,文字是文化的支撐,文化的形成是一個需要時間積累的緩慢過程,是一個群體的生活共識,當形成這個群體的共識文化之後,具有不可推論、不可預測和不可論證,比如一些文章文字順序對調或者沒有按照正常順序排列,並不影響人們正常閱讀。

例如下面這段話:

“研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。”

我們能夠看得懂是因為我們眼睛獲取的信息到達大腦經過分析,能夠獲取到正確的意思。

不可推論、不可預測體現在,對同樣事物的語言表達今天和明天表達語境、邏輯、心情等具有不一樣,無法整齊劃一的預測。

同時,由於語言內部詞彙、句法等結構的巨大差異,以及語言作為社會、文化等向外表達綜合體現, 不同群體間的語言無法在轉化中做到絕對的等值。

美國語言學家奈達在《對等的原則》中也指出:“在語言間不可能做到完全的對等, 因此也沒有完全準確的翻譯。譯文的總體影響只會接近原文, 而不可能在具體內容上一致”。

技術性本質決定機器翻譯具有天然的弊端

機器翻譯是通過計算機實現從一種自然語言文本到另一種或多種自然語言文本的翻譯,涉及到自然語言(Natural Language)的拆分、轉換、分析、組合,還要將語意和語境理解分析,將詞彙嵌入其中搭配組合,並且形成記錄不斷修正、糾錯,已涵蓋了自然語言處理的所有技術。

跨越千年的“終極之問”:翻譯困局何解?

從起初的建立詞典和語法規則庫,到語料庫和統計學規律,再到當今流行的人工智能神經網絡,無論機器翻譯如何發展, 終究逃脫不了其技術的本性。

從其本質來看,機器翻譯是一種“拆解”方式,即人為地將自然語言劃分為語法、結構等,用規則約束它, 把拆分的碎片化納入“語料庫”中, 再賦予一定的算法模型,但值得注意的是,人類語言是不能被形式化、單義化、被強求和程序化的,否則這種 “自然性”被破壞之後,就缺乏了其本身所具有的藝術性、模糊性和靈活性。

人類的語言是較複雜的, 人與人交流的時候都有可能產生誤解, 更不用說機器了, 所以機器翻譯或許可能無限接近人能夠讀懂和理解的能力,滿足基本“正確性”要求,在實際的翻譯過程中不是簡單的對字面意思進行翻譯, 還需要對作者想要表達的言外之意進行深入領會, 這是機器所欠缺的。

"

1969年7月20日,美國宇航員尼爾•阿姆斯特朗走出登月艙,標誌人類征服了地球引力,而與其同時啟動的“機器翻譯”計劃 ,50年過去了,仍然是一個世紀難題。 其實,從公元前5000新石器時代開始,人們一直在為跨語言的溝通和交流堅持不懈的努力,從人工翻譯到機器翻譯,到今天的人機結合,7000年左右時光中均未有實質性的進展和突破,那麼人類語言有什麼獨特之處,比登月還難的翻譯難究竟難在何處?人工智能驅動下翻譯難題如何破解?誰能回答這個終極之問?

人類語言的特點決定翻譯具有不可譯性

語言是人類後天文化、思維與社會環境等諸多因素作用的結果,不能離開人類大腦的分析而單獨存在,在多種因素的作用下,使得不同社會環境中的人群之間交流充滿障礙, 也使得不同語言間的轉換更為困難。

跨越千年的“終極之問”:翻譯困局何解?

Transn傳神董事長何恩培認為:“語言是人類大腦思維產生反應和工具,是眼、耳、鼻、口、舌六維通過口一維的表達方式,而且是人類必須使用的、無可選擇的溝通方式;而且同樣語言和詞彙,不同場景含義是不一樣的,要結合經歷、屬性等大腦產生反應進行分析定義,當語言發展到一個較為完備的狀態的時候,文字就順其自然的產生了,因此文字單獨存在沒有任何意義,文字要和大腦產生作用才能產生價值。”

在他看來,文字是文化的支撐,文化的形成是一個需要時間積累的緩慢過程,是一個群體的生活共識,當形成這個群體的共識文化之後,具有不可推論、不可預測和不可論證,比如一些文章文字順序對調或者沒有按照正常順序排列,並不影響人們正常閱讀。

例如下面這段話:

“研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。”

我們能夠看得懂是因為我們眼睛獲取的信息到達大腦經過分析,能夠獲取到正確的意思。

不可推論、不可預測體現在,對同樣事物的語言表達今天和明天表達語境、邏輯、心情等具有不一樣,無法整齊劃一的預測。

同時,由於語言內部詞彙、句法等結構的巨大差異,以及語言作為社會、文化等向外表達綜合體現, 不同群體間的語言無法在轉化中做到絕對的等值。

美國語言學家奈達在《對等的原則》中也指出:“在語言間不可能做到完全的對等, 因此也沒有完全準確的翻譯。譯文的總體影響只會接近原文, 而不可能在具體內容上一致”。

技術性本質決定機器翻譯具有天然的弊端

機器翻譯是通過計算機實現從一種自然語言文本到另一種或多種自然語言文本的翻譯,涉及到自然語言(Natural Language)的拆分、轉換、分析、組合,還要將語意和語境理解分析,將詞彙嵌入其中搭配組合,並且形成記錄不斷修正、糾錯,已涵蓋了自然語言處理的所有技術。

跨越千年的“終極之問”:翻譯困局何解?

從起初的建立詞典和語法規則庫,到語料庫和統計學規律,再到當今流行的人工智能神經網絡,無論機器翻譯如何發展, 終究逃脫不了其技術的本性。

從其本質來看,機器翻譯是一種“拆解”方式,即人為地將自然語言劃分為語法、結構等,用規則約束它, 把拆分的碎片化納入“語料庫”中, 再賦予一定的算法模型,但值得注意的是,人類語言是不能被形式化、單義化、被強求和程序化的,否則這種 “自然性”被破壞之後,就缺乏了其本身所具有的藝術性、模糊性和靈活性。

人類的語言是較複雜的, 人與人交流的時候都有可能產生誤解, 更不用說機器了, 所以機器翻譯或許可能無限接近人能夠讀懂和理解的能力,滿足基本“正確性”要求,在實際的翻譯過程中不是簡單的對字面意思進行翻譯, 還需要對作者想要表達的言外之意進行深入領會, 這是機器所欠缺的。

跨越千年的“終極之問”:翻譯困局何解?

圖注:百度指數提供的“人工翻譯”“機器翻譯”關注度走勢圖

近些年來,基於神經網絡的翻譯可以學習和收集信息模仿人類大腦的神經元建立聯繫,充分利用上下文信息,對句子進行整體編碼和解碼,從而生成更為流暢的譯文,於是人們樂觀地認為機器翻譯將替代人類時代來臨,使用時才發現翻譯質量太差,開始懷疑機器翻譯而回歸到人工翻譯。

Transn傳神認為,儘管機器翻譯在一定程度上保證翻譯的高效性和準確性,但是可讀性和流暢性始終存在很大欠缺,滿足不了人們閱讀精細化的需求,如果要保證翻譯具有流暢性和可讀性,又要有“言外之意”,必須需要人工的干預,即需要具備一定能力的專家對機器翻譯內容進行修改審校,彌補其不足。

所謂的“人工干預”,就是機器輔助人翻譯的“譯後編輯”,翻譯的效率背後還是由人類譯員的能力決定的。

人工翻譯“非標化”和“極限值”決定翻譯難以有發展

翻譯活動本身不僅僅涉及語言本身, 語言背後的社會、文化、經濟、政治等因素決定了其是一個跨學科的交際行為,是人類譯者在一個複雜的生態系統中進行適應、進化的過程,是一個非標化的翻譯活動。

如果把一篇文章給1000個不同的人翻譯,結果都不一樣,因為每個人教育背景、知識環境、文化、情感等不一樣。

值得注意的是,人類譯員在翻譯效率上劣勢,決定了單純依靠人工翻譯難以有量的發展,無法滿足人類的需求。

Transn傳神董事長何恩培舉了個實例,假設譯員翻譯的極限速度分鐘180個字,人的閱讀每分鐘1500字,二者有 7-15倍的差距,人工翻譯難以滿足人類實際閱讀速度需求。

在當今信息爆炸時代,人們學習和獲取知識的速度以及需求也在急劇增長,人工翻譯的極限的天花板決定了其發展難以跟上信息的裂變式速度。

"

1969年7月20日,美國宇航員尼爾•阿姆斯特朗走出登月艙,標誌人類征服了地球引力,而與其同時啟動的“機器翻譯”計劃 ,50年過去了,仍然是一個世紀難題。 其實,從公元前5000新石器時代開始,人們一直在為跨語言的溝通和交流堅持不懈的努力,從人工翻譯到機器翻譯,到今天的人機結合,7000年左右時光中均未有實質性的進展和突破,那麼人類語言有什麼獨特之處,比登月還難的翻譯難究竟難在何處?人工智能驅動下翻譯難題如何破解?誰能回答這個終極之問?

人類語言的特點決定翻譯具有不可譯性

語言是人類後天文化、思維與社會環境等諸多因素作用的結果,不能離開人類大腦的分析而單獨存在,在多種因素的作用下,使得不同社會環境中的人群之間交流充滿障礙, 也使得不同語言間的轉換更為困難。

跨越千年的“終極之問”:翻譯困局何解?

Transn傳神董事長何恩培認為:“語言是人類大腦思維產生反應和工具,是眼、耳、鼻、口、舌六維通過口一維的表達方式,而且是人類必須使用的、無可選擇的溝通方式;而且同樣語言和詞彙,不同場景含義是不一樣的,要結合經歷、屬性等大腦產生反應進行分析定義,當語言發展到一個較為完備的狀態的時候,文字就順其自然的產生了,因此文字單獨存在沒有任何意義,文字要和大腦產生作用才能產生價值。”

在他看來,文字是文化的支撐,文化的形成是一個需要時間積累的緩慢過程,是一個群體的生活共識,當形成這個群體的共識文化之後,具有不可推論、不可預測和不可論證,比如一些文章文字順序對調或者沒有按照正常順序排列,並不影響人們正常閱讀。

例如下面這段話:

“研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。”

我們能夠看得懂是因為我們眼睛獲取的信息到達大腦經過分析,能夠獲取到正確的意思。

不可推論、不可預測體現在,對同樣事物的語言表達今天和明天表達語境、邏輯、心情等具有不一樣,無法整齊劃一的預測。

同時,由於語言內部詞彙、句法等結構的巨大差異,以及語言作為社會、文化等向外表達綜合體現, 不同群體間的語言無法在轉化中做到絕對的等值。

美國語言學家奈達在《對等的原則》中也指出:“在語言間不可能做到完全的對等, 因此也沒有完全準確的翻譯。譯文的總體影響只會接近原文, 而不可能在具體內容上一致”。

技術性本質決定機器翻譯具有天然的弊端

機器翻譯是通過計算機實現從一種自然語言文本到另一種或多種自然語言文本的翻譯,涉及到自然語言(Natural Language)的拆分、轉換、分析、組合,還要將語意和語境理解分析,將詞彙嵌入其中搭配組合,並且形成記錄不斷修正、糾錯,已涵蓋了自然語言處理的所有技術。

跨越千年的“終極之問”:翻譯困局何解?

從起初的建立詞典和語法規則庫,到語料庫和統計學規律,再到當今流行的人工智能神經網絡,無論機器翻譯如何發展, 終究逃脫不了其技術的本性。

從其本質來看,機器翻譯是一種“拆解”方式,即人為地將自然語言劃分為語法、結構等,用規則約束它, 把拆分的碎片化納入“語料庫”中, 再賦予一定的算法模型,但值得注意的是,人類語言是不能被形式化、單義化、被強求和程序化的,否則這種 “自然性”被破壞之後,就缺乏了其本身所具有的藝術性、模糊性和靈活性。

人類的語言是較複雜的, 人與人交流的時候都有可能產生誤解, 更不用說機器了, 所以機器翻譯或許可能無限接近人能夠讀懂和理解的能力,滿足基本“正確性”要求,在實際的翻譯過程中不是簡單的對字面意思進行翻譯, 還需要對作者想要表達的言外之意進行深入領會, 這是機器所欠缺的。

跨越千年的“終極之問”:翻譯困局何解?

圖注:百度指數提供的“人工翻譯”“機器翻譯”關注度走勢圖

近些年來,基於神經網絡的翻譯可以學習和收集信息模仿人類大腦的神經元建立聯繫,充分利用上下文信息,對句子進行整體編碼和解碼,從而生成更為流暢的譯文,於是人們樂觀地認為機器翻譯將替代人類時代來臨,使用時才發現翻譯質量太差,開始懷疑機器翻譯而回歸到人工翻譯。

Transn傳神認為,儘管機器翻譯在一定程度上保證翻譯的高效性和準確性,但是可讀性和流暢性始終存在很大欠缺,滿足不了人們閱讀精細化的需求,如果要保證翻譯具有流暢性和可讀性,又要有“言外之意”,必須需要人工的干預,即需要具備一定能力的專家對機器翻譯內容進行修改審校,彌補其不足。

所謂的“人工干預”,就是機器輔助人翻譯的“譯後編輯”,翻譯的效率背後還是由人類譯員的能力決定的。

人工翻譯“非標化”和“極限值”決定翻譯難以有發展

翻譯活動本身不僅僅涉及語言本身, 語言背後的社會、文化、經濟、政治等因素決定了其是一個跨學科的交際行為,是人類譯者在一個複雜的生態系統中進行適應、進化的過程,是一個非標化的翻譯活動。

如果把一篇文章給1000個不同的人翻譯,結果都不一樣,因為每個人教育背景、知識環境、文化、情感等不一樣。

值得注意的是,人類譯員在翻譯效率上劣勢,決定了單純依靠人工翻譯難以有量的發展,無法滿足人類的需求。

Transn傳神董事長何恩培舉了個實例,假設譯員翻譯的極限速度分鐘180個字,人的閱讀每分鐘1500字,二者有 7-15倍的差距,人工翻譯難以滿足人類實際閱讀速度需求。

在當今信息爆炸時代,人們學習和獲取知識的速度以及需求也在急劇增長,人工翻譯的極限的天花板決定了其發展難以跟上信息的裂變式速度。

跨越千年的“終極之問”:翻譯困局何解?

圖注:人類知識數據的增長週期

聯合國教科文組織的研究表明:在18世紀時,知識更新週期為80-90年;19世紀到20世紀初,知識更新週期縮短為30年;上世紀六七十年代,週期為5-10年;而進入新世紀,已縮短至2-3年,2010年之後週期變為1年。甚至有人預測,2020年,知識更新週期將在每73天內翻1倍。

人類語言猶如一條複雜的地下河,人類一直藉助機器和人工智能破解“跨語言溝通”翻譯難題,機器翻譯、人工翻譯以及二者結合的人機共譯模式下均各有弊端,但人類從未放棄過嘗試和探索,Transn傳神始終以“讓人類溝通沒有語言障礙”為使命,提出第三產能“Twinslator”全新理念,讓“人賦慧於機器,機器賦能於人”,未來已來,其或將成為解決人類多語溝通的最佳實踐手段。

"

相關推薦

推薦中...