編者按:隨著機(jī)器翻譯的不斷發(fā)展,我們經(jīng)常聽(tīng)到或看到機(jī)器翻譯將取代人工翻譯的觀點(diǎn)。人類(lèi)口譯員會(huì)很快向新技術(shù)的尖端投降嗎?機(jī)器翻譯會(huì)像深藍(lán)和AlphaGo一樣成為一個(gè)領(lǐng)域破壞者嗎?道格拉斯霍夫斯塔德(Douglas Hofstadter)在采用人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)后,引用了法語(yǔ)、德語(yǔ)和中文的幾段話來(lái)測(cè)試谷歌翻譯(Google Translation)的最新版本。谷歌翻譯的即時(shí)翻譯效率可以理解,免費(fèi)使用也值得稱(chēng)贊,但要真正理解還有很長(zhǎng)的路要走。
周日,在我們每周的薩爾薩舞會(huì)上,我的朋友弗蘭克帶來(lái)了一位丹麥客人。我知道弗蘭克說(shuō)丹麥語(yǔ)很好,因?yàn)樗麐寢屖堑溔耍r(shí)候在丹麥住過(guò)一段時(shí)間。他帶來(lái)的女性朋友,英語(yǔ)也說(shuō)得很流利,聽(tīng)起來(lái)像標(biāo)準(zhǔn)的北歐英語(yǔ)。但是在晚上聊天的過(guò)程中,我驚訝的發(fā)現(xiàn),他們兩個(gè)以前都是用Google Translate把文本轉(zhuǎn)換后再發(fā)給對(duì)方。弗蘭克將用英語(yǔ)寫(xiě)一封電子郵件,然后將電子郵件的內(nèi)容復(fù)制并粘貼到谷歌翻譯中,以生成一個(gè)新的丹麥版本,并將其發(fā)送給他的朋友。相反,他的朋友會(huì)先用丹麥語(yǔ)寫(xiě)一封郵件,然后復(fù)制粘貼到Google Translate中生成新的英文版本。這太奇怪了!為什么兩個(gè)聰明人,兩個(gè)能把對(duì)方的語(yǔ)言說(shuō)好的人,會(huì)這樣做?就我個(gè)人在機(jī)器翻譯軟件方面的經(jīng)驗(yàn)來(lái)說(shuō),我一直對(duì)這些軟件持懷疑態(tài)度。但很顯然,他們兩個(gè)并沒(méi)有像我一樣質(zhì)疑。其實(shí)很多有思想的人都癡迷于這些翻譯程序。在他們看來(lái),這些翻譯程序沒(méi)有什么可指責(zé)的。這讓我很迷茫。
作為一個(gè)語(yǔ)言愛(ài)好者,一個(gè)熱情的譯者,一個(gè)認(rèn)知科學(xué)家,一個(gè)對(duì)人腦的忠實(shí)崇拜者,我對(duì)機(jī)器翻譯的關(guān)注可以追溯到幾十年前。我第一次對(duì)機(jī)器翻譯感興趣是在20世紀(jì)70年代中期,當(dāng)時(shí)我看到數(shù)學(xué)家沃倫·韋弗(他也是機(jī)器翻譯的早期倡導(dǎo)者)在1947年寫(xiě)給諾伯特·維納(控制論的創(chuàng)始人)的一封信。韋弗在他的信中提出了一個(gè)有趣的說(shuō)法,這個(gè)說(shuō)法今天已經(jīng)廣為流傳:
“當(dāng)我讀到一篇用俄語(yǔ)寫(xiě)的文章時(shí),我可以說(shuō),‘這篇文章其實(shí)是用英語(yǔ)寫(xiě)的,但是用一個(gè)奇怪的符號(hào)加密了,我現(xiàn)在就解碼。’"
幾年后,他提出了不同的觀點(diǎn):“只要你理性,你永遠(yuǎn)不會(huì)認(rèn)為機(jī)器翻譯能達(dá)到風(fēng)、雅、贊的效果。普希金不必為此而顫抖?!蔽一艘荒陼r(shí)間試圖把亞歷山大·普希金著名的詩(shī)化小說(shuō)《葉甫蓋尼·奧涅金》翻譯成我的母語(yǔ)(也就是說(shuō),把這部偉大的俄羅斯作品翻譯成英文小說(shuō))。經(jīng)歷了這樣難忘的經(jīng)歷,不得不說(shuō)韋弗后來(lái)的言論明顯比之前的言論更貼近事實(shí)。然而,他在1947年發(fā)表的翻譯被視為解碼的觀點(diǎn)長(zhǎng)期以來(lái)一直是促進(jìn)機(jī)器翻譯發(fā)展的信條。
此后,“翻譯引擎”逐漸發(fā)展起來(lái)。最近,由于“深度神經(jīng)網(wǎng)絡(luò)”的應(yīng)用,一些觀察者甚至產(chǎn)生了這樣的感覺(jué)(參見(jiàn)《紐約時(shí)報(bào)》的吉迪恩·劉易斯-克勞斯(Gideon Lewis-Kraus)發(fā)表的《大AI覺(jué)醒》(The Great AI Awakening)和《經(jīng)濟(jì)學(xué)人》(The Economist)的萊恩·格林(Lane Greene)發(fā)表的《機(jī)器翻譯:超越巴別塔》(Machine Translation: Beyond Babel)。他們認(rèn)為人類(lèi)翻譯可能會(huì)成為瀕危的職業(yè)類(lèi)型。這樣,人類(lèi)翻譯者將在幾年內(nèi)轉(zhuǎn)變?yōu)榉g文本的質(zhì)量控制和糾錯(cuò)人員,而不是負(fù)責(zé)產(chǎn)生新的翻譯文本。
這樣的變化會(huì)對(duì)我們的精神世界造成巨大的沖擊。雖然我完全理解他們?cè)噲D讓機(jī)器翻譯發(fā)揮最大魅力的心情,但我并不急于看到人類(lèi)翻譯被冰冷的機(jī)器所取代。的確,他們的這種想法讓我感到害怕和厭惡。在我看來(lái),翻譯是一種奇妙的藝術(shù)形式,它依賴(lài)于人類(lèi)譯者多年的生活經(jīng)驗(yàn),需要他們運(yùn)用創(chuàng)造性的想象力來(lái)完成。如果說(shuō)人類(lèi)的解釋者在未來(lái)只能成為一種歷史遺跡,那么我對(duì)人類(lèi)心靈和思維的尊重就會(huì)徹底動(dòng)搖,這種沖擊會(huì)讓我困惑很久,陷入無(wú)盡的悲哀。
每當(dāng)我讀到一些聲稱(chēng)人類(lèi)口譯員很快就會(huì)臣服于新技術(shù)之劍的文章時(shí),我就覺(jué)得有必要檢驗(yàn)一下這些說(shuō)法是否屬實(shí)。一方面,我害怕這個(gè)噩夢(mèng)很快就會(huì)到來(lái);另一方面,我希望我可以放心,這種變化不會(huì)很快發(fā)生;最后,我認(rèn)為有必要長(zhǎng)期反擊對(duì)人工智能技術(shù)的各種夸大。我了解到Google中的Google Brain最近采用了人工神經(jīng)網(wǎng)絡(luò)的傳統(tǒng)概念和思想,利用“深度學(xué)習(xí)”技術(shù)生成了一個(gè)新的軟件,聲稱(chēng)要顛覆機(jī)器翻譯。所以我覺(jué)得有必要暫時(shí)滿足一下谷歌翻譯的最新化身。會(huì)不會(huì)像深藍(lán)(1997年IBM深藍(lán)擊敗象棋冠軍)和AlphaGo一樣成為一個(gè)領(lǐng)域破壞者?
舊版Google Translate可以處理大量的語(yǔ)言類(lèi)型,但最新版本的Deep Learning Translate目前只適用于9種語(yǔ)言。所以我把考試內(nèi)容限定在英語(yǔ)、法語(yǔ)、德語(yǔ)、漢語(yǔ)。
在進(jìn)一步討論我的發(fā)現(xiàn)之前,我想指出,我們應(yīng)該注意形容詞“深度”所造成的歧義。比如我們聽(tīng)說(shuō)谷歌收購(gòu)了一家叫DeepMind的公司,它的產(chǎn)品有一個(gè)基于“深度學(xué)習(xí)”的“深度神經(jīng)網(wǎng)絡(luò)”。聽(tīng)到這里,我們可能會(huì)不由自主地想到“深刻”、“深刻”、“有力”等形容詞。但實(shí)際上,這個(gè)語(yǔ)境中的“深度”只是意味著這些神經(jīng)網(wǎng)絡(luò)比以前的網(wǎng)絡(luò)有更多的層次?,F(xiàn)在可能是12層,以前只有兩三層。但是這個(gè)深度是否意味著這個(gè)網(wǎng)絡(luò)一定是深遠(yuǎn)的?不,只是語(yǔ)言技能。
盡管宣傳很多,聲勢(shì)很大,但我一直對(duì)谷歌翻譯持謹(jǐn)慎態(tài)度。雖然我對(duì)它有些反感,但不得不承認(rèn),作為我身邊的一根刺,我的存在也有一些驚人的亮點(diǎn)。每個(gè)人都可以免費(fèi)使用它,并且可以將100種語(yǔ)言中的任何一種轉(zhuǎn)換成任何其他語(yǔ)言。僅此一點(diǎn)就非常值得驕傲。如果我為自己能說(shuō)三種以上語(yǔ)言而自豪,那我為谷歌翻譯掌握了100種語(yǔ)言而自豪!而且如果我把語(yǔ)言A的文字內(nèi)容復(fù)制粘貼到Google翻譯欄,可以在短時(shí)間內(nèi)把文字翻譯成語(yǔ)言B。
谷歌翻譯及類(lèi)似技術(shù)的實(shí)用性毋庸置疑。總的來(lái)說(shuō),這可能是好事,但也有一些嚴(yán)重的缺失??偨Y(jié)一句話,就是理解。機(jī)器翻譯從來(lái)不是為了理解語(yǔ)言,而是一直在試圖“解碼”語(yǔ)言,試圖在沒(méi)有理解和意義的情況下達(dá)到翻譯的目的。想翻譯好,可能不需要理解?無(wú)論是人類(lèi)還是機(jī)器,想要產(chǎn)生高質(zhì)量的翻譯,是否可能不重視語(yǔ)言的意義?為了更好的說(shuō)明這個(gè)問(wèn)題,我先展示一下我的實(shí)驗(yàn)。
谷歌英法翻譯實(shí)驗(yàn)展示
我用一個(gè)非常簡(jiǎn)短的描述句子開(kāi)始了這個(gè)實(shí)驗(yàn)??吹竭@句話可以讓我們?cè)谀X海中形成一個(gè)清晰的畫(huà)面:
在他們家,一切都是成雙成對(duì)的。他的車(chē)和她的車(chē),他的塔和她的塔,他的圖書(shū)館和她。(在他(她)家,一切都是成對(duì)的:有他的車(chē),有她的車(chē);有他的毛巾和她的;他的書(shū)店和她的書(shū)店都在。)
這個(gè)翻譯任務(wù)看似簡(jiǎn)單,但在法語(yǔ)(和其他羅曼語(yǔ))中,“他的”和“她”對(duì)應(yīng)的詞與主人的性別不一致,而是與名詞一致。以下是谷歌翻譯成法語(yǔ)的內(nèi)容:
在你的房子里,兩人一組。Il y a sa voiture et sa voiture,ses serviettes et ses serviettes,sa liberthyèque et les siennes。
任何人都知道,我說(shuō)的這段話描述的是一對(duì)情侶,強(qiáng)調(diào)他擁有的一切,他的妻子也有同樣的對(duì)應(yīng)。但是Google Translate用“sa”這個(gè)詞表示“他的車(chē)”和“她的車(chē)”,所以你無(wú)法分辨車(chē)主的性別。同樣,“他的毛巾”和“她的毛巾”都是不分性別的復(fù)數(shù)詞“ses”。在關(guān)于他和她的書(shū)店的最后一段,原文最后一個(gè)“她”里的“s”讓Google Translate誤以為是復(fù)數(shù),于是最終在目標(biāo)語(yǔ)言里以復(fù)數(shù)形式呈現(xiàn)(“l(fā)es siennes”)。顯然,谷歌翻譯產(chǎn)生的法語(yǔ)句子根本沒(méi)有表現(xiàn)出原文的重點(diǎn)。
接下來(lái),我試著把原文翻譯成法語(yǔ),前提是我保留原文想要表達(dá)的形象。最終翻譯如下:
不,我不會(huì)加倍。il y a sa voitureàelle and sa voutureàlui,ses servicesàelle and ses servicesàlui,sa liberthy queàelle and sa liberthy queàlui。
" sa voiture à elle "代表"她的車(chē)",而" sa voiture à lui "只能翻譯為"他的車(chē)"。然后,我想如果法語(yǔ)內(nèi)容用Google Translate翻譯成英語(yǔ)應(yīng)該沒(méi)問(wèn)題,但是我太天真了。它給了我以下的英文翻譯:
在家里,他們什么都有。有他自己的車(chē),他自己的車(chē),他自己的毛巾,他自己的毛巾,他自己的圖書(shū)館,他自己的圖書(shū)館。(在家里,他們什么都加倍,包括他自己的車(chē)和他自己的車(chē),他自己的毛巾和他自己的毛巾,他自己的書(shū)店和他自己的書(shū)店。)
什么鬼東西?即使我給出的內(nèi)容清晰有力地表達(dá)了貨主的性別,Google機(jī)器翻譯還是無(wú)視我的呼喊,把貨主都變成了男人。為什么要扔掉這句話最重要的信息?
我們?nèi)祟?lèi)對(duì)夫妻、房子、個(gè)人財(cái)產(chǎn)等有形的東西有一些愛(ài)好,這些愛(ài)好受到驕傲、競(jìng)爭(zhēng)、嫉妒、隱私等許多無(wú)形情感的影響。比如夫妻使用的毛巾上分別繡有“他”和“她”的字樣。谷歌翻譯顯然不熟悉這種情況。或者可以說(shuō)谷歌翻譯對(duì)任何現(xiàn)實(shí)都不熟悉。Google Translate只熟悉單詞組成的字符串,是超快的文本轉(zhuǎn)換,不是思考或想象,也不是記憶或理解。它甚至不知道單詞是什么意思。但我想說(shuō),原則上,一個(gè)計(jì)算機(jī)程序肯定可以知道語(yǔ)言的含義,也可以讓自己有想法、記憶和經(jīng)驗(yàn),并加以利用,但這并不是Google Translation的初衷,他們的設(shè)計(jì)師甚至沒(méi)有把這樣的想法納入未來(lái)目標(biāo)的范圍。
嗯,我承認(rèn)看到Google Translation這么差的表現(xiàn)讓我竊喜,因?yàn)槲医K于可以松一口氣了。顯然,機(jī)器翻譯取代人工翻譯的時(shí)代并不在眼前。但是我覺(jué)得我還是應(yīng)該更仔細(xì)的繼續(xù)這個(gè)實(shí)驗(yàn),畢竟還沒(méi)有到“一咽不解渴”的程度。
谷歌翻譯我的新短語(yǔ)“一燕不成夏”怎么樣?忍不住想試一試,但Google Translate提供的法文版是這樣的:“Une hirondelle n'aspire pas la soif?!边@句話從語(yǔ)法角度來(lái)說(shuō)不是問(wèn)題,但是意思很難理解。一開(kāi)始,“une hirondelle”指的是一種鳥(niǎo)——燕子,然后它說(shuō)這種鳥(niǎo)不吸氣也不吸(“n'aspire pas”),最后它的意思是這種既不吸氣也不吸的東西是渴的(“l(fā)a soif”)。很明顯,谷歌翻譯沒(méi)有理解我想表達(dá)的意思,我翻譯的只是一派胡言。
德語(yǔ)翻譯展
試完法語(yǔ),再來(lái)看德語(yǔ)。最近,我一直沉浸在奧地利數(shù)學(xué)家卡爾·西格蒙德的著作《維也納學(xué)派》(他們自稱(chēng)維也納學(xué)派)中。這本書(shū)描述了20世紀(jì)二三十年代一群理想主義的維也納知識(shí)分子,他們對(duì)20世紀(jì)的哲學(xué)和科學(xué)產(chǎn)生了巨大的影響。我摘抄了西格蒙德書(shū)中的一小段,復(fù)制粘貼到谷歌的翻譯專(zhuān)欄。詳見(jiàn)下文,首先是德語(yǔ),其次是我的翻譯版,最后是Google翻譯版。(對(duì)了,我把我的版本給了兩位德語(yǔ)母語(yǔ)者(其中一位是卡爾·西格蒙德),所以我的版本應(yīng)該沒(méi)問(wèn)題。)
Sigmund原文:
Krieg·薩亨教授是德國(guó)的一名教授,他是德國(guó)的一名教師,他是德國(guó)的一名教師。我是葛軍·威斯敏斯特的教練。和Wissenschaftlerinen Kamen so wieso不在frageüber wenig war man sich einiger .
我的版本:
失敗后,許多具有泛日耳曼主義傾向的教授(當(dāng)時(shí)他們占教職員工的大多數(shù))認(rèn)為保護(hù)高等教育機(jī)構(gòu)不受“不受歡迎的人”的影響是他們的職責(zé)最有可能被解雇的是年輕的sc holars,他們還沒(méi)有獲得教授大學(xué)課程的權(quán)利。至于女學(xué)者,嗯,她們?cè)隗w制內(nèi)根本沒(méi)有地位;沒(méi)有比這更清楚的了。(失敗后,占當(dāng)時(shí)教職人員大多數(shù)的教授有泛德傾向,認(rèn)為保護(hù)高等教育機(jī)構(gòu)不受“政治不良分子”的影響是他們的責(zé)任。最容易被炒魷魚(yú)的年輕學(xué)者是那些沒(méi)有獲得終身職位的人。很明顯女學(xué)者在體制內(nèi)根本沒(méi)有地位。)
谷歌翻譯版:
在戰(zhàn)爭(zhēng)失敗后,許多德國(guó)教授,同時(shí)也是大多數(shù)教師,認(rèn)為他們有責(zé)任讓大學(xué)遠(yuǎn)離“奇怪”;年輕科學(xué)家在適應(yīng)訓(xùn)練前最脆弱。無(wú)論如何,科學(xué)家沒(méi)有質(zhì)疑;戰(zhàn)敗后,許多德國(guó)教授以及大多數(shù)大學(xué)教職員工都將保護(hù)大學(xué)免受“怪人”侵害視為自己的責(zé)任。那些還沒(méi)有獲得特許證教學(xué)資格的年輕科學(xué)家是最弱勢(shì)的群體……不知道為什么。)
Google翻譯的版本都是由拼寫(xiě)正確的英文單詞組成,看起來(lái)不錯(cuò)。但是你很快就會(huì)發(fā)現(xiàn)這個(gè)翻譯根本站不住腳,內(nèi)容越往后越經(jīng)不起推敲。
第一個(gè)是“odd”這個(gè)詞,對(duì)應(yīng)的是德語(yǔ)原文中的“ungeraden”,意思是“政治領(lǐng)域不受歡迎的人”。Google Translate顯然出于某種原因選擇了“odd”這個(gè)詞,其實(shí)純粹是基于統(tǒng)計(jì)結(jié)果。也就是說(shuō),在谷歌龐大的雙語(yǔ)數(shù)據(jù)庫(kù)中,“ungeraden”這個(gè)詞幾乎總是被翻譯成“odd”。而我選擇用“不受歡迎的人”這個(gè)詞來(lái)表示“ungeraden”,與統(tǒng)計(jì)數(shù)據(jù)無(wú)關(guān),純粹是基于我對(duì)語(yǔ)義的理解。只有這樣,我才能傳達(dá)出文中沒(méi)有說(shuō)清楚的意思,但實(shí)際上我想這樣表達(dá)。用“不受歡迎的人”來(lái)翻譯“不受歡迎的人”可能是在任何德語(yǔ)詞典中都找不到的一對(duì)。
接下來(lái)我們來(lái)看一下德語(yǔ)原文中的“Habilitation”,用來(lái)表示類(lèi)似終身教職的大學(xué)教學(xué)資格或地位。它的同源詞“habilitation”在英語(yǔ)中也可以找到,但其實(shí)這個(gè)詞很少見(jiàn),也不會(huì)與終身任職或其他類(lèi)似信息聯(lián)系在一起。正因?yàn)槿绱?,我?huì)用一個(gè)短語(yǔ)來(lái)解釋這個(gè)意思,而不是直接引用這么一個(gè)模糊的詞,因?yàn)闄C(jī)械地以這種方式引用產(chǎn)生的譯文無(wú)法向英語(yǔ)讀者傳達(dá)準(zhǔn)確的信息。當(dāng)然,Google Translate不能像我一樣給出翻譯版本,因?yàn)樗鼘?duì)讀者的知識(shí)模型一無(wú)所知。
現(xiàn)在,我們來(lái)看看最后三句話。相信你會(huì)明白理解對(duì)翻譯是多么重要。15個(gè)字母的德語(yǔ)名詞“Wissenschaftler”的意思是“科學(xué)家”或“學(xué)者”(我選擇了后者,因?yàn)樵谶@個(gè)語(yǔ)境下,指的是普通知識(shí)分子,這是Google翻譯無(wú)法理解的細(xì)微差別?!癢issenschaftlerinnen”由20個(gè)字母組成,是“Wissenschaft lerin”(17個(gè)字母)的復(fù)數(shù)形式,反映了德語(yǔ)名詞中的性別差異。較短的名詞在語(yǔ)法上是正的,因而代表一個(gè)男學(xué)者,而較長(zhǎng)的名詞是負(fù)的,代表女學(xué)者。我用“女學(xué)者”這個(gè)詞來(lái)表達(dá)原文的意思。但Google Translate沒(méi)有注意到正后綴“-in”是這句話的重點(diǎn),所以只使用了“科學(xué)家”一詞對(duì)應(yīng)“Wissenschaftlerinnen”,遺漏了這句話的要點(diǎn)。就像我上面用的法語(yǔ),Google Translate沒(méi)有意識(shí)到這句話的唯一目的就是突出男女對(duì)比。
除了這個(gè)錯(cuò)誤,最后兩句的翻譯正是事故現(xiàn)場(chǎng)。先看看“科學(xué)家無(wú)論如何都沒(méi)有質(zhì)疑”這句話。這真的是“骨折中的wissenschaft lerin nen Kamen sowiesonicht”這句翻譯嗎?英文翻譯表達(dá)的根本不是原文的意思,甚至可以說(shuō)是完全錯(cuò)誤的。這個(gè)英文翻譯只是根據(jù)德語(yǔ)原話一個(gè)一個(gè)找對(duì)應(yīng)的英文單詞放在一起。這種輸出過(guò)程和內(nèi)容可以稱(chēng)之為翻譯嗎?
最后一句也是錯(cuò)誤的。德語(yǔ)原文是“對(duì)此沒(méi)有異議”或“這是絕對(duì)清楚的”,但Google Translate給出的翻譯是“有很多”(幾乎沒(méi)有)。這句話聽(tīng)起來(lái)令人困惑,這就引出了一個(gè)問(wèn)題,“什么什么?(幾乎什么都沒(méi)有?)”但對(duì)于機(jī)械聽(tīng)者Google Translate來(lái)說(shuō),這樣的問(wèn)題毫無(wú)意義。Google Translate不知道這些詞是什么意思,所以它可能連看似簡(jiǎn)單的問(wèn)題都回答不了。Google翻譯只是將一種語(yǔ)言符號(hào)轉(zhuǎn)換成另一種語(yǔ)言符號(hào),對(duì)符號(hào)可能象征的信息和意義沒(méi)有概念。
伊萊扎效應(yīng)與人類(lèi)譯員的翻譯過(guò)程
對(duì)于一個(gè)有真實(shí)生活經(jīng)驗(yàn),知道如何用詞造句準(zhǔn)確傳達(dá)意思的人來(lái)說(shuō),似乎很難意識(shí)到空是如何在我們的電腦屏幕上挖洞Google Translate輸出的翻譯文本的。人們總是習(xí)慣性地認(rèn)為,這樣一個(gè)能流暢處理文字的軟件,一定知道如何表達(dá)意思。這是典型的人工智能項(xiàng)目的錯(cuò)覺(jué),被稱(chēng)為“伊萊扎效應(yīng)”(意思是人可以過(guò)度解讀機(jī)器的結(jié)果,讀出原來(lái)的意思)。伊萊扎是20世紀(jì)60年代早期的人工智能項(xiàng)目,它可以通過(guò)腳本理解簡(jiǎn)單的自然語(yǔ)言,并像人類(lèi)一樣進(jìn)行交互。其中伊萊扎假裝是心理治療師,很多與之互動(dòng)的人都認(rèn)為伊萊扎真的知道自己內(nèi)心最深處的感受。
幾十年來(lái),即使是有經(jīng)驗(yàn)的人和人工智能領(lǐng)域的一些研究人員也陷入了伊萊扎效應(yīng)的陷阱。為了保證我的讀者能夠避開(kāi)這個(gè)陷阱,我來(lái)引用一下上一段說(shuō)的一些短語(yǔ),比如“Google翻譯不懂”,“它沒(méi)意識(shí)到”,“Google翻譯根本沒(méi)想到”。雖然這些短語(yǔ)反復(fù)強(qiáng)調(diào)谷歌翻譯缺乏對(duì)句子的理解,但實(shí)際上,這些單詞也表達(dá)了谷歌翻譯至少有時(shí)應(yīng)該理解單詞、短語(yǔ)或句子的意思,或者至少知道他們說(shuō)什么。但事實(shí)并非如此。Google Translate一直在試圖繞過(guò)或者避開(kāi)理解語(yǔ)言的環(huán)節(jié)。
對(duì)我來(lái)說(shuō),“翻譯”這個(gè)詞散發(fā)著神秘的光芒,讓人細(xì)細(xì)品味。翻譯是人類(lèi)的一種深刻的藝術(shù)形式,它將語(yǔ)言A中的思想清晰生動(dòng)地傳達(dá)給語(yǔ)言b。要發(fā)揮橋梁的作用,翻譯不僅要保持語(yǔ)義的清晰,還要保持原作者的寫(xiě)作風(fēng)格、詞句和文體特征。我翻譯的時(shí)候,總是把原文看的很仔細(xì),盡量把原文的意思內(nèi)化清楚,在腦子里反復(fù)回放。這不是反復(fù)回放原文,而是原文的意思和思路會(huì)在腦海中觸發(fā)各種相關(guān)的想法,創(chuàng)造各種相關(guān)的場(chǎng)景,產(chǎn)生一系列的光環(huán)。這個(gè)過(guò)程在很大程度上是一個(gè)無(wú)意識(shí)的過(guò)程,我不會(huì)開(kāi)始試圖用另一種語(yǔ)言自然地表達(dá)它們,直到光環(huán)完全聚集在一起,激發(fā)出足夠的反應(yīng)。
簡(jiǎn)而言之,在翻譯的過(guò)程中,我不會(huì)簡(jiǎn)單地把A語(yǔ)言的單詞和短語(yǔ)轉(zhuǎn)換成b語(yǔ)言的單詞和短語(yǔ),腦海里會(huì)浮現(xiàn)出圖像、場(chǎng)景和想法,我會(huì)想起自己的經(jīng)歷(在書(shū)中讀到的、在電影中看到的或者從朋友那里聽(tīng)到的)。只有當(dāng)這種非語(yǔ)言的、生動(dòng)的、現(xiàn)實(shí)的氣場(chǎng)形成,只有當(dāng)難以捉摸的意義形成的氣泡浮在我的腦海里,我才會(huì)開(kāi)始輸出目標(biāo)語(yǔ)言的單詞和短語(yǔ),然后進(jìn)行修改、修改、再修改。這樣一個(gè)通過(guò)理解原文意思來(lái)推進(jìn)的過(guò)程,聽(tīng)起來(lái)可能很慢,確實(shí)比Google翻譯每頁(yè)兩到三秒的響應(yīng)時(shí)間慢很多,但這是一個(gè)任何嚴(yán)謹(jǐn)?shù)娜祟?lèi)譯者都會(huì)經(jīng)歷的過(guò)程。這是我聽(tīng)到“深腦”這類(lèi)詞時(shí)想到的。
漢英翻譯展覽
相比以上兩種歐洲語(yǔ)言,中文對(duì)于這個(gè)深度學(xué)習(xí)軟件的考驗(yàn)顯然更為嚴(yán)峻。至于語(yǔ)文考試資料,我從中國(guó)劇作家兼翻譯家江洋寫(xiě)的《我們仨》一書(shū)中摘錄了一段,復(fù)制粘貼到Google翻譯專(zhuān)欄。以下是《我們仨》的原文段落,我翻譯的版本(請(qǐng)母語(yǔ)為中文的人審閱)和Google翻譯給出的版本:
楊瀾原文:
在清華工作一年后,鐘書(shū)被調(diào)到毛選翻譯委員會(huì),住在城里,周末回到學(xué)校。他還在負(fù)責(zé)研究生。
毛選翻譯委員會(huì)的組長(zhǎng)是許同志。是清華的同學(xué)喬同志介紹來(lái)做這個(gè)工作的。
晚飯后,一位老朋友雇了一輛人力車(chē)從城里來(lái)祝賀他??腿俗吆?,鐘書(shū)害怕地對(duì)我說(shuō):
他以為我要走在南書(shū)房。做起來(lái)不容易。我們不求有功,但求無(wú)過(guò)。
我的翻譯版本:
錢(qián)鐘書(shū)在清華大學(xué)工作一年后,被調(diào)到翻譯《毛主席選集》的委員會(huì)。他住在城里,但每個(gè)周末他都會(huì)回到學(xué)校。他還在指導(dǎo)他的研究生。
毛澤東著作翻譯委員會(huì)的負(fù)責(zé)人是許同志,安排中書(shū)翻譯的是他的老清華同窗喬同志。
就在這個(gè)約會(huì)定下來(lái)的那天,晚飯后,一個(gè)老朋友特地雇了一輛人力車(chē),從城里一路趕來(lái),就是為了祝賀鐘書(shū)??腿俗吆螅姇?shū)不安地轉(zhuǎn)向我說(shuō):
“他以為我會(huì)成為‘南方研究特別助理’這種工作不容易。你不能指望榮耀;你所能期望的就是做到?jīng)]有錯(cuò)誤。"
谷歌翻譯版:
在清華工作一年后,他被調(diào)到毛翻譯委員會(huì),住在城里,周末回到學(xué)校。他還是研究生。
毛澤東翻譯委員會(huì)的領(lǐng)導(dǎo)是徐永健同志。介紹這本書(shū)做這項(xiàng)工作的是清華學(xué)生喬同志。
活動(dòng)當(dāng)天,晚飯后,一位老朋友從城里雇了一輛人力車(chē)來(lái)祝賀??腿艘吡耍瑫?shū)中的恐懼對(duì)我說(shuō):
他以為我要做“南學(xué)走”這不是好事,不是為了立功,而是白做。
讓我簡(jiǎn)要指出谷歌翻譯和原文之間的一些差異。首先,谷歌翻譯沒(méi)有提到“鐘書(shū)”一次,但這個(gè)名字在原文中出現(xiàn)了三次。在Google的翻譯中,第一次使用“他”,第二次翻譯成“書(shū)”,第三次翻譯成“書(shū)中恐懼之書(shū)”。太可笑了!
第二個(gè)出入是原文明確顯示錢(qián)鐘書(shū)是在指導(dǎo)研究生,而Google Translate直接把他變成研究生。
第三位是“毛澤東翻譯委員會(huì)”,省略了毛澤東主席名字的最后一個(gè)字。
第四個(gè)地方是,原來(lái)的“許應(yīng)永”已翻譯成了“徐永健”。
第五處是“客人走了之后”已經(jīng)翻譯成“客人要走了”。
第六位是最后一句。沒(méi)有任何意義。
這六個(gè)錯(cuò)誤對(duì)于Google翻譯來(lái)說(shuō)已經(jīng)夠?qū)擂蔚牧?,但這里不需要責(zé)怪。我想和你討論一句讓我困惑的話,“南書(shū)房走”。這個(gè)短語(yǔ)由五個(gè)漢字組成,可能是“南書(shū)室走走”。但是隨機(jī)拼湊起來(lái)顯然無(wú)法表達(dá)原文的意思。特別需要注意的是,“南學(xué)走”在原文中是作為名詞存在的。Google Translate發(fā)明了“南書(shū)房走”這句話,顯然還是不知道為什么。
我不得不承認(rèn)這句話對(duì)我來(lái)說(shuō)很難理解。雖然從字面上來(lái)說(shuō),似乎是指走在一棟樓南邊的書(shū)房里,但我知道應(yīng)該不是這個(gè)意思,因?yàn)楦鶕?jù)上下文沒(méi)有意義。所以,如果我想準(zhǔn)確翻譯這句話,我需要在它背后挖掘出一些我在中國(guó)文化中不理解的東西。那么我應(yīng)該在哪里找到答案呢?當(dāng)然是Google(但不是Google翻譯)。我把“行走在南書(shū)房”這五個(gè)漢字輸入谷歌搜索欄,加了雙引號(hào),然后開(kāi)始搜索。很多中文網(wǎng)頁(yè)馬上就出現(xiàn)了,然后我費(fèi)了好大勁才把前幾個(gè)網(wǎng)頁(yè)開(kāi)頭的信息弄懂,想搞清楚這五個(gè)字的意思。
我發(fā)現(xiàn)“南書(shū)房走”這個(gè)名詞其實(shí)可以追溯到清朝。并不是指官職,而是皇家知識(shí)分子翰林擔(dān)任的“差事”,其職責(zé)是幫助皇帝(在皇宮南書(shū)房)起草“特別圣旨”。這樣就很容易理解“走就走”這個(gè)詞的字面意思是助手。所以根據(jù)Google搜索提供的信息,我用“南學(xué)特別助手”來(lái)表達(dá)原文的意思。
很遺憾谷歌翻譯不能像我一樣使用谷歌搜索中的信息。雖然Google Translate可以即時(shí)翻譯網(wǎng)頁(yè)內(nèi)容,但它并不理解網(wǎng)頁(yè)中的信息。以下是我在谷歌翻譯后搜索《行走在南書(shū)房》時(shí)瀏覽的網(wǎng)頁(yè)信息版本:
“南學(xué)行走”并不是官職,在大清時(shí)代之前這只是一個(gè)“信使”,一般由當(dāng)時(shí)的科舉知識(shí)分子翰林擔(dān)任。南書(shū)房在翰林官員中以“擇蔡晨唯品而優(yōu)”為價(jià)值,稱(chēng)為“南書(shū)房散步”因?yàn)榻咏实?,所以?duì)皇帝的決定有一定的影響。雍正后來(lái)設(shè)置了“軍機(jī)”軍機(jī)大臣,專(zhuān)職學(xué)習(xí),雖仍為翰林入值,但沒(méi)有參與政務(wù)。清代學(xué)者對(duì)入南學(xué)的價(jià)值引以為傲。許多學(xué)者和清初學(xué)者通過(guò)研究進(jìn)入南方。
這是英語(yǔ)嗎?這是事實(shí)。我們都同意上面的段落是由英文單詞組成的(大部分),但這是英文段落嗎?在我看來(lái),這一段不是英文段落,而是由隨機(jī)單詞沙拉組成的零散大雜燴。
以下是我花了幾個(gè)小時(shí)做的同一內(nèi)容的英文翻譯,供你參考:
南-方舒-星洲(“南學(xué)特別助理”)不是一個(gè)官方職位,但在清初,這是一個(gè)特殊的角色,通常由皇帝的現(xiàn)任知識(shí)分子院士擔(dān)任。在皇宮南書(shū)房工作的一群阿卡德米西亞人會(huì)在他們中間選擇一個(gè)才華橫溢、品德高尚的人來(lái)為皇帝代筆,并隨時(shí)聽(tīng)候皇帝的吩咐;這就是為什么這個(gè)角色被稱(chēng)為“南方研究特別助理”這位《南方研究》的助手與皇帝如此親近,顯然能夠影響后者的政策決定。然而,雍正帝建立了一個(gè)有一名大臣和各種較低職位的官方軍事部后,南方研究助手盡管仍在為皇帝服務(wù),但不再在政府決策中發(fā)揮主要作用。盡管如此,清代學(xué)者渴望在皇帝的南學(xué)工作的榮耀,在清朝早期,相當(dāng)多的著名學(xué)者作為南學(xué)的特別助手為皇帝服務(wù)。
有些讀者可能會(huì)懷疑我為了攻擊Google Translate故意找了一些比較難的段落。他們認(rèn)為谷歌翻譯實(shí)際上在大多數(shù)段落中表現(xiàn)得更好。這聽(tīng)起來(lái)很合理,其實(shí)不然。我從我讀的書(shū)里選了很多段落來(lái)測(cè)試,幾乎每一段都會(huì)有不同形式和大小的翻譯錯(cuò)誤,包括上面提到的完全不認(rèn)識(shí)所以又無(wú)法理解的句子。
當(dāng)然,我也承認(rèn)Google Translate有時(shí)候會(huì)產(chǎn)生一系列看起來(lái)不錯(cuò)的英文句子(雖然可能與原意有一些誤解或者完全錯(cuò)誤),有時(shí)候看起來(lái)一段甚至兩段翻譯的內(nèi)容都很優(yōu)秀,給人一種Google Translate理解自己所讀內(nèi)容的錯(cuò)覺(jué)。在這種情況下,人們會(huì)用新的眼睛和耳朵看待谷歌的翻譯,認(rèn)為它幾乎可以與人類(lèi)媲美。我們應(yīng)該贊美谷歌翻譯的創(chuàng)作者和背后的集體努力,但同時(shí)也不要忘記谷歌翻譯在這兩段中文中的翻譯表現(xiàn),以及前面的法文和德文段落。要想理解這種不足,必須時(shí)刻提醒自己伊萊扎效應(yīng)。Google翻譯不是像正常人一樣“閱讀”文本,而是處理文本。它處理的符號(hào)與現(xiàn)實(shí)世界的體驗(yàn)是分離的。當(dāng)它快速轉(zhuǎn)換文字時(shí),沒(méi)有真實(shí)的經(jīng)驗(yàn)可提取,沒(méi)有圖片可形成,沒(méi)有理解,沒(méi)有意義。
幾個(gè)問(wèn)題的探討
有朋友問(wèn)我,谷歌翻譯的水平是否不僅僅是由程序數(shù)據(jù)庫(kù)決定的?他認(rèn)為,如果數(shù)據(jù)庫(kù)可以擴(kuò)大100萬(wàn)倍,甚至10億倍,應(yīng)該可以翻譯任何內(nèi)容,翻譯基本可以達(dá)到完美的水平。我不同意他的觀點(diǎn)。擁有更多的“大數(shù)據(jù)”在理解上是不會(huì)有任何進(jìn)步的,因?yàn)槔斫馐切枰枷雭?lái)發(fā)揮作用的,而缺乏思想是機(jī)器翻譯中一切問(wèn)題的根源。所以,我敢說(shuō),更大的數(shù)據(jù)庫(kù)解決不了問(wèn)題。
另一個(gè)問(wèn)題是,在Google Translation中使用神經(jīng)網(wǎng)絡(luò)能否使機(jī)器翻譯更接近于理解語(yǔ)言。聽(tīng)起來(lái)很有道理,但實(shí)際上機(jī)器翻譯并沒(méi)有試圖超越單詞和短語(yǔ)的層面。構(gòu)成龐大數(shù)據(jù)庫(kù)的各種統(tǒng)計(jì)事實(shí)都體現(xiàn)在神經(jīng)網(wǎng)絡(luò)中,但這些統(tǒng)計(jì)事實(shí)只是把文字和其他文字聯(lián)系起來(lái),而不是把文字和思想聯(lián)系起來(lái)。如果不試圖創(chuàng)建一個(gè)可以被視為思想、圖像、記憶或經(jīng)驗(yàn)的內(nèi)部結(jié)構(gòu),這些屬于人類(lèi)的心理活動(dòng)仍然很難從計(jì)算層面反映出來(lái),所以他們使用一種快速而復(fù)雜的統(tǒng)計(jì)詞聚類(lèi)算法作為替代。但這種形式的結(jié)果,并不符合人類(lèi)在閱讀、理解、創(chuàng)造、修改、評(píng)判一篇文章時(shí)的最終思想。
雖然我對(duì)Google Translate持否定態(tài)度,但是Google Translate提供的服務(wù)確實(shí)讓很多人給予了很高的評(píng)價(jià):它可以將A語(yǔ)言的表意段落快速轉(zhuǎn)換成B語(yǔ)言的單詞串組成的文本。只要一些B語(yǔ)言的文字可以理解,這就足以讓很多人對(duì)這個(gè)產(chǎn)品滿意了。如果他們能通過(guò)谷歌翻譯理解他們不知道的一段語(yǔ)言的大致意思,他們會(huì)很高興。雖然這不符合我個(gè)人對(duì)“翻譯”這個(gè)詞的看法,但對(duì)很多人來(lái)說(shuō),這是一個(gè)很好的服務(wù)。對(duì)他們來(lái)說(shuō),這就是翻譯。我知道他們的需求,我理解他們的快樂(lè)和滿足。只能說(shuō)他們運(yùn)氣好!
最近看到一些技術(shù)發(fā)燒友制作的條形圖,聲稱(chēng)這些圖表反映了人和機(jī)器翻譯的“質(zhì)量”,認(rèn)為最新的翻譯引擎和人的翻譯之間的距離縮小到了驚人的程度。但對(duì)我來(lái)說(shuō),這是一種把無(wú)法量化的東西量化的偽科學(xué),或者是一群書(shū)呆子在數(shù)學(xué)上計(jì)算著他們無(wú)法理解的無(wú)形的、細(xì)微的、藝術(shù)的東西。在我看來(lái),Google Translate的輸出質(zhì)量參差不齊,有優(yōu)秀的翻譯,也有荒謬的翻譯,但我無(wú)法量化我的感受。想想我在這篇文章里舉的第一個(gè)例子,里面有“他”和“她”的法語(yǔ)素材。機(jī)器翻譯幾乎可以實(shí)現(xiàn)每個(gè)單詞的正確對(duì)應(yīng),但盡管如此,原文最重要的意義卻根本沒(méi)有表達(dá)出來(lái)。在這樣的情況下,如何“量化”其翻譯質(zhì)量?用看似科學(xué)的條形圖來(lái)反映翻譯質(zhì)量,只不過(guò)是對(duì)科學(xué)外表的濫用。
讓我們回到文章開(kāi)頭提到的悲劇譯者形象。好像很快就要淘汰了,以后只會(huì)成為質(zhì)檢人員和文字校對(duì)人員的翻譯形象。這充其量只能形容那些平庸的譯者。一個(gè)認(rèn)真的藝術(shù)家不會(huì)一開(kāi)始就給錯(cuò)誤一個(gè)粗略的版本,然后再去彌補(bǔ),以至于不能產(chǎn)生高質(zhì)量的藝術(shù)作品,這不是藝術(shù)的本質(zhì),翻譯是一門(mén)藝術(shù)。
在我多年的創(chuàng)作生涯中,我一直認(rèn)為人腦是一個(gè)機(jī)器,一個(gè)非常復(fù)雜的機(jī)器,我強(qiáng)烈反對(duì)機(jī)器不能控制本質(zhì)意義的觀點(diǎn)。甚至有一個(gè)哲學(xué)流派聲稱(chēng),計(jì)算機(jī)永遠(yuǎn)不會(huì)“理解語(yǔ)義”,因?yàn)樗鼈兪怯伞板e(cuò)誤的東西”(硅)構(gòu)成的。在我看來(lái),這只是一些可以不假思索地說(shuō)出來(lái)的廢話。在這里,我就不爭(zhēng)論這個(gè)論點(diǎn)了,但我不希望讀者有這樣的印象,也不希望讀者誤以為我的觀點(diǎn)是計(jì)算機(jī)得不到智慧,實(shí)現(xiàn)不了理解。如果我在這篇文章中給你這樣的誤解,那是因?yàn)槲乙恢痹谟懻摍C(jī)器翻譯,沒(méi)有試圖再現(xiàn)人類(lèi)的智慧。相反,它試圖繞過(guò)人類(lèi)的智能,而我上面展示的Google翻譯輸出文本清楚地揭示了它的巨大缺陷。
就我而言,我們沒(méi)有根本的依據(jù)斷言未來(lái)機(jī)器不會(huì)有創(chuàng)造性、趣味性、懷舊性、興奮性、恐懼性、狂喜性和希望性,從而斷言未來(lái)機(jī)器翻譯無(wú)法實(shí)現(xiàn)兩種語(yǔ)言之間的生動(dòng)翻譯。同樣,我們沒(méi)有根本的理由可以否定機(jī)器翻譯在未來(lái)成功翻譯笑話、雙關(guān)語(yǔ)、電影劇本、小說(shuō)和詩(shī)歌的潛力。但是,只有當(dāng)機(jī)器翻譯像人類(lèi)一樣充滿思想、感情和經(jīng)驗(yàn)的時(shí)候,我說(shuō)的才會(huì)成真。而現(xiàn)在,這些都無(wú)法實(shí)現(xiàn),也不是距離遇見(jiàn)愛(ài)情指日可待。其實(shí)我覺(jué)得要做到這一點(diǎn)還有很長(zhǎng)的路要走,至少這是一個(gè)我是人類(lèi)思維的終極崇拜者的結(jié)果。
有一天,如果一個(gè)翻譯引擎能夠準(zhǔn)確的翻譯出一首五音步抑揚(yáng)格準(zhǔn)確的詩(shī),傳達(dá)出原文的智慧、悲傷和文體魅力,那么我知道,終于到了摘掉帽子進(jìn)行機(jī)器翻譯的時(shí)候了。
原文鏈接:https://www . the Atlantic . com/technology/archive/2018/01/the-smooth-of-Google-translate/551570/
由編譯團(tuán)隊(duì)編譯。編輯:郝鵬程
1.《谷哥翻譯 深度剖析谷歌翻譯:淺薄而冰冷,一時(shí)還取代不了人類(lèi)譯員》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《谷哥翻譯 深度剖析谷歌翻譯:淺薄而冰冷,一時(shí)還取代不了人類(lèi)譯員》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/tiyu/1587886.html