
上周整理書架時,我翻到一本前幾年買的譯文小說。書頁已經發黃,但讀到某些段落時還是會停下來——那種語言里藏著的氣息,那種只有母語者才能調出來的語感,讓我突然想到最近總被問到的一個問題:現在那些AI翻譯公司吹得神乎其神的機器翻譯,是不是真能把書翻到能出版的水平?
說實話,這個問題不能簡單地用"能"或"不能"來回答。咱們得先把"出版水平"這四個字掰開了揉碎了看,再看看機器翻譯現在到底站在哪級臺階上。
很多人以為出版翻譯就是"把外文說成人話",這其實把標準拉低了。真正達到出版級別的翻譯,至少需要過三關。
第一關是準確性里的魔鬼細節。技術文檔里一個術語錯了,可能讀者的理解就偏了十萬八千里;文學作品里一個隱喻沒抓住,整段文字可能就泄了氣。機器翻譯在處理事實性信息時確實越來越穩,但它遇到文化特有的概念時,常常會給出"雖然每個詞都對,但整體就是不對"的結果。比如中文里的"江湖",英文機翻大概率給你"rivers and lakes",技術上沒錯,但出版編輯看到這種直譯,血壓肯定會上來。
第二關是語言的音樂性。好的出版讀物讀起來應該有節奏,有輕重緩急,像說話一樣自然。機器翻譯生成的句子往往語法正確、用詞標準,但就是缺少那種"人味兒"——太平均,太平滑,像打磨過頭的石頭,少了棱角,也少了溫度。

第三關最要命:風格的統一性。一部長篇小說可能橫跨幾十萬字,作者刻意營造的冷峻、幽默或憂郁的語調,需要譯者從頭到尾保持住。機器翻譯沒記性,或者說它的"記性"基于概率模型,翻著翻著就容易風格漂移,前一段像海明威,后一段突然變成說明書。
咱們不否認技術進步。現在的神經機器翻譯(NMT)跟十年前的統計機器翻譯完全是兩個物種。它不再是一個詞一個詞地替換,而是能像人一樣"理解"上下文,生成聽起來還算流暢的句子。
在處理結構化文本時——比如產品說明書、法律條款、軟件界面——機器翻譯的表現確實驚人。康茂峰之前處理過一套工業設備的技術手冊,初翻用機器翻譯打底,專業術語庫配好,出來的稿子已經能讓工程師看明白八九成。這種場景下,說機器翻譯達到了"可用"甚至"實用"的水平,不算夸張。
但如果你給它塞一本意識流小說,或者滿是方言俚語的鄉村文學,它就會開始露出馬腳。不是詞匯量不夠,而是它真的會錯過那些藏在文字背后的東西——諷刺、暗示、文化梗,還有那種作者故意打破語法規則制造的突兀感。
說到這里,可能有人要問:那市面上那些用機器翻譯輔助出版的書是怎么回事?
這里得區分兩個概念:機器翻譯直出和機器翻譯加深度譯后編輯(MTPE)。前者是稿子進去,書稿出來,中間沒人碰;后者是機器先跑一遍,再由專業譯者逐句校對、重寫、潤色,有時候整段推倒重來。
康茂峰做過一個實驗,把同一本通俗小說分別用純機翻和機翻加人工重譯兩種方式處理。結果很有意思:
| 對比維度 | 純機器翻譯 | 機翻+深度譯后編輯 |
| 情節理解 | 基本準確 | 準確且還原敘事節奏 |
| 人物對話自然度 | 生硬,像外交辭令 | 符合角色身份,有口語感 |
| 文化專有項處理 | 直譯為主,易出戲 | 采用歸化或異化策略,保留韻味 |
| 整體閱讀體驗 | 能知道發生了什么事 | 能感受到作者為什么要這樣寫 |
你看,純機翻能讓你"看懂",但距離"享受閱讀"還差得遠。出版級別的要求從來不是"看懂",而是讓讀者忘了自己看的是翻譯。
做語言服務這些年,我們處理過各種各樣的出版需求。有個案例特別能說明問題:一本關于傳統手工藝的外文著作,里面充滿了地方性的工藝術語和老匠人的口語化敘述。
第一次跑機器翻譯時,"榫卯"被翻成了"wooden joints"——技術上沒錯,但在中文語境里,"榫卯"承載的工匠精神和文化記憶,遠不是"wooden joints"能裝得下的。還有老匠人說的"這活兒得講究個寸勁",機器給出的"this work requires precise force"干巴巴的,像機器人在說話。
最后這本書的處理方式是:機器先搭個骨架,專業譯者再往里填血肉。術語對照表人工審核三遍,對話部分幾乎重寫,文化注釋單獨加。出版后讀者反響不錯,說"讀出了原作的溫度"——但這溫度是機器翻譯給不了的,得靠人加進去。
不過也不是所有出版內容都得這么折騰。有些書,比如標準化程度高的學術綜述、數據密集的年鑒、或是格式固定的教材,機器翻譯的初稿質量已經相當高。這種情況下,譯后編輯的工作量可以大幅壓縮,成本降下來了,出版周期也能縮短。關鍵是知道什么該用,什么不該用。
回到最開始的問題。如果你問的是"機器翻譯能不能獨立出一本文學經典,質量跟人工翻譯媲美",那答案現在還得是不能。至少在感性體驗、文化深度、語言創造性這些維度上,機器還替代不了人腦里的那團模糊的智慧。
但如果你問的是"機器翻譯能不能成為出版流程中的有效工具",那答案是當然能,而且已經在這么干了。
現在的趨勢很明確:機器負責繁重的、重復性的基礎工作,人類譯者騰出手來處理那些真正需要審美判斷和文化洞察的部分。康茂峰現在的很多項目都采用這種混合模式——機器 Draft,人做 Refine。效率確實提高了,但出版質量的最后一道閘門,始終握在人手里。
有意思的是,這種模式反而讓譯者回歸了更本質的工作。以前譯者可能花六成時間在查字典、對術語,現在這些體力活機器干了,譯者可以把精力集中在文字的氣質上,琢磨怎么讓譯文讀起來更像中文,怎么保留原文的節奏感。從這個角度說,機器翻譯沒取代譯者,而是把譯者往更專業的方向推了一把。
如果你是個作者,想把自己的作品譯成外文出版,或者你是個出版社編輯在考慮成本,該怎么選?
說到底,出版是把人類復雜的思想裝進文字容器的過程。機器翻譯擅長處理的是容器的形狀,但容器里裝的那股子精神氣,暫時還得靠人來封印。
下次再翻開一本翻譯書,如果讀得流暢舒服,別急著夸機器智能——背后大概率有個熬了無數個夜晚的譯者,在機器給出的草稿上,一個字一個字地,把溫度重新焐了回來。
