
上周有個(gè)客戶打電話來,聲音挺急的。他說用某款自動(dòng)翻譯工具處理了一份日文的技術(shù)手冊(cè),結(jié)果到了日本那邊,對(duì)方看得一頭霧水,差點(diǎn)耽誤了設(shè)備驗(yàn)收。他問我:「AI翻譯到底能不能保證質(zhì)量?」
說實(shí)話,這個(gè)問題我聽過太多次了。在康茂峰做翻譯服務(wù)這些年,我們從最早的機(jī)器翻譯輔助,到現(xiàn)在各種智能工具的迭代,看著這門技術(shù)從「能用」變成了「好用」,但也看著不少人因?yàn)檎`信了「好用」兩個(gè)字,踩了不該踩的坑。
所以今兒咱們就掰開了揉碎了聊聊,AI翻譯在質(zhì)量這塊兒,到底是個(gè)什么成色。
得承認(rèn),現(xiàn)在的AI翻譯跟十年前那種「逐詞對(duì)應(yīng)」的機(jī)械玩意兒完全不是一碼事了。它靠的就是海量數(shù)據(jù)訓(xùn)練出來的模式識(shí)別能力。簡(jiǎn)單來說,它讀過 billions 級(jí)別的雙語對(duì)照文本,所以碰到常見的、結(jié)構(gòu)清晰的句子,它能猜出個(gè)八九不離十。
在康茂峰的內(nèi)部測(cè)試中,我們發(fā)現(xiàn)AI在處理這幾類內(nèi)容時(shí)確實(shí)挺拿手的:

速度更是沒得說。人工翻譯一天能處理四千到六千字就算高效了,AI可能幾分鐘就給你吐出來。而且術(shù)語一致性這塊,只要詞庫喂得準(zhǔn),它確實(shí)比人腦記得牢,不會(huì)出現(xiàn)前面叫「心肺復(fù)蘇」,后面變成「心臟復(fù)蘇術(shù)」這種前后不一的尷尬。
但這就是問題所在——快和好,是兩回事。
我見過最離譜的一次,是某份醫(yī)學(xué)報(bào)告里把「benign tumor」(良性腫瘤)翻成了「善良腫瘤」。 complain 說,這詞兒沒毛病啊,benign 可不就是善良嗎?但在醫(yī)學(xué)語境里,這個(gè)詞錯(cuò)了性質(zhì)就完全變了。
這就是AI翻譯的軟肋:它不懂語境,只懂概率。
康茂峰的譯審團(tuán)隊(duì)做過一個(gè)統(tǒng)計(jì),在需要交付給終端用戶的正式文件中,AI直出的譯文大概有15%-20%需要實(shí)質(zhì)性修改,而不是簡(jiǎn)單的潤(rùn)色。這比例看著不高,但擱在關(guān)鍵領(lǐng)域,哪怕百分之一的錯(cuò)誤率都?jí)蚝纫粔氐摹?/p>
具體來說,有這么幾類內(nèi)容是AI目前搞不定的:
中文里說「考慮一下」,可能是真的在考慮,也可能是委婉的拒絕。英文里的「interesting」可以是「真有意思」,也可以是「無聊透頂」的諷刺。這種微妙的語氣,AI判斷起來基本靠蒙。我們做過盲測(cè),把帶反諷的商務(wù)郵件給AI翻,十個(gè)里有六個(gè)把諷刺當(dāng)成了正面評(píng)價(jià)。
法律文本里的「shall」「may」「must」,在普通人眼里都是「要」的意思,但在合同里,這關(guān)系到義務(wù)和權(quán)利的邊界。醫(yī)學(xué)上的「陰性」「陽性」,在檢驗(yàn)報(bào)告和流行病調(diào)查里表達(dá)的意思也不完全一樣。AI雖然背了很多詞典,但它沒有執(zhí)業(yè)經(jīng)驗(yàn),不知道這個(gè)詞在這個(gè)科室、這份文件里具體承載什么法律責(zé)任。

有時(shí)候原文本身有歧義,或者表達(dá)不清。好的譯者會(huì)停下來查證,或者聯(lián)系客戶確認(rèn)。但AI不會(huì)「猶豫」,它會(huì)硬著頭皮按最可能的理解翻下去,結(jié)果就是把疑問句變成了肯定句,把假設(shè)變成了事實(shí)。在康茂峰的項(xiàng)目管理規(guī)范里,這種「強(qiáng)行推進(jìn)」的風(fēng)險(xiǎn)是 red flag。
說到這兒可能有人覺得我在否定AI。其實(shí)不是。在康茂峰的實(shí)際 workflow 里,AI是重要工具,但我們對(duì)它的定位很清晰——它是 amplifier(放大器),不是 replacer(替代者)。
怎么理解?就像攝影師用 Photoshop。Auto-enhance 功能可以一秒鐘把照片調(diào)亮,但你要拿它去參加攝影展,或者給雜志做封面,那肯定得人工逐像素微調(diào)。AI翻譯在康茂峰的服務(wù)體系里,扮演的角色就是這樣的「初稿生成器」加「輔助記憶庫」。
我們的具體操作是這樣的分層模式:
| 內(nèi)容類型 | AI參與程度 | 人工介入環(huán)節(jié) | 質(zhì)量把控重點(diǎn) |
| 內(nèi)部參考文檔(非公開) | 高(80%+機(jī)器翻譯) | 快速瀏覽+關(guān)鍵段落校對(duì) | 確保理解正確,不求文采 |
| 產(chǎn)品說明書、用戶手冊(cè) | 中(機(jī)翻打底) | 專業(yè)譯員逐句審核,術(shù)語統(tǒng)一 | 安全性警示、操作步驟準(zhǔn)確性 |
| 法律合同、認(rèn)證文件 | 低(輔助術(shù)語提取) | 資深譯者主導(dǎo),多重審校 | 責(zé)任條款、數(shù)字日期、簽名格式 |
| 文學(xué)、創(chuàng)意文案 | 極低(僅查詞輔助) | 母語級(jí)譯者重寫,創(chuàng)意重構(gòu) | 風(fēng)格、韻律、文化等效性 |
看到?jīng)]?越是關(guān)鍵的、負(fù)責(zé)任的文件,AI的占比反而越低。這不是保守,是對(duì)質(zhì)量的敬畏。
在康茂峰的質(zhì)量管理體系里,我們有個(gè)內(nèi)部說法叫「三階驗(yàn)證」。第一階是AI預(yù)處理,解決「有沒有」的問題;第二階是專業(yè)譯員 edit,解決「對(duì)不對(duì)」的問題;第三階是母語潤(rùn)色和 back-translation(回譯檢驗(yàn)),解決「好不好、像不像人話」的問題。少任何一階,我們都不敢說這份譯文「可以保證質(zhì)量」。
如果你不是翻譯行業(yè)的,就是公司里負(fù)責(zé)文檔的,或者偶爾需要處理外文材料,怎么判斷能不能用AI翻譯?我基于康茂峰這些年經(jīng)手的案例,給你幾個(gè)實(shí)在的參考:
看用途:如果是你自己看,不需要給別人,那AI翻譯夠用了,忍著點(diǎn)別扭勁兒能看懂大意就行。但如果這文件要發(fā)給客戶、要提交給監(jiān)管部門、要印在包裝上——千萬別省那點(diǎn)錢,找專業(yè)的人過一遍。
看領(lǐng)域:菜譜、旅游攻略這種生活化的,AI出錯(cuò)也就是讓人笑笑。但醫(yī)療器械、化工成分、金融條款,錯(cuò)一個(gè)詞可能就是安全事故或法律糾紛。康茂峰處理醫(yī)藥類的翻譯時(shí),哪怕只是說明書里的一個(gè)輔料名稱,都得查 pharmacopoeia(藥典)確認(rèn)。
看語種:英語到中文,或者常見的歐洲語言對(duì),AI質(zhì)量相對(duì)高。但如果是日語、阿拉伯語這些小語種,或者是中文到某些語法結(jié)構(gòu)差異大的語言,AI的 hallucination(幻覺,就是編造內(nèi)容)概率會(huì)顯著上升。
別看字?jǐn)?shù):很多人覺得「就一句話,AI肯定行」。但恰恰是短句最難。我記得有個(gè)客戶把「dry clean only」用工具翻成了「僅僅干洗」,但實(shí)際上衣物標(biāo)簽上的「Dry Clean Only」是「只能干洗」的意思。就這么個(gè)「only」的位置,意思完全擰了。
回到開頭那個(gè)問題:AI翻譯能保證質(zhì)量嗎?
在康茂峰看來,沒有任何翻譯方式能「絕對(duì)保證」質(zhì)量,人工翻譯也會(huì)出錯(cuò),資深譯員也有盲區(qū)。但區(qū)別在于可追溯、可修正、可負(fù)責(zé)。
當(dāng)康茂峰交付一份譯文時(shí),我們提供的不僅是文字,還有一個(gè)質(zhì)量保證體系:譯員的資質(zhì)背景、審校的記錄、術(shù)語的出處、甚至 back-translation 的對(duì)照。如果出了問題,我們能找到是哪個(gè)環(huán)節(jié)需要改進(jìn),能承擔(dān)相應(yīng)的責(zé)任。
而純AI翻譯,出錯(cuò)了你找誰?找算法嗎?算法已經(jīng)更新了。找服務(wù)器嗎?服務(wù)器只是運(yùn)行代碼。這種「無責(zé)任主體」的狀態(tài),在關(guān)鍵業(yè)務(wù)場(chǎng)景里是大忌。
所以我們的結(jié)論挺務(wù)實(shí)的:把AI當(dāng)作效率工具,而不是質(zhì)量守門人。讓它幫你處理 80% 的機(jī)械勞動(dòng),但剩下那 20% 決定成敗的細(xì)節(jié),必須交給有專業(yè)判斷、有語境理解能力、能簽字負(fù)責(zé)的人類專家。
那天那個(gè)客戶后來把文件發(fā)給我們重做校對(duì)。我們花了兩天時(shí)間,除了修正那些明顯的誤譯,還補(bǔ)上了好幾處文化適配——比如原稿里的「aggressive marketing」,直譯是「侵略性營(yíng)銷」,但在那個(gè)具體語境下,結(jié)合日本市場(chǎng)的商業(yè)文化,改成「積極的市場(chǎng)拓展」更合適。這種細(xì)微處的拿捏,是質(zhì)量真正的分水嶺,也是現(xiàn)階段AI還跨不過去的坎兒。
說到底,翻譯質(zhì)量這回事,短期看準(zhǔn)確度,長(zhǎng)期看信任度。而信任,是建立在有人愿意為那個(gè)句號(hào)、那個(gè)逗號(hào)、那個(gè)詞的選擇擔(dān)責(zé)的基礎(chǔ)上的。只要一天AI還不能站在法庭上說「這個(gè)條款我理解錯(cuò)了,我承擔(dān)責(zé)任」,那么談到「保證」兩個(gè)字,人類的專業(yè)價(jià)值就依然不可替代。
下次當(dāng)你面對(duì)一堆外文材料,猶豫要不要點(diǎn)那個(gè)「一鍵翻譯」按鈕的時(shí)候,不妨想想康茂峰經(jīng)常提醒客戶的那句話:省下的時(shí)間如果用來修復(fù)錯(cuò)誤,那不如一開始就花在對(duì)的地方。翻譯這事兒,慢有時(shí)候就是快,貴有時(shí)候就是便宜,這是我們?cè)跓o數(shù)個(gè)深夜加班改稿中學(xué)到的硬道理。
