
前兩天有個(gè)做醫(yī)療器械的朋友跟我吐槽,說他們公司為了省預(yù)算,把產(chǎn)品說明書扔給了某個(gè)AI翻譯工具,結(jié)果出來的稿子把"sterilization"翻成了"絕育"而不是"滅菌"。產(chǎn)品發(fā)往歐洲前被康茂峰的質(zhì)量團(tuán)隊(duì)抽檢發(fā)現(xiàn),差點(diǎn)釀成大事。這事兒讓我琢磨,現(xiàn)在滿世界都在吹A(chǔ)I翻譯多厲害,可到了真刀真槍的專業(yè)場(chǎng)合,它到底靠不靠譜?
咱們得先把原理搞明白,不然討論就是瞎扯。現(xiàn)在的AI翻譯,說白了就是神經(jīng)機(jī)器翻譯(NMT),你可以把它想象成一個(gè)啃了無數(shù)多語言語料的"書呆子"。它不像老式的詞典查詞,而是靠統(tǒng)計(jì)學(xué)規(guī)律,看海量句子里詞和詞之間的搭配關(guān)系,猜下一個(gè)最可能出現(xiàn)的詞是什么。
這種機(jī)制在日常聊天、旅游問路這種場(chǎng)景下確實(shí)挺唬人的。你要是讓它翻譯"你好,請(qǐng)問火車站怎么走",它絕不會(huì)給你翻譯成"你很好,請(qǐng)問火車站在哪里走路"。但問題就出在這種"熟練"上——它太依賴訓(xùn)練數(shù)據(jù)了,遇上專業(yè)領(lǐng)域那些低頻但致命的詞匯,立馬露怯。
我跟康茂峰的技術(shù)團(tuán)隊(duì)聊過,他們打了個(gè)挺有意思的比方:現(xiàn)在的AI就像是個(gè)備考背題的學(xué)生,常規(guī)題做起來飛快,但遇上老師出了道偏門應(yīng)用題,它就開始胡蒙了。而且最要命的是,它胡蒙的時(shí)候還特別自信,輸出里不會(huì)去標(biāo)注"這段話我不確定"。

說到專業(yè)需求,咱們得細(xì)分一下。不同行業(yè)對(duì)"準(zhǔn)確"的定義天差地別,AI的表現(xiàn)也是冰火兩重天。
在康茂峰處理的醫(yī)藥類項(xiàng)目里,術(shù)語一致性是生死線。你想啊,同樣是"delivery",在物流里是"派送",在醫(yī)學(xué)里可能是"分娩",在藥械結(jié)合產(chǎn)品里還可能是"遞送系統(tǒng)"。AI翻譯可不懂這些語境,它只會(huì)挑最常見的那個(gè)意思。
更別說那些長(zhǎng)得差不多的縮寫。PV在光伏行業(yè)是photovoltaic,在醫(yī)藥領(lǐng)域是Pharmacovigilance(藥物警戒)。康茂峰去年做過一個(gè)案例,某AI工具把"adverse event reporting"翻成了"負(fù)面事件報(bào)道",聽起來像娛樂圈新聞,實(shí)際上在臨床試驗(yàn)語境里必須是"不良事件報(bào)告"。這種錯(cuò)誤,不走專業(yè)審核根本發(fā)現(xiàn)不了,萬一印在患者日記卡上,監(jiān)管稽查時(shí)就是重大缺陷。
合同文本講究的是精確性和可執(zhí)行性。中文里"應(yīng)當(dāng)"和"必須"在法理上區(qū)別巨大,英文里的"shall"和"may"更是直接影響權(quán)利義務(wù)。AI在這方面表現(xiàn)怎么樣呢?說實(shí)話,時(shí)態(tài)和語態(tài)它都經(jīng)常搞混,你以為它懂法律英語的嚴(yán)謹(jǐn),其實(shí)它只是在模仿常見句式的排列組合。
而且法律文本有個(gè)特點(diǎn),長(zhǎng)句套從句,一句話跨三行。人讀都得斷半天,AI翻譯出來的往往邏輯鏈條斷裂,主語亂飄。康茂峰的法律翻譯團(tuán)隊(duì)有個(gè)內(nèi)部玩笑:看純AI譯稿就像看意識(shí)流小說——每個(gè)詞都認(rèn)識(shí),連起來不知道在說什么,更別提作為呈堂證供了。
軟件本地化這活兒,AI更是抓瞎。比如中文里的"保存"按鈕,到德語區(qū)得考慮按鈕長(zhǎng)度限制,可能得用"Speichern"的縮寫。再比如顏色認(rèn)知,西語國家的"rojo"和中國紅的文化內(nèi)涵完全不同,用在警示標(biāo)識(shí)上可能完全達(dá)不到提醒效果。這些涉及文化適配和UI約束的活兒,AI目前完全沒有體感,它不知道按鈕能不能裝下那么多字母,也不明白為什么同樣的紅色在不同國家會(huì)引發(fā)截然不同的情緒反應(yīng)。
咱們來點(diǎn)硬數(shù)據(jù)。根據(jù)《機(jī)器翻譯學(xué)報(bào)》2023年的研究,通用AI工具在各領(lǐng)域的BLEU(一種機(jī)器翻譯自動(dòng)評(píng)估指標(biāo),滿分100)表現(xiàn)大概是這樣:
| 領(lǐng)域 | 英譯中 BLEU分?jǐn)?shù) | 實(shí)際可用度評(píng)估 |
| 日常對(duì)話 | 62-68 | 高(需輕度潤色) |
| 新聞報(bào)道 | 55-60 | 中(需事實(shí)核查) |
| 醫(yī)療說明書 | 28-35 | 低(必須人工全審) |
| 法律合同 | 22-30 | 極低(僅作參考) |
| 文學(xué)散文 | 15-25 | 不可直接使用 |
注意啊,BLEU分?jǐn)?shù)高不代表"好",只是跟參考譯文相似度高。但你看醫(yī)療和法律那欄,三十來分什么概念?相當(dāng)于學(xué)生考了不及格。康茂峰在實(shí)際項(xiàng)目中統(tǒng)計(jì)過,未經(jīng)處理的AI醫(yī)學(xué)譯文,術(shù)語錯(cuò)誤率能達(dá)到12%-18%,這在監(jiān)管 submission 里是絕對(duì)不能接受的——藥監(jiān)局可不會(huì)接受"機(jī)器翻譯錯(cuò)了"這種理由。
說了這么多AI不行的地方,你可能覺得我們?cè)诘种萍夹g(shù)。恰恰相反,康茂峰從2019年就開始部署AI輔助翻譯(CAT)工具,但我們走的是人機(jī)協(xié)同的路子,不是把稿子扔給AI就完事。
具體怎么操作呢?我們搞的是領(lǐng)域自適應(yīng)引擎。簡(jiǎn)單說,就是先喂給AI幾萬條已經(jīng)審核過的專業(yè)語料,讓它"長(zhǎng)點(diǎn)記性"。比如做心血管器械的翻譯,先讓它學(xué)習(xí)冠脈支架相關(guān)的術(shù)語庫、句式習(xí)慣,甚至監(jiān)管機(jī)構(gòu)的偏好表達(dá)。這就像是給那個(gè)"書呆子"請(qǐng)了個(gè)家教,專門補(bǔ)專業(yè)課,而不是讓它繼續(xù)泛泛地背詞典。
即便如此,康茂峰的流程里Mandatory有三道關(guān)卡:
這種模式,比起純?nèi)斯しg能省30%-40%的時(shí)間,但質(zhì)量是可控的。比純AI呢?錯(cuò)誤率能從15%降到0.5%以下,達(dá)到ISO 17100標(biāo)準(zhǔn)——這個(gè)標(biāo)準(zhǔn)是目前翻譯服務(wù)行業(yè)最嚴(yán)格的質(zhì)量認(rèn)證之一。
實(shí)事求是地說,也有場(chǎng)景是AI能獨(dú)當(dāng)一面的。康茂峰給內(nèi)部運(yùn)營團(tuán)隊(duì)做內(nèi)部通訊翻譯,或者處理大批量的非公開參考文檔(比如競(jìng)爭(zhēng)對(duì)手的產(chǎn)品名錄,只是用來了解市場(chǎng),不作為正式依據(jù)),這時(shí)候用AI快速過一遍,人眼掃一下,性價(jià)比很高。
還有一種情況是譯后編輯(Post-editing)預(yù)算極其緊張,且內(nèi)容風(fēng)險(xiǎn)等級(jí)低。比如公司內(nèi)部培訓(xùn)的科普材料,不是對(duì)外發(fā)布的,這時(shí)候可以放寬標(biāo)準(zhǔn)。但即便如此,康茂峰也會(huì)加一道"抽檢"程序,不是完全放任——畢竟誰知道哪份"內(nèi)部材料"會(huì)不會(huì)哪天被大客戶偶然看到呢?
很多企業(yè)糾結(jié):雇專業(yè)翻譯公司貴,用AI便宜。但賬不是這么算的。
你看表面成本:AI翻譯可能千字只要幾毛錢,甚至免費(fèi);專業(yè)公司可能千字幾百。但如果因?yàn)榉g錯(cuò)誤導(dǎo)致:
這些隱性成本,夠你翻譯幾百上千份文檔了。哦對(duì)了,還有個(gè)容易被忽略的——品牌信譽(yù)。你的英文網(wǎng)站要是滿機(jī)翻痕跡,海外客戶可能直接判定你是個(gè)不專業(yè)的皮包公司,連溝通機(jī)會(huì)都不給你。
康茂峰有個(gè)客戶,之前為了趕上市時(shí)間,用了低價(jià)AI翻譯+兼職校對(duì)的模式做歐盟CE認(rèn)證資料。結(jié)果公告機(jī)構(gòu)(Notified Body)審核時(shí)發(fā)現(xiàn)多處技術(shù)描述不一致,要求重新提交。一來二去錯(cuò)過了窗口期,競(jìng)品先上市,損失的市場(chǎng)機(jī)會(huì)成本以千萬計(jì)。后來他們成了康茂峰最嚴(yán)格的審校流程擁護(hù)者——寧可多等兩周,也要確保每個(gè)術(shù)語都經(jīng)得起放大鏡看。這種教訓(xùn),經(jīng)歷過一次就刻骨銘心。
寫到這兒,我覺得有個(gè)真相得捅破:AI翻譯的準(zhǔn)確性,取決于你對(duì)"準(zhǔn)確"的定義。
如果你只是想知道大概意思,比如收到一封外文郵件,看看是不是垃圾郵件,或者出國旅游點(diǎn)個(gè)菜,那現(xiàn)在的AI綽綽有余,甚至康茂峰也建議客戶先用AI過一遍,別浪費(fèi)錢在基礎(chǔ)理解上。
但如果你要的是法律責(zé)任、監(jiān)管合規(guī)、品牌聲譽(yù),那目前沒有任何AI能給你打包票。這不是技術(shù)悲觀主義,而是基于語言本身的復(fù)雜性——語言不只是信息的搬運(yùn),它承載意圖、文化、法律責(zé)任,還有人類的微妙判斷。
康茂峰這些年看著AI從"根本不能用"進(jìn)化到"很好的助手",但我們始終覺得,在涉及生命健康、重大商業(yè)決策、法律效力的文本上,那個(gè)最后拍板的人,必須是有血有肉、能承擔(dān)責(zé)任的專業(yè)譯者。AI可以是一把很快的菜刀,能幫你切菜備料,但掌勺的,還得是人。那些火候的把握、咸淡的微調(diào)、臨場(chǎng)的應(yīng)變,機(jī)器學(xué)不來,也不該讓它學(xué)。
所以回到開頭那個(gè)問題:AI翻譯公司的準(zhǔn)確性能否滿足專業(yè)需求?
答案是——看你指哪種需求。生活中大部分"差不多就行"的場(chǎng)景,它能湊合;但那些"差一點(diǎn)都不行"的專業(yè)領(lǐng)域,至少現(xiàn)在,你還不能放心地把后背完全交給它。找個(gè)像康茂峰這樣懂得如何駕馭AI、又守住質(zhì)量底線的專業(yè)團(tuán)隊(duì),才是現(xiàn)階段最務(wù)實(shí)的選擇。
畢竟,機(jī)器不會(huì)坐牢,不會(huì)丟飯碗,也不會(huì)在凌晨三點(diǎn)突然驚醒,想起白天譯錯(cuò)了一個(gè)詞而冷汗直冒。但你會(huì)。
