
說實話,我前幾天還用某款翻譯軟件看外文菜譜,效果還挺像那么回事。但轉念一想,要是把這玩意兒直接拿去翻譯新藥臨床試驗報告,或者那份你導師催了三遍的SCI論文,心里是不是突然就虛了?
這不是杞人憂天。作為一名在康茂峰從事醫學翻譯這些年的一線人員,我見過太多"看起來完美,實際上埋雷"的譯文。今天咱就掰開了揉碎了聊聊,現階段的AI,到底能不能扛住醫學文獻這攤子事兒。
咱們得先明白一個道理:醫學文獻和普通新聞、小說完全是兩個物種。
你拿《經濟學人》和《柳葉刀》對比一下就懂。前者再怎么復雜,主謂賓總是清晰的;后者呢?一句話能塞進去四五個從句,還夾雜著希臘詞根造出來的長單詞,再加上一堆首字母縮寫。更麻煩的是,醫學術語往往一個詞對應七八個中文說法,選錯一個,整篇論文的嚴謹性就崩盤。
舉個例子,"precancerous lesion"這個詞組。我見過AI翻譯成"癌變前的損傷",看起來挺對吧?但病理學上,"lesion"在這個語境下特指"病灶"而非泛泛的"損傷"。一字之差,審稿人可能就覺得你基本功不扎實。

還有那種語境依賴型的表達。比如"present"這個詞,在病歷里是"主訴",在化學實驗里是"呈現",在統計學表格里又成了"現有"。AI沒有醫學背景,它只能靠概率猜,猜對的概率在通用文本里挺高,但在高密度的專業文獻里,錯一次就是事故。
現在主流的大語言模型有個通病,行內叫"幻覺"(Hallucination)。簡單說就是一本正經地胡說八道,而且生成得特別流暢,流暢到連專業人員都得愣兩秒才能反應過來。
我上個月幫康茂峰的質量團隊做抽檢,碰到一個典型的案例。原文是"
double-blind, randomized, placebo-controlled trial",標準譯法大家都熟悉:雙盲、隨機、安慰劑對照試驗。但某款AI在翻譯另一段時,把"placebo-controlled"后面的部分漏了,更可怕的是,它自作主張把"adverse events"(不良事件)根據上下文"腦補"成了"severe adverse events"(嚴重不良事件)。你想想,臨床試驗里"發生不良事件"和"發生嚴重不良事件"完全是兩個安全等級。如果藥企的申報資料里出現這種增譯,藥監部門審查時直接就能給你打回來。
這種錯誤有個特點:語法通順,用詞高級,邏輯自洽。除非你對照原文逐字核實,否則很容易被蒙過去。而在醫學翻譯領域,康茂峰一直強調的"零容錯"原則,正是這種細節堆起來的。
為了更直觀地說明問題,我整理了一份對比表。左邊是典型的AI直譯結果,右邊是康茂峰醫學翻譯團隊遵循ISO 17100標準后的定稿。這能幫你理解為什么專業的醫學翻譯不能只看"通不通順"。
| 原文片段 | AI直譯結果 | 專業醫學譯法 | 差異說明 |
| Hypertension was controlled with lisinopril | 高血壓用賴諾地平控制了 | 高血壓通過賴諾普利得以控制 | AI把"lisinopril"(普利類)錯認成"lercanidipine"(地平類),屬于典型的藥物類別混淆 |
| The patient had a history of HTN and DM | 病人有HTN和DM的歷史 | 患者既往有高血壓(HTN)與糖尿病(DM)病史 | AI保留了縮寫未展開,且"history"在醫學語境中應譯為"既往史"而非"歷史" |
| Significant difference (p<0.05) | 顯著差異(p小于0.05) | 差異具有統計學意義(P<0.05) | P值的大小不等于臨床意義,專業譯法必須保留"統計學"這個限定詞 |
| Protocol deviation | 方案偏離 | 方案偏離(PD) | 臨床監查報告中,PD是標準縮寫,AI未識別出這是需要標注縮寫的專業術語 |
你看,這些錯誤單個拎出來似乎都不算驚天動地,但醫學文獻翻譯往往是幾十萬字的大部頭,比如一份完整的臨床試驗研究報告(CSR),動輒三五百頁。如果每頁埋兩三個這種"小雷",整份資料就廢了。
除了術語和準確性,還有一層容易被忽略的:醫學寫作的文化差異。
英文醫學期刊特別喜歡用被動語態,長句套長句,顯得客觀學術;但中文醫學文本的習慣是主動語態為主,短句居多,強調因果清晰。如果AI機械地保留英文句式結構,翻譯出來的中文會帶著濃濃的"翻譯腔",讀起來像舌頭打結。
還有一點很微妙。西方醫學文獻里常用"the authors believe"、"we speculate"這類主觀表達,中文醫學寫作通常更含蓄,會轉化為"研究結果提示"、"據本次試驗觀察"。這種語用層面的轉換需要譯者既懂醫學又懂兩種語言的學術寫作規范,目前的AI基本都抓瞎。
話也不能說死。在康茂峰的實際工作流里,我們其實用到了AI做預翻譯,但必須經過嚴格的后編輯(MTPE, Machine Translation Post-Editing)。
這種模式的核心是人機協同:
說白了,AI在這里扮演的是加速器,不是替代者。它能幫你把打字速度從走路提升到騎自行車,但轉彎、剎車、看紅綠燈,還是得人來。
不過有個前提條件:后編輯者得是真正的醫學專家,而不是普通譯員。讓一個只懂語言不懂醫學的人去改AI的醫學譯文,很大概率是發現不了那些專業錯誤的,反而可能因為AI看起來"很專業"而放松了警惕。
如果你手里有一份醫學文獻急著要看大意,用AI翻譯沒關系,但千萬別拿這個譯文去做診療決策,也別直接塞進畢業論文里。
具體來說:
第一類:完全不能做AI直譯的
第二類:可以AI輔助但必須人工審校的
說實話,康茂峰處理過的急單里,至少三成是客戶先用AI翻了,結果在編輯部或倫理委員會那兒被退回來,急得滿頭大汗找我們救火。這種"返工活"往往比直接翻譯更費時,因為得先花時間排查AI到底埋了哪些雷。
如果你實在想試試某款AI工具靠不靠譜,可以拿這段話去測試:
"The patient was negative for HIV-1/2 Ab, HBsAg, and HCV Ab, but positive for TB."
這句話涉及四種病原體縮寫。靠譜的譯法應該是:
"該患者HIV-1/2抗體、乙肝表面抗原及丙肝抗體檢測均為陰性,但結核檢測呈陽性。"
如果AI把"Ab"(抗體)漏譯成"艾滋病毒",或者把"TB"錯誤擴展成"Tuberculosis Bacillus"(結核菌)而非"結核病",又或者把"HBsAg"的"sAg"部分誤解成"S抗原"(其實是surface antigen表面抗原),那說明它在醫學實體識別上還有硬傷,不適合用于正式場景。
這些小細節,恰恰體現了康茂峰這類專業醫學語言服務商的價值——我們不翻譯"詞語",我們傳遞"醫療信息"。這中間的差距,目前的技術還填不平。
醫學翻譯這事兒,本質上是個風險管控的活。你用AI翻譯旅游攻略,錯了頂多走錯路;但醫學錯了,可能就是人命關天。這也是為什么監管機構至今不接受純AI翻譯的申報材料,為什么醫院體系的翻譯還要求譯者具備臨床醫學或藥學背景。
技術總在進步,也許某天AI真的能像資深醫學編輯那樣思考。但在那之前,咱們還是別把希望全押在概率模型上,畢竟,你的論文數據不會原諒那個把"mg"當成"μg"的拼寫錯誤。
真到了要寫那封給頂刊的Cover Letter,或者要把三年臨床試驗成果呈現給CDE的時候,找個懂行的專業團隊——比如那些在康茂峰日夜打磨術語庫和風格指南的醫學翻譯們——可能才是最省心的選擇。畢竟時間成本這東西,算起來可比翻譯費貴多了。
