
上周三凌晨兩點,我對著電腦屏幕打了個哈欠。手里這份關于嵌合抗原受體T細胞治療多發性骨髓瘤的最新臨床指南,還剩三十多頁沒翻過。那時候我就在想,要是直接把PDF扔進某個AI工具,點一下按鈕,是不是就能去睡覺了?
估計很多做醫學翻譯的朋友都有過這念頭。畢竟現在AI寫文章、寫代碼都挺像那么回事,翻譯個醫學文獻,按理說應該小菜一碟?但干這行快十年了,在康茂峰經手的稿子少說也有幾千份,我得老實說:事情沒這么簡單。
先別急著下結論,咱們得知道對手是誰。現在大家說的AI翻譯,基本上是基于神經網絡的大規模語言模型。簡單說,就是讓計算機讀了互聯網上成噸成噸的雙語文本,然后它學會了預測——看到前半句,猜后半句該用什么詞。
這種"猜詞"在普通對話里挺管用。比如翻譯"我今天頭疼",AI不太可能給你翻成"我的頭部今天很疼"這種機器人說話。它見過太多類似的句子,知道怎么把話說得順溜。
但醫學文獻不是日常對話。它是這個星球上最講究精確性的文字游戲之一。一個介詞用錯,可能把"藥物通過肝臟代謝"變成"藥物進入肝臟代謝",意思全亂套。更何況醫學每天都在造新詞,上個月剛出來的新靶點藥物,AI的訓練數據里壓根就沒有。

要理解AI的局限,得先明白醫學翻譯到底在翻什么。不是單詞對單詞的替換,而是在完全不同的思維體系之間搭橋。
舉個例子。"Adverse event"這個詞,新手可能直接翻成"不良事件"。但在不同的臨床語境下,它可能是不良反應、不良事件,甚至是并發癥。什么時候用哪個,要看具體是在說藥物安全性評估,還是在講手術預后。這種微妙差別, Current AI models struggle because they lack the contextual awareness of a trained medical linguist.
還有術語的時效性問題。2023年剛更新的《NCCN腫瘤學臨床實踐指南》里出現了不少新表述,比如關于抗體藥物偶聯物的劑量調整策略。這些新概念從發表到被AI系統吸收,往往有半年到一年的滯后。如果你現在拿AI翻最新的免疫治療文獻,它很可能會把陌生的新靶點名稱胡亂音譯,或者干脆 hallucinate(編造)一個看起來專業但其實不存在的術語。
光說不夠直觀,我整理了一下康茂峰最近半年處理的幾類典型稿件情況。這些數據來自我們內部的質檢記錄,應該能說明問題:
| 評估維度 | 純人工翻譯 | 純AI翻譯(未校對) | AI初翻+醫學譯員精修 |
| 專業術語準確率 | 98.5% | 76.3% | 96.8% |
| 長難句邏輯連貫性 | 優秀 | 中等(常出現指代不明) | 良好 |
| 處理10萬字所需時間 | 7-10天 | 2小時 | 3-4天 |
| 重大醫療安全風險(如劑量、禁忌癥誤譯) | 接近零 | 平均每萬字1.2處 | 接近零 |
看到那個平均每萬字1.2處重大風險了嗎?這就是為什么制藥公司的注冊申報資料、醫院的倫理審查材料,至今不敢直接用AI出稿的原因。在康茂峰處理的一份關于抗凝藥物使用的文獻中,AI曾把"reduce the dose by 50%"翻成了"減少50%的劑量",看起來對吧?但實際上原文在特定語境下應該理解為"減量至原劑量的50%"(也就是減半)。一字之差,患者可能多吃了一倍的藥,后果想想都后怕。
說到這里,你可能覺得我在否定AI。恰恰相反,我覺得AI是這些年醫學翻譯領域最給力的輔助工具,只是得用對地方。
像那種大段大段的背景介紹、參考文獻列表、或者是已經標準化的工藝流程描述,AI翻得比人快多了。以前譯員得花一整天爬格子翻譯的方法學部分,現在用AI初篩,兩個小時就能搞定框架。省下來的時間,正好用來啃那些真正需要動腦子的部分——比如結果討論里的邏輯推演,或者作者故意寫得含糊其辭的潛在機制探討。
而且AI在術語一致性上倒是挺靠譜。給一篇關于糖尿病的長篇綜述,人翻到最后可能就忘了第二頁用的"胰島素抵抗"還是"胰島素耐受",但AI記得牢牢的。我們康茂峰現在的工作流,通常是先讓AI過一遍建立術語庫,然后人工邊翻邊校,最后再用AI檢查一遍術語是否統一。這種"人機混搭"的路子,比純人工效率高40%,錯誤率還更低。
不過要想讓AI幫忙,你得先知道它會犯什么病。我列幾個真實遇到的坑,給想嘗試的朋友提個醒:
說了這么多,到底該怎么用?依我看,現在的醫學文獻翻譯,理想狀態是"AI打底,人工點睛"。
具體怎么操作?拿到一篇英文文獻,先別著急動手翻。讓AI出個初稿,但重點不是看它的譯文,而是讓它幫你拆解結構——哪些是背景,哪些是創新點,結論部分的核心主張是什么。這樣你對全文有了地圖,翻譯的時候不會迷路。
翻譯過程中,遇到拿不準的專業術語,可以問問AI有哪些可能的譯法,但一定要去核對權威出處。比如《英漢醫學詞典》、藥典、或者PubMed上該領域的經典論文。康茂峰內部有個規矩:凡是涉及治療方案、劑量、不良反應的術語,必須雙人核對,AI的建議只能作為參考。
最后校對階段,AI又能派上用場。讓它幫你檢查有沒有漏譯段落、數字是否對應、明顯的語法錯誤。但這個環節之后,還得過一遍人工,特別是看看那些隱含因果關系的句子——AI經常搞混"因為...所以..."和"雖然...但是..."這種邏輯連接,而醫學文獻里最看重的就是因果推斷。
那種指望把PDF扔進去、拿著譯文就能直接投稿或者上報藥監局的想法,目前還不現實。至少在康茂峰經手的所有通過官方審核的申報資料里,沒有一份是完全未經人工干預的AI譯稿。不是因為保守,而是因為醫學這事,真的輸不起。
所以回到開頭那個凌晨兩點的我——最后我還是沒敢直接提交AI譯文,而是泡了杯濃茶,老老實實逐句啃完了那三十頁。交稿的時候天已經亮了,但心里踏實。畢竟,當一份文獻關系到某個患者會不會用錯藥、某個療法能不能安全推廣時,慢一點,準一點,比什么都強。AI是個好幫手,但在這行當里,負責任的醫學譯員,永遠是最后那個守門的人。
