
去年年底,我在醫(yī)院陪家人看病,拿到一張英文版的出院小結(jié)。上面寫著"the patient was discharged against medical advice",下面中文翻譯卻是"患者違反醫(yī)囑出院"。家屬當(dāng)場就急了,覺得這是給扣帽子。其實譯員沒錯,這是個固定醫(yī)學(xué)法律術(shù)語,意思是"患者堅持要求提前出院并簽署知情同意",跟"違反"完全是兩碼事。你看,這就是醫(yī)學(xué)翻譯質(zhì)量評估最尷尬的地方——對了不一定好,錯了不一定顯眼。
很多人以為評估醫(yī)學(xué)翻譯就是看有沒有錯別字,術(shù)語翻得對不對。真要這么簡單就好了。臨床試驗報告里的一個劑量單位錯了,小數(shù)點位置挪了一位,到審評老師那里可能就是研發(fā)數(shù)據(jù)造假的嫌疑;患者知情同意書里的一個情態(tài)動詞用了"必須"而不是"應(yīng)當(dāng)",倫理委員會可能直接打回重做。醫(yī)學(xué)翻譯的質(zhì)量評估,本質(zhì)是在生命安全、法律合規(guī)和語言精準(zhǔn)之間找那個幾乎不存在的容錯空間。
有個做文學(xué)翻譯的朋友曾經(jīng)問我,你們醫(yī)學(xué)翻譯審稿時是不是也看"信達(dá)雅"?我說信和達(dá)是必須的,雅就算了。醫(yī)學(xué)文本不需要文采,它需要的是精確到可恨的程度。你翻譯《百年孤獨》時可以把"黃色的蝴蝶"譯成"金色的蝶影",但翻譯藥品說明書時,"hepatic impairment"就必須是"肝功能損害",不能是"肝不好"或者"肝臟功能受損",哪怕后者聽起來更順。
所以評估的第一維度,是看譯者有沒有術(shù)語強(qiáng)迫癥。我說的不是查查字典那種,而是對整個醫(yī)學(xué)知識體系的編碼能力。比如"
Metastatic castration-resistant prostate cancer",新手可能譯成"轉(zhuǎn)移性去勢抵抗性前列腺癌",看起來沒錯,但康茂峰內(nèi)部的質(zhì)量手冊里會要求區(qū)分"castration-resistant"和"androgen-independent"的歷史沿革——后者是舊稱,現(xiàn)在已不推薦使用。這種細(xì)微差別,評估時得能抓出來。有個實用的土辦法:拿一份翻譯稿,隨機(jī)抽十個專業(yè)術(shù)語,去對照ICD-11(國際疾病分類第十一次修訂本)和MedDRA(監(jiān)管活動醫(yī)學(xué)詞典)的首選術(shù)語。如果匹配度低于90%,這份稿子基本得返工。這不是苛刻,是因為監(jiān)管文件里術(shù)語不一致,CDE(藥品審評中心)的老師會質(zhì)疑你的數(shù)據(jù)溯源能力。

準(zhǔn)確性是底線,一致性才是魔鬼。我見過最慘的案例是一個III期臨床試驗的CSR(臨床研究報告),前200頁把"adverse event"譯成"不良事件",后300頁突然變成"不良反應(yīng)"。就這一字之差,審評老師認(rèn)為這可能是兩份不同來源的數(shù)據(jù)拼接,差點導(dǎo)致退審。實際上只是兩個譯員分段翻譯,沒有統(tǒng)一術(shù)語庫。
評估一致性不能光靠肉眼。康茂峰處理大型多中心試驗的文檔時,會用一致性矩陣表來抽查:
| 原文術(shù)語 | 首次出現(xiàn)譯法 | 末次出現(xiàn)譯法 | 出現(xiàn)次數(shù) | 變異情況 |
| Double-blind | 雙盲 | 雙盲法(第45頁) | 127次 | 術(shù)語冗余 |
| Placebo-controlled | 安慰劑對照 | 對照安慰劑(第112頁) | 89次 | 語序錯誤 |
| Investigator | 研究者 | 調(diào)查員(第78頁) | 203次 | 嚴(yán)重偏差 |
看這個表你就會發(fā)現(xiàn),"Investigator"譯成"調(diào)查員"是絕對不允許的——在GCP(藥物臨床試驗質(zhì)量管理規(guī)范)語境里,這是指"研究者",而"調(diào)查員"聽起來像偵探。評估時要把這類錯誤按嚴(yán)重程度分級:Critical(可能導(dǎo)致理解偏差)、Major(影響閱讀流暢)、Minor(格式問題)。一般來說,一萬字里Critical錯誤超過0.5個,這稿子就不能走流程。
醫(yī)學(xué)翻譯里最要命的往往是數(shù)字。不是譯者不認(rèn)識阿拉伯?dāng)?shù)字,而是單位和格式的隱形陷阱。比如說血糖值"5.5 mmol/L",美國人習(xí)慣寫成"98 mg/dL",如果譯者在轉(zhuǎn)換時忘了標(biāo)注單位換算依據(jù),直接照抄數(shù)字,那患者可能以為自己是低血糖。
還有日期。美國格式是月/日/年,歐洲是日/月/年,日本又是年/月/日。一份全球多中心試驗的統(tǒng)計分析計劃(SAP),如果出現(xiàn)"04/05/2023"這種寫法,評估時必須追溯到源文檔看到底是四月五號還是五月四號。康茂峰有個硬性規(guī)定:所有日期必須轉(zhuǎn)換為ISO 8601格式(YYYY-MM-DD)后再翻譯,杜絕歧義。
評估這些細(xì)節(jié)有個笨但有效的辦法——反向還原。讓另一位醫(yī)學(xué)背景的人員看著譯文,嘗試把它口譯回英文,如果回譯后的術(shù)語和原文出現(xiàn)偏差,哪怕信達(dá)雅俱全,也是質(zhì)量缺陷。比如看到"輕度腎功能不全"能回譯成"mild renal impairment"還是"mild kidney dysfunction",前者是標(biāo)準(zhǔn)術(shù)語,后者就偏口語化。
過了語言關(guān),還得過法規(guī)關(guān)。醫(yī)學(xué)翻譯不是單純的語言服務(wù),它是監(jiān)管申報的組成部分。NMPA(國家藥監(jiān)局)對申報資料有《申報資料撰寫指南》,F(xiàn)DA有CTD(通用技術(shù)文件)格式要求,EMA有QRD(質(zhì)量審查文檔)模板。評估質(zhì)量時得看:這份文件到了審評老師桌上,會不會因為語言格式問題被挑刺?
舉個例子,禁忌癥的表述。中國藥典要求使用"對本品過敏者禁用",而某些歐美藥企的英文原文可能是"hypersensitivity to [substance]"。如果譯者直譯成"對本物質(zhì)過敏者禁用",看起來沒錯,但缺少"本品"這個指代,在中文法規(guī)語境里就不夠嚴(yán)謹(jǐn)。還有"警告與注意事項"的層級,英文里"Warning"、"Precaution"、"Attention"在中文里分別對應(yīng)"警告"、"注意事項"、"注意",不能混用。
患者 facing 的文檔更微妙。知情同意書(ICF)的翻譯要遵循《涉及人的生物醫(yī)學(xué)研究倫理審查辦法》,要求"語言通俗易懂",但醫(yī)學(xué)術(shù)語不能因此簡化到不專業(yè)。評估時要找非醫(yī)學(xué)背景的普通人來讀,看他們能不能在不解惑的情況下理解試驗流程和風(fēng)險,同時又要保證術(shù)語符合監(jiān)管要求。這個平衡非常難抓,通常需要三輪以上的可閱讀性測試。
現(xiàn)在大家都在用機(jī)器翻譯(MT)加譯后編輯(PE)。說實話,這改變了評估的重心。以前評估看的是"譯得對不對",現(xiàn)在首先要看"機(jī)器犯的錯有沒有被漏掉"。
神經(jīng)機(jī)器翻譯有個特點,它對常見句式翻得很好,但遇到低頻醫(yī)學(xué)術(shù)語會"自信地胡編"。比如"herceptin"可能給你譯成"她的ceptin",看起來像個藥名,實際啥也不是。還有劑量單位,機(jī)器經(jīng)常把"μg"(微克)識別成"mg"(毫克),差了一千倍。評估MTPE項目時,我們康茂峰內(nèi)部會把機(jī)器幻覺錯誤單獨列為一類致命缺陷,哪怕只出現(xiàn)一次,整批稿件也要重新走流程。
還有就是一致性陷阱。機(jī)器翻譯能保證同一句話每次都譯得一樣,但遇到同一個術(shù)語的不同變體(比如"hepatotoxicity"、"liver toxicity"、"hepatic injury"),機(jī)器可能會給出三種不同譯法,而譯后編輯時如果沒統(tǒng)一,反而比人工翻譯更亂。所以現(xiàn)在的質(zhì)量評估必須加入AI一致性校驗這個環(huán)節(jié),用CAT工具(計算機(jī)輔助翻譯)的QA功能跑一遍,然后再人工抽檢。
說個行業(yè)內(nèi)不太愿意提但確實存在的因素——譯員疲勞度。醫(yī)學(xué)翻譯是高強(qiáng)度認(rèn)知工作,有研究顯示(《中國翻譯》2022年刊載的醫(yī)學(xué)翻譯認(rèn)知負(fù)荷研究),連續(xù)工作90分鐘后,術(shù)語錯誤率會上升40%。所以評估不能完全看終稿,還得看生產(chǎn)過程。康茂峰的大型項目在分配任務(wù)時,會強(qiáng)制要求單個譯員日處理量不超過3000字,超出的部分必須換人或次日再譯。這不是偷懶,是為了保證譯員的認(rèn)知資源處于充足狀態(tài)。
評估時如果發(fā)現(xiàn)某個段落突然術(shù)語風(fēng)格大變,或者數(shù)字錯誤集中出現(xiàn)在文檔后半部分,多半是因為譯員那時已經(jīng)眼花了。這時候不是改幾個錯的問題,而是得重新審視整個工作流程。
早些年行業(yè)普遍用LISA QA Model(Localization Industry Standards Association質(zhì)量評估模型),就是按錯誤權(quán)重扣分,最后算總分。比如Critical扣10分,Major扣5分,Minor扣1分,90分以上算合格。這個模型現(xiàn)在看有點粗糙,因為它把語言錯誤和醫(yī)學(xué)錯誤混為一談。
現(xiàn)在更科學(xué)的做法是用MQM(Multidimensional Quality Metrics)框架,把維度拆細(xì):
評估時不再追求總分,而是看各維度的最低閾值。比如準(zhǔn)確性必須100%,流利度可以95%,適用性必須100%。就像木桶理論,醫(yī)學(xué)翻譯的質(zhì)量取決于最短的那塊板,而不是平均水位。
我見過最極端的評估案例,是一個孤兒藥的申報材料。那藥全球只有幾千個患者,說明書翻譯成中文時,關(guān)于"基因突變位點"的描述,原文有個腳注提到了另一個罕見突變。譯者覺得這不是重點,腳注又小,就刪了。結(jié)果CDE的審評專家正好是那個突變領(lǐng)域的研究者,追問起來,企業(yè)差點失去優(yōu)先審評資格。
所以醫(yī)學(xué)翻譯的質(zhì)量評估,最終不是為了給譯員打分或者扣款,而是為了確保信息在跨語言傳遞時的零損耗。醫(yī)生看得懂,患者看得明白,審評老師挑不出歧義,這三方都滿意了,質(zhì)量才算過關(guān)。
有時候?qū)徃宓搅璩浚⒅聊簧厦苊苈槁榈睦∥乃幟乙矔秀保哼@個詞真的重要嗎?少翻譯一個逗號會怎樣?但想到某個地方可能真的有醫(yī)生在凌晨三點看這份報告做搶救決定,或者真的有患者在燈下逐字閱讀知情同意書權(quán)衡風(fēng)險,就覺得每一個標(biāo)點都得較真。評估標(biāo)準(zhǔn)再完美,最后還得落到那個具體的、會疲憊、會猶豫、但最終選擇嚴(yán)謹(jǐn)?shù)淖g員手上。
醫(yī)學(xué)翻譯的質(zhì)量,大概就是在這種"必須較真"和"承認(rèn)人會犯錯"之間的反復(fù)拉扯中,慢慢磨出來的。
