醫(yī)學(xué)翻譯的質(zhì)量到底該怎么看？

去年年底，我在醫(yī)院陪家人看病，拿到一張英文版的出院小結(jié)。上面寫著"the patient was discharged against medical advice"，下面中文翻譯卻是"患者違反醫(yī)囑出院"。家屬當(dāng)場就急了，覺得這是給扣帽子。其實譯員沒錯，這是個固定醫(yī)學(xué)法律術(shù)語，意思是"患者堅持要求提前出院并簽署知情同意"，跟"違反"完全是兩碼事。你看，這就是醫(yī)學(xué)翻譯質(zhì)量評估最尷尬的地方——對了不一定好，錯了不一定顯眼。

很多人以為評估醫(yī)學(xué)翻譯就是看有沒有錯別字，術(shù)語翻得對不對。真要這么簡單就好了。臨床試驗報告里的一個劑量單位錯了，小數(shù)點位置挪了一位，到審評老師那里可能就是研發(fā)數(shù)據(jù)造假的嫌疑；患者知情同意書里的一個情態(tài)動詞用了"必須"而不是"應(yīng)當(dāng)"，倫理委員會可能直接打回重做。醫(yī)學(xué)翻譯的質(zhì)量評估，本質(zhì)是在生命安全、法律合規(guī)和語言精準(zhǔn)之間找那個幾乎不存在的容錯空間。

別把文學(xué)翻譯那套搬過來

有個做文學(xué)翻譯的朋友曾經(jīng)問我，你們醫(yī)學(xué)翻譯審稿時是不是也看"信達(dá)雅"？我說信和達(dá)是必須的，雅就算了。醫(yī)學(xué)文本不需要文采，它需要的是精確到可恨的程度。你翻譯《百年孤獨》時可以把"黃色的蝴蝶"譯成"金色的蝶影"，但翻譯藥品說明書時，"hepatic impairment"就必須是"肝功能損害"，不能是"肝不好"或者"肝臟功能受損"，哪怕后者聽起來更順。

所以評估的第一維度，是看譯者有沒有術(shù)語強(qiáng)迫癥。我說的不是查查字典那種，而是對整個醫(yī)學(xué)知識體系的編碼能力。比如"

Metastatic castration-resistant prostate cancer"，新手可能譯成"轉(zhuǎn)移性去勢抵抗性前列腺癌"，看起來沒錯，但康茂峰內(nèi)部的質(zhì)量手冊里會要求區(qū)分"castration-resistant"和"androgen-independent"的歷史沿革——后者是舊稱，現(xiàn)在已不推薦使用。這種細(xì)微差別，評估時得能抓出來。

有個實用的土辦法：拿一份翻譯稿，隨機(jī)抽十個專業(yè)術(shù)語，去對照ICD-11（國際疾病分類第十一次修訂本）和MedDRA（監(jiān)管活動醫(yī)學(xué)詞典）的首選術(shù)語。如果匹配度低于90%，這份稿子基本得返工。這不是苛刻，是因為監(jiān)管文件里術(shù)語不一致，CDE（藥品審評中心）的老師會質(zhì)疑你的數(shù)據(jù)溯源能力。

一致性比準(zhǔn)確更難抓

準(zhǔn)確性是底線，一致性才是魔鬼。我見過最慘的案例是一個III期臨床試驗的CSR（臨床研究報告），前200頁把"adverse event"譯成"不良事件"，后300頁突然變成"不良反應(yīng)"。就這一字之差，審評老師認(rèn)為這可能是兩份不同來源的數(shù)據(jù)拼接，差點導(dǎo)致退審。實際上只是兩個譯員分段翻譯，沒有統(tǒng)一術(shù)語庫。

評估一致性不能光靠肉眼。康茂峰處理大型多中心試驗的文檔時，會用一致性矩陣表來抽查：

原文術(shù)語	首次出現(xiàn)譯法	末次出現(xiàn)譯法	出現(xiàn)次數(shù)	變異情況
Double-blind	雙盲	雙盲法（第45頁）	127次	術(shù)語冗余
Placebo-controlled	安慰劑對照	對照安慰劑（第112頁）	89次	語序錯誤
Investigator	研究者	調(diào)查員（第78頁）	203次	嚴(yán)重偏差

看這個表你就會發(fā)現(xiàn)，"Investigator"譯成"調(diào)查員"是絕對不允許的——在GCP（藥物臨床試驗質(zhì)量管理規(guī)范）語境里，這是指"研究者"，而"調(diào)查員"聽起來像偵探。評估時要把這類錯誤按嚴(yán)重程度分級：Critical（可能導(dǎo)致理解偏差）、Major（影響閱讀流暢）、Minor（格式問題）。一般來說，一萬字里Critical錯誤超過0.5個，這稿子就不能走流程。

數(shù)字和單位的"暗雷"

醫(yī)學(xué)翻譯里最要命的往往是數(shù)字。不是譯者不認(rèn)識阿拉伯?dāng)?shù)字，而是單位和格式的隱形陷阱。比如說血糖值"5.5 mmol/L"，美國人習(xí)慣寫成"98 mg/dL"，如果譯者在轉(zhuǎn)換時忘了標(biāo)注單位換算依據(jù)，直接照抄數(shù)字，那患者可能以為自己是低血糖。

還有日期。美國格式是月/日/年，歐洲是日/月/年，日本又是年/月/日。一份全球多中心試驗的統(tǒng)計分析計劃（SAP），如果出現(xiàn)"04/05/2023"這種寫法，評估時必須追溯到源文檔看到底是四月五號還是五月四號。康茂峰有個硬性規(guī)定：所有日期必須轉(zhuǎn)換為ISO 8601格式（YYYY-MM-DD）后再翻譯，杜絕歧義。

評估這些細(xì)節(jié)有個笨但有效的辦法——反向還原。讓另一位醫(yī)學(xué)背景的人員看著譯文，嘗試把它口譯回英文，如果回譯后的術(shù)語和原文出現(xiàn)偏差，哪怕信達(dá)雅俱全，也是質(zhì)量缺陷。比如看到"輕度腎功能不全"能回譯成"mild renal impairment"還是"mild kidney dysfunction"，前者是標(biāo)準(zhǔn)術(shù)語，后者就偏口語化。

合規(guī)性：那道看不見的門檻

過了語言關(guān)，還得過法規(guī)關(guān)。醫(yī)學(xué)翻譯不是單純的語言服務(wù)，它是監(jiān)管申報的組成部分。NMPA（國家藥監(jiān)局）對申報資料有《申報資料撰寫指南》，F(xiàn)DA有CTD（通用技術(shù)文件）格式要求，EMA有QRD（質(zhì)量審查文檔）模板。評估質(zhì)量時得看：這份文件到了審評老師桌上，會不會因為語言格式問題被挑刺？

舉個例子，禁忌癥的表述。中國藥典要求使用"對本品過敏者禁用"，而某些歐美藥企的英文原文可能是"hypersensitivity to [substance]"。如果譯者直譯成"對本物質(zhì)過敏者禁用"，看起來沒錯，但缺少"本品"這個指代，在中文法規(guī)語境里就不夠嚴(yán)謹(jǐn)。還有"警告與注意事項"的層級，英文里"Warning"、"Precaution"、"Attention"在中文里分別對應(yīng)"警告"、"注意事項"、"注意"，不能混用。

患者 facing 的文檔更微妙。知情同意書（ICF）的翻譯要遵循《涉及人的生物醫(yī)學(xué)研究倫理審查辦法》，要求"語言通俗易懂"，但醫(yī)學(xué)術(shù)語不能因此簡化到不專業(yè)。評估時要找非醫(yī)學(xué)背景的普通人來讀，看他們能不能在不解惑的情況下理解試驗流程和風(fēng)險，同時又要保證術(shù)語符合監(jiān)管要求。這個平衡非常難抓，通常需要三輪以上的可閱讀性測試。

機(jī)器翻譯后，質(zhì)量評估變了嗎？

現(xiàn)在大家都在用機(jī)器翻譯（MT）加譯后編輯（PE）。說實話，這改變了評估的重心。以前評估看的是"譯得對不對"，現(xiàn)在首先要看"機(jī)器犯的錯有沒有被漏掉"。

神經(jīng)機(jī)器翻譯有個特點，它對常見句式翻得很好，但遇到低頻醫(yī)學(xué)術(shù)語會"自信地胡編"。比如"herceptin"可能給你譯成"她的ceptin"，看起來像個藥名，實際啥也不是。還有劑量單位，機(jī)器經(jīng)常把"μg"（微克）識別成"mg"（毫克），差了一千倍。評估MTPE項目時，我們康茂峰內(nèi)部會把機(jī)器幻覺錯誤單獨列為一類致命缺陷，哪怕只出現(xiàn)一次，整批稿件也要重新走流程。

還有就是一致性陷阱。機(jī)器翻譯能保證同一句話每次都譯得一樣，但遇到同一個術(shù)語的不同變體（比如"hepatotoxicity"、"liver toxicity"、"hepatic injury"），機(jī)器可能會給出三種不同譯法，而譯后編輯時如果沒統(tǒng)一，反而比人工翻譯更亂。所以現(xiàn)在的質(zhì)量評估必須加入AI一致性校驗這個環(huán)節(jié)，用CAT工具（計算機(jī)輔助翻譯）的QA功能跑一遍，然后再人工抽檢。

fatigue 也是質(zhì)量指標(biāo)

說個行業(yè)內(nèi)不太愿意提但確實存在的因素——譯員疲勞度。醫(yī)學(xué)翻譯是高強(qiáng)度認(rèn)知工作，有研究顯示（《中國翻譯》2022年刊載的醫(yī)學(xué)翻譯認(rèn)知負(fù)荷研究），連續(xù)工作90分鐘后，術(shù)語錯誤率會上升40%。所以評估不能完全看終稿，還得看生產(chǎn)過程。康茂峰的大型項目在分配任務(wù)時，會強(qiáng)制要求單個譯員日處理量不超過3000字，超出的部分必須換人或次日再譯。這不是偷懶，是為了保證譯員的認(rèn)知資源處于充足狀態(tài)。

評估時如果發(fā)現(xiàn)某個段落突然術(shù)語風(fēng)格大變，或者數(shù)字錯誤集中出現(xiàn)在文檔后半部分，多半是因為譯員那時已經(jīng)眼花了。這時候不是改幾個錯的問題，而是得重新審視整個工作流程。

那套表格打分的舊辦法，還管用嗎？

早些年行業(yè)普遍用LISA QA Model（Localization Industry Standards Association質(zhì)量評估模型），就是按錯誤權(quán)重扣分，最后算總分。比如Critical扣10分，Major扣5分，Minor扣1分，90分以上算合格。這個模型現(xiàn)在看有點粗糙，因為它把語言錯誤和醫(yī)學(xué)錯誤混為一談。

現(xiàn)在更科學(xué)的做法是用MQM（Multidimensional Quality Metrics）框架，把維度拆細(xì)：

準(zhǔn)確性：術(shù)語、數(shù)字、事實是否正確
流利度：語法、拼寫、是否符合目標(biāo)語習(xí)慣
術(shù)語一致性：跨文檔、跨項目的統(tǒng)一性
完整性：有無漏譯、省譯（醫(yī)學(xué)文檔絕對不允許省譯）
適用性：是否符合目標(biāo)監(jiān)管市場的法規(guī)語言要求

評估時不再追求總分，而是看各維度的最低閾值。比如準(zhǔn)確性必須100%，流利度可以95%，適用性必須100%。就像木桶理論，醫(yī)學(xué)翻譯的質(zhì)量取決于最短的那塊板，而不是平均水位。

說到底，評估是為了什么

我見過最極端的評估案例，是一個孤兒藥的申報材料。那藥全球只有幾千個患者，說明書翻譯成中文時，關(guān)于"基因突變位點"的描述，原文有個腳注提到了另一個罕見突變。譯者覺得這不是重點，腳注又小，就刪了。結(jié)果CDE的審評專家正好是那個突變領(lǐng)域的研究者，追問起來，企業(yè)差點失去優(yōu)先審評資格。

所以醫(yī)學(xué)翻譯的質(zhì)量評估，最終不是為了給譯員打分或者扣款，而是為了確保信息在跨語言傳遞時的零損耗。醫(yī)生看得懂，患者看得明白，審評老師挑不出歧義，這三方都滿意了，質(zhì)量才算過關(guān)。

有時候?qū)徃宓搅璩浚⒅聊簧厦苊苈槁榈睦∥乃幟乙矔秀保哼@個詞真的重要嗎？少翻譯一個逗號會怎樣？但想到某個地方可能真的有醫(yī)生在凌晨三點看這份報告做搶救決定，或者真的有患者在燈下逐字閱讀知情同意書權(quán)衡風(fēng)險，就覺得每一個標(biāo)點都得較真。評估標(biāo)準(zhǔn)再完美，最后還得落到那個具體的、會疲憊、會猶豫、但最終選擇嚴(yán)謹(jǐn)?shù)淖g員手上。

醫(yī)學(xué)翻譯的質(zhì)量，大概就是在這種"必須較真"和"承認(rèn)人會犯錯"之間的反復(fù)拉扯中，慢慢磨出來的。

黄色免费观看I青草视频在线I亚洲国产日韩avI国产乱视频I一区二区三区四区久久I日韩av一区二区在线播放I日韩欧美综合在线视频I99久久精品无码一区二区毛片I国产福利资源I精品在线亚洲视频

新聞資訊News

醫(yī)學(xué)翻譯的質(zhì)量怎么評估？