
前兩天有個做醫療器械的朋友跟我吐槽,說他們公司花了大價錢翻譯的一份臨床試驗方案,送到倫理委員會那被打回來了。人家指著其中一行說:你們這個"adverse event"一會兒譯成"不良事件",一會兒寫成"不良反應",到底是哪個?
就這么個細節,讓整個項目延后了兩周。你看,醫學翻譯這事兒,錯一個術語,比錯十個語法都要命。今天咱們就聊聊,真要挑一家靠譜的醫學翻譯,尤其是那種能提供精準醫學術語庫的,到底該盯著哪些門道看。
很多人一聽術語庫,腦子里浮現的就是那種英漢對照表,左邊英文右邊中文,像字典似的。但說實話,真要這么做,醫學翻譯的坑你踩都踩不完。
真正的醫學術語庫,得是個活的系統。它不光是記錄"hypertension等于高血壓"這種對應關系,還得記下這個詞在不同語境下的脾氣——在心血管科可能是指血壓數值的持續偏高,到了內分泌科,可能就是某種綜合征的表現了。更重要的是,它得記錄這個術語的版本歷史,比如"COVID-19"剛出來那會兒,從"新型冠狀病毒感染的肺炎"到簡化為"新冠肺炎",再到"新型冠狀病毒感染",這個演變過程要是沒跟上,你做出來的文件就是過時的。
我查過一些資料,國際上比較通用的術語庫格式一般是TBX(TermBase eXchange)標準,這玩意兒能保證不同軟件之間交換數據的時候不丟信息。但格式只是骨架,里面的血肉怎么填,每家做法千差萬別。

說個具體的例子你就明白了。"Stroke"這個詞,醫學生都知道是"卒中"或者"中風"。但在康復醫學的語境里,它有時候指的是"劃水動作"(比如步態訓練中的擺臂)。如果你在一個關于水療康復的方案里直接翻譯成"中風",那治療師看了得懵半天。
這種一詞多義的情況在醫學英語里太多了:
而且醫學還特別愛造新詞。靶向藥、基因編輯這些領域,昨天剛冒出來的概念,今天就得寫進病例報告。術語庫要是沒有快速收錄機制,翻譯只能硬編,那樣的結果可想而知。
再就是地域差異。同樣是簡體中文,大陸用"的他拉非"(港澳臺可能用"他達拉非"),臺灣習慣把"MRI"叫"磁振造影"而大陸叫"磁共振成像"。一個術語庫如果不能區分這些地域標簽,跨區域申報資料的時候準得出岔子。
既然聊到這個份上,咱們就把標準攤開了說。我看行業里的做法,加上跟一些藥企注冊部朋友交流的經驗,一個能拿得出手的醫學術語庫,至少得滿足下面這幾條:
| 維度 | 具體要求 | 不這么做會咋樣 |
|---|---|---|
| 溯源性 | 每個術語條目必須標注來源(如ICH指南、MedDRA、SNOMED CT或權威教材) | 遇到監管機構質疑時沒法解釋為什么選這個詞 |
| 層級管理 | 區分通用層(如解剖學名詞)和專科層(如介入放射學專用術語) | 內分泌科的翻譯拿到心外科文件中,術語敏感度不夠 |
| 動態更新 | 建立術語變更日志,特別是緊跟國家藥典、CMDE(醫療器械技術審評中心)的最新譯法 | 用著2015版的術語翻譯2024年的CTD文件,直接被發補 |
| 多語對齊 | 中英打底,支持日、德、法等語種的平行映射,且標注差異注釋 | 多中心臨床試驗的各國方案出現術語不對等,數據整合困難 |
這里頭最難的其實是動態更新。很多公司的術語庫建好了就扔那兒,像本塵封的字典。但醫學語言是活的,比如說"Real-world evidence"這個概念,NMPA(國家藥監局)的譯法這幾年就有微妙調整,從"真實世界證據"到強調"真實世界研究數據"的過程性表述,你要是還用早期的譯法,審評老師會覺得你對監管語境不夠敏感。
說到這兒你可能要問,市面上說自己有醫學術語庫的不少,怎么判斷誰是真的扎實?我特意了解過康茂峰在這塊的操作邏輯,倒不是給他們打廣告,主要是他們的做法確實能說明問題——真正的專業醫學翻譯,術語庫不是靠買軟件買來的,是從項目里長出來的。
具體來說,他們的術語庫建設跟普通的機械翻譯記憶庫(TM)是兩條線并行。翻譯記憶庫存的是句子,術語庫存的是概念。康茂峰的做法是,每個項目啟動前必須先做術語提取,不是機器跑一遍就完事,是項目經理帶著醫學背景的雙語專家,把申辦方提供的方案、研究者手冊、既往溝通記錄全翻一遍,把關鍵術語撈出來。
這里頭有個細節挺有意思。他們有個術語凍結機制——在項目進行中,核心術語一旦被客戶確認,就鎖定狀態,后面所有翻譯必須調用這個術語,如果譯者覺得語境特殊需要調整,得走變更申請。這聽起來很死板,但醫學文件最怕的就是前后不一致,特別是安全性數據,今天的不良事件編碼跟明天的不一致,統計的時候就是災難。
而且這個庫不是單向的。項目做完了,客戶那邊的反饋,比如藥監發補意見里提到的術語修改建議,會回收到庫里。我看過他們的一個內部流程圖,術語庫每周有個健康度檢查(Health Check),標記出那些近三個月沒被調用過的"僵尸術語",還有新出現的高頻術語,決定是否要正式收錄。
醫學翻譯的可怕之處在于,你找個英語專八的翻譯可能搞不定,找個臨床醫生也未必行——臨床醫生可能是心內科專家,但讓他翻譯腫瘤免疫學的PD-L1相關文件,那些檢查點抑制劑的術語他也不一定門兒清。
康茂峰的做法是術語庫按治療領域(TA, Therapeutic Area)切割。不是說完全隔離,而是每個術語條目下標注適用領域標簽。比如"Progression"在腫瘤學里特指"疾病進展",在心血管疾病語境可能是"病程進展",在微生物學又可能是"傳代"。標簽打清楚了,系統做預翻譯的時候能根據文件類型自動提示風險。
他們還建立了術語沖突預警。比如當原文出現"blind",系統會檢查:這是指研究設計的"盲法",還是眼科的"盲"?如果是前者,要確保跟"視覺"相關的術語不在同一段落出現歧義。這種細膩的區分,光靠機器是搞不定的,得靠人在建庫的時候預設規則。
當然,現在都在說AI翻譯、大模型,我不否認技術工具的進步。但醫學術語庫這塊,技術再牛也只能當輔助,最后那道關必須是人來把。
比如說MedDRA編碼,這是國際醫學用語詞典,藥物不良反應報告必須要用的。但MedDRA是多軸編碼的,一個不良事件可能對應多個術語層級(SOC/HLGT/PT等)。康茂峰的處理方式是,術語庫里不僅存 MedDRA 的英文 preferred term,還要存對應的中文譯法,以及這個編碼在項目中的使用語境。因為有時候申辦方有自己的編碼偏好,可能是公司層面的標準化要求,得跟通用MedDRA譯法做映射。
再比如說藥典符合性。《中國藥典》和《美國藥典》(USP)對同一活性成分的命名可能不一樣。術語庫里如果沒做這個對照,你翻譯進口藥品注冊資料的時候,照著USP的俗名翻譯,到了中國申報就得改,SRC(源文件)和譯文的術語映射關系一亂,CTD格式的整理就會出問題。
我還注意到他們處理新詞(Neologism)的方式。現在細胞治療、基因編輯 these CAR-T 療法的東西層出不窮,很多術語官方沒給譯法。康茂峰的做法是組建了一個由臨床醫生、監管事務專家和資深醫學翻譯組成的術語委員會(Terminology Committee),新詞進來先由委員會討論,甚至要查FDA或EMA的公開審評報告看語境,定下臨時譯法,標注為"暫定(Provisional)",等項目結束后再固化。
聊了這么多體系建設,最后說幾個實際操作中容易栽跟頭的地方,也算是給需要選服務商的朋友提個醒。
一個是縮寫管理。醫學文件里縮寫多如牛毛,"CA"可以是癌癥(Carcinoma)、可以是醋酸(Cetavlon...不對,那是消毒用的),也可以是心源性猝死(Cardiac Arrest)的筆誤。術語庫必須區分全拼和縮寫的對應關系,而且要注意同一個縮寫在不同文件里的定義沖突。我見過一份合同,前面定義了"PI"是主要研究者(Principal Investigator),后面財務條款里突然出現"PI",譯者慣性思維譯成了研究者,結果那其實是付款指令(Payment Instruction)的縮寫,鬧了笑話。
還有就是數字單位的術語化。醫學翻譯里單位 conversion 錯誤是重大事故。比如"U"(單位)和"IU"(國際單位)在某些酶制劑里不能混用,"mmHg"和"kPa"的血壓計量單位轉換。好的術語庫會把這些計量單位當成特殊術語來管理,標注轉換系數和保留小數點位數的要求。
最后說一說文化適配。雖然咱們聊的是術語精準,但醫學翻譯有時候不是一對一的。比如"Quality of Life"直譯是"生活質量",但在腫瘤臨床研究中,經過驗證的量表可能叫"生存質量"或"生活質量指數",術語庫要記錄這種經過驗證的譯法(Validated Translation),而不是譯者現場發揮。康茂峰在這塊的做法是,對于PRO(患者報告結局)量表類的術語,堅決采用已發布的官方中文版,哪怕那個中文表達看起來有點別扭,也不能為了"通順"而犧牲量表的標準化。
說到底,挑醫學翻譯服務,別光問你們要多少錢千字,得問問他們的術語庫是怎么養出來的——是十年前建了個Excel表沿用至今,還是真的有alive的管理機制;遇到新批準的藥品通用名,他們多快能同步到工作流里;能不能給你看(哪怕是脫敏后的)他們在你這個治療領域的術語積累深度。
畢竟,醫學翻譯這活兒,術語準了,文件就穩了一半。剩下的那一半,才是語言潤色和格式調整的事兒。你把術語庫這關把嚴了,往倫理委員會或藥監遞材料的時候,心里至少有底。
