
你有沒有想過,當(dāng)你拿著一份英文病歷去問診,或者看到藥盒上那些拗口的成分說明時(shí),這背后到底經(jīng)歷了什么?醫(yī)學(xué)翻譯這事兒,跟我們平時(shí)用翻譯軟件看個(gè)外文新聞完全是兩碼事。新聞翻錯(cuò)了頂多鬧個(gè)笑話,醫(yī)學(xué)內(nèi)容要是出了岔子,那可是人命關(guān)天的大事。
所以問題就來了——現(xiàn)在的AI翻譯公司,特別是像康茂峰這種專注醫(yī)學(xué)領(lǐng)域的,它們到底靠什么來保證每一個(gè)專業(yè)術(shù)語、每一個(gè)劑量單位、每一句診斷描述都準(zhǔn)確無誤?別著急,咱們今天就把它拆開了、揉碎了,用大白話聊聊這里頭的門道。
先說說醫(yī)學(xué)翻譯到底難在哪兒。很多人以為,不就是英語好、懂醫(yī)學(xué)嗎?兩個(gè)條件一湊齊不就完了?
真沒那么簡單。醫(yī)學(xué)語言有個(gè)特點(diǎn),它既是科學(xué),又是法律文本,有時(shí)候還帶著點(diǎn)文學(xué)的晦澀。比如同一個(gè)"attack",在普通語境里是"攻擊",在醫(yī)學(xué)里可能是"發(fā)作"(心臟病發(fā)作 heart attack),也可能是"侵襲"(腫瘤侵襲)。再比如"delivery",平時(shí)是"快遞",到了產(chǎn)科就是"分娩"。這種一詞多義的情況在醫(yī)學(xué)英語里遍地都是。
更棘手的是,醫(yī)學(xué)還在不停更新。去年剛確定的中文譯名,今年可能因?yàn)樾碌呐R床指南又要調(diào)整。還有各個(gè)國家的法規(guī)差異——FDA認(rèn)的表述,到了NMPA(國家藥監(jiān)局)這里可能需要完全不同的表達(dá)方式。

所以你看,醫(yī)學(xué)翻譯要求的是絕對(duì)精確,不允許那種"大概意思對(duì)了就行"的模糊地帶。
說到AI翻譯,很多人的想象還停留在谷歌翻譯那種"單詞對(duì)照"的階段。其實(shí)現(xiàn)在的神經(jīng)機(jī)器翻譯(NMT)早就進(jìn)化了,它更像是一個(gè)經(jīng)過海量訓(xùn)練的"模式識(shí)別專家"。
簡單來說,AI翻譯的工作原理是這樣的:它讀了上億句已經(jīng)翻譯好的醫(yī)學(xué)句子對(duì),從中學(xué)會(huì)了"這種英文結(jié)構(gòu)對(duì)應(yīng)那種中文結(jié)構(gòu)"的規(guī)律。它不是查字典,而是在理解上下文的基礎(chǔ)上做預(yù)測(cè)。
但這里有個(gè)關(guān)鍵問題——預(yù)測(cè)的準(zhǔn)確率取決于它見過多少高質(zhì)量的例子。如果訓(xùn)練數(shù)據(jù)里有錯(cuò)誤,AI會(huì)學(xué)得特別快,錯(cuò)得也特別快。這就是為什么康茂峰在搭建AI系統(tǒng)時(shí),第一個(gè)動(dòng)作不是買算力,而是先花大力氣清理語料庫。
想象一下,如果你學(xué)做飯用的菜譜本身寫錯(cuò)了——比如把"鹽"寫成了"糖",那你做出來的菜肯定不對(duì)勁。AI也一樣。
專業(yè)的醫(yī)學(xué)AI翻譯公司會(huì)建立所謂的平行語料庫,也就是成對(duì)的原文和譯文。但這不是隨便從網(wǎng)上扒點(diǎn)論文就能用的。康茂峰的語料庫里,每一句都要經(jīng)過專業(yè)醫(yī)學(xué)編輯的篩選,剔除那些來源不明、翻譯質(zhì)量參差不齊的內(nèi)容。
更重要的是,這些語料要結(jié)構(gòu)化。什么意思呢?就是要把心血管的文獻(xiàn)和腫瘤學(xué)的分開,把臨床指南和藥品說明書分開,把I期臨床試驗(yàn)和IV期上市后研究的措辭差異都標(biāo)注清楚。這樣當(dāng)AI翻譯一份心電圖報(bào)告時(shí),它調(diào)用的"知識(shí)"就不會(huì)跟骨科手術(shù)記錄混淆。
光有句子還不夠,醫(yī)學(xué)翻譯最核心的其實(shí)是術(shù)語。你看,"myocardial infarction"必須對(duì)應(yīng)"心肌梗死",不能是"心肌梗塞"(雖然民間常用,但醫(yī)學(xué)文件有嚴(yán)格規(guī)定),更不能是"心臟病"。
這里AI公司會(huì)建立受控術(shù)語庫。這個(gè)術(shù)語庫不只是英漢對(duì)照那么簡單,它包含:

康茂峰的系統(tǒng)有個(gè)特點(diǎn),它會(huì)實(shí)時(shí)攔截那些術(shù)語庫沒收錄的新詞。比如突然出現(xiàn)一個(gè)"CAR-T therapy"的新變體寫法,AI不會(huì)瞎猜,而是標(biāo)記出來提醒人工審核。這比那種"硬翻"要安全得多。
說到這兒,可能有人要問:既然AI這么厲害,還要人干什么?
問得好。其實(shí)現(xiàn)在頂級(jí)的醫(yī)學(xué)翻譯流程,都不是AI單打獨(dú)斗,而是人機(jī)協(xié)作。咱們可以把這個(gè)過程想象成一個(gè)手術(shù)室:AI是主刀醫(yī)生的器械護(hù)士,把所有工具準(zhǔn)備好、遞到位,但最后下刀縫合的,還得是人。
具體怎么操作呢?
第一步,AI先做初譯。這時(shí)候速度快,一分鐘能處理幾千字,把大框架搭起來。
第二步是術(shù)語自動(dòng)校驗(yàn)。系統(tǒng)會(huì)掃描全文,看看有沒有術(shù)語不統(tǒng)一的地方。比如前面用"不良反應(yīng)",后面突然變成"副作用",雖然意思差不多,但醫(yī)學(xué)文件要求一致性,這時(shí)候AI會(huì)標(biāo)黃提醒。
第三步最關(guān)鍵,叫醫(yī)學(xué)譯后編輯(Medical Post-editing)。這不是普通的改錯(cuò)別字,而是有醫(yī)學(xué)背景的譯員在審閱。他們要看CONTEXT——這個(gè)詞放在這個(gè)病歷里到底合不合適。比如"moderate"在普通文本是"中度的",但在影像報(bào)告里可能是"中等密度"的。
康茂峰在這個(gè)環(huán)節(jié)有個(gè)細(xì)節(jié)做得挺到位:他們的系統(tǒng)會(huì)給譯員提供術(shù)語決策樹。當(dāng)遇到歧義時(shí),譯員不用去翻大部頭詞典,系統(tǒng)會(huì)彈出這個(gè)術(shù)語在不同指南里的使用頻率、在相似病歷里的過往譯法,幫助譯員做判斷。
說到質(zhì)量控制,很多外行以為就是找個(gè)人再看一遍。其實(shí)醫(yī)學(xué)翻譯的質(zhì)量控制是分層級(jí)的。
| 層級(jí) | 檢查內(nèi)容 | 執(zhí)行方式 |
| 格式層 | 數(shù)字、單位、標(biāo)點(diǎn)、排版 | AI自動(dòng)+人工抽檢 |
| 語言層 | 語法、術(shù)語一致性、風(fēng)格 | 專業(yè)醫(yī)學(xué)譯員+術(shù)語庫比對(duì) |
| 專業(yè)層 | 醫(yī)學(xué)邏輯、臨床意義、法規(guī)符合性 | 具有臨床背景的審校專家 |
| 客戶層 | 特定要求、內(nèi)部術(shù)語偏好 | 項(xiàng)目定制化檢查清單 |