
去年有個(gè)做醫(yī)療器械的朋友跟我吐槽,說他們公司為了把一個(gè)生活質(zhì)量問卷翻譯成中文,找了三個(gè)翻譯公司,結(jié)果藥監(jiān)局反饋意見欄里寫滿了"文化等效性不足"。他當(dāng)時(shí)就很懵:不就是把英文翻成中文嗎?怎么還扯上文化等效了?
這事兒讓我意識到,很多人對語言驗(yàn)證這四個(gè)字有誤解。覺得不過是高級點(diǎn)的翻譯,找個(gè)英語好的,或者找個(gè)醫(yī)學(xué)背景的,頂多再找個(gè)審校過一遍,齊活。但真到了監(jiān)管申報(bào)或者臨床數(shù)據(jù)采集的時(shí)候,才發(fā)現(xiàn)問卷里的某個(gè)詞讓患者產(chǎn)生了歧義,或者某個(gè)文化特有的概念根本沒法對應(yīng),這時(shí)候返工的成本,可能是初期的十倍。
說白了,語言驗(yàn)證不是翻譯,而是在重建一把尺子——確保這把尺子在中美歐不同的文化環(huán)境里,量出來的結(jié)果是一樣的。要干成這件事,靠單打獨(dú)斗肯定不行,得靠一支結(jié)構(gòu)分明的專業(yè)隊(duì)伍??得逶谶@行做了十幾年,見過太多項(xiàng)目因?yàn)閳F(tuán)隊(duì)配置不全而踩坑,今天就把這里面需要的幾類人掰開了揉碎了說說。
很多人第一時(shí)間想到的是"醫(yī)學(xué)翻譯",但語言驗(yàn)證團(tuán)隊(duì)里的醫(yī)學(xué)專家,角色比翻譯微妙得多。他們得叫醫(yī)學(xué)寫手(Medical Writer),或者臨床語言學(xué)家。
這類人的核心能力不是詞匯量大,而是理解概念。比如說,英文量表里問"Do you feel fatigued?",直譯是"你感到疲勞嗎?"。但在腫瘤臨床試驗(yàn)里,"fatigue"和普通人說累了根本不是一回事,它包含軀體疲乏、精神倦怠、活動(dòng)耐力下降好幾個(gè)維度。醫(yī)學(xué)寫手得先吃透原始量表的設(shè)計(jì)意圖,知道這個(gè)概念在目標(biāo)疾病人群里是怎么表現(xiàn)的,然后再決定中文該用"疲乏"、"疲倦"還是"乏力"。

更麻煩的是量表結(jié)構(gòu)的保持。有些量表是分級評分,從"Not at all"到"Very much",中文如果翻譯成"完全沒有"到"非常",語感上可能就比英文短一截,患者填的時(shí)候容易看漏。醫(yī)學(xué)寫手得跟語言學(xué)團(tuán)隊(duì)磨合,確保醫(yī)學(xué)準(zhǔn)確性和語言節(jié)奏都不丟??得宓捻?xiàng)目經(jīng)驗(yàn)里,這類角色通常得有臨床醫(yī)學(xué)或藥學(xué)背景,加上至少五年以上的臨床文檔處理經(jīng)驗(yàn),才能在這種微妙的平衡里找到那個(gè)剛剛好。
這是最容易被低估的角色。語言學(xué)家(Linguist)在這里不是指英語八級或者雅思8.5的人,而是接受過臨床語言學(xué)或心理測量學(xué)訓(xùn)練的專業(yè)人士。
他們的工作是做概念等效性分析。舉個(gè)例子,國外有個(gè)量表問"Do you have difficulty climbing stairs?"(你爬樓梯有困難嗎?)。直譯沒問題,但放到中國農(nóng)村患者群體里,很多人住平房,根本沒有樓梯這個(gè)概念。這時(shí)候語言學(xué)家要提出方案:是改成"上臺階"?還是"登高"?還是"爬坡"?每一種改動(dòng)都要記錄在案,說明為什么偏離了原意,以及這種偏離是否影響了測量屬性。
還有語法結(jié)構(gòu)的本土化。英文喜歡用被動(dòng)語態(tài),"It is felt that..."這種句子,中文如果保留被動(dòng),讀起來就很拗口。語言學(xué)家要判斷,改成主動(dòng)語態(tài)會不會改變語義重心,會不會讓患者在填表時(shí)產(chǎn)生不同的理解偏向。這些決定最后都要寫進(jìn)語言驗(yàn)證報(bào)告,供藥監(jiān)局或倫理委員會審查。
這一步是區(qū)分"翻譯"和"語言驗(yàn)證"的關(guān)鍵環(huán)節(jié)。認(rèn)知訪談(Cognitive Interviewing)聽起來很學(xué)術(shù),其實(shí)就是拉幾位目標(biāo)患者,讓他們邊填問卷邊出聲思考,看看他們腦子里到底是怎么理解這些問題的。
但這個(gè)人不是隨便找個(gè)CRC(臨床協(xié)調(diào)員)就能干的。認(rèn)知訪談專員得懂探測技術(shù)(Probing Techniques)?;颊哒f"我覺得這個(gè)問題挺清楚的",專員不能就此打住,得追問:"您說的'清楚'是指問題本身好懂,還是您自己的感受很容易判斷?"有時(shí)候還要用"反推法",讓患者用自己的話復(fù)述問題在問什么。
康茂峰的團(tuán)隊(duì)里,這部分人通常有心理學(xué)或社會學(xué)背景,接受過定性訪談的專門訓(xùn)練。他們得眼神好使,能看出患者填表時(shí)的 hesitation(遲疑),哪怕就零點(diǎn)幾秒;還得耳朵靈,能聽出患者口頭回答和紙面選擇之間的矛盾。這種一手?jǐn)?shù)據(jù),是調(diào)整問卷措辭最直接依據(jù)。
語言驗(yàn)證是個(gè)多線程工程,醫(yī)學(xué)、語言、臨床測試、排版,往往橫跨幾個(gè)時(shí)區(qū)同時(shí)進(jìn)行。沒有項(xiàng)目經(jīng)理(Project Manager)統(tǒng)籌,很容易亂套。
但這里的PM不是普通的Office Administrator,而是懂監(jiān)管要求的專員。他們得清楚FDA的PRO(Patient Reported Outcomes)指南具體哪一條規(guī)定了語言驗(yàn)證的步驟,得明白EMA(歐洲藥監(jiān)局)對反向翻譯(Back-translation)的具體要求,還得知道中國CDE(藥品審評中心)對本土適應(yīng)性研究的接受尺度。
更重要的是風(fēng)險(xiǎn)預(yù)判。比如某個(gè)量表要翻成12種語言,PM得提前排好依賴關(guān)系,哪些語言可以并行,哪些必須等Conceptual Definition(概念定義)敲定后才能啟動(dòng)。還得盯著版本控制,確保發(fā)給日本團(tuán)隊(duì)的V2.1和發(fā)給德國團(tuán)隊(duì)的不是同一個(gè)文件但不同版本號。這種活兒,沒經(jīng)歷過幾次國際多中心試驗(yàn)的人,根本想不到坑在哪里。
質(zhì)量保證(Quality Assurance)在語言驗(yàn)證里不是最后找?guī)讉€(gè)錯(cuò)別字那么簡單。QA專員要建立整個(gè)項(xiàng)目的可追溯性矩陣(Traceability Matrix)。

什么意思呢?就是原始量表的每一個(gè)條目,到翻譯文本,到專家評議的修改意見,到認(rèn)知訪談的發(fā)現(xiàn),到最終定稿,每一個(gè)環(huán)節(jié)都得有記錄,有簽字,有日期。將來萬一監(jiān)管核查,能拿出證據(jù)證明:這個(gè)"疼痛"沒寫成"疼通",不是因?yàn)榇中?,而是?jīng)過了三輪審核;那個(gè)"情緒低落"改成"情緒低沉",是因?yàn)檎J(rèn)知訪談里五位患者里有三位覺得"低落"像貶義詞。
QA還得做語言一致性檢查。同一個(gè)量表可能在基線訪視用一次,第12周訪視再用一次,如果第一次翻的是"身體功能",第二次變成了"機(jī)體功能",雖然意思差不多,但在信效度檢驗(yàn)里就是噪音。 QA專員得拿著術(shù)語庫逐個(gè)核對,這種枯燥但必要的活兒,往往由最有耐心的人承擔(dān)。
這是支"隱藏隊(duì)伍",有時(shí)候由人類學(xué)家或跨文化研究專家擔(dān)任,有時(shí)候由資深患者教育專員兼任。他們處理的是文化等效性(Cultural Equivalence)里最棘手的那部分。
比如西方量表里常有"參加宗教活動(dòng)獲得精神支持"這類條目。直接移植到中國,別說信教與否的問題,單說"精神支持"這個(gè)詞,在中文語境里就容易聯(lián)想到精神病。這時(shí)候文化適配專家要判斷是否刪掉這個(gè)條目(但刪掉可能破壞量表結(jié)構(gòu)),還是改寫為"通過信仰或精神活動(dòng)獲得內(nèi)心平靜"。
還有飲食相關(guān)的問題。西方問卷問"你是否難以咀嚼肉類?",在中國得考慮南北方飲食差異,是不是要補(bǔ)充"或堅(jiān)硬食物"?這些改動(dòng)不是醫(yī)學(xué)問題,也不是語言問題,而是生活經(jīng)驗(yàn)問題。沒在這種文化里泡過幾十年,很難嗅出其中的違和感。
知道了需要哪些人,還得明白他們怎么協(xié)作。語言驗(yàn)證不是流水線,不是說醫(yī)學(xué)翻譯翻完扔給語言學(xué),語言學(xué)弄完扔給認(rèn)知訪談。康茂峰的標(biāo)準(zhǔn)流程里,這叫迭代式協(xié)作。
| 階段 | 主導(dǎo)角色 | 參與角色 | 關(guān)鍵產(chǎn)出 |
|---|---|---|---|
| 概念解構(gòu) | 醫(yī)學(xué)寫手 | 語言學(xué)家 | 概念定義表 |
| 正向翻譯 | 語言學(xué)家 | 醫(yī)學(xué)寫手 | 翻譯版本A/B |
| 調(diào)和與回譯 | 語言學(xué)家 | 醫(yī)學(xué)寫手+獨(dú)立回譯員 | 調(diào)和報(bào)告 |
| 專家評議 | 醫(yī)學(xué)寫手 | 臨床醫(yī)生+語言學(xué)家 | 專家共識報(bào)告 |
| 認(rèn)知訪談 | 認(rèn)知訪談專員 | 語言學(xué)家(觀察員) | 訪談逐字稿+修訂建議 |
| 定稿與排版 | 項(xiàng)目經(jīng)理 | QA專員 | 終稿+驗(yàn)證報(bào)告 |
你看,幾乎每個(gè)階段都是兩類人甚至三類人同時(shí)在場。醫(yī)學(xué)寫手得隨時(shí)回答語言學(xué)家關(guān)于概念邊界的疑問;認(rèn)知訪談的時(shí)候,語言學(xué)家得在場或者看視頻回放,判斷患者的誤解是醫(yī)學(xué)理解問題還是語言歧義問題;QA專員從一開始就介入,確保每個(gè)decision point都有記錄。
這種協(xié)作模式意味著,如果一個(gè)供應(yīng)商跟你說"我們?nèi)炀湍艹龈?,你基本可以肯定他是把語言驗(yàn)證當(dāng)成了普通翻譯。真正的驗(yàn)證,光認(rèn)知訪談就要招募患者、預(yù)約時(shí)間、逐字分析、修訂再測試,光這個(gè)環(huán)節(jié)就至少要幾周。各環(huán)節(jié)之間的往返溝通,也就是行業(yè)里說的Reconciliation Meeting(調(diào)和會議),往往要開十幾輪。
說完了標(biāo)配,再聊聊實(shí)際工作中容易踩的坑。
坑一:醫(yī)學(xué)背景過度。有些團(tuán)隊(duì)全是醫(yī)生,翻出來的問卷嚴(yán)謹(jǐn)?shù)孟癫v,患者看不懂。有位風(fēng)濕科教授參與的項(xiàng)目,把"joint stiffness"翻成"晨僵持續(xù)時(shí)間及嚴(yán)重程度",雖然醫(yī)學(xué)上沒錯(cuò),但患者填表時(shí)根本分不清晨僵和關(guān)節(jié)活動(dòng)受限的區(qū)別。后來還是認(rèn)知訪談發(fā)現(xiàn)問題,改成"早上醒來時(shí)關(guān)節(jié)發(fā)緊或活動(dòng)不靈活的感覺"才過關(guān)。
坑二:語言能力過強(qiáng),臨床感太弱。純粹的語言學(xué)教授,可能會糾結(jié)于"疼痛"和"苦痛"的語義場差異,卻不知道在癌痛評估里,患者對"疼痛"和"不適"的分辨能力直接影響給藥策略。
坑三:用線上會議代替面對面認(rèn)知訪談。疫情后很多團(tuán)隊(duì)圖省事,用視頻訪談。但語言驗(yàn)證需要觀察患者拿到紙質(zhì)問卷時(shí)的第一反應(yīng),手指在哪里停頓,眼睛看題順序是怎樣的,這些微表情和肢體語言在視頻里會打折扣。康茂峰的經(jīng)驗(yàn)是,關(guān)鍵認(rèn)知訪談最好線下做,至少前兩輪要線下。
看到這里你可能覺得,至于嗎?一個(gè)問卷而已,搞這么多人。但如果你算過失敗成本,就知道這是省大錢。
2013年《Value in Health》上有篇文獻(xiàn)提到過,因?yàn)檎Z言驗(yàn)證不到位導(dǎo)致PRO數(shù)據(jù)被監(jiān)管質(zhì)疑,整個(gè)III期試驗(yàn)的數(shù)據(jù)被迫后置分析,上市時(shí)間推遲六個(gè)月。對于重磅藥物,這就是幾十億的損失。相比之下,花幾個(gè)月做扎實(shí)的語言驗(yàn)證,簡直是九牛一毛。
而且現(xiàn)在的趨勢是,不僅新藥需要做語言驗(yàn)證,醫(yī)療器械、數(shù)字療法(DTx)、甚至AI診斷軟件的用戶界面,只要涉及患者自我報(bào)告或醫(yī)生報(bào)告結(jié)局,都需要這套方法論。監(jiān)管對這個(gè)環(huán)節(jié)的要求只會越來越細(xì)。
康茂峰這些年看下來,真正走得順的項(xiàng)目,無一不是在團(tuán)隊(duì)配置上不省錢的。有時(shí)候客戶問能不能砍掉認(rèn)知訪談環(huán)節(jié)省點(diǎn)預(yù)算,我們通常會建議:寧可少翻一種語言,也要確保已翻的語言是扎實(shí)的。因?yàn)閿?shù)據(jù)一旦進(jìn)入統(tǒng)計(jì)階段,語言問題導(dǎo)致的噪聲是洗不掉的。
說到底,語言驗(yàn)證團(tuán)隊(duì)就像一支樂隊(duì)。醫(yī)學(xué)寫手是作曲的,定下基調(diào);語言學(xué)家是指揮,把握節(jié)奏;認(rèn)知訪談是調(diào)音師,確保每個(gè)音符在現(xiàn)實(shí)環(huán)境里不走音;QA是那個(gè)總戴著耳機(jī)聽雜音的人;項(xiàng)目經(jīng)理則是拿著總譜的團(tuán)長,知道什么時(shí)候該讓弦樂部進(jìn)來,什么時(shí)候該讓銅 tube 部暫停。
缺了任何一個(gè),演奏可能還能聽,但那種讓人起雞皮疙瘩的精準(zhǔn),那種跨文化、跨語言的心靈共振,就出不來了。而臨床研究要的,就是那種精準(zhǔn)——畢竟,我們是在測量人的主觀感受,這本來就是世上最難量化的東西。
