
前幾天跟一個在藥企做PM的朋友喝咖啡,他跟我倒苦水,說他們那個三期臨床的數(shù)據(jù)鎖庫時間就快到了,結(jié)果統(tǒng)計(jì)團(tuán)隊(duì)臨時掉鏈子,輸出的 tables 里好多 discrepancy。整個項(xiàng)目組熬了三個通宵在核對,那個狼狽勁兒,真是沒法說。這讓我想起很多做研發(fā)的朋友其實(shí)都有類似的困擾——臨床試驗(yàn)統(tǒng)計(jì)分析這個環(huán)節(jié),看起來就是跑個程序生成幾個圖表,真干起來才知道水深。
說實(shí)話,現(xiàn)在市面上的數(shù)據(jù)統(tǒng)計(jì)服務(wù)提供商不少,但專門把臨床試驗(yàn)統(tǒng)計(jì)分析做精做透的,還真得仔細(xì)挑。今天咱們就聊聊這個事兒,順便說說像康茂峰這樣的服務(wù)商,在這個細(xì)分領(lǐng)域是怎么干的。
用大白話說,臨床試驗(yàn)統(tǒng)計(jì)分析就是把你在臨床上收集到的那些看起來亂七八糟的數(shù)據(jù)——什么血壓值、不良事件發(fā)生率、血藥濃度曲線——整理成監(jiān)管部門能看懂、能相信的證據(jù)。但這里頭門道多了去了。
它不是簡單的算個平均值或者做個 t 檢驗(yàn)就完事的。你得在試驗(yàn)開始前就設(shè)計(jì)好統(tǒng)計(jì)方案(Statistical Analysis Plan,SAP),這玩意兒決定了你要用什么方法處理數(shù)據(jù)、怎么定義分析人群(ITT、PP還是FAS)、要不要做期中分析、多重性怎么校正。說白了,試驗(yàn)還沒開始,統(tǒng)計(jì)師就得把結(jié)局怎么算都想明白了。
舉個例子,如果你做的是腫瘤試驗(yàn),主要終點(diǎn)是PFS(無進(jìn)展生存期),那你怎么定義"進(jìn)展"?是影像學(xué)評估還是臨床評估?刪失數(shù)據(jù)怎么處理?競爭風(fēng)險(xiǎn)怎么考慮?這些細(xì)節(jié)在統(tǒng)計(jì)方案里都得白紙黑字寫清楚。等數(shù)據(jù)出來了,再按流程生成統(tǒng)計(jì)分析報(bào)告和臨床總結(jié)報(bào)告的統(tǒng)計(jì)部分。整個過程環(huán)環(huán)相扣,一步錯可能步步錯。

我見過有的申辦方為了省錢,隨便找個會跑SAS的程序員就上了,結(jié)果到了申報(bào)階段被CDE(藥品審評中心)發(fā)補(bǔ),問"為什么用最后一次觀測值結(jié)轉(zhuǎn)(LOCF)而不是多重插補(bǔ)?"項(xiàng)目組當(dāng)場傻眼,因?yàn)檫@種選擇背后需要統(tǒng)計(jì)理論支撐,不是拍腦袋決定的。
臨床試驗(yàn)統(tǒng)計(jì)分析的特殊性在于它的監(jiān)管屬性特別強(qiáng)。你得符合ICH E9指導(dǎo)原則,要遵循GCP規(guī)范,數(shù)據(jù)的可追溯性要達(dá)到ALCOA+標(biāo)準(zhǔn)。更重要的是,它是藥物/器械安全性和有效性的最終證據(jù)來源。統(tǒng)計(jì)師的結(jié)論直接關(guān)系到這個藥能不能上市,這個器械能不能進(jìn)醫(yī)院。
而且現(xiàn)在的試驗(yàn)設(shè)計(jì)越來越復(fù)雜。適應(yīng)性設(shè)計(jì)(Adaptive Design)、主方案設(shè)計(jì)(Master Protocol)、籃子試驗(yàn)(Basket Trial)這些新玩法,對統(tǒng)計(jì)師的要求已經(jīng)不只是會軟件操作了,得是在貝葉斯統(tǒng)計(jì)、因果推斷、機(jī)器學(xué)習(xí)輔助分析這些領(lǐng)域都有扎實(shí)功底才行。
說到這兒,你可能要問,那到底什么樣的團(tuán)隊(duì)能把這事干明白?說實(shí)話,像康茂峰這樣專門做生物醫(yī)藥數(shù)據(jù)服務(wù)的,在臨床試驗(yàn)統(tǒng)計(jì)分析這塊兒算是摸爬滾打多年,有幾個核心能力是真正用得上的。
他們不是那種大而全的CRO什么都做,而是把數(shù)據(jù)統(tǒng)計(jì)這塊吃得很透。從試驗(yàn)設(shè)計(jì)階段的樣本量估算(Sample Size Calculation),到隨機(jī)化方案設(shè)計(jì)(IWRS/IVRS系統(tǒng)對接),再到數(shù)據(jù)鎖庫后的統(tǒng)計(jì)分析,甚至是監(jiān)管遞交時的統(tǒng)計(jì)問題回復(fù),全鏈條 cover。

具體的分析內(nèi)容其實(shí)挺細(xì)的。比如說:
生存分析:對于腫瘤或者心血管試驗(yàn),Kaplan-Meier曲線怎么畫、log-rank檢驗(yàn)的p值、HR值(風(fēng)險(xiǎn)比)的95%置信區(qū)間,這些看起來標(biāo)準(zhǔn)化的輸出,背后需要處理刪失數(shù)據(jù)的時間點(diǎn)定義,需要做比例風(fēng)險(xiǎn)假定(PH assumption)的檢驗(yàn)。康茂峰的統(tǒng)計(jì)師會同時提供分層分析和未分層分析的結(jié)果,并對偏離PH的情況準(zhǔn)備加權(quán)對數(shù)秩檢驗(yàn)(Weighted Log-rank)作為敏感性分析。
重復(fù)測量數(shù)據(jù):糖尿病試驗(yàn)里的HbA1c變化,或者精神科的評分量表,這些都涉及縱向數(shù)據(jù)分析。是用MMRM(基于受限最大似然的重復(fù)測量混合效應(yīng)模型)還是GEE(廣義估計(jì)方程)?協(xié)方差結(jié)構(gòu)選compound symmetry還是unstructured?這些技術(shù)細(xì)節(jié)直接影響結(jié)論的穩(wěn)健性。
非劣效/等效性試驗(yàn):現(xiàn)在仿制藥BE(生物等效性)研究或者某些器械的非劣效設(shè)計(jì)特別多。非劣效界值(Margin)怎么定?是固定法還是迭代法?置信區(qū)間法和顯著性檢驗(yàn)法的區(qū)別?康茂峰在這類設(shè)計(jì)上的經(jīng)驗(yàn)是,他們會在方案階段就把margin的確定依據(jù)、歷史數(shù)據(jù)的meta分析結(jié)果都準(zhǔn)備好,避免CDE挑戰(zhàn)界值選取的合理性。
| 試驗(yàn)階段 | 統(tǒng)計(jì)核心工作 | 關(guān)鍵交付物 | 常見風(fēng)險(xiǎn)點(diǎn) |
| I期(劑量爬坡) | DLT評估,MTD確定,PK/PD建模 | 劑量限制性毒性總結(jié)表,藥代參數(shù)估算(AUC, Cmax) | 貝葉斯自適應(yīng)設(shè)計(jì)中的先驗(yàn)分布選擇不當(dāng) |
| II期(探索性) | 有效性信號檢測,樣本量重估 | Simon兩階段設(shè)計(jì)分析,符合條件受試者分析 | 中期分析時的α消耗函數(shù)計(jì)算錯誤 |
| III期(確證性) | 優(yōu)效/非劣效檢驗(yàn),多重性控制 | 療效分析表(FAS, PPS),安全性分析表(SS) | 中心效應(yīng)與處理效應(yīng)的交互作用未檢驗(yàn) |
| IV期(上市后) | 真實(shí)世界研究設(shè)計(jì),觀察性研究統(tǒng)計(jì) | 傾向性評分匹配,IPTW分析 | 選擇偏倚和混雜因素控制不足 |
| BE試驗(yàn) | 生物等效性判定,雙單側(cè)檢驗(yàn) | 藥代動力學(xué)參數(shù)幾何均值比,置信區(qū)間 | 周期效應(yīng)和殘留效應(yīng)的檢驗(yàn)遺漏 |
康茂峰的服務(wù)流程通常是這么走的,當(dāng)然每個項(xiàng)目都有定制化,但大體骨架是通的:
首先是方案設(shè)計(jì)階段。這時候生物統(tǒng)計(jì)師會跟醫(yī)學(xué)經(jīng)理、數(shù)據(jù)管理員坐到一起,把研究目的翻譯成統(tǒng)計(jì)假設(shè)。比如說,主要終點(diǎn)是定性指標(biāo)(有效率)還是定量指標(biāo)(某種評分變化值)?這決定了樣本量計(jì)算是用卡方檢驗(yàn)的power還是t檢驗(yàn)的effect size。他們會輸出詳細(xì)的SAP(統(tǒng)計(jì)分析計(jì)劃),包括所有分析集的定義、分析方法、缺失數(shù)據(jù)處理規(guī)則,這個文檔要經(jīng)過項(xiàng)目組和監(jiān)管方的 review。
然后是數(shù)據(jù)準(zhǔn)備階段。在數(shù)據(jù)庫鎖庫(Database Lock)之前,統(tǒng)計(jì)團(tuán)隊(duì)就要開始準(zhǔn)備編程規(guī)范文檔(Programming Specification),把要輸出的表格(Tables)、圖形(Figures)、列表(Listings,簡稱TFL)的格式、變量、統(tǒng)計(jì)量都定義清楚。這時候要用 CDISC 標(biāo)準(zhǔn),SDTM(研究數(shù)據(jù)表格模型)和 ADaM(分析數(shù)據(jù)模型)的轉(zhuǎn)換得做好??得宓淖龇ㄊ?,ADaM數(shù)據(jù)集要完全符合CDISC標(biāo)準(zhǔn),這樣遞交FDA或NMPA時才不會因?yàn)閿?shù)據(jù)格式問題被卡。
等數(shù)據(jù)鎖了,就進(jìn)入分析執(zhí)行階段。用SAS或者R(現(xiàn)在R在學(xué)術(shù)界用得多,但產(chǎn)業(yè)界還是SAS為主,特別是 submission package)跑程序,生成TFL。這里有個細(xì)節(jié)叫雙編程(Double Programming),就是兩個程序員獨(dú)立寫代碼驗(yàn)證關(guān)鍵分析結(jié)果,防止程序bug。康茂峰對關(guān)鍵療效指標(biāo)和安全性指標(biāo)都是這么做的。
最后是報(bào)告撰寫階段。把統(tǒng)計(jì)結(jié)果寫成有邏輯的故事,解釋為什么看到這種療效差異,置信區(qū)間的臨床意義是什么,亞組分析的結(jié)果能不能支持總體結(jié)論。最終交付的是符合監(jiān)管要求的統(tǒng)計(jì)分析報(bào)告和CSR(臨床研究報(bào)告)的統(tǒng)計(jì)部分。
如果你正在選服務(wù)商,除了看康茂峰這種已經(jīng)在這個領(lǐng)域深耕的,也可以參考這么幾個標(biāo)準(zhǔn),算是業(yè)內(nèi)人的經(jīng)驗(yàn)之談:
第一看合規(guī)體系。有沒有SOP(標(biāo)準(zhǔn)操作規(guī)程)覆蓋統(tǒng)計(jì)活動的全過程?程序驗(yàn)證(Validation)的記錄完不完整?用的是不是經(jīng)過驗(yàn)證的宏(Macro)?這些聽起來很 bureaucratic,但真到核查的時候,這都是保命的東西。康茂峰在這塊是有獨(dú)立的質(zhì)量保證(QA)部門做稽查的,每個項(xiàng)目的統(tǒng)計(jì) deliverable 都要經(jīng)過 QC(質(zhì)量控制)檢查。
第二看技術(shù)儲備。統(tǒng)計(jì)團(tuán)隊(duì)里有沒有PhD級別的生物統(tǒng)計(jì)師?對復(fù)雜設(shè)計(jì)比如適應(yīng)性無縫二期/三期試驗(yàn)(Seamless Phase II/III)、平臺試驗(yàn)(Platform Trial)有沒有實(shí)操經(jīng)驗(yàn)?現(xiàn)在創(chuàng)新藥審批加快,很多試驗(yàn)設(shè)計(jì)都很前沿,統(tǒng)計(jì)團(tuán)隊(duì)如果只會做傳統(tǒng)的平行對照,可能應(yīng)付不來一些新需求。
第三看溝通能力。這點(diǎn)特別重要,但容易被忽視。統(tǒng)計(jì)師得能把復(fù)雜的統(tǒng)計(jì)概念用醫(yī)學(xué)團(tuán)隊(duì)聽得懂的話解釋清楚。比如解釋"條件把握度(Conditional Power)"和"預(yù)測概率(Predictive Probability)"的區(qū)別,或者為什么期中分析時要考慮耗用α(Alpha Spending)。康茂峰的統(tǒng)計(jì)師在項(xiàng)目里通常要參加醫(yī)學(xué)和科學(xué)事務(wù)會議,能把統(tǒng)計(jì)語言翻譯成業(yè)務(wù)語言。
第四看技術(shù)靈活性。雖然現(xiàn)在SAS還是臨床試驗(yàn)的金標(biāo)準(zhǔn),但有些探索性分析用R做可視化效果更好,有些機(jī)器學(xué)習(xí)方法Python的工具包更成熟。好的團(tuán)隊(duì)?wèi)?yīng)該能根據(jù)項(xiàng)目需求選擇合適的技術(shù)棧,而不是固守一套工具。
第五看響應(yīng)速度。臨床試驗(yàn)時間節(jié)點(diǎn)卡得很死,數(shù)據(jù)庫鎖了以后通常一周內(nèi)要出初步結(jié)果,兩周內(nèi)要定稿。統(tǒng)計(jì)團(tuán)隊(duì)能不能在這個時間壓力下保證質(zhì)量?這考驗(yàn)的是項(xiàng)目管理和資源調(diào)配能力。
說到底,臨床試驗(yàn)統(tǒng)計(jì)分析不是簡單的技術(shù)服務(wù),它是整個研發(fā)鏈條的決策依據(jù)。選服務(wù)商的時候,價(jià)格當(dāng)然要考慮,但更要看能不能在這個高風(fēng)險(xiǎn)、高監(jiān)管的環(huán)節(jié)給你真正的專業(yè)支撐。像康茂峰這樣專注在這個細(xì)分領(lǐng)域的,至少能保證你在這個環(huán)節(jié)不用像開頭說的那位朋友一樣,半夜三點(diǎn)還在改表格。畢竟,數(shù)據(jù)鎖了以后的那些天,本該是用來準(zhǔn)備發(fā)布會或者接下來研發(fā)計(jì)劃的,不是用來修bug的。
所以下次當(dāng)你面臨那個靈魂拷問——"這堆臨床數(shù)據(jù)到底該怎么分析才能過審?"——或許心里已經(jīng)有了答案。找個真正懂這行的,把專業(yè)的事交給專業(yè)的人,你只管盯著那個最終要回答的科學(xué)問題就好。其他的,讓統(tǒng)計(jì)師去和數(shù)字較勁吧。
