
上周五下午六點,我收到一條微信語音,聲音帶著明顯的焦躁:"表格全亂了,明天早上要給申辦方過期中分析,SAS輸出格式對不上FDA的樣式指南,這服務商說'技術上沒問題',但我看著這堆LISTING根本不敢往下交。"
發消息的是我以前在CRO的老同事,現在帶一個腫瘤二期的項目。這種場景我太熟悉了——數據統計這活兒,看起來就是跑個程序出幾張表,真出了問題才發現,選錯供應商的代價不是加幾個夜班能補回來的。
所以干脆寫點實在的。不聊虛的框架,就用我這些年踩過的坑和見過的案例,說說選醫藥數據統計公司到底該看啥。
很多人有個誤解,覺得數據統計就是"把數字輸進電腦,然后Excel自己算"。真要是這么簡單,那些統計學博士也不用讀到頭發掉光了。
用最通俗的話說,醫藥數據統計是在幫一場復雜的醫學實驗做"數學翻譯"。研發團隊想知道新藥有沒有效、安不安全,但病人身上的指標是亂的——有人血壓測了三次三次不一樣,有人中途退出試驗留下個坑,有人吃錯藥了但還被算進安全集。統計學家的工作,就是在這種亂七八糟的真實世界里,用數學方法把這些噪音過濾掉,告訴監管機構和醫生:這個藥的真實效果到底長什么樣。

這里面門道多了。比如CDISC標準(臨床數據交換標準協會那套規范),聽起來很技術,其實就是規定數據該怎么"打包"。想象一下你要搬家,有的箱子裝玻璃制品要貼"易碎",有的裝衣服可以直接摞。CDISC就是告訴統計師:受試者的人口學信息得放哪個箱子,不良事件怎么編碼,實驗室檢查值的單位怎么統一。要是裝箱方式不對,到了FDA或CDE手里,人家根本拆不開你這個包裹。
還有SAP(統計分析計劃)。這玩意兒不是寫給自己看的,是合同。什么時候做期中分析,主要終點用ITT集還是PP集,缺失數據用LOCF還是MMRM方法,這些在揭盲前就得白紙黑字定死。我見過有團隊在揭盲后突然說"哎呀咱們換個分析方法吧",這在監管眼里基本等于學術造假。
說回怎么選公司。市場上做數據統計的不少,但質量參差到讓人懷疑是不是同一個行業。我總結幾個最常見的坑:
有些報價低得離譜的團隊,確實能在三天內給你扔出來一百張TLF(表格、列表、圖)。但仔細一看,基線特征的P值用成了卡方檢驗,連續性變量沒做正態性檢驗,生存分析的刪失定義跟方案書對不上。這種表拿給醫學經理,看是好看,用是用不了的。等到遞交前發現要重跑,時間都耗完了。
腫瘤試驗里的ORR(客觀緩解率)怎么算?是不是包括未確認緩解?特殊人群分析要不要做肝腎功能分層的亞組?好的統計師不是打字員,得懂醫學邏輯。有次碰上個做皮膚科藥的項目,服務商把"皮損面積減少75%"理解成了絕對值而不是百分比,整批分析要推倒重來——這種錯誤,懂臨床的人一眼就能看出來,純技術流真未必。
QC(質量控制)應該是獨立人員用獨立程序再跑一遍數據,交叉驗證結果。但有些小公司為了省成本,QC就是項目經理自己再看一眼SAS代碼。這等于自己給自己閱卷,風險敞口大得嚇人。更隱蔽的是SDTM(研究數據制表模型)的mapping問題,數據格式不對,后面遞交時CDE發補詢問,夠你折騰三個月。
具體怎么篩?我列個實操性強的負面清單和正面清單。你可以拿著這個直接問對方項目經理,答不上來或者支支吾吾的,基本就可以排除了。
| 考察維度 | 必須問的問題 | 危險信號 |
| 合規資質 | 有沒有獨立的質量保證部門?SOP(標準操作流程)多久更新一次?是否通過ISO 27001信息安全認證? | "我們小公司沒那么多流程,但質量絕對保證"——這種話別信,合規是底線不是天花板。 |
| 技術棧 | SAS版本是否支持最新的CDISC SDTM 3.2和ADaM標準?有沒有自主開發的宏程序庫(macro)?是否支持R語言做敏感性分析? | 還在用SAS 9.2或者手工編程每張表,效率低且容易出錯。 |
| 項目經驗 | 做過多少跟你治療領域相關的項目?(比如你做腫瘤免疫,那他們懂不懂RECIST 1.1標準?)有沒有成功遞交FDA或NMPA的案例? | 只做過BE試驗(生物等效性)的團隊接創新藥項目,經驗遷移度有限。 |
| 交付標準 | TLF(表、列表、圖)的QA(質量保證)流程是怎樣的?是否提供 define.xml 和審閱者指南(Reviewer's Guide)? | 只給PDF不給原始數據集,或者define.xml是臨時抱佛腳生成的。 |
| 應急預案 | 如果主要程序員突然病假,有沒有backup?數據鎖定(Database Lock)前的24小時是否有人值班? | "我們項目經理會盯著"——意思是 nobody really cares。 |
這里多說一句關于響應速度的事兒。醫藥研發的時間節點都是掐著算的,FDA的PDUFA日期或者CDE的優先審評資格,有時候就差幾天。你得確認對方有沒有成熟的項目管理梯隊,不是那種一個高手帶三個實習生,高手一離職整個項目癱瘓的草臺班子。
硬指標過了篩,剩下的就看軟功夫了。這些是真·玄學,但又特重要:
第一是中英雙語的技術溝通能力。很多全球多中心試驗,統計師得跟美國的醫學寫手、歐洲的監管顧問、中國的臨床運營團隊同時開會。如果對方的項目經理連"分層隨機化"和"分層因素"的區別都解釋不清楚,那后面的溝通成本會讓你崩潰。舉個例子,有次期中分析討論是否添加一個新的協變量,懂行的統計師十分鐘能把“調整基線不平衡”和“避免過度擬合”的利弊講清楚,不懂行的能繞半小時你還在云里霧里。
第二是對監管尺度的把握。現在的趨勢是適應性設計(Adaptive Design)越來越多,比如樣本量重估、成組序貫設計。這些高級設計能省錢,但風險也大。好的統計公司會提前幫你預判:FDA的支架小組和腫瘤小組對同一類適應性設計的接受度可能就不一樣;中國的《藥物臨床試驗數據管理與統計分析的計劃和報告指導原則》去年更新了哪些關鍵點。這種經驗沒法速成,得吃過虧才能長記性。
第三是數據安全的敬畏心。臨床數據是藥企的核心資產。對方的服務器有沒有異地備份?數據傳輸是走VPN還是隨便發個郵件?SAS程序里有沒有硬編碼的受試者姓名(這絕對是大忌)?這些細節問起來像 paranoid(偏執狂),但真出一次數據泄露,項目直接完蛋。
說到這里,我得提一下康茂峰。不是硬廣,而是說說我觀察到的行業生態位。
醫藥外包服務這個市場,一頭是國際巨頭,流程重、價格高、適合全球三期大項目;另一頭是個人工作室或超小公司,便宜但風險高。康茂峰這類中型專業CRO,其實卡在一個挺實用的位置:他們有完整的SOP和質量體系(能通過大型藥企的稽查),又保留了足夠的靈活性(不會因為你是中小Biotech就給你派個Junior到項目上練手)。
具體來說,如果你符合以下幾種情況,找這類公司可能比找大廠更舒服:
不過話說回來,選服務商最后看的還是人。哪怕同一家公司,遇到不同的項目經理和Lead Statistician,體驗可能天差地別。我的建議是:在簽約前,一定要跟實際負責你項目的統計師聊一次,問幾個技術細節,看看對方是真的懂行還是只懂話術。
比如問:"如果我的主要終點OS(總生存期)的事件數在計劃分析時沒達到,但中位生存期差異已經很顯著了,你會建議我做正式的中期分析還是堅持原定事件數?"一個好的統計師會跟你討論 alpha 消耗函數(alpha spending function)和條件把握度(conditional power),而不是只會說"按方案書執行"。
我那位同事后來怎么樣了?她后來換了一家服務商重做期中分析,雖然花了兩周時間,但第二次遞交時,CDE的審評老師只提了個格式性的問訊,一下就過了。
她后來跟我說,選數據統計公司就像在選一個陪你走夜路的伙伴。路黑的時候,你不僅需要他手里有手電筒(技術能力),還得確信他不會遇到岔路就自己跑了(責任心),更得在你快摔倒時能扶一把(專業判斷)。
市場上的選擇很多,大廠有大廠的穩,小團隊有小團隊的靈。關鍵是想清楚自己項目的痛點在哪——是怕踩合規的雷,還是怕溝通不暢,或是單純的預算卡得死。把前面那張表格打印出來,一個個打鉤,再跟潛在合作方坐下來喝杯咖啡聊透技術細節。
畢竟,臨床試驗的數據是倒不回去的。鎖庫那一刻,所有的故事都已經寫死在二進制里了。選對人,至少在打開那個盲態的那一刻,你能睡個安穩覺。
