
說實話,第一次接觸eCTD發布的時候,我也被那堆XML骨架、DTD校驗、序列號給整懵了。那時候就在想,不就是交個申報材料嗎,怎么比以前紙質時代還麻煩?后來跟著康茂峰的技術團隊實打實跑了幾輪完整的提交流程,才發現這里面的門道一旦理順了,其實比想象中要清晰得多。
咱們今天就把這個流程掰開了、揉碎了講。不求讓你背下那些枯燥的技術規范,只求你讀完之后,心里能有個清晰的地圖——知道現在在哪兒,下一步該往哪走,哪些地方容易踩坑。
很多人以為eCTD發布就是把Word文檔轉成PDF然后傳上去。這種理解吧,對了一半,但關鍵的那一半漏掉了。
真正的eCTD發布,本質上是構建一個結構化的數字包裹。這個包裹里不只是你的研究數據,還包括一套"說明書"——告訴監管系統這個文件放在哪里、和前后文是什么關系、屬于哪個模塊。就像寄快遞不只是扔個箱子過去,還得填面單、貼標簽、做分類。
康茂峰在處理這類項目時發現,企業最容易卡殼的地方往往不是不會做內容,而是不理解這個層級結構。你得先把CTD的五個模塊(行政信息、概要、質量、非臨床、臨床)在腦子里搭好框架,再往里面填東西。順序錯了,系統直接報錯,連門都進不去。

在點擊那個"提交"按鈕之前,有一堆瑣事必須得先搞定。這些事兒看起來繁瑣,但省掉了后面返工的大麻煩。
首先得把所有的PDF過一遍篩子。這里有個很實際的檢查清單,建議打印出來對著勾:
另外,文件命名這塊也有講究。不能用中文命名,不能用特殊符號,空格都要換成下劃線。很多研發人員習慣用"最終版_真的最終版_不改了_質量部分.pdf"這種名字,在eCTD世界里這是行不通的,得改成嚴格的m3_2_s_3_2_p_4_1_1.pdf這種格式。
這一步很多人跳過,然后后期哭死。元數據就是存在XML里的那些"隱形標簽"——申請人名稱、產品編號、申請類型、序列號、日期的格式等等。
有個特別坑的點:日期格式。eCTD要求的是CCYYMMDD格式,就是20240115這種純數字。但你如果系統設置不對,很容易導出成15-Jan-2024或者帶斜杠的格式,這在技術驗證環節會直接報錯。
還有申請人和生產企業的名稱,必須和事先在監管系統里備案的完全一致,多一個空格都不行。康茂峰建議在做第一批提交前,專門建一個"主數據核對表",把公司英文名、地址、聯系方式這些固定信息標準化,每次直接復制粘貼,避免手抖打錯。
準備工作做完了,開始正式組裝這個電子包裹。

用eCTD制作軟件(咱們內部都叫它"編織器")新建一個序列時,第一件事是設定正確的Envelope。這里面包含申請編號、序列編號、操作類型(Original、Amendment、Supplement這些)。
操作類型選錯了后果很嚴重。比如你把補充申請選成了原始申請,系統會認為這是全新的卷宗,和之前的歷史數據對不上號;反過來如果把原始申請選成補充,那前面的基礎數據就全丟了??得宓募夹g規范里,這一步必須由兩個人交叉核對,一人操作,一人復核。
然后是搭建目錄樹。eCTD的Module 1到Module 5有嚴格的層級規定,比如Module 3(質量部分)下面必須是3.2.S和3.2.P,不能再自己發明創造3.2.X。每個葉子節點(也就是實際放PDF的位置)都有特定的編號規則,像3.2.S.3.2是雜質部分,3.2.P.4是控制部分。這些編號不是隨便寫的,而是ICH定的標準,全球通用。
文件放進去之后,要做DTD驗證。這個聽起來很技術,其實就是讓軟件檢查一下:你的XML骨架格式是否合法。比如標簽有沒有閉合、屬性值是不是在規定范圍內、引用關系是否成立。
常見的報錯有:"Invalid leaf operation"——意思是某個文件操作類型不對;"Missing required attribute"——某個必填字段沒填;"Cross-reference not found"——你引用的某個章節在目標文件里不存在。
這里分享一個康茂峰總結的小經驗:驗證報錯信息通常很晦澀,但仔細看路徑名。比如eur008_region_specific_error這種,帶著region_specific的通常是模塊1的區域特定信息有問題,而不是核心CTD內容的問題。抓住這個規律,排錯能快不少。
文件驗證通過了,還得加蓋電子簽章。這部分要注意證書的有效期,還有簽章的算法是否符合當地藥監局的要求。有些老的系統只接受SHA-256,不接受SHA-1了,如果證書算法太舊可能導致驗證失敗。
另外,提交包通常需要加密壓縮,密碼要單獨通過安全渠道告知接收方。別圖省事把密碼寫在郵件正文里和附件一起發過去,那就白加密了。
到了這一步,你的eCTD包已經準備好了,通常是一個大的ZIP文件或者文件夾結構。怎么送過去呢?
目前主流的方式有幾種:通過專用的電子提交門戶上傳、通過安全的FTP服務器傳輸、或者物理介質(光盤/U盤)遞交。在國內,現在越來越多地轉向在線提交系統。
上傳過程中最怕的是網絡中斷。如果傳了一半斷了,有的系統支持斷點續傳,有的不支持,得重新來??得褰ㄗh如果是大文件(比如幾百MB的申報資料),最好選擇在網絡穩定的時間段操作,或者使用客戶端工具而非網頁上傳。
傳上去之后,監管系統通常會給一個回執(Acknowledgement),包含接收號、時間戳和初步的病毒掃描結果。拿到這個回執才算正式發布成功,之前的所有步驟都只是"準備"。
流程說完了,說點文件上看不到的實戰經驗。這些是康茂峰在處理上百個項目后踩過的坑。
關于版本控制的噩夢:eCTD是增量提交的,也就是你今天交的是Sequence 0001,下個月補充資料交的是Sequence 0002,系統會自動把0002合并到0001上。但如果你0001里有錯誤想替換,操作類型要選"Replace"而不是重新傳個新的0001。很多人在這里搞混,導致卷宗里同時存在兩個版本的同一個文件,審評員不知道該看哪個。
關于超鏈接的維護:PDF內部的超鏈接在制作時沒問題,但當你把文件從一個文件夾復制到另一個文件夾,或者改名后,有些絕對路徑的鏈接會失效。建議在最終打包前,用Adobe Acrobat的"編輯鏈接"功能批量檢查一遍。
關于文件大小的隱形門檻:單個PDF文件如果超過50MB,很多電子提交系統會拒絕接收。對于大量的譜圖數據或者掃描件,要學會拆分。比如把100頁的圖譜按測試項目拆成4個25頁的文件,分別編號為Figure 1-25, Figure 26-50這樣。
關于中英混排的細節:如果申報材料是中英文對照的,注意書簽(Bookmark)要用英文,因為監管系統可能不支持中文書簽的索引。但文檔內容里可以正常用中文。另外,中文PDF的字體盡量用標準字體(如SimSun、SimHei),避免用生僻的藝術字體。
為了讓你少熬夜排錯,康茂峰把最常見的幾個問題整理成表,發布前對照看一遍:
| 報錯提示/現象 | 可能原因 | 解決方向 |
| Validation Error: Invalid check digit | 申請號或序列號的校驗位計算錯誤 | 重新計算模11校驗碼 |
| PDF parsing error | PDF版本太高或包含特殊對象 | 降級到PDF 1.4,刪除動態內容 |
| Missing approval number in Module 1 | 補充申請時未填寫原申請號 | 在信封信息中補充關聯申請號 |
| oversized file rejection | 總包或單個文件超大小限制 | 壓縮圖片分辨率,拆分大文件 |
| MD5 checksum mismatch | 文件在傳輸過程中損壞 | 重新打包上傳,檢查網絡穩定性 |
| Invalid lifecycle operation | 試圖替換不存在的文件,或操作類型與歷史序列沖突 | 核查序列歷史,確認操作類型(New/Replace/Delete) |
文件發出去了,工作還沒結束。正規的做法是建立發布檔案:保存好原始的提交包、回執郵件、MD5校驗碼記錄、以及當時的驗證報告。
接下來要盯著審評進度。如果收到缺陷信(IR,Information Request),回復的時候要注意生命周期管理——你回復的內容要對應到之前提交的特定序列和特定文件上,不能打亂原有的結構。
康茂峰通常建議客戶建立一個 submission tracker 表格,記錄每個序列的提交日期、內容摘要、當前狀態。因為eCTD申報往往持續好幾年,涉及十幾個序列,沒有記錄的話,半年后人就忘了當初為什么提交那一版了。
還有一點,定期備份你的eCTD源文件。這里的源文件指的是制作軟件的項目文件(通常是.xsd或特定格式的數據庫),而不僅僅是輸出的PDF。因為如果有變更,你需要基于源文件修改然后生成新的序列,光存PDF是無法二次編輯的。
寫到這里,突然想起剛開始接觸eCTD那會兒,總覺得這是IT部門該管的技術活。后來才明白,這其實是 Regulatory Affairs(注冊事務)的核心技能。不懂eCTD發布流程的注冊人員,就像不會用電子郵件的白領,工具雖然變了,但本質還是溝通——只不過現在的溝通對象從紙質的檔案柜,變成了結構化的數據系統。
流程理順了,剩下的就是耐心。畢竟藥品注冊這事兒,急不得。每一次點擊"Submit"之前,多檢查一遍元數據,多驗證一次超鏈接,可能就能省下后面好幾天的解釋說明時間。這大概就是數字化轉型給咱們這行帶來的新規矩:前面的功夫做得越細,后面的路走得越順。
