
做藥品注冊的朋友都知道,eCTD這玩意兒聽起來很高大上,說白了就是把以前那套紙質(zhì)資料電子化,讓審評老師能在電腦上看你的申報資料,而不是抱著半人高的紙箱子。但就是這么個"電子化"的過程,愣是把多少人折磨得半夜睡不著覺。今天咱們就聊聊,當(dāng)你終于把技術(shù)文檔寫完了,準(zhǔn)備點那個"發(fā)布"按鈕之前,到底該注意些什么。
很多人一上來就急著做文件,其實連eCTD的骨架都沒搞明白。eCTD不是簡單地把Word轉(zhuǎn)成PDF然后打個包,它是有嚴(yán)格邏輯的——五個模塊像搭積木一樣層層遞進,從行政管理信息到臨床研究報告,每一塊都有自己的編號規(guī)則和存放位置。
在康茂峰這么多年的項目經(jīng)驗里,我發(fā)現(xiàn)一個規(guī)律:凡是出問題的項目,十有八九是最開始沒把文件夾結(jié)構(gòu)想明白。比如模塊一各個國家地區(qū)的要求不一樣,中國的模塊一和美國的模塊一完全是兩碼事,你要是用錯了骨架,后面填充再多內(nèi)容也是白搭。
說白了,eCTD就是一個精細到變態(tài)的檔案柜。每個抽屜該放什么,文件該怎么貼標(biāo)簽,甚至連你用的字體、顏色都有講究。搞懂這個邏輯,比急著學(xué)軟件操作重要得多。

先說文件名這事兒。很多人習(xí)慣用"最終版"、"修改版2"、"真的最終版"這種命名方式,在eCTD里這可是大忌。
eCTD的文件名是有密碼的——8位或12位的編號,前兩位是模塊號,中間幾位是序列號,后面跟著版本號。比如m1-23-456-789-0123-v1.pdf這種格式,每個橫杠后面的數(shù)字都有特定含義。你要是隨意命名,系統(tǒng)根本識別不了,傳到審評系統(tǒng)里就是一串亂碼。
更坑的是書簽命名。正文里的書簽(page target)和外部鏈接(external link)必須一一對應(yīng),少一個或者錯一個,審評老師點開就是個404。我們康茂峰的技術(shù)團隊有個 checklist,光是檢查命名規(guī)則就有十七條細則,聽著繁瑣,但真能救命。
說來也怪,PDF這個大家都在用的格式,在eCTD里卻是個技術(shù)難點。
首先,必須生成PDF/A格式,這是長期歸檔的標(biāo)準(zhǔn)。普通的PDF可能包含JavaScript、透明圖層或者某些字體嵌入方式,過幾年打開就可能亂碼或缺失。其次是字體嵌入,有些中文字體在審評老師的電腦上如果沒有安裝,顯示出來就是一堆方框。
還有圖片分辨率。掃描件不能低于300dpi,但文件大小又不能超過系統(tǒng)限制——通常單個文件不能超過50MB或100MB,具體看申報路徑。這就得在清晰度和體積之間找平衡,有時候需要重新OCR識別,或者把大圖切分成幾頁。
最隱蔽的坑是PDF的"屬性"信息。有些軟件導(dǎo)出的PDF會帶作者信息、修改時間甚至內(nèi)部路徑,這些信息在eCTD規(guī)范里可能屬于"元數(shù)據(jù)不合規(guī)",得用專業(yè)工具清干凈。
eCTD最大的價值之一就是超鏈接導(dǎo)航。比如臨床研究報告里引用了模塊三的某份原料藥質(zhì)檢報告,理論上應(yīng)該是點一下就能跳過去。但做起來才知道多麻煩。
鏈接分兩種:一種是內(nèi)部交叉引用(Cross-Reference),一種是外部跳轉(zhuǎn)(External Link)。前者在同一個PDF內(nèi)部,后者是跳轉(zhuǎn)到另一個文件。做鏈接的時候,路徑必須是相對路徑,不能用絕對路徑,否則換個電腦環(huán)境就失效。
而且,鏈接目標(biāo)必須是具體的段落或頁面,不能鏈到整個文件的開頭。比如說你引用了穩(wěn)定性數(shù)據(jù)第3批的結(jié)果,就得精準(zhǔn)定位到那份PDF的原始數(shù)據(jù)表格那一頁,而不是讓讀者自己翻。
康茂峰的技術(shù)規(guī)范里有個硬性要求:每個鏈接在發(fā)布前必須全部點一遍測試。聽起來很笨對吧?但這是最保險的辦法。軟件自動生成的鏈接有時候會錯位,特別是在文檔經(jīng)過多輪修訂后,頁碼變了,但鏈接沒更新,就會出現(xiàn)"牛頭不對馬嘴"的情況。

發(fā)布前跑驗證是標(biāo)準(zhǔn)動作。業(yè)界常用的驗證工具會輸出一份報告,告訴你哪里錯了、哪里警告。但很多人有個誤區(qū)——覺得只要顯示"Pass"就可以提交了。
其實吧,驗證工具也是有局限性的。它能檢查XML骨架是否完整、文件是否存在、超鏈接語法是否正確,但有些邏輯錯誤查不出來。比如:
所以在康茂峰的操作流程里,驗證報告只是第一步,后面還必須有人工的邏輯審查。特別是生命周期管理(Life Cycle Management)的操作,比如增補、替換或刪除文件,這些動作在XML里體現(xiàn)為特定的操作指令,錯了就很難撤回。
大禮包打成ZIP之前,得考慮一下文件大小。很多申報系統(tǒng)有單文件大小限制,也有總大小限制。如果是一份幾百頁的臨床研究報告,直接塞進去可能超過100MB,得按章節(jié)拆分成多個PDF。
但拆分也有講究。不能隨心所欲地劈成兩半,得按照內(nèi)容邏輯切。比如按章節(jié)3.2.P.5.2切到3.2.P.5.3,不能把一個表格攔腰斬斷。拆分后的文件命名還要保持連續(xù)性,讓審評老師一看就知道這是第幾部分。
表格太多也是個大問題。有些質(zhì)量標(biāo)準(zhǔn)的表格特別寬,A4紙橫著都放不下,這時候得考慮是用A3尺寸,還是拆列顯示。不管怎么調(diào),必須保證打印出來(雖然eCTD是電子的,但審評老師可能會打印看)或者放大到150%時還能看清。
如果你同時申報多個國家,eCTD的發(fā)布就更復(fù)雜了。雖然ICH搞了個統(tǒng)一標(biāo)準(zhǔn),但各國藥監(jiān)局都加了自己的"地方特色"。
比如模塊一的區(qū)域信息,中國要求特定的申請表和說明函,美國要Form 356h,歐盟又是另一套Cover Letter的格式。更頭疼的是技術(shù)細節(jié):美國對書簽的展開層級有要求,歐盟對PDF的版本號顯示位置有規(guī)定,中國對掃描件的公章清晰度有特定標(biāo)準(zhǔn)。
在康茂峰處理的多地區(qū)申報項目中,我們通常會做基礎(chǔ)包+區(qū)域包的策略。核心數(shù)據(jù)(模塊二到五)保持全球統(tǒng)一,模塊一和某些特定文件按國家定制。發(fā)布的時候得特別小心,別把美國的文件塞進中國的包里,這種低級錯誤真要命。
說幾個真實的場景吧(當(dāng)然具體客戶信息得保密)。
有一次,客戶辛辛苦苦做了三個月的資料,發(fā)布前最后一分鐘發(fā)現(xiàn),所有PDF的書簽都指向了本地C盤的臨時文件夾。在他們自己的電腦上測試一切正常,一傳到審評系統(tǒng)全瞎了。原因是制作軟件默認用了絕對路徑,而客戶沒改成相對路徑。結(jié)果整個包得退回重做,耽誤了整整兩周。
還有一次,某個項目用了特殊符號在文件名里,看起來是個普通的橫杠,其實是Unicode里的某種特殊連接符。驗證工具沒報錯,但上傳到CDE的系統(tǒng)后顯示亂碼,導(dǎo)致文件無法關(guān)聯(lián)。
最冤的是超鏈接循環(huán)引用——A文件鏈到B,B文件鏈回A,這樣在PDF閱讀器里一點就死循環(huán)或者報錯。這種問題手工檢查很難發(fā)現(xiàn),得有專門的工具掃描。
所以啊,我們康茂峰內(nèi)部有個不成文的規(guī)矩:發(fā)布前必須"冷靜期"。就是所有文件做完后,放一晚上,第二天再檢查。人在疲勞的時候,看著滿屏幕的PDF和XML,真的會"視而不見",明明有錯也看不出來。隔一晚上,或者換個同事交叉檢查,效果完全不一樣。
說了這么多技術(shù)細節(jié),其實最想說的是心態(tài)。eCTD發(fā)布不是終點,而是長跑的最后一公里。這時候最容易急躁,想著"終于做完了快點發(fā)出去",結(jié)果在最簡單的環(huán)節(jié)翻車。
記得留足時間做最終驗證。別指望一次就能過,通常第一次驗證都會報幾個警告或錯誤,有的是真錯誤,有的只是系統(tǒng)過于敏感。你需要時間去甄別哪些是必須改的,哪些是可以解釋的。
還有,備份很重要。在點"生成最終包"之前,確保你所有的源文件、中間版本、參考資料都有備份。萬一發(fā)布后發(fā)現(xiàn)致命錯誤(比如發(fā)現(xiàn)某份批記錄貼錯了),還能有補救的余地。
最后,也是最容易被忽略的:檢查你的申報信(Cover Letter)。eCTD是結(jié)構(gòu)化的,但 Cover Letter 是自由文本,這是你和審評老師"說話"的唯一機會。把這次提交的內(nèi)容、變更說明、特殊事項交代清楚,別讓人家去海量文件里猜你的意圖。
做好這些準(zhǔn)備,按下發(fā)布按鈕的時候,至少能睡個安穩(wěn)覺。至于審評老師后續(xù)會提什么問題,那就是另一個故事了。但至少,你把能控制的環(huán)節(jié)都控制住了,剩下的,交給專業(yè)和運氣吧。
