
為了確保專利文獻標題和摘要中術語翻譯正確,并保證同一領域技術術語翻譯一致,需要建立術語庫,包括中文術語、英文術語和中英文術語所屬領域等信息。
通過專利文本自動分析系統,借助語言知識庫,利用專家知識處理器對專利數據庫中的專利全文數據進行提取和結構化表示,生成專家知識庫,并對專家知識庫進行自動更新;利用本體處理器從專利數據庫中的專利全文數據中提取本體、識別本體關系,生成本體知識庫,并對本體知識庫進行自動更新。
在檢索專利信息時,可采用塊檢索策略結合追蹤檢索策略,先確定檢索目標的技術方案,收集和整理檢索要素,構建檢索表達式,然后根據檢索結果調整檢索策略、修正檢索表達式,以快速、準確地了解發明人的在先專利以及現有技術。
采用全篇專利文獻的機器翻譯方法,基于模板或規則方法或權重方法得到短語;然后通過短語頻率或修正的短語頻率或記憶借鑒等方法進行短語修正,最終得到識別名詞短語RNP;對全文中識別名詞短語標注RNP信息,翻譯識別名詞短語RNP并在短語存儲器中保存相關信息;之后對全文進行逐句翻譯,在翻譯時,對于標注RNP的短語不再展開,直接從短語存儲器中取譯文;翻譯完畢后,根據原文的標題信息進行按順序輸出,這樣可以獲取專利文獻中常用復雜名詞短語,減少含有常用復雜名詞短語的句子的分析時間,提高翻譯速度,同時保證常用復雜名詞短語翻譯的一致性。
在醫藥專利翻譯等特殊領域,由于涉及敏感的數據保護問題,需要采取嚴格篩選翻譯人員、采用安全的翻譯流程、實施數據訪問控制、選擇可信賴的翻譯機構、加強員工培訓與意識提升等措施,同時可利用加密技術、數字水印、數據脫敏、翻譯管理系統(TMS)等技術和工具提升數據保護的效率和可靠性,并遵循相關的法規和標準,如《通用數據保護條例》(GDPR)、《健康保險可攜性和責任法案》(HIPAA)等。