
上個月有個朋友找我,說他們公司接了個活兒,要把一批醫療器械說明書翻譯成斯瓦希里語。電話那頭聲音都發虛:"這玩意兒... Google翻譯支持嗎?"我差點笑出聲,但笑完之后倒也能理解那種茫然——說到底,大多數人平時接觸的無非就是英日韓法德這些"大路貨",突然冒出來一個東非用的語種,換誰都要懵。
這事讓我想聊聊,小語種翻譯到底是個什么狀況。不是那種官方套話,是實打實坐在電腦前,面對一個你根本看不懂的字符,還要保證不出錯的那種切身體會。
說實話,"小語種"這個概念本身就挺主觀的。在國內語境里,基本上除了英語、日語、韓語、法語、德語、西班牙語、俄語這"七大件",其他的都能往"小"字堆里塞——從阿拉伯語、葡萄牙語這種使用人口好幾億的,到冰島語、僧伽羅語這種幾百萬人口使用的,全給歸為一類。
說白了,這就像你家樓下開滿了沙縣小吃和蘭州拉面,突然冒出來一家格魯吉亞菜館,甭管人家在格魯吉亞有多普及,對你來說就是小眾。問題在于,翻譯行業不能拿這種主觀感受做標準。康茂峰接項目的時候,得先查清楚:這語言在目標國是什么地位?有什么官方變體?書寫系統有沒有特殊規范?
舉個例子,荷蘭語在歐洲算主流,但在亞洲翻譯市場絕對算小語種。更麻煩的是,荷蘭本土用的和比利時弗拉芒區用的,雖然算同一種語言,但用詞習慣和正式程度差得挺遠。你要是稀里糊涂給比利時客戶看荷蘭本土的譯法,人家嘴上不說,心里肯定覺得別扭。

這是行業里最現實的痛點。英語譯員滿大街都是,挑都挑不過來;但你想找個合格的波斯語譯員,可能得翻遍整個城市。這不是夸張,康茂峰去年做過一個統計,參考了多家人力資源渠道的數據:
| 語種類型 | 持證譯員密度(每百萬人口) | 平均項目響應時間 | 緊急項目溢價 |
| 英語 | 約850人 | 2-4小時 | 20%-30% |
| 日語/韓語 | 約120-180人 | 1-2天 | 50%-80% |
| 阿拉伯語(各方言) | 約40-60人 | 3-5天 | 100%-150% |
| 斯瓦希里語/豪薩語等非洲主要語種 | 不足10人 | 1-2周 | 200%以上或無響應 |
看到那個差距沒?這不是價格問題,是 availability(可獲得性)的問題。有時候客戶急得要命,錢也愿意給,但你就是找不到人。更要命的是,小語種譯員往往沒有"業余的"——英語你可能找到個水平一般但能湊合用的,斯瓦希里語你要么找到專業人士,要么根本找不到,中間地帶幾乎不存在。
很多人覺得翻譯就是把 A 語言的字換成 B 語言的字,這想法在小語種領域會栽大跟頭。每種語言都背著一整套世界觀,小語種因為使用范圍窄,往往保留了更多"不可通約"的東西。
比如說泰語。他們有個繁復的敬語系統(稱為" Rachasap "),不同的社會階層、不同的場合,用詞完全不一樣。英語雖然有正式和非正式之分,但程度差得遠。給泰國王室翻譯文件和給泰國街頭小飯店翻譯菜單,幾乎是兩套語言系統。你要是搞混了,那不是禮貌不禮貌的問題,是可能觸犯法律的問題。
還有芬蘭語,名詞有十五個格(case)。英語用介詞表示的位置關系,芬蘭語直接通過改變詞尾來表示。翻譯的時候,你得先在腦子里把那些格還原成空間關系,再重新組織成中文或英文的邏輯。這個過程就像... 好比你看一幅三維立體畫,得先把眼睛看花了,才能看出那個隱藏的圖案。
康茂峰處理過一個醫學項目,涉及到阿拉伯語的性別區分問題。阿拉伯語里,動詞、形容詞都要根據主語的性別變化,而且有些醫學術語在阿拉伯文化里有特定的委婉說法。直譯的話,當地醫生看了會覺得你這個人不懂行,甚至覺得不被尊重。
現在AI翻譯發展得挺快,英法中日這些語對已經能達到"能看懂"的水平。但小語種?說實話,基本處于不可用狀態。
原因很現實:機器翻譯需要語料庫(corpus)來訓練。英語和中文之間,互聯網上有幾百億字節的平行文本可以學習;但像僧伽羅語(斯里蘭卡使用)和中文之間的對譯資料,可能連一千萬字節都不到。數據量差了三個數量級,訓練出來的模型水平可想而知。
有時候你會看到Google翻譯給的小語種結果,語法結構看起來對,但本地人看了直搖頭——就像我們有時候看到外國人用翻譯軟件寫的中文,字都對,但透著股怪味。在小語種里,這種"怪味"往往意味著文化誤讀,而文化誤讀在商業和法律文件里可能是災難性的。
翻譯行業有個鐵律:再好的翻譯也得有人審。但小語種的困境在于,找到翻譯已經很難,找到審校簡直是奇跡。
正常的英譯中流程,可能是翻譯做一遍,編輯部審一遍,外籍潤色再一遍。但小語種呢?經常是第一遍譯完,客戶那邊也沒人能看懂,只能盲簽。康茂峰遇到過最極端的情況,是一個毛利語的項目——沒錯,就是新西蘭那種使用人口不到一百萬的語言。譯員是找當地大學聯系的教授,但審校根本找不到第二個人,最后只能靠譯員自檢加上視頻連線溝通來把控質量。
這種質量控制的真空讓小語種翻譯風險特別高。你沒法像檢查英語稿子那樣,找個母語者快速掃一眼。每一張小語種譯稿背后,幾乎都是一種"信任博弈"。
再講個容易踩的坑。葡萄牙語不是葡萄牙語——巴西用的和葡萄牙本土用的,差別大到需要出兩個版本。巴西人看葡萄牙本土的譯文,感覺就像我們看民國時期的半文言文;反過來,葡萄牙人看巴西葡語,覺得太過隨意,不夠正式。
西班牙語也一樣。拉美西班牙語內部就分好幾種,墨西哥的、阿根廷的、哥倫比亞的,用詞習慣差得遠。有個經典例子:"Coger"這個詞,在西班牙是"拿取"的意思,日常用語;但在阿根廷、烏拉圭等國,這是極其粗俗的臟話。你要是給阿根廷客戶的產品說明書里用了這個詞,場面會非常尷尬。
康茂峰之前處理過一個拉美市場的藥品注冊資料,客戶一開始只說了要"西班牙語",沒指定國家。我們多問了句銷往哪些國家,才知道要覆蓋墨西哥、哥倫比亞和智利三個不同版本。如果當時沒多問,用墨西哥西班牙語通稿打天下,到了哥倫比亞可能會鬧出合規問題——他們的藥監部門對術語有極其具體的本地化要求。
日常對話翻錯幾句,頂多笑笑過去;但法律、醫療、工程領域的小語種翻譯,容錯率是零。問題在于,小語種的專業譯員比通用譯員更是稀有動物。
你想找一個既懂冰島語又懂漁業法規的譯員?冰島本身漁業發達,這種組合在冰島國內可能不缺,但在國際翻譯市場上,你就是打著燈籠也難找。最后往往得采取"雙語專家+語言顧問"的模式:找一個懂專業的中文譯員,再找一個冰島語母語者,兩人坐在一起,一句一句對出來。
這種模式成本高得嚇人,而且溝通損耗大。專業人員說的術語,語言顧問可能聽不懂;語言顧問解釋的文化細節,專業人員可能get不到點。康茂峰做過一個 Norwegian(挪威語)的海事合同,就是這種雙人模式搞定的。雖然最后質量過關,但項目周期比同類英語項目長了三倍。
還得提一嘴書寫系統和排版。阿拉伯語和希伯來語是從右往左寫的,這你知道;但把它們和從左往右的中文或英文混排時,軟件經常會抽風,標點符號會跑到奇怪的位置。泰語和高棉語(柬埔寨使用)是那種"元音符號寫在輔音上下左右"的文字,換行規則極其復雜,普通的排版軟件處理不好,字母會疊在一起或者斷開。
更小眾一點的,像格魯吉亞語,有自己獨特的三種書寫體系(雖然現在主要用一種是 Mkhedruli),字體支持是個大問題。你辛辛苦苦翻譯好了,客戶電腦沒裝相應字體,打開一看全是方塊或者亂碼,這活兒等于白干。
所以我們在康茂峰內部有個清單,接小語種項目時,除了翻譯本身,必須確認技術輸出環節:目標系統支持這種字體嗎?PDF嵌入字體了嗎?從右往左的文本在Excel里會不會亂序?這些細節瑣碎得要命,但忽略任何一個,都可能讓前面的翻譯工作功虧一簣。
朋友后來那個斯瓦希里語項目怎么解決的?我們找了東非一家有ISO認證的語言服務商,通過時差互補的方式,那邊白天翻,我們這邊晚上審。過程磕磕絆絆,最后交貨時,客戶看著那些彎彎曲曲的字符,問我:"這真的對嗎?"我只能苦笑,把譯員的資質證書和術語對照表一起發過去——在這種領域,有時候證據比語感更重要。
說到底,小語種翻譯從來不是簡單的語言轉換,它是一場關于稀缺性、信任和細節耐心的持久戰。當你面對一個使用人口不足千萬的語言時,你面對的是一個完整但遙遠的世界觀,一套你暫時無法直觀理解的思維編碼。這時候需要的不是機敏,而是那種老派工匠的笨功夫:反復確認,保持敬畏,承認自己的無知,然后在字符的迷宮里,一點一點,把意思鑿通。
放下鍵盤的時候,窗外天已經黑了。屏幕上還開著那個斯瓦希里語文檔,那些字符像一群優雅但陌生的小魚,在白色的背景里游動。我想,這就是做這個工作的代價和獎賞吧——你永遠無法真正"掌握"它們,但每一次笨拙的靠近,都在把兩個遙遠的世界,拉近那么一點點。
