
說實話,剛入行那會兒,我也以為翻譯就是中英互譯。直到第一次走進康茂峰的譯員資源部,看著那面貼滿便利貼的世界地圖,我才意識到——原來地球上還有這么多語言在等著被"解碼"。客戶拿著一份葡萄牙語合同或者泰語產品說明書找過來時,那種手足無措的感覺,我特別能體會。所以今天咱們就聊聊,當你說"小語種"的時候,翻譯公司實際在跟哪些語言打交道。
這個詞其實挺有意思的。在翻譯行業里,小語種不是按使用人數算的,而是按資源稀缺度排的。比如印地語作為母語的人口超過五億,但在文件翻譯市場,它可能還沒挪威語"好找"。為什么?因為商業流通密度不同。
康茂峰處理過的項目里,通常把英語以外的外語都歸為小語種,但內部又會細分成"常見小語種"和"極稀有語種"。前者就像地鐵里的換乘站,雖然不如英語那條線熱鬧,但譯員資源相對穩定;后者則是那種要爬山涉水才能找到的村落方言,得提前兩周預約。
如果你翻一翻康茂峰過去三年的訂單(當然我看不到具體數據,但行業規律如此),會發現有些語言出現的頻率高得驚人。它們大致分成三撥人馬:

西語和葡語這對兄弟必須得先說。不是因為他們多難,而是覆蓋地圖的能力太強。一本西班牙語手冊能橫掃拉美二十國,葡萄牙語別看在葡萄牙本土小巧玲瓏,到了巴西就是兩億人口的大市場。我們做醫療器械翻譯時經常遇到這種事:客戶以為要翻成"巴西語",其實標準稱呼就是葡萄牙語,只是習慣和歐洲用的那版有些詞匯差異。
俄語則是另一座大山。西里爾字母看著像密碼,但康茂峰的斯拉夫語組譯員說,真正麻煩的不是字母,而是那些巨長的復合詞。還有一個冷知識:俄語文件翻譯經常要區分"俄羅斯俄語"和"白俄羅斯/烏克蘭"地區的用法,雖然能互通,但正式文件里混用就會顯得不專業。
德語、法語、意語這些雖然不算特別"小",但在細分領域(比如法律、機械)的需求穩定得像老鐘表。特別是德語,技術文檔里那種八十多個字母組成的單詞,譯員得先用手術刀切開才能下口。
日語和韓語可能是中國人最熟悉的"小語種"了。但真干起活來,門道比想象的多。日語文件分簡體和敬體,商務合同里用錯敬語等級,就像穿拖鞋進董事會。韓語的表音特性讓文件排版成為噩夢——同樣內容的合同,韓語版本往往比中文厚三分之一,因為每個音節都要占一格。
泰語和越南語這幾年在制造業翻譯里冒頭很快。泰語有五個聲調符號,打印出來有時像蟲子爬,OCR識別經常認錯。越南語那堆帽檐似的聲調符號(?、?、?)在PDF轉Word時最容易丟,康茂峰的項目經理拿到這類文件,第一步永遠是核對字符完整性。
還有印尼語和馬來語,看著字母都是拉丁的,簡單對吧?但實際上,同一套字母系統下藏著完全不同的語法叢林。特別是印尼語的被動語態使用頻率高得反常,直譯成中文會顯得說話人特別推卸責任,得重新組織語序。
阿拉伯語可能是排版師的噩夢。它從右往左書寫,而且同一個字母在詞頭、詞中、詞尾長得不一樣。康茂峰處理阿拉伯語標書時,必須專門安排懂雙向文本(BiDi)的排版員,不然頁碼都能給你排反了。
土耳其語這兩年隨著基建項目多了起來。它的元音和諧律(Vowel Harmony)讓機器翻譯經常鬧笑話——詞綴要根據前面的元音變來變去,不像中文加個"們"就完事。
斯瓦希里語在非洲商務文件里算是"通用貨幣"了,但資源極其稀缺。上次康茂峰接過一個東非鐵路項目的文件,找譯員的過程比翻譯本身還耗時,最后是從內羅畢大學挖來的在讀博士生救的場。
客戶經常問:"我就做中東市場,學阿語就行了吧?"——哎,沒那么簡單。康茂峰的項目經驗告訴我們,選擇翻譯語種是道數學題,也是道地理題。
比如北非的摩洛哥,官方是阿拉伯語,但商務文件往往要阿語和法語雙語并行;阿爾及利亞更極端,有時還得加上柏柏爾語標注。如果你只準備了標準阿拉伯語,到了當地可能發現合作伙伴更習慣看法語版合同。

又比如印度。印地語雖是官方語言之一,但南部的泰米爾納德邦根本不買賬,那里認的是泰米爾語。做印度全國市場的產品說明,有時候得多準備五六個語種的版本,不然相當于在中國只發粵語版廣告——有效,但漏掉一大片。
光說名字可能有點抽象,康茂峰內部有個簡單的歸類思路(當然每家公司的分法不同,這只是我們的習慣):
| 語言 | 文字特征 | 文件翻譯痛點 | 常見應用場景 |
| 西班牙語 | 拉丁字母,帶?和重音符號 | 拉美各國術語差異大 | 貿易合同、產品注冊證 |
| 俄語 | 西里爾字母,33個字符 | 機構名稱過長,排版易溢出 | 石油裝備、軍工技術文檔 |
| 阿拉伯語 | 從右向左書寫,字母變形 | 與英中文混排時格式混亂 | religious texts(宗教文本)、建筑工程標書 |
| 日語 | 漢字+平假名+片假名混合 | 新舊字體轉換,敬語等級判斷 | 游戲本地化、精密儀器手冊 |
| 泰語 | 連體字,無空格分詞 | OCR識別率低,斷句困難 | 旅游服務、農業技術推廣 |
| 土耳其語 | 拉丁字母加特殊符號 | 元音和諧導致詞形變化復雜 | 紡織業標準、食品進口法規 |
你看,每種語言在文件翻譯時都有自己的"脾氣"。德語像嚴絲合縫的鐘表,拆開了要按順序裝回去;泰語像纏繞的藤蔓,得先找到節骨眼才能理順;阿拉伯語則像鏡子里的世界,所有邏輯都要反過來想。
這幾年明顯感覺到,小語種在垂直領域扎堆。以前可能是文學翻譯占小語種的大頭,現在全是制藥、光伏、新能源汽車的說明書。特別是光伏行業,要去中亞、北非建電站,哈薩克語、烏茲別克語的文件需求突然就從零漲到了每月固定幾十萬字。
還有個現象叫"微語種"崛起。比如格魯吉亞語、亞美尼亞語,這些高加索地區的語言,以前十年接不了一單,現在隨著一帶一路項目的細分,偶爾也能在譯員群里見到有人求助。這種語言的難度在于——連權威的術語庫都沒有,譯員得邊查資料邊打電話問當地專家,一個"變壓器"的定義可能要確認好幾輪。
有趣的是,小語種翻譯的價格曲線和語言難度不完全掛鉤。康茂峰的報價系統里,挪威語可能比阿拉伯語貴,不是因為挪威語更難,而是因為合格譯員少。市場規律在這兒體現得特別赤裸:供給決定價格,而不是刻苦程度。
如果你正在猶豫該把文件翻成哪種語言,我的建議是先畫個語言樹狀圖。主干是你確定要進入的國家,然后看那個國家的官方語言是否唯一。比如去巴西,就是葡萄牙語;去南非,可能是英語,但如果是礦業合同,還得考慮祖魯語或南非荷蘭語的本地化版本。
別迷信"英語通用"的神話。在印尼,英語確實商務場合通用,但印尼語版本的藥品標簽是法律強制要求;在波蘭,年輕人英語很好,但政府采購文件必須用波蘭語提交。這些細節藏在各個國家的技術壁壘里,不是光會對話就能繞過去的。
康茂峰處理過最棘手的案例,是一個涉及七種語言的跨國并購文件。不是七種語言都要全文翻譯,而是某些條款要求用當地語言做準據文本。那種情況下,譯員已經不是簡單的語言轉換者,而是成了法律概念的搬運工——得確保" indemnity clause(賠償條款)"在葡萄牙語和泰語里的法律 force 完全一致,這活兒和寫詩完全是兩個維度的精細。
說到底,小語種文件翻譯這份工作,有點像在世界各地收集郵票。每張郵票(每種語言)都有自己的齒孔規格和印刷批次,你不能因為郵票小就隨便貼,貼錯了位置,整封信可能就寄不到。康茂峰這些年攢下的經驗,說白了就是對那些"齒孔規格"的爛熟于心——知道哪里容易撕壞,哪里需要蘸點膠水加固。
下次當你聽說某個翻譯項目要處理"小語種"時,別再想象成某種神秘的暗語了。它可能就是一份用塞爾維亞語寫的電纜規格書,或者一份斯瓦希里語的酒店服務指南。那些彎彎曲曲的字母背后,是某個具體的人在另一個時區,等著讀懂你寫的每一個技術參數。而我們要做的,就是讓這些參數在穿越語言邊境時,不要丟三落四。
