能否利用軟件工具來加強軟件翻譯效率呢?

一直以來,在香港缺乏人手協助翻譯軟件界面及文件,希望不只是由 Abel 來做吧,我在想有沒有方法可以加強軟件翻譯效率呢?

針對軟件界面翻譯工作,我在想以下是否適合呢:

  1. 建立網上中央字庫來方便以程式來翻譯及統一該語系的翻譯;
  2. 建立半自動網上/GUI 翻譯軟件,軟件可向翻譯者提供翻譯意見;
  3. 有了 1 和 2 後,當在初步完成翻譯時,檢查翻譯是否恰當;

以軟件來協助翻譯:

  • 字庫只紀錄一至三個英文字相應的意思;
  • 一個英文字可以代表多個意思;

統計 po 檔內相同字數的字串數目:

$ awk ‘/^msgid/ {  sub(/^msgid \”/,””); sub(/\”$/,””); print NF }’ zh_HK.po | sort | uniq -c

$ grep “^msgid ” zh_HK.po | cut -f 2- -d ‘ ‘ | sed -e “s/^\”//” -e “s/\”$//” | awk ‘{ print NF }’ | sort | uniq -c

以下是 wordpress 2.2 zh_HK po 檔的結果,不過應該找一大堆 zh_HK .po 來研究。

189 0
275 1
40 10
18 11
7 12
5 13
3 14
344 2
234 3
107 4
64 5
68 6
49 7
39 8
39 9

顯示特定字數的字串:

$ grep “^msgid ” zh_HK.po | cut -f 2- -d ‘ ‘ | sed -e “s/^\”//” -e “s/\”$//” | awk ‘NF == 2 { print $0 }’ | sort