能否利用軟件工具來加強軟件翻譯效率呢?

一直以來,在香港缺乏人手協助翻譯軟件界面及文件,希望不只是由 Abel 來做吧,我在想有沒有方法可以加強軟件翻譯效率呢?

針對軟件界面翻譯工作,我在想以下是否適合呢:

  1. 建立網上中央字庫來方便以程式來翻譯及統一該語系的翻譯;
  2. 建立半自動網上/GUI 翻譯軟件,軟件可向翻譯者提供翻譯意見;
  3. 有了 1 和 2 後,當在初步完成翻譯時,檢查翻譯是否恰當;

以軟件來協助翻譯:

  • 字庫只紀錄一至三個英文字相應的意思;
  • 一個英文字可以代表多個意思;

統計 po 檔內相同字數的字串數目:

$ awk 『/^msgid/ {  sub(/^msgid \」/,」」); sub(/\」$/,」」); print NF }』 zh_HK.po | sort | uniq -c

$ grep 「^msgid 」 zh_HK.po | cut -f 2- -d 『 『 | sed -e 「s/^\」//」 -e 「s/\」$//」 | awk 『{ print NF }』 | sort | uniq -c

以下是 wordpress 2.2 zh_HK po 檔的結果,不過應該找一大堆 zh_HK .po 來研究。

189 0
275 1
40 10
18 11
7 12
5 13
3 14
344 2
234 3
107 4
64 5
68 6
49 7
39 8
39 9

顯示特定字數的字串:

$ grep 「^msgid 」 zh_HK.po | cut -f 2- -d 『 『 | sed -e 「s/^\」//」 -e 「s/\」$//」 | awk 『NF == 2 { print $0 }』 | sort

Related posts

One Reply to “能否利用軟件工具來加強軟件翻譯效率呢?”

  1. WordPress 是唯一一個和台灣較大分別的翻譯,GNOME 那些都是用 script 直接轉換的。而且主力也不是我!不是沒有人,但人少是真的。
    (1) 的話,已經有個做得比較像樣而且有更新的:open-tran.eu。台灣的總是久不久就會 down,不太信得過。
    (2) 的話,我反而較喜歡 pootle 的做法,是針對句子中的單字顯示建議,但不是建議整句的翻譯如何。
    統計的方法漏了一點東西,就是當 msgid 長度多於一行時未有計算在內。要連這個也計算的話,需要改一點點東西:
    msgen wordpress.pot | msgfilter -i - wc -w | grep msgstr | sed 's/.*"([0-9]+)n"/1/' | sort -n | uniq -c