Hi, all, KDE team 寫信來詢問說是否將我們 zh_TW.Big5 的翻譯全部轉換成 utf-8 格式? 其實這問題我們滿早前就討論過了, 只是未獲得共識,所以尚未有所行動。 現在大家覺得如何呢?
我覺得主要的考量是若轉換為 utf-8, 我們就不應使用 zh_TW.Big5 這個名字了。 或許應改為 zh_TW. (也許有人會問為何不用 zh_TW.utf8 ? 其實這是沒有必要的。因為 zh_TW 就已包含了 使用各種 encoding 的可能性)
The size of the po file would increase by up to 1.5x of its original size. 2-byte Big-5 character = 3-byte UTF-8 character
The speed may be dragged down by converting UTF-8 back to Big-5: Load UTF-8 .po string -> Convert to Big-5 -> Pass onto Qt -> Display the string using Big-5 font
Why not use Unicode or UCS (ISO 10646) instead of UTF-8?
Yuting
----- Original Message ----- From: Chih-Wei Huang cwhuang@linux.org.tw To: zh-l10n@linux.org.tw Sent: Friday, April 06, 2001 9:28 AM Subject: [zh-l10n] [Fwd: KDE translations]
Hi, all, KDE team 寫信來詢問說是否將我們 zh_TW.Big5 的翻譯全部轉換成 utf-8 格式? 其實這問題我們滿早前就討論過了, 只是未獲得共識,所以尚未有所行動。 現在大家覺得如何呢?
我覺得主要的考量是若轉換為 utf-8, 我們就不應使用 zh_TW.Big5 這個名字了。 或許應改為 zh_TW. (也許有人會問為何不用 zh_TW.utf8 ? 其實這是沒有必要的。因為 zh_TW 就已包含了 使用各種 encoding 的可能性)
-- ~ Chih-Wei Huang (cwhuang@linux.org.tw) 'v' CLDP Project : http://www.linux.org.tw/CLDP/ (Coordinator) // \ CLE Project : http://cle.linux.org.tw/CLE/ (Developer) /( )\ I18N Project : http://i18n.linux.org.tw/ (Translator) ^`~'^ HomePage : http://www.cwhuang.idv.tw/
这是我第一次参加gnu软件的翻议工作,我把一个集成开发环境工具motor翻译成了gb2312的了,我不知是否有工具可以帮我省省力气将它翻议成big5码的.
Yuting Kuo 寫道:
The size of the po file would increase by up to 1.5x of its original size. 2-byte Big-5 character = 3-byte UTF-8 character
Yes. 但以現在的硬碟或記憶體容量這實在是微不足道。
The speed may be dragged down by converting UTF-8 back to Big-5: Load UTF-8 .po string -> Convert to Big-5 -> Pass onto Qt -> Display the string using Big-5 font
有點錯誤。 Qt 內部全部以 Unicode(UCS2) 做儲存、處理。 所以不管是 UTF-8 or Big5 po 全部也都會轉換成 Unicode。反而 UTF-8 -> Unicode 轉換比較直接, 我相信速度更快。
再說以目前的電腦速度來說這些也都是微不足道的。
Why not use Unicode or UCS (ISO 10646) instead of UTF-8?
UCS2(Unicode) or UCS4 是內碼, 是程式內部處理使用的(使用 widechar 的情形) 再說拿 Unicode 來存 po 檔的話像 gettext 等 tool 根本也無法處理。 在程式之間傳輸、儲存至媒體,通常使用交換碼。 UTF-8, UTF-16, UTF-7 才是交換碼。 (UTF means Unicode Transfer Format)
UTF-16 or UTF-7 各有所限制。 以 UTF-8 做為 UCS4 的交換碼已是趨勢。
建議您看一下這篇文件 http://www.cl.cam.ac.uk/~mgk25/unicode.html
目前 kde-i18n 中 CJK 的部份, 大陸、日本、韓國都已將 po 檔轉換成 UTF-8. 只剩台灣仍在使用 local encoding. (請 checkout kde-i18n 模組,看一下各國翻譯中, messages 目錄下的 charset 便知。) Gnome-i18n 那邊也有聲音要求各 translation team 將 po 檔通通轉換成 UTF-8。 我們應及早正視這個問題! (否則也許到時 KDE, GNOME 都會將我們的翻譯 mark 成 broken)
zh-l10n-archive@lists.slat.org