Search

8/05/2011

簡繁轉換 - Linux Wiki

簡繁轉換 - Linux Wiki
cconv - php extension


使用cconv轉換
http://code.google.com/p/cconv/
ubuntu用戶可以用命令“sudo apt-get install cconv”安裝。
cconv是建立在iconv之上,增加了詞語轉換能力,效果分析見後面。
使用cconv進行簡繁轉換的方法為:
cconv -f UTF8-CN -t UTF8-HK jian.txt -o fan.txt


不難發現,對於多解的字,OpenOffice.Org未轉換,iconv按單一規則轉換,而cconv與google翻譯則能正確轉換。
但是google翻譯未能保持原格式,而OpenOffice.Org、iconv和cconv則很好地保留了原格式。
另外,iconv不能處理混合編碼的文件。
使用cconv轉換20M含部分亂碼的文本文件耗時僅數秒,且效果非常理想,不會像iconv一樣遇到“ә”等非常規字符或亂碼字符時報錯停止轉換。(推薦使用)

沒有留言: