ICU中GB18030汉字排序问题求教

wgf098 2018-03-19 08:24:45
UTF8编码下, 使用ICU的排序功能,非常好用,默认就是按照拼音来排序;但是在换成GB18030编码后,排序就都是乱的了,不知道哪位大神能够帮忙解答?

现在在验证阶段,是在ICU自带的例子上稍微进行了修改后进行的排序。

例子目录为 icu/source/sample/coll,源coll.cpp编译后生成coll可执行文件,输入source和target后对两个字符串进行比较。

例如几个汉字:南,一,啊,鳌,丂

当locale是zh_cn.utf8的时候(当然汉字也为utf8编码),排序后的顺序就为:啊,鳌,丂,南,一;
当locale是zh_cn.gb18030时,几个汉字就是乱的,不是按拼音,也不是按笔画,也不是按编码字节。搞不清楚怎么回事。期待的结果是gb18030编码排序和utf8的一样。
...全文
454 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1,194

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 Informix
社区管理员
  • Informix社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧