如何把一个词典的词按照汉字编码排序

tianjiao85 2009-08-06 11:12:40
RT,分词加词典,当要把词按照汉字编码排序,请大侠们给个思路。
若能给示例代码,感激不尽,C++,JAVA实现都可以。。
...全文
94 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
sallior 2009-08-18
  • 打赏
  • 举报
回复
补充一下,排出来的顺序是按照汉语拼音的顺序,与字典同

谢楼主赏分了
sallior 2009-08-18
  • 打赏
  • 举报
回复
回楼主,好几天没来不好意思
我是2楼,
可以按照汉字编码排序,我写的工具里用了这个,你不妨试下
sallior 2009-08-07
  • 打赏
  • 举报
回复

排序就可以呀,先重载一下符号
bool operator<(const char[] &a,const char[] &b)
{
return _stricmp(a,b)<0 ;
}


bool operator>(const char[] &a, const char[] &b)
{
return _stricmp(a,b)>0
}

把字典的词放入数组或vector,
比如用数组吧,int array× = new int[max];
然后用sort排序就ok了
sort(array, array+max);
neohope 2009-08-07
  • 打赏
  • 举报
回复
你说的汉字编码是指什么啊?
区位码吗?
还是拼音顺序?
还是笔画?

还是gb2312那种编码啊?

楼上的unicode直接比较也是顺序啊
tianjiao85 2009-08-07
  • 打赏
  • 举报
回复
没有人顶,,,,
tianjiao85 2009-08-07
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 sallior 的回复:]
排序就可以呀,先重载一下符号
bool operator <(const char[] &a,const char[]  &b)
{
return _stricmp(a,b) <0 ;
}


bool operator>(const char[] &a, const char[] &b)
{
return _stricmp(a,b)>0
}

把字典的词放入数组或vector,
比如用数组吧,int array× = new int[max];
然后用sort排序就ok了
sort(array, array+max);

[/Quote]
谢谢,
你这个是按照unicode编码的大小排序的吧,这个当然知道,如何按照汉字编码排序呢?
贝隆 2009-08-07
  • 打赏
  • 举报
回复
飘过

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧