社区
数据结构与算法
帖子详情
如何把一个词典的词按照汉字编码排序
tianjiao85
2009-08-06 11:12:40
RT,分词加词典,当要把词按照汉字编码排序,请大侠们给个思路。
若能给示例代码,感激不尽,C++,JAVA实现都可以。。
...全文
98
7
打赏
收藏
如何把一个词典的词按照汉字编码排序
RT,分词加词典,当要把词按照汉字编码排序,请大侠们给个思路。 若能给示例代码,感激不尽,C++,JAVA实现都可以。。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sallior
2009-08-18
打赏
举报
回复
补充一下,排出来的顺序是按照汉语拼音的顺序,与字典同
谢楼主赏分了
sallior
2009-08-18
打赏
举报
回复
回楼主,好几天没来不好意思
我是2楼,
可以按照汉字编码排序,我写的工具里用了这个,你不妨试下
sallior
2009-08-07
打赏
举报
回复
排序就可以呀,先重载一下符号
bool operator<(const char[] &a,const char[] &b)
{
return _stricmp(a,b)<0 ;
}
bool operator>(const char[] &a, const char[] &b)
{
return _stricmp(a,b)>0
}
把字典的词放入数组或vector,
比如用数组吧,int array× = new int[max];
然后用sort排序就ok了
sort(array, array+max);
neohope
2009-08-07
打赏
举报
回复
你说的汉字编码是指什么啊?
区位码吗?
还是拼音顺序?
还是笔画?
还是gb2312那种编码啊?
楼上的unicode直接比较也是顺序啊
tianjiao85
2009-08-07
打赏
举报
回复
没有人顶,,,,
tianjiao85
2009-08-07
打赏
举报
回复
[Quote=引用 2 楼 sallior 的回复:]
排序就可以呀,先重载一下符号
bool operator <(const char[] &a,const char[] &b)
{
return _stricmp(a,b) <0 ;
}
bool operator>(const char[] &a, const char[] &b)
{
return _stricmp(a,b)>0
}
把字典的词放入数组或vector,
比如用数组吧,int array× = new int[max];
然后用sort排序就ok了
sort(array, array+max);
[/Quote]
谢谢,
你这个是按照unicode编码的大小排序的吧,这个当然知道,如何按照汉字编码排序呢?
贝隆
2009-08-07
打赏
举报
回复
飘过
电子
词
典
的数据结构设计.pdf
#资源达人分享计划#
MYSQL 汉子字典
词
典
数据库合集
MYSQL 汉子字典
词
典
数据库合集 ,UTF8格式 word表是字典 words表是
词
典
oracle数据库中
汉字
排序
方法
对于需要存储中文的oracle数据库,我们在查询时如果需要按照
汉字
拼音对结果集进行
排序
时应该怎么做?看完本文档你就知道了。
汉字
二级字库 3008个字 部首
排序
txt
汉字
二级字库 共3008个字,按部首
排序
: 亍丌兀丐廿卅丕亘丞鬲孬噩丨禺丿匕乇夭爻卮氐囟胤馗毓睾鼗丶亟鼐乜乩亓芈孛啬嘏仄厍厝厣厥厮靥赝匚叵匦匮匾赜卦卣刂刈刎刭刳刿剀剌剞剡剜蒯剽劂劁劐劓冂罔亻仃仉仂仨仡仫仞伛仳伢佤仵伥伧伉伫佞佧攸佚佝……
wbx.rar_五笔_五笔输入法_反编译_
汉字
编码
_输入法
一组处理五笔输入法码表文件的小程序 chpy.c 将中文字符串自动转换成拼音的形式. 将中文的文件名转换成拼音的文件名- PY_FILE为WIN95全拼输入法反转换生成的拼音
编码
文件 delsingle.c 删除包含单个
汉字
的行 gb2312.c 生成所有GB2312码
汉字
genwbsig.c 生成所有GB2312码
汉字
的五笔
编码
py.c 去除imegen反编译后的TXT文件中
词
的
编码
,只剩下字的
编码
wbadd.c 在已经存在的五笔
编码
文件中加入新增
词
组, 五笔
编码
wbcombine.c 合并2行
编码
相同的
词
组 wbone.c 从重码的
词
组中挑选一个 wbword.c 从
词
组列表中生成五笔的
编码
,要求与原来已经有的五笔
词
组不重复 wbx2jj.c 将WINDOWS五笔
编码
文件(wbx.txt)转换成五笔加加用户
词
典
编码
文件的形式。 wbx.c 将wbxadd.txt中的字加入到wbx.txt中。只加入最后一个 > 字符后的单
词
. wbxchk2.c 检查五笔
编码
文件中在前后几行内有无重复的情况,若有,则去掉。 wbxchk3.c 对于五笔
编码
文件中具有相同
编码
的几个
词
组的情况,让短长度的
词
组放到前面来。 wbxchk.c 检查一个五笔输入法的
编码
文件有无错误的
词
组
编码
.将有错误的
编码
生成另一个文件。 wbxconv.c 转换wbxadd.txt 到智能五笔的用户
词
组文件。 wbxpri.c 将相同长度的重码组
词
排序
。
数据结构与算法
33,027
社区成员
35,335
社区内容
发帖
与我相关
我的任务
数据结构与算法
数据结构与算法相关内容讨论专区
复制链接
扫一扫
分享
社区描述
数据结构与算法相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章