如何统计文档中某个特定词组(比方说姓名)出现的次数== 不是字符,

CasterOxfd 2013-12-05 07:59:58
现在想要分析一部小说中不同人物出现的次数,,不是单个字符哦==
比如说神雕侠侣中杨过出现的次数。
找了不少资料和代码,发现大部分都是统计英文中单词出现的次数,而且英文中有空格可以用来分割,

但是一句话中要怎么提取出特定的一个词啊,(还要尽量考虑别名的情况,比如杨过还叫过儿啊===)

次数统计的方法可以用TreeMap就不用说了。。。
妈蛋的课设。。
求大神解答
...全文
998 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
dahlwuyn 2013-12-07
  • 打赏
  • 举报
回复
引用 11 楼 u011228889 的回复:
[quote=引用 10 楼 dahlwuyn 的回复:] 正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧
我现在用的是Scanner,可以扫描一个人名了。但是因为人名储存在数组中,用For循环的话,扫描完第一个人,Scanner就读到文件末尾了,有没有一种循环可以让Scanner多次扫描的,不然就只能同样代码写十遍了==[/quote]用那个可推回的输出流吧,或者随机读写文件流
dahlwuyn 2013-12-06
  • 打赏
  • 举报
回复
正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧
0小黑0 2013-12-06
  • 打赏
  • 举报
回复
你目前的方式应该是有多少组人名就会将整个文件扫描多少次吧,不能改成一次扫描匹配多组人名吗?
CasterOxfd 2013-12-06
  • 打赏
  • 举报
回复
引用 13 楼 zhu19870712 的回复:
推荐正则表达式
11楼问题求解答。。。
CasterOxfd 2013-12-06
  • 打赏
  • 举报
回复
引用 12 楼 huxiweng 的回复:
这个还是用全文检索吧。lucense
OH,不能再改了。。明天上午就要交了,今天还有一下午的课
0小黑0 2013-12-06
  • 打赏
  • 举报
回复
推荐正则表达式
teemai 2013-12-06
  • 打赏
  • 举报
回复
这个还是用全文检索吧。lucense
CasterOxfd 2013-12-06
  • 打赏
  • 举报
回复
引用 10 楼 dahlwuyn 的回复:
正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧
我现在用的是Scanner,可以扫描一个人名了。但是因为人名储存在数组中,用For循环的话,扫描完第一个人,Scanner就读到文件末尾了,有没有一种循环可以让Scanner多次扫描的,不然就只能同样代码写十遍了==
CasterOxfd 2013-12-05
  • 打赏
  • 举报
回复
各位可以上点心么!妈蛋
淡淡的蛋蛋 2013-12-05
  • 打赏
  • 举报
回复
我晕!
CasterOxfd 2013-12-05
  • 打赏
  • 举报
回复
引用 3 楼 waynexuan 的回复:
杨兄,杨兄弟,杨贤侄,杨相公,杨郎,大哥哥,杨居士,姓杨的,神雕侠,神雕大侠
卧槽兄弟你太机智了,继续
WayneXuan 2013-12-05
  • 打赏
  • 举报
回复
杨大爷,西狂,傻兄
WayneXuan 2013-12-05
  • 打赏
  • 举报
回复
杨少侠,杨大侠,姓杨名过,杨老弟,杨公子,杨某,杨哥哥,杨师弟,杨英雄,杨爷,杨家哥哥,姓杨的小子,杨小邪,杨君,杨相公
WayneXuan 2013-12-05
  • 打赏
  • 举报
回复
杨兄,杨兄弟,杨贤侄,杨相公,杨郎,大哥哥,杨居士,姓杨的,神雕侠,神雕大侠
WayneXuan 2013-12-05
  • 打赏
  • 举报
回复
还有杨大哥,傻蛋...
CasterOxfd 2013-12-05
  • 打赏
  • 举报
回复
对了 , 因为文本要求是20万字以上 所以我用的是RandomAccess 读的文件

62,623

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧