社区
Java SE
帖子详情
请教个算法问题
amdgaming
2010-04-23 06:34:33
我有1万多个关键字
然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次
各位看看 有什么好思路。谢谢
我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
...全文
297
24
打赏
收藏
请教个算法问题
我有1万多个关键字 然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次 各位看看 有什么好思路。谢谢 我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
24 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
bastengao
2010-04-29
打赏
举报
回复
lucene 应该可以帮你解决。不过你要实现一下自己的分词。
amdgaming
2010-04-29
打赏
举报
回复
楼上的 好像可以 ,没有人再看看吗?
csulipan
2010-04-29
打赏
举报
回复
我也是来学习的
WilliamTau
2010-04-29
打赏
举报
回复
我是来学习的~~~~~~
keeya0416
2010-04-26
打赏
举报
回复
楼主看看 字典树 相关的文章
我也是才了解
http://www.cppblog.com/hunter/archive/2008/11/16/67039.aspx
amdgaming
2010-04-26
打赏
举报
回复
[Quote=引用 18 楼 quxiaoyong 的回复:]
这个问题还真有点难度
除了2L提出的解决方案,我还想说个
其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?
只是一个思路,LZ见笑了。
[/Quote]
我当时就是这么说的,建本地索引,人家说不要用这种办法
从算法方面考虑
欢乐极客
2010-04-26
打赏
举报
回复
这个问题还真有点难度
除了2L提出的解决方案,我还想说个
其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?
只是一个思路,LZ见笑了。
amdgaming
2010-04-26
打赏
举报
回复
自己 再来顶下 呵呵
Mars_Ma_OK
2010-04-25
打赏
举报
回复
帮顶.顺便学习学习!
SambaGao
2010-04-25
打赏
举报
回复
1. 你要记录出现关键字多少次,所以必须全文扫描。。
2. 一个字链表LinkedList一个数组ArrayList 和一个HashMap
而又分关键字和值。。所以还是建议使用HashMap..
zfq642773391
2010-04-25
打赏
举报
回复
帮顶!!!!
amdgaming
2010-04-24
打赏
举报
回复
自己 顶下。。。
amdgaming
2010-04-24
打赏
举报
回复
自己 再来顶下 呵呵 100分没人 要吗?????
wjz748305545
2010-04-23
打赏
举报
回复
接分ing接分ing
amdgaming
2010-04-23
打赏
举报
回复
[Quote=引用 9 楼 princess_rosie 的回复:]
二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
[/Quote]
可是文章的内容 是 字符串类型,二分查找 没有办法处理这个问题的啊
还是需要 顺序查找吧,或者hash
princess_rosie
2010-04-23
打赏
举报
回复
二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
amdgaming
2010-04-23
打赏
举报
回复
[Quote=引用 7 楼 keeya0416 的回复:]
我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
[/Quote]
哈哈 见笑了,兄弟
keeya0416
2010-04-23
打赏
举报
回复
我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
zfq642773391
2010-04-23
打赏
举报
回复
用哈希效率还是不错的
mtawaken
2010-04-23
打赏
举报
回复
2L同志的算法真的能提高性能吗?
加载更多回复(4)
C语言
算法
精华
Re: anya:
请教
一个
问题
anya Re: 如何给汉字分界? anya Re: 八皇后
算法
问题
请教
? anya Re: 急寻图象压缩
算法
anya 游戏中最佳路径的
问题
anya 平面点覆盖
问题
求教 anya Re: 平面点覆盖
问题
求教 anya Re: ...
vb自动组卷系统
软件运行有
问题
,并且很多地方不懂,
请教
一下,最好有好心人能给我讲解一下随机抽题的核心
算法
java通过坐标划分区域_
请教
一个超级
算法
难题——java根据定位坐标计算区域
问题
!...
问题
详情
请教
一个超级
算法
难题——java根据定位坐标计算区域
问题
!
请教
一个超级难题——java根据定位坐标计算区域
问题
!这些大概数据GIS方面的知识。
问题
描述:在一个房间里(以房间一角做原点(0,0,0))1. 使用定位...
【人工智能实验】A*
算法
求解8数码
问题
实验一 A*
算法
求解8数码
问题
一、实验目的 熟悉和掌握启发式搜索的定义、估价函数和
算法
过程,并利用A*
算法
求解N数码难题,理解求解流程和搜索顺序。 二、实验原理 A*
算法
是一种启发式图搜索
算法
,其特点在于对...
java多级反馈队列进程调度,多级队列反馈调度
算法
请教
多级反馈队列调度
算法
...
请教
多级反馈队列调度
算法
????????????在某一操作系统中对进程调度采用多级反馈队列调度
算法
。现设定采用三级分数给小编了,小编来 0时刻A到达,进入I队列,执行2个时间段后,转向队列II,再执行了3个时间段后,B...
Java SE
62,612
社区成员
307,332
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章