社区
Java SE
帖子详情
请教个算法问题
amdgaming
2010-04-23 06:34:33
我有1万多个关键字
然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次
各位看看 有什么好思路。谢谢
我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
...全文
292
24
打赏
收藏
请教个算法问题
我有1万多个关键字 然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次 各位看看 有什么好思路。谢谢 我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
24 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
bastengao
2010-04-29
打赏
举报
回复
lucene 应该可以帮你解决。不过你要实现一下自己的分词。
amdgaming
2010-04-29
打赏
举报
回复
楼上的 好像可以 ,没有人再看看吗?
csulipan
2010-04-29
打赏
举报
回复
我也是来学习的
WilliamTau
2010-04-29
打赏
举报
回复
我是来学习的~~~~~~
keeya0416
2010-04-26
打赏
举报
回复
楼主看看 字典树 相关的文章
我也是才了解
http://www.cppblog.com/hunter/archive/2008/11/16/67039.aspx
amdgaming
2010-04-26
打赏
举报
回复
[Quote=引用 18 楼 quxiaoyong 的回复:]
这个问题还真有点难度
除了2L提出的解决方案,我还想说个
其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?
只是一个思路,LZ见笑了。
[/Quote]
我当时就是这么说的,建本地索引,人家说不要用这种办法
从算法方面考虑
欢乐极客
2010-04-26
打赏
举报
回复
这个问题还真有点难度
除了2L提出的解决方案,我还想说个
其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?
只是一个思路,LZ见笑了。
amdgaming
2010-04-26
打赏
举报
回复
自己 再来顶下 呵呵
Mars_Ma_OK
2010-04-25
打赏
举报
回复
帮顶.顺便学习学习!
SambaGao
2010-04-25
打赏
举报
回复
1. 你要记录出现关键字多少次,所以必须全文扫描。。
2. 一个字链表LinkedList一个数组ArrayList 和一个HashMap
而又分关键字和值。。所以还是建议使用HashMap..
zfq642773391
2010-04-25
打赏
举报
回复
帮顶!!!!
amdgaming
2010-04-24
打赏
举报
回复
自己 顶下。。。
amdgaming
2010-04-24
打赏
举报
回复
自己 再来顶下 呵呵 100分没人 要吗?????
wjz748305545
2010-04-23
打赏
举报
回复
接分ing接分ing
amdgaming
2010-04-23
打赏
举报
回复
[Quote=引用 9 楼 princess_rosie 的回复:]
二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
[/Quote]
可是文章的内容 是 字符串类型,二分查找 没有办法处理这个问题的啊
还是需要 顺序查找吧,或者hash
princess_rosie
2010-04-23
打赏
举报
回复
二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
amdgaming
2010-04-23
打赏
举报
回复
[Quote=引用 7 楼 keeya0416 的回复:]
我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
[/Quote]
哈哈 见笑了,兄弟
keeya0416
2010-04-23
打赏
举报
回复
我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
zfq642773391
2010-04-23
打赏
举报
回复
用哈希效率还是不错的
mtawaken
2010-04-23
打赏
举报
回复
2L同志的算法真的能提高性能吗?
加载更多回复(4)
相关推荐
AIops智能运维机器学习
算法
实战
课程主要就Aiops及特征工程,预测和分类
问题
,模型优化,聚类
问题
,异常检测
问题
,回归,决策树,集成
算法
-Bagging,模型调优,集成
算法
-Boosting,集成
算法
-Stacking,降维,聚类
算法
-Kmeans,聚类
算法
-DBSCAN,SVM,独立森林,配套实战案例与项目全部基于真实数据集与实际任务展开,结合企业级框架进行建模实战。由浅入深,每一个理论搭配一个实验,且侧重技能不同,学员的知识体系会更加全面。
请教
个
问题
请教
个
问题
请教
个
问题
请教
个
问题
请教
个
问题
!!!
请教
个
问题
spring 声明事务管理里 aop 的 pointcut定义 save* public void save { saveA(); saveB(); saveC(); } 这样的代码spring 的事务 生成 代理类是怎么织入事务代码的 是...
请教
个
问题
,ajax.net 的效率如何
请教
个
问题
,ajax.net 的效率如何,我准备用在一个大概几千用户的网站上,有没有
问题
?
iOS RN或者H5的大神有偿
请教
个
问题
打扰见谅!
iOS RN或者H5的大神有偿
请教
个
问题
打扰见谅!
Java SE
62,569
社区成员
307,520
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告