请教个算法问题

amdgaming 2010-04-23 06:34:33
我有1万多个关键字
然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次

各位看看 有什么好思路。谢谢

我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
...全文
301 24 打赏 收藏 转发到动态 举报
写回复
用AI写文章
24 条回复
切换为时间正序
请发表友善的回复…
发表回复
bastengao 2010-04-29
  • 打赏
  • 举报
回复
lucene 应该可以帮你解决。不过你要实现一下自己的分词。
amdgaming 2010-04-29
  • 打赏
  • 举报
回复
楼上的 好像可以 ,没有人再看看吗?
csulipan 2010-04-29
  • 打赏
  • 举报
回复
我也是来学习的
WilliamTau 2010-04-29
  • 打赏
  • 举报
回复
我是来学习的~~~~~~
keeya0416 2010-04-26
  • 打赏
  • 举报
回复
楼主看看 字典树 相关的文章
我也是才了解
http://www.cppblog.com/hunter/archive/2008/11/16/67039.aspx
amdgaming 2010-04-26
  • 打赏
  • 举报
回复
[Quote=引用 18 楼 quxiaoyong 的回复:]

这个问题还真有点难度

除了2L提出的解决方案,我还想说个

其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?

只是一个思路,LZ见笑了。
[/Quote]
我当时就是这么说的,建本地索引,人家说不要用这种办法
从算法方面考虑
欢乐极客 2010-04-26
  • 打赏
  • 举报
回复
这个问题还真有点难度

除了2L提出的解决方案,我还想说个

其实我对这方面的算法不是很精通,但我想到了一个东西,Lucene,可不可以按照Lucene的思路,通过建立索引,然后提取关键字这样去解决呢?

只是一个思路,LZ见笑了。
amdgaming 2010-04-26
  • 打赏
  • 举报
回复
自己 再来顶下 呵呵
Mars_Ma_OK 2010-04-25
  • 打赏
  • 举报
回复
帮顶.顺便学习学习!
SambaGao 2010-04-25
  • 打赏
  • 举报
回复
1. 你要记录出现关键字多少次,所以必须全文扫描。。

2. 一个字链表LinkedList一个数组ArrayList 和一个HashMap

而又分关键字和值。。所以还是建议使用HashMap..
zfq642773391 2010-04-25
  • 打赏
  • 举报
回复
帮顶!!!!
amdgaming 2010-04-24
  • 打赏
  • 举报
回复
自己 顶下。。。
amdgaming 2010-04-24
  • 打赏
  • 举报
回复
自己 再来顶下 呵呵 100分没人 要吗?????
wjz748305545 2010-04-23
  • 打赏
  • 举报
回复
接分ing接分ing
amdgaming 2010-04-23
  • 打赏
  • 举报
回复
[Quote=引用 9 楼 princess_rosie 的回复:]

二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
[/Quote]
可是文章的内容 是 字符串类型,二分查找 没有办法处理这个问题的啊

还是需要 顺序查找吧,或者hash
princess_rosie 2010-04-23
  • 打赏
  • 举报
回复
二分法查找效率会很高,一亿个都没问题,在查找的同时返回该下标值的所在位置,并返回一个count累计重复找到的
amdgaming 2010-04-23
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 keeya0416 的回复:]

我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
[/Quote]
哈哈 见笑了,兄弟
keeya0416 2010-04-23
  • 打赏
  • 举报
回复
我发现楼主这 机器人 近日学习算法的热情无与伦比呀
加油
zfq642773391 2010-04-23
  • 打赏
  • 举报
回复
用哈希效率还是不错的
mtawaken 2010-04-23
  • 打赏
  • 举报
回复
2L同志的算法真的能提高性能吗?
加载更多回复(4)
【1】项目代码完整且功能都验证ok,确保稳定可靠运行后才上传。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通,帮助解答。 【2】项目主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 【3】项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 【4】如果基础还行,或热爱钻研,可基于此项目进行二次开发,DIY其他不同功能,欢迎交流学习。 【注意】 项目下载解压后,项目名字和项目路径不要用中文,否则可能会出现解析不了的错误,建议解压重命名为英文名字后再运行!有问题私信沟通,祝顺利! 基于opencv图像处理+卷积神经网络实现的实时人脸识别python源码+项目说明.zip 1.原理介绍: 人脸检测利用opencv进行图像处理,借用keras框架搭建卷积神经网络,对图像进行特征提取与特征训练,再利用训练好的分类模型进行预测,再将预测标签实时打在每一帧图片上,实现实时人脸检测与人脸标注. ## 2.具体步骤: 2.1数据获取:借由opencv自带的人脸检测haarcascade_frontalface_alt2.xml进行人脸检测划分,构建起2*1000数据集. 2.2数据处理:利用opencv对图片进行读取,剪切,转为矩阵;划分好图片和标签集 2.3模型训练与保存: > 2.3.1搭建CNN神经网络模型; > 2.3.2对标签进行one-hot编码(用不同位置数组表示不同类型),对图像矩阵进行归一化; > 2.3.3将处理好的数据分批量fit给模型,进行训练. 保存训练好的模型,以便调用. 2.4模型预测:调用训练完成的模型进行识别.

62,624

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧