社区
C语言
帖子详情
取得一段文本中的关键字
markdandan
2010-03-30 06:02:43
我有一段文本,这段文本不定大小,有可能很大,然后我想取出这段文本中有意义的词,请问有什么好办法吗?
例如:文本:我想学习。然后有意义的词:学习。(有意义的词是不固定的)请提供一算法~谢谢~~~~
...全文
124
17
打赏
收藏
取得一段文本中的关键字
我有一段文本,这段文本不定大小,有可能很大,然后我想取出这段文本中有意义的词,请问有什么好办法吗? 例如:文本:我想学习。然后有意义的词:学习。(有意义的词是不固定的)请提供一算法~谢谢~~~~
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
17 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
markdandan
2010-04-01
打赏
举报
回复
[Quote=引用 9 楼 dobzhansky 的回复:]
谁想学习?
我想学习。
去洗头么?
我想学习。
今晚有什么打算?
我想学习。
[/Quote]
没看懂您要表达什么意思
markdandan
2010-04-01
打赏
举报
回复
楼上各位,能不能告诉我一个具体的算法实现,什么语言的都行,谢谢~
markdandan
2010-04-01
打赏
举报
回复
[Quote=引用 12 楼 dubiousway 的回复:]
lz,
我有一段文本,这段文本不定大小,有可能很大
就上面这句话说,哪个是关键字
[/Quote]
这句话有意义的词会是:文本
cattycat
2010-03-31
打赏
举报
回复
自动发现有意义的词? 查找字符串就不是难题了。
如果是自动发现有意义的词的话,就推荐用聚类的方法吧,监督学习或非监督学习,这个比较专业了。
qiuyatao
2010-03-31
打赏
举报
回复
应该是学习一下 全文搜索的东西 不过一般也就是读入到内存 然后再用模式匹配KMP算法
dubiousway
2010-03-31
打赏
举报
回复
lz,
我有一段文本,这段文本不定大小,有可能很大
就上面这句话说,哪个是关键字
liuxingjin
2010-03-31
打赏
举报
回复
先把文本文件做内存映射。再调用memchr 在内存里查找
白云飘飘飘
2010-03-31
打赏
举报
回复
这个算法网上介绍很多,搜索一下就行了
Dobzhansky
2010-03-31
打赏
举报
回复
谁想学习?
我
想学习。
去洗头么?
我
想
学习。
今晚有什么打算?
我想
学习
。
markdandan
2010-03-31
打赏
举报
回复
[Quote=引用 5 楼 lhcwjy 的回复:]
首先要进行分词,简单的可以自己写一个最大匹配法分词法,也可以使用免费的分词系统,中科院的比较好。
[/Quote]
能不能说一下这个“最大匹配法分词法”怎么实现?我就是想问这个算法~!~谢谢~~~
yuzl32
2010-03-30
打赏
举报
回复
文件内容搜索?
tuo_li
2010-03-30
打赏
举报
回复
学习一下
白云飘飘飘
2010-03-30
打赏
举报
回复
首先要进行分词,简单的可以自己写一个最大匹配法分词法,也可以使用免费的分词系统,中科院的比较好。
ForestDB
2010-03-30
打赏
举报
回复
strstr
KMP
macrojj
2010-03-30
打赏
举报
回复
词库?
吴明治
2010-03-30
打赏
举报
回复
怎样才是有意义的? 这个标准是动态的还是静态的?
lovesi3344
2010-03-30
打赏
举报
回复
HTML
零基础Linux命令详细案例讲解课程(第3季)--
文本
搜索和
文本
处理
笔记标题采用
关键字
标识法,帮助学员更加容易记住知识点 笔记以超链接形式让知识点关联起来,形式知识体系 采用先概念后实例再应用方式,知识点深入浅出 提供授课内容笔记作为课后复习以及工作备查工具 部分图标...
合理的
关键字
密度散布与黑帽SEO之躲藏
文本
咱们都晓得,关于baidu的
关键字
排行有一个很重要的条件即是
关键字
密度,在咱们的了解
中
关键字
的密度在2%-8%这个规模之内。咱们想为啥在这个规模之内呢?韶关查找引擎优化今日就跟咱们讨论一下这个
关键字
密度和用黑帽...
如何做好
文本
关键词提取?从三种算法说起
在自然语言处理领域,处理海量的
文本
文件最关键的是要把用户最关心的问题提取出来。...因此,关键词提取在
文本
挖掘领域是一个很重要的部分。 关于
文本
的关键词提取方法分为有监督、半监督和无监...
python
文本
数据增强_(
中
文)
文本
复述任务实现,用于NLP语料的数据增强
改进谷歌的LaserTagger模型,使用LCQMC等
中
文语料训练
文本
复述模型,即修改
一段
文本
并保持原有语义。复述的结果可用于数据增强,
文本
泛化,从而增加特定场景的语料规模,提高模型泛化能力。二.模型介绍谷歌在文献...
如何提高
文本
生成任务
中
的
文本
多样性
前面的文章
中
我们介绍了
文本
生成
中
的经典模型Seq2Seq,虽然该模型在
文本
生成任务上
取得
了很大的进步,但是由于其目标函数采用的是极大似然估计,即: 1/∣S∣∑(T,S)∈Slogp(T∣S) 1 /|\mathcal{S}| \sum...
C语言
69,373
社区成员
243,080
社区内容
发帖
与我相关
我的任务
C语言
C语言相关问题讨论
复制链接
扫一扫
分享
社区描述
C语言相关问题讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章