社区
VB
帖子详情
如何提取一个文件的关键词
herohlq
2010-01-05 11:30:09
我想用vb.net来抽取一些word和excel文件的关键字。
想了很久,还是想不到方法和算法。
请大侠帮忙。
...全文
175
6
打赏
收藏
如何提取一个文件的关键词
我想用vb.net来抽取一些word和excel文件的关键字。 想了很久,还是想不到方法和算法。 请大侠帮忙。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
yanlongwuhui
2010-01-07
打赏
举报
回复
帮顶,关注
seawoder
2010-01-06
打赏
举报
回复
mark
herohlq
2010-01-06
打赏
举报
回复
这知道,现在在搞词库和分词程序
[Quote=引用 3 楼 wood87654321 的回复:]
.Net针对word和excel都有相应的对象,通过它们可获得word的文本及excel各cell中的文本,剩下的就是从这些纯文本中搜索并统计单词的问题了
[/Quote]
wood87654321
2010-01-06
打赏
举报
回复
.Net针对word和excel都有相应的对象,通过它们可获得word的文本及excel各cell中的文本,剩下的就是从这些纯文本中搜索并统计单词的问题了
herohlq
2010-01-05
打赏
举报
回复
补充:就是在一篇文童里,把重复最多的一些词取出来,变成该文件的关键字,方便以后搜萦而尔。
randomfeel
2010-01-05
打赏
举报
回复
分词技术
用python批量
提取
多个
文件
的
关键词
在日常的工作中,经常会遇到读取多个
文件
,分别
提取
这些
文件
的
关键词
的需求。下面提供这个任务的python代码。 原始数据形式:将需要
提取
关键词
的文章放在
一个
文件
夹下面,如下图: 接着使用python代码读取每个
文件
的
文件
名,以便后面与
关键词
一一对应 ...
python 实现
关键词
提取
Python 实现
关键词
提取
这篇文章只介绍了Python中
关键词
提取
的实现。
关键词
提取
的几个方法:1.textrank 2.tf-idf 3.LDA,其中textrank和tf-idf在jieba中都有封装好的函数,调用起来十分简单便捷。常用的自然语言处理的库还有nltk,gensim,sklearn中也有封装好的函数可以进行SVD分解和LDA等。LDA也有人分装好了库,直接pip insta...
python实现
关键词
提取
python实现
关键词
提取
新人小菜鸟又来写博客啦!!!没人表示不开心~~(>_<)~~ 今天我来弄
一个
简单的
关键词
提取
的代码 文章内容
关键词
的
提取
分为三大步: (1) 分词 (2) 去停用词 (3)
关键词
提取
分词方法有很多,我这里就选择常用的结巴jieba分词;去停用词,我用了
一个
停用词表。具体代码如下:import jieba import jieba.analyse#第一步:分词,这
NLP -
关键词
提取
文章目录关于
关键词
提取
TF-IDF思想由来用处名词/概念解释缺点TextRankLDALSA/LSIRake特点 关于
关键词
提取
关键词
提取
(Key Word Extraction) 主要有以下方法: 基于统计:tf-idf, TextRank 基于词分布: LDA:采用贝叶斯学派的方法对分布信息拟合 LSA/LSI:采用SVD的方法暴力破解 Rake、Topic-Model TF-IDF TF-IDF(注意:这里不是减号)是一种统计方法,用以评估一字词对于
一个
文件
集或
一个
语料库中的其中一份
NLP
关键词
提取
方法总结及实现
目录 一、
关键词
提取
概述 二、TF-IDF
关键词
提取
算法及实现 三、TextRank
关键词
提取
算法实现 四、LDA主题模型
关键词
提取
算法及实现 五、Word2Vec词聚类的
关键词
提取
算法及实现 六、信息增益
关键词
提取
算法及实现 七、互信息
关键词
提取
算法及实现 八、卡方检验
关键词
提取
算法及实现 九、基于树模型的
关键词
提取
算法及实现 十、总结 一、
关键词
提取
概述
关键词
是能够表...
VB
16,721
社区成员
110,522
社区内容
发帖
与我相关
我的任务
VB
VB技术相关讨论,主要为经典vb,即VB6.0
复制链接
扫一扫
分享
社区描述
VB技术相关讨论,主要为经典vb,即VB6.0
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章