社区
C语言
帖子详情
如何判断一个文本和一个主题的相关度?大家有什么好的算法吗?请大家教教我
warcao
2012-04-24 05:57:29
比如我现在的关键字是 “c语言”,还有一个文本。如何判断这个文本是否和c语言相关度呢?
我现在唯一能想到的就是对文本进行分词,然后统计“c语言”在文本中出现的此时,除以总词数,得到相关度的值。
但这个办法不太好,请高手赐教更好的方法呀。
...全文
125
4
打赏
收藏
如何判断一个文本和一个主题的相关度?大家有什么好的算法吗?请大家教教我
比如我现在的关键字是 “c语言”,还有一个文本。如何判断这个文本是否和c语言相关度呢? 我现在唯一能想到的就是对文本进行分词,然后统计“c语言”在文本中出现的此时,除以总词数,得到相关度的值。 但这个办法不太好,请高手赐教更好的方法呀。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
婷婷哈皮
2014-12-13
打赏
举报
回复
确实是个问题呀,这东西,我也再想办法做这个
warcao
2012-04-25
打赏
举报
回复
[Quote=引用 2 楼 的回复:]
这个太难了,而且不是计算机技术问题。
[/Quote]
是吧。比如机器学习什么的就可以吧、
muyi66
2012-04-24
打赏
举报
回复
这个太难了,而且不是计算机技术问题。
机器学习疯狂入门(2):朴素贝叶斯
文本
分类
请
大家准备好这两个环境的安装。 2、本课程从属于正在录制的《机器学习入门系列》,本篇是第2篇:朴素贝叶斯
文本
分类。本课程中会涉及到一些数学
算法
和使用工具。先教大家怎么使用和简单触碰原理。很快后续会有针对...
文本
聚类(一)—— LDA
主题
模型
因工作需要,近期需要做一些
文本
聚类方面的事情,
算法
方面主要选择的是传统的机器学习
算法
,主要尝试的是 LDA
主题
模型和 K-Means 聚类
算法
,使用的数据集是 THUCNews 新闻
文本
分类数据集,其中只使用了训练集 cnews...
一篇入门深度学习OCR:数据集和
算法
合集
当前OCR领域基本上已经是深度学习的天下了,近5年,在
算法
和数据集的双重加持下,OCR已经成为
一个
解决的问题,要做
一个
适合于自己的OCR系统,关键在于选择适合于自己场景的数据集和
算法
。 本文主要记录OCR领域常用的...
手把手教你在Python中实现
文本
分类(附代码、数据集)
文本
分类是商业问题中常见的自然语言处理任务,目标是自动将
文本
文件分到
一个
或多个已定义好的类别中。
文本
分类的一些例子如下: 分析社交媒体中的大众情感 鉴别垃圾邮件和非垃圾邮件 自动标注客户问询 将新闻...
【人工智能】决策树(Decision Tree)
文本
算法
的精确率
TF-IDF(词频-逆
文本
频率),前面的TF也就是常说到的词频,我们之前做的向量化也就是做了
文本
中各个词的...概括来讲, IDF反应了
一个
词在所有
文本
中出现的频率,如果
一个
词在很多的
文本
中出现,那么它的IDF值应该低。
C语言
69,371
社区成员
243,082
社区内容
发帖
与我相关
我的任务
C语言
C语言相关问题讨论
复制链接
扫一扫
分享
社区描述
C语言相关问题讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章