社区
搜索引擎技术
帖子详情
哪一种tfidf的算式效果最好?
Marlonmassine
2014-06-10 03:14:40
本人要对文本聚类,在计算词项的tfidf值的时候,发现tfidf的算式有
多种形式
,不知道取哪一种
效果最好
。也就是说使最能表征文档特征的词项tfidf值最高,而文本聚类的效果也最好。因为以前没有实际使用过tfidf,也不知道
实际操作
时用的是哪一种算式,希望有牛人能不吝赐教,万分感谢!
...全文
100
回复
打赏
收藏
哪一种tfidf的算式效果最好?
本人要对文本聚类,在计算词项的tfidf值的时候,发现tfidf的算式有多种形式,不知道取哪一种效果最好。也就是说使最能表征文档特征的词项tfidf值最高,而文本聚类的效果也最好。因为以前没有实际使用过tfidf,也不知道实际操作时用的是哪一种算式,希望有牛人能不吝赐教,万分感谢!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
自然语言处理中的N-Gram模型详解
N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的...这是模糊匹配中常用的
一种
手段。本文将从此开始,进而向读者展示N-Gram在自然语言处理中的各种powerful的应用。 基于N-Gram模型定义的字符串距离利用
20_多易教育之《yiee数据运营系统》用户画像-算法实例篇
一、算法实例KNN 二、算法实例NaiveBayes 1、算法简介 2、朴素贝叶斯的原理及理解 3、算法计算示例 &...
人工智能自然语言处理:N-gram和TF-IDF模型详解
人工智能自然语言处理:N-gram和TF-IDF模型详解 1.N-gram 模型 N-Gram 是
一种
基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形成了长度是 N 的字节片段序列。 每一...
Mahout聚类分析
所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。
推荐系统学习(三)——聚类算法
所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。人们总是不断...
搜索引擎技术
2,760
社区成员
2,052
社区内容
发帖
与我相关
我的任务
搜索引擎技术
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
复制链接
扫一扫
分享
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章