社区
搜索引擎技术
帖子详情
[100分] 请问:如何计算两篇维度不同的文档的欧氏距离?
lb_hit
2007-05-18 10:32:06
在文本聚类中,两篇文档表示成两个不同长度的向量,相近的文档的欧式距离应该小,如何排除不同向量长度(文本长度)的干扰?实际实现的时候采用怎么样的方法?
谢谢!
...全文
310
4
打赏
收藏
[100分] 请问:如何计算两篇维度不同的文档的欧氏距离?
在文本聚类中,两篇文档表示成两个不同长度的向量,相近的文档的欧式距离应该小,如何排除不同向量长度(文本长度)的干扰?实际实现的时候采用怎么样的方法? 谢谢!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lb_hit
2007-05-20
打赏
举报
回复
谢谢二位的答复,结帖。
lb_hit
2007-05-20
打赏
举报
回复
回复人:youwill(youwill) () 信誉:100 2007-5-18 12:26:33 得分: 50 删除
把高维的降维比较
回复人:yy8354(King) () 信誉:100 2007-5-18 15:33:27 得分: 50 删除
向量归一化
回复人:lb_hit() () 信誉:100 2007-5-20 12:50:57 得分: 0 删除
谢谢二位的答复,结帖。
----------------------------------------------------
为什么我刚结的帖子却看不到给分呢?数据库更新问题?还是系统的bug?郁闷。
youwill
2007-05-18
打赏
举报
回复
把高维的降维比较
yy8354
2007-05-18
打赏
举报
回复
向量归一化
欧氏距离
:点 p 和 q 之间的
欧氏距离
是连接它们的线段的长度。-matlab开发
在数学和
计算
机科学中,
欧氏距离
是一种衡量两个点之间距离的标准方式,特别是在二维和三维空间中。这个概念源于古希腊数学家欧几里得,因此被称为欧几里得距离。在MATLAB环境中,我们可以方便地
计算
两个点之间的欧氏...
Method_C.rar_
欧氏距离
在这个“Method_C.rar_
欧氏距离
”压缩包中,可能包含了一个具体的C聚类算法实现,使用
欧氏距离
作为相似性度量的代码或
文档
。通过对这个文件进行解压和研究,我们可以更深入地理解如何在实践中应用
欧氏距离
进行数据...
常用距离
计算
汇总.doc
1. **
欧氏距离
**:
欧氏距离
是最直观的距离
计算
方式,源于欧几里得几何,适用于各
维度
数据。对于n维向量,
欧氏距离
是各对应元素差的平方和的平方根。在Matlab中,可以使用`pdist`函数
计算
欧氏距离
。 2. **曼哈顿距离...
相似度
计算
方法的
文档
。
欧氏距离
是最直观的距离
计算
方式,它源于欧几里得几何,用于衡量二维、三维乃至更高
维度
空间中点与点之间的距离。在n维空间中,两个向量a和b的
欧氏距离
可以通过平方和再开根号的方式
计算
得出。在Matlab中,可以使用...
向量空间模型快速文本相似度
计算
java源码+数据
3. **
文档
向量化**:对于每篇
文档
,我们将其转化为一个向量,向量的
维度
等于词汇表的大小。向量的每个元素对应词汇表中的一个词汇,如果该词汇在
文档
中出现,其对应的值为该词汇的频率或TF-IDF值(Term Frequency-...
搜索引擎技术
2,760
社区成员
2,049
社区内容
发帖
与我相关
我的任务
搜索引擎技术
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
复制链接
扫一扫
分享
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章