社区
应用实例
帖子详情
mysql 两篇文本相似度?
wpp571
2012-06-12 05:09:13
mysql数据库中有两个字段存储汉字文本的分词结果,
要比较这两篇文本的相似度,
自己写了个c程序计算词语相同个数来得出相似度,
但执行程序耗时太长。
各位有没什么好的思路,来计算文本的相似度,比如用存储过程之类??
...全文
327
5
打赏
收藏
mysql 两篇文本相似度?
mysql数据库中有两个字段存储汉字文本的分词结果, 要比较这两篇文本的相似度, 自己写了个c程序计算词语相同个数来得出相似度, 但执行程序耗时太长。 各位有没什么好的思路,来计算文本的相似度,比如用存储过程之类??
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
夜予
2012-06-12
打赏
举报
回复
还是程序吧,LZ优化下
zczhangchao2003
2012-06-12
打赏
举报
回复
declare @Str1 varchar(5000)
declare @Str2 varchar(5000)
可不可以这样考虑:
取长度较小的一个(假如Len(@Str1)<Len(@Str2)),然后每次从@Str1中取出一个字符到@Str2中查找,如果找到则从@Str1、@Str2中删除此字符(找不到也删除),直到@Str1每个字符都找完。
整个过程用一个变量@i记录找寻的结果(能找到/找不到)。最后拿@i和@Str2做除法 得出‘相似度’
發糞塗牆
2012-06-12
打赏
举报
回复
目前为止没发现用SQL语句可以实现,或者可以想象是非常痛苦跟臃肿。我最近在学python,貌似用几个函数就可以实现了。建议楼主放弃用sql语句实现的想法吧。
叶子
2012-06-12
打赏
举报
回复
数据库弄这个效率还不如程序呢...
--小F--
2012-06-12
打赏
举报
回复
还是用程序吧 MYSQL本身做这个不是强项。
【基于Python+Django的毕业设计】
文本
相似度
计算系统(源码+录像演示+说明).zip
【基于Python+Django的毕业设计】
文本
相似度
计算系统(源码+录像演示+说明).zip 【项目技术】 python+Django+
mysql
【实现功能】 本系统的主要功能是计算两个
文本
之间的
相似度
,具体包括以下几个方面: 1.提供基于余弦
相似度
、编辑距离和Jaccard
相似度
等算法的
文本
相似度
计算功能; 2.完成
文本
预处理功能,其中包括去除停用词、分词和词性标注等; 3.提供
文本
相似度
计算结果的可视化功能,可以直观地展示两个
文本
之间的
相似度
。
django项目实战之
文本
相似度
计算系统(源码+说明+演示视频).zip
源码亲测可用,可做计算机毕业设计、课程设计等参考。 【项目技术】 python+Django+
mysql
【实现功能】 本系统的主要功能是计算两个
文本
之间的
相似度
,具体包括以下几个方面: 1.提供基于余弦
相似度
、编辑距离和Jaccard
相似度
等算法的
文本
相似度
计算功能; 2.完成
文本
预处理功能,其中包括去除停用词、分词和词性标注等; 3.提供
文本
相似度
计算结果的可视化功能,可以直观地展示两个
文本
之间的
相似度
。
(基于python的毕业设计)
文本
相似度
计算系统(源码+说明+演示视频).zip
(基于python的毕业设计)
文本
相似度
计算系统(源码+说明+演示视频),本科毕业设计高分项目。 【项目技术】 python+Django+
mysql
【实现功能】 本系统的主要功能是计算两个
文本
之间的
相似度
,具体包括以下几个方面: 1.提供基于余弦
相似度
、编辑距离和Jaccard
相似度
等算法的
文本
相似度
计算功能; 2.完成
文本
预处理功能,其中包括去除停用词、分词和词性标注等; 3.提供
文本
相似度
计算结果的可视化功能,可以直观地展示两个
文本
之间的
相似度
。
基于Python的
文本
相似度
计算系统.zip
基于Python的
文本
相似度
计算系统 python;django;
mysql
; 本文介绍了一个基于Python的
文本
相似度
计算系统,该技术通过各种方法完成了图像的预处理、特征提取以及相似性运算。简单地,操作系统先是对
文本
进行清洗和分词处理,进而提供关键词的词向量表。然后,通过余弦
相似度
等方法计算
文本
之间的
相似度
,并将结果展示在可视化界面上。实验结果表明,该系统能够有效的计算
文本
之间的
相似度
,具有一定的实用性,并融合别的领域进行创新。因此,该系统对于处理未来在各领域处理
文本
数据具有重要的应用价值。 本系统的主要功能是计算两个
文本
之间的
相似度
,具体包括以下几个方面: (1)提供基于余弦
相似度
、编辑距离和Jaccard
相似度
等算法的
文本
相似度
计算功能; (2)完成
文本
预处理功能,其中包括去除停用词、分词和词性标注等; (3)提供
文本
相似度
计算结果的可视化功能,可以直观地展示两个
文本
之间的
相似度
。
MySql
字符串相似匹配
亲测可用,
mysql
字符串
相似度
匹配函数。下载后直接在
mysql
中可以测试运行。
应用实例
27,580
社区成员
68,556
社区内容
发帖
与我相关
我的任务
应用实例
MS-SQL Server 应用实例
复制链接
扫一扫
分享
社区描述
MS-SQL Server 应用实例
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章