mysql 两篇文本相似度?

wpp571 2012-06-12 05:09:13
mysql数据库中有两个字段存储汉字文本的分词结果,

要比较这两篇文本的相似度,

自己写了个c程序计算词语相同个数来得出相似度,

但执行程序耗时太长。

各位有没什么好的思路,来计算文本的相似度,比如用存储过程之类??
...全文
327 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
夜予 2012-06-12
  • 打赏
  • 举报
回复
还是程序吧,LZ优化下
zczhangchao2003 2012-06-12
  • 打赏
  • 举报
回复
declare @Str1 varchar(5000)
declare @Str2 varchar(5000)

可不可以这样考虑:
取长度较小的一个(假如Len(@Str1)<Len(@Str2)),然后每次从@Str1中取出一个字符到@Str2中查找,如果找到则从@Str1、@Str2中删除此字符(找不到也删除),直到@Str1每个字符都找完。
整个过程用一个变量@i记录找寻的结果(能找到/找不到)。最后拿@i和@Str2做除法 得出‘相似度’
發糞塗牆 2012-06-12
  • 打赏
  • 举报
回复
目前为止没发现用SQL语句可以实现,或者可以想象是非常痛苦跟臃肿。我最近在学python,貌似用几个函数就可以实现了。建议楼主放弃用sql语句实现的想法吧。
叶子 2012-06-12
  • 打赏
  • 举报
回复
数据库弄这个效率还不如程序呢...
--小F-- 2012-06-12
  • 打赏
  • 举报
回复
还是用程序吧 MYSQL本身做这个不是强项。

27,580

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 应用实例
社区管理员
  • 应用实例社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧