高分求关于字符串模糊查询的问题

warehouseleet 2005-03-17 09:59:40
各位 仁兄,小弟 想做一个大批量数据的模糊查询,在这请教一下各位,有没有什么好的方法!

目的:
将类似“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真。”

与“某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真.”

或“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?——七夕轻临,祝您梦想成真。某公司某某”

都认为是同样的!

小弟想了很久也没有想出来,谢谢大家!
...全文
199 20 打赏 收藏 转发到动态 举报
写回复
用AI写文章
20 条回复
切换为时间正序
请发表友善的回复…
发表回复
wupangzi 2005-03-20
  • 打赏
  • 举报
回复
建立函数,在函数上下工夫!
不知道,是否可取!
yown 2005-03-19
  • 打赏
  • 举报
回复
建立全文索引
ashg_16700 2005-03-18
  • 打赏
  • 举报
回复
xue xi
warehouseleet 2005-03-18
  • 打赏
  • 举报
回复
我试了 大概时间是 50万的数据,模糊匹配的数度大概是 1+万条/秒

感觉慢,想求一个快速的方法!
wupangzi 2005-03-18
  • 打赏
  • 举报
回复
如果已经超过就不再匹配!取下一数据!
wupangzi 2005-03-18
  • 打赏
  • 举报
回复
关注!
计算%分比,我想速度一定不会快!
要不写个函数,这样来试试看!
warehouseleet 2005-03-18
  • 打赏
  • 举报
回复
to overmind(overmind) :
怎么 进行词法分析呀??给点提示先??
zwj0712 2005-03-18
  • 打赏
  • 举报
回复
我闪
smallcrocodile 2005-03-18
  • 打赏
  • 举报
回复
晕倒
yangtaylor 2005-03-18
  • 打赏
  • 举报
回复
我觉得算法上已经没有可追寻的了。只有在机器配置上下功夫了。依靠多cpu多线程的集群运算才是提高效率的方法了。
bzszp 2005-03-17
  • 打赏
  • 举报
回复
SQL> SELECT COL2 FROM TB_0
2 WHERE REPLACE(TRANSLATE(COL2,',.?!:,。?!:—',' '),' ','') LIKE
3 '%七夕抬头望碧霄喜鹊双双拱鹊桥家家乞巧对秋月无尽心丝君知晓%';

COL2
--------------------------------------------------------------------------------
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真。

某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真.

七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?
——七夕轻临,祝您梦想成真。某公司某某


SQL>
bzszp 2005-03-17
  • 打赏
  • 举报
回复
SQL> SELECT COL2 FROM TB_0
2 WHERE REPLACE(TRANSLATE(COL2,',.?!:,。?!:—',' '),' ','') LIKE '%七夕抬头望碧霄%'
;

COL2
--------------------------------------------------------------------------------
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真。

某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真.

七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?
——七夕轻临,祝您梦想成真。某公司某某


SQL>
skystar99047 2005-03-17
  • 打赏
  • 举报
回复
不对标点符号进行处理就行,处理时将它去掉或换成统一标点符。
yxxx 2005-03-17
  • 打赏
  • 举报
回复
你的意思是查询中对全角和半角的字符视为一样咯?
?? 。. ,,
mingxuan3000 2005-03-17
  • 打赏
  • 举报
回复
学习
zakat 2005-03-17
  • 打赏
  • 举报
回复
学习

先进行词法分析,找出单词,在按照打分规则进行分数计算。

可不可以举个例子阿?
zhaokeke2004 2005-03-17
  • 打赏
  • 举报
回复
study
overmind 2005-03-17
  • 打赏
  • 举报
回复
先进行词法分析,找出单词,在按照打分规则进行分数计算。
warehouseleet 2005-03-17
  • 打赏
  • 举报
回复
不是 ,是类似这样的 句子的大量数据的匹配,我想到不行就拆字 用单字去比较,超过某个百分点就算一样的内容,可是效率太低了,现在的效率是 大概 1万条/秒,有没有更好更快的办法!?
yxxx 2005-03-17
  • 打赏
  • 举报
回复
学习

17,377

社区成员

发帖
与我相关
我的任务
社区描述
Oracle 基础和管理
社区管理员
  • 基础和管理社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧