社区
基础和管理
帖子详情
高分求关于字符串模糊查询的问题
warehouseleet
2005-03-17 09:59:40
各位 仁兄,小弟 想做一个大批量数据的模糊查询,在这请教一下各位,有没有什么好的方法!
目的:
将类似“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真。”
与“某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真.”
或“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?——七夕轻临,祝您梦想成真。某公司某某”
都认为是同样的!
小弟想了很久也没有想出来,谢谢大家!
...全文
199
20
打赏
收藏
高分求关于字符串模糊查询的问题
各位 仁兄,小弟 想做一个大批量数据的模糊查询,在这请教一下各位,有没有什么好的方法! 目的: 将类似“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真。” 与“某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成真.” 或“七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?——七夕轻临,祝您梦想成真。某公司某某” 都认为是同样的! 小弟想了很久也没有想出来,谢谢大家!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
20 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
wupangzi
2005-03-20
打赏
举报
回复
建立函数,在函数上下工夫!
不知道,是否可取!
yown
2005-03-19
打赏
举报
回复
建立全文索引
ashg_16700
2005-03-18
打赏
举报
回复
xue xi
warehouseleet
2005-03-18
打赏
举报
回复
我试了 大概时间是 50万的数据,模糊匹配的数度大概是 1+万条/秒
感觉慢,想求一个快速的方法!
wupangzi
2005-03-18
打赏
举报
回复
如果已经超过就不再匹配!取下一数据!
wupangzi
2005-03-18
打赏
举报
回复
关注!
计算%分比,我想速度一定不会快!
要不写个函数,这样来试试看!
warehouseleet
2005-03-18
打赏
举报
回复
to overmind(overmind) :
怎么 进行词法分析呀??给点提示先??
zwj0712
2005-03-18
打赏
举报
回复
我闪
smallcrocodile
2005-03-18
打赏
举报
回复
晕倒
yangtaylor
2005-03-18
打赏
举报
回复
我觉得算法上已经没有可追寻的了。只有在机器配置上下功夫了。依靠多cpu多线程的集群运算才是提高效率的方法了。
bzszp
2005-03-17
打赏
举报
回复
SQL> SELECT COL2 FROM TB_0
2 WHERE REPLACE(TRANSLATE(COL2,',.?!:,。?!:—',' '),' ','') LIKE
3 '%七夕抬头望碧霄喜鹊双双拱鹊桥家家乞巧对秋月无尽心丝君知晓%';
COL2
--------------------------------------------------------------------------------
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真。
某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真.
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?
——七夕轻临,祝您梦想成真。某公司某某
SQL>
bzszp
2005-03-17
打赏
举报
回复
SQL> SELECT COL2 FROM TB_0
2 WHERE REPLACE(TRANSLATE(COL2,',.?!:,。?!:—',' '),' ','') LIKE '%七夕抬头望碧霄%'
;
COL2
--------------------------------------------------------------------------------
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真。
某某:七夕抬头望碧霄,喜鹊双双拱鹊桥.家家乞巧对秋月,无尽心丝君知晓?七夕轻临,梦想成
真.
七夕抬头望碧霄,喜鹊双双拱鹊桥。家家乞巧对秋月,无尽心丝君知晓?
——七夕轻临,祝您梦想成真。某公司某某
SQL>
skystar99047
2005-03-17
打赏
举报
回复
不对标点符号进行处理就行,处理时将它去掉或换成统一标点符。
yxxx
2005-03-17
打赏
举报
回复
你的意思是查询中对全角和半角的字符视为一样咯?
?? 。. ,,
mingxuan3000
2005-03-17
打赏
举报
回复
学习
zakat
2005-03-17
打赏
举报
回复
学习
先进行词法分析,找出单词,在按照打分规则进行分数计算。
可不可以举个例子阿?
zhaokeke2004
2005-03-17
打赏
举报
回复
study
overmind
2005-03-17
打赏
举报
回复
先进行词法分析,找出单词,在按照打分规则进行分数计算。
warehouseleet
2005-03-17
打赏
举报
回复
不是 ,是类似这样的 句子的大量数据的匹配,我想到不行就拆字 用单字去比较,超过某个百分点就算一样的内容,可是效率太低了,现在的效率是 大概 1万条/秒,有没有更好更快的办法!?
yxxx
2005-03-17
打赏
举报
回复
学习
软考高项论文50分秘籍——心法篇
讲师以52分和53分通过论文,2次
高分
通过,方法论经得起考验
Java进阶之光!java将数组拼接成一个
字符串
Java基础 1.Java语言的三大特性 2.Java语言主要特性 3. JDK和JRE有什么区别 4.Java基本数据类型及其封装类 5.如果main方法被声明为private会怎样? 6.说明- -下public static void main(String argsQ])这段声明里每个关键字的作用 7.==与equals的区别 8.Object有哪些公用方法 9.为什么Java里没有全局变量? 10.while循环和do循环有什么不同? 11.char型变量中能不能存储一个中文汉字?为什么? 12
echarts图表在浏览器进行缩放时,会变得模糊的
问题
1、我们可以在渲染图表的时候添加一个参数,通过改变该参数来提高图表的像素值,{devicePixelRatio: 2}该参数的意思是设备像素比。theme:指定图表的主题,可选值为
字符串
类型或者对象类型,echarts默认内置了两套主题:light 和dark。renderer:指定图表的渲染方式,可选值为 ‘canvas’ 或 ‘svg’、或’webgl’。devicePixelRatio:指定图表的设备像素比,用于提高图表的清晰度。模糊情况如下图:字体很虚化。el:图表要渲染到的元素。
【嵌入式知识14】使用STM32F103实现OLED屏显和
字符串
滑动显示
SPI是串行外设接口Serial Peripheral Interface的缩写,是一种高速的,全双工,同步的通信总线,并且在芯片的管脚上只占用四根线,节约了芯片的管脚,同时为PCB的布局上节省空间,提供方便,正是出于这种简单易用的特性,越来越多的芯片集成了这种通信协议。SPI的通信原理很简单,它以主从方式工作,这种模式通常有一个主设备和一个或多个从设备,需要至少4根线,事实上3根也可以(单向传输时)。
Elasticsearch(Es搜索(简单使用、全文查询、复合查询)、地理位置查询、特殊查询、聚合操作、桶聚合、管道聚合)
match_phrase_prefix 是针对分片级别的查询,假设 max_expansions 为 1,可能返回多个文档,但是只有一个词,这是我们预期的结果。有的时候实际返回结果和我们预期结果并不一致,原因在于这个查询是分片级别的,不同的分片确实只返回了一个词,但是结果可能来自不同的分片,所以最终会看到多个词。换句话说,上面的查询和下面的查询等价。即 term 查询,就是根据词去查询,查询指定字段中包含给定单词的文档,term 查询不被解析,只有搜索的词和文档中的词精确匹配,才会返回文档。
基础和管理
17,377
社区成员
95,128
社区内容
发帖
与我相关
我的任务
基础和管理
Oracle 基础和管理
复制链接
扫一扫
分享
社区描述
Oracle 基础和管理
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章