7,763
社区成员
发帖
与我相关
我的任务
分享
if instr(1, "*数据库的某条记录*" ,str(i))<> 0 then num = num + 1
来统计重复字符串数目,最后统计 format( num/len("*数据库的某条记录*"), "00.0%")
,降序排列。全过程可以实现,不过误差敏感度很大,即使我统计的时候也用了类似Replace("*数据库的某条记录*"," ","")
来去除空格、标点的影响,不过依然分析结果不理想,往往一个很长的包含大量字符的文本 其类似度 要高于 与源字符串仅有微小差别的文本。请问有没有一些优化方案或其他替代方式呢?谢谢!