呵呵, 1. 建立“字”拆分对照表;如”研“对应,”石“、”开“; 2. 自己写个analyzer或filter,逐个汉字过滤,遇每个汉字时,在对应表中搜索,把搜索到的汉字索引;具体搜索对应表时,可以用lucene或采用直接加载到内存中会获得更好的性能,这个可以参考庖丁解牛、imdict等;
楼主的结贴率太低了 已经飘红了咧 友情帮顶,呵呵
引用 12 楼 ladybirds2008 的回复:我主要是要做到 能拆单个的汉字,能拆开汉字来检索,这样就能更全面的检索到目标啊,就像检索上面的那个“研”字。 明白你的意思,但我比较难理解什么业务会让你有这样的需求。 如果一段文字中有“研”字,那你通过“古”或“开”搜索到这个内容有什么意义?只会让用户觉得奇怪。 如“研究生考试”,用户搜索“石头”,结果搜索出来了。有什么意义么? 如果你需要做一个汉字拆解的业务,如通过“偏部首”搜索到,那你需要建立一个对应库。
我主要是要做到 能拆单个的汉字,能拆开汉字来检索,这样就能更全面的检索到目标啊,就像检索上面的那个“研”字。
朋友门不要吝啬啊 不回答问题也要 帮顶一下哦 谢谢啦
过来帮顶 顺便请问一下 回复别人的帖子 是怎么绕过那个长度验证的 直接空回复也行啊
67,513
社区成员
225,878
社区内容
加载中
试试用AI创作助手写篇文章吧