大家帮忙看一下,这个错误是不是Lucene不能解处理中文

zhaoxuefeng 2003-07-08 08:02:10
我运行:IndexHTML -create g:/1时出现以下错误这个错误是不是Lucene不能解处理中文(用了Lucene_cn.jar)
adding g:/1/xqszhdls.htm
Parse Aborted: Lexical error at line 7, column 38. Encountered: "\u4f53" (20307
), after : ""
adding g:/1/zhyedjz.htm
Parse Aborted: Lexical error at line 7, column 38. Encountered: "\u4f53" (20307
), after : ""
...全文
225 点赞 收藏 10
写回复
10 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
zhaoxuefeng 2003-07-09
中文可以查找了,解决的方法是把建立索引的内容转化为ISO8859_1的编码储存,在查的时候先转化为ISO8859_1的编码查找,再转化为GBK输出,不知这个方法有什么缺点?
回复
eyeieye 2003-07-09
把错误堆栈copy上来看看
回复
eyeieye 2003-07-09
我用1.3没问题,记得以前用1.2的时候也很正常的。

jive那些玩艺不用管,它自己把索引、搜索的功能集中到一起而已。

具体环境不知道,那咱也就不好判断出错原因了。
回复
zhaoxuefeng 2003-07-09
重新用JAVACC编译了htmlparser.jj,还是不行,在问一下我看了jive的查询他里面用了DBsearchManager等这些类,这与生成索引有什么关系吗?是不是利用这些类来生成索引,
在查询数据库的数据时除了生成索引还需要做什么工作?
回复
zhaoxuefeng 2003-07-09
谢谢,
我先用1.2版本是最新的,与MYSQL连通后生成索引测试英语没有问题,但是中文什么结果也没有,重新写SearchFiles.java使用(http://www.javaresearch.org/article/showarticle.jsp?column=25&thread=1232&message=1881&redirect=true&hilite=true&q=lucene)下载的lucene_cn.jar并把Analyzer analyzer = new StandardAnalyzer();改为Analyzer analyzer = new ChineseAnalyzer();然后就出现caught a class org.apache.lucene.queryParser.ParseException
with message: Lexical error at line 1, column 2. Encountered: <EOF> after : ""

回复
eyeieye 2003-07-09
以前1.2版本demo的htmlparser是不支持中文的,下了javacc重新编译一边,把unioncode支持上面打个钩就可以了
回复
eyeieye 2003-07-09
哪个版本的lucene?
回复
zhaoxuefeng 2003-07-09
up
回复
zhaoxuefeng 2003-07-08
caught a class org.apache.lucene.queryParser.ParseException
with message: Lexical error at line 1, column 2. Encountered: <EOF> after : ""
回复
zhaoxuefeng 2003-07-08
up
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2003-07-08 08:02
社区公告
暂无公告