大家帮忙看一下,这个错误是不是Lucene不能解处理中文

zhaoxuefeng 2003-07-08 08:02:10
我运行:IndexHTML -create g:/1时出现以下错误这个错误是不是Lucene不能解处理中文(用了Lucene_cn.jar)
adding g:/1/xqszhdls.htm
Parse Aborted: Lexical error at line 7, column 38. Encountered: "\u4f53" (20307
), after : ""
adding g:/1/zhyedjz.htm
Parse Aborted: Lexical error at line 7, column 38. Encountered: "\u4f53" (20307
), after : ""
...全文
282 10 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhaoxuefeng 2003-07-09
  • 打赏
  • 举报
回复
中文可以查找了,解决的方法是把建立索引的内容转化为ISO8859_1的编码储存,在查的时候先转化为ISO8859_1的编码查找,再转化为GBK输出,不知这个方法有什么缺点?
eyeieye 2003-07-09
  • 打赏
  • 举报
回复
把错误堆栈copy上来看看
eyeieye 2003-07-09
  • 打赏
  • 举报
回复
我用1.3没问题,记得以前用1.2的时候也很正常的。

jive那些玩艺不用管,它自己把索引、搜索的功能集中到一起而已。

具体环境不知道,那咱也就不好判断出错原因了。
zhaoxuefeng 2003-07-09
  • 打赏
  • 举报
回复
重新用JAVACC编译了htmlparser.jj,还是不行,在问一下我看了jive的查询他里面用了DBsearchManager等这些类,这与生成索引有什么关系吗?是不是利用这些类来生成索引,
在查询数据库的数据时除了生成索引还需要做什么工作?
zhaoxuefeng 2003-07-09
  • 打赏
  • 举报
回复
谢谢,
我先用1.2版本是最新的,与MYSQL连通后生成索引测试英语没有问题,但是中文什么结果也没有,重新写SearchFiles.java使用(http://www.javaresearch.org/article/showarticle.jsp?column=25&thread=1232&message=1881&redirect=true&hilite=true&q=lucene)下载的lucene_cn.jar并把Analyzer analyzer = new StandardAnalyzer();改为Analyzer analyzer = new ChineseAnalyzer();然后就出现caught a class org.apache.lucene.queryParser.ParseException
with message: Lexical error at line 1, column 2. Encountered: <EOF> after : ""

eyeieye 2003-07-09
  • 打赏
  • 举报
回复
以前1.2版本demo的htmlparser是不支持中文的,下了javacc重新编译一边,把unioncode支持上面打个钩就可以了
eyeieye 2003-07-09
  • 打赏
  • 举报
回复
哪个版本的lucene?
zhaoxuefeng 2003-07-09
  • 打赏
  • 举报
回复
up
zhaoxuefeng 2003-07-08
  • 打赏
  • 举报
回复
caught a class org.apache.lucene.queryParser.ParseException
with message: Lexical error at line 1, column 2. Encountered: <EOF> after : ""
zhaoxuefeng 2003-07-08
  • 打赏
  • 举报
回复
up

81,122

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧