IKAnalyzer分词测试不成功!

whos2002110 2014-07-17 10:02:03

lucene是最新版本4.9， demo代码基本没有改动，但查询结果却不正确



public class IKAnalyzerDemo {

	public static void main(String[] args) {

		String fieldName = "text";



		String text = "IK Analyzer是一个结合词典分词和文法分词的中文分词开源工具包。它使用了全新的正向迭代最细粒度切分算法。";



		Analyzer analyzer = new IKAnalyzer(true);

		//Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_4_9);

		

		Directory directory = null;

		IndexWriter iwriter = null;

		IndexReader ireader = null;

		IndexSearcher isearcher = null;

		try {

			directory = new RAMDirectory();



			IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_4_9, analyzer);

			iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE);

			iwriter = new IndexWriter(directory, iwConfig);



			Document doc = new Document();

			doc.add(new StringField(fieldName, text, Field.Store.YES));

			iwriter.addDocument(doc);

			iwriter.close();



			ireader = DirectoryReader.open(directory);

			isearcher = new IndexSearcher(ireader);



//			String keyword = "Analyzer";

			String keyword = "中文分词工具包";



			QueryParser qp = new QueryParser(Version.LUCENE_4_9, fieldName, analyzer);

			qp.setDefaultOperator(QueryParser.AND_OPERATOR);

			Query query = qp.parse(keyword);

			System.out.println("Query = " + query);



			TopDocs topDocs = isearcher.search(query, 5);

			System.out.println("命中：" + topDocs.totalHits);



			ScoreDoc[] scoreDocs = topDocs.scoreDocs;

			for (int i = 0; i < topDocs.totalHits; i++) {

				Document targetDoc = isearcher.doc(scoreDocs[i].doc);

				System.out.println("内容：" + targetDoc.toString());

			}

		} catch (CorruptIndexException e) {

			e.printStackTrace();

		} catch (LockObtainFailedException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		} catch (ParseException e) {

			e.printStackTrace();

		} finally {

			if (ireader != null) {

				try {

					ireader.close();

				} catch (IOException e) {

					e.printStackTrace();

				}

			}

			if (directory != null) {

				try {

					directory.close();

				} catch (IOException e) {

					e.printStackTrace();

				}

			}

		}

	}

}

不管怎么改，结果总是：



命中：0

不知道问题出在哪里！！

...全文

263 6 打赏收藏转发到动态举报

写回复

用AI写文章

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

LipipiFighting 2016-05-12

打赏
举报

https://github.com/kweima/IKAnalyzer5 亲测，lucene6.0可用。

whos2002110 2014-07-17

打赏
举报

引用 3 楼 shixitong 的回复:

doc.add(new StringField(fieldName, text, Field.Store.YES));

替换为

doc.add(new Field(fieldName, text, Field.Store.YES, Index.ANALYZED));

引用 4 楼 luotitan 的回复:

lucene4.9 StringField默认不分词 document.add(new StringField("name", user.getName(), Store.YES)); 改成 document.add(new TextField("name", user.getName(), Store.YES)); TextField默认分词

是这个问题，不知道是不是网络的原因，我结贴的时候还没有看到你俩的回复，所以没分了

luotitan 2014-07-17

打赏
举报

lucene4.9 StringField默认不分词 document.add(new StringField("name", user.getName(), Store.YES)); 改成 document.add(new TextField("name", user.getName(), Store.YES)); TextField默认分词

shixitong 2014-07-17

打赏
举报

doc.add(new StringField(fieldName, text, Field.Store.YES));

替换为

doc.add(new Field(fieldName, text, Field.Store.YES, Index.ANALYZED));

whos2002110 2014-07-17

打赏
举报


isearcher = new IndexSearcher(ireader);
System.out.println(isearcher.doc(0).get(fieldName));

这样可以把text内容打印出来，说明数据已经索引了，但是isearcher.search(query, 5); 却查询不到！我猜想不是中文分词不正确的原因，因为当我查询英文的时候也一样的结果。甚至把分词器换为StandardAnalyzer后也同样查询不到数据，不管中文还是英文

tony4geek 2014-07-17

打赏
举报

lucene 没用过。帮顶。

在这个说明中，我们将详细讲解如何在Solr 6.0中配置ikanalyzer分词文件，以实现对中文文本的有效处理。 1. **ikanalyzer简介** ikanalyzer是一款专门为Java语言设计的开源中文分词库，它基于Apache Lucene项目，...

通过上述步骤，我们可以成功地在Windows环境下安装和配置Solr3.6，并集成IKAnalyzer3.2.8实现中文分词功能。这种配置方式不仅适用于开发环境，也能够满足生产环境中对中文检索的需求。此外，Solr的强大之处在于其...

6. **测试整合**：通过Elasticsearch的RESTful API或者客户端工具（如Kibana、curl等）发送测试请求，验证IKAnalyzer是否正常工作。 **四、使用技巧与注意事项** 1. **性能优化**：根据实际需求调整IKAnalyzer的...

本文将详细解析"Android中文分词 2.2以上真机测试成功"这一主题，涵盖相关技术点及其实现过程。首先，我们要理解什么是中文分词。中文分词是自然语言处理的基础步骤，因为中文没有像英文那样的空格来划分单词，...

### Solr安装与整合中文分词IKAnalyzer ...通过以上步骤，不仅完成了Solr的基本安装配置，还成功地集成了IKAnalyzer，实现了对中文文本的有效分词处理，这对于处理中文数据的全文检索应用来说非常重要。

Java EE

67,543

社区成员

225,859

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章