在lucene.net中怎样使用中文分析器？

shijies 2023-09-11 10:37:15

lucene.net没有中文分析器，如下的语句可以得到一个StandardAnalyzer的实例：

Analyzer analyzer = new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29);

lucene.net自带的这个分析器分析中文效果不好。我知道盘古分词和结巴分词可以用于中文分词，结巴分词使用下面的语句：

var segmenter = new JiebaSegmenter();

var segments = segmenter.Cut("我来到北京清华大学", cutAll: true);

我不清楚segmenter是什么，如果想做索引，就需要使用分析器，请问该怎样获得结巴分词的分析器呢？

...全文

157 10 打赏收藏转发到动态举报

写回复

用AI写文章

10 条回复

切换为时间正序

请发表友善的回复…

发表回复

CSDN-Ada助手 2023-09-11

精选

打赏
举报

您的问题已经帮您同步至问答, 链接: https://ask.csdn.net/questions/7997846, 请您保持关注, 如果回答有帮助解决此问题, 麻烦您动动小手给相关的回答点赞, Ada会在评论区为您更新结题状态

shijies 2023-09-14

打赏
举报

在VS2017和VS2022对下面代码编译：
在new Lucene.Net.Analysis.China.ChineseAnalyzer()底下出现了红色的折线
Lucene.Net.Analysis.Analyzer objCA = new Lucene.Net.Analysis.China.ChineseAnalyzer();
都通不过。

shijies 2023-09-13

打赏
举报

using Lucene.Net.Analysis;
using System.IO;
using Lucene.Net.Analysis.Standard;
using ICSharpCode.SharpZipLib;
using Lucene.Net.Analysis.China;

引用了Lucene.Net.dll、Lucene.Net.Analysis.China.dll和ICSharpCode.SharpZipLib.dll
下面这一句中，在new Lucene.Net.Analysis.China.ChineseAnalyzer()底下出现了红色的折线
Lucene.Net.Analysis.Analyzer objCA = new Lucene.Net.Analysis.China.ChineseAnalyzer();

shijies 2023-09-13

打赏
举报

下面这一句中，在new Lucene.Net.Analysis.China.ChineseAnalyzer()底下出现了红色的折线
Lucene.Net.Analysis.Analyzer objCA = new Lucene.Net.Analysis.China.ChineseAnalyzer();

shijies 2023-09-12

打赏
举报

是不是装了JIEba分词 .net core 版，不能直接给Lucene使用？

shijies 2023-09-12

打赏
举报

是这个AdvancedChineseAnalyzer？

shijies 2023-09-12

打赏
举报

lucene.net是否只带有simpleanalyzer可以用于中文分词？按单个字分，效果还可以？

暖洋洋的好日子 2023-09-12

打赏
举报

我直接用lucene做分词，效果还可以

shijies 2023-09-11

打赏
举报

这样也不行：
Analyzer analyzer = new JieBaAnalyzer(TokenizerMode.Search);

shijies 2023-09-11

打赏
举报

以下这一句编译错误：
Analyzer analyzer = new JiebaAnalyzer();

错误 CS0246 未能找到类型或命名空间名“JiebaAnalyzer”(是否缺少 using 指令或程序集引用?) ，可是我引用了这么多：
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using JiebaNet.Segmenter;
using JiebaNet.Segmenter.PosSeg;
using Lucene.Net;
using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.QueryParsers;
using Lucene.Net.Search;
using Lucene.Net.Store;
using Lucene.Net.Util;
using Lucene.Net.Analysis;
using System.IO;
using Lucene.Net.Analysis.Standard;