搜索引擎小记
薄舟 2019-01-19 09:38:04 lucene:
底层使用倒排索引:
倒排索引:
1.先将要存储索引的数据做编号形成文档列表(含有文档编号,跟其他字段)
2.将文档数据进行分词,得到很多分词,以词条为索引,根据词条保存含有这个词条的文档编号
3.将用户输入的内容进行分词得到词条,拿这些词条去倒排索引列表匹配;能匹配上就能找到包含这些词条的文档编号,根据文档编号查找文档并相应给用户
TestField(会创建索引也会被分词)StringField(会创建索引但不会被分词)
添加索引流程
1.创建字段(field)到文档对象(document)通过索引写入器(indexWriter){需要装置写入器配置对象(indexWriterConfig)配置分词器(analyzer)} 写入到目录类(Directory)