本人最近正在学习Solr4.0(初学者),部署了Solr Server,在用SolrJ使用过程中遇到一些问题,希望有经验的人可以帮帮忙,对于全文检索有了解的人或者正在学习的人,能留下QQ等联系方式,希望能和大家交流交流。本人
QQ:260148597
1.对于ContentStreamUpdateRequest类。在demo里面用它的addFile方法后报错,这个困惑了好久。
demo代码如下:
ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
up.addFile(new File("mailing_lists.pdf"));
up.setParam("literal.id", "mailing_lists.pdf");
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
result = server.request(up);
2.对于对文件建立索引。
①在上面的问题中,如果addFile成功后,文件内容会被Solr内部集成的Tika读出内容作为一个索引字段,还是整个文件就是作为索引字段?
②如果对文件建立索引呢。一般存文件内容的索引字段如content,是将所有内容作为一个单值存入索引(当文件大小很大时,文件内容太大怎么办?),还是在schema中content是multiValued为true,将文件内容分词后得到关键词列表存到索引中?
现阶段具体问题就以上2个,但是还有好多问题都不知道怎么去描述(— —///)
边学习,发现的问题就越来越多,哎,大家帮帮我吧