solr 分组不能按大写字母问题? [问题点数:50分]

Bbs1
本版专家分:0
结帖率 0%
其他相关推荐
solr 分组统计
我这里实现分组统计的方法是使用了Solr的Facet组件, Facet组件是Solr默认集成的一个组件.Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计 适宜被Facet的字段一般代表了实体的某种公共属性,如商品的分类,商品的制造厂家,书籍的出版商等等. Facet字段的要求Facet的字段必须被索引.一般来说该字段无
solr 查询 分组及排序
背景 solr中有个索引,对应mysql的用户表,如下: { "chineseName": "宋玉山", "englishName": "&amp
solr分组查询、统计功能详解
solr分组功能介绍,获取分组信息,同时使用map接收返回全部信息~~~~
Solr之分组统计。
博文中的内容来源《Solr基础知识》这本书,感激不尽。
Solr 使用Facet分组过程中与分词的矛盾解决办法
对于一般查询而言 , 分词和存储都是必要的 . 比如 CPU 类型 ”Intel 酷睿 2 双核 P7570”, 拆分成 ”Intel”,” 酷睿 ”,”P7570” 这样一些关键字并分别索引 , 可能提供更好的搜索体验 . 但是如果将 CPU 作为 Facet 字段 , 最好不进行分词 . 这样就造成了矛盾 , 解决方法为 , 将 CPU 字段设置为不分词不存储 , 然后建立另外一个
Solr分组聚合查询之Group
摘要: Solr对结果的分组处理除了facet还可以使用group。Solr的group是根据某一字段对结果分组,将每一组内满足查询的结果按顺序返回。Group对比FacetGroup和Facet的概念很像,都是用来分组。Facet返回所有相关的结果并允许用户基于facet的目录重新定义结果集。Facet可以对分组数量进行过滤,以及排序,和日期范围,时间范围分组,但是如果你想得到具体的数据,还得需要
Solr---Group分组查询
场景描述:JAVA部分代码: ...         // 创建solrQuery对象 SolrQuery query = new SolrQuery(); query.set("q", "*:*" ); /*分组*/ //是否分组 query.setParam("group", true); //分组的字段,不可以是多值字段 query.s...
Solr之结果分组/字段折叠
结果分组solr中非常有用的功能之一,它能确保针对用户的查询返回最佳搜索结果。结果分组,通常也被称为字段折叠,能针对一个字段里的唯一值只返回一份文档,如果有多份相似文档,这个功能就能派上用场。结果分组能通过显示多个文档类别来确保搜索结果的多样化。...
solr按年份分组统计 按年份查询
效果:solr时间分组统计拼写:Calendar calendar = new GregorianCalendar(); try { calendar.setTime(DateUtils.parseDate(DateUtils.getYear(), "YYYY")); } catch (ParseException e) { // TODO Auto-generated cat...
solr分组查询
public static HttpSolrServer server = new HttpSolrServer("http://localhost:8080/solr/"); public static void main(String[] args) { queryAll(); } public static void queryAll(){ Map rmap = new Lin
solr group分组查询
如:http://localhost:8080/solr/test_core/select?q=*:*&wt=json&indent=true&group=true&group.field=field&group.limit=0 参数说明 param name param value description gr
Solr分组聚合查询之Facet
摘要: Solr的分组聚合是一个笼统的概念,目的就是把查询结果做分类,有多种方式可以做到很类似的结果。也正是由于它们的不同表现,可以适合于多种场景。何为FacetFacet是一种手段,用来将搜索结果分类,它并不会修改查询结果信息,只是给分类后的结果加上了每一项的数量值。我们可以用facet来做导航栏,引导用户更精确地查找信息。一般参数 参数 说明 facet 布尔值,设置为true,表
IK分词组件大小写的问题
IK分词器在加载词典时, 词典中的大小写字符加载到内存时一律变为小写, 但是在分词时大小写是不会转换的, 所以就有以下情况发生: 当词典中有"HL定理", 对"HL定理的应用"分词时是不能分出"HL定理"的, 处理办法:在讲要分词的句子输入分词器前, 先将所有的大些字母转化为小写, 这样分词出来的就是 "hl定理"
solr facet查询(SOLR的另一种groupBy),可以分页,分组,统计
一.   Facet 简介  Facet 是 solr 的高级搜索功能之一 , 可以给用户提供更友好的搜索体验 . 在搜索关键字的同时 ,能够按照 Facet 的字段进行分组并统计 .二.   Facet 字段1.       适宜被Facet 的字段一般代表了实体的某种公共属性 , 如商品的分类 , 商品的制造厂家 , 书籍的出版商等等 .2.       Facet 字段的要求Facet 的字...
使用solr进行高亮显示、过滤、分组、分页排序查询
public class HighlightAndFilterQueryDemo { @Autowired private SolrTemplate solrTemplate; public Map search(Map searchMap){ Map map = new HashMap(); //1、查询列表 "rows" : contentList map.putA...
4、solr的增删改查和高亮以及分组
代码如下: package com.hj.solr; import org.apache.solr.client.solrj.beans.Field; /** * 在变量的set方法上注解上lucene内部的字段名称 */ public class Message { private String id; private String title; private String
solr 中的group使用说明
参数说明 param name param value description group true/false if true, turn on result grouping group.field [fieldname] Group
Solr聚合查询
1  分组查询 1.1     Facet分组 solr种以导航为目的的查询结果成为facet,在用户查询的结果上根据分类增加了count信息,然后用户根据count信息做进一步搜索,  Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计。   Solr Fact提供了4种类型的Fact
Solr系列六:solr搜索详解优化查询结果(分面搜索、搜索结果高亮、查询建议、折叠展开结果、结果分组、其他搜索特性介绍)
一、分面搜索1. 什么是分面搜索?分面搜索:在搜索结果的基础上进行按指定维度的统计,以展示搜索结果的另一面信息。类似于SQL语句的group by分面搜索的示例:http://localhost:8983/solr/techproducts/browse  2. Solr中支持的分面查询 字段分面、区间分面、决策树分面、查询分面 2.1 字段分面执行搜索时,根据查询请求返回特定分面字段中找到的唯一...
Solr中的group与facet的区别
Solr中的group与facet的区别 如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的。 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Exception {       solrServer = createSolrServer();
Solr---Facet分面查询中时间区间分面的坑
场景描述:        上一篇分面查询文章中,我们提到了时间区间分面,但是在使用的过程中,遇到了很坑的事情,那就是时区。        如果忽视时区,直接设置时间,时间分面查询的结果。很自然的你会设置起始时间都为该月1号00:00:00,但是因为时区的问题,在Solrj处理之后发送给服务器查询时,你可以通过debug看到他的查询条件处理成减了8小时。也就变成了上个月最后一天的16:00:00,如...
[Lucene高性能] Lucene中分组统计(GroupBy)及去重(Distinct)性能在数量级上提升解决方案
所谓分组统计,就是类似sql里group by的功能。在solr里,这个功能称为faceting。lucene本身不支持分组统计,不过可以使用fieldCache来实现分组统计功能,而且也有很好的性能。solr根据不同的情况,还提供了其他方法(filterCache和UnInvertedField)来实现,这个以后再说。 fieldCache是lucene用来排序的缓存。对要用来排序
Solr分组聚合查询之StatsComponent
摘要: Solr可以利用StatsComponent 实现对数字、字符串或日期字段的聚合统计查询。Stats Component参数 参数 描述 stats 布尔值,设为true,表示开启Stats Component stats.field 指定需要做统计的字段 stats.facet 对指定的facet生成一个子结果集 stats.calcdistinct
solr分组统计
1.代码案例 public void FacetByLjf(){         LBHttpSolrServer server = SolrUtils.getInstance().getEnterpriseNewServer();         SolrQuery query = new SolrQuery();         String sql="(enterpriseName:
Solr.NET快速入门(三)【Faceting】
分面搜索SolrNet支持分面搜索。基本上有三种方面查询: 按字段查询 日期分面 任意分面查询 分面查询通过QueryOptions的FacetQueries属性发出。 然后QueryOptions实例被传递到服务器实例。分面限制有可能,您用作分面的字段可能具有太多的值,因此您可能想要限制应显示多少个值。 为此,我们在SolrFacetFieldQuery中具有Limit属性。只需将Limit设
Solr4.6,搜索不区分大小写的配置
有些字段搜索的时候不需要区分大小写。这个时候需要做简单的过滤,建索引和搜索的时候把输入都转换成小写即可。配置如下:     配置中使用的过滤器工厂类LowerCaseFilterFactory的wiki定义如下:
取色,取密码,突破灰色按钮
可以解决不能按的按钮问题
solr的增删改查和高亮以及分组
代码如下: [java] view plain copy   package com.hj.solr;      import org.apache.solr.client.solrj.beans.Field;      /**   * 在变量的set方法上注解上lucene内部的字段名称   */   public class Me
分组查询最大最小记录的方法
两种 1-- 自连接的方式,如果最大条记录或者最小记录存在多条的话,则会查出所有的记录2SELECT 3 _max.sale_id,4 _max.visit_date,5 _max.sign_time,6 _max.id,7 _min.sign_time,8 _min.id 9FROM10 (SELECT 11   sign_max.id,12   sign_m
Solr7.1 学习笔记
一、Lucene介绍 1. lucene简介 Lucene是一个全文搜索框架,而不是应用产品。因此它并不像 baidu 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 在全文检索工具中,全部都由三个部分组成:索引部分、分词部分、搜索部分 2. lucene的工作方式 lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本...
按钮突破专家
解决按钮灰化问题,windows 下的 按钮不能按问题
数据结构——算法之(030)(将字符串中所有小写字母排在大写字母的前面)
【申明:本文仅限于自我归纳总结和相互交流,有纰漏还望各位指出。 联系邮箱:Mr_chenping@163.com】 题目: 有一个由大小写组成的字符串,现在需要对他进行修改,将其中的所有小写字母排在大写字母的前面 开辟足够少的空间,时间复杂度O(n) 题目分析: 1、字符串从新排序后没有要求保持以前的顺序 2、用两个指针分别指向字符串头和尾,头指针指向每次指向大写字
Solr.NET快速入门(六)【聚合统计,分组查询】
聚合统计 属性 说明 Min 最小值 Max 最大值 Sum 总和 Count 记录数,也就是多少行记录 Missing 结果集中,有多少条记录是空值 SumOfSquares 平方和(x1^2 + x2^2+xn^2) Mean 平均数(x1+x2+xn)/n StdDev 标准差 示例:ISolrOperations
solrj实现solr的group查询:
参考wiki:http://wiki.apache.org/solr/FieldCollapsing#Result_Grouping_.2BAC8_Field_Collapsing 一、实现的相关类:SolrServer、SolrQuery、QueryResponse、GroupResponse、GroupCommand、Group、SolrDocumentList     (1)
solr聚合统计
StatsComponent 转载请出自出处:http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述        Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能   二、参数 参数
文件夹名千万不要大写!!!
欢迎使用Markdown编辑器写博客 本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I...
solr分组问题
请问下solr使用fact分组时能否返回该分组的总条数?[img=http://img.bbs.csdn.net/upload/201603/23/1458709226_313170.png][/img]就像这里返回10条,怎么得到10这个结果
Solr中Facet用法和Group用法
group用法: //组查询基础配置 params.set(GroupParams.GROUP, "true");  params.set(GroupParams.GROUP_FIELD, "dkeys"); params.set(GroupParams.GROUP_LIMIT, "5");  params.set(GroupParams.GROUP_FORMAT, "grouped")
win7电脑磁盘文件以分组方式展现解决方案
问题:   win7电脑磁盘文件以分组方式展现,具体如下:   解决:    右键磁盘空白处--》分组依据--》选择无;图解如下:
转:solr中facet及facet.pivot理解(整合两篇文章保留参考)
Facet['fæsɪt]很难翻译,只能靠例子来理解了。Solr作者Yonik Seeley也给出更为直接的名字:导航(Guided Navigation)、参数化查询(Paramatic Search)。 上面是比较直接的Faceted Search例子,品牌、产品特征、卖家,均是 Facet 。而Apple、Lenovo等品牌,就是 Facet values 或者说 Constraint
Solr之分组查询facet
用户查询之后通过点击分组,能继续缩小搜索范围,来定位自己想要的内容,效果图入下: Solrj 代码 /**  * 一个演示方法,根据查询关键词查询结果,连带查结果对应的栏目分组情况 。  *  * @param kw 搜索词  */ public static void query(String kw) {     SolrQuery query = new SolrQuer
solr分组
http://localhost:8983/solr/select?q=ipod&rows=0&facet=true&facet.limit=-1&facet.field=cat&facet.field=inStock 02 0 0 0 0 1 0 3
关于大数据量下Core Data的数据迁移
Core Data版本迁移基础 通常,在使用Core Data的iOS App上,不同版本上的数据模型变更引发的数据迁移都是由Core Data来负责完成的。 这种数据迁移模式称为Lightweight Migration(可能对于开发人员来说是lightweight),开发人员只要在添加Persistent Store时设置好对应选项,其它的就交付给Core Data来做了:
关于solr的一些总结和问题
关于solr的一些总结和问题,主要是solrJ,schema.xml,solrCloud
将字符串中的小写字母排在大写字母的前面
有一个由大小写组成的字符串,现在需要对它进行修改,将其中的所有小写字母排在大写字母的前面(大写或小写字母之间不要求保持原来次序)。#include #include #include using namespace std; const int MAX = 100; void handleStr(char *str) { int size = strlen(str); int head = 0; int tail = size - 1;
solr去重
基于solr本身去重的局限性。 solr的去重建议直接采用set的特性去重即可。
分布式面试之Solr以及redis的面试问题
redis之雪崩问题的解决:首先redis做缓存,应用场景一般如下: Redis做缓存是最常见的应用场景。客户端请求在缓存层命中就直接返回,如果miss就去读取存储层,存储层读取到就写入缓存层,然后再返回到客户端。  优点:  加速读写  降低后端负载  缺点:  数据的不一致性  代码维护成本  运维成本 缓存穿透化: 然而缓存可能会遇到这种问题:请求cache拿不到数据,就会去存...
面试准备之solr集群及solr集群中zookeeper的应用和activeMQ
activeMQ应用场景:添加商品时需要将索引同步到数据库(这时候的manage-service充当消息的) solrcloud:solrcloud是solr提供的,基于solr和zookeeper的分布式搜索方案 应用场景 :1) 当需要大规模,容错,分布式索引和检索能力时使用solrcloud; 2)当索引量很大,搜索请求并发很高时,同样需要使用solrcloud来满足这些需求; 不过
solr 6.3 入门(四) (solr facet 高级使用)
最近项目需要用到solr的高级功能 facet 功能,说起来这个功能的特点在于方便,快速, 这个转载一个写得很好的博客 本文主要沿着以下三个方向来解开solr使用之谜,让大家使用solr跟使用mysql一样简单方便,安装和介绍部分已经在上一篇solr安装和简介详细介绍,在此就不详述。   1、solr php客户端实现   2、solr简单功能使用   3
solr增量索引问题
关于solr增量索引问题在网上会搜索到一堆文章。我这里只对我做项目时遇到的问题问进行一个描述和解疑:         我所做项目的数据库是千万级以上的数据量。所以全量索引就不太现实了,但在进行增量索引配置时总是出现  id 无法解析等问题。后来查阅资料才了解到配置文件的信息不正确。如下图: 在data-config.xml文件中红色方框的字段名称要一致,之前我由于配置的并不一样,所
solr 增量同步问题
今天做solr同步时遇到问题,发现数据值同步了部分字段,先来看下配置增量导入的sql配置: SELECT id,name,picture,description,type,price,hard,update_statue,introduce,original_cos
关于solr--多表插入索引覆盖问题
问题描述:如果在solr中添加数据库中表数据:在solrhome中配置solrconfig.mxl文件,添加一个requestHandler。   class="org.apache.solr.handler.dataimport.DataImportHandler">            data-config.xml           创建一个data-config.xm
Solr权威指南 下卷
实战
Solr问题处理(总结版)
检查索引:java -ea:org.apache.lucene... org.apache.lucene.index.CheckIndex  /usr/share/solr/data/index 修复索引:java –cp /solr/lucene/lucene-core-3.1-SNAPSHOT.jar -ea:org.apache.lucene... org.apache.lucene.
kafka与solr一同搭建集群时遇到的问题
在虚拟机中搭建过Kafka集群,没有什么问题,这次在公司电脑里搭建Kafka时出现问题, 因为同时存在solr集群,这里采用两个zookeeper搭建,因为存在两个zk,所以有点问题,报了一些错误, 最终更换Kafka版本,还是有错误,最后解决了,问题出在,Kafka中的配置文件,consumer.properties里面的ip也需要更换, 保持跟service.properties的相同,
solr使用中遇到的问题
1.剔除数据 ----在搜索时,想将某些结果排除掉,我们可以使用操作符 “-”进行排除查询。即:-field:value。例:剔除id为123的数据filterQuery.addFilter("-id:123")2.SolrServerException: No live SolrServers available to handle this request:[http://192.168.20...
solr5解决时区差8小时的问题
在oschina上的第一篇文章,记录一个在工作中遇到的问题 问题很简单,也算是开博了 在solr5中解决时区的问题,更加简单了,直接修改配置文件bin/solr.in.sh即可。如下: #SOLR_TIMEZONE="UTC" 将此参数修改为如下: SOLR_TIMEZONE="UTC+8"
solr 7.X 与spring-data 3.X整合 --(2)自定义查询
虽然Spring-data-solr提供了常用的curd操作,但是对于个性化的场景还是不能完全满足我们的需求,需要自己去实现。 代码的相关配置,请参见solr 7.0 与spring-data 3.0整合 –(1) 要实现个性化的查询,我们就需要对repository进行改写。 这里实现一个按照歌手名字喝歌曲名字来进行搜索,并完成分页。 新建自定义接口 public interface ...
Solr分词fieldType分词解析器设置错误导致查询错误
      今天在线上生产环境中碰到一个Solr的查询条件无法匹配到查询结果的问题问题虽小,但是找到问题的过程确实比较周折,还好最终问题只是一层窗户纸,这里记录以下,以作备忘。        问题是这样的,业务方告诉我有一个查询条件,没有办法匹配到目标记录。查询条件是:name:Y9砵仔糕吕托 收到问题,于是就开始了我的排错之路。         首先,确认了一下name字段原始的文本字段...
面试:----利用solr实现商品的搜索功能
后期补充: 为什么要用solr服务,为什么要用luncence? 问题提出:当我们访问购物网站的时候,我们可以根据我们随意所想的内容输入关键字就可以查询出相关的内容,这是怎么做到呢?这些随意的数据不可能是根据数据库的字段查询的,那是怎么查询出来的呢,为什么千奇百怪的关键字都可以查询出来呢? 答案就是全文检索工具的实现,luncence采用了词元匹配和切分词。举个例子:北京天安门-
Solr经常出现问题
Solr服务异常 删除new_core目录下data目录下的所有数据;如果数据域类型错误,通过Solr控制台删除所有自定义数据类型并重新定义 高亮显示 高亮显示的字段修改为text_general类型,Solr中已有的数据必须重新删除并导入,Controller中定义查询条件不能包含*,比如查询: name:七匹狼 删除Solr中的文档 向Solr中添加文档时,Map中必须包含i...
solr 分组后排序问题
根据一个字段进行分组过后,如何根据分组后的数量进行排序?rn[code=java]rn SolrQuery q = new SolrQuery();rn q.setParam("group", true);rn q.setParam("group.field", "Country_s");rn q.setParam("group.ngroups", true);rn[/code]
solr统计只返回10或者100个数据的解决办法
        因为我所在的公司为政府做的项目【风险管理系统】,其中涉及大量的统计展示,多数以整个市的区划,行业部门等方式返回,在昨天,我发现听过填报单位的方式返回时,始终只有100个数据。通过对比发现,在前辈的代码中统计的存在一个巧合,就是全市的区划、行业部门钻取的方式都没有超过100,刚好我写的这个接口的填报单位有接近3w个单位。    在solr中不管是FacetPivotField还是Fa...
solr 主从集群出现的问题
solr 4.7.2 主从服务配置参见http://dacoolbaby.iteye.com/blog/2144775。 startup commit 测试流程:关闭master,在slave同步报错后再启动master。想看看启动master后salve是否正常同步 结果:第一次在master启动后slave没有任何反应,即使重启slave后也不行,在master使用dataim
通讯录 按中文名字 拼音首字母 排序
<body>    <div class="address">        <div class="address_title clearfix">            <input class="form-control pull-left" id="address_search" type="text"
solr常见问题整理
本文是我在开发过程中遇到的一些问题的整理,有些摘自网上别人的方法。 1. org.apache.solr.client.solrj.SolrServerException: Timeout occured while waiting response from server at: http://localhost/solr请求超时     解决方法:设置setConnectionTime
Solr查询参数(分页)start 与 rows
在Solr中,用start参数控制返回第一条记录在完整找到结果中的偏移位置,用rows 指定返回结果最多有多少条记录,配合start来实现分页。
别人的面试总结
原文地址:http://www.jianshu.com/p/d6c99e7370f5?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-timeline&from=timeline&isappinstalled=1 1.美团 美团好像近期在大肆招人,我面试也是很快,请了一上午的假去的
Solr操作中新手常见问题
solr 4添加索引是新手容易遇到的问题 异常一. Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/http/NoHttpResponseException Caused by: java.lang.ClassNotFoundException: org.apache.http.NoHttpRespo
Solr分页查询代码,包含查询,分页,高亮及获取高亮处摘要代码
solr工具类import java.util.ArrayList; import java.util.Date; import java.util.Iterator; import java.util.List; import java.util.Map;import org.apache.log4j.Logger; import org.apache.solr.client.solrj.Solr
solr 高级进阶,解决以下五个问题,就可以投产了
一、多表、多数据源 数据导入的问题 之前介绍过通过data-config.xml 导入数据的问题,实际开发过程中可能会遇到多表、甚至是多数据源的问题,以下我根据实际业务场景说下该如何解决该问题。 只需要,更改data-config.xml的写法就行了。<dataConfig> <!-- <dataSource type="JdbcDataSource" driver="...
理解Solr缓存及如何设置缓存大小
文献地址:http://wangdg.com/understanding-and-tuning-solr-cache/ 理解Solr缓存及如何设置缓存大小 为了得到最好的检索性能,Solr会在内存中缓存不同的数据: Result Set: 检索结果Filter: filter query结果Document Field: 文档的字段值 所以随后类似的检索可以被快速处理。
积分商城基于Solr的搜索引擎优化
基于solr服务器搜索引擎框架,让大家了解solr,认识solr,解决电子商务网站性能问题
基于RecyclerView的字母分组排序列表(类似通讯录)
基于RecyclerView的字母分组排序列表(类似通讯录),解决RecyclerView不能滚动定位问题
solr6遇到的查询问题总结
1. 查询时 filed:value value的值必须完全匹配才能查出来。 后发现是因为 filed中的type类型是 strings  将type改成 text-general 即可查询出来  不过高亮显示的是逐字断开的 将type改成 text_ik即支持中文的分词器即可 按查询内容完全查询。
solr深分页,游标操作分页,解决性能问题
了解solr的setStart分页问题不能解决后续分页的性能问题,提供了游标操作,不仅能解决深度分页问题,还能提供一次性全部获取索引(虽然不推荐这么做)
Solr中的日期/时间表示
摘要: Solr的日期字段(TrieDateField 和DateRangeField)可以对一个时间点以毫秒精度表示。格式Solr中的日期有很严格的格式限制: YYYY-MM-DDThh:mm:ssZ YYYY 表示年 MM 表示月份 DD 表示天 hh 表示小时,24小时制 mm 表示分钟 ss 表示秒钟 Z 代表时区是UTC 比如: 2017-01-22T17:33:18Z 时区不能换,只
分布式Solr的排序及分页性能问题
分布式Solr的排序和分页使用下面的算法: 1. 传入查询条件q,排序sort,开始行数start,返回记录数rows 2. 修改参数,向各个分片shard发送新的查询请求:    a)保持q和sort不变    b)修改start=0,rows=原start+原rows    c)分片shard将会返回最多(原start+原rows)行数据,并且是按照sort排序的 3. 合并每个s
Solr Tokenizers分词器介绍
摘要: Solr的分词器(Tokenizers)用来将文本流分解成一系列的标记(tokens)。分析器analyzer 受字段配置的影响,分词器(Tokenizers)于此无关。分析器主要是把字符流(character stream )处理成一系列的标记对象(Token objects)。参见原文。分词器说明输入流中很些信息可能是不需要的,比如空格和标点;有些信息是需要添加的,如同义词/别名;有些信
Solr时间差问题解决办法
在oschina上的第一篇文章,记录一个在工作中遇到的问题问题很简单,也算是开博了在solr5中解决时区的问题,更加简单了,直接修改配置文件bin/solr.in.sh即可。如下:<!-- lang: shell --> #SOLR_TIMEZONE="UTC" 将此参数修改为如下:<!-- lang: shell --> SOLR_TIME...
solr权重
solr权重可以在solrconfig.xml配置,也可以用solrJ直接实现,本人用的是第二种方法,demo比较简单,但是可以看出流程和结果 第一步:先往索引库里添加数据,我这里只添加五条,不要问为什么 for(int i=0;i<5;i++){ //添加数据 SolrInputDocument doc1 = new SolrInputDocument(); doc
solr5.5在web中高亮显示
1.搭建web项目 2.添加相关的jar包:在solr-5.5.0\dist\solrj-lib(全部)和solr-5.5.0\dist\(2个:core和solrj)下可以找到这些jar包 3.高亮显示的代码 4.启动运行 启动solr,运行后结果如下 5.问题:测试的时候,查询出来的高亮的结果Map总是没有,是空的??很不明白
Solr的facet分组
  待学习。。。 参考: http://ynial.iteye.com/blog/598811 http://jlk.iteye.com/blog/623433  
Solr 6.0 问题汇总
本文是针对在学习和运用solr6.0中遇到的问题做总结,会持续更新配置solr 404问题在Solr 6.0 学习(一)环境搭建中很多同学在评论区说404问题 访问:http://localhost:8080/solr/index.html 正常 访问:http://localhost:8080/solr 报404我们看下到web.xml中部分配置如下:
solr分组和统计功能
http://localhost:8983/solr/select?q=*:*&amp;stats=true&amp;stats.field=price&amp;stats.field=popularity&amp;rows=0&amp;indent=true   http://localhost:8983/solr/collection1/select?q=*%3A*&amp;wt=xm...
solr使用过程中遇到的一些问题
1.solr部署到tomcat报错 com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: 1 字节的 UTF-8 序列的字节 1 无效。  有可能是由于上面的web.xml中写了中文的注释 2.对表进行查询时 http://localhost:8080/solr/db/dataimport
Solr Facet分组技术
问题背景 在《搜索引擎关键字智能提示的一种实现》一文中介绍过,美团的CRM系统负责管理销售人员的门店(POI)和项目(DEAL)信息,提供统一的检索功能,其索引层采用的是SolrCloud。在用户搜索时,如果能直观地给出每个品类的POI数目,各个状态的DEAL数目,可以更好地引导用户进行搜索,进而提升搜索体验。 需求分析 例如,下图是用户搜索项目(DEAL)的界面,当选中一个人或
solr分组聚合
在大型电子商务网站中,在商品列表页,我们都可以看到商品按分类,品牌,价格的分类显示,如下图,这些我们可以使用solr中的facet功能实现。      facet的基本功能就是对搜索结果中的商品进行分类。     1.facet用法        facet.field:指定要分类的字段        facet=on 或 facet=true表示功能开启        facet...
一个朋友的面试总结,算自己的知识回顾补偿吧
面试总结   作者 codertom 关注 2017.03.06 00:02* 字数 2351 阅读 26评论 2喜欢 3 1.美团 美团好像近期在大肆招人,我面试也是很快,请了一上午的假去的,面试官很不错,顺着简历问了一些项目的问题问题也主要是项目的问题,也指出项目上可能存在的一些问题,问一下我的解决方案,主要问题汇总一下: LocalCache
solr基本查询和高级查询
查询参数常用:q - 查询字符串,必须的。fl - 指定返回那些字段内容,用逗号或空格分隔多个。start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows - 指定返回结果最多有多少条记录,配合start来实现分页。sort - 排序,格式:sort=&lt;field name&gt;+&lt;desc|asc&gt;[,&lt;field name&gt;+&lt;...
solr高级
Full Import 例子 让我们来看下面的例子. 假设我们数据库中的表结构如下: This is a relational model of the same schema that Solr currently ships with. 我们使用这个例子来为我们的DataImportHandler建data-config.xml。 我们已经使用这个结构在HSQLDB上建立了一个数据库.
solr之~模糊查询
有的时候,我们一开始不可能准确地知道搜索的关键字在 Solr 中查询出的结果是什么,因此,Solr 还提供了几种类型的模糊查询。模糊匹配会在索引中对关键字进行非精确匹配。例如,有的人可能想要搜索某个前缀开始的单词(称为通配符查询),或者想要查询和关键字有一两个字母不相同的单词(称为模糊查询或编辑距离查询),或者你想要查询两个关键字,并且这两个关键字之间的距离不会大于某个最大值(称为临近查询)。总的
Solr针对空间搜索的支持
Spatial SearchSolr支持在地理空间搜索中使用位置数据,使用空间搜索,你可以: 索引点或者其他形状 通过矩形框,圆或者其他形状来过滤搜索结果 通过点之间的距离 或者两个区域之间的矩形之间的距离,排序或者增强分数 产生一个二维的网格来生成热力图或者点绘制 有四个字段类型来进行空间搜索: LatLonPointSpatialField LatLonType (已经过期) SpatialRe
solr主从节点数据不一致
1.commit命令会触发同步? 2.删除从节点,新建
solr5.3 如何配置使用UUID解决id覆盖问题
在做多表的联合查询时,由于我数据库中表的id有重复,所以在查询结果的时候发生了索引覆盖的事。然后用uuid自动生成这个唯一的ID解决这个问题。(防止id被覆盖) 1.修改schema.xml文件的配置 添加fieldType   添加uuid字段配置 或者在原来的id字段的基础上进行修改 将uuid设置uniqueKey uuid 2.修改sol
solr问题及解决
solr一部分常见的问题及解决方法
Solr --- 管理界面详解
Solr管理界面详解
搜索引擎solr系列---高亮配置及问题总结
solr的高亮配置有两种方式:  一种是配置形式,具体是在配置文件中配置的,该方式我没有用过,所以我这里就不写它了。   另一种就是以代码的形式,我只会用这种方式,所以只写这部分。   其实还要一种就是自我实现,这个更简单粗暴。1.高亮的代码具体如下:package cloud.solr.controller;import cloud.solr.controller.base.BaseContr
配置solr过程中遇到的问题及解决方案
1.由于缺少solr源文件报错 2018/1/9 上午10:56:59 WARN SolrResourceLoader Can't find (or read) directory to add to classloader: ../../../contrib/extraction/lib (resolved as: /usr/local/solrhom
关于Solr索引性能优化
如何能在有限的服务器资源上较好的使用Solr服务,性能调优是必不可少的。鉴于个人经验,给出几条可调优方法: 1. 配置SolrConfig中的Directory, 不当的Directory会消耗大量的内存或IO资源,当索引规模变大时也很容易导致内存溢出,或索引维护的Map Failed现象!如何选择合适的Directory可参看《Lucene in Action》(第二版) Section2.1
我们是很有底线的