全文检索+千万数据排序+limit分页,时间1秒
原需求:
1、全文检索多个字段
2、检索结果按时间倒叙排序
3、排序结果按limit offset分页输出,每页100(可以调整)
4、每次分页输出时间最好在1秒内,也可5秒
尝试方案:
--关于greenplum
1、全文检索需要的词典要定时更新,否则可能无法检索到陌生词汇,否决。
--关于Postgres
1、使用gin索引+pg_trgm做分词(三字分词),效果很好
2、水平拆分,使用分区表,但是每个月的数据仍然可能会很大(千万级)
3、考虑过局部索引,会有效果但是分页时会不适合,比较麻烦,暂时跳过
4、垂直拆分,测试发现拆分后有接近10倍的提升,但是每个分表时间在5-9秒,join之后肯定更多
5、搜索引擎sphinx,正在部署测试
请问各位大神,有没有什么建议?
数据库不限,尽量稳定;甚至不用数据库也可以,但是要考虑以后的拓展。(机器不能多,最好1台)