都2周了,还是找不到好的办法,集思广益,有思路就给分
我有张大表,记录为5百万条,这表对id和create_time做了4个hash分区。(表可以加索引,但其他都不允许改)
需要使用的字段有(asc_code,vin,bl_time,phone)
asc_code有400个,bl_time的时间范围在2年。字段上都有索引。
条件为,
1.对于同一个asc_code,vin和phone都不可以重复
2.祛除重复值后,对asc_code进行采样(随机取标本数,例如,随机对每个asc_code只取7条记录)
我现在的情况描述
1。我用一条sql语句,可以完成上述步骤,都用了分析函数,因为表较大,其排序会花费很长时间。我的时间取一个月,asc_code为全部,花费时间为5分钟左右。3个月的,我都没完成就点了cancel,但需要查询范围可以为一年。
2。前台为jsp,在5分钟内没响应就会超时。
3。前台需要把查询出的结果写文件。
4。如果查询时间为一年,我的cost为22万,代价就在上面的2个排序上。
请大家给点建议,什么都行,分区啊,索引啊,物化视图都行,但最好给出详细可行的。
暂时不贴sql语句,看大家需要再贴
谢各位看帖