【求助】大数据量下,对表字段GROUP BY排序效率问题
例如一个表保存一些网站的新闻标题和url记录等 表结构如下
id host title url ord(排序) time
1 www.sina.com **新闻标题 http://www.sina.com/aa.html 1 2011-1-1
2 www.sina.com **新闻标题2 http://www.sina.com/bb.html 2 2011-1-1
。。。
。。。。
0.目前数据量有1千万了,还在增加
1.站点数量不确定,至少上万个。
2.title中,同样的标题可能会产生几个不同的host和url,因为文章抄袭的还是很多的
3.同样的url也会对应几个不同的title和host
现在遇到查询显示的问题
按列数量排序的语句很慢,例如按host排序
select top 500 host,count(*) as tj from tb group by host order by tj desc
而且还想按title和url也统计排序
如果再加上条件的话,查询就更慢了
求优化方法