请问大侠关于排序大量数据

kolapig 2009-06-29 03:59:59
有10个文件,每个文件1G,
每个文件的每一行都存放的是用户的query,每个文件的query都可能重复

按照query的频度排序


如果内存够大怎么做
内存不够大怎么做


我有一些思路,就是利用map之类的东西,大家觉得对吗?
...全文
49 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
内存不够打的话,用归并来实现外排。
kolapig 2009-07-01
  • 打赏
  • 举报
回复
没有个结论阿
光宇广贞 2009-06-29
  • 打赏
  • 举报
回复
外排。
AYZBL 2009-06-29
  • 打赏
  • 举报
回复
合并排序,那还用说么
绿色夹克衫 2009-06-29
  • 打赏
  • 举报
回复
内存大的话利用map就可以,如果不够大,可以先按照url的前3位进行分治(36^3 = 46656),将源文件分为若干个小文件,
再分别统计。相同的url肯定会在同一个文件里。
蒋晟 2009-06-29
  • 打赏
  • 举报
回复
用Merge sort
little06 2009-06-29
  • 打赏
  • 举报
回复
内存够大
用TreeMap

不过10G数据,都转为内存对象,不知道要多大了
showjim 2009-06-29
  • 打赏
  • 举报
回复
想简单一点解决问题:导入数据库,group by;
自己写程序,内存足够的话,就先用hash表记录次数,然后根据次数进行排序;用hash内存不够的话,用数组排序记录次数,然后根据次数进行排序;内存还是不够的话,根据内存大小多路归并排序两次,第一次字符串排序用于统计次数,每二次根据次数排序
软件名称:大侠DXBBS简体中文版 程序版本:V8.1 开发语言:ASP.NET2.0+MSSQL(C#) 联系方式: 客服QQ:6192665 DXBBS论坛系统简介 DXBBSV8.1论坛系统为采用最新asp.net2.0C#技术原创开发的一套BBS论坛系统. 内核程序高度集成,采用高速数据检索技术与独特的缓存机制,使得系统的运行速度为极速.程序对所有参数进行严格过滤,对cookies采用了特殊加密处理,使得系统具有高度的安全性. 对于大量数据的论坛,系统根据贴子量,自动建立新的数据表,防止单表数据量过大而造成数据库压力过大。 ----------------------------- DXBBS论坛系统的特色 1.极速的系统运行效率。 2.高强度的系统安全性。 3.高贵大方的皮肤界面。 4.功能强大,囊括BBS论坛系统的所必须的各项功能。 5.完善的用户权限设置模式. 6.采用最新.net控件模式排版,方便用户轻易修改出自己独特的风格。 7.采用用户表XML设置方式,可以方便实现与任何其他系统进行用户整合. ----------------------------- DXBBSV8.1版本新增功能 1.模板采用DIV布局,输出速度更快,代码更简洁,兼容各种浏览器. 2.改进系统缓存机制,让系统运行更高效。 3.加入我参与的主题功能。 4.后台增加下拉菜单是否显示设置. 5.加入服务器时差设置. 6.改进用户密码加密方式,供选多种加密方式选择. 7.加入注册用户名字符长度后台设置功能。 8.增加主题列表排序方式设置,可按发表时间,回复时间排序。 9.加入后台直接编辑修改论坛模板与皮肤功能。 10.加入版面、用户、主题、回复等四个回收站功能,让一切重要数据都可恢复。 11.改进分页控件,可以跳转到任一页. 12.改进编辑器,并美化编辑器,提供四种可选模式,通过设置Mode参数值:full-全功能,simple-简洁(默认),blank-无功能按钮,textarea-文本框模式. 13.改进论坛分栏模式浏览问题,进行模式切换时,不会改变正在浏览的内容。 14.改进专题显示方式,采用页签方式显示,更加直观。 15.改进系统消息群发不能按圈子组为群发对象. 16....
软件名称:大侠DXBBS简体中文版 程序版本:V8.1ACCESS 开发语言:ASP.NET2.0+access(C#) 联系方式: 客服QQ:6192665 DXBBS论坛系统简介 DXBBSV8.1论坛系统为采用最新asp.net2.0C#技术原创开发的一套BBS论坛系统. 内核程序高度集成,采用高速数据检索技术与独特的缓存机制,使得系统的运行速度为极速.程序对所有参数进行严格过滤,对cookies采用了特殊加密处理,使得系统具有高度的安全性. 对于大量数据的论坛,系统根据贴子量,自动建立新的数据表,防止单表数据量过大而造成数据库压力过大。 ----------------------------- DXBBS论坛系统的特色 1.极速的系统运行效率。 2.高强度的系统安全性。 3.高贵大方的皮肤界面。 4.功能强大,囊括BBS论坛系统的所必须的各项功能。 5.完善的用户权限设置模式. 6.采用最新.net控件模式排版,方便用户轻易修改出自己独特的风格。 7.采用用户表XML设置方式,可以方便实现与任何其他系统进行用户整合. ----------------------------- DXBBSV8.1版本新增功能 1.模板采用DIV布局,输出速度更快,代码更简洁,兼容各种浏览器. 2.改进系统缓存机制,让系统运行更高效。 3.加入我参与的主题功能。 4.后台增加下拉菜单是否显示设置. 5.加入服务器时差设置. 6.改进用户密码加密方式,供选多种加密方式选择. 7.加入注册用户名字符长度后台设置功能。 8.增加主题列表排序方式设置,可按发表时间,回复时间排序。 9.加入后台直接编辑修改论坛模板与皮肤功能。 10.加入版面、用户、主题、回复等四个回收站功能,让一切重要数据都可恢复。 11.改进分页控件,可以跳转到任一页. 12.改进编辑器,并美化编辑器,提供四种可选模式,通过设置Mode参数值:full-全功能,simple-简洁(默认),blank-无功能按钮,textarea-文本框模式. 13.改进论坛分栏模式浏览问题,进行模式切换时,不会改变正在浏览的内容。 14.改进专题显示方式,采用页签方式显示,更加直观。 15.改进系统消息群发不能按圈子组为群发对象. 16....

33,028

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧