社区
数据结构与算法
帖子详情
请问大侠关于排序大量数据
kolapig
2009-06-29 03:59:59
有10个文件,每个文件1G,
每个文件的每一行都存放的是用户的query,每个文件的query都可能重复
按照query的频度排序
如果内存够大怎么做
内存不够大怎么做
我有一些思路,就是利用map之类的东西,大家觉得对吗?
...全文
49
8
打赏
收藏
请问大侠关于排序大量数据
有10个文件,每个文件1G, 每个文件的每一行都存放的是用户的query,每个文件的query都可能重复 按照query的频度排序 如果内存够大怎么做 内存不够大怎么做 我有一些思路,就是利用map之类的东西,大家觉得对吗?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
猫已经找不回了
2009-07-02
打赏
举报
回复
内存不够打的话,用归并来实现外排。
kolapig
2009-07-01
打赏
举报
回复
没有个结论阿
光宇广贞
2009-06-29
打赏
举报
回复
外排。
AYZBL
2009-06-29
打赏
举报
回复
合并排序,那还用说么
绿色夹克衫
2009-06-29
打赏
举报
回复
内存大的话利用map就可以,如果不够大,可以先按照url的前3位进行分治(36^3 = 46656),将源文件分为若干个小文件,
再分别统计。相同的url肯定会在同一个文件里。
蒋晟
2009-06-29
打赏
举报
回复
用Merge sort
little06
2009-06-29
打赏
举报
回复
内存够大
用TreeMap
不过10G数据,都转为内存对象,不知道要多大了
showjim
2009-06-29
打赏
举报
回复
想简单一点解决问题:导入数据库,group by;
自己写程序,内存足够的话,就先用hash表记录次数,然后根据次数进行排序;用hash内存不够的话,用数组排序记录次数,然后根据次数进行排序;内存还是不够的话,根据内存大小多路归并排序两次,第一次字符串排序用于统计次数,每二次根据次数排序
胡学钢
数据
结构和实验
合肥工业大学胡学钢教授的课件以及实验内容,包括概述,栈,队列,链栈和链队列,线性表,递归,树和二叉树,图,查找,
排序
,数组和广义表
大侠
论坛英文ACCESS版_C#论坛社区程序.rar
大侠
论坛英文ACCESS版_C#论坛社区程序
Quick Tour of ClickHouse Internals.pdf
Yandex的Alex Zatelepin讨论了ClickHouse体系结构决策,从应用程序开发人员的角度考虑以及确定ClickHouse是否适合特定场景。
大侠
DXBBS论坛程序mssql 8.1
软件名称:
大侠
DXBBS简体中文版 程序版本:V8.1 开发语言:ASP.NET2.0+MSSQL(C#) 联系方式: 客服QQ:6192665 DXBBS论坛系统简介 DXBBSV8.1论坛系统为采用最新asp.net2.0C#技术原创开发的一套BBS论坛系统. 内核程序高度集成,采用高速
数据
检索技术与独特的缓存机制,使得系统的运行速度为极速.程序对所有参数进行严格过滤,对cookies采用了特殊加密处理,使得系统具有高度的安全性. 对于
大量
数据
的论坛,系统根据贴子量,自动建立新的
数据
表,防止单表
数据
量过大而造成
数据
库压力过大。 ----------------------------- DXBBS论坛系统的特色 1.极速的系统运行效率。 2.高强度的系统安全性。 3.高贵大方的皮肤界面。 4.功能强大,囊括BBS论坛系统的所必须的各项功能。 5.完善的用户权限设置模式. 6.采用最新.net控件模式排版,方便用户轻易修改出自己独特的风格。 7.采用用户表XML设置方式,可以方便实现与任何其他系统进行用户整合. ----------------------------- DXBBSV8.1版本新增功能 1.模板采用DIV布局,输出速度更快,代码更简洁,兼容各种浏览器. 2.改进系统缓存机制,让系统运行更高效。 3.加入我参与的主题功能。 4.后台增加下拉菜单是否显示设置. 5.加入服务器时差设置. 6.改进用户密码加密方式,供选多种加密方式选择. 7.加入注册用户名字符长度后台设置功能。 8.增加主题列表
排序
方式设置,可按发表时间,回复时间
排序
。 9.加入后台直接编辑修改论坛模板与皮肤功能。 10.加入版面、用户、主题、回复等四个回收站功能,让一切重要
数据
都可恢复。 11.改进分页控件,可以跳转到任一页. 12.改进编辑器,并美化编辑器,提供四种可选模式,通过设置Mode参数值:full-全功能,simple-简洁(默认),blank-无功能按钮,textarea-文本框模式. 13.改进论坛分栏模式浏览问题,进行模式切换时,不会改变正在浏览的内容。 14.改进专题显示方式,采用页签方式显示,更加直观。 15.改进系统消息群发不能按圈子组为群发对象. 16....
大侠
DXBBS简体中文版access V8.1
软件名称:
大侠
DXBBS简体中文版 程序版本:V8.1ACCESS 开发语言:ASP.NET2.0+access(C#) 联系方式: 客服QQ:6192665 DXBBS论坛系统简介 DXBBSV8.1论坛系统为采用最新asp.net2.0C#技术原创开发的一套BBS论坛系统. 内核程序高度集成,采用高速
数据
检索技术与独特的缓存机制,使得系统的运行速度为极速.程序对所有参数进行严格过滤,对cookies采用了特殊加密处理,使得系统具有高度的安全性. 对于
大量
数据
的论坛,系统根据贴子量,自动建立新的
数据
表,防止单表
数据
量过大而造成
数据
库压力过大。 ----------------------------- DXBBS论坛系统的特色 1.极速的系统运行效率。 2.高强度的系统安全性。 3.高贵大方的皮肤界面。 4.功能强大,囊括BBS论坛系统的所必须的各项功能。 5.完善的用户权限设置模式. 6.采用最新.net控件模式排版,方便用户轻易修改出自己独特的风格。 7.采用用户表XML设置方式,可以方便实现与任何其他系统进行用户整合. ----------------------------- DXBBSV8.1版本新增功能 1.模板采用DIV布局,输出速度更快,代码更简洁,兼容各种浏览器. 2.改进系统缓存机制,让系统运行更高效。 3.加入我参与的主题功能。 4.后台增加下拉菜单是否显示设置. 5.加入服务器时差设置. 6.改进用户密码加密方式,供选多种加密方式选择. 7.加入注册用户名字符长度后台设置功能。 8.增加主题列表
排序
方式设置,可按发表时间,回复时间
排序
。 9.加入后台直接编辑修改论坛模板与皮肤功能。 10.加入版面、用户、主题、回复等四个回收站功能,让一切重要
数据
都可恢复。 11.改进分页控件,可以跳转到任一页. 12.改进编辑器,并美化编辑器,提供四种可选模式,通过设置Mode参数值:full-全功能,simple-简洁(默认),blank-无功能按钮,textarea-文本框模式. 13.改进论坛分栏模式浏览问题,进行模式切换时,不会改变正在浏览的内容。 14.改进专题显示方式,采用页签方式显示,更加直观。 15.改进系统消息群发不能按圈子组为群发对象. 16....
数据结构与算法
33,028
社区成员
35,337
社区内容
发帖
与我相关
我的任务
数据结构与算法
数据结构与算法相关内容讨论专区
复制链接
扫一扫
分享
社区描述
数据结构与算法相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章