百万级数据下排序问题

.NET技术 > ASP.NET [问题点数:20分]
等级
本版专家分:33
结帖率 5.88%
等级
本版专家分:33
等级
本版专家分:55956
勋章
Blank
银牌 2005年2月 总版技术专家分月排行榜第二
Blank
微软MVP 2009年7月 荣获微软MVP称号
2010年7月 荣获微软MVP称号
2008年7月 荣获微软MVP称号
Blank
红花 2005年2月 Delphi大版内专家分月排行榜第一
Blank
黄花 2008年5月 .NET技术大版内专家分月排行榜第二
2008年4月 .NET技术大版内专家分月排行榜第二
2004年11月 Delphi大版内专家分月排行榜第二
2004年8月 Delphi大版内专家分月排行榜第二
2004年7月 Delphi大版内专家分月排行榜第二
等级
本版专家分:8185
等级
本版专家分:68
勋章
Blank
红花 2009年4月 扩充话题大版内专家分月排行榜第一
Blank
蓝花 2014年4月 扩充话题大版内专家分月排行榜第三
等级
本版专家分:3035
等级
本版专家分:55956
勋章
Blank
银牌 2005年2月 总版技术专家分月排行榜第二
Blank
微软MVP 2009年7月 荣获微软MVP称号
2010年7月 荣获微软MVP称号
2008年7月 荣获微软MVP称号
Blank
红花 2005年2月 Delphi大版内专家分月排行榜第一
Blank
黄花 2008年5月 .NET技术大版内专家分月排行榜第二
2008年4月 .NET技术大版内专家分月排行榜第二
2004年11月 Delphi大版内专家分月排行榜第二
2004年8月 Delphi大版内专家分月排行榜第二
2004年7月 Delphi大版内专家分月排行榜第二
等级
本版专家分:2198
等级
本版专家分:33
syx381

等级:

千万乃至亿级排序思路

看了别人的博客了解到方法,感到非常震撼,理了思路分享给大家. ================= 第一种 快排加归并 普适 举例 有 一百万条数据排序 分成四个文件 四个部分,分别进行内部快排,最后在把四个有序文件进行归并...

数据库SQL优化大总结之 百万级数据库优化方案

网上关于SQL优化的教程很多,但是比较杂乱。近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充。 这篇文章我花费了大量的时间查找资料、修改、排版,希望大家阅读之后,感觉好的...

排序实现百万级数据取若干数量的最大数字(java)

 输入若干个float数字(百万级以上) ,编写一个算法从中取出指定数量(100个以内)的最大的数字。 我们先分析一下这道题,从一堆数字里取出几个最大的数,以我们通常的思想去考虑,首先想到的是对这堆数字进行倒序...

百万数据进行查询与排序

百万数据进行查询与排序! 在网上找了一堆,有一下几大排序算法如:快速排序,归并排序,堆排序百万数据查询 。 那什么是快速排序:  1. 快速排序算法是一种不稳定的排序算法。其时间复杂度为O(nlogn),最坏...

数据量很大的排序问题 大量数据如何排序

数据量很大的排序问题 大量数据如何排序  【尊重原创,转载请注明出处】http://blog.csdn.net/guyuealian/article/details/51119499  同学某天参加腾讯面试,技术面的时候,面试官问了排序问题:   问题一:若有...

MySQL百万级数据量分页查询方法及其优化

适用场景:适用于数据量较少的情况(元组百/千) 原因/缺点: 全表扫描,速度会很慢 且 有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3). limit限制的是从结果集的 m 位置处取出 n 条输出,其余抛弃....

各种排序算法的总结和比较

1 快速排序(QuickSort)快速排序是一个就地排序,分而治之,大规模递归的算法。从本质上来说,它是归并排序的就地版本。快速排序可以由下面四步组成。(1) 如果不多于1个数据,直接返回。(2) 一般选择序列最...

MYSQL百万级数据分页查询优化实战

MYSQL大数据量分页查询优化 ...单表数据量在500w左右,本人就写了一个小程序负责mysql到es的数据迁移,功能其实很简单,但其中出现了一些没有考虑到的问题,比如查询的效率问题,在此做记录。老日志数据如下 数...

八种排序算法总结

学习了这么多的排序算法,还没有做个总结,呵呵 冒泡排序冒泡排序是最慢的排序算法。在实际运用中它是效率最低的算法。它通过一趟又一趟地比较数组中的每一个元素,使较大的数据下沉,较小的数据上升。它是O(n^2)的...

数据结构和算法的选择

本部分总结前面介绍的数据结构和算法,并讨论在不同的情况如何进行选择。 通用数据结构:数组、链表、树、哈希表 专用数据结构:栈、队列、优先级队列 排序:插入排序、希尔排序、快速排序、归并排序、堆排序...

UltraEdit高级教程之列模式、排序操作

转自:...   UltraEdit 是一套功能强大的文本编辑器,可以编辑文字、Hex、ASCII码,可以取代记事本,内建英文单词检查、C++及VB 语法加亮,可同时编辑多个文件,而且即使开启很大的文件速度也不会慢。...

大量数据带筛选条件的正确分页方案

先根据筛选条件获取满足条件记录的id,并且对id在sql中排序(避免大量数据内存中排序,很慢、很耗性能),取到分页对应的id;再根据id查询对应的记录,此时如果id对应的记录在库中很离散,那么会再次全表遍历; 问题...

排序算法,对内存小数据量大的数据排序(一)

问题描述 百度面试题: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去...

各种排序算法的稳定性和时间复杂度小结

选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。冒泡法: 这是最原始,也是众所周知的最慢的算法了。他的名字的由来因为它的工作看来象是冒泡...

Oracle sql 优化:增加order by 慢 去掉之后就变快 解决办法

问题背景: 1.oracle的版本的为11g 2.数据是由生产库导入部分数据至开发库 3.表为范围分区表 4.order by 的字段为分区表的分区字段 5.数据记录大概有一千万; 5.使用的分析工具为toad10 二 问题描述 1....

哈希排序

转自:http://wenku.baidu.com/view/c8ca9533b90d6c85ec3ac6db.html ... 第一部分:Top K 算法详解 问题描述 百度面试题:  搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长

排序(hash排序

问题描述百度面试题:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不...

常见的三种排序算法(堆排、快排、归并排序)的比较总结

这两天看了一下常见的三种排序算法:堆排序、快速排序、gong

排序算法的稳定性及其汇总

1 快速排序(QuickSort)快速排序是一个就地排序,分而治之,大规模递归的算法。从本质上来说,它是归并排序的就地版本。快速排序可以由下面四步组成。(1) 如果不多于1个数据,直接返回。(2) ...

sql order by与索引之间的关系(where条件出现字段才有效)

ORDER BY 通常会有两种实现方法,一个是利用有序索引自动实现,也就是说利用有序索引的有序性就不再另做排序操作了。另一个是把结果选好之后再排序。 用有序索引这种,当然是最快的,不过有一些限制条件,来看下面...

MySQL实现分页查询

limit 基本实现方式一般情况,客户端通过传递 pageNo(页码)、pageSize(每页条数)两个参数去分页查询数据库中的数据,在数据量较小(元组百/千)时使用 MySQL自带的 limit 来解决这个问题: 收到客户端{page...

PHP排序数据量分页

数据量分页,除了使用mysql的order by 排序,也可以使用php排序,来实现业务。代码:使用到的函数 usort、array_slice public function getPage(int $pageSize, int $offset){ $sql = 'select scores,count...

各种排序算法的时间复杂度

选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法, 冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。 排序算法不稳定的含义是:在排序之前,有两个数相等. 但是在排序结束之后,它们两个有可能...

大数据——海量数据处理的基本方法总结

声明: 原文引用参考July大神的csdn博客文章 => 海量处理面试题 海量数据处理概述所谓海量数据处理,就是数据量太大,无法在较短时间内迅速解决,无法一次性装入内存。本文在前人的基础上总结一下解决此类问题的办法...

排序算法小结

相关读书笔记、心得文章列表1 快速排序(QuickSort)快速排序是一个就地排序,分而治之,大规模递归的算法。从本质上来说,它是归并排序的就地版本。快速排序可以由下面四步组成。(1) 如果不多于1个数据,直接...

数据结构与算法】——排序算法篇

由于研究生考试的需要,加上我对算法的情有独钟,这段时间一直在研究算法。...存放数据就像我们在日常生活中存放东西一样,时不时需要整理一下,你下次拿东西的时候才方便。如果你的东西是一堆乱麻,你

Oracle 10G字段排序问题

oracle排序一般是全表扫描,当数据量非常大时,分配给oracle的内存就不够用了,只能通过磁盘I/0扫描。 大家都知道内存的读写速度要比磁盘快6-10倍。这时候可以修改系统分配给oracle相关的内存,就可以大大改善排序...

mysql在百万数据查询慢的问题

这两天,越来越觉得自己做的玩家历史表,查询速度很慢,开始还以为是网络的问题,然后持续了一两天很快pass了这个想法。很可能是自己的查询速度慢,于是进入数据库看了一下,发现历史记录已经达到了600多万条了。...

数据量的五种处理方式

 ... 处理海量数据问题,无非就是: 分而治之/hash映射 + hash统计 + 堆/快速/归并排序; Bloom filter/Bitmap;Trie树/数据库/倒排索引;外排序;分布式处理之hadoop/mapreduce。

External Sort(外排序)

今天来正式面对这个问题, 引入外排序这个词。 相比于外排序, 我们之前学的内排序(internal sort), 就是能够在计算机的内存中直接完成排序任务的算法。 7大内排序如下(只不过不同的perspective): (1)bu

相关热词 c#创建非模态窗体 c#提取字符串中的数字 c# 扩展无返回类 c#网站如何做预览功能 c# 异步 返回值 c#chart实时曲线图 c# 窗体 隐藏 c#实现终端上下滑动 c# 传递数组 可变参数 c# list 补集