求解第K小&分治算法

chenluzhou050901 2024-10-13 21:39:39

在一个未排序的数组中找到第 k 小的元素。它使用了快速选择算法：
1. partition(int a[], int l, int r)函数
目的：对数组 a 的部分 [l, r] 进行划分，使得基准元素 x（通常选择 a[l]）位于其最终位置，所有小于 x 的元素都位于其左侧，所有大于 x 的元素都位于其右侧。

步骤：

初始化两个指针 i 和 j，分别指向 l 和 r+1。
设置基准元素 x 为 a[l]。
使用两个 while 循环，一个从左向右扫描寻找大于 x 的元素，另一个从右向左扫描寻找小于 x 的元素。
当找到这样的一对元素时，交换它们。
重复上述过程，直到 i 和 j 相遇或交错。
将基准元素 x 与 a[j] 交换（此时 j 是基准元素的最终位置）。
返回基准元素的最终位置 j。
伪代码：
partition(a, l, r):
i = l
j = r + 1
x = a[l]
while True:
while a[++i] < x and i < r: pass
while a[--j] > x: pass
if i >= j: break
swap(a[i], a[j])
a[l] = a[j]
a[j] = x
return j
2. find(int a[], int l, int r, int k)函数：在数组 a 的部分 [l, r] 中找到第 k 小的元素。

步骤：

如果 l 小于 r，则调用 partition 函数对数组进行划分，得到划分点 q。
如果划分点 q 不是第 k-1 个位置（注意数组索引从 0 开始），则递归地在左半部分 [l, q-1] 或右半部分 [q+1, r] 中继续寻找第 k 小的元素。
如果划分点正好是第 k-1 个位置，则直接返回 a[k-1]。
伪代码：
find(a, l, r, k):
if l < r:
q = partition(a, l, r)
if q != k - 1:
if k - 1 < q:
return find(a, l, q - 1, k)
else:
return find(a, q + 1, r, k)
return a[k - 1]
3. swap(int &x, int &y)：交换两个整数的值。

步骤：

使用一个临时变量 temp 存储 x 的值。
将 y 的值赋给 x。
将 temp（即原来的 x 的值）赋给 y。
伪代码：
swap(x, y):
temp = x
x = y
y = temp

4. main()

步骤：

读取数组大小 n 和要找的元素排名 k。
读取数组 a 的元素。
调用 find 函数，传入数组 a、起始索引 0、结束索引 n-1 和要找的元素排名 k。
输出 find 函数的返回值。
伪代码：
main():
read n and k
for i from 0 to n-1:
read a[i]
print find(a, 0, n-1, k)

算法时间复杂度分析：

1.在最好的情况下，每次划分都能将数组均匀地分成两部分，这样递归树的深度将是 logn。每次划分操作本身需要 O(n) 的时间（因为需要遍历整个数组来找到划分点），所以最好的时间复杂度是：O(nlogn)。特别的，如果每次划分都恰好将第 k 小的元素放在正确的位置，则只需 O(n) 次比较和交换，但是这种情况在实际应用中极为罕见。

2.在最坏的情况下，每次划分都极不平衡，即每次划分后，一个子数组只包含一个元素，而另一个子数组包含剩余的所有元素。这会导致递归树的深度为 n，每次划分操作需要 O(n) 的时间，因此最坏的时间复杂度是：O(n2)

体会和思考：

分治法的核心在于将问题递归地分解为更小的子问题。这种分解通常基于某种“分而治之”的策略，即将大问题划分为几个相互独立且结构相似的子问题。分治法通常结构清晰，易于理解和实现。分治法通常能够产生高效的算法。在最佳情况下，分治法的时间复杂度可以接近线性时间，而在最坏情况下，它仍然可以保持较好的性能，尽管有时可能不是最优的。

但是，在使用分治法时，需要仔细考虑基准的选择、递归的深度、并行化的潜力以及算法的适用性等问题。通过合理的优化和策略选择，才能产生高效且简洁的算法来解决实际问题。

...全文