434
社区成员




在一个未排序的数组中找到第 k 小的元素。它使用了快速选择算法:
1. partition(int a[], int l, int r)函数
目的:对数组 a 的部分 [l, r] 进行划分,使得基准元素 x(通常选择 a[l])位于其最终位置,所有小于 x 的元素都位于其左侧,所有大于 x 的元素都位于其右侧。
步骤:
初始化两个指针 i 和 j,分别指向 l 和 r+1。
设置基准元素 x 为 a[l]。
使用两个 while 循环,一个从左向右扫描寻找大于 x 的元素,另一个从右向左扫描寻找小于 x 的元素。
当找到这样的一对元素时,交换它们。
重复上述过程,直到 i 和 j 相遇或交错。
将基准元素 x 与 a[j] 交换(此时 j 是基准元素的最终位置)。
返回基准元素的最终位置 j。
伪代码:
partition(a, l, r):
i = l
j = r + 1
x = a[l]
while True:
while a[++i] < x and i < r: pass
while a[--j] > x: pass
if i >= j: break
swap(a[i], a[j])
a[l] = a[j]
a[j] = x
return j
2. find(int a[], int l, int r, int k)函数:在数组 a 的部分 [l, r] 中找到第 k 小的元素。
步骤:
如果 l 小于 r,则调用 partition 函数对数组进行划分,得到划分点 q。
如果划分点 q 不是第 k-1 个位置(注意数组索引从 0 开始),则递归地在左半部分 [l, q-1] 或右半部分 [q+1, r] 中继续寻找第 k 小的元素。
如果划分点正好是第 k-1 个位置,则直接返回 a[k-1]。
伪代码:
find(a, l, r, k):
if l < r:
q = partition(a, l, r)
if q != k - 1:
if k - 1 < q:
return find(a, l, q - 1, k)
else:
return find(a, q + 1, r, k)
return a[k - 1]
3. swap(int &x, int &y):交换两个整数的值。
步骤:
使用一个临时变量 temp 存储 x 的值。
将 y 的值赋给 x。
将 temp(即原来的 x 的值)赋给 y。
伪代码:
swap(x, y):
temp = x
x = y
y = temp
4. main()
步骤:
读取数组大小 n 和要找的元素排名 k。
读取数组 a 的元素。
调用 find 函数,传入数组 a、起始索引 0、结束索引 n-1 和要找的元素排名 k。
输出 find 函数的返回值。
伪代码:
main():
read n and k
for i from 0 to n-1:
read a[i]
print find(a, 0, n-1, k)
算法时间复杂度分析:
1.在最好的情况下,每次划分都能将数组均匀地分成两部分,这样递归树的深度将是 logn。每次划分操作本身需要 O(n) 的时间(因为需要遍历整个数组来找到划分点),所以最好的时间复杂度是:O(nlogn)。特别的,如果每次划分都恰好将第 k 小的元素放在正确的位置,则只需 O(n) 次比较和交换,但是这种情况在实际应用中极为罕见。
2.在最坏的情况下,每次划分都极不平衡,即每次划分后,一个子数组只包含一个元素,而另一个子数组包含剩余的所有元素。这会导致递归树的深度为 n,每次划分操作需要 O(n) 的时间,因此最坏的时间复杂度是:O(n2)
体会和思考:
分治法的核心在于将问题递归地分解为更小的子问题。这种分解通常基于某种“分而治之”的策略,即将大问题划分为几个相互独立且结构相似的子问题。分治法通常结构清晰,易于理解和实现。分治法通常能够产生高效的算法。在最佳情况下,分治法的时间复杂度可以接近线性时间,而在最坏情况下,它仍然可以保持较好的性能,尽管有时可能不是最优的。
但是,在使用分治法时,需要仔细考虑基准的选择、递归的深度、并行化的潜力以及算法的适用性等问题。通过合理的优化和策略选择,才能产生高效且简洁的算法来解决实际问题。