首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
01 | 为什么要学习数据结构和算法?
02 | 如何抓住重点,系统高效地学习数据结构与算法?
03 | 复杂度分析(上):如何分析、统计算法的执行效率和资源消耗?
04 | 复杂度分析(下):浅析最好、最坏、平均、均摊时间复杂度
05 | 数组:为什么很多编程语言中数组都从0开始编号?
06 | 链表(上):如何实现LRU缓存淘汰算法?
07 | 链表(下):如何轻松写出正确的链表代码?
08 | 栈:如何实现浏览器的前进和后退功能?
09 | 队列:队列在线程池等有限资源池中的应用
10 | 递归:如何用三行代码找到“最终推荐人”?
11 | 排序(上):为什么插入排序比冒泡排序更受欢迎?
12 | 排序(下):如何用快排思想在O(n)内查找第K大元素?
13 | 线性排序:如何根据年龄给100万用户数据排序?
14 | 排序优化:如何实现一个通用的、高性能的排序函数?
15 | 二分查找(上):如何用最省内存的方式实现快速查找功能?
16 | 二分查找(下):如何快速定位IP对应的省份地址?
17 | 跳表:为什么Redis一定要用跳表来实现有序集合?
18 | 散列表(上):Word文档中的单词拼写检查功能是如何实现的?
19 | 散列表(中):如何打造一个工业级水平的散列表?
20 | 散列表(下):为什么散列表和链表经常会一起使用?
21 | 哈希算法(上):如何防止数据库中的用户信息被脱库?
22 | 哈希算法(下):哈希算法在分布式系统中有哪些应用?
23 | 二叉树基础(上):什么样的二叉树适合用数组来存储?
24 | 二叉树基础(下):有了如此高效的散列表,为什么还需要二叉树?
25 | 红黑树(上):为什么工程中都用红黑树这种二叉树?
26 | 红黑树(下):掌握这些技巧,你也可以实现一个红黑树
27 | 递归树:如何借助树来求解递归算法的时间复杂度?
28 | 堆和堆排序:为什么说堆排序没有快速排序快?
29 | 堆的应用:如何快速获取到Top 10最热门的搜索关键词?
30 | 图的表示:如何存储微博、微信等社交网络中的好友关系?
31 | 深度和广度优先搜索:如何找出社交网络中的三度好友关系?
32 | 字符串匹配基础(上):如何借助哈希算法实现高效字符串匹配?
33 | 字符串匹配基础(中):如何实现文本编辑器中的查找功能?
34 | 字符串匹配基础(下):如何借助BM算法轻松理解KMP算法?
35 | Trie树:如何实现搜索引擎的搜索关键词提示功能?
36 | AC自动机:如何用多模式串匹配实现敏感词过滤功能?
37 | 贪心算法:如何用贪心算法实现Huffman压缩编码?
38 | 分治算法:谈一谈大规模计算框架MapReduce中的分治思想
39 | 回溯算法:从电影《蝴蝶效应》中学习回溯算法的核心思想
40 | 初识动态规划:如何巧妙解决“双十一”购物时的凑单问题?
41 | 动态规划理论:一篇文章带你彻底搞懂最优子结构、无后效性和重复子问题
42 | 动态规划实战:如何实现搜索引擎中的拼写纠错功能?
43 | 拓扑排序:如何确定代码源文件的编译依赖关系?
44 | 最短路径:地图软件是如何计算出最优出行路径的?
45 | 位图:如何实现网页爬虫中的URL去重功能?
46 | 概率统计:如何利用朴素贝叶斯算法过滤垃圾短信?
47 | 向量空间:如何实现一个简单的音乐推荐系统?
48 | B+树:MySQL数据库索引是如何实现的?
49 | 搜索:如何用A*搜索算法实现游戏中的寻路功能?
50 | 索引:如何在海量数据中快速查找某个数据?
51 | 并行算法:如何利用并行处理提高算法的执行效率?
52 | 算法实战(一):剖析Redis常用数据类型对应的数据结构
53 | 算法实战(二):剖析搜索引擎背后的经典数据结构和算法
54 | 算法实战(三):剖析高性能队列Disruptor背后的数据结构和算法
55 | 算法实战(四):剖析微服务接口鉴权限流背后的数据结构和算法
56 | 算法实战(五):如何用学过的数据结构和算法实现一个短网址系统?
当前位置:
首页>>
技术小册>>
数据结构与算法之美
小册名称:数据结构与算法之美
### 12 | 排序(下):如何用快排思想在O(n)内查找第K大元素? 在数据结构与算法的广阔领域中,排序算法和查找算法占据了举足轻重的地位。排序不仅是对数据进行有序化处理的基石,也是众多高级算法(如搜索、数据压缩等)的基础。而查找算法,则是在大量数据中快速定位所需信息的关键技术。本章将深入探讨如何利用快速排序(Quick Sort)的核心思想,在平均时间复杂度为O(n)的条件下,高效地查找数组中的第K大元素。这一技巧不仅在算法竞赛中频繁出现,也在实际开发中,如大数据分析、数据库索引构建等方面有着广泛应用。 #### 1. 快速排序回顾 在开始之前,我们先简要回顾一下快速排序算法的基本原理。快速排序通过选择一个“基准值”(pivot),将数组分为两部分:一部分包含所有小于基准值的元素,另一部分包含所有大于基准值的元素。然后,递归地对这两部分进行同样的操作,直到整个数组变得有序。快速排序的平均时间复杂度为O(n log n),但在最坏情况下(如数组已排序或所有元素都相同)会退化到O(n^2)。 #### 2. 快速选择算法(QuickSelect) 快速选择算法是快速排序算法的一个变种,专门用于解决查找第K小(或第K大)元素的问题。其核心思想是利用快速排序中的分区操作,但不再追求整个数组的完全排序,而是仅通过有限次分区操作找到目标元素的位置。这使得快速选择算法的平均时间复杂度降低到了O(n),大大优于传统排序后查找的方法。 #### 3. 快速选择算法的实现步骤 ##### 3.1 选择基准值 与快速排序类似,快速选择算法首先需要选择一个基准值。基准值的选择策略多种多样,常见的有选择数组的第一个元素、最后一个元素、中位数作为基准,或者使用三数中值分割法(Median-of-Three)来提高算法的鲁棒性。 ##### 3.2 分区操作 接下来,算法执行分区操作,根据基准值将数组分为小于基准值的左子数组和大于基准值的右子数组。分区完成后,基准值将位于其最终排序位置。重要的是,分区操作还会返回基准值的新索引(即基准值在分区后数组中的位置)。 ##### 3.3 判断与递归 - 如果基准值的索引恰好等于K-1(因为数组索引通常从0开始,所以第K大元素的索引为K-1),则找到了第K大元素,算法结束。 - 如果基准值的索引小于K-1,说明第K大元素在右子数组中,递归地在右子数组中查找第K-索引-1大的元素。 - 如果基准值的索引大于K-1,说明第K大元素在左子数组中(或已经被替换为小于第K大的元素),递归地在左子数组中查找第K大元素。 #### 4. 示例解析 假设我们有一个数组`[3, 2, 1, 5, 6, 4]`,需要找到第3大的元素。 1. **选择基准值**:选择第一个元素`3`作为基准值。 2. **分区操作**:执行分区后,数组可能变为`[2, 1, |3|, 5, 6, 4]`(其中`|`表示基准值的位置),基准值`3`现在位于索引`2`处。 3. **判断与递归**:因为`K-1=2`,基准值的索引`2`等于`K-1`,所以`3`就是第3大的元素,算法结束。 如果基准值的索引不是`K-1`,比如分区后基准值索引为`0`,且我们仍在寻找第3大的元素(K=3),则递归地在右子数组`[5, 6, 4]`中查找第2大的元素(因为已经排除了一个元素)。 #### 5. 优化与注意事项 - **基准值选择**:合理的基准值选择策略对算法性能至关重要。使用三数中值分割法或随机选择策略可以有效减少最坏情况的发生。 - **尾递归优化**:在某些情况下,可以通过迭代而非递归的方式实现快速选择,以避免递归带来的栈溢出风险。 - **稳定性与空间复杂度**:快速选择算法不是稳定的排序算法(即相等的元素可能在排序后顺序改变),且在最坏情况下空间复杂度为O(log n)(由递归调用栈引起)。 - **实际应用**:快速选择算法特别适用于大数据集且只需部分排序结果的场景,如数据库查询优化、数据流处理等。 #### 6. 结论 通过快速选择算法,我们能够在平均时间复杂度为O(n)的条件下高效地找到数组中的第K大元素。这一算法不仅是对快速排序思想的灵活运用,也是解决特定查找问题的高效手段。在实际编程和算法设计中,掌握快速选择算法不仅有助于提升解题效率,还能加深对排序与查找算法之间联系的理解。希望本章内容能够为您的数据结构与算法学习之旅增添一抹亮色。
上一篇:
11 | 排序(上):为什么插入排序比冒泡排序更受欢迎?
下一篇:
13 | 线性排序:如何根据年龄给100万用户数据排序?
该分类下的相关小册推荐:
数据结构与算法(上)
业务开发实用算法精讲
编程之道-算法面试(上)
数据结构与算法(下)
算法面试通关 50 讲
编程之道-算法面试(下)
数据结构与算法(中)