首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
01 | 为什么要学习数据结构和算法?
02 | 如何抓住重点,系统高效地学习数据结构与算法?
03 | 复杂度分析(上):如何分析、统计算法的执行效率和资源消耗?
04 | 复杂度分析(下):浅析最好、最坏、平均、均摊时间复杂度
05 | 数组:为什么很多编程语言中数组都从0开始编号?
06 | 链表(上):如何实现LRU缓存淘汰算法?
07 | 链表(下):如何轻松写出正确的链表代码?
08 | 栈:如何实现浏览器的前进和后退功能?
09 | 队列:队列在线程池等有限资源池中的应用
10 | 递归:如何用三行代码找到“最终推荐人”?
11 | 排序(上):为什么插入排序比冒泡排序更受欢迎?
12 | 排序(下):如何用快排思想在O(n)内查找第K大元素?
13 | 线性排序:如何根据年龄给100万用户数据排序?
14 | 排序优化:如何实现一个通用的、高性能的排序函数?
15 | 二分查找(上):如何用最省内存的方式实现快速查找功能?
16 | 二分查找(下):如何快速定位IP对应的省份地址?
17 | 跳表:为什么Redis一定要用跳表来实现有序集合?
18 | 散列表(上):Word文档中的单词拼写检查功能是如何实现的?
19 | 散列表(中):如何打造一个工业级水平的散列表?
20 | 散列表(下):为什么散列表和链表经常会一起使用?
21 | 哈希算法(上):如何防止数据库中的用户信息被脱库?
22 | 哈希算法(下):哈希算法在分布式系统中有哪些应用?
23 | 二叉树基础(上):什么样的二叉树适合用数组来存储?
24 | 二叉树基础(下):有了如此高效的散列表,为什么还需要二叉树?
25 | 红黑树(上):为什么工程中都用红黑树这种二叉树?
26 | 红黑树(下):掌握这些技巧,你也可以实现一个红黑树
27 | 递归树:如何借助树来求解递归算法的时间复杂度?
28 | 堆和堆排序:为什么说堆排序没有快速排序快?
29 | 堆的应用:如何快速获取到Top 10最热门的搜索关键词?
30 | 图的表示:如何存储微博、微信等社交网络中的好友关系?
31 | 深度和广度优先搜索:如何找出社交网络中的三度好友关系?
32 | 字符串匹配基础(上):如何借助哈希算法实现高效字符串匹配?
33 | 字符串匹配基础(中):如何实现文本编辑器中的查找功能?
34 | 字符串匹配基础(下):如何借助BM算法轻松理解KMP算法?
35 | Trie树:如何实现搜索引擎的搜索关键词提示功能?
36 | AC自动机:如何用多模式串匹配实现敏感词过滤功能?
37 | 贪心算法:如何用贪心算法实现Huffman压缩编码?
38 | 分治算法:谈一谈大规模计算框架MapReduce中的分治思想
39 | 回溯算法:从电影《蝴蝶效应》中学习回溯算法的核心思想
40 | 初识动态规划:如何巧妙解决“双十一”购物时的凑单问题?
41 | 动态规划理论:一篇文章带你彻底搞懂最优子结构、无后效性和重复子问题
42 | 动态规划实战:如何实现搜索引擎中的拼写纠错功能?
43 | 拓扑排序:如何确定代码源文件的编译依赖关系?
44 | 最短路径:地图软件是如何计算出最优出行路径的?
45 | 位图:如何实现网页爬虫中的URL去重功能?
46 | 概率统计:如何利用朴素贝叶斯算法过滤垃圾短信?
47 | 向量空间:如何实现一个简单的音乐推荐系统?
48 | B+树:MySQL数据库索引是如何实现的?
49 | 搜索:如何用A*搜索算法实现游戏中的寻路功能?
50 | 索引:如何在海量数据中快速查找某个数据?
51 | 并行算法:如何利用并行处理提高算法的执行效率?
52 | 算法实战(一):剖析Redis常用数据类型对应的数据结构
53 | 算法实战(二):剖析搜索引擎背后的经典数据结构和算法
54 | 算法实战(三):剖析高性能队列Disruptor背后的数据结构和算法
55 | 算法实战(四):剖析微服务接口鉴权限流背后的数据结构和算法
56 | 算法实战(五):如何用学过的数据结构和算法实现一个短网址系统?
当前位置:
首页>>
技术小册>>
数据结构与算法之美
小册名称:数据结构与算法之美
### 15 | 二分查找(上):如何用最省内存的方式实现快速查找功能? 在数据结构与算法的广阔天地中,二分查找以其高效性、简洁性而著称,是处理有序数据集合时不可或缺的工具。本章将深入探讨二分查找的基本原理、实现方式,以及如何在保证查找效率的同时,最大限度地节省内存资源。我们将从理论出发,逐步过渡到实践,帮助读者理解并掌握这一经典算法。 #### 一、二分查找的基本概念 **定义**:二分查找(Binary Search)是一种在有序数组中查找特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或小于中间元素,则在数组的大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。 **特点**: - **有序性**:二分查找要求数据集合必须是有序的,这是其高效性的前提。 - **对半分割**:每次查找都会将搜索范围减半,因此其时间复杂度为O(log n),其中n是数组的长度。 - **内存节省**:由于二分查找直接在原数组上进行操作,不需要额外的数据结构来存储数据,因此相较于某些其他查找算法(如哈希表),它在内存使用上更为节省。 #### 二、二分查找的基本实现 在实现二分查找时,我们需要明确几个关键点:查找范围(left和right两个指针界定)、中间元素的计算方式、以及根据中间元素与目标值的比较结果调整查找范围。 **示例代码(Python)**: ```python def binary_search(arr, target): left, right = 0, len(arr) - 1 while left <= right: mid = left + (right - left) // 2 # 防止溢出 if arr[mid] == target: return mid # 找到目标,返回索引 elif arr[mid] < target: left = mid + 1 # 调整左边界 else: right = mid - 1 # 调整右边界 return -1 # 未找到目标,返回-1 # 示例 arr = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19] target = 7 print(binary_search(arr, target)) # 输出: 3 ``` #### 三、二分查找的变种与优化 尽管基本的二分查找算法已经足够高效,但在实际应用中,我们可能需要根据具体场景对其进行调整和优化。 **1. 查找第一个等于给定值的元素** 有时,数组中可能存在多个相同的元素,而我们希望找到第一个等于给定值的元素的索引。这要求我们在找到目标值后,继续向左搜索,直到找到第一个等于目标值的元素或越界。 **示例代码**: ```python def binary_search_first_occurrence(arr, target): left, right = 0, len(arr) - 1 result = -1 while left <= right: mid = left + (right - left) // 2 if arr[mid] >= target: # 注意这里使用>=,以便向左搜索 result = mid right = mid - 1 else: left = mid + 1 return result if result != -1 and arr[result] == target else -1 # 示例 arr = [1, 2, 4, 4, 5, 6, 7] target = 4 print(binary_search_first_occurrence(arr, target)) # 输出: 2 ``` **2. 查找最后一个等于给定值的元素** 类似地,我们也可能需要找到最后一个等于给定值的元素的索引。这要求我们在找到目标值后,继续向右搜索,直到找到最后一个等于目标值的元素或越界。 **示例代码**(略,基于上述逻辑稍作调整即可)。 **3. 循环与递归实现** 二分查找既可以用循环实现,也可以用递归实现。循环实现更为直观,易于理解;而递归实现则可能更简洁,但在某些情况下(如数组极大)可能导致栈溢出。 **4. 插值查找** 在某些情况下,如果数组分布比较均匀,我们可以使用插值查找来代替二分查找。插值查找通过计算元素在数组中的分布概率来选择中间元素,从而可能获得比二分查找更快的查找速度。但需要注意的是,插值查找的适用性较窄,且当数组分布不均匀时,其性能可能不如二分查找。 #### 四、二分查找的内存节省特性 二分查找之所以能在内存使用上表现出色,主要得益于其直接在原数组上进行操作的特点。相比之下,哈希表虽然查找效率也很高(平均时间复杂度为O(1)),但它需要额外的内存空间来存储哈希表和解决冲突(如链表法、开放定址法等)。在内存资源受限的场景下,二分查找成为了一个非常有力的工具。 此外,二分查找还具有良好的可扩展性。当数据量增大时,我们可以通过分治策略(如外部排序中的归并排序)将大数据集分割成多个小数据集,然后对每个小数据集应用二分查找,从而实现对大数据集的快速查找。 #### 五、总结 二分查找作为一种高效且内存节省的查找算法,在有序数据集合的处理中发挥着重要作用。通过对其基本原理、基本实现以及变种与优化的深入理解,我们可以更好地将其应用于实际场景中,解决各种查找问题。同时,我们也应该注意到二分查找的局限性,比如它要求数据集合必须是有序的,以及在数据量极大时可能存在的性能瓶颈。因此,在实际应用中,我们需要根据具体情况选择合适的算法和数据结构。
上一篇:
14 | 排序优化:如何实现一个通用的、高性能的排序函数?
下一篇:
16 | 二分查找(下):如何快速定位IP对应的省份地址?
该分类下的相关小册推荐:
数据结构与算法(上)
编程之道-算法面试(下)
数据结构与算法(下)
算法面试通关 50 讲
编程之道-算法面试(上)
数据结构与算法(中)
业务开发实用算法精讲