首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
Bubble Sort - 冒泡排序
Selection Sort - 选择排序
Insertion Sort - 插入排序
Merge Sort - 归并排序
Quick Sort - 快速排序
Heap Sort - 堆排序
Bucket Sort
Counting Sort
两数之和
两数相加
无重复字符的最长子字符串
两个排序数组的中值
最长回文子串
锯齿形变换
反转整数
合并K个排序列表
链表循环
除Self之外的数组乘积
4的威力
蛙跳
将交叉口大小设置为至少两个
最大的块,使其分类
到达点
阶乘零点函数的前像大小
建造一个大的岛屿
唯一字母串
树的距离之和
猜词游戏
节点的最短路径
矩形区域II
K-相似字符串
雇佣K工人的最低成本
至少为K的最短子阵
获取所有key的最短路径
加油站的最小数量
有利可图的计划
细分图中的可达节点
超级蛋掉落
最大频率叠加
有序队列
DI序列的有效置换
猫和老鼠
最长不含重复字符的子字符串
丑数
第一个只出现一次的字符
字符流中第一个不重复的字符
两个链表的第一个公共结点
数字在排序数组中出现的次数
0到n-1中缺失的数字
数组中数值和下标相等的元素
二叉树的深度
数组中只出现一次的两个数字
数组中唯一只出现一次的数字
翻转单词顺序
左旋转字符串
滑动窗口的最大值
当前位置:
首页>>
技术小册>>
数据结构与算法(中)
小册名称:数据结构与算法(中)
堆排序通常基于二叉堆实现,以大根堆为例,堆排序的实现过程分为两个子过程。第一步为取出大根堆的根节点(当前堆的最大值), 由于取走了一个节点,故需要对余下的元素重新建堆。重新建堆后继续取根节点,循环直至取完所有节点,此时数组已经有序。基本思想就是这样,不过实现上还是有些小技巧的。 堆的操作 以大根堆为例,堆的常用操作如下。 最大堆调整(Max_Heapify):将堆的末端子节点作调整,使得子节点永远小于父节点 创建最大堆(Build_Max_Heap):将堆所有数据重新排序 堆排序(HeapSort):移除位在第一个数据的根节点,并做最大堆调整的递归运算 建堆时可以自顶向下,也可以采取自底向上,以下先采用自底向上的思路分析。我们可以将数组的后半部分节点想象为堆的最下面的那些节点,由于是单个节点,故显然满足二叉堆的定义,于是乎我们就可以从中间节点向上逐步构建二叉堆,每前进一步都保证其后的节点都是二叉堆,这样一来前进到第一个节点时整个数组就是一个二叉堆了。下面用 C++ 实现一个堆的类。 堆排在空间比较小(嵌入式设备和手机)时特别有用,但是因为现代系统往往有较多的缓存,堆排序无法有效利用缓存,数组元素很少和相邻的其他元素比较,故缓存未命中的概率远大于其他在相邻元素间比较的算法。但是在海量数据的排序下又重新发挥了重要作用,因为它在插入操作和删除最大元素的混合动态场景中能保证对数级别的运行时间。TopM C++ ```asp #include <iostream> #include <vector> using namespace std; class HeapSort { // get the parent node index int parent(int i) { return (i - 1) / 2; } // get the left child node index int left(int i) { return 2 * i + 1; } // get the right child node index int right(int i) { return 2 * i + 2; } // build max heap void build_max_heapify(vector<int> &nums, int heap_size) { for (int i = heap_size / 2; i >= 0; --i) { max_heapify(nums, i, heap_size); } print_heap(nums, heap_size); } // build min heap void build_min_heapify(vector<int> &nums, int heap_size) { for (int i = heap_size / 2; i >= 0; --i) { min_heapify(nums, i, heap_size); } print_heap(nums, heap_size); } // adjust the heap to max-heap void max_heapify(vector<int> &nums, int k, int len) { // int len = nums.size(); while (k < len) { int max_index = k; // left leaf node search int l = left(k); if (l < len && nums[l] > nums[max_index]) { max_index = l; } // right leaf node search int r = right(k); if (r < len && nums[r] > nums[max_index]) { max_index = r; } // node after k are max-heap already if (k == max_index) { break; } // keep the root node the largest int temp = nums[k]; nums[k] = nums[max_index]; nums[max_index] = temp; // adjust not only just current index k = max_index; } } // adjust the heap to min-heap void min_heapify(vector<int> &nums, int k, int len) { // int len = nums.size(); while (k < len) { int min_index = k; // left leaf node search int l = left(k); if (l < len && nums[l] < nums[min_index]) { min_index = l; } // right leaf node search int r = right(k); if (r < len && nums[r] < nums[min_index]) { min_index = r; } // node after k are min-heap already if (k == min_index) { break; } // keep the root node the largest int temp = nums[k]; nums[k] = nums[min_index]; nums[min_index] = temp; // adjust not only just current index k = min_index; } } public: // heap sort void heap_sort(vector<int> &nums) { int len = nums.size(); // init heap structure build_max_heapify(nums, len); // heap sort for (int i = len - 1; i >= 0; --i) { // put the largest number int the last int temp = nums[0]; nums[0] = nums[i]; nums[i] = temp; // reconstruct heap build_max_heapify(nums, i); } print_heap(nums, len); } // print heap between [0, heap_size - 1] void print_heap(vector<int> &nums, int heap_size) { for (int i = 0; i < heap_size; ++i) { cout << nums[i] << ", "; } cout << endl; } }; int main(int argc, char *argv[]) { int A[] = {19, 1, 10, 14, 16, 4, 7, 9, 3, 2, 8, 5, 11}; vector<int> nums; for (int i = 0; i < sizeof(A) / sizeof(A[0]); ++i) { nums.push_back(A[i]); } HeapSort sort; sort.print_heap(nums, nums.size()); sort.heap_sort(nums); return 0; } ``` 复杂度分析 从代码中可以发现堆排最费时间的地方在于构建二叉堆的过程。 上述构建大根堆和小根堆都是自底向上的方法,建堆过程时间复杂度为 O(2N)O(2N)O(2N), 堆排过程中重建的时间复杂度为 O(2NlogN)O(2N \log N)O(2NlogN). 故总的时间复杂度为 O(NlogN)O(N \log N)O(NlogN). 先看看建堆的过程,画图分析(比如以8个节点为例)可知在最坏情况下,每次都需要调整之前已经成为堆的节点,那么就意味着有二分之一的节点向下比较了一次,四分之一的节点向下比较了两次,八分之一的节点比较了三次... 等差等比数列求和,具体过程可参考下面的链接。
上一篇:
Quick Sort - 快速排序
下一篇:
Bucket Sort
该分类下的相关小册推荐:
编程之道-算法面试(下)
数据结构与算法(下)
业务开发实用算法精讲
编程之道-算法面试(上)
算法面试通关 50 讲
数据结构与算法之美
数据结构与算法(上)